뮤직데이터그램 위키페이지

뮤직데이터그램(0)

2021.07.26 | 조회 1.96K |
0

음악파는 김루씨

업계 사람들이 얘기하는 음악과 음악 산업

※이 글은 2021년 7월 26일에 마지막으로 업데이트 되었습니다.

 

발송된 뉴스레터에서는 길게 다루지 않았던 음악 데이터를 자세히 소개하는 페이지입니다. 사실 음악 데이터를 활용하고 있는 분들은 기술영역 깊숙한 곳부터 산업 전체를 조망하는 분들까지 다양하게 있습니다. 또, 데이터는 뭔가 많다고는 하는데 쓸만한 데이터는 어떻게 찾아야 할 것인지 실무자로서 갈피 잡기가 어려울 수 있을 것 같아요.

따라서 이 게시글은 뉴스레터로는 발송하지 않고, 최신 정보를 계속 업데이트해나가는 위키 페이지입니다.

 

Part 0. 데이터란 무엇인가?

제가 한국어웹에서 본 내용 중, 가장 실용적인 정의를 인용해봅니다.

데이터는 어떤 제품과 서비스가 기획되고, 만들어지고, 판매되고, 사용되면서 발생하는 흔적들이 디지털로 기록된 것입니다. 생산, 제조, 유통 현장에서는 프로세스가 효율화 자동화되면서 그 흔적들이 수집되기 시작했고, 고객을 중심으로 소셜네트워크 서비스, 스마트폰 등의 보급 등으로 그 흔적들이 수집되기 시작

데이터의 가치를 이해하기 위한 한 가지 틀, 우정훈

즉 음악에 관한 데이터는, 음악에 관련된 제품과 서비스가 기획되고, 만들어지고, 판매되고, 사용되면서 발생한 흔적들이 기록된 것입니다. 판매되기 전까지는 생산자가 만들어낸 데이터, 사용된 이후부터는 소비자/청취자가 만들어나가는 데이터가 되겠지요. 그래서 많은 음원을 확보하고, 많은 청취자가 오랫동안 활용하는 플랫폼이 가장 많은 데이터포인트를 가지고 있을 가능성이 높습니다.

 

Part 1. 음악 및 청취에 대한 데이터의 개괄

이해하기 쉬운 단위로, 나뭇잎→나무→숲 순서로 생각해보겠습니다. 일단 오디오 → 콘텐츠 → 청취 → 서비스/회사의 4단계로 나누어볼 수 있지 않을까요? 정답이 있는 내용은 아니니, 일단 이 순서로 살펴보겠습니다.

1. 오디오 속성

  • 오디오의 속성을 디지털화한 데이터포인트 중 danceability, valence, energy, tempo, loudness, speechiness, instrumentalness, liveness, acousticness, key, mode, duration, time signature 등 13개의 속성값을 Spotify 등 음원 플랫폼에서 추천 등의 서비스에서 활용하고 있다는 사실은 널리 알려져있지요. 
  • Spotify의 api를 통해서, 특정 곡의 오디오 속성값을 얻을 수 있습니다 : 링크

2. 콘텐츠 메타

  • 콘텐츠를 생산할 당시 정해지는, 생산자가 만들어낸 정보들입니다. 콘텐츠를 만든 참여자에 대한 정보나 곡과 앨범에 대한 설명과 각종 이미지들도 포함할 수 있겠지요. (마침 앨범커버와 선공개 싱글에 관한 글도 있으니 참고가 될 것 같습니다.) 쉽게 말하자면, 각종 포털사이트, 음원사이트에서 검색하면 보여지는 바로 그 데이터입니다. 어떤 사이트에서 어떤 곡을 검색하든 나오는 바로 그 정보의 총체이죠. 
  • 곡/앨범에 대한 메타데이터 : 곡/앨범에 대한 모든 참여자 정보(작사, 작곡, 편곡, 세션, 유통사, 기획사 등등), 발매일, 앨범이미지, 싱글/정규/리패키지 여부, 가사 등
  • 아티스트에 대한 메타데이터 : 아티스트의 활동이력(데뷔년도, 주활동시기, 소속 그룹이나 협업 아티스트 등)과 국적 등. 참, 그룹 아티스트의 경우에는 멤버가 변경이 되거나 활동명이 변경되는 것에 대한 정보 관리도 필요하겠지요.

3. 청취

  • 청취자가 남기는 행적들이 모이는 행동 데이터입니다. 여기서부터는 해석해야할 여지가 많아지게 됩니다.
  • 언제 : 플랫폼 데이터는 작게는 milisecond 혹은 microsecond단위까지도 데이터가 기록됩니다. 그러나, 행동을 그렇게 작은 시간단위까지 볼 필요는 없겠죠. 개인적으로는 아침, 점심, 저녁, 새벽의 구분을 저는 선호합니다. 6~12시, 12~18시, 18~24시, 0~6시 구분이 직관적이니까요. Spotify 선생님은 좀 더 세분화해서 6개의 time context를 활용하는군요.
출처 : Spotify R&D research<br>(그림을 누르시면, 원문으로 이동합니다.)
출처 : Spotify R&D research
(그림을 누르시면, 원문으로 이동합니다.)
  • 이 '언제 듣는가'에 관한 데이터포인트가 있다면, 일정한 시간대에 음악을 꾸준히 듣는지, 계절성에 따른 변화에 관한 변수를 만들 수 있습니다. 한국의 경우 많은 사람들이 출퇴근 시간대(9시, 18시)에 음악을 꾸준히 듣는게 일반적이지만, 국가나지역에 따라서는 이 패턴이 다소 달라진다고 하네요. 
  • 어디에서 : 글로벌 플랫폼의 최대 강점은, 다양한 지역에서의 청취자를 파악할 수 있다는 점입니다. 일부 제공되는 데이터로 지역정보를 가공하는 경우도 있습니다. 이 또한 Spotify Chart에서 csv로 다운로드 받아, 직접 시각화 해보는 것이 가능합니다. 
  • 어떤 디바이스로 : 또한 어떤 기기를 쓰고 있는가를 통해서도 이 사람이 이동 중인지, 머물러있는지, 혼자 듣는지, 누군가와 함께 듣는지를 유추할 수도 있습니다. 이제 음악을 스트리밍할 수 있는 디지털기기는 휴대전화를 넘어 스마트워치, TV, 자동차, 각종 인공지능 스피커, 게이밍디바이스까지도 됩니다. (애플은 이 부분이 애플 제품군으로 묶여 있어 좀 보수적인 편이지만) 사실 아직도 아직 어떤 스마트워치, 모바일 디바이스는 MP3를 이동시키는 것으로 일단 '듣게는 한다'고 대응 중이죠. 그러나 스트리밍 플랫폼이 연결된 디바이스여야만, 청취자의 청취패턴을 놓치지 않고 수집할 수 있을 터입니다.
  • 국내 업체들은 스마트워치 지원을 상당히 열심히 하고 있습니다. (링크) 뿐만 아니라 인공지능 스피커나 냉장고와도 연결이 되기 시작했지요..
Spotify가 지원하는 대략적인 제품군을 확인해볼 수 있습니다. 로컬 음원 플랫폼도 비슷한 구성이 많지요.<br>(그림을 누르시면, 스포티파이의 해당 페이지로 이동합니다.)<br>
Spotify가 지원하는 대략적인 제품군을 확인해볼 수 있습니다. 로컬 음원 플랫폼도 비슷한 구성이 많지요.
(그림을 누르시면, 스포티파이의 해당 페이지로 이동합니다.)

 

4. 서비스/회사

  • (추가 예정)

다음 업데이트에서는 음악의 텍스트 데이터에 관한 부분을 조금 더 자세히 보강하고, 여유가 되면 음악 데이터를 활용한 음악 산업에서 만들어낸 보고서들이나 참고 자료들을 추가해보려고 합니다. 또 이후에는 이런 데이터들을 획득할 때 주의해야할 점, 활용 시에 고려해야할 점 등들도 다뤄볼 예정입니다.

이 페이지에 관한 의견이나 제보 또한 언제나 환영합니다.

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️
댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !
© 2024 음악파는 김루씨

업계 사람들이 얘기하는 음악과 음악 산업

뉴스레터 문의biz.kimlou@gmail.com

자주 묻는 질문 서비스 소개서 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관