안녕하세요! 팀 김루씨에서 음악 데이터 주제를 담당할 여름씨입니다.
... 그런데, 음악 비즈니스를 다루는 뉴스레터에서, 왜 갑자기 데이터를 다룰까요?
그 이유는, 그곳에 데이터가 있기 때문입니다(끄덕).
음악 산업이 온라인 스트리밍 플랫폼으로 중심이 옮겨가면서, 제 눈에는 데이터 측면에서 다음의 세 가지가 크게 변한 것으로 보입니다.
- 상품 단위에서 사람 단위로 : 피지컬 시대에는 '앨범 판매량' 이나 누가 '빌보드 1위'가 되느냐가 핵심이었겠지만 디지털 시대에는 '멜론 진입 순위' 부터 '스포티파이 Monthly listener' 같은 기존에 없던 지표들이 보입니다. 아티스트의 인스타그램 팔로워 수나, 공식 유튜브 구독자 수도 마찬가지지요.
- 로컬에서 글로벌로 : 유튜브나 틱톡 같은 플랫폼은 기존의 미디어에 비해 폭발적인 도달 범위를 보입니다. 앨범 판매량 백만 장으로 업적을 세던 시절을 지나, 이제 BTS는 1억 뷰를 얼마나 빨리 달성했느냐로 이야기하죠. 이는 음악 산업에만 발생하는 일이 아닙니다. 배우 조인성이 모은 한국 영화관 관객 수가 2천만, ODG의 하랑이가 출연 유튜브 총 조회 수는 1억을 넘었다죠. 대단히 잘나간다의 관용적인 표현이 '백만', '천만'이 아니라 억 단위가 되었죠.
- 아티스트/앨범보다는 곡, 곡보다는 검색으로 : 이전에는 대형 아티스트의 신보와 앨범에 대한 정보가 매스미디어를 통해 접하기가 쉬웠습니다. 다들 비슷한 매체(=광고노출구좌)를 보다 보니, 몇 군데 메이저 프로그램에 정보를 노출하면 퍼지기가 쉬웠죠. 그걸 보고 음반 가게에 가서 아티스트나 앨범명을 기억해서 매대에서 음반을 집었죠. 지금은 아티스트를 몰라도 기억나는 가사의 일부만 어느 웹사이트에서든 검색이 되고, 언어를 몰라도, 샤잠처럼 음악 검색하는 기능들이 널리 사용하고 있죠.
이런 변화로 쌓인 데이터를 기업이 어떻게 쓰고 있는지는 소개된 바가 많지만, 기술적인 허들이 높아 저도 실무에서 맞닥뜨리는 어려움이 상당했습니다. 거기다가 실제로 한국의 음악 업계의 데이터 분석일은, 청취자에 대해 충분한 이해를 하는 단계로 데이터가 자주 활용되고 있지는 않았어요. 그런저런 아쉬움이 있어, 어떤 백그라운드에 계시든 음악에 관한 데이터를 알고 싶고, 활용해보고 싶은 분들에게 드리는 글을 써보려고 합니다.
그래서, 기존에는 없었다는 '행동' 데이터를 다뤄보려고요
김루씨가 어느 날 저에게 물었습니다. '오마이걸은 어느새 잘 되었네요, 이거 언제부터 이렇게 된 걸까요?'
(물론 이런 질문에 가장 빨리 대답할 방법은 델파이 기법입니다. 문제점은, 내 주변에 항상 오마이걸 팬이 있는 것은 아니라는 것, 팬덤에 있는 분들이 이 질문을 해결하기 위한 전문가가 아닐 수도 있다는 것입니다.)
그러면 '오마이걸은 언제 데뷔했고, 어떤 곡이 유명하고, 누가 좋아하지?'란 질문이 자연스럽게 떠오르게 되네요.
- '언제 데뷔했지?', '어떤 장르의 곡을 부르지?' → 생산자, 즉 아티스트(와 그가 속한 레이블, 유통사 등)가 만들어냅니다.
- '유명한 곡이 뭐지?', '누가 좋아하는지?', → 청취자가 만들어내는 정보입니다. 음원이 공개되는 날부터 형성되기 시작하는 내용입니다.
what | who | when | how | where | sort |
아티스트 데뷔년도 아티스트명 곡의 장르 | 생산자 | 음원 발매 전 | 거의 변하지 않음 | 포탈 검색 결과 음원사이트 검색 결과 (앨범정보) 등 | 콘텐츠 메타 데이터 |
아티스트의 유명한 곡 팬덤 | 청취자 | 음원 발매 후 계속 | 변할 수 있음 (계절과 시의성에 따라, 팬덤의 변화 등) | 음원사이트 검색 결과 (인기순) 각종 댓글, 팬싸이트 등 | 행동데이터 |
그러니 정리해보자면 생산자가 만드는 데이터 = 음악에 대한 정보로, 이건 데이터를 열어볼 때 필수적인 재료입니다. 이런 것들은 상당히 많은 부분 공개되어 있는 정보라 크롤링 등으로 일부 얻어올 수가 있습니다. 그러나, 청취자가 만드는 데이터 = 음악에 대한 반응, 선호, 해석 등은 일부는 공개되어있고, 일부는 공개되어 있지 않습니다.
이런 청취자 행동 데이터에 대한 자세한 이야기는 조금 길어질 듯 하니, 뉴스레터가 아닌 포스팅으로 대신하겠습니다. 또 앞으로의 여정에서도 조금씩 더 다뤄나갈 것이고요.
아무튼, 저는 공개된 청취자의 반응이 드러나는 행동 데이터들을 활용하거나 유추하는 방법으로 청취자의 데이터를 다뤄보려고 합니다. 기존에 충분히 살펴보지 않았던 영역이기에, 해결해야 할 문제가 많은 것은 축복입니다. 물론 고난도 (많이) 있을 테지만...
앞으로 어떻게 할거냐면요,
정기적으로 토픽을 잡아서 문제를 해결해나가는 분석을 해보려고 합니다.
그런데, 어떤 주제가 다뤄지면 좋을지는 의견을 받아보고 싶습니다. 이 링크에서 한번 골라봐 주시면 좋겠습니다. 다음 편 구상에 최대한 반영해보고 싶어요. 그 외에도 궁금한 점은 언제든지 메일 주신다면, 연재분에 잘 녹여보겠습니다.
하지만 아무리 프로페셔널이라고 해도 모든 요리가 성공적이지 않듯이, 종종 망한 데이터 분석도 있을 것 같습니다. 한 편의 글에 하나의 분석이 완결되기 어려울 경우도 있을 것 같습니다. 그래서 뉴스레터의 '뮤직데이터그램' 시리즈는 질문에 대한 궁리를 하는 과정이라도 공유해보려고 합니다. 그것으로도 실질적인 도움과 재미가 되리라 생각하면서요.
의견을 남겨주세요
알랑이
흥미롭네요
음악파는 김루씨
기대해주세요😝
의견을 남겨주세요