스포티파이는 사용자의 입맛 변화를 미리 알아차릴 수 있을까?

플랫폼이 마음만 먹는다면, 고객을 어디까지 탐구할 수 있는걸까?

2021.05.20 | 조회 1.5K |
0
|

팀 뮤직데이터

매주 FLO의 음악데이터를 읽어드립니다.

구독자님은 어떤 장르의 음악을 좋아하시나요?

팀 뮤직데이터에서는 하나만 고르기 어렵다는 응답이나, '그때 그때 다른 것 같다'는 대답이 상당히 많았습니다. 어떨 땐 클래식, 또 어떨 땐 아이돌댄스, 또 다른 날엔 인디뮤직을 즐겨 듣기도 합니다.

나이대에 따라서도 달라질 수 있습니다. 이 글을 쓰는 저 자신도 10대 때 즐겨듣던 장르와 30대 때 즐겨 듣던 장르를 생각해보면, 꽤나 달라져있습니다. 나도 모르는 사이에 가장 좋아하는 장르에 서서히 변화가 찾아온 걸지도요.

시간에 따라 선호하는 장르가 변화하는 것이 자연스러운 일이라면, 그럼 음악 선호 장르는 어떤 방식으로 변화하게 될까요? 이번 뉴스레터에서는 사용자의 장르 선호 변화에 대해서 스포티파이에서 연구한 내용을 소개하려고 합니다. 


우리가 즐겨 듣는 장르는 점차 변화한다

일단 정말 사람들이 좋아하는 장르가 변화하는지부터 확인해야겠죠? 일단 스포티파이는 다음과 같이 접근했습니다.

  • 2016년부터 2020년까지 지속적으로 청취한 10만명의 청취자 대상
  • 분기별로 자료를 정리 : 기준 시기(2016년 1분기)에 비해 다음 분기, 다다음 분기에 듣는 장르가 달라진 정도를 "장르별 스트리밍 비율"로 확인

그 결과, 2016년 1분기에 비해 장르별 스트리밍비율이 시간이 지날수록 점점 달라졌습니다.기준 시기(2016년 1분기) 분기별 장르 스트리밍 비율 차를 나타낸 분포의 평균이 0.4에서 0.6까지 증가하였음을 발견하였습니다. 아래 그래프에서, 왼쪽에서 오른쪽으로 갈 수록 선그래프의 높이가 낮아지며 점차 옆으로 더 퍼져가는 것을 볼 수 있습니다. 

고객의 장르별 스트리밍 비율(고객이 청취한 장르의 트랙수/고객이 청취한 전체 장르의 트랙 수)의 차이는 개개인마다 다릅니다. 만약 나혼자라는 고객이 2016년 1분기에 100개의 서로 다른 트랙을 청취했고, 그 중 Kpop장르는 20개, 클래식 장르나 80개라면 0.2와 0.8이 기준값이 될 것입니다. 나혼자씨가 2020년 2분기에 Kpop장르 스트리밍 비율이 0.4이 되고(기준 시기 대비 +0.2), 클래식 장르 스트리밍 비율이 0.6(기준 시기 대비 -0.4)가 되면, 각 장르 스트리밍 비율의 차인 0.2와 -0.4에 각각 절댓값을 씌워서 2로 나눈 것을(결과적으로 0.1과 0.2) variation으로 본 분포로 보입니다.

당신이 들어본 적 없는 장르의 음악을 좋아할 가능성은?

스포티파이는 이러한 선호 음악 장르의 변화를 예측하기 위해서 Preference Transition Model (PTM)를 사용했습니다. 해당 모델은 사용자가 과거에 한 번도 들어 본 적이 없는 새로운 장르를 예측하는 데 특히 유용하다고 합니다. (음악 선호도 뿐만 아니라, 요리 선호도에서 영화 선호도에 이르기까지 공개적으로 사용 가능한 다른 데이터 세트에 모델을 적용하고 이러한 애플리케이션에서도 모델이 잘 작용한다는 것을 발견했다고 하는데요.)

예를 들어 나혼자 라는 사람이 있고, 3개의 장르, 걸그룹, 힙합, 인디팝이 있다고 가정해봅시다. 이 경우, 나혼자씨가 현 시점에서 좋아하는 장르를 알 수 있다면, 스포티파이가 발견한 장르간 전환 확률을 적용해서 다음에 좋아할만한 장르를 예측할 수 있습니다.

현재 선호하는 장르에서 미래에 선호하는 다른 장르로 전환될 확률 뿐만 아니라 현재 장르와 동일한 장르로 선호가 유지될 확률도 구합니다. 왜냐하면, 현 시점과 다음 시점에 가장 선호하는 장르가 동일할 수도 있기 때문입니다. 아래 예시를 보면 걸그룹에서 걸그룹으로(선호 장르 유지), 걸그룹에서 힙합으로(장르 전환), 걸그룹에서 인디팝으로 바뀔 확률(장르 전환) 이 바로 그것입니다.

위에는 나혼자씨가 현시점 듣고 있는 장르가 명확해서 한 장르에 세 장르에 대한 확률만 나와있지만, 사실 각 장르를 듣고 있는 경우까지 고려하게 되면 확률전환 표가 3X3의 행렬로 표현 됩니다. (이론이 궁금하시면, 이 유투브 링크를 참고하시죠.) 결과적으로는 현 장르 외에 가장 높은 확률의 장르가 다음 번에 들을 확률이 높은 장르가 될 수 있습니다.


장르 간에는 비교 우위가 존재한다!

이 연구의 가장 흥미로운 지점은, 같은 두 장르 사이에서도 어느 장르에서 어느 장르로 전환되느냐에 따라서 확률이 다를 수 있다고 합니다. 즉, 입문하는 장르가 무엇이냐에 따라서 다음에 어떤 장르를 좋아하게 될지는 전혀 다른 것입니다.

장르1에서 장르2로 전환될 확률과 장르2에서 장르1로 전환될 확률을 나타낸 표입니다. 숫자 크기가 많이 다르네요! 대체로, 장르2쪽에 있는 장르들이 장르1에 비해 비교우위가 낮아서, '뺏길 가능성'이 높은 것으로 보입니다. 
장르1에서 장르2로 전환될 확률과 장르2에서 장르1로 전환될 확률을 나타낸 표입니다. 숫자 크기가 많이 다르네요! 대체로, 장르2쪽에 있는 장르들이 장르1에 비해 비교우위가 낮아서, '뺏길 가능성'이 높은 것으로 보입니다. 
jam band를 좋아하는 사람이 jamgrass를 좋아하게 될 확률(전환 확률)0.0014이지만 반대로는 전환 확률 0.87로 차이가 많이 납니다.
jam band를 좋아하는 사람이 jamgrass를 좋아하게 될 확률(전환 확률)0.0014이지만 반대로는 전환 확률 0.87로 차이가 많이 납니다.

두 개의 장르 사이에 선호가 전환될 확률이 출발점이 어디냐에 따라 다르다는 점이 신기합니다. 생각해보면, 음식에 있어서도 비교 우위라는 것이 있습니다. 이를테면, 콜라를 마시다가 피자를 떠올릴 확률보다는, 피자를 먹다가 콜라를 떠올릴 확률은 더 높을 듯 합니다.

장르의 인기순위에 따라 4,000개의 Genre가 X축에 나열되어 있고, Y축은 장르가 유지될 확률을 나타낸 것입니다. X축 가장 왼편에 인기 있는 장르가 다음 시기에 유지될 확률은 대부분 높은데 비하여, X축 가장 오른편에 있는 즉 인기가 낮은 장르는 유지될 확률이 대부분 낮은 것을 확인할 수 있습니다.
장르의 인기순위에 따라 4,000개의 Genre가 X축에 나열되어 있고, Y축은 장르가 유지될 확률을 나타낸 것입니다. X축 가장 왼편에 인기 있는 장르가 다음 시기에 유지될 확률은 대부분 높은데 비하여, X축 가장 오른편에 있는 즉 인기가 낮은 장르는 유지될 확률이 대부분 낮은 것을 확인할 수 있습니다.

장르의 인기도에 따라 다음 시기에 동일한 장르에 머무를 확률이 다르다는 것도 눈여겨 볼 점인데요. 인기있는 장르의 선호가 다른 장르에 뺏기지 않고 지속될 가능성이 높습니다.

위 그래프를 따르면, 클래식을 선호하는 청취자가 힙합을 선호하는데까지 전환되는 가장 짧은 길은 클래식 → 후기 낭만주의어덜트 스탠다드캐내디안팝 → 힙합입니다. 이 순서대로 플레이리스트를 큐레이션 해 준다면 실제로 사람들의 취향이 변하는 것을 확인해 볼 수 있겠습니다.


스포티파이의 야심에 다시 한번 놀랍니다

스포티파이는 앞으로의 연구 과제로 전체 유저를 대상이 아닌 유저의 특성을 기반으로 그들을 그룹핑하여 그룹별 장르전환 패턴을 구할 것을 언급하기도 했습니다. 

또 한국의 음악 플랫폼 데이터로 위의 연구를 참고한다면, 이전 글에서 다루었던 사용자 클러스터링 결과를 반영하는 것이 좋을 것 같습니다. 사실 아이를 보면서 음악을 듣는 분들의 장르 선호가 단기간에 변화 되기는 어려울 겁니다. 그러나 출퇴근 시간대에 음악을 듣는 사람들은 가능하겠지요. 장르 구분을 넘어 플레이리스트나 아티스트 전환을 예측하는 것도 상상해봅니다. 

이러한 연구가 서비스에 잘 녹아든다면 나도 모르는 사이에 다양한 장르를 자연스럽게 마주하게 될 것 같습니다. 스포티파이의 최근 연구에서는 다양한 음악 장르를 청취하는 사용자가 무료 구독에서 유료 구독으로 전환 할 가능성이 더 높다는 연구 결과가 있습니다. 스포티파이는 고객의 입맛 변화를 알아채고, 더 많은 유료 구독자를 늘릴 꿈을 꾸고 있는 모양입니다. 플랫폼이 데이터를 잘 다루면 이런 큰 그림도 그릴 수 있습니다.

 

작업후기

1. 이 연구는 올해 4월 19일, 스포티파이 엔지니어링 블로그(https://research.atspotify.com/finding-structure-in-users-evolving-listening-preferences/)에 게재된 것입니다. 사실 간단하게만 소개드리려고 했는데, 팀 뮤직데이터의 데이터사이언티스트들이 원 연구를 찾아내버렸습니다. 그리고 고통스러운 논문 읽기가 시작되었고.. 네. 많은 공부가 되었습니다! 2. 심리학에 영감을 받은 모델로 장르를 예측하는 연구도 있는데요.(https://arxiv.org/pdf/2003.10699.pdf) 청취 데이터를 기반으로 인지 아키텍쳐인 ACT-R을 이용했다고 합니다.(수식 스압 경고 🚨) 3. 영화 분야에서도 장르 예측과 관련된 연구도 선행되어져 왔는데요. 다음 장르를 예측하는 것은 아니지만, 시놉시스 데이터만 가지고 해당 영화의 장르와 Rating까지 예측한 연구도 있습니다. (https://www.aclweb.org/anthology/Y18-1007.pdf) 4. 다음 글 예고가 은근슬쩍 사라지고 있는 것은 어쩔 수 없습니다! 세이브 원고가 동났어요. 댓글로 남겨주신 의견들을 취합해서 정리 중이니 조금만 기다려주세요!

 

 

  • 팀 뮤직데이터는 음악 스트리밍 플랫폼(FLO)에서 발생하는 데이터의 질감을 공부하며 발행하는 뉴스레터입니다. 기술적인 how to 보다 데이터를 충분히 관찰하는 작업을 우선시 합니다.
  • 데이터의 해석은 발행일 당시의 의견으로 글을 읽는 시기에 따라 관점이 달라질 수 있습니다. 새로운 해석과 분석 주제가 있다면 댓글 부탁드립니다.
  • 팀 뮤직데이터의 자료 해석은 서비스와 회사의 입장을 반영하지 않습니다.

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

팀 뮤직데이터 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

© 2024 팀 뮤직데이터

매주 FLO의 음악데이터를 읽어드립니다.

뉴스레터 문의 : dreamus.musicdata@gmail.com

자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관