공간의 제약이 사라진다는 이 이야기는 불과 몇 년 전이다. 그러나 우리는 긴 터널과 같은 코로나19 시국을 지나고 있다. 코로나19로 인해 일상에도 많은 변화가 생겼다. 재택 근무를 하는 인구가 늘었고 학생들은 학교에 가지 못한지 오래다. 불필요한 외출을 삼가하는 경향도 생겼고, 다수가 한 자리에 모이는 일은 정부 방침으로 없어진 지 오래다. 결혼식이나 돌잔치 같은 가족 행사들이 간소화 되고, 해외 여행이나 출국도 극적으로 줄었다.
이런 상황이 데이터 분석가들에게도 새로운 종류의 어려움을 가져왔다. 이전 같으면 고객이나 사용자가 특정 공간에 체류 한다는 사실을 활용하여, 사용자가 특정한 맥락 하에 있을 것으로 추정하는 방식으로 분석 할 수 있었다. 방문 기록과 함께 몇 가지 보조 정보를 더 확보할 수 있다면, 방문의 맥락 뿐 아니라 방문의 의도까지도 가정할 수 있었다.
예를 들자면, 예전에는 서점에 방문한 횟수나 서점에 체류한 시간을 통해 그 사람에 대한 많은 정보를 얻을 수 있었다. 일정한 주기로 방문하는지, 체류 시간은 얼마나 되는지, 서점 내에서 이동의 패턴은 일정한지 방문할 때마다 다른지 등의 질문에 데이터로 답을 하면서 방문의 목적을 추정했다. 만약 동일한 사용자의 카드 결제 기록을 추가로 확보 할 수 있게 된다면, 서점에 방문할 때마다 서점에서 결제를 했는지, 서점을 방문 하기만 하고 결제는 거의 하지 않았는지 또는 비슷한 금액의 결제를 반복하는지, 결제 금액이 들쑥 날쑥 한지 등의 정보를 통해서도, 이 사람이 서점을 방문하는 이유를 짐작 할 수 있게 된다.
다른 예로는, 매일 비슷한 시간대에 지하철역에 나타나는 사람이 있는데, 이 사람이 주말에는 그 시간대에 지하철역에 등장하지 않고, 그 패턴이 몇 개월 이상 혹은 몇 년에 걸쳐 반복 된다면, 이 사람은 정기적인 이동을 하는 종류의 사람이고, 이 정보를 기반으로 이 사람은 직업을 가졌을 확률이 높다고 판단 할 수도 있었다. 그러나 코로나19로 인해 이동의 양이 줄면서 방문 기록이 줄어들고 데이터를 활용해 방문의 맥락과 의도를 파악하기 어려워졌다. 기존의 분석 방식과 가정이 무력해진 것이다.
요즘은 대신 생활의 많은 부분이 온라인으로 이동했다. 매일 아침 지하철역에 등장하던 직장인은 이제 비슷한 시간대에 직장에서 제공한 보안 프로그램을 접속 하는 것으로 업무를 시작한다. 점심 시간이 되면 회사 근처 식당으로 이동했지만, 이제는 배달앱을 켠다. 주말에나 시간을 내서 들렀던 영화관 대신 퇴근 후 영화앱을 켠다.
사람들이 핸드폰이나 컴퓨터에서 어떤 온라인 서비스를 사용하는지, 얼마나 자주 서비스에 방문하는지, 앱 서비스 내에서 어떤 경로로 움직이는지가 점점 더 중요해진다. 이전에는 오프라인 방문 장소나 이동 경로를 통해 사용자를 파악했다면, 이제 온라인 서비스들이 오프라인 장소를 대신한다. 내가 웹툰 앱을 자주 켜는지, 음악 앱을 자주 켜는지, 금융 앱을 자주 켜는지가 나의 성향과 관심사를 결정하는 기준이 된다. 내가 핸드폰에 깔아둔 앱 서비스 중 어떤 분야에서 돈을 많이 쓰는지로 내가 어떤 성향의 사람인지가 판단 된다.
우리나라 사용자들은 평균 100개가 넘는 앱을 핸드폰에 설치하고, 한 달에 30개가 넘는 앱 서비스를 사용한다고 한다. 이런 상황이라 개별 앱 서비스의 사용 기록에는 나의 기록 중 일부만이 남게 된다. 즉, 웹툰 앱 한 개, 배달 앱 한 개에 남은 기록을 분석 해서는 나에 대해 제대로 파악하기 어렵다는 뜻이다. 대개의 경우, 일반적으로 플랫폼이라고 부르는 사용자가 아주 많은 앱 서비스나 구글, 애플 처럼 핸드폰의 운영 체제를 보유한 회사들이 사용자의 전체적인 정보를 수집하기에 유리 하다.
데이터 분석가들은 여러 앱에 분산되어 저장된 사용자의 의도를 찾고 의미 순서로 사용자의 행동을 연결하는 작업에 시간을 많이 쏟게 된다. 머신러닝이나 분석의 자동화가 점점 각광 받게 되는 이유이기도 하다. 기존에는 사람 분석가가 사용자가 남긴 흔적을 하나 하나 눈으로 따라 가며 의미를 찾았다면, 최근에는 많은 수의 사용자가 남긴 기록에서 패턴을 찾는 분석 방식이 발전하고 있다. 컴퓨터가 앱서비스에 남겨진 기록을 활용하여, 자동으로 비슷한 사람들을 묶어 주거나, 표본이 되는 사람들과 유사한 사람들을 찾아주는 일을 수행한다. 이것이 우리가 자주 접하는 ‘빅데이터’와 ‘AI’의 핵심 개념이다.
우리의 일상에서 온라인이 차지하는 비중이 늘수록, 회사들은 내가 온라인에 남긴 기록에 더 많이 의존하게 된다. 나를 잘 파악하기 위해, 즉 나를 이해 하기 위한 단서를 하나라도 더 얻기 위해, 내가 앱 서비스에 남기는 기록의 양을 점점 늘리고, 더 다양한 종류의 정보를 남기도록 프로그래밍 한다. 또한 더 세밀한 기록을 남기도록 한다.
회사들의 이러한 노력의 결과로, 내가 최근에 검색한 여행지 광고가 뜨고, 최근 구입한 핸드폰의 케이스가 추천된다. 매주 주말에 우유를 주문했더니, 쇼핑앱을 켜자마자 '우유를 장바구니에 넣을까요?' 라고 알림창이 뜨는 것은 이제 놀랍지도 않다. 온라인 세상에 우리가 남긴 그림자가 시간이 갈수록 점점 선명해지고 있다. 다음 글에서는 우리가 온라인 세상에 남긴 흔적, 우리의 그림자, 개인 정보와 광고용 데이터에 대해 적어보려고 한다.
*
글쓴이 - 서하연
카카오에서 데이터 비즈니스를 고민하고, 데이터 프로덕트를 만듭니다.
데이터, 인공지능과 함께 하는 미래에 관심이 많습니다.
facebook page https://www.facebook.com/alexsuh01
의견을 남겨주세요