🧐 Summary
1️⃣ AI는 진짜로 생각하진 않지만, 마치 생각하는 것처럼 보이게 잘 흉내 내요.
2️⃣ 애플이랑 스포티파이 실험을 보면, 요즘 AI는 검색이랑 추천을 자연스럽게 섞어서 점점 더 똑똑해 보이게 만들고 있어요.
3️⃣ 결국 중요한 건 기술이 아니라, 그 기술을 어떻게 쓰고 보여줄지 고민하는 우리 역할이에요.
안녕하세요 구독자님, 요즘 AI 서비스들 정말 똑똑하죠. “잔잔한 재즈 틀어줘” 한마디면, 취향 저격 음악이 바로 나와요. 이쯤 되면 ‘AI가 생각까지 해주는 거 아냐?’ 싶지만 사실, AI는 생각한다기 보단 패턴을 잘 따라하는 기술에 가까워요.
그런데 우리가 마치 AI가 생각하는 것처럼 느끼게 되는 이유 중 하나는, 검색과 추천의 경계가 흐려지고 있기 때문이에요. 원래는 “내가 원하는 걸 찾는 검색”과 “내가 좋아할 걸 제안하는 추천”이 따로였는데, 요즘엔 애매하게 말해도 AI가 알아서 척척 보여주죠.
오늘은 애플과 스포티파이의 실험을 통해서 그런 착각이 어떻게 만들어지는지, 그리고 그걸 기반으로 어떻게 정보 시스템을 설계해야하는지 알아보려고 합니다.
AI는 정말 생각할 수 있을까?
애플의 연구진은 최근 LLM 기반 AI가 실제로 ‘생각’을 할 수 있는지를 실험했어요.일상적인 문장이나 짧은 질문에 답하는 게 아니라, 단계적 추론이 필요한 퍼즐형 문제를 주고 어떻게 반응하는지를 살펴봤습니다.
실험에 사용된 문제들은 단순히 정답이나 패턴을 외워서 풀 수 있는 게 아니었어요. 예를 들면, 하노이탑이나 강 건너기 퍼즐 같은 문제들인데, 이런 문제들은 중간 단계에서 ‘잠시 불리한 선택’을 하고 돌아가는 등 계획·기억·조건 판단이 복합적으로 필요한 문제들이었죠.
처음에는 모델이 제법 잘 해내는 것 같았어요. 간단한 문제는 꽤 정확히 풀었거든요. 하지만 문제 난이도가 높아질수록 놀라운 현상이 나타났습니다. AI가 생각을 ‘줄이기’ 시작한 거예요. 좀 더쉽게말하면, 답을 내기 위해 필요한 사고의 단계 수가 많아질수록 오히려 모델은 그 단계를 ‘생략’하거나, 아주 짧고 단순한 답변으로 회피했습니다. 어떤 경우에는 문제를 풀기를 아예 포기하고 멈추기도 했고요.
애플은 이 현상을 이렇게 분석했어요. 지금의 AI는 본질적으로 “문제를 푸는 알고리즘”을 사용하는 게 아니라 “예전에 본 적 있는 문장을 흉내 내는 방식”으로 답을 생성한다는 거예요. 즉, AI는 진짜로 ‘생각’하는 게 아니라, 그럴듯해 보이게 “말을 만들어내는 데에 최적화된 존재”라는 거죠.
이런 관점에서 보면, AI의 ‘생각’이란 건 실제보다 훨씬 얕고, 불안정한 것일 수도 있어요. 하지만 그렇다고 해서 이 기술이 쓸모없다는 뜻은 아닙니다. 오히려 이 착각을 잘 이해하고 활용하면, 사람이 보기엔 굉장히 똑똑한 시스템처럼 보일 수 있거든요.
생각은 안 해도 추천은 잘하는 AI
Spotify의 실험은 ‘AI가 생각하지 않아도 얼마나 똑똑하게 보일 수 있는지’를 잘 보여줍니다. 그들이 개발한 Text2Tracks 시스템은 기존 추천 시스템의 접근 방식과는 조금 다른 길을 택했어요.
기존에는 사용자가 “잔잔한 재즈 음악 추천해줘”라고 하면, AI는 먼저 이 문장을 해석하고, 관련 있는 아티스트나 곡 제목을 만들고 나서 해당 곡을 검색해서 틀어주는 방식이죠. 그런데 이 방식은 여러 가지 문제가 있었어요. 곡 제목은 분위기를 담지 못할 때가 많고, 같은 제목을 가진 곡이 여러 버전으로 존재하기도 하고, LLM이 긴 제목을 생성하느라 속도도 느렸거든요.
그래서 Spotify는 발상의 전환을 했어요. 아예 곡 제목이나 가수 이름은 건너뛰고, 노래 고유 ID(번호)를 바로 생성하게 했습니다. 사용자가 “비 오는 날 어울리는 감성 발라드”라고 하면, AI가 직접 그 분위기에 어울리는 노래들의 ID를 바로 뽑아주는 방식이에요.
이걸 가능하게 만든 건 사람들의 플레이리스트 데이터였어요. AI는 ‘이런 분위기’라고 쓰인 제목 아래 어떤 노래들이 들어 있는지를 학습한 거죠. 예를 들면 “해질녘 드라이브”라는 리스트에 들어있는 곡들을 보며 그 분위기엔 어떤 음악이 어울리는지를 배우는 식이죠.
재밌는 건, 이 모델이 곡을 직접 들어보거나 감정을 이해하지 않아도 정확한 곡을 추천한다는 거예요. 우리가 AI가 ‘이해했다’고 느끼는 순간도, 사실은 수많은 사람들의 데이터를 바탕으로 ‘그럴듯하게 고른 것’일 뿐이죠. 이처럼, AI는 생각하지 않지만 그 생각을 흉내 내는 능력이 아주 뛰어납니다. AI가 생각했다라고 느끼도록 흉내 내는 능력을 잘 활용한 예입니다.
검색과 추천, 결국 하나의 이야기
위의 Text2Tracks에서 AI는 검색처럼 문장을 이해하고, 추천처럼 곡을 골라주죠. 즉, 검색과 추천이 하나의 시스템 안에서 자연스럽게 연결된다는 걸 보여줘요. 이건 Spotify가 또 다른 연구에서 집중적으로 파고든 주제이기도 해요.
보통 검색 시스템은 텍스트 쿼리를 받아서 그에 맞는 결과를 보여주고, 추천 시스템은 사용자의 이전 행동 데이터를 분석해서 관심 있을 만한 걸 추천하죠. 그래서 지금까지는 검색과 추천을 서로 다른 목적, 다른 모델로 취급해왔어요.
하지만 Spotify는 여기서 질문을 던졌어요. “검색과 추천은 정말 그렇게 분리되어야 할까?” 결국 두 시스템 모두, 사용자가 원하는 걸 더 잘 찾게 해주려는 거잖아요. 그렇다면 이 두 가지 정보를 함께 학습하면, 더 똑똑한 결과를 낼 수 있지 않을까? 그래서 실제로 하나의 생성형 AI 모델에 검색용 쿼리-아이템 데이터와, 추천용 사용자-아이템 데이터를 같이 학습시켰습니다.
결과는 기대 이상이었어요. 이 통합 모델은 기존의 개별 모델들보다 검색도, 추천도 더 잘 해냈어요. 서로 다른 방식으로 아이템을 바라보는 두 데이터가 함께 있을 때 AI가 더 풍부하게 아이템을 표현할 수 있었기 때문입니다. 즉, 콘텐츠를 단순히 많이 소비한 게 아니라, 어떤 맥락에서 소비되었는지를 함께 배웠던 거죠.
이건 AI가 진짜 똑똑해서가 아니라, 우리가 AI에게 ‘똑똑해 보이도록’ 데이터를 설계하고 훈련시켰기 때문이에요. 위의 예시와 마찬가지로 인간이 AI를 사고하는 시스템으로 보이도록 고민했기 때문에 가능한 일이었습니다.
생각의 본질은 단순히 기억을 꺼내는 게 아니라, 전혀 새로운 관계를 발견하고 연결짓는 과정이에요. 하지만 AI는 여전히 과거에 학습한 패턴을 바탕으로 ‘그럴듯한’ 말을 생성할 뿐이죠. 스스로 새로운 개념을 만들거나, 맥락을 바꿔서 판단하는 건 아직 어렵습니다.
그런데도 우리는 자꾸 AI가 마치 생각이라도 한 것처럼 느껴지는 순간을 마주하곤 해요. “어떻게 이걸 알았지?” 싶은 추천이나, 내가 원하던 걸 정확히 보여주는 검색 결과를 볼 때요. 사실 이건 AI가 ‘생각’했기 때문이 아니라, 그 생각을 설계한 사람들이 있었기 때문이에요.
바로 우리 같은 사람들이죠. UX 디자이너, 리서처, 기획자처럼 사람과 기술 사이를 연결하는 일을 하는 사람들.
우리는 지금 ‘사고하지 않는 기술’을 기반으로 ‘사고하는 시스템’을 만들어가고 있어요. 그렇다면 앞으로 더 중요한 질문은 이걸 거예요. 이 시스템은 누구의 사고를 닮아야 할까? 우리는 이 시스템이 어떤 맥락에서, 어떤 기준으로 반응하길 원하는가? 그리고 사용자는 이 시스템을 통해 어떤 감정을 느끼고, 어떤 결정을 하게 될까?
그래서 AI의 발전은 기술의 문제가 아니라 점점 설계와 책임의 문제로 옮겨가고 있어요. 똑똑한 기술보다 더 중요한 건, 어떤 맥락에서 이 기술이 쓰일지 상상하는 사람의 질문이거든요.
지금 우리가 만드는 건 AI가 아니라, 사람을 닮은 기대일지도 모릅니다. 그 기대를 어떻게 채워갈지, 다음주 수요일에 또 이야기 나눠요.
[inspire X 오픈카톡방]
https://open.kakao.com/o/gBHmseah
Reference
[1] https://machinelearning.apple.com/research/illusion-of-thinking
[3] https://research.atspotify.com/2024/10/bridging-search-and-recommendation-with-generative-retrieval
의견을 남겨주세요