숫자 하나만 먼저 드릴게요.
백만 토큰당 25달러 vs 0.20달러. 125배 차이예요.
앞의 숫자는 현재 가장 똑똑한 폐쇄형 AI 모델(Claude Opus 4.6)의 출력 가격이에요. 뒤의 숫자는 지난주 공개된 구글의 오픈 모델 Gemma 4 31B를 API로 쓸 때의 가격이고요. 그런데 이 두 모델이 에이전트 태스크(AI가 도구를 호출하고, 파일을 조작하고, 여러 단계의 지시를 수행하는 일)에서 보여주는 성능 차이는 125배가 아니에요. 비슷한 수준이에요.
AI 에이전트 하나가 태스크 하나를 처리할 때 쓰는 토큰은 100만~350만 개. 이게 하루에 수천 건이 돌아가는 프로덕션 환경이라면? 이 가격 차이는 "비용 절감"이 아니라 "할 수 있느냐 없느냐"의 문제가 돼요.
오늘 뉴스레터에서는 세 가지를 이야기해요.
- 오픈 모델이 정말로 프론티어 모델과 경쟁 가능한지, 데이터로 확인해요
- 에이전트 시대에 토큰 비용이 왜 폭발하는지, 구조적 원인을 짚어요
- 이 변화가 AI 산업의 가치 사슬을 어떻게 재편하고 있는지, GTM 관점에서 해석해요
구독자분들은 아래에서 전체 분석을 이어서 읽어주세요.
의견을 남겨주세요