들어가며
구독자님, 안녕하세요. 오스왈드 입니다. 오늘은 약간 GTM 전략 스러운 이야기를 해보려해요.
올해 2월, Anthropic이 시리즈 G 펀딩을 발표하며 내세운 숫자가 있어요. 연환산 매출(ARR) 140억 달러. 3,800억 달러 기업가치. 역사상 가장 빠르게 성장하는 B2B 기업이라는 수식어가 붙었죠.
그런데 불과 한 달 뒤, 같은 회사의 CFO 크리슈나 라오가 미국 국방부 소송에서 법원에 제출한 선서 진술서에는 전혀 다른 숫자가 적혀 있었어요. "현재까지 누적 매출 50억 달러 초과." 창업 이래 벌어들인 돈 전부를 합쳐서요.
140억 달러와 50억 달러. 같은 회사, 한 달 간격, 같은 경영진이 내놓은 두 숫자예요. 이 간극의 정체가 바로 오늘 이야기할 주제예요. 테크 산업의 '공용 지표'가 다시 한번 세대교체를 앞두고 있어요.
📐 지표의 세대사: DAU에서 ARR로, 그리고 다시
테크 산업에는 시대마다 "이 숫자만 보면 된다"는 지표가 있었어요. 그리고 그 지표가 현실과 어긋나기 시작하면, 새로운 시대가 열렸어요.
1세대: DAU/MAU의 시대 (2007~2015년경). 스마트폰과 소셜 미디어가 폭발하던 시기, 산업 전체를 지배한 질문은 하나였어요. "사용자가 얼마나 자주 오는가?" 페이스북, 트위터, 인스타그램의 가치는 일간 활성 사용자(DAU)[1]와 월간 활성 사용자(MAU)로 측정됐어요. 투자자도, 언론도, 경영진도 이 숫자를 봤어요. 이유는 단순했어요. 사용자가 모이면 광고 매출이건 뭐건 따라오던 시대였거든요.
하지만 문제가 생겼어요. DAU가 1억인 서비스와 DAU가 1억인 다른 서비스의 비즈니스 품질이 완전히 달랐거든요. 봇 계정이 섞여 있었고, '활성'의 정의가 회사마다 달랐고, 무엇보다 사용자 수가 매출과 직결되지 않는 서비스들이 늘어났어요. DAU/MAU는 관심의 크기를 잘 측정했지만, 비즈니스의 건강 상태를 보여주지는 못했어요.
2세대: ARR/MRR의 시대 (2015~2024년경). 클라우드와 SaaS[2]가 주류가 되면서, 산업의 질문이 바뀌었어요. "얼마나 예측 가능하게 버는가?" 월간 반복 매출(MRR)에 12를 곱한 연환산 반복 매출(ARR)이 새로운 공용어가 됐어요.
ARR이 통한 건 SaaS의 세 가지 특성 덕분이었어요. 매출총이익률[3]이 80~90%로 높았고, 고객을 한 명 더 서빙하는 한계비용이 거의 0이었고, 계약이 실제로 '연간'이고 실제로 '반복'됐어요. 이 세 조건에서는 이번 달 매출 × 12가 실제 연간 매출과 거의 같았어요. 이사회도 이해했고, CFO도 예측할 수 있었고, 투자자도 기업 간 비교에 쓸 수 있었어요. 15년간 아무도 심각하게 의심하지 않았던 건, 의심할 이유가 없었기 때문이에요.
그리고 지금, AI가 이 세 가지 전제를 동시에 깨뜨리고 있어요.
🔥 AI가 깨뜨린 ARR의 세 가지 전제
전제 1: 한계비용이 거의 0이다 → 깨졌어요. AI 제품에서는 모든 추론(inference)[4] 호출이 실제 비용이에요. 사용자가 복잡한 코드를 생성하거나 긴 문서를 분석할 때마다 GPU 비용이 청구서에 찍혀요. 기술 저널리스트 Ed Zitron의 보도에 따르면, Anthropic은 2025년 1월부터 9월까지 AWS 컴퓨팅에만 약 26.6억 달러를 지출했는데, 같은 기간 추정 매출은 약 25.5억 달러였어요. 매출의 100% 이상을 클라우드 비용으로 쓴 셈이에요.
전제 2: 고객 간 비용 차이가 미미하다 → 깨졌어요. 같은 월 2,000달러를 내는 두 고객을 상상해 보세요. A 고객은 가벼운 작업을 돌려서 매출총이익률이 78%예요. B 고객은 매일 대규모 모델 집약적 작업을 실행해서 매출총이익률이 31%에요. ARR 대시보드에는 둘 다 동일한 연 24,000달러로 찍혀요. B 고객이 단위경제학[5]을 무너뜨리고 있다는 사실을, ARR은 보여줄 방법이 없어요. 상위 5% 고객이 전체 컴퓨팅 비용의 75%를 소비하면서 나머지 고객과 같은 정액 요금을 내는 건, AI 정액제 제품의 기본 상태예요.
전제 3: '반복'이 보장된다 → 흔들리고 있어요. SaaS에서는 전환 비용이 높았어요. 데이터 마이그레이션, 직원 재교육, 워크플로우 재설계까지. 하지만 AI 도구의 전환은 몇 시간이면 끝나요. API 키를 바꾸면 되거든요. '반복(Recurring)'이라는 전제 자체가 낙관적인 거예요.
세 가지가 동시에 무너지면, ARR은 불완전한 게 아니라 적극적으로 오해를 유발하는 지표가 돼요. DAU가 비즈니스 품질을 설명하지 못하게 된 순간과 같은 구조예요. 최근에 그로스마케팅, 퍼포먼스마케팅이라는 단어가 잘 안보이지 않으세요? 위의 3가지 전제가 꺠지면서 1세대~2세대를 구가했던 그들의 방식이 더 이상 먹히지 않기 시작했어요. 이제 새로운 문법이 필요해졌거든요.
📊 숫자의 이면: Anthropic과 OpenAI
이게 추상적인 이야기가 아니라는 걸, 지금 가장 주목받는 두 AI 기업이 보여주고 있어요.
Anthropic은 2024년 12월 ARR 10억 달러에서 출발해, 2025년 7월 40억, 12월 90억, 그리고 2026년 2월 140억 달러에 도달했다고 발표했어요. 14개월 만에 10배 성장. 역사상 어떤 B2B 소프트웨어 기업도 달성하지 못한 속도예요. 그런데 같은 해 3월 9일, CFO가 미국 법원에 제출한 선서 진술서에는 창업 이래 누적 매출이 "50억 달러를 초과한다"고 적혀 있었어요. Ed Zitron은 Anthropic이 발표한 ARR 수치들을 역산해서 누적 매출을 추정했는데, 최소 66.6억 달러가 나왔어요. 50억 달러와도, 140억 달러와도 맞지 않는 숫자예요. 게다가 추론과 학습에 투입된 비용은 100억 달러 이상이었어요.
OpenAI도 마찬가지예요. CFO 사라 프라이어는 2026년 1월에 "2025년 ARR이 200억 달러를 넘었다"고 발표했어요. 하지만 2025년 9월 공개된 반기 실적을 보면, 상반기 실제 매출은 약 43억 달러, 현금 소진은 25억 달러였어요. 연간 약 130억 달러 매출 페이스인데, 200억 달러라는 ARR과는 상당한 거리가 있었어요.
DAU/MAU 시대에 '활성 사용자'의 정의가 회사마다 달랐던 것처럼, ARR 시대에는 '연환산'이라는 단어가 실제 연간 실적과 다른 의미로 쓰이고 있어요. 그리고 그 간극이 수십억 달러 단위예요. 즉, 더 이상 반복 매출이라는 개념이 유의미 하지 않다는 거에요.

🔄 3세대 지표의 후보들
그렇다면 ARR 이후, AI 시대의 공용어는 뭐가 될까요? 아직 합의된 답은 없지만, 업계에서 유력하게 부상하는 두 가지가 있어요.
첫 번째, 지출 대비 생산성(Productivity per Dollar Spent). SaaS 시대에는 'ARR ÷ 직원 수'가 기업의 효율성을 보여주는 대표 지표였어요. 직원이 주된 비용이었으니까요. 하지만 AI 에이전트가 주 40시간에 해당하는 워크플로우를 처리하고 있다면, 그건 소프트웨어 구독이 아니라 노동력 비용이에요.
GTM 전략가 Kyle Poyar의 제안은 명쾌해요. 분모에 인건비뿐 아니라 AI 에이전트 비용까지 포함하라는 거예요. 'ARR ÷ (인건비 + AI 지출)'이 되는 셈이죠. 이 숫자를 처음 계산해본 기업들 중에는, 기존 'ARR ÷ 직원 수'로는 멀쩡해 보이던 효율성 지표가 실제로는 2년째 하락하고 있었다는 사실을 발견한 경우도 있어요.
벤처 캐피털리스트 Tomasz Tunguz는 한 발 더 나아가서, AI 기업 6곳의 토큰당 매출총이익을 분석했어요. 결과가 인상적이에요. 토큰당 매출총이익과 기업가치의 상관관계는 0.70인 반면, 단순 토큰 처리량과 기업가치의 상관관계는 0.47에 불과했어요. 투자자들은 이미 '얼마나 많이'가 아니라 '얼마나 남기면서'를 보고 있다는 뜻이에요.
두 번째, 1년차 가치(First Year Value). SaaS에서는 LTV/CAC[6] 비율이 투자 효율의 핵심 지표였어요. 고객 생애 가치를 고객 획득 비용으로 나눈 비율이죠. 그런데 CFO 출신 CJ Gustafson은 이걸 AI 스타트업에 적용하는 건 "숫자 놀이"에 가깝다고 말해요.
이유는 간단해요. AI 고객의 '생애'가 얼마인지 아무도 몰라요. 전환 마찰이 역대 어떤 소프트웨어보다 낮고, 나를 대체할 도구가 몇 시간이면 배포돼요. LTV는 낮은 이탈률, 예측 가능한 확장, 긴 유지 기간을 전제하는데, AI 제품은 이 세 가지 중 어떤 것도 아직 증명하지 못했어요.
1년차 가치는 더 날카로운 질문을 던져요. "이 고객이 첫 12개월 안에 갱신을 정당화할 만큼 충분한 가치를 얻었는가?" 2년차나 3년차에 가서야 'yes'가 되는 구조라면, LTV가 보기 좋아도 실은 리텐션 문제를 감추고 있는 거예요.
오스왈드의 시선
지표의 세대교체를 되돌아보면, 패턴이 보여요. 지표는 비즈니스 모델의 그림자예요. 광고 모델이 지배하면 DAU/MAU가 왕이 되고, 구독 모델이 지배하면 ARR이 왕이 돼요. 그리고 비즈니스 모델이 바뀌는데 지표가 바뀌지 않으면, 그 간극에서 수십억 달러 규모의 착시가 만들어져요.
GTM 전략을 수립해온 경험에서 보면, 지표는 단순한 측정 도구가 아니에요. 조직의 행동을 결정하는 인센티브 구조예요. ARR을 KPI로 쓰는 회사의 영업팀은 매출 크기를 최적화하지, 고객별 수익성을 최적화하지 않아요. Anthropic이 140억 달러 ARR을 발표하고 380억 달러 기업가치를 인정받은 사례가 이 구조의 작동 방식을 잘 보여줘요.
하지만 저는 이 구조가 오래 갈 수 없다고 생각해요. 법원 선서 진술서에서 누적 매출이 드러나고, 독립 저널리스트가 AWS 지출을 추적해서 보도하는 시대예요. ARR이라는 화장이 벗겨지는 속도가 빨라지고 있어요. 창업자들도, 소비자들도, 투자자들도 점점 똑똑해지고 있어요. 더 이상 지표로 장난치는 시대는 끝나가고 있다는 뜻이기도 해요.
다만 솔직하게 말씀드리면, 새로운 지표의 가장 큰 병목은 인식이 아니라 인프라예요. 토큰당 매출총이익을 고객별로 실시간 추적하려면, 빌링 시스템·인프라 비용 리포트·재무팀 스프레드시트가 하나로 연결되어야 해요. 대부분의 AI 기업에서 이 세 시스템은 서로 대화하지 않아요. 3세대 지표의 도입은 결국 빌링 아키텍처의 문제이기도 해요.
마치며
정리하면 이래요. DAU/MAU가 광고 모델의 언어였고, ARR이 구독 모델의 언어였듯이 — AI 시대에는 비용 구조를 반영하는 새로운 언어가 필요해요. 지출 대비 생산성과 1년차 가치는 그 언어의 초안이에요.
AI 기업에 투자하거나, AI 제품을 도입하거나, AI 비즈니스를 운영하고 계시다면 — 매출이 아니라 매출총이익을, 성장률이 아니라 첫 해에 남긴 것을 물어보세요. 숫자의 크기가 아니라 숫자의 구조를 읽는 눈이 필요한 시점이에요.
참고자료 & 더 읽기
핵심 출처
- Ed Zitron, "Why Are We Still Doing This?", Where's Your Ed At, 2026년 3월 17일. : Anthropic의 ARR 발표와 법원 선서 진술서 간의 수치 괴리를 역산한 분석이에요.
- Ed Zitron, "How Much Money Do OpenAI And Anthropic Actually Make?", Where's Your Ed At, 2025년 10월 17일. : Anthropic의 ARR 발표와 법원 선서 진술서 간의 수치 괴리를 역산한 분석이에요.
- Tomasz Tunguz, "Gross Profit per Token", 2025년 12월 30일. : AI 기업 6곳의 토큰당 매출총이익과 기업가치 상관관계를 분석한 글이에요. 투자자가 실제로 무엇을 보고 있는지 데이터로 보여줘요.
배경 지식
- Shanaka Anslem Perera, "The Growth Miracle and the Six Fractures: Anthropic at $380 Billion", Substack, 2026년 2월 18일. : Anthropic의 성장 서사 이면에 있는 6가지 구조적 리스크를 다룬 심층 분석이에요.
- Kyle Poyar & CJ Gustafson, Mostly Growth 팟캐스트. : SaaS/AI 기업의 수익화 전략과 지표를 실무적으로 다루는 팟캐스트예요. 지출 대비 생산성, LTV 한계 등을 구체적으로 논의해요.
각주
- [1] DAU/MAU (Daily/Monthly Active Users): 하루 또는 한 달 동안 서비스를 실제로 사용한 사람 수예요. 2010년대 초반 소셜 미디어·모바일 앱 시대의 핵심 지표였어요. '활성'의 정의가 회사마다 달라서 비교가 어려웠다는 한계가 있어요.
- [2] SaaS (Software as a Service): 소프트웨어를 설치하지 않고 클라우드에서 구독 형태로 사용하는 방식이에요. Slack, Notion, Salesforce 같은 서비스가 대표적이에요.
- [3] 매출총이익률 (Gross Margin): 매출에서 직접 비용(원가)을 뺀 금액의 비율이에요. 100원을 벌었는데 서비스 제공에 20원이 들었다면 80%예요. SaaS에서는 80~90%가 일반적이었지만, AI 기업에서는 40~60%대로 떨어지는 경우가 많아요.
- [4] 추론 (Inference): 이미 학습된 AI 모델이 실제로 답변을 생성하는 과정이에요. 학습(Training)은 모델을 만드는 과정이고, 추론은 만들어진 모델을 사용하는 과정이에요. AI 서비스의 운영 비용 대부분이 여기서 발생해요.
- [5] 단위경제학 (Unit Economics): 고객 한 명, 또는 거래 한 건 단위로 수익성을 따지는 분석이에요. 전체 매출이 커져도 고객 한 명당 적자라면, 성장할수록 손해가 커지는 구조라는 걸 보여줘요.
- [6] LTV/CAC 비율: 고객 생애 가치(Lifetime Value)를 고객 획득 비용(Customer Acquisition Cost)으로 나눈 비율이에요. 보통 3배 이상이면 건강한 비즈니스로 봐요. AI 시대에는 '생애'를 예측하기 어려워 신뢰도가 떨어지고 있어요.

의견을 남겨주세요
주재원
AI 비즈니스에서의 성과지표 및 측정방법에 대한 좋은 글 인상깊게 잘 읽었습니다.
오즈의 지식토킹
감사합니다. 이렇게 댓글 남겨 주시니 더욱 보람찹니다.
의견을 남겨주세요
Won.Derful
대단히 좋은글이네요. 새로운 인사이트를 얻었습니다. 감사합니다.
오즈의 지식토킹
감사합니다. 더 궁금하신 부분이 있다면 편하게 남겨주시면 앞으로 다뤄보겠습니다.
의견을 남겨주세요
제이쓰
비공개 댓글 입니다. (메일러와 댓글을 남긴이만 볼 수 있어요)
오즈의 지식토킹
감사합니다. 재원님. 진심이 담긴 피드백 감사합니다. 공유와 홍보는 늘 환영 입니다. "하이라이트가 너무 많은 점"에 대해서는 사실 저도 고민 입니다. 사실 보통 제가 뉴스레터 초안을 쓰면 보통 1만자에서 8천자 정도 되는데 실제 뉴스레터 발송본으로 줄이는 과정에서 5천자 정도로 줄어 들곤 합니다. 그러다 보니 중요하다고 생각하는 부분에 나름 표시를 ... 변명 같죠? 네 ... 어떻게 히면 이걸 효과적으로 할 수 있을지 고민 더 해보겠습니다. 앞으로도 더 질 좋은 콘텐츠가 될 수 있도록 노력해보겠습니다. 감사합니다.
의견을 남겨주세요