공지
내가 글을 쓰는 이유 & 댓글을 달아주세요.

IT

MAU의 시대의 종말, MRR도 이제 못 믿는다?

AI 기업이 자랑하는 '연 매출'은 이번 달 매출에 12를 곱한 숫자일 뿐이에요.

2026.04.09 |
from.
Kwangseob

이 글은 모든 SaaS에 대한 일반론이 아니라, AI 추론 비용이 제품 원가와 마진에 직접 반영되는 AI 비즈니스를 중심으로 한 문제제기입니다.

들어가며

구독자님, 안녕하세요. 오스왈드 입니다. 오늘은 약간 GTM 전략 스러운 이야기를 해보려해요. 

올해 2월, Anthropic이 시리즈 G 펀딩을 발표하며 내세운 숫자가 있어요. 연환산 매출(ARR) 140억 달러. 3,800억 달러 기업가치. 역사상 가장 빠르게 성장하는 B2B 기업이라는 수식어가 붙었죠.

그런데 불과 한 달 뒤, 같은 회사의 CFO 크리슈나 라오가 미국 국방부 소송에서 법원에 제출한 선서 진술서에는 전혀 다른 숫자가 적혀 있었어요. "현재까지 누적 매출 50억 달러 초과." 창업 이래 벌어들인 돈 전부를 합쳐서요.

140억 달러와 50억 달러. 같은 회사, 한 달 간격, 같은 경영진이 내놓은 두 숫자예요. 이 간극의 정체가 바로 오늘 이야기할 주제예요. 테크 산업의 '공용 지표'가 다시 한번 세대교체를 앞두고 있어요.

📐 지표의 세대사: DAU에서 ARR로, 그리고 다시

테크 산업에는 시대마다 "이 숫자만 보면 된다"는 지표가 있었어요. 그리고 그 지표가 현실과 어긋나기 시작하면, 새로운 시대가 열렸어요.

1세대: DAU/MAU의 시대 (2007~2015년경). 스마트폰과 소셜 미디어가 폭발하던 시기, 산업 전체를 지배한 질문은 하나였어요. "사용자가 얼마나 자주 오는가?" 페이스북, 트위터, 인스타그램의 가치는 일간 활성 사용자(DAU)[1]​와 월간 활성 사용자(MAU)로 측정됐어요. 투자자도, 언론도, 경영진도 이 숫자를 봤어요. 이유는 단순했어요. 사용자가 모이면 광고 매출이건 뭐건 따라오던 시대였거든요.

하지만 문제가 생겼어요. DAU가 1억인 서비스와 DAU가 1억인 다른 서비스의 비즈니스 품질이 완전히 달랐거든요. 봇 계정이 섞여 있었고, '활성'의 정의가 회사마다 달랐고, 무엇보다 사용자 수가 매출과 직결되지 않는 서비스들이 늘어났어요. DAU/MAU는 관심의 크기를 잘 측정했지만, 비즈니스의 건강 상태를 보여주지는 못했어요.

2세대: ARR/MRR의 시대 (2015~2024년경). 클라우드와 SaaS[2]​가 주류가 되면서, 산업의 질문이 바뀌었어요. "얼마나 예측 가능하게 버는가?" 월간 반복 매출(MRR)에 12를 곱한 연환산 반복 매출(ARR)이 새로운 공용어가 됐어요.

ARR이 통한 건 SaaS의 세 가지 특성 덕분이었어요. 매출총이익률[3]​이 80~90%로 높았고, 고객을 한 명 더 서빙하는 한계비용이 거의 0이었고, 계약이 실제로 '연간'이고 실제로 '반복'됐어요. 이 세 조건에서는 이번 달 매출 × 12가 실제 연간 매출과 거의 같았어요. 이사회도 이해했고, CFO도 예측할 수 있었고, 투자자도 기업 간 비교에 쓸 수 있었어요. 15년간 아무도 심각하게 의심하지 않았던 건, 의심할 이유가 없었기 때문이에요.

그리고 지금, AI가 이 세 가지 전제를 동시에 깨뜨리고 있어요.

🔥 AI가 깨뜨린 ARR의 세 가지 전제

전제 1: 한계비용이 거의 0이다 → 깨졌어요. AI 제품에서는 모든 추론(inference)[4]​ 호출이 실제 비용이에요. 사용자가 복잡한 코드를 생성하거나 긴 문서를 분석할 때마다 GPU 비용이 청구서에 찍혀요. 기술 저널리스트 Ed Zitron의 보도에 따르면, Anthropic은 2025년 1월부터 9월까지 AWS 컴퓨팅에만 약 26.6억 달러를 지출했는데, 같은 기간 추정 매출은 약 25.5억 달러였어요. 매출의 100% 이상을 클라우드 비용으로 쓴 셈이에요.

전제 2: 고객 간 비용 차이가 미미하다 → 깨졌어요. 같은 월 2,000달러를 내는 두 고객을 상상해 보세요. A 고객은 가벼운 작업을 돌려서 매출총이익률이 78%예요. B 고객은 매일 대규모 모델 집약적 작업을 실행해서 매출총이익률이 31%에요. ARR 대시보드에는 둘 다 동일한 연 24,000달러로 찍혀요. B 고객이 단위경제학[5]​을 무너뜨리고 있다는 사실을, ARR은 보여줄 방법이 없어요. 상위 5% 고객이 전체 컴퓨팅 비용의 75%를 소비하면서 나머지 고객과 같은 정액 요금을 내는 건, AI 정액제 제품의 기본 상태예요.

전제 3: '반복'이 보장된다 → 흔들리고 있어요. SaaS에서는 전환 비용이 높았어요. 데이터 마이그레이션, 직원 재교육, 워크플로우 재설계까지. 하지만 AI 도구의 전환은 몇 시간이면 끝나요. API 키를 바꾸면 되거든요. '반복(Recurring)'이라는 전제 자체가 낙관적인 거예요. 다만, 이 부분은 모든 AI 제품에 동일하게 적용되지는 않아요. 워크플로우·데이터와 깊이 결합된 제품은 전환 비용이 여전히 높아요. 반면 API 중심이거나 추상화된 사용 계층에서는 전환 마찰이 SaaS보다 훨씬 낮아질 수 있어요.

세 가지 전제가 흔들리기 시작하면, ARR은 단독으로 해석하기 어려운 지표가 돼요. 특히 AI 추론 비용이 원가에 직접 반영되는 비즈니스에서는 더욱 그래요. DAU가 비즈니스 품질을 설명하지 못하게 된 순간과 같은 구조예요. 최근에 그로스마케팅, 퍼포먼스마케팅이라는 단어가 잘 안보이지 않으세요? 위의 3가지 전제가 꺠지면서 1세대~2세대를 구가했던 그들의 방식이 더 이상 먹히지 않기 시작했어요. 이제 새로운 문법이 필요해졌거든요.

📊 숫자의 이면: Anthropic과 OpenAI

이게 추상적인 이야기가 아니라는 걸, 지금 가장 주목받는 두 AI 기업이 보여주고 있어요.

Anthropic은 2024년 12월 ARR 10억 달러에서 출발해, 2025년 7월 40억, 12월 90억, 그리고 2026년 2월 140억 달러에 도달했다고 발표했어요. 14개월 만에 10배 성장. 역사상 어떤 B2B 소프트웨어 기업도 달성하지 못한 속도예요. 그런데 같은 해 3월 9일, CFO가 미국 법원에 제출한 선서 진술서에는 창업 이래 누적 매출이 "50억 달러를 초과한다"고 적혀 있었어요. Ed Zitron은 Anthropic이 발표한 ARR 수치들을 역산해서 누적 매출을 추정했는데, 최소 66.6억 달러가 나왔어요. 50억 달러와도, 140억 달러와도 맞지 않는 숫자예요. 게다가 추론과 학습에 투입된 비용은 100억 달러 이상이었어요.

OpenAI도 마찬가지예요. CFO 사라 프라이어는 2026년 1월에 "2025년 ARR이 200억 달러를 넘었다"고 발표했어요. 하지만 2025년 9월 공개된 반기 실적을 보면, 상반기 실제 매출은 약 43억 달러, 현금 소진은 25억 달러였어요. 연간 약 130억 달러 매출 페이스인데, 200억 달러라는 ARR과는 상당한 거리가 있었어요.

DAU/MAU 시대에 '활성 사용자'의 정의가 회사마다 달랐던 것처럼, ARR 시대에는 '연환산'이라는 단어가 실제 연간 실적과 다른 의미로 쓰이고 있어요. 그리고 그 간극이 수십억 달러 단위예요. 즉, 반복 매출이라는 개념이 사라진다기보다, 그것만으로는 비즈니스의 질을 설명하기 어려워졌다는 뜻이 되어 버린거죠.

첨부 이미지

🔄 3세대 지표의 후보들

그렇다면 ARR 이후, AI 시대의 공용어는 뭐가 될까요? 아직 합의된 답은 없지만, 업계에서 유력하게 부상하는 두 가지가 있어요.

첫 번째, 지출 대비 생산성(Productivity per Dollar Spent). SaaS 시대에는 'ARR ÷ 직원 수'가 기업의 효율성을 보여주는 대표 지표였어요. 직원이 주된 비용이었으니까요. 하지만 AI 에이전트가 주 40시간에 해당하는 워크플로우를 처리하고 있다면, 그건 소프트웨어 구독이 아니라 노동력 비용이에요.

GTM 전략가 Kyle Poyar의 제안은 명쾌해요. 분모에 인건비뿐 아니라 AI 에이전트 비용까지 포함하라는 거예요. 'ARR ÷ (인건비 + AI 지출)'이 되는 셈이죠. 이 숫자를 처음 계산해본 기업들 중에는, 기존 'ARR ÷ 직원 수'로는 멀쩡해 보이던 효율성 지표가 실제로는 2년째 하락하고 있었다는 사실을 발견한 경우도 있어요.

벤처 캐피털리스트 Tomasz Tunguz는 한 발 더 나아가서, AI 기업 6곳의 토큰당 매출총이익을 분석했어요. 결과가 인상적이에요. 토큰당 매출총이익과 기업가치의 상관관계는 0.70인 반면, 단순 토큰 처리량과 기업가치의 상관관계는 0.47에 불과했어요. 투자자들은 이미 '얼마나 많이'가 아니라 '얼마나 남기면서'를 보고 있다는 뜻이에요.

두 번째, 1년차 가치(First Year Value). SaaS에서는 LTV/CAC[6]​ 비율이 투자 효율의 핵심 지표였어요. 고객 생애 가치를 고객 획득 비용으로 나눈 비율이죠. 그런데 CFO 출신 CJ Gustafson은 이걸 AI 스타트업에 적용하는 건 "숫자 놀이"에 가깝다고 말해요.

이유는 간단해요. AI 고객의 '생애'가 얼마인지 아무도 몰라요. 전환 마찰이 역대 어떤 소프트웨어보다 낮고, 나를 대체할 도구가 몇 시간이면 배포돼요. LTV는 낮은 이탈률, 예측 가능한 확장, 긴 유지 기간을 전제하는데, AI 제품은 이 세 가지 중 어떤 것도 아직 증명하지 못했어요.

1년차 가치는 더 날카로운 질문을 던져요. "이 고객이 첫 12개월 안에 갱신을 정당화할 만큼 충분한 가치를 얻었는가?" 2년차나 3년차에 가서야 'yes'가 되는 구조라면, LTV가 보기 좋아도 실은 리텐션 문제를 감추고 있는 거예요.

오스왈드의 시선

지표의 세대교체를 되돌아보면, 패턴이 보여요. 지표는 비즈니스 모델의 그림자예요. 광고 모델이 지배하면 DAU/MAU가 왕이 되고, 구독 모델이 지배하면 ARR이 왕이 돼요. 그리고 비즈니스 모델이 바뀌는데 지표가 바뀌지 않으면, 그 간극에서 수십억 달러 규모의 착시가 만들어져요.

GTM 전략을 수립해온 경험에서 보면, 지표는 단순한 측정 도구가 아니에요. 조직의 행동을 결정하는 인센티브 구조예요. ARR을 KPI로 쓰는 회사의 영업팀은 매출 크기를 최적화하지, 고객별 수익성을 최적화하지 않아요. Anthropic이 140억 달러 ARR을 발표하고 3800억 달러 기업가치를 인정받은 사례가 이 구조의 작동 방식을 잘 보여줘요.

하지만 저는 이 구조가 오래 갈 수 없다고 생각해요. 법원 선서 진술서에서 누적 매출이 드러나고, 독립 저널리스트가 AWS 지출을 추적해서 보도하는 시대예요. ARR이라는 화장이 벗겨지는 속도가 빨라지고 있어요. 창업자들도, 소비자들도, 투자자들도 점점 똑똑해지고 있어요. 더 이상 지표로 장난치는 시대는 끝나가고 있다는 뜻이기도 해요.

+ AI가 들어간다고 해서 모든 비즈니스에서 ARR이 무의미해지는 것은 아니에요. 다만 AI 추론 비용이 원가에 직접 반영되고, 고객별 사용 강도에 따라 마진 편차가 커지며, 일부 영역에서는 전환 마찰까지 낮아지는 모델이라면 이야기가 달라져요. 이 경우 ARR은 여전히 중요한 성장 지표이지만, 단독으로는 비즈니스의 질을 설명하기 어려워집니다. 제가 말하고 싶은 건 ARR의 폐기가 아니라, AI 시대에는 ARR 위에 비용 구조와 유지 구조를 함께 읽는 새로운 해석 틀이 필요하다는 점이에요.

다만 솔직하게 말씀드리면, 새로운 지표의 가장 큰 병목은 인식이 아니라 인프라예요. 토큰당 매출총이익을 고객별로 실시간 추적하려면, 빌링 시스템·인프라 비용 리포트·재무팀 스프레드시트가 하나로 연결되어야 해요. 대부분의 AI 기업에서 이 세 시스템은 서로 대화하지 않아요. 3세대 지표의 도입은 결국 빌링 아키텍처의 문제이기도 해요.

마치며

정리하면 이래요. DAU/MAU가 광고 모델의 언어였고, ARR이 구독 모델의 언어였듯이 — AI 시대에는 비용 구조를 반영하는 새로운 언어가 필요해요. 지출 대비 생산성과 1년차 가치는 그 언어의 초안이에요.

AI 기업에 투자하거나, AI 제품을 도입하거나, AI 비즈니스를 운영하고 계시다면 — 매출이 아니라 매출총이익을, 성장률이 아니라 첫 해에 남긴 것을 물어보세요. 숫자의 크기가 아니라 숫자의 구조를 읽는 눈이 필요한 시점이에요.

참고자료 & 더 읽기

핵심 출처

  • Ed Zitron, "Why Are We Still Doing This?", Where's Your Ed At, 2026년 3월 17일. : Anthropic의 ARR 발표와 법원 선서 진술서 간의 수치 괴리를 역산한 분석이에요.
  • Ed Zitron, "How Much Money Do OpenAI And Anthropic Actually Make?", Where's Your Ed At, 2025년 10월 17일. : Anthropic의 ARR 발표와 법원 선서 진술서 간의 수치 괴리를 역산한 분석이에요.
  • Tomasz Tunguz, "Gross Profit per Token", 2025년 12월 30일. : AI 기업 6곳의 토큰당 매출총이익과 기업가치 상관관계를 분석한 글이에요. 투자자가 실제로 무엇을 보고 있는지 데이터로 보여줘요.

배경 지식

 


각주

  1. [1] DAU/MAU (Daily/Monthly Active Users): 하루 또는 한 달 동안 서비스를 실제로 사용한 사람 수예요. 2010년대 초반 소셜 미디어·모바일 앱 시대의 핵심 지표였어요. '활성'의 정의가 회사마다 달라서 비교가 어려웠다는 한계가 있어요.
  2. [2] SaaS (Software as a Service): 소프트웨어를 설치하지 않고 클라우드에서 구독 형태로 사용하는 방식이에요. Slack, Notion, Salesforce 같은 서비스가 대표적이에요.
  3. [3] 매출총이익률 (Gross Margin): 매출에서 직접 비용(원가)을 뺀 금액의 비율이에요. 100원을 벌었는데 서비스 제공에 20원이 들었다면 80%예요. SaaS에서는 80~90%가 일반적이었지만, AI 기업에서는 40~60%대로 떨어지는 경우가 많아요.
  4. [4] 추론 (Inference): 이미 학습된 AI 모델이 실제로 답변을 생성하는 과정이에요. 학습(Training)은 모델을 만드는 과정이고, 추론은 만들어진 모델을 사용하는 과정이에요. AI 서비스의 운영 비용 대부분이 여기서 발생해요.
  5. [5] 단위경제학 (Unit Economics): 고객 한 명, 또는 거래 한 건 단위로 수익성을 따지는 분석이에요. 전체 매출이 커져도 고객 한 명당 적자라면, 성장할수록 손해가 커지는 구조라는 걸 보여줘요.
  6. [6] LTV/CAC 비율: 고객 생애 가치(Lifetime Value)를 고객 획득 비용(Customer Acquisition Cost)으로 나눈 비율이에요. 보통 3배 이상이면 건강한 비즈니스로 봐요. AI 시대에는 '생애'를 예측하기 어려워 신뢰도가 떨어지고 있어요.
첨부 이미지

필자 안광섭은 세종대학교 경영학과 교수이자 OBF(Oswarld Boutique Consulting Firm) 리드 컨설턴트이다. 대학에서 경영데이터 관리, 비즈니스 애널리틱스 등 데이터 분석을 가르치는 한편, 현장에서는 GTM 전략과 인공지능 전략 컨설팅을 이끌며 기술과 비즈니스의 접점을 설계하고 있다. AI 대화 시스템의 기억 아키텍처(HEMA) 연구로 학술 논문을 발표했으며, 매일 글로벌 AI 논문을 큐레이션하는 Daily Arxiv 프로젝트를 운영하고 있다. 고려대학교 KBMA와 기술경영전문대 석사과정을 졸업했다. 지은 책으로 《생각을 맡기는 사람들: 호모 브레인리스》가 있다.

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

이번 뉴스레터 어떠셨나요?

오즈의 지식토킹 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글 19개

의견을 남겨주세요

확인
  • 주재원의 프로필 이미지

    주재원

    0
    21일 전

    AI 비즈니스에서의 성과지표 및 측정방법에 대한 좋은 글 인상깊게 잘 읽었습니다.

    ㄴ 답글 (1)
  • Won.Derful의 프로필 이미지

    Won.Derful

    0
    21일 전

    대단히 좋은글이네요. 새로운 인사이트를 얻었습니다. 감사합니다.

    ㄴ 답글 (1)
  • 제이쓰의 프로필 이미지

    제이쓰

    1
    21일 전

    비공개 댓글 입니다. (메일러와 댓글을 남긴이만 볼 수 있어요)

    ㄴ 답글 (1)
  • sejin의 프로필 이미지

    sejin

    1
    20일 전

    AI로 인해 제품생산성이 올라간 것이 반복 매출이나 활성 사용자 수 지표의 권위를 크게 흔들 수 있을만큼 stickiness에 큰 영향을 끼쳤다는 것에 동의하기 어렵습니다. GPT나 클로드 같은 LLM 모델처럼 완벽히 추상화되어 호환 가능한 인터페이스 하에서 돌아가는 경우에만 해당되는 이야기 아닌지요?

    ㄴ 답글 (10)
  • DAEHYEONG CHO의 프로필 이미지

    DAEHYEONG CHO

    0
    15일 전

    "DAU가 1억인 서비스와 DAU가 1억인 다른 서비스의 비즈니스 품질이 완전히 달랐거든요." 문장을 조금 이해하기 어려운데요, DAU는 똑같이 1억인 서로 다른 두 서비스간의 품질이 달랐다는 뜻일까요?

    ㄴ 답글 (1)

다른 뉴스레터

© 2026 오즈의 지식토킹

하고 싶은 말을 합니다. 주로 기술, 인문학, 경제에 대한 이야기를 합니다.

뉴스레터 문의newsletter@oswarld.com

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 송파구 위례광장로 199, 5층 501-8호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스