공지
내가 글을 쓰는 이유 & 댓글을 달아주세요.

경제

애플이 구글에 1조 낸 진짜 이유

최고의 모델 대신 최대의 배포를 골랐어요

2026.06.16 |
from.
안광섭

들어가며

구독자님, 안녕하세요. 오즈의 지식토킹입니다."재난(disaster)." 2025년 12월, 웨드부시의 댄 아이브스 애널리스트가 애플의 AI 전략에 붙인 단어예요. 니드햄의 로라 마틴은 "경쟁사 대비 1~2년 뒤처져 있다"고 했고, Siri는 여전히 밈의 소재였어요. 그런데 2026년 6월 8일, WWDC 무대에서 애플이 자체 파운데이션 모델[1]​ 5개를 한꺼번에 공개했어요. 여기서 주목할 건 모델 성능이 아니에요. 애플이 이걸 만든 방식과 구조가 진짜 뉴스예요. 개인적으로 이번 WWDC 2026에서 가장 주목해야할 부분인데 뭔가 묻히는 거 같아서 한 번 언급해봐요.

결론부터 말씀드리면, 애플은 AI 군비경쟁에서 진 게 아니라 아예 다른 경기를 뛰고 있었어요.

첨부 이미지

🏗️ 6,000억 달러 군비경쟁에서 혼자 빠진 회사

지금 빅테크의 AI 인프라 투자 규모는 역사상 전례가 없는 수준이에요. 2026년 기준, 주요 기업의 연간 CapEx[2]​를 보면요.

  • 아마존: 약 2,000억 달러
  • 마이크로소프트: 약 1,900억 달러
  • 알파벳(구글): 약 1,800억 달러
  • 메타: 약 1,250억 달러

이 네 회사만 합쳐도 연간 6,000억 달러 이상이에요. 한화로 약 830조 원, 한국 정부 연간 예산의 약 1.2배에 해당해요. 이 돈이 어디로 가느냐면, GPU를 사고, 데이터센터를 짓고, 더 큰 모델을 훈련시키는 데 쓰여요. 마이크로소프트는 최근 실적 발표에서 연간 CapEx의 약 250억 달러가 "더 비싸진 메모리 부품 가격" 탓이라고 밝혔을 정도예요. 역사상 가장 큰 규모의 인프라 투자가 동시에 벌어지고 있는 거예요.

그런데 애플은요? 2025년 전체 CapEx가 127억 달러예요. 2026년 전망도 약 140억 달러. 빅테크 4사 합산의 1/40 수준이에요. 구글이 한 분기에 쓰는 돈보다 애플의 연간 투자가 적은 거예요.

월스트리트의 반응은 가혹했어요. 웨드부시의 댄 아이브스는 애플의 AI 전략을 "재난"이라 불렀고, "마이크로소프트, 구글, 메타, OpenAI에 비해 의미 있는 AI 성과를 내고 있다고 믿는 사람은 월스트리트에 아무도 없다"고까지 말했어요. Quartz의 보도에 따르면 애플 스스로도 내부적으로 OpenAI와 구글 대비 2년 뒤처져 있다고 평가했다는 분석도 나왔어요.

그런데 WWDC 2026 발표를 뜯어보면 풍경이 달라져요. 이 회사가 돈을 안 쓴 게 아니라, 쓰는 방식이 완전히 달랐다는 걸 알 수 있거든요. 같은 목적지를 전혀 다른 경로로 향한 거예요.

💰 1조 원짜리 수업, 그 구조를 뜯어보면

2026년 1월, 애플과 구글은 다년간의 AI 파트너십을 공식 발표했어요. 블룸버그의 마크 거먼에 따르면 규모는 연간 약 10억 달러(한화 약 1.4조 원). 애플은 구글의 Gemini(파라미터 1.2조 개 규모의 프론티어 모델)에 대한 접근권을 확보했어요. 여기서 많은 사람이 오해한 부분이 있어요. "애플이 결국 구글한테 AI를 맡긴 거 아니냐"는 반응이었거든요. 실제로는 전혀 다른 구조예요.

다들 썸네일로 어그로를 맛있게 끌었지만 내용을 보면 그래도 AI 언급 해주십니다들..ㅎㅎ
다들 썸네일로 어그로를 맛있게 끌었지만 내용을 보면 그래도 AI 언급 해주십니다들..ㅎㅎ

핵심은 증류(distillation)[3]​라는 기법이에요. 거대한 '교사 모델'(Gemini)의 출력을 참고해서 작고 효율적인 '학생 모델'(AFM)을 훈련시키는 거예요. WWDC 직후 애플의 크레이그 페더리기 수석부사장은 이렇게 말했어요.

"우리가 사용하는 구글 어시스턴트의 양은 제로입니다."

AI 담당 부사장 아마르 수브라마냐는 좀 더 정확하게 표현했어요. "모든 모델은 애플 실리콘용 커스텀 빌드이며, Gemini 프론티어 모델의 출력으로 정제(refined)한 것"이라고요.

정리하면 이런 구조예요.

  • 교사: 구글 Gemini (1.2조 파라미터)
  • 학생: 애플 AFM 3 시리즈 (5개 모델)
  • 수업 방식: 증류 ≈ Gemini의 출력을 훈련 신호로 활용
  • 시험(런타임): Gemini 없이 AFM 단독 추론

수업은 받되 시험은 혼자 치르는 거예요. 비유하자면, 연간 1조 원을 내고 최고의 과외 선생님한테 배우되, 졸업장은 자기 이름으로 받는 구조예요.

이건 2026년 AI 업계에서 하나의 패턴이 되고 있어요. 프론티어 모델을 직접 만드는 기업은 소수고, 나머지는 그 결과물을 증류해서 자기 제품에 맞게 재가공하는 거예요. 애플은 이 패턴을 가장 큰 규모로, 가장 명시적으로 채택한 사례예요. 아래는 최근 일론 머스크와 OpenAI 소송에서 언급된 증류에 대한 업계? 표준이에요.

한 가지 더 짚을 부분이 있어요. 구글 입장에서 이 딜의 의미예요. The Information의 보도에 따르면, 애플은 자사 데이터센터 내에서 Gemini 모델에 대한 전체 접근권을 확보했어요. 단순히 API를 호출하는 수준이 아니라, 모델 가중치 자체를 가져와서 증류 파이프라인을 돌리는 구조예요. 구글로서는 연간 10억 달러의 안정적 수익 + 자사 클라우드 인프라(Google Cloud + NVIDIA GPU) 위에서 AFM 3 Cloud Pro가 돌아가는 구조를 확보한 거예요. 양쪽 모두에게 합리적인 거래인 셈이에요.

Fortune은 이 구조를 두고 흥미로운 질문을 던졌어요. "AI 모델이 교체 가능한 상품이 될 것인가, 아니면 지속적인 경쟁 우위의 원천이 될 것인가?" 애플은 전자에 베팅하고 있는 거예요. 만약 모델이 상품이 된다면, 직접 만드느라 수천억 달러를 쓸 필요 없이 최고의 모델을 가져다 증류하면 되니까요.

📱 진짜 무기는 모델이 아니라 20억 대의 주머니

그렇다면 애플이 절약한 비용으로 집중한 건 뭘까요? 온디바이스 AI예요.

AFM 3 Core Advanced는 이번 발표의 기술적 하이라이트예요. 200억 개 파라미터 규모의 모델인데, 이걸 12GB RAM밖에 없는 아이폰에서 돌려요. 보통이라면 불가능한 일이에요. 일반적인 LLM은 전체 가중치를 DRAM에 올려야 하거든요. 이 모델이 가능하게 하는 것들 "감정이 실린 자연스러운 TTS(텍스트-투-스피치) 음성, 더 정확한 받아쓰기, 이미지를 이해하는 멀티모달 처리" 즉, 시리와 같은 기능은 전부 클라우드 없이 기기 위에서 돌아가요. 이게 기술적으로 엄청난 거 거든요.

2024년에 처음 Apple Intelligence를 발표했을 때, 온디바이스 모델은 30억 파라미터급이었어요. 2년 만에 규모가 거의 7배 커진 건데, 그걸 가능하게 한 게 바로 애플 연구진이 개발한 IFP(Instruction-Following Pruning)[4]​라는 기술이에요. 작동 방식은 이래요.

  • 200억 개 파라미터 전체를 NAND 플래시[5]​에 저장해요. 사진이나 앱이 저장되는 바로 그 메모리예요.
  • 사용자가 질문을 하면, 가벼운 예측 블록이 해당 요청에 필요한 '전문가'만 골라서 DRAM에 올려요.
  • 프롬프트당 실제로 활성화되는 파라미터는 10억~40억 개. 나머지 160억 개는 플래시에 그대로 잠들어 있어요.

일반적인 MoE[6]​ 모델은 토큰마다 전문가를 바꿔야 해서 메모리 대역폭이 병목이 되는데, IFP는 프롬프트 단위로 한 번만 라우팅 결정을 내려요. NAND-to-DRAM 대역폭이 느린 현실적 제약을 아키텍처 설계로 우회한 거예요.

이게 왜 중요하냐면요. ChatGPT든 Gemini든 Claude든, 클라우드 기반 AI는 결국 서버에 요청을 보내야 해요. 네트워크가 필요하고, 데이터가 외부로 나가요. 애플의 온디바이스 모델은 그 과정 자체가 없어요. 프라이버시가 구조적으로 보장되는 거예요. 더 무거운 작업은 Private Cloud Compute라는 애플 자체 서버로 넘기는데, 여기서도 사용자 데이터는 저장되지 않고 애플을 포함해 누구도 접근할 수 없는 구조예요.

그리고 여기서 숫자 하나를 짚어야 해요. 애플의 활성 기기 수는 20억 대 이상이에요. ChatGPT의 주간 활성 사용자가 4억 명(2025년 12월 기준), Gemini가 월 3.5억 명 수준이에요. 애플은 새로운 AI 앱을 하나 만드는 게 아니라, 이미 주머니에 들어가 있는 20억 대의 기기에 OS 업데이트로 AI를 배포하는 거예요.

모델 성능 경쟁에서 보면 AFM 3가 GPT-4o나 Gemini 2.5 Pro를 이기기는 어려워요. 하지만 자체 벤치마크에서 세대 간 도약은 분명해요. 애플의 인간 평가에서 AFM 3 Cloud는 전작 대비 텍스트 작업에서 64.7% 대 8.7%로 선호되었고, 이미지 이해에서는 37.8% 대 9.6%이었어요. 그리고 올해 처음으로 Foundation Models 프레임워크가 이미지 입력을 지원하면서, 서드파티 앱 개발자도 온디바이스 멀티모달 AI를 Swift 앱에 직접 통합할 수 있게 됐어요.

이게 의미하는 건, 애플이 하려는 게 벤치마크 1등이 아니라는 거예요. "충분히 좋은" 모델을 "가장 많은 사람에게" 전달하는 것, 그리고 그 모델 위에서 돌아가는 앱 생태계를 만드는 것이에요. ChatGPT나 Gemini가 하나의 앱이라면, 애플은 그 앱들이 올라가는 OS 자체에 AI를 심는 전략이에요.

오스왈드의 시선

솔직히 이야기하면, 저는 이번 발표를 보고 기술보다 유통 전략이 먼저 보였어요.

기술경영 전략을 수립하면서 반복적으로 확인한 패턴이 있어요. 기술 시장에서 "최고의 제품"이 이기는 경우는 생각보다 드물어요. 더 자주 이기는 건 "충분히 좋은 제품 + 압도적 유통" 조합이에요. VHS가 베타맥스를 이긴 것도, 안드로이드가 스마트폰 시장의 70%를 차지한 것도 그 구조예요.

지금 AI 시장에서 벌어지는 일도 비슷한 전환점에 있다고 봐요. 프론티어 모델 간의 성능 차이는 갈수록 좁아지고 있어요. GPT-4o, Gemini 2.5, Claude 4가 서로 벤치마크 1~2점 차이로 순위를 바꾸는 상황이에요.(상향평준화) 사용자 입장에서 체감 차이가 줄어들수록, 모델 성능보다 접근성과 통합도가 선택의 기준이 되거든요. 이건 모델이 상품화(commoditization) 단계에 진입하고 있다는 신호예요.

만약 이 방향이 맞다면 — 모델 자체보다 모델을 누가, 어디에, 어떻게 배포하느냐가 승부를 가른다면 — 애플의 140억 달러짜리 전략은 낭비가 아니라 선견지명이에요. 물론 이건 큰 '만약'이에요.

리스크도 분명해요. AFM 3는 출시 시점에 EU와 중국 본토의 아이폰·아이패드에서 사용할 수 없어요. 애플 활성 기기 20억 대 중 상당 비중이 이 두 시장에 있다는 점을 감안하면, "최대의 배포"라는 전략의 전제 조건에 구멍이 있는 셈이에요. 그리고 "충분히 좋은" 모델이 정말 충분히 좋은지는 올가을 실사용이 시작되어야 검증돼요.

마치며

정리하면 이래요. 애플은 AI 군비경쟁에서 진 게 아니라, 군비경쟁의 결과물을 재가공해 배포하는 게임을 선택한 거예요. 연간 1조 원으로 구글의 프론티어 모델을 증류하고, 절약한 비용은 온디바이스 아키텍처에 집중했어요.

이 전략이 통하려면 AI 모델이 계속 상품화되어야 해요. 하나의 모델이 압도적 격차를 벌리면 전략이 무너지지만, 지금까지의 흐름을 보면 그 가능성은 점점 낮아지고 있어요. AI 경쟁의 진짜 질문은 "누가 가장 똑똑한 모델을 만드느냐"가 아니라 "누가 20억 명의 주머니에 먼저 도착하느냐"일 수 있어요.

💬 구독자님은 AI에서 더 중요한 게 '모델 성능'이라고 보시나요, 아니면 '배포 규모'라고 보시나요? 댓글로 의견 남겨주세요.

참고자료 & 더 읽기

핵심 출처

배경 지식

 

각주

  1. [1] 파운데이션 모델(Foundation Model): 대규모 데이터로 사전 훈련되어 다양한 작업에 범용적으로 활용할 수 있는 AI 모델이에요. GPT, Gemini, Claude 등이 대표적이에요.
  2. [2] CapEx(Capital Expenditure, 자본적 지출): 기업이 설비, 인프라, 장비 등에 투자하는 비용이에요. AI 시대에는 GPU 구매와 데이터센터 건설 비용이 대부분을 차지해요.
  3. [3] 증류(Distillation): 거대한 '교사 모델'의 지식을 작은 '학생 모델'로 옮기는 훈련 기법이에요. 교사 모델의 출력을 학생 모델이 따라 배우면서, 작은 크기에서도 높은 성능을 내도록 하는 거예요.
  4. [4] IFP(Instruction-Following Pruning): 애플이 개발한 동적 가지치기 기법이에요. 사용자의 입력(프롬프트)을 분석해서 해당 작업에 필요한 파라미터만 골라 활성화해요. 기존 가지치기가 모델을 영구적으로 줄이는 것과 달리, 매 요청마다 다른 부분을 활성화할 수 있어요.
  5. [5] NAND 플래시: 스마트폰이나 SSD에서 데이터를 저장하는 비휘발성 메모리예요. DRAM보다 느리지만 용량이 훨씬 크고 전원이 꺼져도 데이터가 유지돼요. 애플은 이 저장 공간을 AI 모델의 '창고'로 활용했어요.
  6. [6] MoE(Mixture of Experts): 모델 내부에 여러 '전문가' 네트워크를 두고, 입력에 따라 일부만 활성화하는 아키텍처예요. 전체 파라미터 수에 비해 실제 연산량을 줄일 수 있어서, 대규모 모델의 효율적 운용에 사용돼요.
첨부 이미지

필자 안광섭은 세종대학교 경영학과 교수이자 OBF(Oswarld Boutique Consulting Firm) 리드 컨설턴트이다. 대학에서 경영데이터 관리, 비즈니스 애널리틱스 등 통계 및 데이터 분석을 가르치는 한편, 현장에서는 GTM 전략과 인공지능 전략 컨설팅을 이끌며 기술과 비즈니스의 접점을 설계하고 있다. AI 대화 시스템의 기억 아키텍처(HEMA) 연구로 학술 논문을 발표했으며, 매일 글로벌 AI 논문을 큐레이션하는 Daily Arxiv 프로젝트를 운영하고 있다. 고려대학교 기술경영전문대 석사과정와 KMBA을 졸업했다. 지은 책으로 《생각을 맡기는 사람들: 호모 브레인리스》가 있다.

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

이번 뉴스레터 어떠셨나요?

오즈의 지식토킹 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글 2개

의견을 남겨주세요

확인
  • Cleaner의 프로필 이미지

    Cleaner

    0
    1일 전

    배포 규모에도 먹을게 있고, 모델 성능에도 먹을게 있을거 같습니다. 근데 누가 더 쉽게 많이 먹을지는 적어주신거 같네요. ㅎㅎ

    ㄴ 답글
  • 평상심의 프로필 이미지

    평상심

    0
    1일 전

    애플 입장에서는 최고의 AI모델을 만드는 끝이 안보이는 경쟁에 참여하는 것보다는 이미 사용자들에게 배포된 제품위에서 실 생활에서 적용가능한(개인 차원에서 엄청 대단한 기능까지 사용하지는 않을테니) 모델을 만드는 전략이 더 좋겠네요. 내용을 이해하기 쉽게 설명해주셔서 감사합니다.

    ㄴ 답글

다른 뉴스레터

© 2026 오즈의 지식토킹

하고 싶은 말을 합니다. 주로 기술, 인문학, 경제에 대한 이야기를 합니다.

뉴스레터 문의newsletter@oswarld.com

메일리 로고

도움말 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 송파구 위례광장로 199, 5층 501-2-31호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스