들어가며
구독자님, 안녕하세요. 오즈의 지식토킹이에요. 지난주 AWS CEO 맷 가먼이 인터뷰에서 이런 말을 했어요. "신입사원을 AI로 대체하는 건 제가 들어본 것 중 역대급 바보짓이에요." 같은 인터뷰에서 그는 아마존이 올해 인턴과 신입을 11,000명 채용한다고 밝혔어요. 저는 이 말을 듣고 어이가 없었어요.
이 말이 나오기 불과 몇 달 전, 아마존은 기업 부문 인력 약 3만 명을 감축했거든요. 아마존 CEO 앤디 재시는 "AI가 우리의 전체 기업 인력을 줄이게 될 것"이라고 직원들에게 공식 서한을 보냈고요. 아마존은 동시에 로봇으로 50만 개 이상의 일자리를 대체할 계획도 추진 중이에요.
채용과 감축을 동시에 밀어붙이는 이 이상한 셈법. 하지만 저는 이 모순보다 아마존 안에서 벌어진 다른 사건에 더 주목했어요. 직원들이 AI 사용량 리더보드를 의도적으로 조작한 사건, 이른바 '토큰맥싱'[1]이에요.
🏷️ AI를 쓰는 척하는 사람들
올해 5월, 파이낸셜 타임스가 보도한 내용은 이랬어요. 아마존 내부에 KiroRank라는 리더보드가 있었어요. 직원들이 AI 코딩 도구 Kiro를 얼마나 많이 사용하는지 토큰[2] 소비량으로 순위를 매긴 대시보드예요. 아마존은 개발자의 80% 이상이 주 1회 이상 AI 도구를 사용하도록 목표를 세웠어요.
결과는 예상 가능했어요. 직원들이 MeshClaw라는 내부 에이전트[3] 도구로 코드 배포, 이메일 분류, 슬랙 메시지 처리 같은 작업을 자동화했는데, 문제는 이 작업들이 실제로 필요한 것이 아니었다는 거예요. 순위를 올리기 위해 쓸모없는 작업을 AI에 시킨 거죠. 직원들은 이걸 '토큰맥싱'이라고 불렀어요.
한 직원은 FT에 이렇게 말했어요. "이 도구를 써야 한다는 압박이 엄청나요. MeshClaw로 토큰 사용량을 최대화하는 사람들이 있어요." 아마존은 토큰 사용량이 인사 평가에 반영되지 않는다고 했지만, 직원들은 관리자가 비공식적으로 데이터를 확인하고 있다고 느꼈어요. 보안 우려도 제기됐어요. MeshClaw는 사용자 대신 코드를 배포하고 내부 시스템과 상호작용할 수 있는 권한을 갖고 있었거든요. 한 직원은 "기본 보안 설정이 무섭다"며 "혼자 돌아다니게 내버려둘 수 없다"고 했어요. 저도 실제로 뉴스레터에서 우버의 사례를 가지고 다뤘어요.
아마존만의 문제가 아니었어요. Meta에서는 'Claudeonomics'라는 리더보드가 직원 85,000명의 토큰 소비량을 집계했는데, 30일 동안 소비된 토큰이 60조 개에 달했어요. 공개 API 가격으로 환산하면 약 90억 달러 상당이에요. 상위 사용자에게는 'Token Legend', 'Session Immortal' 같은 칭호가 부여됐고요. 일부 직원은 AI 에이전트를 몇 시간씩 방치한 채 리서치 작업을 돌려 순위를 올렸어요. 외부 보도 후 48시간 만에 폐쇄됐어요.
Microsoft에서도 사장 줄리아 리우슨이 "AI 사용은 더 이상 선택이 아니라 모든 역할과 모든 레벨의 핵심"이라는 내부 메모를 보냈어요. 엔비디아의 젠슨 황은 한발 더 나갔어요. "연봉 50만 달러짜리 엔지니어가 25만 달러어치 토큰을 안 쓰고 있다면 심히 걱정할 것"이라고 공개적으로 말했고요.
흥미로운 점은 이 세 회사 모두 거의 동시에 리더보드를 폐쇄하거나 접근을 제한했다는 거예요. 빅테크 전반에서 AI 사용량 자체가 성과 지표가 됐다가, 그 지표가 실패했다는 걸 동시에 인정한 셈이에요.
📊 7,000억 달러 투자의 수요는 진짜일까
가먼은 인터뷰에서 이 사건을 이렇게 정리했어요. "측정하려는 것을 제대로 측정해야 해요. 우리는 잘못된 지표를 만들었고, 사람들이 목표가 아니라 지표를 우회하는 방법을 찾아냈어요."
맞는 말이에요. 하지만 '왜 이 지표를 만들었는가'라는 더 근본적인 질문이 남아요.
올해 아마존, 알파벳, 메타, 마이크로소프트 4개사의 합산 AI 자본지출(CAPEX)[4]은 약 7,000억 달러예요. 지난해 4,100억 달러에서 70% 넘게 증가한 수치고, 한화로 약 1,000조 원이에요. 이 투자의 핵심 전제는 "AI 수요가 공급을 계속 초과한다"는 것이에요.

그런데 이 수요의 일부가 토큰맥싱이었다면요? 직원 85,000명이 30일간 60조 토큰을 태운 것 중 얼마가 실제 업무였고, 얼마가 리더보드 게이밍이었을까요?
물론 기업 외부의 유료 고객 수요는 별도예요. 실제로 가먼이 인용한 CIO 조사에서는 100명 중 약 90%가 AI 투자에서 ROI를 확인하고 있다고 손을 들었어요. 보험 청구 처리 기간이 60~90일에서 대폭 단축된 사례, 에이전트가 업무 프로세스 성공률을 20%에서 90%대로 끌어올린 사례도 소개했고요.
그리고 아마존은 실제로 작동하는 AI 제품도 내놓고 있어요. 올해 4월 출시한 Amazon Connect Talent은 AI가 24시간 자율적으로 음성 면접을 수행하는 채용 도구예요. 가먼은 "우리 채용 담당자들은 후보자를 직접 찾고 관계를 형성하는 데 집중하길 원한다"며 "세부 정보를 입력하는 건 그들이 원하는 일이 아니다"라고 말했어요. 채용 면접을 AI가 대신하는 도구를 팔면서 "신입 대체는 바보짓"이라고 말하는 거예요. 이 두 문장은 모순처럼 보이지만, 가먼의 논리 안에서는 양립해요. AI가 반복 업무를 처리하면 사람은 더 높은 가치의 일을 한다는 거죠.
하지만 가먼 본인도 인정한 부분이 있어요. "성과를 보지 못한 PoC[5]를 중단하는 기업이 그만큼, 아니 더 많다"고요. 수요가 전부 허수라는 게 아니에요. 다만 수천억 달러 인프라 투자의 근거가 되는 사용량 데이터 안에, 성과 시그널링과 실제 가치 창출이 구분 없이 섞여 있다는 게 문제예요.
경제학에 굿하트의 법칙[6]이라는 개념이 있어요. "지표가 목표가 되면, 좋은 지표가 아니게 된다"는 원리예요. 토큰 소비량이 AI 생산성의 지표로 설정되는 순간, 토큰 소비량은 AI 생산성을 측정하는 기능을 잃어요. 토큰맥싱은 이 법칙의 교과서적 사례예요.
🔍 한국에서도 사다리가 빠지고 있다
가먼의 '엑셀 비유'를 잠깐 짚고 넘어갈게요. 그는 "엑셀이 수기 계산 일자리를 없앴지만, 사람들은 컴퓨터를 배웠고 노동시장은 확대됐다"고 말했어요. 틀린 말은 아니에요. 하지만 이번에는 구조가 좀 달라요.
스탠포드대 연구팀이 ADP 급여 데이터를 기반으로 분석한 결과, AI 고노출 직종에서 22~25세 초기 경력자 고용이 약 20% 감소한 반면, 30대 이상 경력자의 고용은 오히려 6~9% 증가했어요. AI가 모든 일자리를 없애는 게 아니라, 주니어가 경험을 쌓는 업무, 즉 요약하고 정리하고 초안을 작성하는 '사다리의 아랫단'을 자동화하고 있는 거예요.
한국 데이터도 비슷한 패턴을 보여요. 채용 플랫폼 캐치에 따르면 대기업 IT·통신 분야 신입 채용 공고가 전년 대비 67% 급감했어요. 전체 대기업 정규직 신입 채용도 43% 감소했고요. 올해 5월에는 한국의 상용근로자 수가 전년 대비 감소세로 전환됐어요. 26년 5개월 만에 처음이에요. 20대 상용직은 정보통신업에서만 5만 7천 명이 줄었는데, 같은 분야 30대는 2만 6천 명이 늘었어요. 신입에서 경력 중심으로 채용 구조가 재편되고 있다는 뜻이에요.
엑셀이 등장했을 때 계산원은 회계사로 '올라갈' 수 있었어요. 하지만 지금 AI가 자동화하는 건 올라가기 위해 밟아야 하는 단계 자체예요. 신입 개발자가 보일러플레이트 코드를 작성하며 시스템을 배우는 과정, 주니어 분석가가 데이터를 정리하며 비즈니스 맥락을 익히는 과정이요. Stanford Social Innovation Review의 표현을 빌리면, AI가 잡아먹은 건 "조직에서 일하는 법을 가르쳐주던 낮은 위험의 반복 업무"예요. 이 '학습 업무'가 사라지면 인재 파이프라인에 구조적 공백이 생기고, 3~5년 후 중간 관리자와 시니어를 채울 인력 풀이 말라버려요.
이 문제를 인식한 기업도 있어요. IBM은 AI 효율에만 의존하는 전략이 장기적으로 지속 가능하지 않다고 판단하고, 신입 채용을 3배로 늘리겠다고 발표했어요. IBM의 CHRO는 "3~5년 후 가장 성공할 기업은 지금 이 시기에 신입 채용을 두 배로 늘린 기업"이라고 말했고요. Cognizant도 2025년에만 신입 2만 명을 채용했어요.
가먼이 "앞으로 직원에게 가장 중요한 역량은 특정 기술이 아니라 배우려는 의지"라고 말한 건 이 맥락에서 읽어야 해요. 맞는 말이에요. 하지만 배울 기회 자체가 줄어드는 구조에서, '배우려는 의지'만으로는 사다리를 대체할 수 없어요.
오스왈드의 시선
기업에 GTM/기술 전략을 수립해오면서 저는 '측정이 행동을 만든다'는 사실을 수없이 확인했어요. 기업이 MAU를 KPI로 설정하면 직원들은 리텐션이 아니라 가입 수를 늘리는 데 집중하고, 코드 커밋 수를 측정하면 의미 없는 커밋이 늘어나요. 토큰 소비량을 측정하면 토큰맥싱이 나타나는 건 당연한 귀결이에요.
제가 더 주목하는 건 이 현상이 인프라 사업자의 구조적 유인과 맞물려 있다는 점이에요. AWS는 AI 인프라를 파는 회사예요. 고객이 AI를 많이 써야 서버가 팔려요. 그러니까 가먼이 "일자리는 바뀌지 사라지지 않는다"고 말하는 건 진심일 수 있지만, 동시에 비즈니스적으로 그렇게 말해야만 하는 포지션이기도 해요. 고객이 AI 도입을 두려워하면 인프라를 안 사니까요.
이건 가먼 개인의 문제가 아니에요. 인프라 사업자가 필연적으로 안게 되는 구조적 이중성이에요. "AI가 세상을 바꿀 것이다"라고 말해야 하지만, "세상이 너무 많이 바뀌면 안 된다"고도 말해야 하거든요.
진짜 AI 도입의 기준은 간단해요. "얼마나 쓰느냐"가 아니라 "무엇이 달라졌느냐"를 물어야 해요. 보험 청구 처리가 60일에서 3일로 줄었다면, 그건 토큰 몇 개를 썼느냐와 무관하게 가치가 있어요. 한국 기업들이 AI 전환을 추진할 때, 사용량 지표가 아니라 업무 결과 지표를 먼저 설계해야 하는 이유가 여기에 있어요.
마치며
정리하면 이래요.
아마존이 3만 명을 자르면서 1만 명을 뽑는 건 모순이 아니라 일종의 포트폴리오 교체예요. 하지만 그 교체가 실제 생산성에 기반한 것인지, 아니면 토큰맥싱처럼 '사용량'이라는 허수 위에 서 있는지는 아직 검증 중이에요. 빅테크 4개사가 올해 쏟는 7,000억 달러, 한국 기업들이 뒤따르는 AI 전환 투자, 그 수요의 진위를 판별하는 가장 간단한 질문은 이거예요. "AI를 얼마나 쓰고 있느냐"가 아니라 "AI 덕분에 뭐가 달라졌느냐"예요.
혹시 회사에서 AI 도구 도입 후 '사용률'이나 '활용도'를 측정하라는 지시를 받아본 적 있으세요? 그때 실제로 측정한 것은 도구의 가치였나요, 아니면 사용의 증거였나요? 경험을 댓글로 들려주시면 다음 호에 반영해볼게요.
💬 AI 도입 측정에 대한 경험이나 생각을 댓글로 남겨주세요 · 📨 이 글이 동료에게 도움이 될 것 같다면 공유해 주세요.
참고자료 & 더 읽기
핵심 출처
- Casey Newton, "The CEO of AWS on why Amazon is hiring 11,000 interns and junior employees", Platformer, 2026.6.24. : AWS 가먼의 '엑셀 비유'와 토큰 리더보드 관련 직접 발언이 담겨 있어요.
- Financial Times, "Amazon employees inflate AI usage on internal leaderboards", 2026.5.11. : 토큰맥싱 현상을 최초 보도한 기사예요. 아마존 직원 인터뷰가 포함돼 있어요.
- The Information, "Meta's Claudeonomics leaderboard", 2026.4.7. ··· Meta의 60조 토큰 소비 실태를 보도한 원본 기사예요.
배경 지식
- Erik Brynjolfsson, Danielle Li, Raymond Wang, "Canaries in the Coal Mine? Six Facts about the Recent Decline in Entry-Level Hiring", Stanford Digital Economy Lab, 2025. : 22~25세 초기 경력자 고용 감소를 실증 분석한 논문이에요. 본문의 '사다리 아랫단' 논의의 핵심 근거예요.
- Stanford HAI, "AI Index Report 2026", 2026.4. : 주니어 개발자 고용 20% 감소, AI 도입률 53% 등 주요 데이터를 종합한 연례 보고서예요.
- 캐치(채용 플랫폼), "2025년 대기업 신입 채용 공고 분석", 2025.12. : 한국 대기업 IT·통신 신입 채용 67% 급감 데이터의 출처예요.
각주
- [1] 토큰맥싱(Tokenmaxxing): AI 도구 사용량을 인위적으로 부풀려 내부 리더보드 순위를 올리는 행위예요. '토큰'(AI가 처리하는 데이터 단위)과 '맥싱'(극대화)의 합성어로, 2026년 빅테크에서 동시다발적으로 나타난 현상이에요.
- [2] 토큰(Token): AI 모델이 텍스트를 처리할 때 사용하는 데이터의 최소 단위예요. 한글 한 글자가 대략 2~3개 토큰에 해당하고, AI 서비스 요금은 대부분 토큰 소비량 기준으로 책정돼요.
- [3] 에이전트(Agent): 사람의 개입 없이 스스로 판단하고 작업을 수행하는 AI 소프트웨어예요. 단순 챗봇과 달리 코드 배포, 이메일 처리, 일정 관리 같은 실무 작업을 자율적으로 처리할 수 있어요.
- [4] CAPEX(Capital Expenditure, 자본지출): 기업이 데이터센터, 서버, 부동산 같은 장기 자산에 투자하는 비용이에요. AI 시대에는 GPU 서버와 전력 인프라 구축 비용이 CAPEX의 대부분을 차지하고 있어요.
- [5] PoC(Proof of Concept, 개념 증명): 새로운 기술이나 아이디어가 실제로 작동하는지 확인하기 위한 소규모 실험이에요. 성공하면 본격 도입으로 이어지고, 실패하면 중단돼요.
- [6] 굿하트의 법칙(Goodhart's Law): 영국 경제학자 찰스 굿하트가 제시한 원리로, "측정 지표가 목표로 전환되면 그 지표는 더 이상 좋은 측정 도구가 아니게 된다"는 뜻이에요. 토큰 소비량이 AI 생산성의 '지표'에서 '목표'로 바뀐 순간, 생산성 측정 기능을 잃은 것이 대표적 사례예요.
의견을 남겨주세요