들어가며
구독자님, 올해 5월 AI 업계에서 흥미로운 갈림길이 하나 생겼어요. 사카나 AI와 함께 'AI가 스스로를 개선하는 시스템'을 공동 연구했던 과학자 Jeff Clune이 약 9천억 원의 투자를 유치하고 별도의 회사를 세운 거예요. 회사 이름은 Recursive Superintelligence, 말 그대로 '재귀적 초지능'이에요. NVIDIA와 Google Ventures가 투자자 명단에 이름을 올렸고, 기업가치는 약 6.5조 원이에요.
같은 시기, 도쿄에 남은 사카나 AI 138명은 RSI Lab[1]이라는 전담 연구 조직을 공식 출범시켰어요. 같은 연구에서 출발해 같은 목표를 향하면서, 방법론은 완전히 갈라진 거예요. 결론부터 말씀드리면, 이 갈림길의 본질은 기술 경쟁이 아니라 "AI를 발전시키려면 더 큰 컴퓨터가 필요한가, 더 똑똑한 방법이 필요한가"라는 근본 질문에 대한 두 가지 답이에요.
제가 이렇게 늦은 시간에 키보드 앞에서 메일을 쓰게 된 이유는 이 뉴스와 일본의 대표적 인공지능 회사인 SakanaAI의 새로운 오케스트레이션 플랫폼 출시 때문이에요.
같은 코드, 다른 배팅
'AI가 스스로를 개선한다'는 개념은 오래됐어요. 1966년 영국 수학자 I. J. Good은 "초지능 기계가 더 나은 기계를 설계할 수 있다면 지능 폭발이 일어날 것"이라고 예측했어요. 60년이 지난 2026년, 이 개념은 RSI(Recursive Self-Improvement)라는 이름으로 실제 연구 분야가 됐어요. 올해 4월 ICLR 2026에서는 RSI 전용 워크숍이 개설될 만큼, 학계에서도 독립적 연구 영역으로 자리잡고 있어요.
그런데 RSI를 어떻게 실현할 것인가를 두고, 지금 두 진영이 극명하게 갈라지고 있어요.
Recursive Superintelligence는 올해 5월 런던에서 스텔스 모드를 벗으면서 약 9천억 원($650M)을 공개했어요. 기업가치 약 6.5조 원($4.65B). 공동 창업자 8명이 OpenAI, Google DeepMind, Meta AI, Salesforce 출신 스타 연구자이고, AI 교과서의 대명사인 피터 노빅(Peter Norvig)이 어드바이저예요. 아직 팀이 30명 미만인데, 공개된 기술적 성과는 없어요. 이 회사의 배팅은 명확해요. 대규모 컴퓨트로 자기개선 루프의 속도를 최대한 높이겠다는 거예요.
사카나 AI는 정반대 길을 걷고 있어요. 2023년 도쿄에서 설립된 이 회사의 CTO는 Llion Jones, 현대 AI의 기반이 된 논문 "Attention Is All You Need"의 공저자예요. 트랜스포머 아키텍처를 공동 발명한 사람이, 2025년 TED AI 무대에서 "트랜스포머에 질렸다"고 말하고 도쿄에서 그 너머를 연구하고 있는 셈이에요. 누적 투자금 약 5,300억 원($379M), 기업가치 약 3.7조 원($2.65B), 직원 138명. 이들의 핵심 철학은 한 문장으로 요약돼요.
"컴퓨트가 아니라 아이디어로 발전한다."
이건 단순한 전술 차이가 아니에요. "더 크면 더 좋은가, 더 똑똑하면 더 좋은가"라는 AI 개발의 근본 전제에 대한 입장 차이예요. 그리고 이 갈림길의 시작점이 된 연구가 바로 Darwin Gödel Machine[2]이에요. 사카나와 UBC(브리티시컬럼비아대학)가 2025년에 공동 개발한 이 시스템은, AI 에이전트가 자기 코드를 스스로 수정해서 소프트웨어 엔지니어링 성능을 두 배 이상 끌어올린 결과를 냈어요. 이 프로젝트의 UBC 측 핵심 연구자가 바로 Jeff Clune이었고, 그는 같은 아이디어를 다른 규모로 실행하기 위해 Recursive를 세운 거예요.
150개 샘플의 카이젠
사카나 AI의 RSI Lab 발표문에는 인상적인 문장이 하나 있어요. 일본의 제조업 지배력이 풍부한 자원이 아니라 공장 시스템 자체를 근본적으로 재설계한 데서 나왔다는 거예요. 도요타의 카이젠[3] 철학을 AI 개발에 대입하겠다는 선언이에요.
그냥 수사에 불과한 걸까요? 사카나가 지난 2년간 내놓은 연구 결과를 보면, 실체가 있어요.
ShinkaEvolve(2025)는 단 150개 샘플로 복잡한 최적화 문제를 풀었어요. 같은 문제에 보통 수만~수십만 번의 시행이 필요한 걸 감안하면, 이건 놀라운 샘플 효율성[4]이에요. 이 기술로 MoE 모델[5]의 부하 분산 손실 함수를 새로 만들어 내기도 했고요.
ALE-Agent(2025)는 AtCoder 알고리즘 경진대회에서 804명의 인간 전문가를 제치고 1위를 차지했어요. 연산량을 무한히 늘린 게 아니라, 시행착오에서 구조화된 교훈을 뽑아내는 자기학습 메커니즘으로 달성한 결과예요.
그리고 AI Scientist가 있어요. 연구 아이디어 생성부터 실험 설계·실행, 논문 집필, 심지어 피어리뷰까지 과학 연구의 전 과정을 자동화한 이 시스템의 논문이 올해 3월 Nature에 게재됐어요. AI가 작성한 논문이 세계 최고 학술지의 피어리뷰를 통과한 최초의 사례예요. 특히 이 논문에는 흥미로운 발견이 하나 있어요. 기초 모델의 성능이 좋아지면, AI Scientist가 생성하는 논문의 품질도 비례해서 올라간다는 '과학의 스케일링 법칙'이에요. 자기개선 루프가 실현 가능할 수 있다는 간접 근거인 셈이에요.
이 연구들을 관통하는 공통점이 있어요. 자원을 더 쓰는 게 아니라, 같은 자원으로 더 많이 배우는 구조를 설계한다는 거예요. 도요타가 대량 생산 방식의 GM을 이긴 건 공장을 더 크게 지어서가 아니라, '필요한 것을 필요한 만큼'이라는 원칙으로 시스템을 재설계했기 때문이에요. 사카나가 추구하는 건 이 패턴의 AI 버전이에요.
사카나의 장기 로드맵은 네 단계로 구성돼 있어요. 첫째, 채팅이 아니라 에이전트 용도에 최적화된 기초 모델(Agent-Native Model) 개발. 둘째, 이 모델을 활용한 자동화된 과학 연구(AI Scientist). 셋째, AI 에이전트가 자기 기초 모델의 코드를 직접 수정·검증하는 자율 업그레이드 사이클(RSI). 넷째, 이 자기개선 기술의 범용화(Democratized AI).
세 번째에서 네 번째로의 전환이 이 로드맵의 진짜 핵심이에요. 그리고 이 지점에서, 사카나가 왜 하필 도쿄에 있는지가 중요해져요.
도쿄에서만 가능한 배팅
사카나가 RSI Lab을 도쿄에 세운 건 감상적 이유가 아니에요. 철저한 전략적 계산이에요.
일본의 AI 인프라 시장은 구조적 전환 중이에요. IDC에 따르면 2026년 일본 AI 인프라 지출은 55억 달러(약 7.7조 원)를 넘어설 전망이에요. 3년 전 대비 7배 성장이에요. 경제안보추진법 아래 정부 주도로 GPU 서버 배치가 가속화됐고, AIST(산업기술종합연구소)의 ABCI 클라우드가 국가 AI 컴퓨트 인프라로 가동 중이에요. 반도체 분야에서는 차세대 2나노 칩을 위한 라피더스(Rapidus)에 1,000억 엔 규모의 국가 투자가 진행되고 있어요.

하지만 이 수치를 미국 빅테크와 비교하면 여전히 규모 차이가 커요. 2026년 빅테크의 AI 인프라 투자 총액이 6,550억 달러로 전망되는 상황에서, 일본의 55억 달러는 1%가 안 돼요.
사카나 AI는 이 격차를 열세가 아니라 디자인 제약으로 재정의해요. 인간의 인지 능력도 무한한 자원이 아니라 엄격한 제약 속에서 진화가 만들어낸 것이라는 게 이들의 논리예요. 컴퓨트 제약이 오히려 샘플 효율적 자기개선 기술을 강제하고, 그 기술이야말로 하이퍼스케일러 바깥에서 범용적으로 작동할 수 있는 유일한 경로라는 거예요.
이게 소버린AI(Sovereign AI)[6] 담론과 정확히 맞물려요. 2026년 현재, 프랑스(Mistral), UAE(Falcon), 사우디(HUMAIN), 싱가포르(SEA-LION), 인도(BharatGen), 일본(LLM-jp) 등 주요 국가들이 자국 AI 역량을 구축하고 있어요. 하지만 대부분은 기초 모델 학습 단계에서 미국 하이퍼스케일러 의존을 벗어나지 못하고 있어요. 독일의 Aleph Alpha가 자체 모델 개발을 포기하고 컨설팅으로 전환한 사례가 보여주듯, Sovereign AI의 현실은 슬로건만큼 간단하지 않아요.
일본은 여기서 조금 다른 길을 걷고 있어요. 단일 국가 챔피언이 아니라, AIST·Swallow·Stockmark 같은 컨소시엄 + 사카나 같은 민간 프론티어 랩의 협력 구조예요. 사카나의 RSI가 약속하는 건 이 협력 구조 위에 자기개선 엔진을 얹는 거예요. 자기개선 기술이 작은 컴퓨트 환경에서도 작동하면, 기초 모델 개발 자체가 탈중앙화될 수 있거든요.
물론 이건 아직 비전이에요. 완전한 자기개선 루프가 실제로 작동한다는 증명은 아직 없어요. 하지만 시도의 방향 자체는 주목할 만해요.
그런데, 이 원고를 마무리하는 시점에, 사카나가 증거를 하나 내놨어요.
그리고 오늘, 138명이 내놓은 답
어제 그러니까 6월 22일, 사카나 AI가 Sakana Fugu를 정식 출시했어요. 4월 베타 이후 약 두 달 만이에요.
Fugu의 구조는 사카나의 카이젠 철학이 제품으로 구현된 것이나 다름없어요. 핵심은 7B(70억) 파라미터짜리 작은 언어 모델이 오케스트레이터[7] 역할을 한다는 거예요. 이 모델은 스스로 문제를 풀지 않아요. 대신 GPT-5, Claude, Gemini 같은 프론티어 모델들에게 '누가 어떤 부분을 맡을지'를 지시하고, 결과를 검증하고, 필요하면 자기 자신을 재귀적으로 호출해서 교정 워크플로우를 돌려요.
결과가 흥미로워요. Fugu Ultra는 SWE-Pro(실전 소프트웨어 엔지니어링), GPQA-D(대학원 수준 과학 문답), LiveCodeBench(코딩) 등 주요 벤치마크에서 Opus 4.8, Gemini 3.1 Pro, GPT-5.5를 상회했어요. 10개 벤치마크 중 8개에서 1위 또는 동률이에요. 더 주목할 건, 수출 규제로 접근이 제한된 Fable 5나 Mythos Preview(이 모델들은 Fugu의 에이전트 풀에 포함되지도 않았는데)와 동급 성능을 달성했다는 점이에요.
AutoResearch 실험에서는 단일 H100 GPU 한 장으로 14시간 동안 123개 학습 실험을 자율 수행하고, 모든 프론티어 모델 기준선을 상회하는 결과를 냈어요. 거대 클러스터 없이 달성한 성과예요.
사카나라는 이름은 일본어로 '물고기'예요. 물고기 한 마리는 별것 아니지만, 떼를 지으면 포식자보다 똑똑해져요. Fugu는 이 비유를 제품으로 만든 거예요. 거대한 단일 모델을 만드는 대신, 여러 모델의 집단지성을 학습된 지휘자가 조율하는 구조. ICLR 2026에 채택된 두 편의 논문(TRINITY, Conductor)이 이 아키텍처의 학술적 기반이에요.
참고로, Fugu는 일본어로 복어인데요. 복어는 테트로도톡신이라는 치명적인 맹독을 가지고 있지만, 숙련된 전문 요리사가 아주 정확하게 손질하고 준비해야만 안전하고 훌륭한 고급 진미로 거듭나듯이, 미국의 AI 수출 규제나 특정 벤더의 리스크가 발생했을 때(Fable5 같이), 후구는 내부적으로 문제가 되는 모델을 제외하고 안전한 대체 모델들을 동적으로 우회 조합(Swappable Pool)하여 인프라를 안정적으로 유지합니다. 즉, 외부 규제라는 독을 피해 AI 주권을 지키겠다는 전략적 의미도 함께 담겨있다고 하니... 브랜딩까지 완벽하죠?
Sovereign AI 관점에서도 시사점이 커요. 특정 프론티어 모델이 수출 규제에 걸리더라도, Fugu는 접근 가능한 모델들만으로 동급 성능을 재구성할 수 있어요. 벤더 종속 없는 프론티어 성능... 이건 지난 섹션에서 다룬 비전이 제품 레벨에서 작동하기 시작했다는 신호예요.
오스왈드의 시선
솔직히 말씀드리면, 저는 사카나 AI의 "제약이 곧 강점"이라는 내러티브에 반은 동의하고 반은 유보해왔어요. Fugu 이후 그 비율이 조금 움직였어요.
GTM 전략과 기술 경영전략을 수립하면서 봐왔던 패턴이 있어요. 자원이 부족한 쪽이 "효율"을 내세우는 건, 전략이자 동시에 자기 합리화일 수 있거든요. 카이젠이 성공한 건 구호가 아니라, 적게 쓰면서도 더 많이 학습하는 시스템을 실제로 작동시켰기 때문이에요. Fugu는 그 '작동'의 첫 번째 제품 증거예요. 7B 모델이 프론티어 모델들을 지휘해서 프론티어 수준을 달성한 건, 단순한 라우팅이 아니라 학습된 조율이 경쟁력이 될 수 있다는 걸 보여줬어요.
다만 구분이 필요해요. Fugu는 '기존 모델을 더 잘 조합하는 기술'이에요. RSI의 전체 사이클 — AI가 자기 기초 모델의 코드를 개선하고, 그 모델이 다시 AI Scientist를 개선하는 자기강화 루프 — 과는 다른 차원이에요. 오케스트레이션의 성공이 곧 자기개선의 성공은 아니에요. Recursive 쪽은 여전히 9천억 원을 모으고도 공개 성과가 없고요.
제가 주목하는 건 양쪽 승패보다 이 경쟁의 존재 자체예요. AI 개발 방법론이 단일 경로에서 복수 경로로 갈라지기 시작했다는 신호거든요. 경로가 다양해지면 AI를 '사용하는' 쪽에서 자기 조건에 맞는 선택지가 생겨요.
한 가지 더 짚을게요. 사카나가 RSI Lab 발표문에서 자기개선 시스템의 실패 모드(분포 이탈, 벤치마크 해킹, 제약 우회)를 공개적으로 기술하고 핵심 엔지니어링 과제로 규정한 건, 이 분야에서 필요한 태도예요.
마치며
정리하면 이래요.
같은 연구에서 출발한 두 조직이 'AI가 AI를 개선한다'는 같은 목표를 두고 정반대 전략을 택했어요. 한쪽은 자본과 규모, 다른 쪽은 효율과 제약. 그리고 도쿄 쪽이 먼저 제품을 내놨어요. 7B 모델이 프론티어급 성능을 지휘하는 Fugu는, "더 크게 만들지 않고도 이길 수 있다"는 가설의 첫 번째 작동 증거예요.
이 경쟁의 결과는 두 회사의 승패를 넘어서요. AI 개발이 소수 빅테크의 전유물로 남을지, 더 다양한 주체에게 열릴지를 결정할 수 있어요. 다음에 AI 뉴스를 보실 때, 벤치마크 순위 대신 "이 모델을 만드는 데 얼마나 들었는가"를 따져보세요.
개인적으로 한중일은 이제 AI에 대해 완전 다른 전략을 선택했어요. 중국은 미국과 같은 스케일링으로, 일본은 오케스트레이션으로, 한국은... 지난 뉴스레터로 갈음할게요. 구독자님은 AI 개발이 결국 '자본의 게임'일까요, '방법론의 게임'일까요? 댓글로 의견 들려주세요.
참고자료 & 더 읽기
핵심 출처
- Sakana AI, "Introducing Sakana AI's Recursive Self-Improvement (RSI) Lab", 2026. : 사카나의 RSI 연구 포트폴리오와 4단계 로드맵이 정리되어 있어요. 오늘 뉴스레터의 핵심 소스예요.
- Sakana AI, "Sakana Fugu: One Model to Command Them All", 2026. : Fugu/Fugu Ultra의 아키텍처, 벤치마크, 가격 구조가 정리되어 있어요. 정식 출시 발표문이에요.
- Sakana AI, "Sakana Fugu Technical Report", 2026. : Fugu의 기술적 기반인 TRINITY와 Conductor 논문, 벤치마크 상세 결과, API 구조를 확인할 수 있어요.
- "Sakana AI bets AI that improves itself can break the compute arms race", The Decoder, 2026. : RSI Lab 발표의 맥락과 사카나의 연구 궤적을 잘 정리한 기사예요.
- "Recursive Superintelligence raises $650m at $4.65bn valuation", The Next Web, 2026. : Recursive의 창업 배경, 팀 구성, 투자 구조를 상세히 다뤘어요.
- Lu et al., "Towards end-to-end automation of AI research", Nature, March 2026. : AI Scientist 시스템의 아키텍처와 스케일링 결과를 다룬 Nature 논문이에요.
배경 지식
- "Recursive Self-Improvement Edges Closer In AI Labs", IEEE Spectrum, 2026. : RSI 분야의 현황을 학술적·산업적 양면에서 균형 있게 다뤘어요.
- IDC, "7x Growth in Just Three Years: Japan's AI Infrastructure Will Surge Past $5.5 Billion in 2026", 2026. : 일본 AI 인프라 시장의 구조적 성장 데이터예요.
- ICLR 2026 Workshop on AI with Recursive Self-Improvement. : RSI가 독립 연구 분야로 학계에서 인정받기 시작했음을 보여주는 이벤트예요.
- "Sakana AI's CTO says he's 'absolutely sick' of transformers", VentureBeat, 2025. : Llion Jones의 TED AI 발언 전문이 정리되어 있어요. 사카나의 철학적 기반을 이해하는 데 도움이 돼요.
각주
- [1] RSI (Recursive Self-Improvement): AI가 자기 자신의 개발 프로세스를 반복적으로 개선하는 방식이에요. AI가 더 나은 AI를 만들고, 그 AI가 다시 더 나은 AI를 만드는 자기강화 루프를 목표로 해요.
- [2] Darwin Gödel Machine (DGM): AI 에이전트가 진화적 알고리즘으로 자기 코드를 수정해 성능을 높이는 시스템이에요. 사카나 AI와 UBC가 공동 개발했고, 소프트웨어 엔지니어링 벤치마크에서 기초 성능 대비 30%p 절대 향상(약 2배)을 달성했어요.
- [3] 카이젠(改善): 일본 제조업에서 유래한 '지속적·점진적 개선' 철학이에요. 도요타 생산 시스템(TPS)의 핵심 원리로, 한 번의 큰 투입보다 작은 개선의 반복적 축적을 강조해요.
- [4] 샘플 효율성(Sample Efficiency): 적은 데이터나 시행 횟수만으로 목표 성능에 도달하는 능력이에요. AI 학습에서 데이터를 많이 쓰는 게 유리하지만, 같은 성능을 더 적은 데이터로 달성하면 비용과 시간이 크게 줄어요.
- [5] MoE (Mixture of Experts): 하나의 거대한 모델 대신, 여러 '전문가' 모듈 중 입력에 맞는 것만 활성화하는 구조예요. 전체 모델 크기는 크지만 실제 연산량은 훨씬 적어서, 효율적인 대규모 모델 구축에 많이 쓰여요.
- [6] Sovereign AI: 국가나 기관이 외부(특히 미국 빅테크) 의존 없이 독자적으로 보유·운영하는 AI 역량이에요. 모델 학습, 데이터 파이프라인, 컴퓨트 인프라 전반에 대한 자주권을 뜻해요.
- [7] 오케스트레이터(Orchestrator): 여러 AI 모델에게 역할을 배분하고, 결과를 검증·종합하는 '지휘자' 모델이에요. Fugu의 경우 7B 파라미터의 작은 모델이 강화학습으로 훈련되어 GPT-5, Claude, Gemini 같은 대형 모델들을 조율해요.
의견을 남겨주세요
주재원
AI의 성능을 높이기 위해서 계속 스케일업 투자를 하는 방향만 있는줄 알았는데, 사카나 AI 의 개발방향에 두손들고 응원하게 됩니다. 좋은 글 통해 많은 인사이트 얻어 갑니다. 감사합니다. ^^b
오즈의 지식토킹
모두가 스케일업하는 방식으로 가면 사실 중국, 미국만 살아남는 세상이 되지 않을까 하는데 이렇게 오케스트레이션 형태의 해법도 있다는 걸 일본이 보여주니 한국도 좋은 선택지를 한 번 고를 수 있는 지혜를 내보면 어떨까 합니다. 너무 파운데이션 모델의 함정에 빠져있는 것 같아요.
의견을 남겨주세요
단파빵
늘 인사이트가 넘치는 뉴스레터 잘 구독하고 있습니다. 최근의 AI 개발 흐름을 따라가면 각 국가별의 금융인프라에 따라서 접근법이 달라지는 것 같습니다 금융자본조달 인프라가 발달한 미국의 경우는 역시나 하이퍼스케일러의 자금수급을 바탕으로 혁신을 지원하고 있고, 중국은 공산당의 관치금융 비호아래서 콜로세움을 열어서 치열하게 경쟁하는 중이고 일본은 자신들이 가장 잘하는 분야에 집중하는 듯한 모습을 보여주네요. 개인적으로는 일본의 AI 생태계도 흥미롭게 보고 있는 중입니다 저력이 있는 국가이다보니 후발주자로서의 킥이 있을 것이라고 봅니다. 그에 비해 한국의 AI 생태계 인프라는 너무 하드웨어쪽으로 치중되어 있지 않나 우려가 됩니다
의견을 남겨주세요