중국 AI 연구소 안에서

Divided by Zero에 오신 걸 환영합니다. IT테크, 스타트업 그리고 자본시장에 대한 2차적 사고를 공유합니다.

AI 연구자 네이선 램버트(Nathan Lambert)가 중국 AI 연구소들을 직접 방문하고 쓴 글이 화제입니다. 램버트는 앨런 AI 연구소(Ai2)에서 오픈소스 LLM을 만드는 사람인데, 항저우에서 상하이로 가는 고속열차 안에서 이 글을 마무리했다고 하죠. 문샷(Moonshot), 즈푸(Zhipu), 메이퇀, 샤오미, 큐원(Qwen), 01.ai 등 중국의 거의 모든 주요 AI 연구소를 36시간 안에 돌아다니며 현장 연구자들과 대화한 기록입니다.

미국을 대표로하는 소위 서양에서 중국 AI를 다루는 글은 보통 두 가지입니다. "중국이 따라잡고 있다, 무섭다" 아니면 "미국이 3~6개월 앞서 있다, 괜찮다". 램버트의 글은 둘 다 아닙니다. 현장에서 사람들과 직접 이야기한 뒤, 숫자와 벤치마크로는 보이지 않는 것들을 정리한 거죠.

꽤 흥미로운 관찰이 많아서 몇 가지를 뽑아봤습니다.

램버트가 가장 강조하는 관찰은 문화적 차이입니다. 지금 최고의 LLM을 만드는 작업은 데이터부터 아키텍처 세부사항, 강화학습 알고리즘 구현까지 전 영역에서 꼼꼼한 작업을 맞물리게 해야 하는 일인데, 이 과정에서 어떤 연구자의 아이디어는 전체 최적화를 위해 버려져야 할 때가 있다고 합니다.

미국 연구자들은 개별적으로는 당연히 뛰어나지만, 자기 작업을 어필하는 문화가 강하다고 합니다. 유명 AI 과학자가 되는 경로가 존재하고, 자기 아이디어가 최종 모델에 안 들어가면 불만을 갖는 구조죠. 램버트는 메타의 라마(Llama) 팀이 이런 내부 정치의 무게에 눌려 무너졌다는 소문을 언급하면서, 어떤 연구소에서는 불만을 잠재우려고 최고 연구자에게 돈을 줘야 했다는 이야기까지 전합니다.

중국 연구소에서는 이 역학이 약간 다르다는 겁니다. 화려하지 않은 작업도 최종 모델을 위해 기꺼이 하려는 경향이 있고, 에고가 덜해서 조직 구조가 조금 더 유연하게 확장될 수 있다는 거죠. 램버트는 이게 중국이 패스트 팔로워로서 특히 강한 이유 중 하나라고 봅니다.

다만 이 문화의 다른 면도 있습니다. AI의 경제적 불확실성이나 사회적 리스크에 대해 물어보면 중국 연구자들 대부분이 의견이 없다고 합니다. 중국에서는 카테고리 에러, 즉 질문 자체가 이상한 거죠. 한 연구자는 중국은 엔지니어가 운영하고, 미국은 변호사가 운영한다는 말을 인용하면서 자기 역할은 만드는 것이라고 했다고 합니다. 미국에 드워케시나 렉스 프리드먼 같은 AI 과학자 스타 시스템이 있는 반면, 중국에는 그런 경로 자체가 없다는 것이죠.

학생이 핵심 인력

또 하나 눈에 띄는 건 중국 AI 연구소의 핵심 기여자 중 상당수가 현역 학생이라는 겁니다. 연구소 자체가 젊고, 학생이 동료 연구자로 팀에 바로 통합되는 구조라고 합니다. 이건 미국의 톱 연구소들과 완전히 다릅니다. 오픈AI, 앤스로픽, 커서 같은 곳은 아예 인턴십 자체를 제공하지 않거든요. 구글이 명목상 제미나이 관련 인턴을 받지만, 실제로 핵심 프로젝트에 투입되는지는 불확실하다고 하죠.

학생이라는 게 왜 강점이 될 수 있냐면, LLM의 핵심 패러다임이 지난 몇 년 사이에 MoE 스케일링에서 RL 스케일링으로, 다시 에이전트로 빠르게 바뀌었기 때문입니다. 이걸 잘하려면 방대한 맥락을 빠르게 흡수하고, 기존 가정을 버리고, 새로운 기술 스택에 머리부터 뛰어들어야 합니다. 학생들은 원래 이런 일에 익숙하죠. 선입견이 적고, 이전 하이프 사이클에 묶여 있지 않으니까요.

관련해서 재밌는 에피소드가 있다고 하는데요. 한 연구자가 교수가 되고 싶다고 했는데, 이유가 교육 시스템에 가까이 있고 싶어서라고 했다하는데, 바로 이렇게 덧붙였다고 합니다.

"교육은 LLM으로 해결됐잖아요. 학생이 왜 나한테 말을 걸겠나요"

생태계가 다르다

램버트가 정리한 중국 AI 산업의 특징 중 서양과 가장 다른 점 몇 가지를 뽑아보면 이렇습니다.

일단 거의 모든 대형 중국 기술 기업이 자체 범용 LLM을 만들고 있습니다. 배달 서비스 메이퇀, 소비자 가전의 샤오미까지요. 미국에서 이 위치의 회사들은 보통 오픈AI나 앤스로픽의 서비스를 사서 씁니다. 중국 기업들이 LLM을 직접 만드는 건 유행을 타려는 게 아니라, 자기 기술 스택을 직접 통제하겠다는 근본적인 의지 때문이라고 램버트는 봅니다. 오픈소스로 모델을 풀어서 커뮤니티 피드백을 받고, 동시에 내부에는 자사 제품에 맞게 파인튠한 버전을 유지하는 실용적인 구조이죠.

그리고 재밌게도 중국 개발자들 대부분도 클로드에 빠져 있습니다. 명목상 중국에서 금지되어 있는데도요. 중국이 역사적으로 소프트웨어에 돈을 안 쓴다는 통념이 있지만, 램버트는 AI 지출이 SaaS 시장(역사적으로 작음)이 아니라 클라우드 시장(근본적으로 큼)을 따라갈 거라고 봅니다. 중국 기술 인력이 워낙 실용적이고 동기부여가 강해서, 도움이 되는 도구에 돈을 안 쓸 이유가 없다는 거죠. 오픈AI의 코덱스(Codex)에 대한 언급은 의외로 거의 없었다고 합니다.

한편으로는 엔비디아 칩에 대한 갈망이 절실합니다. 학습에는 엔비디아가 골드 스탠다드이고, 공급만 있으면 살 거라는 게 모든 연구소의 일치된 반응이었다고 합니다. 화웨이 등 다른 가속기는 추론 쪽에서는 긍정적으로 이야기되지만, 학습에서는 대체재가 아직 부족한 상태이죠. 미국의 수출 통제가 실제로 물고 있다는 뜻입니다.

거기에 당연한 이야기겠지만 데이터 산업이 미국보다 덜 발달해 있습니다. 앤스로픽이나 오픈AI가 단일 강화학습 환경에 1,000만 달러 이상을 쓴다는 이야기를 듣고 중국에도 비슷한 생태계가 있는지 물었는데, 외부 데이터 업계의 품질이 낮아서 대부분 직접 만든다는 답이 돌아왔다고 합니다. 바이트댄스나 알리바바 같은 큰 회사는 내부 데이터 라벨링 팀을 갖고 있고요. 역시 '사지 말고 만들어라'는 문화의 연장선입니다.

경쟁이 아닌 생태계

가장 인상적인 관찰은 분위기에 대한 겁니다.

중국에서는 LLM 커뮤니티가 대립하는 부족이 아니라 하나의 생태계처럼 느껴진다고 합니다. 비공개 대화에서 경쟁사에 대한 존중이 가득했다고 하죠. 모든 연구소가 바이트댄스(더우바오 모델)를 두려워하고, 딥시크를 기술적 리더로 존경한다고 합니다. 램버트의 표현이 좋은데, "미국에서 비공개로 연구소 사람들을 만나면 금방 불꽃이 튄다." 중국에서는 그렇지 않았다는 거죠.

정부의 역할에 대해서는 좀 더 미묘합니다. 정부가 돕고 있는 건 분명하지만, 구체적으로 어디까지인지는 불분명하다고 합니다. 베이징의 구 단위에서 기업 유치를 위해 경쟁한다거나, 관료적 규제를 제거해준다는 수준의 이야기는 나왔지만, 중국 정부 상층부가 기술적 의사결정에 개입한다는 조짐은 전혀 없었다고 합니다.

램버트의 글을 읽으면서 떠오르는 생각이 있습니다.

딥시크 V4가 나올 때마다 우리는 벤치마크 점수와 토큰당 가격을 비교하죠. 미국이 3~6개월 앞서 있다, 중국이 따라잡고 있다, 수출 통제가 효과가 있다 없다. 이런 식으로요. 하지만 그런 숫자로는 보이지 않는 층이 있습니다. 학생이 핵심 연구자인 조직 구조, 에고보다 최종 모델을 우선하는 문화, 소프트웨어를 사지 않고 만드는 습관, 경쟁사를 적이 아니라 생태계의 일부로 보는 태도.

이 차이가 최종 모델 품질에 의미 있는 차이를 만드는지, 아니면 중국 모델이 영원히 3~6개월 전의 미국 모델과 비슷하게 설명되는 데 그칠지는 아직 모릅니다. 하지만 램버트가 글 끝에서 한 말이 계속 남습니다. "미국에서 중국에 대한 현재의 세계관은 의사결정의 핵심 도구로 쓰이고 있다. 그런데 중국의 현장 연구자들과 직접 이야기해보면, 서양의 의사결정 체계로는 모델링하기 매우 어려운 자질과 본능이 있다."

벤치마크는 모델의 출력을 측정합니다. 그 모델을 만드는 사람들의 문화와 조직 방식은 측정하지 못하죠. 그리고 후자가 전자를 결정하는 데는 생각보다 오래 걸리지 않을 수 있습니다.

중국 AI 연구소 안에서

Divided by Zero 님에게 커피와 쪽지 보내기

학생이 핵심 인력

생태계가 다르다

경쟁이 아닌 생태계

다가올 뉴스레터가 궁금하신가요?

이번 뉴스레터 어떠셨나요?

Divided by Zero 님에게 커피와 쪽지 보내기

이전 뉴스레터

다음 뉴스레터

다른 뉴스레터

메일리 도우미