(금주의) AI 레이스

Divided by Zero에 오신 걸 환영합니다. IT테크, 스타트업 그리고 자본시장에 대한 2차적 사고를 공유합니다.

매주 크리스마스같이 AI 소식이 새로 나오고 있습니다. 지난주는 구글과 오픈AI가 또 새로운 프로젝트를 발표했습니다.

구글은 알파이볼브(AlphaEvolve), 그리고 오픈AI는 코덱스(Codex) 플랫폼. 두 회사가 각각 선보인 AI 에이전트들은 단순한 코딩 도우미를 넘어, 아예 새로운 알고리즘을 창조하거나 소프트웨어 개발과정을 혁신하려는 모습을 보여주는데요.

또 어떤 방식으로 우리 일하는 방식을 바꿔놓을지 기대가 됩니다.

출처: Google DeepMind

구글 딥마인드 알파이볼브

먼저 구글부터 살펴보죠.

구글 딥마인드가 내놓은 알파이볼브, 좀 특별합니다. 단순히 코드를 짜주는 걸 넘어, 아예 새로운 알고리즘을 '발견'하고 최적화하도록 설계된 AI 코딩 에이전트죠. 제미나이 프로(Gemini Pro)와 제미나이 플래시(Gemini Flash) 같은 언어 모델의 생성 능력을 '진화론적 프레임워크'와 결합했다고 합니다.

말이 좀 어렵나요? 쉽게 말해, 수많은 코드 후보군을 만들어내고, 그걸 자동으로 테스트해서 가장 괜찮은 놈들만 살아남아 계속 진화하는 방식입니다.

그리고 이 방식은 이미 구글 내부에서도 꽤 의미있는 결과를 내고 있다고 합니다. 이미 구글 데이터센터 운영 스케줄을 개선해서 글로벌 컴퓨팅 자원의 평균 0.7%를 아꼈다고 하는데, 구글의 인프라 규모를 생각하면 비용절감 측면에서 어마어마하겠죠.

더불어 구글의 AI 반도체(TPU) 회로 설계를 최적화하고, 제미나이 모델 학습 시간을 1% 단축시키는 데도 기여했다고하죠. (제미나이 아키텍처의 핵심 행렬 연산 속도를 23%나 높였다네요!)

더 놀라운 건, 알파이볼브가 인간 프로그래머의 능력을 뛰어넘는 결과를 보여주기 시작했다는 점입니다.

GPU 커널 최적화 같은 고도의 기술 영역에서는 인간 전문가들이 도달하지 못했던 수준의 속도 향상(최대 32.5%)을 달성했다고 합니다. 순수 수학 분야에서도 새로운 행렬 곱셈 알고리즘을 제안하거나, 오랫동안 풀리지 않던 난제(11차원에서의 키싱 넘버 문제 같은) 해결에 실마리를 제공하기도 했고요. 50개가 넘는 알고리즘 챌린지 벤치마크에서는 약 95%의 경우에서 기존 해법을 재발견하거나 개선하는 성과를 냈다고 합니다.

결국 알파이볼브의 핵심 경쟁력은 거대 언어 모델의 '창의적인 생성 능력'과 '엄격한 자동 평가 시스템'의 시너지라고 볼 수 있겠습니다. 복잡한 코드 속에서 AI가 직접 혁신적인 해결책을 찾아내는 자율적인 'AI 연구 과학자'가 등장한 셈이죠. 딥마인드는 앞으로 이 기술을 신약 개발, 신소재 과학, 지속가능성 연구 등 알고리즘으로 표현하고 자동으로 테스트할 수 있는 모든 분야에 적용할 수 있을 것으로 기대하고 있습니다.

정말 AI가 스스로 새로운 과학적 발견을 하는 시대가 얼마 남지 않아보입니다

오픈AI 코덱스 플랫폼

출처: 오픈AI

한편, 오픈AI는 코덱스(Codex) 플랫폼이라는 이름으로 또 다른 방향의 혁신을 예고했습니다.

이 플랫폼은 여러 AI 코딩 에이전트들을 동시에 병렬적으로 실행시켜, 소프트웨어 개발의 전 과정을 돕는 것을 목표로 한다고 합니다. 개발자들은 이 플랫폼을 통해 수십 개의 코덱스 에이전트에게 각자의 코드베이스가 미리 탑재된 격리된 환경에서 작업을 할당하고 모니터링할 수 있다고 하죠.

이 특수한 에이전트들은 새로운 기능 구현, 버그 식별 및 수정, 자동 테스트 실행, 심지어 인간 개발자의 검토를 위한 풀 리퀘스트(pull request)* 제안까지 다양한 소프트웨어 엔지니어링 작업을 수행할 수 있습니다.

* 소프트웨어 개발에서, 특히 Git이나 GitHub, GitLab, Bitbucket 같은 협업 플랫폼에서 자주 쓰이는 기능. 쉽게 말해, 내가 수정한 코드를 팀의 공식 저장소에 반영해줘도 되는지 요청하는 행위

플랫폼의 핵심 엔진은 오픈AI의 o3 모델을 소프트웨어 엔지니어링 작업에 특화시켜 미세 조정한 'codex-1'. 실제 코딩 챌린지에 대한 강화 학습을 통해 훈련된 이 모델은 인간 개발자의 코딩 스타일을 더 잘 이해하고, 더 깔끔한 코드를 생성하며, 테스트가 통과될 때까지 계속적으로 작업을 수행하고, 주어진 지침도 더 잘 따른다고 하네요.

각 에이전트가 수행한 활동은 터미널 로그, 테스트 결과 등 모든 과정이 추적 가능한 형태로 기록되어, 사용자가 AI의 작업 내용을 투명하게 감사할 수 있게 설계되어 있습니다고 합니다.

하지만 오픈AI는 코덱스가 아직 완전한 자율성을 갖춘 것은 아니라고 강조합니다. AI가 만들어낸 결과물의 정확성을 검증하고 예외적인 상황을 처리하기 위해서는 여전히 인간 개발자의 검토가 필수적이라는 거죠.

여러 에이전트가 동시에 작업할 때 발생할 수 있는 파일 수정 충돌 문제나, 각기 다른 에이전트가 만들어낸 코드의 품질을 일관되게 유지하는 것도 아직 해결해야 할 숙제로 남아있다고 합니다.

AI 레이스, 이제는 투 트랙 경쟁

위의 구글의 알파이볼브와 오픈AI의 코덱스 플랫폼이 보여준 방향은 현재 AI 경쟁이 단순히 코드 몇 줄 더 빨리 짜는 수준을 넘어, 훨씬 더 정교하고 다면적인 양상으로 진화하고 있음을 보여주는 것 같습니다. 이젠 특정 목적에 특화된 AI 시스템 개발 경쟁이라고 봐야 할 것 같네요.

알파이볼브 프로젝트는 AI를 근본적인 '발견'과 '혁신'의 영역으로 밀어 넣고 있는 모습인데요. 복잡하고 정량화 가능한 분야에서 인간의 한계를 뛰어넘는 새로운 알고리즘을 '발명'할 수 있는 AI 연구 과학자로서의 가능성을 보여준 것이죠.

→ 새로운 지식과 근본적으로 우수한 알고리즘 솔루션을 창조하는 방향

반명 코덱스 플랫폼은 인간 소프트웨어 엔지니어의 역량을 강화하고 확장하는 데 집중하고 있습니다. 여러 AI 에이전트들을 활용하여 반복적인 개발 작업을 자동화하고 팀 생산성을 극대화하는 강력한 '협업 도구'를 지향하는 것으로 보이죠.

기존 개발 워크플로우에 자연스럽게 통합되고 인간의 코딩 표준을 따르는 형태는, AI가 소프트웨어 개발 수명 주기의 상당 부분을 담당하고 인간 개발자는 더 높은 수준의 설계와 문제 해결에 집중하는 그림을 보여줍니다.

→ 소프트웨어를 만들고, 유지하고, 디버깅하는 '과정' 자체를 혁신하는 경쟁이죠

결국 알파이볼브가 '무엇을(what)' 발견하는 데 중점을 둔다면, 코덱스는 '어떻게(how)' 개발할 것인가를 개선하는 데 초점을 맞춘, 서로 다른 듯하면서도 상호 보완적인 두 가지 방향으로 전개되고 있다고 볼 수 있습니다.

두 프로젝트 모두 AI가 코드와 알고리즘 문제 해결에 적용되는 방식이 한 단계 성숙했음을 보여줍니다. 알파이볼브가 이전에 해결할 수 없었던 문제에 대한 해답을 찾고 새로운 효율성을 추구한다면, 코덱스는 일상적인 소프트웨어 개발 방식을 혁신하려 합니다.

좀 더 멀리본다면 결국 자율성과 협업의 기술적 돌파구가 마련되는 순간, AI는 단순한 도구에서 하나의 주체로 전환될 것으로 보입니다.

그리고 그 순간부터, 우리가 코드를 짜는 방식도, 산업의 규칙도, 과학의 패러다임도 근본적으로 달라질 것이 확실합니다.

항상 이 레이스를 주시해야할 이유

(금주의) AI 레이스

구글 알파이볼브 & 오픈AI 코덱스 플랫폼

Divided by Zero 님에게 커피와 쪽지 보내기

구글 딥마인드 알파이볼브

오픈AI 코덱스 플랫폼

AI 레이스, 이제는 투 트랙 경쟁

다가올 뉴스레터가 궁금하신가요?

이번 뉴스레터 어떠셨나요?

Divided by Zero 님에게 커피와 쪽지 보내기

이전 뉴스레터

다음 뉴스레터