업무자동화 도구 Zapier의 창업자 마이크 눕이 유튜브 채널 Peter Yang과 진행하여 2024년 12월 1일 공개된 인터뷰 내용을 리뷰해봤습니다.
AI 자동화의 두 가지 접근법
Zapier의 공동창업자 Mike Knoop은 현대 자동화 기술을 두 가지 큰 카테고리로 구분합니다:
API 기반 자동화 | RPA (로봇 프로세스 자동화) |
Zapier 방식 | Anthropic Computer Use 방식 |
API 키 필요 | 키보드와 마우스로 사용자 행동을 모사 |
높은 신뢰성 | 낮은 신뢰성 |
낮은 범용성 | 높은 범용성 |
Zapier의 AI 도입 여정
Zapier는 2022년부터 본격적인 AI 도입을 시작했습니다:
- GPT-3에서 시작된 관심
- 2022년 Chain-of-Thought 논문의 영향
- OpenAI 플러그인 스토어 초기 참여
- 전사적 AI 코드레드(Code Red) 선언
- 50% 이상의 직원들이 일상적으로 AI 도구 사용
AGI를 향한 새로운 도전: ARC Prize
François Chollet가 2019년에 제시한 AGI의 정의:
- 효율적으로 새로운 기술을 학습하고 적용할 수 있는 시스템
- 개방형 문제 해결 능력
- 현재 AI 시스템과의 근본적 차이
ARC Prize의 특징:
- 100만 달러 이상의 상금
- 소스코드는 반드시 오픈소스로 공개해야 함
- GPT-4, Claude 3.5 등 최신 모델들도 해결하지 못함
현재 AI 연구의 한계와 새로운 방향
주목할만한 발전:
- OpenAI의 o1 모델: 테스트 시간 검색 도입
- DeepMind의 AlphaProof: 검색과 테스트 타임 파인튜닝 결합
- Minds AI 팀: 200M 파라미터 모델로 효율적 접근
현재 연구의 문제점:
- 단순히 컴퓨팅 능력을 확장하는 스케일업에 치중
- 2023년 기준 LLM 스타트업에는 2000억 달러가 몰린 반면, 초지능 AGI 연구에는 1억 달러가 투자됨
일반적인 오해들
하이퍼스케일러(OpenAI, Anthropic, Google, Meta, Amazon)의 지배력:
- 대규모 데이터센터 필요성 강조
- 원자력 발전소급 컴퓨팅 파워 요구
- 거대 기업만이 경쟁 가능하다는 인식
기술적 한계:
- 단순 스케일업으로 해결될 것이라는 착각
- 기존 언어 모델의 한계 과소평가
- 혁신적 아이디어의 중요성 간과
도전 영역과 기회
미해결된 핵심 과제들
인간 수준의 단순 작업:
- ARC 벤치마크가 제시하는 기초적 문제들
- 5년간 정복되지 않은 과제들
- 인간에게는 직관적인 문제 해결 능력
새로운 연구 방향:
- 메모리제이션을 넘어선 추론 능력
- 효율적 학습 메커니즘
- 개방형 문제 해결 접근법
연구 시작점
실천적 접근법:
- ARC 벤치마크 문제 탐구
- 기술 가이드 학습
- Kaggle에서 실제 구현 시도
- 오픈소스 코드 기여
리뷰
일단 리뷰하면서 느낀 건 이분이 말하는 속도가 엄청나게 빠르다는 것이었는데요. 보통 머리가 좋은 사람들이 말이 빠르다고 하니, 정말 머리가 좋은 사람이구나라는 것을 쉽게 알 수 있었습니다.
게다가 2023년 GPT-3를 처음 접하고 나서 곧바로 Zapier의 업무자동화 서비스와 AI가 공통점이 있다는 점을 깨닫고 스스로 공부해서 상당한 경지에까지 도달하였고, 경영자로써도 Code Red를 발령하여 Zapier에서의 모든 업무를 일주일 동안 중단하고 모든 직원이 AI를 집중적으로 공부할 수 있게 해주었습니다.
인터뷰를 보면서 떠오른 인물은 두명이었는데요. 한명은 함께 Arc Prize를 런칭한 Google의 프랑소와 숄레입니다. 일전에 다룬 적이 있었구요.
다른 한명은 OpenAI의 정형원 박사입니다. 역시 일전에 다룬 적이 있었습니다.
제가 마이크의 인터뷰에서 이 두 사람을 떠올린 이유는 마이크, 프랑소와, 정형원 박사 모두가 같은 이야기를 하고 있기 때문이죠. 그것은 바로 AI 발전이 정체되어 있고 새로운 아이디어가 필요하다는 이야기였습니다.
일단, AGI라는 용어의 정의에 대해서 문제를 삼았는데요. OpenAI에서 얘기하는 "대부분의 경제적 가치 있는 작업에서 인간을 능가하는 시스템"이라는 정의는 너무 모호해서 측정이 어렵고 심지어 OpenAI에서는 이미 o1 모델로 AGI를 달성했다고 주장하고 있어서 부적절하다는 의견을 제시합니다.
마이크와 프랑소와는 AGI의 정의가 "최소한의 학습 데이터만 가지고 새로운 기술을 빠르게 습득하는 시스템"으로 바뀌어야 한다고 주장합니다. 그리고 이를 측정하기 위한 프랑소와는 이미 2019년에 ARC라는 벤치마크를 고안했지요. 저도 풀어봤는데 정말 신기할 정도로 인간에게는 쉽지만 인공지능에게는 쉽지 않은 퍼즐들이었습니다.
이런 벤치마크를 통해서 우리는 인간 지능과 기계 지능의 차이점을 명확하게 이해할 수 있고, 현재의 기계 지능이 지능의 여러 면 중에서 특히 "기억"에만 특화되어 있다는 것을 알 수 있었습니다. 학습을 통해 "기억"된 문제에 대해서는 잘 답변을 하나, 그 기억들을 기반으로 일반화를 하여, 처음 보는 다른 문제는 잘 풀지 못하는 것이 2024년 현 시점 기계 지능의 한계라는 것이죠.
여전히 정복되지 못한 문제라는 것은 이곳에 많은 기회가 있다는 이야기지요. 그래서 마이크는 미리 포기하지 말고 2025년에도 열릴 Arc Prize를 포함해서 아직 업계가 풀지 못하고 있는 문제에 적극적으로 도전해줄 것을 당부하고 있습니다.
의견을 남겨주세요