공지
[공지] Divided by Zero 멤버십 전환 안내 ☕️

구글 알파폴드 다음 전쟁은 데이터?

2025.06.23 | 조회 140 |
0
|
from.
Essence
Divided by Zero의 프로필 이미지

Divided by Zero

IT테크, 스타트업 그리고 자본시장에 대한 2차적 사고를 공유합니다

Divided by Zero에 오신 걸 환영합니다. IT테크, 스타트업 그리고 자본시장에 대한 2차적 사고를 공유합니다.

구글 딥마인드의 알파폴드(AlphaFold). 50년간 이어진 생물학의 난제 단백질 접힘 문제를 해결하고, 2024년 노벨 화학상까지 거머쥔 이 AI 모델은 그야말로 과학계의 혁명이었습니다. 수십억 년의 연구 시간을 절약해주었고, 수백만 명의 연구자들에게 이전에는 상상도 할 수 없었던 단백질 구조 데이터를 무료로 제공하며, 한때 신약 개발의 가장 큰 병목 현상이었던 단백질 구조 예측을 '민주화'했죠.

그런데 말입니다, 이 위대한 '민주화'가 역설적으로 더 넘기 힘든 새로운 '장벽'을 만들고 있다는 사실, 알고 계셨나요? 알파폴드의 성공으로, 이제 의료 스타트업 생태계에선 완전히 새로운 규칙의 게임이 진행되고 있습니다.

출처: Google Deepmind
출처: Google Deepmind

알파폴드의 민주화

알파폴드가 얼마나 대단한지는 굳이 길게 설명할 필요가 없을 겁니다. 단백질의 아미노산 서열만으로 그 3차원 구조를 거의 실험에 가까운 정확도로 예측해낸다는, 모든 게임을 바꾼 사건이었으니까요.

하지만 이 혁명적인 도구의 성공은, 역설적으로 그 자신의 아킬레스건을 드러냈습니다. 바로 "AI는 결국 훈련 데이터만큼만 똑똑하다"는 냉정한 현실이죠. 알파폴드는 단백질 데이터뱅크(PDB)라는 공개 데이터셋을 기반으로 훈련했습니다. 문제는 이 공개 데이터가 신약 개발에 가장 중요한 정보들을 담고 있지 않다는 겁니다.

  • 알파폴드는 단백질의 정지된 사진 한 장을 예측할 뿐, 실제 생체 내에서 끊임없이 형태를 바꾸는 동적인 움직임은 보여주지 못합니다. 약물이 단백질에 어떻게 영향을 미치는지 이해하려면 이 동적인 상호작용을 알아야 하는데 말이죠
  • 신약 개발에 가장 필요한 데이터는 "다양한 약물 후보 물질이 수많은 표적 단백질에 어떻게 결합하는가"에 대한 정보입니다. 그리고 이 데이터는 제약사들의 금고 속에 잠겨있는, 수십억 달러 가치의 1급 기밀이죠. 공개 데이터에는 이런 정보가 턱없이 부족합니다

결국 알파폴드는 단백질 구조 예측이라는 과정을 상품화하고 민주화했지만, 동시에 진짜 가치 있는 데이터의 중요성을 모두에게 일깨워주었습니다. 이제 경쟁의 축은 "누가 더 예측을 잘하는가"가 아니라, "누가 더 가치 있는 데이터를 가지고 있는가"로 옮겨간 셈입니다.

데이터 장벽

이 새로운 '데이터 병목현상' 앞에서, 시장은 두 개의 거대한 진영으로 나뉘기 시작했습니다.

1. 독점적 데이터 장벽을 쌓는 빅파마

글로벌 빅파마들은 자신들의 데이터가 새로운 시대의 석유임을 깨달았습니다. 애브비, 존슨앤드존슨, 사노피, 아스트라제네카 등 거대 제약사들은 'AI 구조생물학 컨소시엄(AISB)'을 결성했습니다. 이들의 전략은 명확합니다. 각 회사가 가진 독점적인 단백질-리간드 상호작용 데이터를 '연합 학습(Federated Learning)'이라는 기술을 통해 공유하지 않으면서도, 공동으로 더 강력한 AI 모델을 훈련시키는 거죠. 그리고 이렇게 만들어진 최첨단 모델은, 당연히 컨소시엄 회원사들만 독점적으로 사용할 계획입니다. 일종의 '데이터 해자'를 쌓아 올리고 있는 겁니다.

2. 오픈소스의 반격

이러한 움직임에 맞서, 과학계와 일부 기업들은 '오픈폴드 컨소시엄(OpenFold Consortium)'을 중심으로 뭉쳤는데요. 컬럼비아 대학 같은 학술 기관과 제넨텍, 바이엘 같은 기업들이 참여하여, 누구나 자유롭게 사용하고 상업적으로도 활용할 수 있는 오픈소스 AI 모델과 새로운 공공 데이터를 만드는 것을 목표로 합니다. 특정 기업의 데이터 독점을 막고, 생물학 분야의 혁신을 계속해서 개방적으로 이끌어가려는 의미있는 접근이죠.

AI 네이티브 스타트업

이처럼 독점과 개방이라는 두 개의 축이 만들어낸 새로운 환경 속에서, 과거와는 전혀 다른 종류의 AI 네이티브 바이오텍 스타트업들이 폭발적으로 등장하고 있습니다.

  • 이스라엘의 프로타이(Protai)는 알파폴드 같은 공개된 AI 도구를 가져와, 자신들만의 독점적인 실험 데이터와 결합하여 가치를 창출합니다. 알파폴드로 단백질 구조를 예측한 뒤, 자사의 질량 분석 데이터를 활용해 그 예측을 검증하고 정교화하는 방식으로 신약 후보물질을 발굴합니다. 이들의 경쟁력은 AI 모델 자체가 아니라, AI와 결합할 수 있는 고품질의 자체 데이터
  • 딥마인드 출신들이 설립한 레이턴트 랩스(Latent Labs)는 알파폴드가 풀지 못하는 문제, 즉 '세상에 없던 새로운 단백질을 설계(de novo design)'하는 데 집중하죠. 이들은 최첨단 생성 AI 기술을 이용해 새로운 항체나 효소를 컴퓨터상에서 프로그래밍해서, 제약사들에게 제공하는 것을 목표로 합니다. 이들의 해자는 최고 수준의 AI 인재 그 자체
  • 그리고 구글 딥마인드의 자매 회사인 아이소모픽 랩스(Isomorphic Labs)가 있습니다. 아이소모픽 랩스는 알파폴드 3를 직접 개발한 기술력을 바탕으로, AI 모델 개발부터 신약 후보물질 발굴, 임상 개발까지 모든 과정을 수직 통합하려는 풀스택 전략을 구사합니다. 이미 일라이 릴리, 노바티스와 총 30억 달러에 달하는 초대형 파트너십을 체결했고, 최근에는 6억 달러의 외부 투자까지 유치하며 그 야망을 드러내고도 있죠

규제

여기에 또 하나의 변수가 등장했는데요, 바로 규제.

미국 FDA는 2025년, 신약 개발에 사용되는 AI 모델에 대한 가이드라인 초안을 발표했습니다. 핵심은 AI 모델이 규제 결정을 뒷받침하는 데 사용될 경우, 그 신뢰성을 입증하기 위한 엄격하고 체계적인 검증과 문서화를 요구한다는 겁니다.

환자 안전을 위해 당연한 조치이지만, 스타트업에게는 새로운 현실의 벽이 될 수 있습니다. 이 복잡한 규제 요구사항을 맞추기 위해서는 상당한 비용과 전문 인력이 필요하기 때문이죠. 결국 충분한 자본과 전담 팀을 갖춘 대기업이나, 아이소모픽 랩스 같은 빅테크에게 절대적으로 유리한 환경이 만들어지는 겁니다. 이제는 규제 대응 능력 자체가 하나의 중요한 경쟁력이자, 진입 장벽이 된 셈입니다.

더 치열해진 전쟁

알파폴드는 분명 세상을 바꿨습니다. 단백질 구조 예측이라는 과정을 민주화하여, 더 많은 연구자들이 이 분야에 뛰어들 수 있는 문을 열어주었죠.

하지만 그 문 안쪽에서 마주한 현실은, 더 교묘하고 복잡한 새로운 전쟁터였습니다. 이제 경쟁의 핵심은 '알고리즘'이 아니라 '독점적 데이터'와 '규제 대응 능력'으로 옮겨갔습니다. 빅파마들은 자신들만의 데이터 장벽을 쌓고 있고, 구글은 아이소모픽 랩스라는 거대한 성을 구축했습니다.

결국 알파폴드는 신약 개발의 레이스를 끝낸 것이 아니라, 단지 출발선을 앞으로 당겨준 것에 불과합니다. 출발선에 서기는 쉬워졌지만, 결승선까지 완주하는 것은 오히려 더 어려워진, 아주 역설적인 상황이 펼쳐지고 있는 거죠.

AI가 열어젖힌 신약 개발의 시대, 그 진짜 승자는 누가 될지 이제부터가 본격적인 시작입니다.

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

이번 뉴스레터 어떠셨나요?

Divided by Zero 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !
© 2025 Divided by Zero

IT테크, 스타트업 그리고 자본시장에 대한 2차적 사고를 공유합니다

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보 뉴스레터 광고 문의

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스