2026년 3월 26일, 앤트로픽(Anthropic)의 미공개 내부 문서 약 3,000건이 외부에 노출되면서 'Claude Mythos'라는 이름의 차세대 AI 모델의 존재가 세상에 알려졌다. 보안 연구자 Roy Paz(LayerX Security)와 Alexandre Pauwels(케임브리지대학교)가 이를 발견했으며, Fortune, CNBC 등 주요 매체가 일제히 보도하면서 업계에 큰 파장을 일으켰다. 앤트로픽은 미토스를 "가장 강력한 모델"이자 성능 면에서 "단계적 도약(step change)"이라고 표현했다.
4월 7일, 앤트로픽은 미토스 프리뷰(Claude Mythos Preview)를 공식 발표하되, 일반 공개를 하지 않겠다는 전례 없는 결정을 내렸다. 그 이유는 미토스가 사이버보안 영역에서 보여준 능력이 기존 모델들과는 차원이 다른 수준이었기 때문이다. 앤트로픽 프론티어 레드팀 책임자 Logan Graham에 따르면, 미토스 프리뷰는 "극도로 자율적"이며 숙련된 보안 연구원에 필적하는 수준의 고도화된 추론 능력을 갖추고 있다. 실제로 이 모델은 수만 건의 취약점을 독자적으로 발견할 수 있으며, 주요 운영체제와 웹 브라우저 전반에 걸쳐 수천 건의 고위험 취약점을 탐지했다. 그중에는 27년간 발견되지 않았던 결함도 포함되어 있었다.

영국 AI 안전연구소(AISI)의 독립 평가 결과는 이를 더욱 뒷받침한다. AISI에 따르면, 미토스 프리뷰는 전문가 수준의 CTF(Capture the Flag) 사이버보안 과제에서 73%의 성공률을 기록했다. 이는 불과 1년 전만 해도 어떤 AI 모델도 완수하지 못하던 수준의 과제였다. 2년 전에는 최고 모델조차 초급 수준의 사이버 과제도 거의 수행하지 못했음을 감안하면, AI 사이버 역량의 진보 속도가 얼마나 급격한지를 실감할 수 있다.
엔트로픽, '프로젝트 글래스윙' 출범
앤트로픽은 미토스의 파괴적 잠재력을 방어적 목적으로 전환하기 위해 프로젝트 글래스윙(Project Glasswing)'을 출범시켰다. 여기에는 AWS, Apple, Google, Microsoft, NVIDIA, JPMorgan Chase, Broadcom, Cisco, CrowdStrike, Linux Foundation, Palo Alto Networks 등 글로벌 테크·금융·보안 분야의 핵심 기업 12곳이 파트너로 참여하고 있다. 여기에 추가로 40개 이상의 핵심 소프트웨어 인프라 관련 조직에도 모니터링 접근 권한이 부여되었다.
앤트로픽은 이 프로젝트에 최대 1억 달러 규모의 사용 크레딧과 오픈소스 보안 기관(OpenSSF, Alpha-Omega, Apache Software Foundation 등)에 대한 400만 달러의 기부를 약속했다. 프로젝트 참여 기업들은 로컬 취약점 탐지, 바이너리 블랙박스 테스트, 엔드포인트 보안, 침투 테스트 등의 방어적 보안 업무에 미토스 프리뷰를 활용하게 된다.
Microsoft는 자사 벤치마크 CTI-REALM에서 미토스 프리뷰가 이전 모델 대비 뚜렷한 성능 향상을 보여주었다고 밝혔으며, 이 파트너십이 고객 보호를 위한 보안·개발 솔루션을 한 단계 강화할 것으로 기대한다고 평가했다. 한편, 앤트로픽은 미국 CISA(사이버보안 및 인프라 보안국)와 상무부를 비롯한 정부 기관에도 미토스의 잠재적 위험과 이점에 대해 별도로 브리핑한 것으로 알려졌다.
OpenAI의 즉각적 대응
미토스의 등장은 경쟁사들의 즉각적인 반응을 촉발했다. OpenAI는 4월 15일, 방어 목적에 특화된 GPT-5.4-Cyber 모델을 공개하며 기존의 TAC(Trusted Access for Cyber) 프로그램을 대폭 확대했다. OpenAI의 접근 방식은 앤트로픽과 대조적이다. 앤트로픽이 약 40개 조직에 한정한 제한적 접근을 유지하는 반면, OpenAI는 수천 명의 검증된 개인 및 팀에게 보다 광범위한 접근을 허용하는 전략을 택했다. 이 전략적 차이는 앤트로픽의 "안전 우선" 철학과 OpenAI의 "광범위한 보급 먼저" 철학 간의 근본적 노선 차이를 더욱 뚜렷이 보여준다.
OpenAI는 한발 더 나아가, 투자자 메모를 통해 앤트로픽이 "의미 있게 더 작은 규모의 곡선에서 운영되고 있다"고 직접 비판하며 컴퓨팅 인프라 면에서의 우위를 강조했다. OpenAI는 2030년까지 30GW 규모의 컴퓨팅을 확보할 계획인 반면, 앤트로픽은 2027년 말 기준 약 7~8GW 수준에 머물 것으로 전망했다. 그러나 앤트로픽 CEO 다리오 아모데이(Dario Amodei)는 자사가 소비자 대면 트렌드를 쫓기보다 엔터프라이즈 시장에 집중하는 전략을 취하고 있으며, 경쟁사들과 같은 "코드 레드" 식의 대응을 할 필요가 없다고 밝힌 바 있다. 양사는 현재 기업 가치 합산 1조 달러를 넘어서며, 각각 IPO를 추진하는 가운데 미토스를 둘러싼 사이버보안 AI 경쟁이 시장 포지셔닝의 핵심 변수로 부상하고 있다.
AI 사이버 무기화의 전환점
미국 외교협회(CFR)의 Gordon M. Goldstein은 미토스를 "AI와 글로벌 안보에 있어 변곡점"이라고 규정했다. 그에 따르면, 미토스는 앤트로픽 엔지니어들의 의도와 무관하게 자체적으로 공격적 사이버 역량을 발전시킨 최초의 AI 모델이다. 이러한 능력은 범용적인 추론과 소프트웨어 엔지니어링 역량의 향상에서 자연스럽게 파생된 것으로, 앤트로픽 역시 사이버 공격 전문 학습을 명시적으로 수행하지 않았다고 밝혔다. 또한 영국 앨런 튜링연구소 산하 CETaS(신기술·안보센터)는 이에 대해 핵심적인 질문을 제기한다.
프로젝트 글래스윙처럼 통제된 환경에서는 취약점 발견 역량을 모니터링할 수 있지만, 다른 프론티어 AI 연구소들이 유사한 역량에 도달하면 그 통제가 더 이상 유효하지 않게 된다는 점이다. 범용 AI의 추론 능력 향상이 사이버 공격 역량의 향상을 수반하는 구조적 특성상, 이는 개별 기업의 정책을 넘어 국제적 거버넌스 체계의 구축이 시급해지는 국면이다.
미토스 이후의 AI 사이버보안 생태계
- 단기(2026년 하반기): 앤트로픽은 미토스 프리뷰의 일반 공개 계획이 없다고 명시했지만, 궁극적 목표는 미토스급 모델을 안전하게 대규모로 배포하는 것이다. 이를 위해 4월 16일 공개된 Claude Opus 4.7에는 미토스 수준의 위험 없이 사이버보안 세이프가드를 테스트·개선할 수 있는 장치가 탑재되었다. 앤트로픽은 "금지되거나 고위험인 사이버보안 사용을 자동으로 탐지·차단하는 세이프가드"를 적용했다고 밝혔다.
- 중기(2027~2028년): 사이버보안 AI가 업계 표준 도구로 자리잡을 전망이다. 앤트로픽은 궁극적으로 민관 합동의 독립적 제3자 기구가 대규모 사이버보안 프로젝트의 표준을 설정하는 것이 이상적이라는 입장을 밝혔다. AI가 기존에 인간의 역량으로는 처리할 수 없었던 규모의 취약점 탐지를 가능하게 하면서, 공격과 방어 양측 모두에서 AI 도입이 가속화될 것으로 예상된다.
너무 강력한 AI 시대, 우리에게 남은 과제는?
앤트로픽의 매출은 2025년 연간 약 70억 달러에서 2026년 말 200~260억 달러로 급성장할 것으로 전망되며, 이는 엔터프라이즈 AI 채택의 폭발적 증가를 반영한다. 미토스는 단순한 기술적 성과를 넘어, AI 모델의 이중 용도(dual-use) 특성이 본격적으로 드러난 첫 사례로 역사에 기록될 가능성이 높다. 튜링상 수상자 요슈아 벤지오(Yoshua Bengio)가 2025년 말 경고한 "다가오는 AI 임계점"이 미토스를 통해 현실화되고 있는 것이다.
미토스의 등장은 AI 산업에 근본적인 질문을 던진다. 범용 AI의 능력 향상이 의도치 않게 사이버 공격 역량을 수반할 때, 그 책임은 누구에게 있으며 어떤 거버넌스가 필요한가? 현재로서는 정부가 아닌 AI 기업만이 이 위험을 통제할 수 있는 역량을 보유하고 있다는 점이 가장 우려스러운 대목이다.
프로젝트 글래스윙은 업계 협력의 중요한 시작점이지만, 이것만으로는 충분하지 않다. AI 사이버보안의 국제 규범 수립, 모델 평가의 표준화, 그리고 민간과 공공 영역을 아우르는 거버넌스 프레임워크의 구축이 시급한 과제로 남아 있다.
의견을 남겨주세요