안녕하세요. 은호입니다.
인공지능 산업의 작업 방식이 단순 추론에서 자율 에이전트로 이동하고 있습니다. 사용자의 한 번 요청 안에서 모델이 도구를 호출하고 자녀 에이전트를 만들어 다단계 작업을 이어가는 흐름이 운영 환경에 본격적으로 들어왔습니다. 같은 시기에 골드만, UBS, 그리고 대학·연구기관 공동 보고가 차례로 공개됐습니다.
골드만은 글로벌 토큰 처리량이 2030년까지 24배 늘어 월 12경 개 규모에 도달하고, 단가 하락과 처리량 증가가 함께 작용하는 구간이 2026년 상반기에 시작된다고 봤습니다. UBS는 같은 기간 서버 CPU 잠재 시장이 5배 가까이 확장되고, GPU 한 개당 함께 따라붙는 CPU 코어 수가 8~12개에서 80~120개로 늘어난다고 짚었습니다.
스탠퍼드·MIT CSAIL·카네기멜런·NVIDIA 공동 연구진은 운영 중인 자율 에이전트 847개를 점검해 91%가 도구 체인 공격에 노출돼 있고 94%가 기억 오염 위험을 안고 있다는 결과를 내놨습니다. 2025년 11월 공개된 오픈소스 에이전트 OpenClaw에서는 단일 데이터베이스 결함 하나로 77만 개의 에이전트가 동시에 공격 경로에 들어가는 사고가 보고됐습니다. 24배의 처리량 확대와 5배의 CPU 시장 팽창, 91%의 보안 노출률이 같은 시기에 한꺼번에 가시화되고 있습니다.