Divided by Zero에 오신 걸 환영합니다. IT테크, 스타트업 그리고 자본시장에 대한 2차적 사고를 공유합니다.
오픈AI의 전 CTO 미라 무라티(Mira Murati)가 만든 씽킹머신랩(Thinking Machines Lab, TML)이 드디어 뭘 만들고 있었는지 보여줬습니다. 처음 회사를 세웠을 때 "도대체 뭘 하려는 건지 모르겠다"는 반응이 많았는데, 지난주에 나온 결과물을 보면 이건 챗봇의 다음 세대가 아니라 컴퓨터와 대화하는 방식 자체를 바꾸려는 시도를 하고 있습니다.

지금까지 모든 AI 모델은 차례를 기다립니다. 내가 질문을 끝내면 AI가 생각하고, AI가 답을 끝내면 내가 다시 말하는 구조죠. 아무리 빠른 GPT-Realtime이나 제미나이 라이브도 이 턴제 구조 위에 빠른 응답을 얹은 것이지, 구조 자체를 바꾼 건 아닙니다.
씽킹머신랩의 인터랙션 모델은 다릅니다. 200밀리초(0.2초)마다 심장이 뛰듯이 입력을 받고 출력을 내보냅니다. 쉬지 않고요. 사용자가 말하는 동안에도 AI가 듣고 있고, AI가 말하는 동안에도 사용자의 소리와 화면과 웹캠을 계속 처리합니다. 이걸 전이중 통신(full-duplex)이라고 하는데, 전화 통화가 이 방식이죠. 내가 말하면서 동시에 상대방 소리도 들립니다. 기존 AI는 무전기(한쪽이 끝나야 다른 쪽이 시작)였는데, 이건 전화입니다.
의견을 남겨주세요