Jan 24, 2026
vol. 001

[■ 위클리 픽 ■]
① 생일은 거짓말해도 말투는 못 속여
ChatGPT가 사용자의 채팅 데이터를 분석해 나이를 추측하는 시스템을 도입했습니다.
② 프롬프트 멈춰! 클릭으로 빚는 AI 인플루언서
힉스필드가 복잡한 명령어 없이 게임하듯 캐릭터를 만드는 스튜디오 기능을 공개했습니다.
③ 맥북의 재발견, 인터넷 없이 그리는 AI 그림
올라마(Ollama)가 맥OS 환경에서 무료로 이미지를 생성하는 로컬 기능을 지원합니다.
구독자님, 안녕하세요. AI 트렌드 뉴스레터 피치 프롬프트 입니다.
한 주에 있었던 AI 소식 중에서 꼭 알아야 할 3가지만 먼저 모아봤어요.
복잡한 내용은 최대한 빼고, 쉽게 이해되도록 정리해드릴게요.
[■ 이슈 포커스 ■]

음성 AI, 이제 말귀를 알아듣기 시작하다
OpenAI, 듣고·번역하고·받아쓰는 음성 모델 3종 공개
Edit. VQZ
◆What (무슨 일?)
OpenAI가 2026년 5월 7일, 실시간 음성 모델 3종을 공개했습니다. 대화하는 GPT-Realtime-2, 실시간 통역하는 GPT-Realtime-Translate, 말하는 동시에 받아쓰는 GPT-Realtime-Whisper입니다. 이번 업데이트의 핵심은 음성 AI에 처음으로 GPT-5급 추론 능력을 얹었다는 점입니다.
■How (어떻게?)
기존 음성 AI가 "질문 → 대답"의 단순 구조였다면, GPT-Realtime-2는 말 중간에 여러 작업을 동시에 처리할 수 있습니다. 미국 부동산 플랫폼 Zillow는 이 모델 도입 후 통화 성공률이 26포인트 향상됐습니다(95% vs 69%). 번역 모델은 70개 언어로 말을 받아 13개 언어로 실시간 통역하고, 전사 모델은 회의나 상담 중에 바로 텍스트로 기록합니다.
▲Why (왜 지금?)
같은 날 Google은 Gemini 음성 기능을 확장했고, Anthropic도 Claude 음성 베타를 기업에 개방했습니다. 세 회사가 같은 날 음성 업데이트를 내놓은 건 우연이 아닙니다. 텍스트 AI 경쟁이 음성으로 무대를 옮기고 있습니다.
🗣️ 에디터의 킥 (Editor's Kick)
음성 AI 자체는 새로운 기술이 아닙니다. 이번이 다른 건 '추론'이 붙었다는 거죠. 다만 공개된 활용 사례가 대부분 기업 고객 중심이라는 점은 짚어둘 필요가 있습니다. 일반 사용자가 체감할 수 있는 경험이 되기까지는 아직 시간이 필요해 보입니다.

프롬프트는 그만! 클릭으로 빚는 나만의 AI 인플루언서
게임 커마하듯 만드는 힉스필드 스튜디오, 24시간 릴스 공장 가동
Edit. VQZ
◆What (무슨 일?)
영상 생성 AI '힉스필드(Higgsfield)'가 일을 냈습니다. 복잡한 프롬프트(명령어) 입력 없이, 마우스 클릭만으로 가상 인플루언서를 만드는 'AI 인플루언서 스튜디오'를 공개했거든요.
■How (어떻게?)
RPG 게임 캐릭터 만들 때 커마 해보셨죠? 딱 그 방식입니다. 성별, 나이, 인종은 기본이고 눈동자 색, 주근깨, 흉터까지 슬라이더로 조절합니다. 심지어 인간을 넘어 요정이나 외계인 같은 '혼종' 캐릭터도 가능합니다. 다 만든 캐릭터는 4K 화질로 뽑혀서 바로 틱톡이나 릴스 영상에 투입할 수 있죠.
▲Why (왜 지금?)
가장 큰 장점은 '일관성(Consistency)'입니다. 기존 AI 모델은 영상마다 얼굴이 미세하게 변해서 인플루언서로 키우기 어려웠는데, 이건 완벽하게 고정된 캐릭터가 나옵니다. 지금이 바로 선점할 타이밍이죠.
🗣️ 에디터의 킥 (Editor's Kick)
얼굴 공개가 부담스러워서 숏폼 도전 못 하셨던 분들, 이제 핑계가 사라졌습니다. 방구석에서 '심즈' 하듯 매력적인 부캐 하나 깎아서 데뷔시키세요. 국내에서도 '로지'(@rozy.gram) 같은 버추얼 인플루언서가 인기인데, 잘 만든 캐릭터 하나가 열 직장인 안 부러운 수익을 가져다줄지도 모릅니다. (일단 저부터 제2의 자아 만들러 갑니다 🏃)

맥북에선 이제 미드저니 무료? Ollama 이미지 생성 시작
인터넷 없이, 구독료 0원. 터미널 한 줄로 뽑는 무제한 로컬 그림
Edit. VQZ
◆What (무슨 일?)
로컬 LLM의 절대강자 'Ollama(올라마)'가 드디어 이미지 생성(Image Generation)을 공식 지원하기 시작했습니다. 그것도 macOS를 가장 먼저, 독점적으로 지원합니다. 이제 인터넷 연결 없이, 비싼 구독료 없이, 내 맥북의 GPU만으로 고퀄리티 이미지를 뽑아낼 수 있게 된 것이죠.
■How (어떻게?)
복잡한 설치 과정? 없습니다. 터미널 창을 열고 명령어 한 줄만 치면 끝입니다. 알리바바의 초고속 모델 z-image-turbo나 블랙 포레스트 랩스의 flux-2-klein을 다운로드해 바로 실행할 수 있죠. 텍스트 생성하듯 프롬프트를 입력하면, 내 맥북이 '윙~' 소리를 내며 이미지를 뱉어냅니다.
▲Why (왜 지금?)
매달 나가는 미드저니, ChatGPT 구독료가 부담스러워지는 시점입니다. 이 기능은 100% 무료이자 완전한 프라이버시를 보장합니다. 특히 보안이 생명인 기업 프로젝트나, 인터넷이 불안정한 곳에서 일하는 디지털 노마드에게는 대체 불가능한 도구죠. 비싼 돈 주고 산 M1, M2, M3 칩의 성능을 본전 뽑을 기회가 바로 지금입니다.
🗣️ 에디터의 킥 (Editor's Kick)
솔직히 아직 미드저니만큼 예술적이진 않지만, 스토리보드 짜거나 아이디어 스케치용으로는 차고 넘칩니다. 매달 3만 원씩 내던 '월세' 생활 청산하실 분? 지금 바로 터미널 켜고 ollama run을 입력해보세요.
의견을 남겨주세요