요즘 제일 핫한 IT 트렌드, 놓치고 싶지 않다면?
화요일마다 주목해야 할 트렌드 소식을 전달해 드립니다!
지난주, 생성형 AI 업계에서 눈에 띄는 업데이트가 하나 있었습니다. 챗GPT의 라이벌로 알려진 클로드(Claude)가 음성 모드를 새롭게 추가했다는 소식인데요.
생성형 AI가 이제 텍스트는 물론, 음성까지도 이해할 수 있다니! 꽤 놀라운 변화 같지만, 사실 이런 흐름은 클로드만의 이야기가 아닙니다. 최근, OpenAI, 구글 등 주요 AI 기업들이 잇따라 음성 기능을 강화하고 있었거든요. 그래서 이번 주는 음성 모드를 추가한 생성형 AI들이 어떤 방식으로 차별화를 꾀하고 있는지, 그리고 실제로 이 기능이 얼마나 유용한지도 함께 살펴보려 합니다. 🧐
🗓️ 우리 클로드는 말도 하고, 요약도 해요
먼저, 가장 최근에 업데이트된 클로드(Claude)부터 살펴볼까요? 이번 업데이트를 통해 어떤 음성 모드 기능이 도입됐는지 간단히 소개해드릴게요.
우선, 클로드의 음성 모드 속에서는 Buttery, Airy, Mellow 등 총 5가지의 모드가 마련되어 있습니다. 각각 말투와 억양이 조금씩 달라, 자신의 취향에 맞는 목소리를 선택해 이용할 수 있어요.
또한, 새로운 음성 모드와 기존의 타이핑 모드를 병행해서 사용할 수 있는데요. 음성으로 대화하다가 갑자기 텍스트로 바꿔 입력해도 대화가 어색하지 않고 자연스럽게 이어집니다.
그리고 클로드가 말할 때 핵심 내용을 함께 화면으로 보여주는 기능이 정말 실용적입니다. 말로만 들으면 흘릴 수 있는 정보들을 시각적으로 같이 확인할 수 있어서 훨씬 명확하게 전달돼요.
무엇보다 대화가 끝나면 전체 내용을 요약해서 다시 확인할 수 있고, 유료 이용자라면 구글 캘린더나 지메일 같은 외부 서비스와도 연결해 음성으로 활용할 수 있어요. 클로드는 이번 업데이트를 통해 단순히 음성 기능을 넣은 게 아니라, 실제로 일상적인 상황에서 더욱 유용하게 쓸 수 있도록 세심하게 설계된 인상이 듭니다.
요즘 유튜브에서 화제인 ‘내 안의 보석’, 보신 적 있으신가요? 배우 김지석이 직접 ‘프라이데이’라는 이름을 붙인 AI와 함께 쇼핑도 하고, 사진도 찍으면서 친구처럼 하루를 보내는 콘텐츠인데요. 영상 속에서 두 사람(?)의 대화가 너무 자연스러워서, 댓글에는 “AI가 벌써 이 정도야?”, “실제 친구보다 더 편해 보여” 같은 반응이 쏟아지고 있습니다.
이 영상에 등장한 AI가 바로, 챗GPT의 음성 모드였다고 하는데요. 말도 척척 알아듣고, 자연스럽게 대답해주니, 왜 다들 놀라는지 알 것 같더라고요. 챗GPT의 음성 모드에는 어떤 색다른 기능이 있는지 함께 살펴보시죠!
🗣️ 휴대폰을 안봐도 음성 모드를 사용할 수 있다고?
그동안 오픈AI의 챗GPT는 고급 음성 모드를 유료 기능으로만 제공해왔는데요. 최근에는 이 기능을 무료 사용자들에게도 개방했습니다.
챗GPT의 음성 모드는 말로 자연스럽게 대화할 수 있는 것은 물론, 굳이 휴대폰을 들지 않아도 질문하고 대답을 들을 수 있다는 것이 가장 큰 차별점입니다. 앞서 소개한 유튜브 영상에서도 마치 통화하듯, 화면을 보지 않고도 자연스럽게 대화를 이어가는 모습이 인상적이었죠. 또한, 휴대폰 카메라로 사물을 비추면 챗GPT가 그게 무엇인지 설명을 해주는 기능도 있답니다.
여전히 사용량 제한은 있지만, 유료 요금제의 경우 하루 이용 횟수가 5배 이상 늘었고, 월 200달러짜리 상위 요금제에선 사실상 무제한으로 이용할 수 있습니다.
오픈AI 덕분에 음성 기반 AI도 이제는 특별한 기술이라기보다는, 점점 더 일상적인 도구로 자리잡고 있는 것 같아요.
🚘 제미나이 라이브, 자동차까지 탑승 준비 완료
구글의 제미나이도 질 수 없겠죠? 최근 구글은 음성 기반 기능인 ‘제미나이 라이브(Gemini Live)’를 모든 안드로이드 사용자에게 개방했습니다. 이제 앱이나 오버레이 화면에서 마이크 버튼만 톡 눌러주면, 음성으로 질문하고 바로 대답을 들을 수 있어요.
제미나이 음성 모드 특징 중 하나는, 대화 중간에 AI의 답변을 끊거나 다시 이어갈 수 있다는 것이에요. 또한 제미나이 역시 여러 목소리 중에서 마음에 드는 스타일을 고를 수 있고, 대화 흐름도 사용자가 원하는 대로 조절할 수 있어 꽤 유연하게 쓸 수 있습니다. 현재는 영어만 지원되지만, 다른 언어와 iOS 지원도 준비 중이라고 해요.
그리고 가장 흥미로운 소식! 구글은 앞으로 제미나이를 차량에서도 사용할 수 있도록 준비 중인데요. 음악을 틀거나 문자 보내는 건 물론, 연락처에 맞춰 자동 번역된 메시지를 보내거나, 주변 맛집까지 찾아주는 기능도 가능해진다고 합니다. 제미나이 음성 모드와 함께라면 운전 중 혼자라도 심심할 틈이 없을지도 모르겠네요.
⭐️ Editor’s point
최근 생성형 AI들이 너나 할 것 없이 음성 모드를 도입하고, 업데이트하는 데 열중하고 있어요. 사람들에게 가장 익숙한 소통 방식인 ‘말’을 이용해, 더 편하게 대화하고 AI와의 거리감을 줄여보려는 움직임이죠. 이때 흥미로운 건, 같은 음성 모드라도 서비스마다 개성이 전혀 다르다는 거예요.
오늘 함께 살펴본 클로드는 말하면서도 핵심 내용을 화면에 정리해주고, 챗GPT는 카메라로 본 걸 이해해 설명해주고, 제미나이는 이젠 차 안에서도 음성 기능을 도입하고자 합니다.
앞으로도 더 많은 AI들이 자신들만의 목소리를 갖게 될 것 같은데요! 여러분은 어떤 AI의 음성 모드가 가장 마음에 드셨나요? 그럼 다음 주에는 더 재미있는 IT 소식으로 만나요! 😉
의견을 남겨주세요