프로덕트

이제 손으로 메모하는 건 그만. 음성 자동생성 AI

혼잣말할 때 더 좋은 아이디어가 나오는 사람을 위한 안성맞춤 솔루션.

2024.05.24 | 조회 1.12K |
2
|

커피챗

UX 디자이너의 프로덕트 레터

안녕하세요. 디자이너 제나입니다. 
오늘의 커피챗에서 소개할 프로덕트는 음성인식 AI툴 'letterly'와 Voicenotes' 입니다.

프로덕트헌트에서 Letterly(https://www.producthunt.com/products/letterly-2)와
Voicenotes(https://www.producthunt.com/posts/voicenotes-2)는 모두 이번 상반기에 높은 주가를 달리고 있는 보이스를 기반으로 하고 있는 AI 툴입니다. 지금까지 강의를 녹음할 때, 인터뷰할 때 전부 받아 적고 있었나요? 음성을 받아적는 일이야말로 번거롭고 효율성이 낮은 작업입니다. 소름끼칠 정도로 음성을 명확하게 인식하고 녹화하는 동시에 텍스트로 내보내주는 프로덕트는 생산성을 상상 이상의 영역으로 끌어올려주고 있습니다. 저 역시 보통 음성인식 기록보다 손으로 직접 하는 타이핑에 익숙해져서 반신반의하면서 프로덕트를 사용해 봤습니다. 그러나 상상 이상으로 음성을 활용한 기록의 편리함을 깨닫고 새로운 세계에 눈을 뜨게 되었기에 오늘의 프로덕트를 소개해보려고 합니다.

 

해리포터에서 등장하는 기자가 애용하는 자동으로 기록해주는 속기 깃펜.
해리포터에서 등장하는 기자가 애용하는 자동으로 기록해주는 속기 깃펜.

혹시 해리포터를 유심히 본 사람이라면 알 수도 있습니다. 저는 당시 다양한 마법에 걸린 물건 중에서도 인터뷰 내용을 바쁘게 대신 받아 적어주는 펜이 유독 눈에 들어왔던 기억이 있습니다. 저런 물건이 있다면 굉장히 편리할 거라는 생각에 상당히 부러웠습니다. 그때는 마법의 펜같은 물건이 나올 거라 상상할 수 없었지만 현재에는 'letterly'와 'voicenotes' 같은 음성기록 AI는 완벽하게 속기 깃펜과 동일한 역할을 하고 있습니다. 이러한 프로덕트는 아서 클라크 경의 '충분히 발달한 기술은 마법과 구별할 수 없다'는 유명한 문구를 현실에서 실감할 수 있는 모먼트 아닐까요? 그럼 얼마나 AI가 정확하게 음성을 기록해주는지 오늘의 프로덕트를 비교 분석해보겠습니다.

 

코어기능 : 녹음와 동시에 생성되는 텍스트

우리가 개인적으로 기록하는데 녹화기능을 생각보다 잘 사용하지 않는 건 필요한 부분을 다시 훑어보기 어렵기 때문입니다. 텍스트로 정리되어 있는 글은 눈으로 빠르게 체크할 수 있는 장점이 있습니다.

그러나 음성기록의 장점은 생생하게 모든 디테일을 포함해서 기록이 가능하며, '작성'하는 행위 자체가 배제되어 오직 아무것도 인식하지 않고 '생각'에 집중할 수 있습니다. 자연스럽게 혼잣말을 중얼거릴 때 종종 가장 좋은 아이디어가 떠오르는 것도 이러한 이유 때문입니다. 그러나 받아적지 않으면 아이디어는 무용지물이 되기 때문에 급하게 '작성'이라는 행위를 하게 됩니다. 그리고 글쓰기에 집중하는 순간, 섬광처럼 찾아온 좋은 생각이 사라지곤 합니다. 보이스 생성 AI는 이런 문제점을 해결하고 있습니다.

 

첫 번째 프로덕트 'Letterly'의 화면입니다. 일기장 혹은 메모장의 구조를 전체적으로 가져갔습니다. 그렇기 때문에 사용자에게 보다 캐주얼하게 접근합니다. 

Letterly : 가벼운 아이디어를 기록하는데 집중시켜주는 프로덕트

모바일 기반 서비스

'letterly'는 들어가자마자 바로 중앙의 버튼을 눌러 녹음을 하면 되는데, 굉장히 정확하게 목소리를 인식하고 동일하게 받아 적습니다. 사용자의 발음이 다소 어색하거나 주변에서 꽤 시끄러운 소음이 들려도 명확하게 목소리를 알아 들었습니다. 그리고 굉장히 일상적인 말투인 구어체로 녹음을 진행해도 정확하게 받아 적었습니다. 

프로 기능을 사용하지 않으면 2분정도 녹음이 됩니다. 프로로 업그레이드를 할 경우 최대 15분까지 녹음을 사용할 수 있습니다.  

텍스트가 생성된 후에 가장 중요한 버튼은 중앙에 배치 되어 있는 'rewrite' 기능인데 내 목소리를 바탕으로 다양한 포멧으로 글을 다듬어 줍니다. 밑에서 자세히 보도록 해요.

 

15가지의 형식으로 녹음 텍스트를 다듬어 주는 기능, 'Rewrite'.

'magic' 외의 기능은 PRO를 구매하면 활성화 된다.
'magic' 외의 기능은 PRO를 구매하면 활성화 된다.

메모 작성 후에 나타나는 가장 중요한 'rewrite'버튼을 누르면 약 15가지 종류의 포멧으로 생성할 수 있습니다. 'magic'이 기본적으로 제공되는 옵션이고 나머지는 내용을 다양한 방식으로 요약해주거나 SNS의 형식에 맞춰서 바꿔주기도 합니다.

생성옵션 Magic, Slightly, Significantly, Structured
생성옵션 Magic, Slightly, Significantly, Structured

각각 얼마나 글의 포멧을 잘 바꿔주는지 예시를 보여드리기 위해서 같은 내용의 글을 여러가지 포멧으로 변경했습니다. 'Magic'을 누르니 잘못된 문법이나 매끄럽지 못한 표현을 제대로 바꿔줍니다. 알아서 문단도 나눠주고 내용의 핵심도 정확히 파악하고 있습니다.

Slightly, Significantly, Structured 에 따라서 문장의 말투와 중요하게 강조하는 형식이 달라집니다. Structured는 구조에 집중하고 있기 때문에 다른 옵션이 비해 불릿 포인트를 달고 있고 보다 구조화된 문장으로 리스트업을 했습니다.

생성된 메모지를 클릭하면 자동생성된 글을 편집할 수 있습니다.

생성옵션 2X Shorter, Meeting Takeaways, Casual Email, Formal Email
생성옵션 2X Shorter, Meeting Takeaways, Casual Email, Formal Email

미팅노트로 변경 요청을 하면 문장의 말투가 상대방을 이해시키기 쉽도록 교정이 되는 모습을 볼 수 있습니다.

그리고 일상적인 이메일과 형식적인 이메일을 비교해봤을 때, 사용하는 단어와 형식이 확실히 목적에 맞게 나눠져있어서 실제에 적용하기에 유용했습니다.

생성옵션 Xpost, Facebook Post, List, Likedin Post
생성옵션 Xpost, Facebook Post, List, Likedin Post

개인적으로 뉴스레터도 쓰고, 숏폼 SNS 계정까지 운영하고 계신 분이라면 적극적으로 사용해볼 가치가 더욱 있다고 느껴졌습니다. SNS에 알맞는 내용으로 변경하기 위해 투자하는 시간을 전폭적으로 줄일 수 있을 것 같습니다. 페이스북이나 링크드인에 걸맞는 길이로 동일한 내용의 글을 이모지까지 곁들여서 빠르게 자동생성 됐습니다.

그러나 'letterly'의 아쉬운 점이라면 영어로 작성된 문장에서 올바른 언어로 요약이 생성되지 않는 옵션이 있었습니다. 아직 오류인 부분인 것 같은데 이 부분은 개선이 되어 더 높은 품질의 답변을 생성할 수 있으면 좋겠습니다.

 

다른 나라 언어도 완벽 인식가능

마지막으로 다른 나라의 언어도 잘 인식하고 받아 적는지 궁금해 '한국어'로 음성녹음을 시도하고 요약을 요청했습니다.

놀랍게도 완전히 명확하게 한글을 인식해서 적었고, 관련 목차를 만들고 공유를 하는 것까지 전혀 문제가 없었습니다. 심지어 영어 텍스트에서 발생하는 오류였던 몇 가지 옵션들이 한국어 버전에서는 잘 적용이 되어 포멧을 생성하는 것을 확인했습니다.

굉장히 단순한 구조와 다양하게 제공되는 텍스트 정리 옵션을 활용해서 어디서든 이동하며 편리하게 녹음과 기록을 할 수 있다는 점이 가장 큰 해당서비스의 큰 장점입니다.

7일간 무료로 체험이 가능하고 그 후엔 연간 비용이 발생합니다. 온보딩 과정에서 어떤 목적으로 주로 프로덕트를 사용할지 묻고 있기 때문에 필요에 따라서 고르면 제안해주는 포멧이 조금씩 영향이 있는 것 같습니다.

 

+그러나 이런 점이 아쉬워요...!

PRO로 업그레이드를 해도 무제한으로 길게 메모를 작성할 수 없다는 점이 아쉽습니다. 15분마다 새롭게 다시 녹음을 시작해야 하는 경우에는 매번 그때마다 다시 '인식'의 과정이 동반되기 때문에 긴 강연을 기록하고 싶은 경우 장시간 인터뷰어와 만남을 기록하는 경우에는 다소 불리하다고 생각합니다. 그리고 서치 기능이 제대로 없어서 내가 작성한 기록이 늘어나면 찾기 어려울 것 같습니다.

그러나 어디든 휴대하고 다니면서 음성을 받아적은 텍스트를 보조해주는 다양한 툴들이 굉장히 직관적입니다. 그리고 길고 짧은 다양한 글에 정확하게 받아 적은 녹음본을 녹여내고 싶다면 'Letterly'가 적격입니다. 인공지능은 이제 명확하게 알아듣고, 정확하게 원하는 바를 대신 수행하는데 문제가 전혀 없습니다.

 

Voicenotes : 길고 포멀한 글에도 적합한 음성기록 프로덕트

PC, IOS, Android 기반 서비스

다음으로 소개할 제품인 'Voicenotes'를 웹에서 사용했습니다. 뿐만 아니라 PC, 안드로이드와 ios 환경 등 다양한 환경에서도 사용이 가능해서 오직 모바일에서만 가능한 'letterly'와 큰 차이를 갖고 있습니다. 첫 화면을 보면 마찬가지로 녹화버튼이 보이고 새롭게 메모를 생성할 수 있는데 구성이 하나의 메모로 관리되는 'letterly'와 달리 타임라인 형식으로 기록됩니다. 조금 더 기존의 언어모델들인 대화형 AI와 비슷한 인상을 줍니다.

그리고 이 프로덕트의 장점은 바로 무료체험 이후에 결제를 해야만 사용가능한 letterly'와 달리 무료로 1분 길이의 보이스 노트를 만들 수 있습니다. 그러나 제가 녹화를 해봤을 때 1분은 상당히 짧은 시간이었습니다. 무료체험일 때도 더 길게 녹화가 되는 'letterly'와 비교해보고 사용해보면 좋을 것 같습니다.

'Voicenotes'는 구독을 하게 되면 길이에 상관없이 무제한으로 긴 노트를 생성할 수 있다는 장점이 있습니다. 월결제는 'letterly'보다 비싼 가격이지만 평생 소장가격은 비교적 저렴한 편입니다.

 

보이스 자동생성 후 텍스트 다듬기 기능

보이스를 텍스트화 해주는 가장 코어기능 역시 동일하게 손색이 없습니다. 이 프로덕트의 차별점은 좌측 상단에 '플레이' 버튼이 있어서 클릭하면 기록했던 음성을 직접 들을 수 있습니다. 텍스트만 생성되는 것 외에도 음성 기록을 동시에 가지고 있을 수 있어서 좋은 기능이라고 생각합니다. 그러나 확실히 음성자체는 꽤 비효율적인 방식의 기록이기 때문에 자주 재생기능을 사용할지 않을 것으로 예상됩니다.

개인적으로 제 목소리를 들을 때 꽤 괴롭기는 했지만 영어 말하기 공부를 할 때 상당히 유용하게 활용될 수 있을 것 같습니다. 자동으로 텍스트를 정리해주면서 문법 정리도 해주기 때문에 제대로 말했는지 원어민 선생님이 없어도 체크를 할 수 있는 점이 유용합니다.

우측 끝에는 주요한 기능이 3가지 있는데 우선 자동생성된 텍스트를 수정할 수 있습니다. 해시태그를 달아서 메모장을 종류별대로 분류할 수 있고 최상단에는 검색창이 배치되어 있어서 이전 기록을 탐색할 수도 있습니다. 부수적인 분류기능이 중요하다면 'Voicenotes'가 적합합니다.

포멧에 따라서 생성되는 노트
포멧에 따라서 생성되는 노트

나머지 버튼이 텍스트를 다듬어주는 버튼입니다. 기존 제공되는 포멧의 종류가 6가지로 이 부분은 'letterly'에 비해 적어서 다소 아쉬웠습니다. 그리고 포인트로 요약하기, 트위터 작성하기, 이메일 등의 옵션은 잘 적용이 됐지만 가장 긴 문장구성력이 필요한 블로그 작성은 생성이 상당히 오래 걸리고 어떤 경우엔 생성자체가 되지 않았습니다.

아마 생성이 안되는 경우는 블로그 글을 작성하기에 충분한 내용을 담지 않으면 불가한 것 같습니다. 보다 양질의 내용을 녹음하니 구어체 형태로 블로그 글을 새롭게 창조해줬습니다. 훌륭하지 않은 말투로 녹음본을 만들어도 꽤 읽기 편한 장문의 글을 생성했습니다.

그리고 적은 옵션만 제공되는 부분을 대체할 수 있도록 대신 텍스트 지문의 방향성을 직접 커스터마이징하는 기능이 있습니다. 값을 입력하자 텍스트가 내용에 맞게 적용되어 생성 됐지만 제공되는 디폴트 값에 비해 문장의 구성은 사용하려면 많이 다듬어야 하는 편입니다. 형식의 제한없이 이용할 수 있다는 장점이 있지만 잘 사용하려면 난이도가 있는 편입니다.

 

얘도 다른 나라 언어도 완벽 인식가능...!

한국어로 실험했을 때 마찬가지로 완벽하게 인식했습니다. 그러나 텍스트 다듬기 기능은 좀 미흡했습니다. To-do list로 바꿔달라고 요청했는데 자동으로 영어로 번역되서 작성이 됐습니다.

그리고 AI 챗봇 기능이 있어서 여러가지 일정관리와 내 메모에 대한 검색이 용이합니다.

'Voicenotes'의 두드러지는 특징으로는 각 타임라인을 스크롤해서 볼 수 있었습니다. 

 

성향에 따른 선택이 필요한 음성기록 서비스

확실히 메모장처럼 생긴 'letterly'는 보다 캐주얼하게 쓰일 수 있는 반면, 좀 더 학문적이고 디테일한 느낌이 있습니다. 소셜미디어를 많이 사용하는 유저라면 개인적으로 'letterly'가 유용하게 사용될 것 같습니다. 비슷한 주제로 SNS에 특화된 포멧을 클릭 한번에 만들어주고, 말하고자 했던 의도를 정확히 담고 있는 것과 동시에 문장까지 구어체로 다듬어 주기 때문에 굉장히 효율성을 올려주는 프로덕트라고 생각합니다. 반면 강의를 기록하거나 긴 내용을 다듬고, 학문적인 공부에 유리한 쪽은 'voicenotes'입니다. 쉽게 탐색과 분류를 할 수 있다는 점과 Chat Gpt와 연동해서 쓸 수 있다는 장점도 훨씬 프로덕트의 볼륨이 큰 편입니다.

전반적으로 놀라울 정도로 음성을 텍스트로 생성하는 기술력이 뛰어납니다. 아직 텍스트 다듬는 기능은 조금 더 여러가지 개선이 필요하다고 생각되지만 저는 기존의 익숙하게 해왔던 수기로 기록하는 버릇을 조금은 개선해보려고 합니다.

 

개인적인 생각

시간과 장소의 한계성을 뛰어넘도록 돕는 기능

제가 이전에 인터뷰를 진행했던 대표님은 항상 차로 이동 중에 많은 일처리를 하셨습니다. 그 때 많이 애용하던 방식의 기록이 녹음이라고 했습니다. 손과 몸으로 다른 일을 해야하니 그 시간을 아껴서 음성으로 기록을 해 시간효율을 올린다는 점이 상당히 인상 깊었습니다. 문득 이번 프로덕트를 분석하니 제가 그 대표님을 다시 만나게 된다면 이 서비스를 추천 해드리고 싶습니다. 기록하신 음성을 다시 들으려면 꽤나 비효율적인 부분도 발생 했을텐데 녹음과 동시에 텍스트도 보관된다면 나중에 한번에 확인해도 유용하지 않을까 하는 생각이 들었습니다.

저는 이 프로덕트가 바쁘신 모든 사용자를 위한 해결책이 되지 않을까 합니다. 점차 생산 속도가 빨라지면서 개인이 처리할 수 있는 일들은 극도로 증가했고 모두가 효율성을 중요시 합니다. 자동차에서 이동하거나 거리를 걷고 있을 때조차 생산성을 올리고 싶다면 이런 프로덕트가 유용하게 사용될 수 있을 거라고 생각합니다.

어떻게 생각하시나요? Letterly와 Voicenotes를 앞으로 기록하는 매개체로 자주 사용할 것 같나요?

저의 글이 오늘의 커피타임에 도움이 되었길 바랍니다. ☕️🙇‍♂️

 

Threads 를 만들었습니다! 여기에서는 뉴스레터에 소개하기엔 애매하고 분량이 짧지만 다양하고 재미있는 프로덕트를 더 자주 캐주얼하게 소개해볼까 합니다.

궁금하신 분들은 찾아와주세요.

@coffechat__

 

 

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

커피챗 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글 2개

의견을 남겨주세요

확인
  • 플로우

    1
    6 months 전

    타이핑이나 클릭, 터치, 스와이프가 아니라 음성과 행동으로 pc/모바일과 상호작용하게 된다는 것은 모든 산업과 서비스에 있어 큰 변화를 가져오게 될 지점이라 생각합니다! 더이상 컴퓨터에 사람을 맞추지 않아도 되니까요. 사람이 정보를 표출하고 수용하는데 가장 즉각적이고 효율적인 말하기와 읽기에 기술이 맞춰주는 시대가 온 듯합니다. 그럴수록 역설적으로 여타의 능력치보다 본신의 역량이 더욱 주목받는 시대가 오지 않을까싶네요!

    ㄴ 답글 (1)
© 2024 커피챗

UX 디자이너의 프로덕트 레터

자주 묻는 질문 서비스 소개서 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관