안녕하세요 구독자님! 주간 실리콘밸리는 경제, 테크, 스타트업, 부동산, 재정적 자유, 비지니스에 관한 정보들을 함께 토론하면서 제가 배워가는 목적으로 평생 무료로 운영되고 있습니다. 그 과정에서 여러분들도 함께 배워나가시면 더 좋을 것 같습니다.
본 커뮤니티의 모든 내용은 대중에게 공개된 정보를 기반으로한 개인적인 의견이며 투자에 대한 조언이 아닌 전반적인 미국의 시장, VC, 스타트업, 기술 트렌드와 그에 대한 개인적인 의견들입니다.
카카오 오픈채팅방 링크모음 (VC, 스타트업, 투자, 실버산업)
이번 주에 저는 유튜브에서 개최하는 컨텐츠 크리에이터 이벤트인 Vidcon에 들를겸 LA에 와있습니다. 감사하게도 더밀크 손재권 대표님과 한국 컨텐츠 진흥원에서 초대를 해주셔서 너무 재미있고 많이 배우는 시간을 보냈습니다. 관련해서는 하고 싶은 이야기가 많아서 잘 정리해서 곧 따로 뉴스레터로 보내드리도록 하겠습니다!
제가 7월 30일에 Andrew Ng교수님과 프라이머사제 인공지능 데이를 주최하려고 잠깐 한국에 들릴 예정인데 또 좋은 아래와 같은 네트워킹 기회가 있어서 참여하게 되었습니다.
아무래도 저는 더 많은 한국계 창업자분들이 미국으로 성공적으로 진출할 수 있는 가능성이 점점 높아지는 시대에 살고있다고 생각하고 프라이머사제에서의 투자여부를 떠나서 제가 미국 VC 생태계에서 일한 경험이 창업자분들께 도움이 될 수있다고 믿고 있습니다.
관심있으신 분들은 아래 링크로 참가 신청해주시고 직접 뵙고 인사드릴수있는 기회가 있었으면 좋겠습니다.
주간 실리콘밸리 마피아 신청이 원래는 지난 주말 마감인데 제가 요즘 뉴스레터가 뜸했다보니 혹시 아직 못보신분들이 있으실까해서 (그리고 저도 독립기념이 연휴라!) 이번주말까지만 받도록 하겠습니다.신청해주신 분들께 다시 한번 감사드리며 우선 1주일 더 신청을 받는 동시에 이번주부터 제가 개별적으로 줌콜을 요청드리도록 하겠습니다 (7월 7일 마감)
과분하게도 너무 뛰어난 분들이 많이 신청해주셨는데 다 모시지못해 죄송한 마음이 많습니다. 각 분야마다 전문가를 한 분씩 모시는게 목표이다보니 특정 분야(e.g. 의사, 인공지능)에 지원자가 몰리셔서 죄송하고 아쉽습니다. 그리고 시차를 고려해서 한국에 계신 분들 위주으로 1기를 모집하려고하고 앞으로 미국+유럽도 곧 기획하도록 하겠습니다.
GPT-4o의 벤치마크를 뛰어넘은 Claude 3.5 Sonnet!
카톡방에 출시된 날 전해드렸듯이 Anthrophic의 Claude가 3.5 Sonnet을 출시하였습니다.
재미있는 부분은 그들의 최고 모델이 아닌 중간 사이즈의 모델을 발전시키면서 더 빠르고 더 저렴하면서도 GPT-4o의 벤치마크를 뛰어넘었다는 부분입니다.
물론 GPT-4 Turbo와는 비교하지 않은걸 보면 GPT보다 성능이 못하기 때문이다라는 반응도 많은데 저도 동감하면서도 동시에 가장 크고 좋지만 비싼 Opus모델이 아니라 중간 사이즈의 Sonnet과의 대결이라는 점을 생각하면 충분히 의미있는 결과가 아닐까 합니다.
그런데 기술이 그렇게 의미가 있나요?
동시에 많이 나온 반응이 "요즘 벤치마크 믿을수없다, cherry picking한다"라는 말씀도 많이하시는데 저도 동감합니다. 그리고 한발 더 나아가 과연 이 benchmark에서의 improvement가 유의미한가에 대한 질문도 있습니다.
계속해서 새로운 모델은 나오고 있고 이번에 Sonnet이 앞서나간다고 해도 그럼 GPT-5가 나올거고 그러고나면 Llama 4가 나오면서 계속 업치락 뒤치락할텐데 정작 그 성능의 발전에 (1) 일반 유저들에게 얼마나 의미가 있으며, (2) 벤치마크상 1%의 성능이 기술적으로 얼마나 유의미한 발전일까, (3) 성능 발전이 어느정도 수렴해가고 있는게 아닌가 라는 생각을 아시다시피 꽤 오래전부터 말씀드려왔고 실제 실리콘밸리 현지에서도 비슷한 느낌을 받는 사람들이 많아지고 있는 것 같습니다.
결국 유저 경험이다?
그렇다면 정말 중요한건 무엇일까요? 이제는 정말 지겨우시겠지만 저는 결국 유저 경험이고 고객들에 대한 value add 라고 생각합니다. 위에 말씀드린 것처럼 벤치마크상의 발전이 지지부진해지는만큼 유저 경험에 대한 비교와 고민이 더 많아지고 있는 것으로 보입니다.
유저경험에 기반한 모델 비교
그러다보니 모델에 대한 비교도 사용자들의 경험에 기반하는 방법론이 인기를 끌고있는데 그 대표적인 예가 Chatbot arena입니다. 사용자가 동시에 익명의 두 챗봇에게 질문을 하고 그 결과값에 대한 선호도를 고르는 방식으로 이루어집니다.
재미있는건 전체성적으로 보았을때는 GPT-4o가 앞서나가고 있지만
여러번 주고받는 대화에서는 Claude가 근소하게 앞서나가는 것처럼 보이고
코딩부분에서도 조금이나마 앞서나가는 것처럼 보입니다.
한국어는 아무래도 데이터가 많은 구글이 앞서나가는 모양인것 같네요. 사실 이거보면서 결국은 데이터많은 구글이 일등이 되지않을까라는 생각도 잠깐 들었습니다 ㅎㅎㅎ 어쨋든 예전부터 주변에 GPT보다 Claude가 좋다라는 분들이 좀 있었는데 확실히 그런 면이 존재해 보이네요.
그래서 이번 Claude의 업그레이드에서 주목할건 사실...
그리고 이번 Claude를 웹상에서 써보시면 artifact라는 새로운 인터페이스가 추가되었습니다. 오른쪽에 따로 실행창이 떠서 요청한 작업을 코드나 텍스트뿐만아니라 실제로 구동되는 모습으로 보여주고 바로 수정가능한 인터페이스인데요, 모델의 성능에 대한 칭찬도 많지만 오히려 artifact에 대한 유저들의 반응이 더 뜨거워 보입니다. 개인적으로도 정말 좋은 방향성이라고 생각하고 성능보단 유저경험!이라는 부분을 잘 보여주는 업데이트라고 생각합니다.
사실 ChatGPT도 UX의 성공일뿐?
그런면에서 ChatGPT의 기술적인 면도 칭찬할만하지만 어쩌면 유저의 경험의 차이가 가장 큰 부분이 아니었을까 생각합니다.
ChatGPT가 나오기전 Jasper AI라는 마케팅 컨텐츠를 생성해주는 툴이 가장 관심을 끌던 회사였는데 실리콘밸리의 VC들이 너도나도 투자하고 데모를 보여주는 등 인공지능의 발전을 칭송하기 시작했었죠.
재미있는건 그 당시의 Jasper AI는 지금의 wrapper들과 같이 OpenAI의 GPT-3의 API위에 인터페이스를 씌운 툴이었고 OpenAI의 GPT-3는 OpenAI Playground를 통해서 사용할 수 있었던 시절입니다. 당시 유저들은 GPT-3를 playground를 통해 직접 쓰기보다 더 비싼 돈을 내고라도 Jasper AI를 썼었는데요, 그 이유는 바로 "쓰기 편리하기 때문"입니다.
이후 샘알트만이 ChatGPT라는 무료이자 일반 유저들이 쉽게 쓸수있는 인터페이스를 출시하면서 만족스러운 유저들의 경험을 제공하였고 이로 인해 Jasper와 같은 wrapper들이 갈 곳을 잃는 첫번째 숙청이 있었던거죠. 물론 모두가 다 망한건 아니고 Jasper를 포함한 많은 회사들은 지금도 열심히 다양하게 재기를 위해 노력하고 있다고 합니다.
아시다시피 GPT 모델들은 모두 transformer라는 구글의 논문에 기반한 구조인만큼 기술적으로도 어느정도 오픈되어있는 상황이었기때문에 저는 ChatGPT의 성공의 큰 부분이 뛰어난 UX덕분이라고 생각합니다. 만약 그들의 기술력이 가장 특별한 경쟁력있는 부분이었다면 지금 Anthrophic이나 Gemini가 이렇게 빠르게 따라올수가 없었어야겠죠.
혹시나 오해하실까봐 정리하자면 OpenAI를 깎아내리는게 아니라 많은 회사들이 접근할 수 있던 좋은 기술을 제대로 꿰어내면서 소비자들을 열광하게 한 첫 회사가 바로 OpenAI이고 그리고 최근 GPT-4o의 데모에서 보셨다시피 뛰어난 소비자 경험을 남들보다 빠르게 알아채고 행동하여 제공함으로써 업계 최고의 자리를 유지하고 있는 OpenAI가 저는 정말 대단하다고 생각합니다.
하지만 동시에 ChatGPT의 부상과 Claude의 맹추격을 보면서 어쩌면 최고의 인공지능 회사는 최고의 기술력을 가진 회사가 아닐수도 있다는 말을 하고 싶었습니다. 그게 어떤 회사냐구요? 아마 인공지능이든 뭐든 어쨋든 최고의 고객 경험과 고객 가치를 창출하는 회사라는 본질은 변하지 않는 것 아닐까요? 이런 회사들을 찾고 도와드리고 싶은 제가 대표님들을 ipark@primersazze.com 에서 언제나 기다리고 있습니다 ㅎㅎㅎ
이메일 보낼때는 논란이 될까봐 안쓴 말이 있는데 생각해보니 어차피 논란이 될만큼 구독자가 많는 것도 아닌데 괜히 몸사리네 싶어서 추가했습니다!
한국 기업들을 자주 만나면서 느끼는게 기술과 특허에 대한 집착이 있다고 느낍니다. 약간 한국의 선비문화같다는 생각도 듭니다.
“니가 뭐가 특별해서 특허도 없이 더 잘팔거라고 자신하냐?”의 “니가 뭔데?”가 경쟁이 심하고 다양성이 적은 한국에서는 더 중요할수도 있겠다 싶긴한데 동시에 성격, 커뮤니케이션, 브랜딩, 미션, 사고방식, 네트워크와 같이 무형적인 자산에 대한 가치평가가 박해서가 아닐까라는 생각이 듭니다. 반면 실리콘밸리에서는 오히려 무형적인 자산들이 더 중요한 사회라고 느끼구요.
일등기술로 갤럭시를 만드는것도 좋지만 일등기술없이 아이폰을 만드는것도 정말 좋다고 생각합니다.
평범한 여드름패치를 아마존에 팔던 Mighty Patch, Hero Cosmetics,는 특허도 없이 $630M에 exit하였습니다. (예전 회사에서 검토할때 한국인인 저는 쿠팡에 올라온 천개가 넘는 여드름패치들을 보고 투심에서 반대표를 던졌었죠)
결론은 고객이 만족하고 좋아하는 가치, 브랜드, 경험이 기술보다 더 중요할수있다는 걸 오늘 글을 통해 말씀드리고 싶었습니다!
사실 요즘 인공지능 버블이 꺼져가는 모습이 느껴져서 그 내용도 쓰려고 했는데 이제 짧게 짧게 자주 쓰기로 마음을 먹었기때문에 다음번으로 미루도록 하겠습니다. 오늘도 읽어주셔서 감사합니다!
의견을 남겨주세요
kimjh
아무리 AI라도 결국 사람, 고객, 그들의 만족과 사용으로 귀결된다는 인사이트 잘 얻고갑니다, AI의 발전속도를 쫓아가려다보니, 조급해지기도 하고, 어지러워지기도 하는 요즘이였는데, 다시 중심을 잡을 수 있을 것 같습니다. 감사합니다,
의견을 남겨주세요