GPT-4o 과 GPT-4 전격비교, 압도적 차이

안녕하세요. 디자이너 제나입니다.
소개해드리고 싶은 새로운 프로덕트들이 참 많았는데도 불구하고, 오늘은 널리 알려진 프로덕트를 들고 왔습니다. 근래의 유명인사 GPT-4o(옴니)입니다. 이전 버전보다 더 똑똑해지고 자연스러워진 건 우리 모두 잘 알고 있습니다. 그러나 옴니가 '어떻게' 변화했는지 좀 더 자세히 알아보고자 오늘 글을 가져왔습니다.

오늘은 예시를 위해서 커핏챗에서 한층 지능이 상승한 옴니가 gpt-4에 비해 얼마나 소설을 잘 쓸 수 있을지 실험해봤습니다.

부업으로 웹소설 쓰시는 분들이 많이 늘어났습니다. gpt-4 시절부터 인공지능의 도움을 많이 받아서 이미 적극적으로 소설 분야에 적용하는 분이 많았습니다. 그러나 출력된 결과 속에 어딘가 어색한 말투가 상당부분을 차지했습니다. 그렇기 때문에 아무리 자동으로 출력된 글을 활용한다고 하더라도 gpt-4가 출력해준 글을 충분히 자연스럽게 고칠 수 있는 능력이 요구됐습니다.

인공지능이 써주는 글은 논리적인 사실을 기반으로 한 논문이나 기사같은 종류의 글에는 이미 이전부터 큰 강점을 보였으나 상대적으로 많은 감정이 요구되는 글은 그대로 가져다 쓰기엔 어려운 부분이 많았습니다. 옴니가 어디까지 보완이 가능한지 같이 뜯어 봅시다.

오늘 gpt-4와 옴니에게 시켜볼 주요 스토리

본격적으로 실험을 시작해보겠습니다. 임의로 아주 뻔한 클리셰로 전개되는 무협지 소설을 써보겠습니다.

주요 강점 : 강한 문단 구성력

UX적인 측면에서도 개선된 모습이 보입니다. 원래는 내용에 관계없이 줄글을 길게 이어갔습니다. 하지만 옴니의 경우, 조금 형편없을지 언정 임의로 제목을 지어주고 스토리 내용마다 걸맞게 부제목을 달아줍니다.

레이아웃부터 차이를 보인다.

심지어 gpt-4는 고작 네 문단 정도로 충실하게 입력된 스토리만 출력해주고 있습니다. 그러나 언뜻봐도 옴니의 경우 앞으로 있을 소설의 내용을 추론해서 쓸 소재를 추천해 줍니다.

입력하지 않은 내용까지 알아서 만들어준다.

문단의 흐름 또한 어색함 없이 일반적인 무협소설에서 등장할 법한 전개를 제시하고 있습니다. 이정도라면 소설에 대한 지식이 없는 사람이라도 쓸 수 있을 정도입니다.

부자연스러운 표현 일체 개선

두 번째 프롬프트

이번에는 얼마나 자연스럽게 사람의 감정을 담아내고, 주관적인 관점을 잘 담아낼 수 있을지 실험해보겠습니다. 인공지능은 3인칭보다 1인칭으로 글을 쓸 때 비교적 더 부자연스럽습니다. 그렇기 때문에 일인칭 주인공 시점의 소설이 작성 난이도가 더 높습니다.

우선 gpt-4의 경우 1인칭 시점으로 바꾸자마자 면접에서 떨어져서 좌절하게 됐다는 아주 중요한 내용을 잊어버렸습니다. 그러나 옴니의 경우 명확하게 처음부터 사건을 파악하고 전개를 시작합니다.

그리고 gpt-4가 쓴 글을 가장 작위적으로 만들어버리는 특징인 과하고 작위적인 표현이 바로 등장합니다. 고전소설에서 등장할 법한 '영혼마저 저릿하게 느껴지는 차가운 바람' 이라는 이상한 문구에 비해 옴니는 아주 담백하게 소설을 작성합니다.

또한 갑작스럽게 술집에 들어가더니 또다시 이유없이 자리를 박차고 나와 한강변을 걷게 되는 구버전과 비교해보면 흥미롭습니다. '문득'이라는 단어를 써서 매끄럽게 한강변에 앉게 한 뒤, 한강에 있는 편의점에 들어가서 소주를 사게 합니다. 굉장히 자연스럽습니다.

계속 독백만 서술하는 gpt-4에 비해 알아서 혼잣말까지 할 줄 아는 등장인물로 성장했습니다. 심지어 프롬프트에 대사를 넣어달라고 부탁한 적이 없는데도 불구하고 한숨을 내쉬며 우울한 감정이 들면 '한탄'을 한다는 행동을 습득하고 있습니다.

또 다시 작위적인 표현인 '이게 끝인가, 아니면 새로운 시작인가?" 같은 말보다 '이대로 끝나는 건가?"라는 매끄러운 결말로 끝납니다.

감정에 따라오는 적절한 행동 학습

세 번째 프롬프트

그렇다면 보다 복잡한 감정을 행동과 연결지어서 길게 쓸 수 있을지 비교해보겠습니다.

우선 동일한 행동에 따라 gpt-4가 만들어낼 수 있는 분량의 2배를 옴니는 만들어낼 수 있습니다. 복잡한 요청을 하니 gpt-4는 위에서 본 결과와 마찬가지로 또 면접이라는 중요한 이슈를 잊었으나 옴니는 한술 더 떠서 '차가운 시선이 아직도 내 뒤통수를 찌르는 것 같다.'는 감정표현을 면접과 잘 연결하고 있습니다.

주인공이 술을 자연스럽게 마시도록 '도저히 집으로 갈 수가 없었다.'라는 표현을 삽입한 것도 훌륭한 지점입니다. 옴니는 기분이 좋지 않은 사람은 집에 가지 않고 강변에 앉아서 소주를 마신다는 행동을 연결할 수 있습니다.

혼잣말의 레벨도 gpt-4와 차원이 다릅니다. gpt-4에서 주인공은 물에 빠질 때까지 자기 탓을 하는 혼잣말에 집착만 하다가 끝납니다. 그러나 옴니의 주인공은 다양한 변화구로 대사를 내뱉습니다. 별과 인생을 대조하는 비유를 쓰는 표현의 다양성마저 습득하고 있습니다.

또한 자책의 감정과 취기를 연결시키는 놀라운 문장력을 갖고 있습니다.

같은 내용으로 퀄리티 높은 장문의 스토리 작성 가능

네 번째 프롬프트

보통 웹소설은 5000자 이상 작성합니다. 전개에 맞는 분량을 작성해보기 위해 같은 내용으로 5000자 이상 작성을 요청했습니다. 길어진 내용에 따라 디테일한 상황 설정도 추가했습니다.

언뜻 보기에도 옴니 쪽이 훨씬 긴 내용으로 작성해줬습니다.

Gpt-4는 내용을 늘리기 위해서 면접장면을 상세하게 설명하고 있으나 크게 소설 전개에 쓸모 있는 표현을 담고 있지 않습니다. 갑작스럽게 내용 분위기와 어울리지 않는 자기 소개를 진지하게 진행하고 있지만 옴니는 적당히 흥미를 유발하는 정도로 쓸모 없는 내용을 생략했습니다.

부족한 공감능력 개선

gpt-4의 경우, 잘 나가는 친구와 비교되는 암담한 현실에서 인공지능의 한계가 많이 드러납니다. 보통 상황이 안 좋은 이야기를 들으면 아무리 좋은 일이 있어도 드러내지 않아야 한다는 복잡한 사회적 관례를 AI는 이해하기 어렵습니다.

위로와 공감을 뛰어넘고 할말만 하는 친구의 모습을 그린 건 프롬프트에서 시킨 내용을 충실히 따랐지만 읽는 사람들은 그저 손절해야 할 친구라고 느끼게 됩니다.

그러나 옴니는 완벽하지 않더라도 어느정도 상황을 조금 더 매끄럽게 만들었습니다. 애초에 스스로 면접을 망친 상황을 밝히지 않도록 만들어서 조금 눈치 없는 수준에서 그치게 했습니다.

또 훌륭한 부분은 글자수를 매꾸기 위해 요청하지 않았던 내용인 다른 지원자라는 조연을 만들어서 주인공의 절망감을 극대화하는 장면을 자체적으로 만들어 냈습니다.

GPT-4로 소설 전문을 쓰는 건 불가능

다섯번째 프롬프트

위 프롬프트에서 5000자 작성을 요구했으나, 각자 글자수를 세어보니 gpt-4는 1400자 옴니는 2300자 정도 출력했습니다.

그렇기에 다른 명령을 하지 않고 다시 장문으로 작성하는 것을 요구했습니다.

gpt-4는 두 가지 옵션을 주면서 선호하는 응답을 고르게 했으나 두 버전 전부 그다지 표현이 좋게 느껴지지 않았습니다. 왜냐하면 여전히 작위적인 표현을 사용해 요청한 글자수를 채우려는 방식이 적용됐습니다.

두 가지 응답을 비교했을 때 응답 2번이 나은 것 같아서 선택했으나 결과물은 비슷하고 만족스럽지 않았습니다. 5000자를 채우는 건 불가능에 가까운 요청이었습니다.

GPT-4O의 압도적인 문장 생성력

옴니는 훨씬 연관성이 있고 사건을 강화해줄 수 있는 색다른 문장들을 만들어서 넣어주고 있습니다. 5000자를 요청하자 조금 모자른 양이긴 하지만 3800자에 달하는 분량으로 동일한 내용을 어색함 없이 연장했습니다.

물에 빠지는 장면은 심지어 가벼운 비속어를 곁들여서 사람이 쓴 것과 차이를 거의 느끼지 못할만큼 일반적인 표현을 작성합니다.

또한 복잡하고 개인이 가진 꿈과 목적같은 모호한 비가시적인 개념을 학습 시키려고 한 노력이 돋보입니다.

요약을 넘어선 창작의 영역?

무협지 관련 장면에 대한 설명은 고작 첫 프롬프트에서 '거지가 됐다‘ 정도로 작성했습니다. 어떤 상세한 설명도 추가하지 않고 작성한 굉장히 부족한 명령입니다. 그리나 옴니는 어딘가 익숙한 소설에서 등장하는 설정을 제대로 붙여서 사용하고 있습니다.

고작 네 문장으로 어색하고 지나치게 일반적인 표현을 이용해 묘사한 gpt-4와 비교하면 엄청난 차이를 느낄 수 있습니다.

요청하지 않은 등장인물도 대화를 자연스럽게 주고 받습니다. 프롬프트는 맨 처음에 요청한 것 이상으로 작성하지 않았고 어떠한 새로운 정보를 주어주지 않았음에도 불구하고 이 정도 결과를 만들어낼 수 있었습니다.

감정도 학습이 가능하다

감정을 실제로 지니고 있는 것과 감정적으로 행동하는 것은 차이가 있습니다. 기계에 감정을 심을 수 없지만 행동은 입력이 가능합니다. 그리고 데이터는 입력된 행동을 통해 반드시 감정을 지니고 있지 않더라도 마치 그 감정을 가진 것처럼 연기할 수 있습니다. 감정에 따른 반응은 보편적인 경우가 많기 때문에 단순한 감정으로 갈 수록 우리가 예상하는 행동은 비슷합니다. 그렇기 때문에 인공지능이 실제로 인간처럼 호르몬에 의해 감정이 유발되지 않더라도 분노, 슬픔, 기쁨 등을 가진 것처럼 보일 수 있습니다.

옴니를 이전 세대와 비교해보고 표현력의 차이를 실감했습니다. 앞으로 Chatgpt에게 감정에 의해 유발되는 행동 데이터의 경우의 수를 모두 입력하게 된다면 근 미래에는 더욱 차이를 느낄 수 없을 정도로 정밀한 행동을 하게 되지 않을까 합니다.

앞으로 미래에는 행동에 따른 감정을 사유하고 추측하기 보다 옴니를 통해 상황과 행동 입력을 통해 명확한 감정을 예측하고 기대할 수 있는 시대가 올수도 있습니다.

사용자는 과거에 기대하기 어려웠던 소설을 쓰고, 상담을 해주는 분야 등 에서 옴니의 능력을 사용해볼 수 있을 것 같습니다.

인간의 창작활동을 돕는가? 방해하는가?

인공지능이 감히 인간의 창작영역을 침범한다고 생각하는 시선이 있습니다. 어떻게보면 이러한 관점은 AI를 도구의 관점보다 인간적인 관점에서 고려하는 생각이라고 할 수 있습니다. 인공지능은 창작을 하는 것이 아니라 오직 인간이 입력한 정교한 시스템 아래에서 존재하는 경우의 수를 출력합니다. AI로는 아예 존재하지 않는 것은 만들 수 없으며, 지나치게 수많은 경우가 조합 됐기 때문에 창작이라는 행위처럼 보일 뿐입니다.

사실 이전부터 창작과 모방은 어느정도 떼어낼 수 없는 관계입니다. 21세기까지 오면서 수많은 창작물이 쏟아지고 지나치게 다양화되면서 전체적인 플롯의 유사성을 유지하며 조금씩의 차이점에 집중하는 방식으로 방향성이 바뀌었기 때문입니다. 프로덕트, 콘텐츠할 것 없이 마찬가지입니다. 그렇기 때문에 기존까지 우리가 해오던 것들이 완벽하게 창작의 영역인가 의문을 갖는다면 구분하기 어려울 수도 있습니다.

인공지능이 문제가 되는 지점은 누구의 것인지 명확하지 않은 데이터로 학습을 했기 때문입니다. 그 안에 유명한 소설의 저자도 포함될 수 있고 우리가 쓴 일반적인 블로그 글일 수도 있습니다. 모든 데이터들의 저자에게 직접 허락을 받고 훈련을 한 것이 아니기 때문에 누구의 것이라고 딱 꼬집어 말할 수 없지만 모든 창작자의 아이디어가 포함되어 있는 셈입니다. 인공지능이 없던 시절, 창작을 위해 좋은 레퍼런스를 모으는 것과 어느정도 일맥상통하는 부분이 있습니다.

그러나 오늘의 옴니를 볼 수록 우리가 이 거대한 흐름을 바꾸기에 어려운 부분이 많다는 것을 다시 느낍니다. 그렇기에 오히려 도구의 관점에서 인공지능을 바라보며 어떻게 다룰 수 있을지 고민해야 합니다. 과거와 비교도 할 수 없을 정도로 빠른 생산속도와 결과물을 검증할 기회가 생겼기 때문에 인간만 가능한 영역에 집중해야 합니다. '무엇을 입력하느냐.'가 앞으로 중요합니다.

어떻게 생각하시나요? 더 변화한 Chatgpt-4o에 무엇을 입력할지 같이 고민해봅시다.

저의 글이 오늘의 커피타임에 도움이 되었길 바랍니다. 다음 주엔 새로운 프로덕트로 돌아오겠습니다.☕️🙇‍♂️

댓글 4개

의견을 남겨주세요

비공개로 댓글 남기기

확인

플로우

1
약 2년 전

비공개 댓글 입니다. (메일러와 댓글을 남긴이만 볼 수 있어요)
ㄴ 답글 (1) ㄴ 접기
커피챗

약 2년 전

안녕하세요:) 재미있게 읽어주셔서 감사합니다🙏 곧 이메일로 회신드리겠습니다!

의견을 남겨주세요

비공개로 댓글 남기기

확인
스마트곰

1
약 2년 전

오 좋은 내용 감사합니다. 저도 심심해서 GPT-4로 소설 써달라고 했더니 완전 엉망인데 이번 옴니는 확실히 다른게 느껴지네요 함도전 해봐야겠어요
ㄴ 답글 (1) ㄴ 접기
커피챗

약 2년 전

좋은 말씀 감사합니다! 옴니로 멋진 소설 재미있게 써보시길 바랍니다:)

의견을 남겨주세요

비공개로 댓글 남기기

확인

프로덕트

GPT-4o 과 GPT-4 전격비교, 압도적 차이

이전보다 더욱 부업으로 쉬워진 소설작가

커피챗 님에게 커피와 쪽지 보내기

주요 강점 : 강한 문단 구성력

부자연스러운 표현 일체 개선

감정에 따라오는 적절한 행동 학습

같은 내용으로 퀄리티 높은 장문의 스토리 작성 가능

부족한 공감능력 개선

GPT-4로 소설 전문을 쓰는 건 불가능

GPT-4O의 압도적인 문장 생성력

요약을 넘어선 창작의 영역?

감정도 학습이 가능하다

인간의 창작활동을 돕는가? 방해하는가?

다가올 뉴스레터가 궁금하신가요?

이번 뉴스레터 어떠셨나요?

커피챗 님에게 커피와 쪽지 보내기

플로우

커피챗

스마트곰

커피챗

이전 뉴스레터

다음 뉴스레터

다른 뉴스레터

메일리 도우미