AI도 '긍정어'를 좋아한다?! "AI에게 ‘하지 마’라고 말하면 생기는 일"

오늘은 조금 충격(?)적인 이야기부터 시작해볼게요.

해외의 유망한 의료 AI 스타트업 CEO가 투자자 미팅에서 기절할 뻔했다고 해요. 그들의 AI가 "종양이 없는 X-ray 사진"을 분석하라고 했더니, 오히려 "종양이 있다"고 잘못 판단한 거죠. 하루 아침에 투자 유치가 물거품이 될 뻔했어요.🫠

근데 알고보니 이건 그 회사만의 문제가 아니었어요.

AI의 치명적인 약점 하나 때문에 전 세계 기업들이 똑같은 문제를 겪고 있었거든요.

문제는 바로 부정어였습니다.

AI에게 지시할 때 '아니, 없는' 같은 부정어 프롬프트를 쓰면 원하는 결과가 잘 이해하지 못하는 이유!

💌 오늘 뉴스레터에서는 대규모 언어 모델 (줄여서 LLM이라고 해요)가 "아니"나 "없는" 같은 부정적인 말을 잘 이해하지 못하는 이유와, 그걸 고치는 방법에 대해 안내합니다.

지난 3일 강수진 박사님 링크드인에 올라온 글을 참고했어요! 프롬프트 쓰면서 실수하기 쉽고, 특히 초보자분들이 알면 좋은 글이라 여겨 보다 쉽게 풀어 전달드립니다.! (문제시 삭제할게요 :)

"아니"라는 말을 못 알아듣는 AI들

ChatGPT에게 "창문이 없는 방 그림 그려줘"라고 해보세요. 창문이 있는 방을 그릴 수 있어요. AI가 "창문"이라는 단어를 들으면 창문을 떠올려서예요. 마치 "공원에 개가 없는 사진"이라고 했는데 개가 있는 사진을 주는 것처럼요.

왜 이런 일이 생길까요?

생성형 AI는 글을 쓰거나 그림을 그릴 때, "A가 아닌 B"처럼 부정적인 말을 잘 못 알아듣습니다.

왜냐하면 AI가 학습할 때 긍정적인 예시(예: "이건 있어요")가 훨씬 많아서라고 해요.

"새는 날 수 있다"는 문장은 수백만 번 봤지만, "새는 날 수 없다"는 문장 학습량이 상대적으로 적기 때문이라는 거죠.

특히, 한국어 "말고"는 AI가 특히 어려워하는 표현이에요. 🧐

"사과 말고 바나나"라고 하면, AI가 사과를 포함할 확률이 높아져요.

영어처럼 단어 순서가 명확한 언어보다 더 헷갈려 하거든요. (영어, 프랑스어는 단어 순서가 명확한 반면

독일어, 체코어, 한국어는 복잡한 문법 구조로 실수할 대가 많습니다.)

그래서 "새는 못 난다"와 "새는 날 수 있다"를 구분하는 걸 지금도 AI는 학습하고 있다고 보시면 돼요. 우리가 외국어를 배울 때, 긍정문에 익숙하다보니 부정문이 헷갈릴 때가 있죠? AI도 그 과정을 지나고 있습니다.

이게 바로 AI의 부정 맹목(negation blindness) 현상이에요. AI가 다음 단어를 예측하도록 배워서, "하지 말고" 같은 말이 나오면 그걸 억제하지 않고 오히려 떠올리기 때문이죠. 다른 말로 '금지어 유출' 이라고도 합니다.

"요약하지 말고 인용구만 뽑아줘"라고 하면, AI가 요약을 해버려요. "공부하지 말고 놀아"라고 했는데 공부하는 친구처럼요.

Daven ai로 만든 이미지

<코끼리를 생각하지마>라는 유명한 책이 있죠. 무언가를 생각하지 말라고 할수록 오히려 그 생각이 더 강해지는 현상을 설명하는 인지과학적 개념입니다. (물론, 이 책의 정치적인 내용과는 전혀 무관합니다.!)

문제는 여기서 그치지 않아요.

AI가 부정적인 걸 싫어해서, 다른 잘못된 이야기를 만들어내기도 한답니다. 사람처럼 "고양이가 매트 위에 없다"라고 들으면 고양이를 떠올리지만, AI는 그걸로 끝나지 않고 사실과 다른 이야기를 추가해요. 부정적인 문장에서 AI의 성능이 떨어져요. "정말 쉬운 걸 물었는데 갑자기 헛소리를 해" 같은 환각(할루시네이션) 현상을 일으키는 요인 중에 하나인 것이죠!

실제로 어느 정도의 수준일까요?

MIT, 구글 딥마인드, 옥스포드 연구진들이 NegBench라는 테스트를 만들어봤어요.

그림, 동영상, 의료 사진 등 7만 9천 개 문제로 AI들을 테스트했는데, 최신 AI들도 찍기 수준의 낮은 점수를 받았다고 해요. 🤣 (하지만 부정적인 예시(캡션)를 수백만 개로 훈련시키면, 검색 정확도가 10% 오르고 객관식 정답률이 40% 올라간다고 합니다.!!)

부정어 프롬프트 때문에 실무에서 실수할 수 있는 사례

이런 환각 현상은 브랜드 이미지 손상으로 직결될 수 있어요.

특히 고객 상담, 마케팅 메시지, 제품 설명 등에서 치명적이죠.

의료 분야의 위험

병원에서 AI에게 "이 CT 사진에 이상이 없는지 확인해줘"라고 물어보면?

AI가 이상이 있는 걸 얘기할 수 있습니다. 환자 생명과 직결되는 문제죠.

마케팅에서의 함정

"경쟁사 제품 언급하지 말고 우리 제품만 소개해줘"라고 AI에게 지시해보세요.

AI가 오히려 경쟁사 이야기를 꺼낼 확률이 높아져요.

고객 서비스 챗봇의 실수

"환불은 안 되고 교환만 가능해요"라는 정책을 AI에게 학습시켜도, 고객이 "환불 안 된다며?"라고 물으면 "환불 도와드릴게요"라고 답할 수 있어요. 🤣

🔨 고치는 방법

AI의 문제를 고치기 위해 여러 방법이 있어요. '프롬프트 전략'이 가장 중요해요. 이는 AI에게 질문을 어떻게 하는지예요. 부정적인 말을 긍정적으로 바꾸거나, 단계별로 생각하게 해요. AI가 크면 조금 나아지지만, 완벽하지는 않아요. 언어마다 다르기도 해요. 영어처럼 단어 순서가 확실한 언어에서는 좀 더 잘해요. 한국어는 그렇다면?!

당신의 프롬프트에 적용할 수 있는 구체적인 방법들

프롬프트 엔지니어링에 집중해야 합니다. 부정어를 쓰는 대신, 원하는 것을 명확하게 표현해주세요!

AI의 한계를 극복하고 더 정확하게 해주는 것은 결국 프롬프트입니다. 앞으로 AI가 더 똑똑해지려면, 부정어 처리와 논리성을 잘 고쳐야 해요. AI가 사람처럼 신뢰할 수 있게 만드는 게 중요합니다.

1. 긍정 프레이밍 전략

부정 지시를 긍정으로 바꾸기 (Positive Framing*: "A 말고 B" 대신 "B만 해"라고 해요. 핵심은 원하는 걸 명확히 말하는 거예요. 이렇게 하면 AI가 의도하지 않은 걸 빼요.

❌ "깃발이 없는 로봇이 투표하는 그림 그려줘" (X)

🅾️ "투표 용지만 들고 있는 로봇 그림 그려줘. 방은 단순하고 아무 장식 없게 해줘"

마케팅 카피 작성 시: "경쟁사 언급하지 말고" → "우리 브랜드 장점만 부각해서"
고객 서비스: "환불 안 된다고 하지 말고" → "교환 서비스를 안내해줘"

2. 단계별 지시 전략(Sequential Prompting / Prompt Chain)

복잡한 작업을 단계로 나누어 지시하세요. 이렇게 하면 지시가 많아서 AI가 헷갈리는 "명령의 저주"를 피할 수 있어요.

예시)

1단계: 제품 특징 리스트업하기

2단계: 고객 니즈와 매칭하기

3단계: 매력적인 카피로 다듬기

예시2)

1단계: 아이디어 생각해.

2단계: 필터링해.

3단계: 형식 맞춰.

3. 사고의 체인 활용 (Chain-of-Thought, COT)

단계별로 생각하게 해요. 이것만으로도 정확도가 크게 올라갑니다. AI가 논리적으로 배운 덕분이에요.

예: "단계적으로 생각해 봅니다" 또는 "순서대로 생각해서 대답해 주세요" 문구를 추가하세요.

4. 부정어 분리 전략(Externalize Negation)

부정어를 쓸 수 밖에 없을 땐 분리하세요. 원하는 내용을 먼저 말하고, 금지사항은 마지막에 따로 언급하세요. 이는 금지어 유출을 막아요.

예시: "고급스러운 브랜드 이미지를 강조하는 카피를 써줘. 단, 가격 언급은 절대 하지 말아줘."

5. 미세 조정 (추가 훈련)

AI에게 부정적인 예시를 더 가르쳐요. 예를 들어, 부정적인 그림 설명 100만 개로 훈련하면 10% 더 잘해요. 영화 리뷰 분석에서도 이 방법이 정확도를 높여요.

6 사람과 AI 비교

사람은 "새는 새가 아니다"라고 하면 거짓이라고 바로 알아요. 하지만 AI는 참이라고 생각할 수 있어요. AI는 인간처럼 의미를 계산하지 않고, 단어 연상으로 하기 때문입니다. 그래서!!

사람도 빨리 생각하면 실수하지만, 천천히(시스템)처럼 처리하면 하면 잘합니요. AI에게 "천천히 생각해"라고 하면 비슷해져요. 사람도 "고양이가 매트 위에 없다"라고 들으면 고양이를 떠올리긴 하지만, 매트 위에 고양이가 있는 이미지를 그리지 않는 것처럼요.

분야별 적용 사례

이커머스 업계

문제 상황: "재고 없는 상품 제외하고 추천해줘"

개선 방법: "현재 구매 가능한 상품만 추천해줘"

콘텐츠

문제 상황: "정치적 내용 빼고 트렌드 콘텐츠 만들어줘"

개선 방법: "라이프스타일과 엔터테인먼트 중심의 트렌드 콘텐츠만 제작해줘"

교육

문제 상황: "어려운 용어 사용하지 말고 설명해줘"

개선 방법: "초등학교 3학년이 이해할 수 있는 쉬운 용어로만 설명해줘"

실무에서 바로 쓸 수 있는 체크리스트

AI 프롬프트 작성 전 체크사항

□ 부정어(~하지 마, ~말고, 없는, 안) 사용했는가?

□ 원하는 결과를 긍정적으로 표현했는가?

□ 복잡한 지시를 단계별로 나누었는가?

□ "단계적으로 생각해서" 문구를 추가했는가?

□ 금지사항을 별도로 분리해서 언급했는가?

AI 결과물 검증 체크사항

□ 금지된 내용이 포함되지 않았는가?

□ 지시사항과 반대되는 결과가 나오지 않았는가?

□ 논리적 일관성이 유지되는가?

□ 브랜드 가치와 일치하는가?

□ 고객에게 전달해도 안전한 내용인가?

😉 "이 뉴스레터가 유용했다면, 친구와 동료에게도 공유해주세요! 📩

📰 다양한 AI 활용법, 튜토리얼, 쏟아지는 뉴스 큐레이팅! AI 레시피 커뮤니티에서 놓치지 마세요!!

https://open.kakao.com/o/g6xdSAfh 👈 AI 레시피 커뮤니티 입장

프롬프트