NOTE18. AI에게 '겸손'을 가르치기 시작했습니다.

Leo Anthony Celi

MIT Institute for Medical Engineering and Science의 수석 연구원이자 하버드 의과대학 부교수, 그리고 보스턴 Beth Israel Deaconess Medical Center에서 환자를 보는 의사인 Leo Anthony Celi는 최근 한 인터뷰에서 이렇게 말했습니다. "지금 우리는 AI를 오라클(신탁)로 쓰고 있습니다. 코치로 쓸 수도 있는데 말입니다."

미국에서 매년 의료 오류로 사망하는 사람은 25만 명이 넘습니다. AI가 이 숫자를 줄여 줄 것이라고 기대했지만, 중환자실(ICU) 연구들은 정반대를 보여 줍니다. 의사들은 자신의 임상 직관과 AI의 진단이 충돌할 때조차, AI가 확신에 찬 어조로 말하면 그것을 따른다는 것입니다. 자동화 편향(automation bias)이라고 부르는 현상입니다.

Celi 팀의 해법은 의외였습니다. 더 똑똑한 AI가 아니라, 더 겸손한 AI를 만들자는 것이었습니다. 2026년 BMJ Health and Care Informatics에 발표된 그들의 프레임워크 이름은 BODHI — Balanced, Open-minded, Diagnostic, Humble, Inquisitive의 약자입니다. 기계에게 '겸손'을 가르치는 시대. 이상하지 않습니까?

저는 이 뉴스를 처음 접했을 때 솔직히 의아했습니다. 겸손은 아마도 우리가 학교에서나 공동체 모임, 가정에서 가르치는 첫 덕목 중 하나이기 때문입니다. 부모가, 선생님이, 교회 목사가 평생을 들여 사람의 마음에 새기려 애쓰는 그것을 이제는 GPT 모델에 프롬프트 한 줄로 주입하는 시대가 온 것입니다.

묻기 시작한 겸손한 AI

연구진이 GPT-4.1-mini와 GPT-4o-mini를 BODHI 프레임워크로 감싸 1,000건의 임상 시나리오에 적용한 결과, GPT-4o-mini의 '맥락 추가 요청 비율(context-seeking rate)'이 0%에서 73.5%까지 올라갔습니다. 즉, 원래 모델은 어떤 시나리오를 줘도 일단 자신감 있게 답을 내놓았습니다. BODHI를 입히자, 같은 모델이 1,000건 중 735건에서 "잠시만요. 이 정보로는 부족합니다. 어떤 검사를 추가로 해주실 수 있습니까?"라고 묻기 시작했습니다.

그리고 흥미로운 트레이드오프가 있었습니다. '커뮤니케이션 품질' 점수는 두 모델 모두 약 12%포인트 떨어졌습니다. 연구진은 이렇게 해석했습니다. 확신에 찬 선언은 세련되게 들리고, 머뭇거리며 질문하는 답변은 그렇게 들리지 않는다고. 표준 벤치마크는 어쩌면, 임상 AI를 더 안전하게 만드는 바로 그 행동을 깎아내리고 있었던 것일지 모른다고.

이 지점에서 질문은 의료 AI를 떠나 우리 자신에게로 돌아옵니다. 나의 일터에서, 가정에서 혹은 친구들과의 대화 시간 중 '확신 있게 들리는 것'과 '정확한 것' 중 우리는 어느 쪽을 더 신뢰해 왔습니까?

상황적 겸손과 성품적 겸손

저는 최근 Journal of Psychology and Theology에 투고된 한 논문을 리뷰할 기회가 있었습니다. 거기서 매우 중요한 구분을 알게 되었습니다. 신학자와 윤리학자들이 오랫동안 다뤄 온 것, '상황적 겸손(situational humility)'과 '성품적 겸손(dispositional humility)'의 차이입니다.

Note

NOTE18. AI에게 '겸손'을 가르치기 시작했습니다.

우리가 잃어버린 것은?

묻기 시작한 겸손한 AI

상황적 겸손과 성품적 겸손

콘텐츠를 개별 결제하시면 읽을 수 있어요

이전 뉴스레터

다음 뉴스레터

다른 뉴스레터

메일리 도우미