
MIT Institute for Medical Engineering and Science의 수석 연구원이자 하버드 의과대학 부교수, 그리고 보스턴 Beth Israel Deaconess Medical Center에서 환자를 보는 의사인 Leo Anthony Celi는 최근 한 인터뷰에서 이렇게 말했습니다. "지금 우리는 AI를 오라클(신탁)로 쓰고 있습니다. 코치로 쓸 수도 있는데 말입니다."
미국에서 매년 의료 오류로 사망하는 사람은 25만 명이 넘습니다. AI가 이 숫자를 줄여 줄 것이라고 기대했지만, 중환자실(ICU) 연구들은 정반대를 보여 줍니다. 의사들은 자신의 임상 직관과 AI의 진단이 충돌할 때조차, AI가 확신에 찬 어조로 말하면 그것을 따른다는 것입니다. 자동화 편향(automation bias)이라고 부르는 현상입니다.
Celi 팀의 해법은 의외였습니다. 더 똑똑한 AI가 아니라, 더 겸손한 AI를 만들자는 것이었습니다. 2026년 BMJ Health and Care Informatics에 발표된 그들의 프레임워크 이름은 BODHI — Balanced, Open-minded, Diagnostic, Humble, Inquisitive의 약자입니다. 기계에게 '겸손'을 가르치는 시대. 이상하지 않습니까?
저는 이 뉴스를 처음 접했을 때 솔직히 의아했습니다. 겸손은 아마도 우리가 학교에서나 공동체 모임, 가정에서 가르치는 첫 덕목 중 하나이기 때문입니다. 부모가, 선생님이, 교회 목사가 평생을 들여 사람의 마음에 새기려 애쓰는 그것을 이제는 GPT 모델에 프롬프트 한 줄로 주입하는 시대가 온 것입니다.
묻기 시작한 겸손한 AI
연구진이 GPT-4.1-mini와 GPT-4o-mini를 BODHI 프레임워크로 감싸 1,000건의 임상 시나리오에 적용한 결과, GPT-4o-mini의 '맥락 추가 요청 비율(context-seeking rate)'이 0%에서 73.5%까지 올라갔습니다. 즉, 원래 모델은 어떤 시나리오를 줘도 일단 자신감 있게 답을 내놓았습니다. BODHI를 입히자, 같은 모델이 1,000건 중 735건에서 "잠시만요. 이 정보로는 부족합니다. 어떤 검사를 추가로 해주실 수 있습니까?"라고 묻기 시작했습니다.
그리고 흥미로운 트레이드오프가 있었습니다. '커뮤니케이션 품질' 점수는 두 모델 모두 약 12%포인트 떨어졌습니다. 연구진은 이렇게 해석했습니다. 확신에 찬 선언은 세련되게 들리고, 머뭇거리며 질문하는 답변은 그렇게 들리지 않는다고. 표준 벤치마크는 어쩌면, 임상 AI를 더 안전하게 만드는 바로 그 행동을 깎아내리고 있었던 것일지 모른다고.
이 지점에서 질문은 의료 AI를 떠나 우리 자신에게로 돌아옵니다. 나의 일터에서, 가정에서 혹은 친구들과의 대화 시간 중 '확신 있게 들리는 것'과 '정확한 것' 중 우리는 어느 쪽을 더 신뢰해 왔습니까?
상황적 겸손과 성품적 겸손
저는 최근 Journal of Psychology and Theology에 투고된 한 논문을 리뷰할 기회가 있었습니다. 거기서 매우 중요한 구분을 알게 되었습니다. 신학자와 윤리학자들이 오랫동안 다뤄 온 것, '상황적 겸손(situational humility)'과 '성품적 겸손(dispositional humility)'의 차이입니다.
카카오페이, 신용카드로 간편결제를 지원합니다.