
성과 평가 시즌마다 관리자들의 고민은 반복됩니다. 지난 한 해를 어떻게 글로 정리할까. 생성형 AI가 그 짐을 덜어줄 것처럼 보입니다. HBR은 거기서 역설을 발견했습니다.
HBR 2026년 5월호는 대부분의 기업이 AI를 성과 평가에 잘못 쓰고 있다고 지적합니다. AI로 기존 서술형 평가를 더 빠르고 세련되게 다듬는 데 그칠 뿐, 평가의 본질적 결함은 건드리지 않습니다. 문제는 이 방식이 기존의 결함—관리자별 평가 불일치, 불완전한 증거—을 없애는 게 아니라 더 그럴듯하게 포장한다는 데 있습니다. AI가 생성한 문서는 모두 비슷하게 유창하고 자신감 있는 어조로 수렴합니다. 신중한 평가와 형식적인 칭찬의 차이가 사라집니다.
저자 Chrysanthos Dellarocas가 제안하는 방향은 다릅니다. AI를 글쓰기 보조가 아닌 증거 발굴 도구로 써야 합니다. "이 직원은 전략적 사고를 발휘합니까?"가 아니라, 그 사고가 드러난 구체적 순간—잘못된 가정을 수정한 문서, 실패한 이니셔티브를 재구조화한 사후 검토—을 AI가 찾아내도록 해야 합니다. 아마존이 Forte 성과 평가에서 구체적 성과 3~5개를 직접 제출하도록 요구한 방식, CRM에서 직접 추출한 파이프라인 데이터로 영업 성과를 평가하는 방식이 그 선례입니다.
평가의 언어가 형용사에서 증거로 바뀔 때, AI는 비로소 평가의 질을 높이는 도구가 됩니다.
오늘의 질문: 우리 조직의 성과 평가는 지금 AI를 글쓰기 도구로 쓰고 있나요, 증거 발굴 도구로 쓰고 있나요?
📎 원문: Harvard Business Review — Gen AI Could Fix Performance Reviews—or Make Them Even Worse (2026-05)
https://hbr.org/2026/05/gen-ai-could-fix-performance-reviews-or-make-them-even-worse
의견을 남겨주세요