Wednesday Insights

사물이 눈을 가진다면

AI에 생명을 불어넣기 위한 디자인

2025.12.10 | 조회 368 |
0
|
from.
inspireX
inspireX의 프로필 이미지

inspireX

매주 수요일, 한 주 동안 생각해볼 만한 IT/UX 이야기를 전달해드립니다.

🧐 Summary

1️⃣ 인간은 얼굴과 조금만 유사한 패턴이 있으면 매우 짧은 순간에도 이를 얼굴로 인식합니다.

2️⃣ 뇌는 사물을 얼굴로 오인한 후 빠르게 오류를 수정할 수 있지만, ‘눈’은 여전히 가장 빠르고 강력한 얼굴 인식 요소입니다.

3️⃣ 로봇/AI 캐릭터 디자인에서 생명감을 만들고 감정을 전달하는 핵심은 눈,입, 그리고 구성 요소의비율입니.


요즘 저희 아기는 식사시간마다 누군가를 찾습니다. 사진 속에 있는 자신의 더 어린 시절 모습, 제일 좋아하는 곰인형, 그림책 속 멍멍이. 이렇게 뭔가 생명체만 보이면 자기 숟가락에 담긴 음식을 먹여주려 합니다. 그런 아기가 얼마전 제 옷에 있던 하트모양 라벨에 숟가락을 갖다대더라구요. 다시보니 하트에 눈이 달려있었습니다. 아, 아기는 눈을 보고 이 하트가 살아있다고 생각한건가? 

꼼데가르송 플레이 로고
꼼데가르송 플레이 로고

파레이돌리아, 생존을 위한 진화

파레이돌리아라는 용어 들어보신적 있나요? 랜덤한 시각적 자극속에서 의미를 찾아내려는 경향을 뜻하는 말인데요, 우리가 뭉게구름을 보며 양을 닮은 모양을 찾아내거나 달 표면에서 토끼를 발견하는 것 같은 현상입니다. 사람은 얼굴 패턴을 아주 빠르게 인식하는 능력이 있습니다. 진화론적 관점에서는 원시인이 위험에 노출되면 빠르게 이를 피하기 위해 이런 능력을 갖추게 되었다고 합니다. 숲속에서 나뭇잎이 뭉쳐져 있는 모습을 보고 동물이라고 판단하면 빠르게 그 위험을 피할 수 있지만 동물을 나뭇잎으로 착각하면 위험하니까요. 일단 얼굴과 유사한 패턴을 보면 얼굴로 인식해버리고 이에 대응하기 위해 이러한 진화가 있었다는 것이 정설로 받아들여지고 있습니다.

이와 같이 우리가 무언가를 얼굴로 인식하는 것은 뇌파(EEG)의 변화로도 확인이 가능합니다. 사람에게 ‘얼굴’이라고 생각되는 자극을 제시하면 약 170ms(0.17초) 후에 후두-측두엽 부근에서 음전위가 나타나 이를 N170이라고 부릅니다. N170은 얼굴의 개별 특징들이 하나의 전체적인 구조로 통합되는 시점을 반영하는 것으로 알려져 있는데, 얼굴의 구성 요소 중 눈만을 따로 떼어 제시했을 때 발생하는 N170의 진폭은 얼굴 전체를 제시했을 때와 거의 비슷한 수준이라고 합니다. 하지만 입만 따로 제시했을 때에는 반응이 매우 작고 느립니다. 이는 뇌가 얼굴을 탐지할 때에 눈이 가장 중요한 요소라는 것을 알려줍니다.

한 연구에서는 이와 같은 현상이 정말 시각적인 특징을 감지해 빠르게 얼굴을 탐지하는 것인지, 아니면 이것보다는 인지적으로 패턴을 재해석하는 조금은 시간이 걸리는 과정인지 실험을 통해 알아보았습니다. 착시 얼굴(마치 얼굴처럼 보이는 사물), 매칭된 사물(착시 얼굴과 유사하지만 얼굴로는 보이지 않는 사물), 그리고 실제 사람의 얼굴. 이렇게 세 가지 이미지를 보여주고 fMRI와 MEG를 통해 이미지를 보고 시간의 흐름에 따라 뇌의 어떤 부분에서 어떤 반응을 보이는지를 알아본 것입니다. 그 결과 이미지를 보고 아주 짧은 시간 동안은 뇌가 착시 얼굴을 실제 사람의 얼굴과 유사하게 인식하는 것을 알 수 있었습니다. 하지만 이미지를 본 후 0.25초 안에 이러한 오류를 수정하여 착시 얼굴이 다시 일반 사물과 동일한 상태로 인식되었습니다. 즉, 인간은 얼굴과 비슷한 특징이 있으면 일단 빠르게 얼굴로 인식하지만, 이러한 오류를 빠르게 수정하여 다시 사물로 올바르게 재분류한다는 것입니다. 이는 파레이돌리아 현상이 사물을 보고 인지적으로 얼굴로 재해석하는 느린 생각의 과정이라기 보다는 사물의 시각적인 특징이 빠르게 이를 얼굴로 탐지하는 메커니즘에 가깝다는 것을 알려줍니다.


디자인에 생명을 불어넣는 요소

아기는 눈이 달린 하트를 보고 음식을 먹여주었습니다. 그렇다면 성인은 어떨까요? 성인은 눈이 달린 하트를 보여준다고 하트에게 말을 걸거나 배가 고플까 걱정해주지는 않지만, 여전히 어떤 순간에는 유사한 반응을 보입니다. 휴대폰이 갑자기 켜지지 않으면 “야, 정신차려봐!”라고 사람을 대하듯 말을 하거나 자동차에 ‘흰둥이’라는 이름을 붙여주기도 하니까요. (네, 제 이야기입니다.) 이러한 점은 로봇이나 AI에게 캐릭터를 부여해 사용자에게 친근하게 다가가도록 할 때에 이를 ‘얼굴’로 인식할 수 있도록 하려면 어떤 부분을 강조해야 하는지에 대한 인사이트로 연결될 수 있습니다.

앞에서 언급했듯 인간이 어떠한 사물을 보고 얼굴로 인식하는데에 가장 중요한 것은 ‘눈’이라고 합니다. 그렇기에 아기도 눈이 달린 하트를 얼굴로 인식했을 가능성이 큽니다. 이 ‘눈’이라는 것은 어떠한 사물을 얼굴로 인식하는 정보 처리의 시작점이며 동시에 가장 풍부한 정보를 담고 있는 영역이라고 할 수도 있습니다. 얼굴을 보여주면서 입을 보라고 지시해도 사람들은 자신도 모르게 눈으로 먼저 시선이 갔다가 입으로 이동하는 현상이 나타난다고 하는데요, 이는 눈이 가지는 의미가 얼마나 강력한지 알려주는 한 예시입니다. 또한 사람을 구분할 때에도 눈이 가장 변별력이 높은 요소라고 합니다.

눈이 이렇게 정적이고 구조적인 정보의 핵심이 된다면, 동적인 정보의 핵심입니다. 사람의 감정을 읽을 때에 행복이나 놀람과 같은 감정은 입에서 찾아낼 수 있는 단서가 많습니다. 또한 대화 중에도 사람의 입모양이 청각 정보를 보완해주는 역할을 하기 때문에 감정 혹은 대화 중에는 입 역시 중요한 역할을 합니다.

 

그렇다면 우리가 로봇이나 AI의 얼굴을 디자인할 때에도 이 요소들을 중요하게 생각해야겠죠. 하나의 생명체, 존재를 사람에게 인식시키려면 가장 중요한 것은 바로 입니다. 점 두 개만 있어도 사용자의 주의를 끌고, 사용자는 그 눈을 통해 캐릭터를 얼굴로 인지할 수 있죠. 점 두 개가 깜빡이거나, 눈웃음을 보여주면 사용자는 그 감정을 읽어낼 수 있습니다.

보다 깊이있는 커뮤니케이션을 원한다면 을 추가해야겠죠. 밝은 배경 위에 역삼각형으로 세 개의 어두운 영역(두 개의 눈과 하나의 입을 상징)만 배치해도 사람은 그 패턴에 반응해 얼굴로 탐지한다고 합니다. 캐릭터를 얼굴로 인지한 후 그 캐릭터의 감정을 풍부하게 전달하려면 입의 모양 변화를 통한 표현이 가능합니다. 그런데 잠깐 입이 없는 캐릭터를 떠올려볼까요. 헬로키티는 입이 없습니다. ‘보는 사람이 본인의 감정을 투영하도록 하기 위해서’ 키티는 입이 없다고 해요. 내가 슬프면 키티도 슬퍼보이고, 내가 기쁘면 키티도 기뻐보일 수 있어요. 이렇게 감정적인 위로를 목적으로 하는 로봇의 경우에는 입 형태를 불분명하게 하거나 아예 생략해서 사용자의 감정 이입을 유도하기도 합니다. 

헬로키티
헬로키티

그렇다면 는 어떨까요? 과감하게 생략할 수 있습니다. 어피치, 시나모롤, 그리고 짱구까지. 가만히 떠올려보면 코가 없는 캐릭터들도 꽤 많아요. 그리고 이모지도 대부분 코가 없지만 표현하고자 하는 감정을 명확히 전달하죠. 그렇기에 우리가 아는 많은 로봇들도 눈만 있거나 눈과 입의 조합을 통해 미니멀한 디자인으로도 감정을 전달하는 경우가 많습니다.  

눈, 코, 입과 같은 얼굴의 구성요소라고 볼 수는 없지만 얼굴의 윤곽과 비율 또한 대상을 보호해야 할 귀여운 존재로 인식하게 만드는 중요한 요소입니다. 콘라트 로렌츠가 제시한 유아 도식(Baby schema, Kindchenschema)이라는 컨셉은 상대적으로 큰 머리, 넓은 이마, 얼굴 하단에 몰려있는 눈코입, 통통한 볼의 중요성을 언급합니다. 이러한 비율을 갖춘 대상은 유아로 인지되어 귀엽다는 인식을 주어 보살펴주고 싶다는 본능을 자극하기 때문이죠. 예전에 로봇 디자인에서 중요한 불쾌한 골짜기 개념을 설명드린 적 있었죠. 이러한 불쾌함을 피하기 위해 많은 로봇들이 인간의 비율을 그대로 따르기 보다는 이 유아 도식에 해당하는 비율을 극대화한 디자인을 채택하기도 합니다.


오늘은 아기의 시선을 끈 하트에서부터 출발해 로봇이나 AI 디자인에 생명을 불어넣을 수 있는 디자인 요소까지 이야기해보았습니다. 우리가 평소에 보던 많은 캐릭터나 로봇 디자인이 그렇게 생긴데에도 다 이유가 있었네요. 점 두 개의 움직임, 그리고 점 두 개와 선 하나의 조합만으로도 생명을 감지하고 얼굴로 인식하는 사람의 본능이 놀랍기도 하면서 한편으로는 우리의 복잡한 얼굴 형태에서 상대방은 얼마나 많은 것을 읽어내고 있는 것인가 새삼 생각해보게 되었습니다. 오늘의 이야기가 언젠가 로봇이나 AI의 비주얼 디자인을 하실 때에 조금이나마 도움이 되시길 바라며 글을 마칩니다.

 

+ 저희가 예고했던 12월 오프라인 모임은 1월 신년회로 대체하려 합니다. 연말에 inspireX에 좋은 소식도 있어서, 그 소식과 함께 1월에 인사드릴게요. 우리 2026년에 얼굴보고 이야기 나눠요!

 

[inspire X 오픈카톡방]

https://open.kakao.com/o/gBHmseah


Reference

[1] Wardle, S. G., Taubert, J., Teichmann, L., & Baker, C. I. (2020). Rapid and dynamic processing of face pareidolia in the human brain. Nature communications, 11(1), 4518.

[2] Tomasello, M., Hare, B., Lehmann, H., & Call, J. (2007). Reliance on head versus eyes in the gaze following of great apes and human infants: the cooperative eye hypothesis. Journal of human evolution, 52(3), 314-320.

[3] Morton, J., & Johnson, M. H. (1991). CONSPEC and CONLERN: a two-process theory of infant face recognition. Psychological review, 98(2), 164.

[4] Lorenz, K. (1943). Die angeborenen formen möglicher erfahrung. Zeitschrift für Tierpsychologie, 5(2), 235-409.

 

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

inspireX 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

다른 뉴스레터

© 2025 inspireX

매주 수요일, 한 주 동안 생각해볼 만한 IT/UX 이야기를 전달해드립니다.

뉴스레터 문의inspirexnewsletter@gmail.com

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 성동구 왕십리로10길 6, 11층 1109호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스