로봇이 아닙니다 - 캡챠는 어떻게 사람과 로봇을 구분할 수 있을까?

🤖: 캡챠? 풀었다- 인간 시대의 끝이 도래했다-

로봇이 아닙니다- 인터넷을 사용하면서 이 메세지를 본 적 없는 사람은 아마도 없겠죠. 회원 가입을 할 때나, 웹사이트에 로그인을 할때 왕왕 보이는 이 메세지, 정식 명칭은 CAPTCHA 캡챠 입니다. 챗GPT가 처음 나왔을 때 바로 이 캡챠로 막혀있는 서비스를 사용하라는 명령을 받자 온라인 심부름 센터 직원에게 시각 장애인인 척 부탁해서 캡챠를 풀어낸 게 논란이 되기도 했죠. 로봇이 아닙니다 라는 어딘가 허술해 보이는 체크박스 하나로 어떻게 로봇인지 인간인지 구별해내는 것인지 궁금하지 않으신가요? 일상 속에 자리 잡은 캡챠, 어떤 원리로 작동 되는지 알아보도록 하겠습니다.

📜 아주 아주 먼 옛날, 꼬부랑 글자가 있었습니다

캡챠가 처음 등장한 건 2000년도의 일입니다. 인터넷을 사용하는 게 비단 인간 뿐만 아니라 봇들도 늘어난 탓에 생겨난 변화죠. 이 봇들은 웹사이트 등에서 데이터를 뽑아가거나 (웹 스크레이핑), 훔친 신용카드 번호 데이터베이스로 결제를 시도 하거나, 꿀같은 강의를 인간이 범접할 수 없는 속도로 수강 신청을 해버리는 등의 만행들을 저지릅니다. 그래서 인간은 쉽게 통과할 수 있지만, 봇은 쉽게 통과하지 못하는 테스트가 필요해지게 되죠. (애초의 캡챠의 약자도Completely Automated Public Turing test to tell Computers and Humans Apart, 인간이랑 컴퓨터랑 구분 가능한 자동화된 튜링테스트 라는 뜻입니다. 튜링 테스트는 컴퓨터가 지능이 있는지를 판별할 수 있는 시험이고요.) 그래서 등장한게 텍스트 기반 캡챠입니다.

여러가지 텍스트 기반 캡챠
(이미지 출처: Imperva.Inc)

이미지에서 글자나 숫자를 인식하는 일은 인간들에게는 쉬운 일이지만 당시의 컴퓨터에게는 어려운 일이었습니다. 네, 여기서 키 포인트는 당시의 입니다. 당시만 해도 텍스트 기반 캡챠는 인간과 컴퓨터를 구분하는 좋은 방법이었습니다만, 지금의 인공지능은 99.8%의 확률로 캡챠를 뚫을 수 있다고 합니다. 텍스트 기반 캡챠만으로는 더이상 인간과 봇을 구분할 수 없게 된거죠. 그렇게 캡챠는 새로운 국면을 맞이하게 됩니다.

🐣 꿩먹고 알먹고, 리캡챠

그렇게 시간이 지나면서 캡챠계의 큰 손이 등장하게 됩니다. 바로 구글이죠. 구글은 다양한 웹사이트에서 캡챠를 직접 개발할 필요 없이 사용할 수 있도록 API를 개발하는 데요, 이 프로그램이 바로 ReCaptcha 리캡챠입니다. 리캡챠 역시도 시작은 텍스트로 시작합니다. 하지만 무작위의 알파벳으로 이미지를 생성하는 방식이 아니라, 구글 북스 데이터베이스를 만들면서 고서에서 스캔 된 단어 중 컴퓨터가 인식하지 못하는 단어들을 이용하는 방식을 사용했습니다.

텍스트 리캡챠. "스팸을 멈추고 책을 읽읍시다" 라는 슬로건이 보입니다.

알게 모르게 캡챠를 푼 사람들이 모두 고서를 디지털화 하는 데 일조를 한 셈이죠. 계산에 의하면 한 사람이 한다면 먹지도 자지도 않고 20년동안 변환해야 할 분량의 데이터를 약 6천만명의 캡챠 유저들이 함께 변환한 꼴이라고 하네요.

구글은 구글 북스의 케이스에서 영감을 받았는지, 캡챠를 꿩먹고 알먹고, 데이터 수집도 하고 보안 검사도 하는 용도로 사용할 수 있도록 다양한 캡챠 방식을 내놓습니다. 책에서 스캔 된 단어, 구글 스트리트 뷰의 표지판 번호 처럼 사진에 적힌 텍스트를 단순히 받아적는 캡챠 뿐만 아니라, 디저트 사진들에서 케이크 찾기, 고양이와 강아지 사진에서 강아지 찾기 등 인간의 인지 능력을 이용한 캡챠도 선보였죠. 구글은 이 캡챠 데이터들을 인공지능 알고리즘을 발전시키는 데 사용합니다. 사진을 보고 "인간처럼" 생각하는 방식에 대해서 데이터를 수집한 것이죠.

요즘에는 압도적으로 신호등이나 오토바이 등을 선택하는 캡챠를 많이 볼 수 있는데요, 이 데이터들은 구글의 무인 자율주행 자동차를 위한 데이터로 활용된다고 하네요.

🔮 미래는 보이지 않는 캡챠

저렇게 한칸씩 걸친 거... 항상 고민되지 않나요?

그런데 이 칸까지 신호등이라고 선택을 해야하나... 말아야하나... 생각하다보면 어째 옛날보다 캡챠가 어려워 진 것만 같죠. 기분탓이 아닐수도 있습니다. 컴퓨터들은 점점 똑똑해지는데 인간들은 20년 전에 비해 특별히 똑똑해지지 않았기 때문에 인간들이 계속 새로운 캡챠 방식들을 고안해내야 해서 그렇습니다. 하지만 다행히도 캡챠를 풀기 위해 삼차방정식을 푸는 날이 올 것 같지는 않습니다. 요즘의 캡챠는 보이지 않는 방식, 덜 귀찮은 방식으로 발전해 나가고 있기 때문이죠.

"보이지 않는 캡챠"는 웹페이지에서 일어나는 데이터들을 기반으로 만들어집니다. 예를 들어 인간이 아무리 의도적으로 곧게 움직인 데도 인간들의 마우스 사용방식에는 약간의 움직임, 무작위성이 들어가기 마련입니다. 로봇이 아닙니다 캡챠처럼 간단한 캡챠는 체크박스를 선택하기 전까지 마우스 움직임을 분석해서 이 움직임이 얼마나 인간다운 움직임인지를 체크하죠. 브라우저 쿠키 등도 사용되는데요, 봇보다는 인간이 이 페이지도 로그인 했다가, 저 페이지도 들어갔다가 하면서 여러 웹페이지의 쿠키 설정값을 가지고 있을 확률이 높죠. "보이지 않는 캡챠", 간단한 캡챠는 백그라운드에서 이런 다양한 요소들을 종합해서 처리를 하다가 봇으로 의심되면 그 때 앞서 말한 다양한 캡챠 문제들을 띄우는 방식으로 작동됩니다. 어쩌면 우리 인간 유저들은 앞으로 캡챠를 잘 보지 않고 인터넷을 즐길 수 있는 시대가 올지도 모르겠네요.

리캡챠를 처음 만든 사람은 루이스 폰 안, 과테말라 출신의 컴퓨터 과학자입니다. 그는 2009년에 구글에 리캡챠를 수천만달러에 매각합니다. 그 이후 세상 사람들이 언어를 공짜로 배울 수 있도록 앱을 하나 고안해 내는데요, 그 앱이 바로 듀오링고입니다. 리캡챠와 듀오링고, 수천 수억명의 유저를 가진 프로그램을 두개나 만들어 내다니 대단한 분이시네요. (그런 의미에서 아이스크림 하나만 사주실 수 있으신가요 교수님)