이전 뉴스 레터에서 가짜 뉴스의 가능성을 이유로 생성 인공지능의 규제의 필요성이 타당한가를 살펴보았습니다. 특히 인공지능이 가짜 뉴스에 의한 선거 혼탁으로 민주주의를 위협한다는 주장이 설득력이 있는가에 대해 논의했습니다.
인공지능은 과거에도 여러 번 세상을 뒤집어 놓을 것이라는 기대를 갖게 만들었습니다. IBM의 인공지능 체스 프로그램이 세계 체스 챔피언을 물리쳤을 때나, 빅 블루 (Big Blue)의 인공지능 수퍼 컴퓨터가 미국의 인기 있는 "Jeopardy!" TV 게임 쇼에서 인간 챔피언을 압도적으로 물리쳤을 때, 구글의 알파고(AlphaGo)가 이세돌을 압도적으로 물리쳤을 때도 인공지능이 곧 인간을 능가해서 세상을 뒤집어 놓을 것이라는 흥분과 또한 인간을 초월하는 기술의 승리를 점치는 예측들이 난무했다.
ChatGPT가 인공지능의 대중화의 획기적 전기를 마련하고 있다는 점에는 이의가 없다. 하지만 최근 인공지능의 규제를 주장하는 논리들은 이론적 또는 실증적 근거가 있다기 보다는 새로운 것에 대한 막연한 공포와 이해집단들의 논리가 범벅이 된 것이 참으로 많다.
그중 하나가 인공지능이 사람들의 지적 재산권을 침해하고 있다는 주장이다. 이런 우려가 현실화된 이유는 현재 주목받고 있는 생성 인공지능 (OpenAI의 ChatGPT, 구글의 Bert 등)의 디지털 콘텐츠 생산 능력 때문이다. 이들 기술의 특징을 대변하는 GPT는 Generative (생성), Pre-trained (사전 훈련된), Transformer (변형)의 약어로 이 기술은 인간의 대화를 인식하여 디지털 콘텐츠 (문서, 이미지, 동영상, 음악, 컴퓨터 코드 등)을 생성에 촛점을 둔 인공지능이다. 인간의 대화에 대한 인식 능력을 높이기 위해 제작 회사들은 인터넷의 정보, 위키피디아, 도서 등 방대한 자료를 활용해서 미리 훈련(training)을 시켰기에 자연어 처리 능력이 획기적으로 높은 인공지능이 탄생했다. 인간의 언어는 매우 복잡하다. 같은 단어라도 상황에 따라 수많은 뜻을 가질 수 있다. 이런 이유로 GPT-3 기술은 무려 1650억 개의 변수(parameters)를 사용해서 훈련을 시킨 것이다. 이런 거대 모델을 돌리는 것은 막대한 전산 자원을 필요로 한다. 지금의 기술이 IT 대기업의 지원이나 주도 하에 개발되고 있는 지를 알 수 있는 사항이다.
이렇게 인간의 자연어를 이해하고 나서 우리가 요청하는 결과물 (디지털 콘텐츠)를 생성하는 방식이 결국은 인간이 생성해온 기존 자료들을 결합해서 사용자의 요구에 부합하게 변형(Transform)하는 방식이다. 비판적으로 말하는 사람들은 '짜집기'를 한다고 한다.
이런 특징으로 저작물의 지적 재산권을 갖고 있는 사람들은 생성 인공지능의 저작권이 있는 창작물들을 저작권자의 허락없이 사용하여 훈련시키고, 이들을 활용해서 결과물을 생성하는 것을 제한하거나 인공지능 기술 개발회사들이 저작권에 대한 보상을 해야 한다고 주장한다. 이런 주장을 받아들여서 일부에서는 지적 재산권의 분쟁 때문이라도 새로운 인공지능에 대한 규제의 틀이 마련되어야 한다고 목소리를 높이고 있다.
그들의 주장을 요약하면 다음과 같다.
1. 저작권이 있는 콘텐츠 (Copyrighted content)를 바탕으로 생성 AI를 훈련시키는 것은 지적 재산권의 절도(theft)에 해당한다.
우리는 여기서 인간들이 어떻게 학습하고, 영감을 얻고, 창작을 하는 지를 상기할 필요가 있다. 인간들은 다른 사람들과 다른 사람들의 창작물로부터 영감을 얻고 배우려고 한다. 이것을 절도라고 주장하는 사람들은 없다. 우리는 "태양 아래 새로운 것은 없다"라는 말을 종종한다. 우리가 생성하는 모든 콘텐츠는 세상의 그 어떤 것과 도 관련이 없는 진공 상태의 산물이 아니다. 다른 사람의 책을 읽고 그림과 예술품을 보고, 음악을 듣고, 공연을 보고 배우고 영감을 얻는다. 이런 과정에 우리는 지적 재산권에 대해 절도 혐의를 받지 않고 거꾸로 사회는 이런 학습과 영감의 기회를 지지한다. 책을 읽고, 전시회를 가고, 공연을 가는 일이 권장되고 정부는 이러한 활동을 지지하기 위해 천문학적인 세금을 쓴다. 왜 인공지능에는 다른 잣대가 적용되어야 하는가?
2. 생성 AI는 저작권자의 명시적 허락이 없이는 저작권이 있는 콘텐츠에 기반으로 한 인공지능의 훈련이 허락되어서는 안 된다.
위에서 제시한 반론과 같다. 인간들은 저작권이 있는 그림, 글, 영화, 공연을 보고 학습을 하고, 거기서 힌트와 영감을 받아서 자신의 미래 컨텐츠 생성에 활용한다. 이때 저작권자의 명시적 허락이 필요하지 않다. 저작권이 있는 사람들이 전시를 하고, 책을 출간하고, 영화를 상영하고, 게임을 팔고, 공연을 하면 우리는 합법적으로 그 산출물들에 대해 접근권을 갖게 되고 그 접근은 늘 권장된다. 우리가 접근이 허용된 콘텐츠를 보고 배우고 영감을 얻는데 저작권을 가진 권리자들에게 명시적 허락을 얻지 않는다. 인스타그램의 사진, 페이스북윽 좋은 글, 인스타그램의 놀라운 사진, 틱톡과 유튜브의 동영상 등 인터넷의 콘텐츠는 물론 갤러리에 가서 그림을 보며 그림 작가에게 이 그림 봐도 되느냐고 허가를 구하거나, 좋아하는 노래를 부르면서 작곡가의 허락을 구하지 않는다. 하지만 이런 콘텐츠를 소비하면서 우리는 영감을 얻고, 배우고 나 자신의 콘텐츠를 만들 수 있는 훈련(training)을 하는 것이다. 그렇다면 인공지능은 인간들과 달리 명시적 허락을 받아야 할 이유가 명확하지 않다.
3. 생성 AI는 저작권자들의 콘텐츠를 활용해서 훈련하는 것에 대해 저작권자에게 보상을 해야 한다.
저작권자들은 다른 사람들이 자신의 작품을 통해 학습하고, 영감을 얻는 경우에 대해 보상을 요구하지 않는다. 저작권을 그대로 사용하며 이익을 얻는 행위를 할 때만 저작권료를 요구한다. 이러한 보상 요구는 종종 저작권자 개개의 기여를 과대 계상하는 오류를 범한다. 생성 AI 모델의 크기는 거대하다. 즉 수많은 디지털 콘텐츠를 통해 학습을 하기 때문에 개별 콘텐츠의 기여는 무시할 만큼 적은 경우가 대부분이다.
세상에는 기여의 크기가 작은 것들은 시장에서 보상을 받지 못하는 경우가 허다하다. 우리가 매일 올리는 소셜 미디어의 콘텐츠도 플랫폼 회사에게는 광고 수입의 원천이다. 페이스북의 글, 인스타그램의 그림, X (트위터의 새로운 이름)의 짧은 소식들을 보러 사람들이 몰려들고 그를 통해 플랫폼 회사들은 거대한 부를 만든다. 하지만 원래 콘텐츠를 올리는 사용자들은 대부분 직접적인 금전적 보상을 받지 못한다. 개별 콘텐츠의 기여는 아주 보잘것없기 때문이다. 신문이나 잡지도 개별 기사를 판매하기는 용이하지 않다. 그래서 월 구독료로 수많은 기사들을 묶어 팔기 (Bundling)를 하는 것이다.
4. 인공지능이 명시적 승인없이 어떤 예술가의 스타일(예술 풍)을 따라 디지털 콘텐츠를 생산하는 것은 금지해야 한다.
사람들은 어떤 예술가의 스타일에 따라 시를 쓰고, 음악을 만들고, 그림을 그리는 것은 완벽하게 합법적이다. Dr. Seuss 스타일이나 김소월 스타일로 시를 쓰는 것, 루이스 암스트롱의 스타일의 노래를 만드는 것이 합법적이고 우리는 자기가 좋아하는 예술가의 스타일에 따라 창작을 하는 것을 '오마주' 한다며 자랑한다. 생성 AI라고 이 자유를 불허할 타당한 이유는 없다.
5. 생성 AI 시스템들이 저작권이 있는 콘텐츠의 일부 조각을 인공지능 산출물에 사용하는 것을 허용되어서는 안 된다.
이러한 주장은 생성 AI 시스템이 어떻게 작동하는지에 대해 이해가 옅은 상태에서 하는 주장이다. 생성 AI는 기존 존재하는 콘텐츠를 재조합(remix)해서 산출물을 생산하지 않는다. 그들은 다양한 소스에서 작은 샘플들을 취하고, 조금씩 수정하고 새로운 순서로 재배열하고 조합해서 산출물을 만드는 것이 아니다. 새로운 인공지능 시스템은 사용자들의 구체적인 요구에 부응하는 놀라울 정도로 복잡한 예측 모델 (Prediction models)을 훈련시키고, 그 모델들이 현실적인 사용자의 요구에 즉각적으로 대응하는 산출물을 만들어 내는 것이다. 이는 흔히 사람들이 하는 짜집기나 표절의 방법이 아니다. 콘텐츠를 통해 훈련을 받은 모델이 사용자 요구에 따라 새로운 콘텐츠를 만드는 것이지 기존 콘텐츠로부터 Copy & Paste를 하는 것이 아니다.
인공지능의 학습을 저작권을 이유로 규제하려는 것은 논리적 근거가 매우 희박하다. 거꾸로, 우리가 진정 걱정해야 하는 것은 생성 AI가 인간의 저작물의 저작권을 침해하는 경우가 아니다. 그 반대다. 인공지능이 생성한 산출물을 자신이 만든 것인 양 사용하고 저작권을 주장하는 인간들이 더 문제다. 배움이 없이 AI가 대신해준 숙제를 제시되는 학생들의 경우가 그런 경우다.
그리고 인간이 인공지능의 능력을 활용해서 위조물(forgeries) 만들어 내고, 저작권 침해의 작품을 만들어내고 배포하고, 다른 사람으로 가장하는 사용자들의 오용이 문제다. 음식을 만드는 칼을 소수의 인간이 살인에 쓰인다고 칼을 비난할 수는 없다. 보통 사람들의 콘텐츠 생산 능력을 크게 향상시키는 새로운 기술이 나왔다고 기술을 비난하는 것은 칼이 폭력의 원인이라는 것과 하등 다르지 않다.
P.S. [1] 이글은 Center for Data Innovation의 보고서 "Critics of Generative AI Are Worrying About the Wrong IP Issues (Daniel Castro, March 20,2023)를 기반으로 작성되었습니다.
이글은 인공지능의 규제 논리에 대한 비판적 글의 두 번째 글입니다. 다음은 인공지능이 인간의 지능을 능가해서 인간을 지배하는 "Super-intelligence"가 되어 인간의 존재를 파괴하는 위협에 이를 것이고, 인간의 일자리가 다 없어지는 기술과 경제의 특이점(Singularity)에 도달할 수 있다는 우려에 대한 비판의 글을 보내 드리겠습니다.
[2] 또 뉴스레터 구독자 '새들처럼'님과, '김지윤'님이 커피 선물권을 보내 주셨습니다. 9.14일 현재 821명의 귀한 자유인들이 구독을 해 주셨습니다. 깊이 감사를 드립니다.
[3] 구독자님께서 팬앤드마이크의 "이병태 칼끝" 경제 방송을 언제 재개하느냐는 질문을 주셨습니다. 지금 경제 방송에 대해 아직 마음을 정하지 못하고 있습니다. 정규재 주필이 건강을 회복하시고 복귀하면 분명히 재개하고 싶다는 말씀만을 현재는 드릴 수 있습니다.
댓글
의견을 남겨주세요