지식은 공유되어야 합니다. 지식 조각 하나하나는 큰 의미가 없지만, 작은 퍼즐 조각이 모여 큰 그림이 완성되면 비로소 우리의 생활을 바꿀 수 있기 때문이지요. 특히 과학기술이 더 그렇습니다. 우리 손에 들어오는 제품을 만들기 위해서는 수많은 특허와 논문이 유기적으로 엮여야 하고, 한 사람의 손으로 그 많은 지식을 모두 생산할 수는 없기 때문이지요. 아무리 혁신적인 지식이라 해도 접하기 어렵고 읽고 이해할 수 없다면 그 의미는 퇴색될 수밖에 없습니다.그러면 학술논문 한 편의 가격은 얼마나 할까요? 학술지마다 논문에 매기는 가격은 다릅니다만, 보통 논문 한 편을 열람하는 데 한화로 5만 원에서 10만 원 정도의 비용을 청구합니다. 개인이 지불하기에는 상당히 부담스럽지요. 적극적으로 자료를 수집할 때는 하루에 논문을 수십 편 다운로드해서 내용을 분석하기도 하는데, 하루에 논문 열람 비용만 백만 원씩 지출하게 되겠지요. 이 정도까지는 아니더라도 논문 한 편을 읽을 때마다 돈을 내야 한다면 연구자들이 새로운 논문을 덜 읽게 될 겁니다.이런 사태를 막기 위해, 대학교나 연구소와 같은 대부분의 연구 기관에서는 학술지 단체 구독을 하고 있습니다. 기관 인터넷을 사용해서 구독 중인 학술지 사이트에 접속하면 별도의 돈을 내지 않고도 논문을 열람할 수 있지요. 지불 장벽(paywall)이 사라지는 겁니다. 하루에 논문 몇 편을 보더라도 추가 비용이 발생하지 않고, 원하는 만큼 논문을 다운받고 읽을 수 있습니다.짐작하시겠지만, 기관의 학술지 단체 구독은 매우 비쌉니다. 서울대학교가 2021년에 엘스비어(Elsevier) 출판사에 지불한 구독료가 27억 원으로, 2016년에 비해 6억 원 오른 가격이었습니다. 구독해야 하는 출판사가 한두 곳이 아니기 때문에 학술지 구독에 투자한 총 비용은 더욱 크겠지요. 현대의 학술지 산업은 아주 큰 비즈니스입니다.돈이 모이는 곳에는 도둑도 모일 수밖에 없지요. 저작권을 훔치는 도둑은 보통 해적(pirate)이라고 부르는데요, 학술지 업계에는 의적을 자처하는 해적이 하나 있습니다. 세계 주요 학술지에 발표된 논문을 모조리 다운로드하여 누구나 무료로 열람할 수 공개해 버리는 사이트입니다. 바로 사이허브(Sci-Hub)이지요.사이허브는 카자흐스탄 사트바예프 대학교의 대학원생이었던 알렉산드라 엘바키얀(Alexandra Elbakyan)이 만들었습니다. 엘바키얀은 소프트웨어 연구자이면서 보안 전문가였는데, 사트바예프 대학교에서 구독하던 학술지가 부족해서 논문을 읽고 연구를 하는데 애로사항이 많았다고 해요. 엘바키얀은 처음에 연구자들끼리 도서관 아이디·비밀번호를 공유하는 사이트에 들어가서 논문을 다운로드받았습니다. 그러다가 사용자 개개인의 정보 공유를 넘어서 모든 학술논문을 자동으로 저장하고 공개하는 시스템의 아이디어를 떠올리게 된 거죠.사이허브가 도대체 어떻게 논문 파일을 구하는지는 공식적으로 알려져 있지는 않습니다. 엘바키얀이 어느 인터뷰에서 밝힌 바에 따르면, 사이허브는 세계 각지의 대학교나 연구소 구성원들의 도서관 아이디·비밀번호를 보유하고 있다고 해요. 지식 공유의 ‘대의’에 동참하는 연구자들에게 기증받았다고 알려져 있긴 하지만 피싱으로 훔쳐냈다고 의심하는 사람도 있습니다.당연하지만 사이허브는 출판사들에게는 눈엣가시입니다. 이전에도 언급했지만, 학술논문 출판사들의 사업모델은 논문을 작성한 저자들에게는 특별히 출판비를 받지 않지만 논문을 읽는 구독자들에게 많은 돈을 청구하는 방식입니다. 그런데 사람들이 사이허브를 통해 무료로 논문을 다운로드받으면 출판사의 수익이 줄어들 수밖에 없지요.엘스비어(Elsevier)나 미국화학회(ACS) 등의 대형 출판사들은 끊임없이 사이허브에 소송을 거는 중입니다. 이 소송은 일부 성공해서 사이허브가 처음 사용하던 도메인(.org)을 차단했고, 엘바키얀은 미국 정부를 피해 숨어 지내는 중입니다. 하지만 사이허브는 지속적으로 도메인을 옮겨다니는 중이라 현재도 사이허브에 접속해서 논문을 다운받는 데는 큰 지장이 없습니다. 출판사들이 소송전을 확대하는 중이지만 사이허브가 접속 차단을 우회하는 전략을 상당히 많이 갖고 있고 이 중에는 토르(Tor) 브라우저 등의 다크웹까지 포함하기 때문에 결국 완전한 차단은 어려울 것으로 보이지요.사이허브의 주 이용자층은 누구일까요? 기관 예산이 부족해서 학술지 구독을 충분히 하지 못하는 3세계 국가가 많습니다. 중국, 브라질, 인도, 이란 등의 국가들이 많은 비중을 차지하지요. 하지만 의외로 세계 2위 접속 국가는 미국입니다. 저 역시 대학원생 시절 동료들이 사이허브를 사용하는 모습을 많이 보았고, 학회장에서도 조금만 돌아다니면 자연스럽게 사이허브에서 논문을 다운받는 사람을 볼 수 있었습니다. 사실상 전 세계의 모든 연구자들이 사이허브를 사용하고 있어요.사이허브의 확장이 어떤 결과를 가져올지에 대해서는 예상이 갈립니다. 출판 생태계 자체가 붕괴해서 지식 공유가 퇴보할 것이라고 주장하는 사람도 있고, 반대로 경계 없이 지식이 공유되면서 과학의 발전에 기여할 것이라고 말하는 사람도 많습니다. 개인이 사이허브에서 논문을 다운받는 것이 부도덕한 도둑질이라고 생각하는 사람도 있는 반면 거대 출판사에 대한 정당한 저항이라고 생각하기도 합니다. 다만 사이허브라는 사업모델 자체가 출판 산업에 대한 반감에서 출발한 만큼, 지식의 공유를 확대하고 결제 장벽을 줄이거나 없애야 한다는 공감대는 충분히 있는 것 같아요.사이허브처럼 법적 문제를 일으키지 않고 저작권법의 테두리 안에서 지식 공유를 확대하려는 흐름은 크게 두 가지가 있습니다. 첫째는 논문 원고 자체를 출판사의 편집을 거치지 않고 온라인에 공개하는 견본인쇄(preprint) 운동이지요. 코넬대 도서관에서 운영하는 아카이브(arXiv)가 대표적인데요, 이곳에는 누구나 자신이 작성한 논문 원고를 게시할 수 있고 누구나 무료로 그 파일을 다운받을 수 있습니다. 이미 인공지능 학계에서는 출판사를 거치지 않고 아카이브에 논문을 게재하는 것이 표준으로 자리잡았지요. 다만 아카이브에는 동료 학자들에게 검증되지 않은 내용도 누구나 게시할 수 있기 때문에 아카이브에 게재된 논문을 읽을 때는 주의할 필요가 있습니다.두 번째는 제도권 출판사에서 추진하는 오픈액세스(open access) 운동입니다. 최근 대부분의 출판사가 지원하고 있는 방식인데요, 저자에게는 출판비를 받지 않고 구독자에게 돈을 받는 기존 방식 대신, 저자가 출판 당시에 수백만 원 정도의 비용을 지불하면 누구나 무료로 다운받을 수 있도록 하는 방식이지요. 다만 비용 부담을 저자에게 전가한다는 점에서 여전히 가난한 국가나 기관에게 불리한 방식이라는 비판이 있습니다. 실제로 인공지능 학계에서는 오픈액세스 운동을 비판하고 완전히 무료인 지식 공유를 지지하는 성명을 발표한 바 있지요.사이허브를 둘러싼 소송전과 논쟁이 어떻게 끝날지, 학술지 생태계가 어떻게 영향받을지 현재로서는 예상하기 어렵습니다. 다만 사이허브가 터뜨린 논쟁 덕에 지식 공유의 장벽을 무너뜨리는 압력이 발생하고 있는 건 분명하지요. 어떤 학자들은 엘바키얀을 ‘과학계의 로빈 후드’라고 부르기도 합니다. 치열한 논쟁 덕에 좀 더 효율적인 지식 공유의 장이 열릴지 지켜봐야겠습니다.
댓글
의견을 남겨주세요