공지
발송 시간과 구독자 리스트를 재조정 했습니다.

IT

670만 달러 가치가된 논문 플랫폼의 35년 만의 독립

arXiv가 코넬을 떠난다.

2026.03.29 |
from.
Kwangseob

들어가며

구독자님, 혹시 논문을 검색할 때 arXiv라는 이름을 보신 적 있으신가요? AI, 물리학, 수학 분야의 최신 연구를 가장 먼저 접할 수 있는 곳이에요. ChatGPT의 기반 기술부터 양자컴퓨팅의 최전선까지, 과학의 최전방은 학술지가 아니라 이 프리프린트[1]​ 서버에서 먼저 공개되고 있어요.

1991년에 물리학자 폴 긴스파그가 로스앨러모스 국립연구소에서 시작한 이 서비스는 현재 240만 편 이상의 논문을 무료로 공개하고 있고, 월간 다운로드 수는 1,000만 건에 달해요. 그런데 이 거대한 지식 인프라를 운영하는 직원은 27명이고, 연간 운영 예산은 670만 달러(약 90억 원)에 불과해요.

이 arXiv가 올해 7월 1일, 25년간 자신을 품어온 코넬 대학교를 떠나 독립 비영리법인으로 전환한다는 소식이 전해졌어요. 단순한 조직 이전이 아니에요. 이 결정의 배경에는 AI 시대가 만들어낸 두 가지 구조적 압력이 있어요.

연간 670만 달러의 줄타기 — arXiv는 왜 떠나는가

arXiv의 독립은 갑작스러운 결정이 아니에요. 창립자 폴 긴스파그 본인이 수년 전부터 권고해온 방향이에요. 핵심 이유는 돈이에요. arXiv는 2024년과 2025년 연속으로 운영 적자를 기록했어요. 2025년 적자만 29만 7천 달러(약 4억 원)예요. 코넬이 이 적자를 메워주고, 별도로 81만 9천 달러(약 11억 원)의 현물 지원까지 제공했지만, 대학 입장에서 arXiv는 항상 다른 예산 수요와 경쟁해야 하는 항목이었어요.

문제의 근본 원인은 폭발적 성장이에요. 2022년 이후 제출 논문 수가 50% 이상 급증했고, 2026년에는 연간 30만 편을 넘길 것으로 예상돼요. 2025년 9월 한 달에만 2만 6천 편이 접수되었다는 기록도 있어요.

이 성장에는 두 가지 동력이 있어요.

첫째, AI 연구 자체의 폭발. AI·머신러닝 분야의 논문 수가 기하급수적으로 늘고 있어요. arXiv의 컴퓨터 과학 편집위원장인 토마스 디트리히(오리건 주립대)는 이를 직접적인 성장 원인으로 꼽았어요.

둘째, AI가 만들어낸 논문 — 이른바 'AI 슬롭(AI slop)'. LLM으로 생성된 저품질 논문이 arXiv에 쏟아지고 있어요. 편집위원회 의장 랄프 비어스(암스테르담 대학)에 따르면, 2025년 초부터 AI 슬롭 투고가 기하급수적으로 증가했고, 거부율은 기존 4%에서 10~12%로 치솟았어요. Nature Human Behaviour에 실린 연구는 2024년 9월 기준으로 컴퓨터 과학 초록의 약 4분의 1에서 LLM 수정 흔적이 발견되었다고 보고했어요.

코넬 대학이라는 울타리 안에서는 이 두 가지 압력을 감당하기 어려웠어요. 소프트웨어 개발자를 충분히 고용할 수도, 외부 기부금을 자유롭게 모을 수도 없었거든요. 긴스파그 본인도 이 점을 인정했어요 — 대학이라는 조직은 이런 종류의 글로벌 연구 인프라를 장기적으로 유지한 경험이 없다고요.

첨부 이미지

AI 슬롭(Slop) — 과학의 속도를 위협하는 과학의 도구

AI 슬롭 문제를 조금 더 들여다볼 필요가 있어요. 이건 arXiv만의 문제가 아니라, 학술 커뮤니케이션 전체의 구조적 위기이기 때문이에요. 코넬 대학 이안 인 연구팀이 2025년 Science에 발표한 연구가 이 상황을 잘 보여줘요. 주요 프리프린트 플랫폼의 논문 200만 편 이상을 분석한 결과, LLM을 사용한 것으로 추정되는 연구자들의 논문 게재량이 33~50% 이상 증가했어요. 특히 비영어권 연구자들의 증가폭은 43~89%에 달했고요. 생산성이 올라간 건 사실이지만, 함정이 있어요 — 같은 시기에 의미 있는 연구와 양산형 콘텐츠를 구별하는 비용도 함께 치솟았다는 거예요.

arXiv는 이 문제에 단계적으로 대응했어요. 2025년 10월, 컴퓨터 과학 카테고리에서 리뷰 논문과 포지션 페이퍼[2]​의 접수를 사실상 금지했어요. 2026년 1월에는 최초 투고자에 대한 보증인 제도를 전 분야로 확대했어요 — 기존에 기관 이메일만 있으면 누구나 투고할 수 있었지만, 이제는 해당 분야의 기존 arXiv 저자로부터 보증을 받아야 해요.

그런데 여기서 딜레마가 생겨요. arXiv의 핵심 가치는 "누구나 빠르게 연구를 공유할 수 있는 개방성"이에요. 게이트를 높이면 AI 슬롭은 줄겠지만, 신진 연구자의 진입 장벽도 함께 올라가요. AI 안전 연구자 스티븐 캐스퍼는 이 정책이 초기 경력 연구자, 컴퓨팅 자원이 부족한 연구자, 윤리·거버넌스 분야 연구자에게 불균형한 영향을 줄 수 있다고 지적했어요.

개방성과 품질 사이의 긴장 — 이건 AI 시대 모든 플랫폼이 직면하는 문제이기도 해요. 위키피디아부터 X(트위터)까지, 누구나 참여할 수 있는 플랫폼은 모두 같은 질문 앞에 서 있어요.

프리프린트 대이동 — arXiv만의 이야기가 아니다

흥미로운 건 arXiv의 독립이 고립된 사건이 아니라는 점이에요. 2025년 3월, 생명과학의 bioRxiv와 의학의 medRxiv가 모체인 콜드 스프링 하버 연구소를 떠나 openRxiv라는 독립 비영리법인을 설립했어요. 이유는 arXiv와 거의 같아요 — 대학/연구소 울타리 안에서는 기부금 확대와 기술 현대화가 어렵다는 거예요. openRxiv는 첫 해에 6만 4천 편 이상의 프리프린트를 접수하며 순항 중이에요.

지금 벌어지고 있는 일은 일종의 '프리프린트 대이동'이에요. 학술 커뮤니케이션의 핵심 인프라들이 대학과 연구소의 품을 떠나 독립 비영리법인으로 재편되고 있어요. 이 흐름의 배경에는 공통된 인식이 있어요:

글로벌 지식 인프라는 한 기관의 부수적 사업이 아니라, 전용 조직이 전담해야 하는 독립 미션이다.

오스왈드의 시선

이 이야기를 읽으면서 제가 계속 떠올린 숫자가 있어요. 670만 달러 대 32억 달러. arXiv의 연간 운영 예산 670만 달러(약 90억 원), 그리고 학술 출판 최대 기업 Elsevier의 모회사 RELX가 2024년에 기록한 영업이익 32억 파운드(약 5.8조 원)예요. Elsevier의 영업이익률은 38.4%에 달해요. 이건 마이크로소프트나 구글과 맞먹는 수준이에요.

GTM 전략 관점에서 보면, 이건 기묘한 시장이에요. 연구자들이 공적 자금으로 연구하고, 다른 연구자들이 무급으로 심사하고, 대학이 다시 구독료를 내서 접근하는 구조 — 가치 사슬의 핵심 노동이 전부 무상으로 이루어지는데, 중간 플랫폼은 40% 가까운 마진을 가져가고 있어요.

arXiv는 이 구조에 대한 가장 오래된 대안이에요. 논문을 무료로 공개하고, 학술 출판의 느린 시계를 우회해서 연구의 속도를 끌어올렸어요. 그런데 이 대안 자체가 늘 자금 부족에 시달려왔다는 사실이 역설적이에요. 저는 arXiv의 독립이 성공하려면, '비영리'라는 법적 형태보다 지속 가능한 수익 모델의 설계가 더 중요하다고 봐요. 현재 270여 개 기관의 회비(최대 연 1만 달러)와 재단 기부금에 의존하는 구조는, 30만 편 시대의 운영 비용을 감당하기엔 너무 얇아요. 물론, 신성한 연구를 자본놀음으로 보다니! 라고 할 수 있지만 그건 너무 동화적 이야기 같구요...ㅋㅋ

한 가지 우려도 솔직히 말씀드릴게요. 독립 비영리법인에 대해 과학자들 사이에서 나오는 걱정 — "결국 상업화되는 거 아니냐" — 이 전혀 근거 없는 건 아니에요. 학술 출판 역사를 보면, 비영리로 시작한 플랫폼이 자금 압박 속에서 영리 기업에 인수되는 패턴이 반복되어 왔거든요. 새 CEO 연봉이 30만 달러라는 점에 대한 논란도 이 맥락에서 나온 거예요. 결국 핵심 질문은 이거예요: 지식의 유통을 공공재로 유지하면서, 그 비용은 누가 지불할 것인가? arXiv의 독립은 이 질문에 대한 35년 만의 실험이에요. 그 답이 나오기까지, 우리 모두가 지켜볼 가치가 있어요.

마치며

  • arXiv는 7월 1일 코넬에서 독립하지만, 이건 조직 이전이 아니라 '글로벌 지식 인프라를 누가 유지할 것인가'라는 질문의 표면화예요.
  • AI가 만든 이중 압력 — 연구 폭발과 AI 슬롭 — 이 기존 운영 모델의 한계를 노출시켰어요.
  • 프리프린트 서버들의 연쇄 독립은, 학술 커뮤니케이션의 거버넌스가 대학에서 전용 비영리법인으로 이동하는 구조적 전환의 신호예요.

한 가지 생각해 볼 점을 남겨드릴게요. 우리가 매일 읽는 AI 연구, 그 연구가 가장 먼저 공개되는 플랫폼이 연간 90억 원 — 테크 스타트업 시드 투자 한두 건 수준 — 으로 운영되고 있다는 사실이요. 지식의 속도를 유지하는 비용에 대해, 우리는 충분히 생각하고 있는 걸까요?

참고자료 & 더 읽기

핵심 출처

배경 지식

  • Cornell Tech, "arXiv Transition to Independent Nonprofit", 2026.
  • openRxiv, "2025 Year in Review", 2025.
  • Karl Huang, "Academic publishing is a multibillion-dollar industry. It's not always good for science", The Conversation, 2026.

 

 

 

각주

  1. [1] 프리프린트(Preprint): 학술지의 공식 심사(피어리뷰)를 거치기 전에 온라인으로 먼저 공개하는 논문이에요. 식당으로 비유하면, 정식 메뉴에 오르기 전에 셰프가 시식용으로 먼저 내놓는 것과 비슷해요. 빠른 지식 공유가 핵심 가치예요.
  2. [2] 포지션 페이퍼(Position Paper): 특정 주제에 대한 저자의 입장이나 견해를 정리한 학술 문서예요. 새로운 실험 결과를 보고하는 논문과 달리, 기존 연구를 바탕으로 주장을 펼치는 형태라서 LLM으로 생성하기 비교적 쉬운 유형이에요.
첨부 이미지

필자 안광섭은 세종대학교 경영학과 교수이자 OBF(Oswarld Boutique Consulting Firm) 리드 컨설턴트이다. 대학에서 경영데이터 관리, 비즈니스 애널리틱스 등 데이터 분석을 가르치는 한편, 현장에서는 GTM 전략과 인공지능 전략 컨설팅을 이끌며 기술과 비즈니스의 접점을 설계하고 있다. AI 대화 시스템의 기억 아키텍처(HEMA) 연구로 학술 논문을 발표했으며, 매일 글로벌 AI 논문을 큐레이션하는 Daily Arxiv 프로젝트를 운영하고 있다. 고려대학교 KBMA와 기술경영전문대 석사과정을 졸업했다. 지은 책으로 《생각을 맡기는 사람들: 호모 브레인리스》가 있다.

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

이번 뉴스레터 어떠셨나요?

오즈의 지식토킹 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !
© 2026 오즈의 지식토킹

하고 싶은 말을 합니다. 주로 기술, 인문학, 경제에 대한 이야기를 합니다.

뉴스레터 문의newsletter@oswarld.com

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 송파구 위례광장로 199, 5층 501-8호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스