세계 최대 학술 사전 출판 저장소 arXiv가 LLM 무검증 사용에 대해 강력한 제재를 공식화했다. arXiv 컴퓨터과학 섹션 의장 Thomas Dietterich는 5월 16일 직접 공지를 통해, 저자가 LLM 출력을 검토하지 않았다는 '반박 불가능한 증거'가 발견된 논문의 저자를 1년간 차단하고, 이후 제출은 반드시 동료 심사 저널에 먼저 게재 승인을 받아야 한다고 밝혔다.
제재 트리거는 구체적이다. 실제로 존재하지 않는 논문을 인용한 환각 레퍼런스, 그리고 본문에 그대로 남아 있는 LLM 프롬프트나 응답 흔적이 대표적 증거다. 집행 절차도 명확히 정해졌다 — 모더레이터가 문제를 플래그하고 섹션 의장이 증거를 직접 확인해야 제재가 집행되며, 저자에게는 항소 기회가 주어진다. 단, 원스트라이크 룰이다.
이 정책의 핵심은 'AI 사용 금지'가 아니라는 데 있다. Dietterich는 "콘텐츠 생성 방식에 무관하게 저자가 전적인 책임을 진다"는 원칙을 명확히 했다. AI가 생성한 콘텐츠라도 저자가 검토하고 책임지면 문제없다. 문제는 검증 없이 그대로 붙여 넣는 행위다. 부적절한 표현, 표절, 편향된 내용, 잘못된 레퍼런스를 AI에게서 복붙한 저자도 그 내용에 완전히 책임을 진다.
이번 조치의 배경에는 최근 biomedical 연구 분야에서 LLM이 만들어낸 가짜 인용이 급증하고 있다는 동료 심사 연구 결과가 있다. arXiv는 컴퓨터과학·수학 분야에서 저널 게재보다 수개월 앞서 연구가 유통되는 1차 경로 — 이 공간의 신뢰도가 흔들리면 학술 트렌드 분석과 동료 간 연구 검토 전반에 파장이 생긴다. arXiv가 코넬대를 떠나 독립 비영리로 전환하는 시점과 맞물린 이번 제재는, 품질 관리에 대한 구조적 의지 표명으로 읽힌다.