CNN이 뉴욕 법원에서 Perplexity를 상대로 저작권 소송을 냈다. 표면적으론 또 한 건의 'AI 학습 데이터' 분쟁처럼 보이지만, 소장을 읽으면 이번 건은 학습이 아니라 출력의 문제다. 핵심 주장은 두 가지. Perplexity의 AI 답변 엔진이 CNN 기사 본문을 '실질적으로 동일한(verbatim)' 분량까지 그대로 출력하고, CNN의 구독 페이월 뒤에 있는 콘텐츠까지 사용자에게 풀어 보여준다는 것이다.
특히 인상적인 건 소장에 박힌 한 가지 시연이다. CNN의 미니애폴리스 후속 기사 'What's next for Minneapolis? A shaky promise, mounting tensions and the fight for control'의 제목을 그대로 프롬프트에 입력하는 것만으로 본문의 상당 부분이 그대로 복원됐다는 주장이다. '제목 한 줄 → 본문 복원'이 가능했다면, 법정 입장에선 학습 데이터의 출처를 캐는 추상적 다툼이 아니라, 출력 자체가 곧 증거물이 되는 깔끔한 사건이 된다.
타임라인도 깨끗하지 않다. 2025년 10월 두 회사는 Comet Plus 구독 안에 CNN 콘텐츠를 묶는 협의를 진행했지만, 'Perplexity가 답변에서 CNN 콘텐츠를 어디까지 사용할 수 있느냐'를 포함한 여러 쟁점에서 합의에 실패해 11월에 결렬됐다. 이후 CNN은 사용 중지와 트레이드마크 사용 중단을 요구하는 서한을 보냈고, 소장은 Perplexity가 응답하지 않았다고 적는다. 더해서 CNN은 자사가 식별·차단을 시도한 정체불명 크롤러를 Perplexity가 무시했다고 본다. Perplexity 대변인 Jesse Dwyer의 공식 답변은 단 다섯 단어, "You can't copyright facts." 한쪽은 취재 노동과 문장 구성을 보호받는 표현으로 묶고, 한쪽은 그것을 사실의 전달로 깎아내리려는 프레임 싸움이다.
그리고 이건 외로운 소송이 아니다. NYT, Encyclopedia Britannica, Merriam-Webster, WSJ를 가진 News Corp, 거기에 Amazon과 Reddit까지 — 콘텐츠 제공자와 거대 플랫폼이 동시에 한 회사를 둘러싸고 있다. Comet이라는 에이전트 브라우저와 답변 엔진을 함께 키우는 회사 입장에서, 답변 품질의 원천 자체가 가장 큰 법적 표면이 되어버린 상황이다. 다음 라운드에서 진짜로 다툴 것은 'verbatim의 임계치', '페이월 콘텐츠가 답변으로 노출됐는지', '크롤러 차단 신호를 의도적으로 무시했는지' 세 가지다. 이 세 가지에 대한 사실 인정 자체가, 사실상 AI 검색·브라우저 업계 전체의 출력 가드레일 표준이 될 가능성이 크다.