LLM이 언어를 이해한다는 것과 세계를 이해한다는 것은 다른 주장이다. MIT Technology Review는 2026년 5월, 편집장 Mat Honan과 시니어 AI 에디터 Will Douglas Heaven, AI 기자 Grace Huckins를 한 자리에 모아 이 질문을 정면으로 다뤘다. 논의의 배경에는 단순한 기술 흥미가 아니라 실질적인 한계 경험이 있다. 자율 시스템이 통제된 환경을 벗어나는 순간 반복적으로 실패한다는 것, 그리고 그 실패가 언어 능력의 부재가 아니라 세계 이해의 부재에서 비롯된다는 것.
이 라운드테이블에서 언급된 포켓몬 GO 사례는 그 자체로 흥미롭다. 배달 로봇이 인치 단위의 공간 인식을 갖추는 데 증강현실 게임 데이터를 활용한다는 것은, 현재 AI 산업이 세계 모델을 어떤 방식으로 구축하고 있는지를 보여주는 단면이다. 수억 명의 사용자가 실내외를 걷고 스캔하며 업데이트한 공간 정보가, 물리 환경을 탐색해야 하는 자율 로봇에게 가장 현실적인 기반 데이터가 된다. 게임 회사가 자율화 인프라의 데이터 공급자가 되는 경로는 계획된 것이 아니라, 세계 모델에 대한 수요가 만들어낸 구조다.
Yann LeCun이 오랫동안 주장해온 방향 — 언어 없이 세계를 표현하는 능력, Joint Embedding Predictive Architecture — 이 2026년 현재 연구 가설 수준을 넘어 산업 설계 선택지로 올라서고 있다는 점도 이 라운드테이블의 시의성을 설명한다. LLM 스케일링이 한계에 부딪히는 정확한 지점을 업계 전반이 직접 체감하기 시작했고, MIT TR이 이 주제를 가장 전면에 배치한 건 그 전환의 신호다.
자동화의 안전장치를 논의할 때, 대부분의 접근은 더 나은 가이드라인이나 사용 제한에 머문다. 하지만 이 라운드테이블이 제기한 질문은 다른 층위에 있다. 시스템이 자신이 놓인 환경을 이해하지 못한다면, 어떤 규칙도 그 이해를 대체할 수 없다. 월드 모델은 기능 추가가 아니라 자율 시스템 설계의 전제 조건이다. 그 전제가 충족되지 않으면 자동화가 확장될수록 실패의 반경도 함께 커진다.