Uber가 OpenAI와 함께 만든 건 단순한 채팅 인터페이스가 아니다. 하루 4,000만 건, 70개국 1만 5,000개 도시에서 실시간으로 작동하는 AI 운영 레이어다. 트래픽, 날씨, 공항 도착편, 로컬 이벤트, 수요 패턴을 동시에 읽고 기사에게 "지금 어디로 가야 하는지"를 실시간으로 알려주는 시스템 — Uber Assistant가 그 핵심이다.
Assistant의 내부 구조는 단일 LLM에 모든 쿼리를 던지는 방식이 아니다. 수익 관련 질문, 온보딩 질문, 마켓플레이스 포지셔닝 질문이 각각 다른 전문화된 에이전트로 라우팅된다. 경량 분류와 빠른 응답엔 nano/mini 모델, 복잡한 추론이 필요한 작업엔 대형 추론 모델을 투입하는 다중 에이전트 아키텍처다. 그 위에 AI Guard라는 자체 거버넌스 레이어를 올려 프롬프트와 응답 양쪽을 스크리닝하고 할루시네이션을 억제한다. 실시간 모바일 앱에서 잘못된 답변이 나오면 사용자는 즉시 이탈한다는 전제 하에, 신뢰 루프 유지가 기술 구현만큼 명시적인 설계 제약으로 다뤄졌다.
예상을 벗어난 데이터가 하나 있다. Uber Assistant는 신규 기사 온보딩 도구로 기획됐는데, 실제로는 숙련 기사들이 더 반복적으로 돌아와 후속 질문을 이어갔다. "공항 가는 게 지금 수익이 될까?" "점심 시간에 배달로 전환할까?" 이건 온보딩 툴이 아니라 매일의 운영 판단을 보조하는 인프라가 됐다는 신호다. Director of PM Dharmin Parikh는 이를 "복잡한 마켓플레이스 데이터를 해석하는 인지 부담을 줄이는 것"이라고 정의했다.
음성 기능은 OpenAI Realtime API 기반으로, 단순 음성-텍스트 변환이 아니다. "짐 5개, 일행 5명, 공항까지 좋은 차로 가고 싶다"는 한 문장을 입력받아 UberXL 추천, 저장된 목적지 매칭, 앱 UI 업데이트를 동시에 처리한다. 음성과 시각적 응답이 실시간으로 동기화된다. 시각 장애인이나 고령 사용자에게 접근성을 열어주는 동시에, 기사 측에서는 핸즈프리 앱 인터랙션이 가능해진다. 현재 미국 내 수십만 명의 기사가 베타로 접근 중이며 음성 예약은 단계적 롤아웃 중이다.
VP of Engineering Aarathi Vidyasagar의 말이 이 변화를 압축한다: "모든 운행은 이벤트의 시퀀스이고, 그 뉘앙스를 이해하고 처리하는 것이 LLM이 우리에게 가져다 준 것이다. 우리가 보유한 규모에서 그 해방감은 엄청나게 강력하다." 마켓플레이스 데이터를 언어 모델이 읽을 수 있는 추론 재료로 재정의한 것 — 이게 4,000만 건 규모에서 AI를 실제 운영에 투입하는 방식이다.