Google이 I/O 2026에서 가장 많이 쓴 단어는 '에이전트'였다. Gemini 3.5 Flash, Gemini Omni, Gemini Spark, Antigravity 2.0 — 발표 목록은 길지만 그 아래를 흐르는 메시지는 하나다. 더 나은 모델이 아니라, AI가 실행되는 인프라를 통제하겠다는 것.
Gemini 3.5 Flash는 4개월 전에 나온 Gemini 3.1 Pro를 거의 모든 벤치마크에서 앞서고 비용은 절반 이하다. 그런데 이 숫자보다 더 의미 있는 지표가 따로 있다. 하루 처리 토큰 수가 3월 5천억에서 지금 3조로 올라갔다는 것. 6배 성장은 모델 품질이 아니라 실행량의 이야기다. Antigravity 플랫폼 위에서 Flash를 돌리면 외부 프론티어 모델 대비 12배 빠른 속도가 나온다고 Google은 주장한다. 이 12배는 모델 자체가 아니라 오케스트레이션 인프라의 차이다. Antigravity 2.0이 이번에 독립형 데스크톱 앱 + CLI + SDK 형태로 외부 개발자에게 공개됐다. Google이 자사 제품을 만들 때 쓰는 것과 동일한 실행 환경이다.
Gemini Spark는 이 인프라를 소비자 수준으로 끌어내린 버전이다. Google Cloud의 전용 VM에서 24시간 실행되며 사용자가 기기를 꺼도 백그라운드에서 작업을 계속한다. Gmail·Docs 통합은 출시와 함께, MCP를 통한 서드파티 연결은 수 주 안에 추가된다. '노트북 뚜껑을 닫아도 돌아간다'는 발표 표현은 마케팅 문구처럼 들리지만 구조적으로 의미가 있다. 에이전트가 사용자 세션에 귀속되지 않고 클라우드 인프라에 귀속된다는 뜻이기 때문이다. 이 방향이 계속되면 AI 사용 경험은 '앱을 열고 요청한다'에서 '에이전트가 늘 돌고 있고 필요할 때 결과를 받는다'로 바뀐다. Daily Brief는 그 첫 번째 형태로, 밤새 이메일과 캘린더를 분석해 아침에 요약을 건네는 기능이다.
Gemini Omni의 포지셔닝도 눈여겨볼 만하다. Google은 Veo의 후계자가 아닌 generalization이라고 설명했다. 텍스트에서 영상을 만드는 단방향 모델이 아니라 생성된 출력을 다시 입력으로 넣어 반복 편집할 수 있는 구조다. Gemini 아키텍처 기반으로 처음부터 멀티모달로 설계됐다는 점에서 Veo와 근본적으로 다르다. Anthropic이 Claude Mythos로 프론티어를 좁히는 사이, Pichai는 '프론티어는 고정된 지점이 아니다'라고 답했다. 모호하게 들리지만 3조 토큰/일의 처리량과 Antigravity 인프라의 공개가 그 발언의 실체다. Google이 선택한 전선은 누가 더 좋은 모델을 만드느냐가 아닌, 누구의 인프라 위에서 AI가 실행되느냐다.