구글의 24/7 AI 비서 Gemini Spark를 일주일간 일상 업무에 투입했다. 5월 개발자 컨퍼런스에서 공개된 이 에이전트는 클라우드 VM 위에서 돌기 때문에, Pichai의 표현대로 “노트북을 닫아도” 작업이 진행된다. 항상 켜둔 데스크탑 위에서 도는 OpenClaw류와의 가장 큰 차이는 호스팅 책임을 사용자가 아닌 구글이 진다는 점이다. 통합 표면은 Gmail, Calendar, Docs, Sheets, Slides로, 컨슈머용이라기보다 ‘업무 인접 잡일’에 최적화돼 있다.
실제로 시켜본 다섯 가지에서 성격이 드러난다. Walgreens 주간 세일과 클립 쿠폰을 매칭시키고, 온라인 픽업이면 프로모 코드를 스택하는 시나리오는 상품 단위까지 정확했지만 코드 한 건은 조건을 채워도 무효였다. 당일치기 패킹 리스트는 날씨·이벤트·짐 흐름이 매끄러웠는데, 정작 결과를 Google Keep에 넣지 못한다. 노트앱 통합이 빠진 ‘personal productivity’ 포지션은 자기모순에 가깝다. 청소년 여름 활동 검색은 30분 반경 후보와 거리는 잘 뽑았지만 비용과 일정을 자발적으로 챙기지 않았고, 뉴스레터 톱5 요약은 정시에 도착했음에도 5개 요청에 4개만 돌아왔다. 링크는 google.com 리다이렉트에서 자동 이동에 실패해 한 번 더 클릭이 필요했다.
그럼에도 인상적인 지점이 있다. 주말 행사 큐레이션에서 Spark는 웹 검색과 내 Gmail 안의 지역 뉴스레터 키워드 탐색을 결합해 longtail 이벤트까지 찾아냈고, 결과에 ‘답장 한 줄’만 보내면 캘린더에 반영되는 confirm UX를 보여줬다. 매주 금요일 같은 시간에 같은 형식으로 도착하는 ‘반복 작업 슬롯’과, 사용자의 개입을 한 줄로 압축한 인터랙션 — 이 두 가지가 일회성 데모형 에이전트와 갈리는 진짜 분기점이다. 시연으로 보여줄 수 있는 능력보다, 같은 품질로 매주 반복되는 신뢰가 자동화의 본질이다.
반대로 별도 브랜드의 정당성은 끝까지 풀리지 않는다. 반복 스케줄과 가벼운 confirm 흐름은 Gemini 본체에 흡수돼도 충분하고, Keep 미통합과 깨진 리다이렉트, ‘4 vs 5’ 같은 수량 명세 미준수는 별도 제품으로서의 완성도를 의심하게 만든다. 그러니 다음 빌드의 평가 잣대는 분명하다. 새로운 시연이 늘었는가가 아니라, 지난주 금요일 아침 8시에 약속된 요약이 같은 품질로 도착했는가, 사용자가 거든 분량은 줄었는가다. 에이전트 시대의 비교는 이제 그 축으로 옮겨가야 한다.