Cloudflare는 최근 6개월간 전체 HTTP 트래픽의 31%가 봇에서 발생했다는 분석을 내놓았다. 그 중 AI 크롤러, 검색 에이전트, AI 어시스턴트가 약 4분의 1을 차지했고, Cloudflare 시니어 PM 라이 이 올슨은 "2027년 상반기에 비인간 트래픽이 인간 트래픽을 넘어설 것"이라고 밝혔다. 이 예측이 의미하는 건 단순한 비중의 변화가 아니다. 인터넷을 구동하는 인프라의 근본 가정 — 인간이 검색하고, 클릭하고, 스크롤하는 패턴에 최적화된 시스템 — 이 틀렸다는 선언이다.
AWS가 목요일 OpenSearch Serverless 차세대 버전을 출시하면서 그 균열을 정면으로 다뤘다. 핵심 기술 변화는 compute와 storage의 분리다. 이전 서버리스 버전은 이름과 달리 항상 최소 1개의 인스턴스를 켜두어야 했다. compute와 storage가 결합된 구조였기 때문에 에이전트가 idle 상태여도 컴퓨트 자원을 미리 확보해두지 않으면 burst 요청을 수용할 수 없었다. AWS OpenSearch 서비스 GM 티아 화이트의 비유는 직관적이다 — "항상 주차 공간 임대료를 내는 구조였다. 새 버전은 주차 미터기 방식이다." idle 시 비용이 0까지 내려가는 것은 에지 케이스 최적화가 아니라 에이전트 경제의 구조적 요건이다.
에이전트 트래픽 패턴은 인간 트래픽과 질적으로 다르다. 인간은 예측 가능한 속도로 검색하고 스크롤한다. 에이전트는 태스크 하나를 받으면 수십 개의 서브에이전트를 동시에 spin up해 수백 개의 데이터베이스와 API를 초 단위로 두드리고, 완료되면 사라진다. 이 burst-and-vanish 패턴을 기존 인프라 — 일정 부하를 가정한 용량 계획, 예약 컴퓨트, 결합된 스케일링 — 는 처리하도록 설계되지 않았다. Vercel과 Kiro와의 네이티브 통합 발표는 이 맥락에서 읽어야 한다. 개발자가 인프라를 건드리지 않고도 에이전트용 벡터 검색 백엔드를 프로덕션에 올릴 수 있게 됨으로써 에이전트 배포의 마찰이 낮아진다.
AWS가 혼자가 아니라는 점이 이 변화의 무게를 더한다. Databricks와 Snowflake는 기업 AI의 메모리·검색 레이어로 자신을 재정의하고 있고, Microsoft는 Azure에 에이전트 간 burst 처리와 공유 메모리를 추가했다. Cloudflare도 지난달 에이전트용 퍼시스턴트 환경과 즉각 확장 인프라를 별도로 발표했다. 클라우드 업계 전반이 동시에 같은 방향을 바라보고 있다. 진짜 경쟁은 누가 에이전트 인프라의 표준 레이어를 선점하느냐다. 에이전트를 싸게 돌릴수록 더 많은 기업이 배포하고, 배포가 늘수록 인프라 수요가 커진다. compute-storage 분리는 기술 사양의 변경이 아니라 그 선순환 구조의 입구를 여는 설계 결정이다.