공격자가 AI를 쓰기 시작하면서 취약점 익스플로잇 시간이 '주 단위'에서 '시간 단위'로 압축됐다. 보안 연구자 Himanshu Anand는 대형 언어 모델이 패치 diff를 분석해 수 분 안에 작동하는 익스플로잇을 만들 수 있다며 소프트웨어 벤더의 90일 유예 기간 폐지를 공개적으로 요구했고, Anthropic의 Claude Mythos Preview는 통제된 접근 환경에서 수천 개의 취약점을 발견한 것으로 알려졌다. 기존 수동 패치 프로세스로는 이 속도를 따라갈 수 없다. Google Cloud가 이 전제에서 출발한 플랫폼 'AI Threat Defense'를 공개한 배경이다.
플랫폼의 핵심은 네 기술의 통합이다. 2025년 3월 $32B에 인수한 Wiz가 기업 IT 환경에서 노출된 서버·API·크리덴셜을 스캔하고, 에이전트가 그 중 실제로 익스플로잇 가능한 항목을 시뮬레이션한다. Gemini가 코드 수준 분석을 담당하고, Mandiant가 실전 공격 사례 기반 인텔리전스를 더한다. 가장 주목할 구성요소는 DeepMind의 Codemender다. 이 에이전트는 단순히 취약점을 보고하는 데 그치지 않고 개발 환경 안으로 직접 진입해 취약한 코드를 교체하며, 레거시 코드베이스를 메모리 안전 언어로 통째로 재작성하기도 한다. 배포 전에는 자동으로 테스트를 생성하고, 어떤 모델이 어떤 패치를 만들었는지 추적할 수 있다.
스캐닝 설계에서 흥미로운 선택이 있다. 구글은 단일 최강 모델 대신 여러 모델을 동시에 운용하는 전략을 택했다. 애플리케이션 로직, 클라우드 설정, 바이너리 분석 각각에서 가장 잘 수행하는 모델이 다르다는 이유에서다. 저비용 모델은 상시 점검 루프에 쓰고, 프론티어 모델은 가장 중요한 시스템에만 집중시킨다. 라이브 환경에서는 Google Security Operations 에이전트가 별도로 활성 공격을 탐지한다. Google Cloud COO Francis deSouza는 경쟁사와의 차이를 이렇게 요약했다: 다른 곳은 경보 목록을 줄 뿐이고, 우리는 완성된 패치를 배포한다.
그러나 검증이 필요한 부분이 남아 있다. 에이전트가 운영 코드를 자율적으로 수정할 때 오류가 발생하면 책임 소재가 불명확하고, 자동 생성 패치의 실제 프로덕션 신뢰성은 아직 충분히 검증되지 않았다. Accenture·Deloitte·PwC·Netenrich·TENEX.AI 같은 구현 파트너가 필요하다는 사실 자체가 완전 자율화와의 거리를 방증한다. 이 플랫폼의 의미는 결국 여기에 달려 있다 — 보안팀의 역할이 '경보를 트리아지하는 사람'에서 '에이전트를 감독하는 사람'으로 전환되는 속도가 자동화의 신뢰성과 정확히 비례할 것이다.