Anthropic이 Claude Enterprise 고객을 대상으로 Claude Security 공개 베타를 시작했다. Claude Opus 4.7을 활용해 코드의 취약점을 스캔하고 패치 방향을 제안하는 제품이다. 표면적으로는 AI 기반 보안 스캐너처럼 보이지만, 이번 발표에서 더 중요한 부분은 모델 성능 자체보다 그것을 어디에 배치했느냐다.
Anthropic은 Claude Security가 알려진 취약점 패턴만 대조하는 방식이 아니라, 여러 파일과 모듈 사이의 상호작용을 분석한다고 설명한다. 결과에는 severity, reproducibility, confidence score가 붙는다. 보안팀이 “위험해 보인다”는 리포트를 던지는 데서 끝나는 것이 아니라, 개발팀이 무엇을 먼저 확인하고 고칠지 판단할 수 있도록 구조화하려는 시도다.
제품 기능도 그 방향을 보여준다. 공개 베타에는 scheduled scan, CSV export, Slack과 Jira 연동이 포함됐다. 정기적으로 코드를 훑고, 결과를 알림과 티켓으로 넘기며, 필요하면 보고용 데이터로 빼낼 수 있다. AI 기능을 별도 콘솔에 가둬두는 대신 기존 보안·개발 파이프라인 안으로 넣겠다는 설계다.
배경에는 더 큰 긴장이 있다. Anthropic은 최근 Mythos라는 모델을 공격 능력이 너무 강하다는 이유로 공개하지 않았다. 영국 사이버보안 기관의 독립 리뷰도 이 모델이 약한 비보호 네트워크를 상대로 강한 공격 역량을 보였다고 확인했다. 기사에서는 OpenAI의 GPT-5.5도 비슷한 능력을 갖춘 것으로 언급된다. 공격자 쪽에서 AI 활용이 빨라지는 만큼, 방어자도 같은 수준의 분석 능력을 갖춰야 한다는 메시지가 Claude Security의 출발점이다.
물론 이것이 곧 자동 보안의 완성을 뜻하지는 않는다. false positive는 여전히 비용이고, confidence score가 검증을 대신할 수는 없다. 재현 가능성이 낮은 취약점 보고는 개발팀의 신뢰를 빠르게 깎을 수 있다. 특히 강한 모델일수록 설득력 있는 설명과 실제로 재현 가능한 취약점을 구분하는 절차가 중요해진다.
그래도 이번 발표의 방향은 분명하다. AI 보안 제품의 경쟁력은 화려한 공격·방어 시연보다 발견, 우선순위화, 티켓화, 패치 제안, 재검증으로 이어지는 반복 루프를 얼마나 줄여주느냐에 달려 있다. CrowdStrike, Palo Alto Networks, SentinelOne, Wiz가 Opus 4.7을 자사 보안 제품에 통합한다는 점도 이 흐름을 강화한다. 공격자에게 AI가 속도를 준다면, 방어자에게 필요한 것은 그 속도를 흡수할 수 있는 업무 구조다.