Anthropic이 Opus 4.8을 공개했다. TechCrunch 보도에 따르면 이번 모델은 Opus 4.7 출시 이후 41일 만에 나왔다. Anthropic의 평소 업데이트 주기와 비교하면 빠르다. 가격은 이전 Opus와 같은 수준으로 유지된다. 배경에는 Opus 4.7에 대한 미지근한 반응, 그리고 OpenAI Codex와 Google Gemini Flash의 최근 움직임이 있다.
이번 발표에서 눈에 띄는 부분은 Dynamic Workflows다. Anthropic은 이 기능을 연구 프리뷰로 내놓으며, Opus 같은 대형 모델이 복잡한 작업을 수백 개의 병렬 서브에이전트로 나눠 처리하도록 설계했다고 설명했다. 단일 모델이 긴 답변을 잘 쓰는 경쟁에서, 여러 에이전트를 묶어 하나의 작업 흐름으로 운영하는 경쟁으로 무게가 옮겨가는 장면이다.
가장 구체적인 예시는 Claude Code와의 조합이다. Anthropic은 Opus 4.8이 Claude Code와 함께 수십만 줄 규모의 코드베이스 마이그레이션을 kickoff부터 merge까지 수행할 수 있고, 기존 테스트 스위트를 기준선으로 삼는다고 밝혔다. 이 설명이 중요한 이유는 명확하다. 대규모 자동화는 멋진 데모보다 검증 기준이 먼저 필요하다. 테스트가 기준선이 될 수 있을 때, 에이전트 작업은 비로소 팀 워크플로 안으로 들어온다.
Opus 4.8의 모델 개선 방향도 이 흐름과 맞물린다. Anthropic은 초기 테스터들이 새 모델이 불확실성을 더 자주 표시하고, 근거 없는 주장을 덜 한다고 봤다고 설명했다. Bridgewater Associates의 코멘트 역시 입력과 출력의 문제를 모델이 먼저 짚는 경향을 차이점으로 언급했다. 수백 개의 서브에이전트를 병렬로 굴리는 환경에서는 이 능력이 꽤 중요하다. 작은 오판이 빠르게 퍼질 수 있기 때문이다.
다만 Anthropic은 더 앞선 Mythos-class 모델은 아직 공개하지 않았다. 지난 프리뷰 이후 사이버보안 우려가 있었고, 필요한 safeguard가 준비되면 몇 주 안에 고객에게 제공할 수 있다고만 밝혔다. 그래서 Opus 4.8 발표의 메시지는 두 갈래다. 한쪽에서는 모델 성능과 작업 자동화의 속도를 끌어올리고, 다른 한쪽에서는 그 속도를 감당할 안전장치와 운영 기준을 마련하려 한다.
AI 도구 경쟁은 이제 단순히 더 좋은 답변을 생성하는 문제에 머물지 않는다. 코드베이스 전체를 읽고, 작업을 쪼개고, 병렬로 실행하고, 테스트를 통과시키고, 문제가 있는 입력을 의심하는 시스템으로 이동하고 있다. Opus 4.8과 Dynamic Workflows는 그 전환을 꽤 직접적으로 보여주는 발표다.