Mistral이 새 플래그십 Medium 3.5를 공개했다. 128B 파라미터에 256K 컨텍스트, dense 구조다. 챗과 추론, 코드를 따로 만들지 않고 한 모델 안에 합쳤다. 추론은 reasoning_effort라는 쿼리 파라미터로 토글되는데, 이 변화로 Le Chat에서는 Medium 3.1과 Magistral 추론 모델이, Vibe CLI에서는 Devstral 2가 사라진다. 별도 reasoning 모델을 따로 두던 산업 트렌드가 빠르게 정리되는 신호로 읽힌다.
흥미로운 건 사이즈 선택이다. 같은 회사의 Large 3은 675B MoE에 토큰당 41B만 활성하고, Small 4는 119B에 6B만 활성한다. 그런데 플래그십만 모든 128B를 매 토큰마다 깨우는 dense를 택했다. Deepseek과 Qwen이 같은 품질에서 추론 단가를 낮추려 MoE로 가는 흐름과 정반대다. 비싼 inference를 감수하고도 단일 모델 운영성과 프로덕션 안정성을 가져가겠다는 판단이다. 자체 발표 기준 SWE-Bench Verified 77.6%, T3-Telecom 91.4%지만 banking 시나리오에서는 Claude에 크게 밀린다는 점도 같은 자료에 솔직하게 들어 있다. API 가격은 입력 100만 토큰당 $1.50, 출력 $7.50.
모델 자체보다 더 큰 변화는 코딩 도구 Vibe다. 로컬 세션을 히스토리·태스크 상태·승인 흐름까지 그대로 클라우드로 이전해서 비동기 에이전트 여러 개를 동시에 돌릴 수 있다. 각 에이전트는 격리된 샌드박스에서 일하고, 끝나면 풀 리퀘스트를 연다. GitHub, Linear, Jira, Sentry, Slack, Teams가 통합되어 있고, 타깃 유스케이스로는 모듈 리팩터, 의존성 업그레이드, 테스트 생성, 버그 수정이 명시됐다. 기반 워크플로는 엔터프라이즈용으로 만들어 둔 Mistral Studio다. OpenAI, Anthropic, Cursor가 이미 같은 방향을 가고 있다는 점에서 새 카테고리라기보다 표준화 단계로 보는 게 맞다.
Le Chat에는 Work Mode가 추가됐다. Medium 3.5 위에서 도는 멀티스텝 워크플로 모드인데, 메일·캘린더·문서 커넥터가 기본 ON이다. 사용자는 빠르게 시작할 수 있지만 데이터 경로에 대한 책임은 더 무거워진다. 그래서 외부 메시지 발송이나 쓰기 같은 민감한 액션은 매번 명시적 승인을 받는 구조로 묶었다. 라이선스도 짚어둘 만하다. Large 3과 Small 4가 쓰던 Apache 2.0 대신 Modified MIT로 바뀌면서 고매출 기업에 대한 예외 조항이 들어갔다. 무게는 여전히 Hugging Face에서 받을 수 있지만, 자체 호스팅은 GPU 4장 기준이라 실질적으로 데이터센터의 얘기다.