NVIDIA가 Nemotron 3 오픈 모델 패밀리를 공개했습니다. Nano(30B) · Super(100B) · Ultra(500B) 세 가지 규모로 구성되며, 하이브리드 Latent MoE 아키텍처로 전체 파라미터의 10%만 활성화하면서 풀 모델에 근접한 성능을 달성합니다.
핵심 수치로는 토큰 처리량 4배 향상, 추론 토큰 60% 절감, 100만 토큰 컨텍스트 윈도우를 지원합니다. 모델 가중치뿐 아니라 3조 토큰 학습 데이터, NeMo 학습 도구, Agentic Safety Dataset까지 완전한 오픈소스로 공개한 것이 가장 파격적입니다.
Nano는 Hugging Face에서 즉시 사용 가능하며, Super와 Ultra는 2026년 상반기 공개 예정입니다.