PrismML은 1-bit Bonsai 8B를 공개하며 8B급 모델을 1.15GB에 담을 수 있다고 주장했다. 비교 기준으로 제시된 일반적인 16비트 8B 모델이 약 16GB라는 설명을 감안하면, 이 발표의 핵심은 단순 압축이 아니라 배포 가능한 하드웨어 범위를 넓히는 데 있다. 회사는 14배 작은 크기, 8배 빠른 실행, 5배 낮은 에너지 사용을 내세우며 이를 '지능 밀도' 경쟁으로 설명한다. 함께 언급된 ternary Bonsai는 약 1.75GB로 더 크지만 평균 벤치마크 점수는 더 높아, 메모리와 품질 사이의 선택 곡선을 제시한다. 의미는 분명하다. 엣지 AI에서는 최고 점수 모델보다 스마트폰, 로봇, 차량, 보안 민감 단말 안에 실제로 들어가는 모델이 더 중요해질 수 있다. 다만 발표 수치는 독립 검증이 필요하며, 실제 성패는 워크로드별 품질, 지연시간, 메모리 대역폭, 커널 최적화, 생태계 통합에서 갈릴 가능성이 높다. takeaway는 단순하다. 이제 모델 선택은 성능표가 아니라 장치 예산표 위에서 이뤄질 수 있다.