Spacedrive 창립자 Jamie Pine이 오픈소스 음성 합성 스튜디오 Voicebox를 공개했습니다. GitHub 스타 19,000+를 넘기며 빠르게 주목받고 있습니다.
ElevenLabs 같은 유료 TTS 서비스의 무료 대안으로, 5개 AI 엔진을 하나의 데스크탑 앱에 통합했습니다.
주요 특징:
- Qwen3-TTS, LuxTTS, Chatterbox, HumeAI TADA 등 5개 TTS 엔진
- 23개 언어 지원 · 감정 태그([laugh], [sigh]) 표현 가능
- 몇 초짜리 오디오 샘플로 보이스 클로닝
- DAW급 타임라인 에디터 · 8종 후처리 이펙트
- Apple Silicon MLX 4~5배 가속 · NVIDIA CUDA · AMD ROCm
- REST API 내장으로 게임·앱에 바로 연동
- Tauri(Rust) 기반 네이티브 앱 · MIT 라이선스
모든 음성 데이터가 클라우드에 올라가지 않고 로컬에서 처리됩니다. 1인 크리에이터부터 기업까지, 유료 TTS 없이 프로덕션 수준 음성을 만들 수 있습니다.