Stable Audio Open이 47초짜리 트랙을 만들 때까지만 해도 이 팀의 야망이 이 정도인 줄 알았다. Stable Audio 3.0 Medium은 1.4B 파라미터로 6분 20초 트랙을 만들고, 1.31초 만에 추론을 끝낸다고 소개된다. 오픈웨이트 오디오 모델이 단순 샘플 생성기를 넘어 실제 제작 워크플로의 시간 단위로 들어오려는 순간이다.
흥미로운 건 모델을 네 갈래로 나눈 방식이다. Small·Medium·Large·Large Turbo가 있고, 그중 세 모델은 비상업 라이선스의 오픈웨이트로 공개됐다. Small과 Medium에는 LoRA 파인튜닝 문서까지 붙었다. 연구자와 크리에이터 커뮤니티가 실험할 수 있는 문은 열어두되, 2B급 Large와 Turbo는 API 뒤에 남겨 상업 수요를 붙잡는 구조다.
저작권 리스크도 정면으로 다뤘다. Stability AI는 학습 데이터가 AudioSparx 라이선스 카탈로그와 자사 오디오 라이브러리에서 왔다고 강조한다. Suno와 Udio가 메이저 음반사들과 소송전을 벌이는 상황에서, 이 문장은 기능 설명보다 사업 전략에 가깝다.
다만 한계도 분명하다. 오픈웨이트라고 해서 곧바로 무료 상업 제작 도구가 되는 것은 아니다. 라이선스, 데이터 출처, 파인튜닝 결과물의 권리, API 의존성을 함께 봐야 한다. Stable Audio 3.0의 메시지는 그래서 단순히 '더 긴 음악 생성'이 아니다. 생성형 음악 모델 경쟁이 이제 품질 데모에서 배포 모델, 권리 설계, 수익화 경계로 이동하고 있다는 신호다.