클라우드 없이 2분 트랙, 오픈웨이트로 6분 컴포지션 — Stable Audio 3.0이 바꾸는 음악 AI의 기준
OnePageDaily·5/21/2026·10 views
Stability AI가 Stable Audio 3.0을 공개하면서 음악 AI 시장의 실용적 기준이 다시 그어졌다. 네 모델 중 Small과 Small SFX(각 459M 파라미터)는 온디바이스 추론을 지원해 인터넷 연결 없이 최대 2분짜리 트랙을 생성한다. Medium(1.4B)과 Large(2.7B)는 6분 20초짜리 풀 컴포지션을 만들 수 있고, 음악적 구조와 멜로디 톤이 끝까지 유지된다고 회사 측은 밝혔다. 2024년 오픈 버전인 Stable Audio Open이 47초 트랙까지만 지원했다는 사실과 비교하면, 이번 릴리스는 단순한 성능 개선이 아니라 사용 가능한 용도 자체가 달라진 것이다.
공개 범위 설계도 주목할 지점이다. Small SFX, Small, Medium은 오픈웨이트로 누구나 내려받아 수정하고 재배포할 수 있다. Large는 API와 유료 셀프호스팅 서비스로만 접근 가능하고, 연 매출 100만 달러 이상 기업은 엔터프라이즈 라이선스를 별도로 체결해야 한다. 로컬에서 빠르게 프로토타이핑하고, 최종 퀄리티가 필요한 시점에 Large API로 올리는 티어드 워크플로가 자연스럽게 설계된 구조다. 개발자와 인디 창작자를 먼저 끌어들이고, 그 위에 상업 레이어를 얹는 전략이다.
업계 전체가 가장 예민하게 지켜보는 라이선스 문제에서 Stability AI는 명확한 위치를 잡았다. Suno와 Udio가 음반사와의 저작권 소송을 진행하는 동안, Stability AI는 Warner Music Group, Universal Music Group과 파트너십을 맺고 이번 모델 패밀리 전체를 완전 라이선스된 데이터로 학습시켰다고 밝혔다. 상업 프로젝트에서 이 모델을 실제로 사용할 수 있느냐는 실무적 질문에 대한 가장 직접적인 답이다. 법적 불확실성이 경쟁사의 약점이 되고 있는 시점에, 이 차이는 작지 않다.
프로 시장 공략 신호도 함께 나왔다. Universal Audio와 Fender에서 최고 디지털 책임자를 지낸 Ethan Kaplan이 합류해 프로 뮤지션 전용 제품군을 이끈다. 아직 구체적인 기능은 공개되지 않았지만, AI 오디오 생성이 취미 수준 도구에서 프로 DAW 워크플로로 진입하는 속도가 빨라지고 있다는 건 분명하다. Google과 ElevenLabs가 각자의 방식으로 시장을 공략하는 상황에서, Stability AI가 선택한 전략은 오픈과 온디바이스를 앞세워 창작자 커뮤니티 안에 먼저 뿌리를 내리는 것이다.