Terence Pae가 Osaurus를 만든 출발점은 기술적 영감이 아니라 사용자의 항의에 가까운 질문이었다. '앱을 따로 사도 어차피 토큰 비용은 내야 하잖아요.' Tesla와 Netflix를 거친 소프트웨어 엔지니어인 Pae는 'AI 버전 Clippy'를 만들던 Dinoki 프로젝트를 접고 전제를 뒤집기로 했다. 클라우드 API에 의존하지 않고, Mac 하드웨어 위에서 직접 AI를 돌리면 파일 접근·브라우저 조작·시스템 설정 모두 토큰 없이 가능하다는 논리였다.
그 결과가 Osaurus다. 오픈소스 Mac 전용 LLM 서버로, DeepSeek V4, Llama, Gemma 4, Qwen3.6, MiniMax M2.5 같은 로컬 모델과 OpenAI·Anthropic·Gemini·xAI 같은 클라우드 모델을 단일 인터페이스에서 전환할 수 있다. 메모리, 파일, 툴은 사용자 하드웨어에 남는다. 출시 약 1년 만에 다운로드 112,000회를 넘겼다.
이 도구의 설계에서 가장 주목할 지점은 격리 구조다. Osaurus는 AI를 하드웨어 격리된 가상 샌드박스 위에서 실행한다. OpenClaw처럼 유사한 '하네스' 구조를 가진 도구들이 보안 구멍을 노출하는 것과 달리, Osaurus는 AI의 작동 범위를 물리적으로 제한해 시스템 전체가 공격면이 되는 상황을 막는다. Full MCP(Model Context Protocol) 서버로도 작동해서, MCP 호환 클라이언트라면 Osaurus에 탑재된 20개 이상의 네이티브 플러그인—Mail, Calendar, Browser, Git, Filesystem, XLSX, PPTX, Vision, Music—에 접근할 수 있다. 음성 기능도 최근 추가됐다.
현실적 제약은 분명하다. 로컬 모델을 돌리려면 최소 64GB RAM이 필요하고, DeepSeek V4처럼 대형 모델은 128GB를 권장한다. 비개발자 일반 소비자에게는 여전히 높은 진입 장벽이다. 그럼에도 Pae가 주목하는 지표는 '와트당 지능' 곡선이다. 작년엔 문장 하나 완성하는 것도 버겁던 로컬 AI가 지금은 툴 실행·코드 작성·브라우저 조작·Amazon 주문까지 한다는 것이 그의 표현이다. 이 속도가 유지된다면, 온프렘 Mac Studio가 클라우드 데이터센터를 상당 부분 대체하는 시나리오가 나온다. Osaurus 팀은 현재 뉴욕 액셀러레이터 Alliance에 참여하면서 법률·의료 분야 기업용 프라이버시 AI를 다음 타깃으로 잡고 있다.