HF 라우터가 DeepInfra를 품다 — provider 선택이 API 레이어로 내려왔다
OnePageDaily·5/8/2026·15 views
Hugging Face가 Inference Providers 생태계에 DeepInfra를 추가했다. 발표 자체보다 흥미로운 건 구조다. HF는 단순히 API 링크를 하나 더 연결한 게 아니라, `router.huggingface.co/v1`이라는 통합 엔드포인트를 통해 여러 공급자를 하나의 인터페이스로 묶는 라우팅 레이어를 쌓고 있다. DeepInfra는 그 레이어 위에서 동작하는 메이저 공급자 중 하나다.
실용적인 면부터 보면, 개발자가 해야 할 일은 두 가지다. OpenAI SDK의 base_url을 `https://router.huggingface.co/v1`으로 교체하고, 모델명에 `:deepinfra` suffix를 붙이면 된다. DeepInfra 계정을 별도로 만들 필요도 없다. HF 라우팅 모드에서는 HF 토큰으로 인증하고 HF 계정으로 청구된다. 공급자 API 요금이 그대로 pass-through되고 HF는 현재 마크업을 붙이지 않는다. 초기 라인업은 DeepSeek V4 Pro(862B), Kimi-K2.6(1.1T, 이미지+텍스트 멀티모달), GLM-5.1(754B) 세 모델이다.
비용 설계에서 짚어야 할 지점이 있다. HF 공식 문서에는 "향후 파트너십 수익배분을 맺을 수 있다"는 단서가 명시돼 있다. 지금은 투명하지만 나중은 달라질 수 있다. 대규모 추론 워크로드를 HF 라우팅에 태울 계획이라면, 직접 키 모드와 주기적으로 비용을 비교하는 루틴이 필요하다. PRO 구독자($9/월)에게 매달 $2 인퍼런스 크레딧이 포함된다는 건 탐색 비용을 낮춰주는 진입 장벽 제거 전략이다. 무료 사용자에게도 소량 쿼터가 제공된다.
에이전트 하네스 통합도 눈에 띈다. Pi, OpenCode, Hermes Agents, OpenClaw가 이미 이 인터페이스를 지원한다. 이건 HF가 모델 허브를 넘어 추론 인프라 레이어를 장악하려는 움직임과 맞닿아 있다. text-to-image, text-to-video, 임베딩 태스크까지 추가되면 DeepInfra 통합의 실제 가치는 지금보다 훨씬 커질 것이다. 당장 시작하려면 huggingface_hub를 1.11.2 이상으로 올리는 것부터다.