논문·사내 문서·로컬 LLM을 하나로 — local-deep-research가 바꾸는 리서치 구조
OnePageDaily·5/5/2026·16 views
클라우드 없이 SimpleQA 95%. Qwen3:27B를 RTX 3090 하나에 올리고 local-deep-research를 붙이면 나오는 수치다. 이 벤치마크가 흥미로운 이유는 숫자 자체가 아니라 그 숫자를 만들어내는 구조에 있다. 이 프로젝트는 LLM에 검색 결과를 던져주는 래퍼가 아니다. arXiv, PubMed를 포함한 10개 이상의 검색 엔진을 병렬로 쿼리하고, 로컬 문서까지 같은 인덱스에 넣어서 LLM이 전체 소스를 통합한 답변을 생성하는 파이프라인이다. 검색이 인풋이고 지식 추출이 아웃풋이다.
llama.cpp와 Ollama를 모두 지원한다는 건 현존하는 로컬 LLM 스택 대부분이 연결 가능하다는 뜻이다. Google 같은 클라우드 백엔드도 쓸 수 있지만, 프로젝트 설계의 중심은 Everything Local & Encrypted다. 이 선택이 마케팅 문구가 아닌 아키텍처 결정임을 알 수 있는 건 PubMed와 개인 문서를 동일 쿼리로 교차 검색하는 구조를 봤을 때다. 의료 데이터, 법률 문서, 기업 내부 리포트는 외부 API로 보낼 수 없다. 이 프로젝트는 그 제약 안에서 동작하도록 설계됐다.
클라우드 RAG 서비스들이 빠르게 성숙하고 있는 지금, 로컬 대안이 의미를 갖는 구간은 좁아지는 것처럼 보인다. 하지만 헬스케어, 금융, 법무처럼 데이터 규제가 강한 산업에서는 아무리 좋은 클라우드 서비스라도 첫 번째 질문이 "이 데이터 외부로 나가도 돼?"다. 그 질문의 답이 No인 순간 선택지는 좁아진다. local-deep-research는 정확히 그 지점을 겨냥한다.
Qwen3:27B 기준 95%는 "이제 실험 단계를 넘었다"는 임계점이다. 더 큰 모델이나 멀티-GPU 환경에서는 수치가 추가로 올라간다. 4,986 스타에 오늘 하루만 200개가 붙었다. 이 속도는 이 필요를 느끼는 사람이 이미 충분히 많다는 것을 보여준다.