기존 RAG 시스템은 텍스트만 처리합니다. PDF 속 차트, 표, 수식은 통째로 무시되고 이미지와 텍스트 사이의 맥락은 끊어집니다.
RAG-Anything은 홍콩대(HKUDS)가 개발한 멀티모달 RAG 프레임워크로, LightRAG를 확장해 모든 모달리티를 하나의 파이프라인으로 처리합니다.
핵심 차별점:
• MinerU/Docling으로 문서 구조 파싱
• 이미지·표·수식 각각 전문 프로세서 분석
• 멀티모달 지식 그래프 구축 (단순 벡터가 아닌 교차 모달 관계 보존)
• VLM 자동 호출로 이미지 분석
• 벡터 + 그래프 순회 하이브리드 검색
pip install raganything 한 줄로 시작 가능.
하루 786스타 — GitHub 트렌딩 급부상 중.
문서의 모든 것을 이해하는 RAG의 새 시대가 열립니다.