RAGFlow
基于深度文档理解的开源 RAG 引擎
- 协议
- Apache-2.0
- 部署难度
- 中等
- GitHub Stars
- 80.7k
- 最近提交
- 2 天前
最新版本
v0.25.4 9.2k forks
3023 个开放 Issue 数据更新于 2026-05-17 RAGFlow 是什么#
RAGFlow 是 InfiniFlow 团队开源的 RAG 引擎,最大的差异是 DeepDoc 文档解析——能在 PDF 中识别表格、双栏排版、扫描件 OCR,而不是简单的「分页+按字数切」。对中文复杂资料尤其有效。
与 Dify / FastGPT 的区别#
- Dify / FastGPT 是「应用平台」,RAGFlow 是「检索引擎」
- RAGFlow 强调答案可追溯(每条回答都能跳到原文)
- 适合作为 Dify / FastGPT 的「上游知识库」,通过 API 接入
优点
- 文档解析能力突出(PDF 表格、扫描件、布局识别)
- DeepDoc 引擎可处理复杂排版的中文资料
- 答案附带可点击的证据片段(重要)
- 内置 GraphRAG 与多路召回
缺点
- 资源占用较高(解析器跑得猛)
- UI 偏工程师向
- 部署需要 ES / Infinity 等组件
适合场景
- 政企、法律、医疗等「文档复杂、来源严肃」的场景
- 需要给客户答案附「原文出处」的合规要求