flag92 flag92
工具库

RAGFlow

基于深度文档理解的开源 RAG 引擎

协议
Apache-2.0
部署难度
中等
GitHub Stars
80.7k
最近提交
2 天前
最新版本 v0.25.4 9.2k forks 3023 个开放 Issue 数据更新于 2026-05-17

RAGFlow 是什么#

RAGFlow 是 InfiniFlow 团队开源的 RAG 引擎,最大的差异是 DeepDoc 文档解析——能在 PDF 中识别表格、双栏排版、扫描件 OCR,而不是简单的「分页+按字数切」。对中文复杂资料尤其有效。

与 Dify / FastGPT 的区别#

  • Dify / FastGPT 是「应用平台」,RAGFlow 是「检索引擎」
  • RAGFlow 强调答案可追溯(每条回答都能跳到原文)
  • 适合作为 Dify / FastGPT 的「上游知识库」,通过 API 接入

优点

  • 文档解析能力突出(PDF 表格、扫描件、布局识别)
  • DeepDoc 引擎可处理复杂排版的中文资料
  • 答案附带可点击的证据片段(重要)
  • 内置 GraphRAG 与多路召回

缺点

  • 资源占用较高(解析器跑得猛)
  • UI 偏工程师向
  • 部署需要 ES / Infinity 等组件

适合场景

  • 政企、法律、医疗等「文档复杂、来源严肃」的场景
  • 需要给客户答案附「原文出处」的合规要求

站内搜索

按 ⌘ K 随时唤起