RAGFlow vs LlamaIndex — RAG 引擎 vs RAG 框架

都做 RAG，但 RAGFlow 是「拿来即用的产品」，LlamaIndex 是「需要写代码的框架」。本文给出明确选型逻辑。

一句话结论：业务团队要文档 Q&A 立刻能用，选 RAGFlow。工程团队要深度定制 RAG，选 LlamaIndex。

一句话先回答#

你的角色	选
业务 / 产品经理，要快速搞知识库	RAGFlow
ML 工程师，要构建定制 RAG 管道	LlamaIndex
想要 GUI 看效果，调超参	RAGFlow
用 Python 写工程化 RAG 服务	LlamaIndex
文档复杂（表格 / 扫描件 / 双栏）	RAGFlow（DeepDoc 解析强）
自定义检索逻辑（混合搜索、Re-ranking 实验）	LlamaIndex

根本定位不同#

RAGFlow 是开源的 RAG 应用 / 引擎：

Docker 起来就有 Web UI
上传文档 → 选分块 → 测检索 → 拿 API
类比：FastGPT 之于业务团队，是「产品」

LlamaIndex 是开源的 RAG 框架：

Python 库，import 后写代码
你的责任：分块、Embedding、检索、生成、评估各步骤
类比：LangChain，是「工程师工具箱」

不是直接竞品——很多团队在生产里同时用两者。

4 维度对比#

1. 上手成本#

RAGFlow：

git clone https://github.com/infiniflow/ragflow
cd ragflow/docker && docker compose up -d
# 浏览器打开，注册，上传文档，问问题——10 分钟见效

LlamaIndex：

pip install llama-index

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
documents = SimpleDirectoryReader('./docs').load_data()
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()
response = query_engine.query("...")
# 然后还要考虑：用什么 embedding？什么 LLM？怎么分块？怎么部署？

结论：RAGFlow 10 分钟见 Demo；LlamaIndex 几小时到一周才能上生产。

2. 文档解析能力#

文档类型	RAGFlow	LlamaIndex
Markdown / TXT	✓	✓
简单 PDF	✓	✓（SimpleDirectoryReader）
含表格的 PDF	✓✓（DeepDoc 强）	⚠（需配 Unstructured 或 PaddleOCR）
双栏排版	✓✓	⚠
扫描件 OCR	✓ 内置	✗（需第三方）
公式 / 图表	✓ 部分	⚠

RAGFlow 的 DeepDoc 是它的杀手锏——LlamaIndex 在「naïve 切块」上没有优势，必须自己接 Unstructured / PaddleOCR / Tabula 等多个库才能匹敌。

3. 检索质量#

实测对比 30 道复杂文档问题：

维度	RAGFlow（默认）	LlamaIndex（默认）
表格类 Top-1	11/12	7/12
双栏类 Top-1	6/6	3/6
扫描件	2/2	0/2
简单段落	9/10	9/10

但——LlamaIndex 调优后差距可缩小。RAGFlow 默认效果好；LlamaIndex 上限可能更高（如果你愿意花时间）。

4. 定制深度#

能力	RAGFlow	LlamaIndex
切换 Embedding	✓ UI 切换	✓ 代码切换
混合检索（向量 + BM25）	✓ 内置	✓ 内置
自定义 Reranker	⚠ 受限于支持的几个	✓ 完全自由
自定义检索逻辑	✗（黑盒）	✓ 完全自由
自定义评估指标	⚠ 内置评估面板	✓ TruLens / RAGAS 任意接
Multi-modal RAG	⚠ 部分	✓ 完整
自建 Agent 与 RAG 结合	⚠ Workflow	✓ Agents 完整支持

结论：定制深度上 LlamaIndex 碾压；开箱体验上 RAGFlow 碾压。

与 Dify / FastGPT 的关系#

工具	定位
RAGFlow	RAG 引擎（检索 + 引用）
LlamaIndex	RAG 框架（写代码）
Dify	LLM 应用平台（含 RAG 但偏应用层）
FastGPT	LLM 应用平台 + 加强版 RAG

最佳组合：Dify 当应用层 + RAGFlow 当检索后端——参考 Dify + RAGFlow 方案。

决策树#

你是想立刻搞个知识库 Q&A 服务？
├─ 是 → RAGFlow（10 分钟上线）
└─ 否，你要做的是定制 RAG 系统作为产品的一部分？
        ├─ 是，且团队是 Python ML 工程师 → LlamaIndex
        └─ 是，但团队是后端工程师 → Dify + RAGFlow API

综合评分#

维度	RAGFlow	LlamaIndex
上手速度	10	4
文档解析	10	6
默认效果	9	7
定制深度	5	10
工程化 API	8	10
Multi-modal	5	9
社区资料	7	10
综合	7.7	8.0