FastGPT 知识库调优全攻略：把准确率从 0.62 提到 0.89

FastGPT 知识库默认配置只能拿到 60% 准确率，调对了能到接近 90%。本文给出分块策略、问题增强、Reranker 的逐步实测。

基准设置#

bge-m3 Embedding，500 字按段落切，top_k=5。

结果：MRR@5 = 0.62——勉强能用，但用户反馈「答案常常错位」。

关键：FastGPT 的「QA 拆分」是国内项目里做得最好的，它会用 LLM 把长段落改写成「问题—答案」对，再分别索引。

FastGPT 有个开关叫「索引时问题增强」，对每个 chunk 自动生成 2-3 个变体问题。

状态	MRR@5
关闭	0.83
开启（每条 2 个变体）	0.86

代价：索引时间 3-5 倍，但只是一次性成本。

检索回 5 条后用 Reranker 重新排序。bge-reranker-v2-m3 是默认推荐。

配置	MRR@5	耗时增加 (ms)
无 Reranker	0.86	0
+ bge-reranker-v2-m3	0.89	+150

150ms 换 3 个百分点准确率，几乎所有客服场景都赚。

你是 [品牌] 的客服助手。请只使用「参考资料」回答用户问题。
要求：
1. 若参考资料不足以回答，回复「我没有相关信息，正在转人工」
2. 不要编造任何数字或日期
3. 回答需附上来源 chunk_id

参考资料：
{{context}}

用户问题：{{question}}

Prompt 状态	Faithfulness
默认 Prompt	0.81
加严格约束 + 引用 chunk_id	0.94

阶段	MRR@5	Faithfulness	累计成本
起点	0.62	0.78	—
+ QA 拆分	0.79	0.81	索引时间 +50%
+ 父子分块	0.83	0.81	索引时间 +30%
+ 问题增强	0.86	0.82	索引时间 +200%
+ Reranker	0.89	0.85	查询 +150ms
+ Prompt 优化	0.89	0.94	0
总收益	+0.27	+0.16	—

我们也试过这些但没有显著提升：