发布于 Tue May 12 2026 08:00:00 GMT+0800 (中国标准时间)
评测EmbeddingRAG
2026 中文 Embedding 模型实战评测:bge-m3、Conan、m3e、bce、OpenAI
同一份中文知识库、同一组真实客服问题,跑五个主流 Embedding 模型,看检索准确率、速度与成本到底差多少。
测试设置#
- 语料:3000 条客服 FAQ + 500 条产品文档(电商场景)
- 测试集:120 条真实用户问题(按场景标注 Top-1 ground truth)
- 检索:纯向量检索,top_k=5
- 指标:MRR@5、Recall@5、单次检索耗时、月成本(按 1M tokens 估算)
参评模型#
| 模型 | 维度 | 开源 | 备注 |
|---|---|---|---|
bge-m3 | 1024 | ✓ | 智源开源,中文场景事实标准 |
Conan-embedding-v1 | 1792 | ✓ | 腾讯开源,2026 年新晋 |
m3e-large | 1024 | ✓ | moka-ai 出品 |
bce-embedding-base_v1 | 768 | ✓ | 网易有道 |
text-embedding-3-large | 3072 | ✗ | OpenAI 闭源 |
结果#
| 模型 | MRR@5 | Recall@5 | 平均耗时 (ms) | 月成本 (1M tokens) |
|---|---|---|---|---|
bge-m3 | 0.87 | 0.94 | 22 | 本地 GPU 自费 |
Conan-embedding-v1 | 0.89 | 0.95 | 31 | 本地 GPU 自费 |
m3e-large | 0.81 | 0.89 | 24 | 本地 GPU 自费 |
bce-embedding-base_v1 | 0.79 | 0.87 | 18 | 本地 GPU 自费 |
text-embedding-3-large | 0.85 | 0.93 | 180-400 | 约 $0.13 |
推荐选择#
| 场景 | 推荐 |
|---|---|
| 默认中文场景 | bge-m3——综合最稳 |
| 追求最高准确率 | Conan-embedding-v1——略胜 bge-m3 |
| 预算极紧 | bce-embedding-base_v1——快、轻量 |
| 多语言混合 | bge-m3 或 text-embedding-3-large |
| 不想自部署 | OpenAI 接口最省心 |
关键发现#
bce-embedding配合自家 Reranker 反超:单独 Embedding 排名第 4,但加上bce-reranker-base_v1后总分提升至 0.88,仅次于 bge-m3- OpenAI 的优势在「不同语言混杂」:英文掺杂在中文里时 OpenAI 仍稳定,开源模型有时降分明显
- 维度并不是越大越好:3072 维的 OpenAI 不如 1024 维的 bge-m3
接入示例#
# Dify 知识库切换 Embedding
# Settings → Model Provider → Add → 选 Hugging Face 或 SiliconFlow
# 模型名:BAAI/bge-m3
# 接口地址:https://api.siliconflow.cn/v1