flag92 flag92
博客
发布于 Tue May 12 2026 08:00:00 GMT+0800 (中国标准时间)
评测EmbeddingRAG

2026 中文 Embedding 模型实战评测:bge-m3、Conan、m3e、bce、OpenAI

同一份中文知识库、同一组真实客服问题,跑五个主流 Embedding 模型,看检索准确率、速度与成本到底差多少。

测试设置#

  • 语料:3000 条客服 FAQ + 500 条产品文档(电商场景)
  • 测试集:120 条真实用户问题(按场景标注 Top-1 ground truth)
  • 检索:纯向量检索,top_k=5
  • 指标:MRR@5、Recall@5、单次检索耗时、月成本(按 1M tokens 估算)

参评模型#

模型维度开源备注
bge-m31024智源开源,中文场景事实标准
Conan-embedding-v11792腾讯开源,2026 年新晋
m3e-large1024moka-ai 出品
bce-embedding-base_v1768网易有道
text-embedding-3-large3072OpenAI 闭源

结果#

模型MRR@5Recall@5平均耗时 (ms)月成本 (1M tokens)
bge-m30.870.9422本地 GPU 自费
Conan-embedding-v10.890.9531本地 GPU 自费
m3e-large0.810.8924本地 GPU 自费
bce-embedding-base_v10.790.8718本地 GPU 自费
text-embedding-3-large0.850.93180-400约 $0.13

推荐选择#

场景推荐
默认中文场景bge-m3——综合最稳
追求最高准确率Conan-embedding-v1——略胜 bge-m3
预算极紧bce-embedding-base_v1——快、轻量
多语言混合bge-m3text-embedding-3-large
不想自部署OpenAI 接口最省心

关键发现#

  1. bce-embedding 配合自家 Reranker 反超:单独 Embedding 排名第 4,但加上 bce-reranker-base_v1 后总分提升至 0.88,仅次于 bge-m3
  2. OpenAI 的优势在「不同语言混杂」:英文掺杂在中文里时 OpenAI 仍稳定,开源模型有时降分明显
  3. 维度并不是越大越好:3072 维的 OpenAI 不如 1024 维的 bge-m3

接入示例#

# Dify 知识库切换 Embedding
# Settings → Model Provider → Add → 选 Hugging Face 或 SiliconFlow
# 模型名:BAAI/bge-m3
# 接口地址:https://api.siliconflow.cn/v1

站内搜索

按 ⌘ K 随时唤起