2026 中文 Embedding 模型实战评测：bge-m3、Conan、m3e、bce、OpenAI

同一份中文知识库、同一组真实客服问题，跑五个主流 Embedding 模型，看检索准确率、速度与成本到底差多少。

测试设置#

模型	MRR@5	Recall@5	平均耗时 (ms)	月成本 (1M tokens)
`bge-m3`	0.87	0.94	22	本地 GPU 自费
`Conan-embedding-v1`	0.89	0.95	31	本地 GPU 自费
`m3e-large`	0.81	0.89	24	本地 GPU 自费
`bce-embedding-base_v1`	0.79	0.87	18	本地 GPU 自费
`text-embedding-3-large`	0.85	0.93	180-400	约 $0.13

bce-embedding 配合自家 Reranker 反超：单独 Embedding 排名第 4，但加上 bce-reranker-base_v1 后总分提升至 0.88，仅次于 bge-m3
OpenAI 的优势在「不同语言混杂」：英文掺杂在中文里时 OpenAI 仍稳定，开源模型有时降分明显
维度并不是越大越好：3072 维的 OpenAI 不如 1024 维的 bge-m3

# Dify 知识库切换 Embedding
# Settings → Model Provider → Add → 选 Hugging Face 或 SiliconFlow
# 模型名：BAAI/bge-m3
# 接口地址：https://api.siliconflow.cn/v1