flag92 flag92
博客
发布于 Wed Apr 29 2026 08:00:00 GMT+0800 (中国标准时间)
运营KPI数据

AI 客服 KPI 指标体系:怎么证明你的 AI 真的省了钱

不要只盯着「AI 自助解决率」一个指标——这里给出 4 层 12 项指标体系,从体验到成本到训练全覆盖。

为什么单看「自助解决率」不够#

很多团队上线 AI 客服后只汇报「AI 自助率 60%」,老板一开始很满意,三个月后开始问:

  • 这 60% 里有多少是「被赶走」而不是「真的解决」?
  • 人工坐席减少了多少?
  • 客户满意度是涨了还是跌了?

需要一套分层指标。

4 层 12 项指标#

第一层:流量与覆盖#

指标定义目标
AI 触达率有 AI 介入的会话 / 总会话> 95%
首响时间 (FRT)用户首条消息→AI 首条回复< 3 秒
平均处理时长 (AHT)从开始到结束的会话时长每月下降

第二层:解决质量#

指标定义目标
AI 自助解决率未转人工 + 用户未回访 / 总会话45-70%
人工转化率AI 主动转人工 + 用户主动转人工 / 总会话< 35%
24 小时回访率24h 内同用户再次咨询同问题< 10%

第三层:客户体验#

指标定义目标
CSAT (AI 段)对 AI 回复的满意度 1-5 评分> 4.0
CSAT (人工段)对人工坐席的评分> 4.5
对话情绪分LLM 自动打负面情绪分月环比下降

第四层:成本与训练#

指标定义目标
单次会话成本tokens + 基础设施 + 人工 / 会话数月环比下降
知识库命中率RAG 检索 top-1 命中 ground truth 比例> 80%
人工兜底质量被人工修改的 AI 回复 → 是否回流知识库> 50% 回流

仪表盘建议#

  • Grafana 看实时(FRT、QPS、错误率)
  • Metabase 看周报(CSAT、自助率、成本趋势)
  • Notion / 飞书表格 给业务团队看月报

三个常见陷阱#

  1. 「自助率」造假:把「用户失望关闭窗口」当成「AI 解决了」。修正:必须加 24h 回访率作为反向指标
  2. CSAT 偏高假象:只在好评后弹评分。修正:所有结束会话强制弹评分
  3. AI tokens 成本被掩盖:财务把 LLM 费用挂在「云服务」科目,无人复盘。修正:单独建账

站内搜索

按 ⌘ K 随时唤起