发布于 Fri May 01 2026 08:00:00 GMT+0800 (中国标准时间)

案例金融合规本地推理

案例 · 一家证券公司上线全本地 AI 客服，合规审计走了哪些路

数据完全不出网、监管审批、内审与外审、灾备规划——本案例公开一家中型证券公司全本地 AI 客服的真实合规历程。

背景#

业务：中型证券经纪商
AUM：约 ¥1,200 亿
已接入客户：~120 万
客服坐席：85 人（分布在 3 个城市）
监管要求：证监会一线合规
原方案：纯人工客服 + 第三方传统呼叫系统

为什么决定上 AI#

四个驱动：

客服压力：开盘日高峰每分钟 800+ 咨询，坐席接不过来
合规审计：现有系统留痕不够细，每年外审花费 8-12 周
培训成本：新坐席上岗需 3 个月，留存率 70%
同业压力：头部券商已上线 AI，客户对比明显

但卡在：所有云端 LLM 都不能用——证监会要求客户对话不出境。

选型决策#

评估过 5 个方向：

方案	决策
用云端 LLM	× 合规死结
跟头部券商合作 IT	× 数据交叉 + 不透明
自研对话模型	× 12-18 个月，团队不具备
内部部署开源 LLM + 框架	✓
内部部署商业 LLM	✓ 但贵 3-5 倍

最终方案：Rasa CALM + Chatwoot + RAGFlow + Qwen 2.5-72B 本地推理（参考全本地推理方案的金融变体）。

架构#

基础设施：所有推理跑在 8 台 A100 80GB（vLLM 部署），数据在 Postgres 主备 + 异地备份，日志走 WORM 存储 + 区块链存证。

合规审批历程（11 个月）#

月 1-2：立项与内部论证#

IT 部出方案
风控部、合规部、法务部审议
CRO 签字立项

月 3-4：技术架构论证#

模型选型论证：为什么是 Qwen 而不是其他
安全架构论证：流量、权限、加密
灾备架构论证：3 中心 5 副本

月 5：监管沟通预沟通#

跟证监会派出机构非正式沟通
提交《AI 系统建设方案》《数据安全说明》《合规承诺函》
获得「不反对」回复

月 6-7：技术建设#

硬件采购到位（A100 × 8、PG 主备、网络架构）
软件部署上线（基础环境）
模型微调（在公司语料上微调 Qwen，约 3 周）

月 8：内部 UAT + 内审#

风控部全程跟踪 1000 个测试 case
发现 12 个边界问题（如「能不能给我推荐股票」），全部用 Rasa Flow 拦截
内审报告通过

月 9：监管现场审查#

证监会派出机构现场 3 天
重点查：数据流是否出境、审计日志是否完整、紧急停机预案
发现 2 个待整改问题：审计日志保留期不足 5 年、未做季度渗透测试
整改 4 周

月 10：外审 + 第三方安全测评#

等保三级测评通过
第三方渗透测试通过
ISO 27001 复审通过

月 11：正式上线#

灰度：1% 已认证客户
第二周 5%
第三周 20%
第四周 100%

上线后 6 个月数据#

指标	上线前	上线后
月会话量	480k	520k（量略增）
AI 自助率	0%	58%
首响时间	平均 47 秒	平均 2.3 秒
人工坐席总工时	13,600 h/月	7,200 h/月
客服坐席数	85	60（25 人转岗）
CSAT	4.1	4.3
投诉率	0.21%	0.18%
外审耗时	8-12 周	4 周（日志结构化）

关键技术决策#

1. 为什么用 Rasa 而不是 Dify#

金融对话不允许猜。客户问「我能不能开通融资融券」，AI 不能用 LLM 自由发挥——必须按业务规则一步步走：

客户身份等级足够？
风险评估等级足够？
是否签风险揭示书？
资金账户是否合规？
全部满足 → 引导到「开通」流程

Rasa 的 Flow + LLM NLU 组合，比 Dify 的纯 LLM Workflow 更适合此场景。

2. 为什么本地 Qwen 而不是商业 GPT 同等替代#

证监会的「数据出境」红线极严：

OpenAI / Anthropic 完全不可用
Azure OpenAI 中国版理论可行但合规材料复杂
国内云厂（阿里、腾讯）的 LLM API 可用，但数据流仍要审查

Qwen 完全本地推理：数据 0 出境，合规审计直接通过。

3. 为什么不接业务系统直接读账户数据#

风险太大。LLM 接业务系统直读账户、订单、资金存在「越权」风险。设计：

LLM 只能访问「公开 KB」（业务规则、政策、流程）
涉及账户数据时调用「业务接口（带权限校验）」
业务接口返回结构化数据 → Rasa Flow 拼接到回复

硬件与成本#

项	配置 / 数量	月成本
A100 80GB × 8	自购，$120k 一次性 / 36 月折旧	¥21k
GPU 主机 × 2	64C/256G	¥8k
存储	100TB（含审计 WORM）	¥6k
网络 / 安全	防火墙 + 等保 + 监控	¥5k
软件许可	Rasa Pro + 商业支持	¥10k
人员（4 人维护团队）	—	¥80k
月度合计		¥130k

听起来贵，但坐席减员 25 人 × ¥15k/月 = ¥375k/月，净省 ¥245k / 月。

不可量化的收益#

审计效率：外审从 8-12 周缩到 4 周，每年节省 ~600 工时
培训周期：新坐席上岗从 3 个月缩到 6 周（AI 兜底容错）
品牌影响：监管层面给了「数字化典型案例」表彰
新业务支持：开通新业务（如 ETF 期权）的客服培训从 2 周缩到 3 天

踩过的坑#

首次合规答疑被拒：第一版 Prompt 没明确「不构成投资建议」声明，全部要重写
Qwen 72B 在「计算复利」上偶尔错：改成 Rasa 调外部计算服务
Rasa Flows 维护成本被低估：业务变化时改 Flow 比改 Prompt 累，团队第 4 个月才稳定下来
A100 利用率低：日均 30-40%，夜间几乎闲置；考虑跑训练任务消化

给同行的建议#

如果你也在监管行业，4 个忠告：

跟监管提前沟通：宁可 9 月开始建，提前 2 个月跟监管打招呼
合规架构先设计：数据流图、权限矩阵、审计要求先画好再动手
不要追新模型：选稳定的、有商业支持的（Qwen + Rasa Pro）
预算合规审计时间：技术上线后还要 2-3 个月走完审批，规划时务必算上