国家网信办等七部门联合发布《人工智能大模型应用安全评估指南(试行)》:首次建立‘场景穿透式’动态评估机制

2026-05-17 17:45 👁 20993

2026年5月17日,国家网信办联合工信部、公安部、国家市场监督管理总局、国家数据局、国家标准化管理委员会、中央网信办人工智能治理专班等七部门,正式印发《人工智能大模型应用安全评估指南(试行)》(以下简称《指南》),并于即日起在京津冀、长三角、粤港澳大湾区三地先行开展为期六个月的试点。这是全球首个聚焦大模型‘真实应用场景落地风险’而非仅限于训练/部署环节的国家级动态评估规范,标志着我国AI治理从‘合规准入’迈向‘运行中治理’新阶段。

《指南》创新提出‘场景穿透式评估’(Scene-Penetrating Assessment, SPA)方法论,要求评估主体必须嵌入典型业务流——如银行智能风控、三甲医院辅助诊断、政务热线语义工单分派等——对模型在真实数据分布漂移、多轮交互诱导、工具调用链路污染、对抗提示扰动等12类高发风险场景下的鲁棒性、可解释性与责任可追溯性进行实时监测与压力测试。不同于传统静态备案制,《指南》强制要求重点行业大模型运营方每季度提交‘场景风险热力图’及‘干预响应日志包’,由属地网信部门联合第三方技术评估机构开展盲测复核。

行业影响层面,《指南》直接触发头部企业技术架构重构:百度文心已启动‘千帆-盾构’计划,为政务大模型新增实时对抗样本注入模块;科大讯飞星火宣布将医疗垂类模型推理链路全面接入国家AI安全监测平台API;多家持牌金融机构暂停上线3个拟投用的信贷审批智能体,并紧急启动SPA适配改造。值得注意的是,《指南》明确将‘评估结果’与‘算力资源配额’‘政务采购资格’‘跨境数据流动白名单’三项核心权益挂钩,形成强约束闭环。

未来展望方面,参与起草的中国信通院专家指出,该《指南》是《人工智能法》立法前的关键实践探路,其积累的200余万条场景化风险样本库、17套行业专用评估指标集,将于2026年11月向全国人大常委会人工智能立法工作组提交实证报告。同时,七部门已同步启动国际标准对接工作,拟联合ISO/IEC JTC 1/SC 42推动‘场景穿透式评估’成为AI治理新范式。业内普遍预期,该机制有望在2027年覆盖全部三级等保以上信息系统,并逐步扩展至教育、交通、能源等关键基础设施领域。