中国《大模型备案管理办法(2026版)》实施:762款模型完成备案,分级评估成新引擎

2026-03-29 18:46 👁 阅读

2026年初,国家互联网信息办公室正式施行《大模型备案管理办法(2026版)》,在原有备案制度基础上新增‘大模型服务分级评估’机制,标志着我国生成式AI监管从‘准入登记’迈入‘全周期动态治理’新阶段。新版办法首次将模型按服务对象、应用场景、输出影响三个维度划分为L1-L4四级,其中L3级(面向公众提供内容生成、情感交互等服务)和L4级(涉及医疗建议、金融决策、司法辅助等高影响场景)必须通过国家AI安全评估中心组织的‘红蓝对抗测试’,涵盖幻觉抑制率、偏见偏差值、应急熔断响应时长等12项硬性指标。截至2026年3月25日,全国累计完成合规备案的大模型达762款,较2025年底增长41.3%,但同期申请退回率亦升至28.6%,主要集中在L4级模型因‘风险缓释方案不具可验证性’被否决。这表明监管已从形式审查转向实质能力验证,倒逼企业将安全能力建设前置至模型架构设计环节。

分级评估机制的核心创新在于构建‘能力-风险-责任’映射关系。例如,L3级模型需证明其内容安全过滤系统对政治谣言、医疗谬误、金融诈骗话术的识别准确率不低于99.2%,且须接入国家网络辟谣平台API实现秒级联动;L4级模型则额外要求‘人类专家复核通道’可用性达100%,并在用户界面显著位置标注‘AI生成内容,重大决策请咨询专业人士’提示语。更关键的是,办法首次引入‘备案有效期动态调整’条款:若模型在运营中发生3次以上重大安全事件,备案等级自动降级并触发强制重评。这种‘以用促管、以管保用’的闭环设计,有效破解了‘一备了之’的监管失效难题。

产业影响已深度显现。头部平台企业普遍重构AI研发KPI体系,将‘安全鲁棒性’权重提升至45%,超过性能指标;中小模型厂商则加速拥抱‘可信模型即服务’(TMaaS)新模式,通过调用已通过L4认证的基础模型,快速构建垂直领域应用。政策红利同步释放——工信部数据显示,2026年一季度面向中小企业的AI安全测评服务订单量同比增长320%,带动第三方合规服务机构营收增长189%。长远看,该办法正推动形成‘基础模型强安全、行业模型重适配、应用产品讲体验’的中国AI产业分层发展格局,为全球大模型治理提供兼具安全性与创新性的‘中国方案’。