腾讯新闻科技联合SkillHub、玄武实验室发布AI TRACE评测框架:首次聚焦AI系统可信工程能力,定义大模型落地‘安全临界点’

5月22日,腾讯新闻科技联合职业能力认证平台SkillHub与国家级网络安全实验室玄武实验室,正式发布全球首个面向产业级AI系统全生命周期的可信性评测框架——AI TRACE(Trustworthy Reasoning and Action Certification Engine)。该框架于2026年5月23日零时起向国内重点AI企业、监管沙盒及高校实验室开放首批白名单试用,标志着我国AI评估体系从‘性能导向’迈入‘可信工程导向’新阶段。

AI TRACE并非传统基准测试的延伸,而是首次将‘可解释性衰减率’‘决策链路断点密度’‘跨模态语义漂移阈值’等12项工业级可信指标纳入强制评估项,并引入‘动态红蓝对抗注入’机制——在真实业务流中实时注入逻辑扰动、数据污染与策略诱导噪声,观测模型响应鲁棒性。据发布会披露,首批参与压力测试的9家头部AIGC平台中,仅2家在金融风控与医疗辅助场景下通过全部三级可信认证(含L3级‘高危动作拦截成功率≥99.97%’硬指标)。

行业影响层面,AI TRACE直击当前大模型规模化落地的核心瓶颈:模型越强,黑箱越深;部署越广,失控风险越隐性。此前多项事故复盘显示,超76%的AI服务异常并非源于准确率下降,而是因推理链断裂导致合规动作漏判或越权执行。该框架将‘安全临界点’量化为可测量、可审计、可追溯的工程参数,为《生成式人工智能服务管理暂行办法》实施细则提供了首个技术对齐工具。多家银行科技子公司已明确将其纳入2026年Q3模型上线前置审批流程。

未来展望上,项目组透露AI TRACE v2.0将于2026年Q4启动共建,拟接入国家人工智能治理公共服务平台,支持与欧盟AI Act合规模块、美国NIST AI RMF 2.0的双向映射。更关键的是,框架底层已预留‘监管探针接口’,允许网信、金融、卫健等垂直监管部门按需加载领域特异性验证规则,实现‘一测多用、一次认证、全域通行’。这或将重构AI产品从研发到准入的全链条价值分配——安全能力不再只是成本项,而将成为可定价、可交易、可质押的技术资产。

值得注意的是,此次发布刻意避开通用能力榜单排名,转而联合中国信通院启动‘TRACE可信伙伴计划’,首批授予23家通过L2认证的企业‘可信工程就绪标识’。业内分析指出,当算力军备竞赛趋缓,这场以‘可控性’为支点的新一轮标准卡位战,或将真正决定下一阶段AI产业化的主导权归属。

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高

2026-03-07 16:00

腾讯新闻科技联合SkillHub、玄武实验室发布AI TRACE评测框架:首次聚焦AI系统可信工程能力,定义大模型落地‘安全临界点’

相关推荐

GPT-5.4 正式发布：百万 Token 上下文 + 原生计算机操作能力升级

Gemini 3.1 Flash-Lite 上线，谷歌推出高性价比轻量化大模型

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高