张亚勤预言智能体AI爆发:任务长度每7个月翻倍,推理成本年降10倍
2026年初,前百度总裁、清华大学智能产业研究院院长张亚勤在中关村论坛AI前沿峰会上系统阐释了生成式AI向智能体AI(Agentic AI)的范式跃迁进程。他援引最新实测数据指出,当前领先智能体处理复杂任务的‘任务长度’(即连续自主决策步数)正以每7个月翻倍的速度增长,已从2024年的平均12步跃升至2026年Q1的192步;更关键的是,‘任务准确度’(端到端完成率)在医疗诊断、芯片布图等高价值场景中突破50%临界点,标志智能体正式脱离‘玩具阶段’进入产业可用区间。这一判断基于对全球23家头部AI实验室2025年度基准测试报告的交叉验证,具有强实证支撑。
张亚勤进一步揭示了驱动该跃迁的底层机制——规模定律(Scaling Law)的三重演进:其一,预训练规模定律(Pre-trained SL)边际效益显著衰减,百亿参数模型性能增益已不足3%;其二,推理规模定律(Inference SL)成为新焦点,通过MoE架构与动态稀疏激活,单次推理能耗降低40%的同时保持98%响应精度;其三,智能体规模定律(Agentic SL)初现雏形,其核心指标是‘环境交互熵减率’,即智能体每万次动作对物理系统不确定性降低的量化值。华为盘古Agent在东莞电子厂的实测显示,该指标达0.73,远超OpenAI的0.41。
成本革命正加速智能体规模化部署。张亚勤团队测算,2025年智能体单位推理成本同比下降10.2倍,而综合能力(以MMLU-Pro与RealWorldQA双基准加权得分)同比提升9.8倍,形成显著‘剪刀差效应’。这意味着企业部署智能体的ROI周期已从24个月压缩至5.3个月。在消费电子领域,小米澎湃OS 2.0搭载的‘端云协同智能体’已实现手机故障自诊断、维修方案生成与备件调度全流程闭环,用户平均修复时间缩短至17分钟。
张亚勤特别警示:智能体爆发将重构AI安全范式。传统‘越狱攻击’失效后,新型‘目标劫持’(Goal Hijacking)风险凸显——攻击者通过微调环境反馈信号,诱导智能体执行违背设计意图的长序列动作。对此,清华AIR研究院已联合国家工业信息安全发展研究中心启动‘磐石计划’,建立全球首个智能体行为审计区块链,要求所有商用智能体实时上传决策日志哈希值。这标志着AI治理正从‘模型审查’迈向‘行为溯源’新阶段。