张亚勤论智能体AI范式跃迁：任务长度每7个月翻倍，AGI进入实干阶段

2025年末，中国工程院院士、清华大学智能产业研究院院长张亚勤在《人工智能发展白皮书（2025）》发布会上系统阐述了AI发展的三大结构性跃迁，其中最引发业界震动的是关于‘生成式AI向智能体AI范式跃迁’的实证分析。他指出，当前主流大模型正经历从‘内容生成’到‘目标驱动’的本质转变，其核心指标已发生数量级变化：处理复杂任务的‘任务长度’（即端到端决策链路长度）正以每7个月翻倍的速度指数增长，2025年Q4实测均值已达单次调用387个原子动作；而‘任务准确度’——在开放世界中完成多约束目标的首次成功率——已突破52.6%，正式越过实用化临界点。

张亚勤特别强调，这一跃迁并非简单的能力叠加，而是架构级重构。传统LLM依赖提示工程与检索增强，而新一代Agentic AI已内置‘目标分解-环境建模-动态规划-执行验证’四层闭环，其推理过程可被完整追踪与干预。以百度文心智能体在汽车产线质检场景为例，该系统能在0.8秒内完成缺陷识别、根因推断、维修路径规划及备件调度指令生成，较人工响应提速17倍且误判率下降至0.03%。这标志着AI正从‘回答问题’迈向‘解决问题’，从‘工具’升维为‘伙伴’。

更深远的影响在于规模定律（Scaling Law）的范式迁移。张亚勤团队通过分析2023–2025年全球137个主流模型训练日志发现：预训练规模定律（Pre-trained SL）边际效益在2025年Q2已趋近饱和，而推理规模定律（Inference SL）与智能体规模定律（Agentic SL）则呈现强正相关。尤为关键的是，模型推理单位成本正以年均10倍速度下降，而智能体综合能力（以MIT-AGI Benchmark v3.1测得）却以同等速率提升，形成典型的‘剪刀差效应’。这意味着AI规模化落地的经济障碍正被快速瓦解，2026年将成为工业智能体商用元年。

张亚勤预测，未来三年将出现‘领域智能体’爆发潮——医疗手术导航体、城市交通协控体、半导体光刻参数优化体等垂直场景专用智能体将率先替代传统软件系统。其核心逻辑在于：当任务长度突破300步阈值后，人类工程师已无法全程监督决策链，必须依赖智能体自身的因果推理与反事实验证能力。这一判断正被华为盘古智能体、阿里通义万相Agent等产品路线图所印证，标志着中国AI正从应用跟随走向范式定义。

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高

2026-03-07 16:00

张亚勤论智能体AI范式跃迁：任务长度每7个月翻倍，AGI进入实干阶段

📚 相关推荐

GPT-5.4 正式发布：百万 Token 上下文 + 原生计算机操作能力升级

Gemini 3.1 Flash-Lite 上线，谷歌推出高性价比轻量化大模型

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高