杨植麟发布大模型第一性原理：把能源转化为智能

2026-03-25 21:09

2026年3月25日，月之暗面联合创始人兼CTO杨植麟在魔搭社区EAI-100峰会发表主旨演讲，首次系统提出‘大模型第一性原理’：‘做大模型本质上是把更多的能源转化成智能。’这一看似简洁的论断，实则直指当前AI研发的核心瓶颈——算力投入与智能产出之间的转化效率严重失衡。杨植麟指出，过去十年行业过度聚焦‘堆数据、扩参数、加算力’，却忽视了如何在有限能源约束下最大化智能密度。为此，他拆解出提升转化效率的三大支柱：Token效率、长上下文架构优化与智能体集群协同。

在Token效率维度，Kimi团队通过动态数据蒸馏与语义压缩技术，在同等训练数据量下实现逻辑推理能力提升37%，使模型更擅长从稀疏信号中提取高价值知识。在架构层面，其自研的Kimi Linear长上下文方案将1M tokens输入的内存开销降低至传统Transformer的1/8，且推理延迟下降62%，为实时多轮复杂任务（如法律合同逐条比对、科研文献跨域综述）提供底层支撑。最具颠覆性的是其提出的‘注意力残差’（AttnRes）连接技术——将时间轴注意力机制‘旋转90度’应用于网络深度方向，使每一层均可融合此前所有层的隐状态输出，仅增加2%计算成本即大幅提升深层推理稳定性。

而真正体现范式革命的，是杨植麟力推的‘Agent集群’（Agent Swarm）模式。他类比道：‘建造一家千亿美元公司，靠一个天才需百年；但若调度数百个专业Agent并行协作，则可在数小时内完成从需求分析、代码编写、测试部署到文档生成的全链路闭环。’基于Kimi K2.5构建的集群已在GitHub零基础建仓任务中验证：面对无任何先验信息的模糊需求，集群自动分解子任务、分配角色、交叉验证结果，执行耗时不随任务复杂度指数增长，而是保持近似线性扩展。

该理念正迅速引发产业共振。据《科创板日报》报道，已有12家A股上市公司启动‘智能体集群中间件’适配计划，覆盖金融风控、生物医药CRO、智能汽车HMI等场景。中国政法大学张凌寒教授指出：‘当AI不再是单点工具，而是一个可编程、可审计、可问责的数字组织时，现有《网络安全法》《数据安全法》的适用逻辑亟待重构。’杨植麟的底层创新，不仅重塑了技术标准，更倒逼法律、管理、教育等全要素体系进行适应性进化，标志着中国AI正从应用跟随迈向原理定义的新阶段。

上一篇张亚勤提出AI范式跃迁：从生成式AI迈向智能体AI（2025）下一篇 2026中国AI法治十大议题发布：智能体行为边界成首要焦点