《2026大模型演进报告》近日发布,报告明确指出,经过两年多的激烈竞争,AI大模型行业已正式告别“参数竞赛”时代,架构创新成为推动大模型发展的主流方向,大模型发展从“炫技”转向“实用”,聚焦效率提升、成本降低与场景适配。

报告显示,2024年以来,全球大模型参数规模增速持续放缓,千亿级、万亿级参数模型的边际效益逐渐递减,单纯追求参数规模已无法显著提升模型性能,反而导致训练成本、部署难度大幅增加。在此背景下,混合专家模型(MoE)、神经符号融合架构等新型架构快速崛起,成为行业主流。

例如,阿里通义千问4.0采用第三代MoE分布式架构,实现“总参数3970亿但单次推理仅激活170亿参数”,部署成本降低60%;百度文心一言6.0的“双脑架构”融合神经网络与符号推理,在复杂数学推理任务中准确率大幅提升。业内专家表示,架构创新不仅解决了大模型“规模越大,效率越低”的困境,还推动大模型向轻量化、高效化方向发展,为中小企业部署应用大模型创造了条件,加速了大模型的产业化落地。