生数科技发布新一代世界模型WGM/WAM双轨架构,推动具身智能泛化能力跃升

2026-04-02 19:56 👁 阅读

2026年3月30日,生数科技在第四届中国数字经济产业发展大会上正式发布其世界模型(World Model)技术体系的最新进展——世界生成模型(World Generation Model, WGM)与世界行动模型(World Action Model, WAM)双轨协同架构。该架构并非简单堆叠视觉语言模型(VLM)与强化学习模块,而是基于统一隐空间表征,实现了对物理环境动态演化、多智能体交互逻辑与长时序动作策略的联合建模。WGM专注于构建高保真、可编辑、具备物理一致性的三维场景生成能力,支持从单张图像或自然语言描述中反演完整环境动力学模型;WAM则在此基础上,直接在隐空间中规划并解码出符合物理约束、任务目标与安全边界的连续动作序列,大幅降低传统端到端模仿学习对海量真实交互数据的依赖。

技术突破的核心在于其创新的“无标注预训练+小样本精调”范式。团队利用超大规模互联网视频与仿真引擎日志,构建了覆盖10万种物体交互、500类物理现象的合成数据集,在无需人工标注动作标签的前提下,通过对比学习与时空一致性约束完成WGM的自监督预训练;随后仅需在特定场景(如仓储分拣、电力巡检)部署数百小时的真实机器人交互数据,即可完成WAM的高效微调。实测表明,在未见过的陌生仓库环境中,搭载该模型的移动机械臂任务成功率提升至89.7%,较上一代方案提高32个百分点,且泛化至新物体抓取的冷启动时间缩短至4.2小时。

这一进展标志着具身智能正从“数据驱动的模仿”迈向“模型驱动的推理”。世界模型作为机器人的“内在心智”,使其能在执行前进行千万次虚拟试错,显著提升决策鲁棒性与安全性。生数科技CTO在发布会上强调:“WGM是机器人的‘想象力’,WAM是它的‘执行力’,二者耦合形成的闭环,让机器人第一次真正拥有了‘思考下一步该怎么做’的能力。”目前,该技术已落地京东亚洲一号仓、南方电网变电站等8个国家级示范场景,并向中科院沈阳自动化所、哈工大机器人技术与系统国家重点实验室等机构开源核心训练框架与评估协议,推动建立具身智能通用评测基准(Embodied-Bench 2.0),为行业标准化发展奠定基础。