生数科技发布世界模型2.0:无标注预训练+具身行动模型(WAM)推动机器人泛化能力跃升

2026-04-02 19:56 👁 阅读

2026年3月30日,生数科技在CCF主办的人工智能前沿论坛上正式发布世界模型(World Model)2.0技术体系,首次将世界生成模型(WGM)与世界行动模型(WAM)解耦并协同优化,实现从“理解世界”到“改造世界”的能力跃迁。新体系摒弃传统依赖海量人工标注轨迹数据的训练范式,转而采用“互联网视频+物理仿真+传感器合成数据”的三源无标注预训练策略:利用千万小时公开视频学习时空因果关系;通过NVIDIA Omniverse构建的10万+高保真工业场景数字孪生体生成物理一致的动作先验;再结合真实机器人采集的稀疏奖励信号进行强化微调。实测显示,WAM在未见过的装配产线环境中任务成功率提升至89.7%,较前代提升32个百分点,且单任务冷启动训练时间压缩至4.2小时,仅为传统方法的1/15。

WAM的核心突破在于提出“动作语义图谱(Action Semantic Graph, ASG)”表征方式,将机械臂运动、工具交互、材料形变等物理动作映射为可推理的拓扑结构,使模型不仅能执行指令,更能自主规划多步子目标链。例如,在电池模组拆解任务中,WAM可自动识别螺丝锈蚀状态→切换扭矩参数→判断胶粘强度→规划无损分离路径,全程无需人工编写规则。该能力已在宁德时代、比亚迪等头部车企的电池回收产线完成验证,异常处理响应速度达毫秒级,人力巡检依赖度下降76%。

更深远的影响在于生态重构:生数科技同步开源WAM-Base 7B模型权重与ASG构建工具链,并联合中国电子技术标准化研究院发布《具身智能动作语义描述规范》团体标准。此举将加速行业形成统一的动作理解接口,打破当前“一厂一模型、一机一算法”的碎片化困局。据预测,2026年内将有超200家制造企业基于WAM开发定制化具身智能体,推动我国工业机器人从“自动化执行”迈入“认知化决策”新阶段,为全球具身智能产业化树立中国技术范式。