生数科技发布世界模型2.0:无标注预训练+具身闭环驱动机器人泛化能力跃升

2026-04-02 19:51 👁 阅读

2026年3月27日,生数科技在杭州召开“World Model Summit 2026”,正式发布世界模型(World Model)2.0技术体系,首次实现“无标注视频流预训练+少量高质量动作标注微调”的新型训练范式,在机器人操作泛化能力上取得突破性进展。新模型基于自研的时空一致性编码器(ST-Consistency Encoder),可直接从TB级未标注工业监控视频、家庭机器人实操录像、自动驾驶路测影像中提取动态物理规律表征,自动构建包含物体运动学、接触力学、因果干预逻辑在内的隐式世界动力学模型。相比传统强化学习需百万次试错,WM2.0仅需500小时真实场景动作标注数据,即可使双臂协作机器人在从未见过的新产线环境中完成螺丝紧固、PCB插拔、柔性物料分拣等复杂任务,成功率提升至91.3%,较上一代提升34个百分点。

WM2.0技术栈包含三大核心模型:基座世界模型(Base WM)负责构建通用物理常识;世界生成模型(WGM)支持长时程、多约束条件下的未来状态仿真推演(如预测机械臂碰撞风险、预测传送带卡顿概率);世界行动模型(WAM)则实现“感知-预测-规划-执行”端到端闭环,支持自然语言指令(如“把左侧第三格蓝色零件装入右侧托盘,避开正在移动的AGV小车”)零样本迁移。目前,该模型已在富士康郑州工厂、菜鸟无人仓、美的微波炉智能装配线完成规模化部署,单台机器人日均任务切换频次达17次,平均重规划响应时间低于800ms。

更深远的意义在于,WM2.0正推动AI从“模式识别”走向“物理理解”。其内部构建的隐式因果图谱,已成功识别出3类此前被传统CV模型长期忽略的工业隐患模式(如金属疲劳微裂纹演化路径、电机轴承谐振频率漂移趋势),并反向输出预测性维护建议。中国科学院自动化所评测报告指出:“WM2.0标志着具身智能正从‘模仿执行’阶段迈入‘因果推演’阶段,为制造业智能化提供了可验证、可追溯、可进化的新型认知基础设施。”