银河通用LDA-1B开源:跨本体世界-动作融合模型引爆具身智能GPT-2时刻
2026年5月1日,具身智能头部企业银河通用正式开源1.6B参数跨本体「隐式世界-动作基础模型」LDA-1B,论文登顶机器人顶会RSS(仅录用210篇),被业界誉为具身智能领域的‘GPT-2时刻’。该模型突破长期制约行业发展的数据割裂瓶颈,首次实现虚拟仿真、真实视频、人类示范、机器人原始传感流等多源异构数据的统一高效利用,无需精细标注即可完成端到端动作策略学习。
技术动态上,LDA-1B采用自研WAM(World-Action Merging)融合架构,摒弃传统VLA(Vision-Language-Action)分阶段建模路径,在隐空间同步建模物理世界状态演化与动作语义生成,使模型仅需1小时后训练即可适配轮式、双足、机械臂等不同具身本体。实测显示,其在零售分拣、家庭叠衣、工业搬运三大典型场景中任务成功率较英伟达DreamZero提升22%,且泛化至未见机器人形态的零样本迁移准确率达78%。
这一突破正重塑具身智能产业逻辑:数据获取成本骤降60%以上,中小企业可通过采集低成本UGC视频或仿真回放快速构建垂直领域动作模型;同时推动硬件厂商从‘卖本体’转向‘卖可进化动作OS’,宇树科技、优必选等已宣布接入LDA-1B SDK。
展望下一阶段,银河通用联合中科院自动化所启动‘LDA-X计划’,拟于2026年内推出支持10B级参数、具备跨模态因果推断能力的LDA-2B,并开放千万级虚实混合动作数据集LDA-DataHub。业内共识认为,LDA系列有望成为继Transformer之后,又一定义AI基础设施范式的底层架构。