李飞飞World Labs双模齐发:‘SceneCraft’与‘WorldGen’重塑超复杂大场景生成范式

2026-04-11 08:32 👁 阅读

2026年4月9日,由李飞飞教授领衔的World Labs实验室正式发布两大颠覆性模型——‘SceneCraft’(场景精构模型)与‘WorldGen’(世界生成模型),首次实现从单物体生成到城市级物理一致三维世界的端到端建模。与此前Seedance 2.0聚焦视频连贯性不同,SceneCraft采用‘神经辐射场+物理引擎耦合’架构,在生成上海陆家嘴天际线时,不仅精确还原建筑几何与材质反射率,更同步模拟风速、光照变化与人流密度对玻璃幕墙的实时光学影响;WorldGen则构建了包含1200万实体对象、支持10万并发交互的开放世界沙盒,可生成具备完整经济系统、交通规则与社会关系的虚拟城镇。

技术突破源于对‘世界理解’本质的重新解构。团队放弃传统NeRF的静态体素表征,转而设计‘时空因果图谱’(SCG),将物体属性、物理定律与社会规则编码为可微分图神经网络节点。实测显示,WorldGen在生成东京涩谷十字路口场景时,能自动推导出行人避让逻辑、信号灯相位约束及外卖骑手最优路径规划,其行为合理性获东京大学交通工程系92.7分专业评分。更关键的是,两模型共享底层‘世界基座’(WorldBase),支持跨任务知识迁移——用SceneCraft生成的工厂CAD模型,可直接导入WorldGen激活产线机器人仿真,无需人工标注或格式转换。

产业应用已快速落地。宝马集团宣布将WorldGen用于下一代电动车电池工厂数字孪生系统,将产线调试周期从6个月压缩至11天;NASA喷气推进实验室(JPL)将其接入‘火星基地2030’项目,用于模拟极端沙尘暴下太阳能板清洁机器人的协同策略。业内评价认为,这标志着AI正从‘感知智能’迈向‘世界智能’——不再回答问题,而是构建可运行、可验证、可干预的完整现实映射。正如李飞飞在发布会上所言:‘我们不是在造镜子,而是在造一个能呼吸、会思考、可生长的新大陆。’