李飞飞World Labs双模齐发:‘SceneForge’与‘WorldSim’重塑大模型场景构建范式

2026-04-13 08:32 👁 阅读

2026年4月9日,由李飞飞教授领衔的World Labs实验室正式发布两大突破性模型:SceneForge(场景锻造者)与WorldSim(世界模拟器),首次实现从‘静态图像生成’到‘动态物理世界建模’的代际跨越。SceneForge专注超复杂三维场景的零样本构建,能在单次推理中生成包含百万级几何体、真实材质反射、全局光照与天气系统的完整城市街区,支持从卫星图、手绘草图或多角度照片任意输入源驱动;WorldSim则作为其运行底座,提供毫秒级物理引擎响应,可实时模拟车辆碰撞、流体运动、布料褶皱甚至微观粒子扩散,精度达到分子动力学仿真级别。二者协同,首次让大模型具备‘世界心智’——不仅理解场景,更能预测其演化。

该成果解决了长期制约具身智能发展的核心瓶颈。此前机器人训练严重依赖仿真环境,但现有平台(如NVIDIA Omniverse)受限于建模效率与物理真实性,一个中等复杂度工厂场景建模需200人天,且无法支持复杂因果推演。SceneForge将建模周期压缩至15分钟以内,WorldSim则使仿真速度提升47倍,支持10万智能体并发交互。在波士顿动力最新测试中,搭载该技术的Spot机器人仅通过观看3段施工视频,即自主规划出混凝土浇筑路径并规避所有动态障碍物,任务成功率从62%跃升至94.7%。

其社会价值远超技术本身。在应急管理领域,国家地震局已接入WorldSim系统,可基于实时地质数据秒级生成震后三维废墟模型,辅助救援路径规划;在文化遗产保护中,敦煌研究院利用SceneForge重建了已损毁的莫高窟第217窟,精度达0.1毫米,为数字孪生文保树立新标杆。专家指出,这标志着AI正从‘认知智能’迈向‘存在智能’——当模型不仅能描述世界,更能内在模拟世界运行规律,通用人工智能的基石才真正奠定。未来,此类技术或将成为数字政府、智慧城市的默认操作系统。