2026年3月9日,斯坦福大学‘以人为本人工智能研究院’(HAI)联合创始人李飞飞在旧金山AI Summit正式发布World Labs首代世界模型Marble。区别于Sora、Pika等视频生成模型,Marble被定义为‘真正意义上的世界模型’——它不输出帧序列,而是根据文本或图像提示即时生成一个几何结构完整、物理规律自洽、支持自由视角导航与对象交互的3D可运行世界。演示中,输入‘雨夜东京涩谷十字路口,霓虹灯闪烁,行人撑伞穿行’,Marble不仅渲染出符合流体力学的雨滴轨迹与光影折射,更允许用户点击任意行人触发对话、拖拽车辆改变路径,甚至调用内置物理引擎模拟碰撞结果。李飞飞强调:‘这不是特效,而是沙盒;不是观看,而是进入。’

该突破源于李飞飞团队对AI进化本质的重新思考。她在访谈中援引寒武纪生命爆发案例指出:‘感知先于语言——5亿多年前,生命最先发育的是视觉与触觉系统,而非语言中枢。AI的下一个前沿,是理解、推理并与3D物理世界互动的能力。’Marble正是这一理念的工程实现:其底层采用神经辐射场(NeRF)与符号化物理引擎耦合架构,将视觉表征、空间拓扑与牛顿力学规则统一编码于隐式神经场中。目前,Marble已在丰田自动驾驶仿真平台、强生外科手术训练系统及NASA火星探测器任务规划中开展实测,将真实世界测试周期压缩87%。

更深远的影响在于应用边界的爆炸式拓展。除游戏影视(虚拟制片效率提升5倍)、机器人训练(加州理工团队用Marble构建10万小时异构地形数据集)外,李飞飞特别提及心理治疗新范式:临床医生可为创伤后应激障碍(PTSD)患者定制可控暴露环境,如‘安静海滩’或‘渐进式地铁车厢’,实时调节光照、声音与人群密度参数,实现精准剂量干预。这标志着AI正从‘内容生成工具’跃迁为‘认知与行为塑造基础设施’,其伦理权重与社会影响已远超传统技术范畴。