腾讯开源混元3D世界模型2.0:一句话生成可交互3D场景,兼容Unity/Unreal引擎

2026-04-18 12:00 👁 阅读

2026年4月14日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0),标志着中国在原生多模态世界建模领域取得关键性突破。该模型支持以自然语言指令(如“生成一座带喷泉的江南园林,含可行走路径与实时光影”)一键生成高保真、结构完整、具备物理属性与语义拓扑的3D场景,并原生导出为Unity、Unreal Engine及WebGL兼容格式。不同于传统NeRF或Gaussian Splatting等单任务重建方法,HY-World 2.0采用‘语义-几何-动力学’三重解耦架构,首次实现文本驱动下的动态物体绑定、碰撞体自动生成与基础交互逻辑嵌入,使生成结果可直接投入游戏开发、数字孪生仿真及机器人训练环境构建。

技术细节显示,模型基于超1200万组高质量3D-文本对齐数据集训练,融合了腾讯自研的跨模态对齐蒸馏(CMAD)机制与轻量化空间注意力模块,在A100集群上推理延迟低于800ms(1024×1024分辨率)。尤为关键的是,其开放API支持开发者上传自有3D资产库进行微调,已接入国内超230家游戏工作室与工业软件企业测试反馈。开源代码、权重及全量基准评测(包括ScanNetV2-3D、Objaverse-XL等新设指标)同步上线GitHub,Apache 2.0协议授权,允许商用。

行业影响层面,HY-World 2.0正加速推动‘AI原生内容生产范式’落地。此前,3D内容创作长期受限于专业门槛高、周期长、成本重三大瓶颈,单个中型场景建模平均耗时72小时以上。而实测数据显示,使用该模型后,初级设计师可在15分钟内完成原型搭建,迭代效率提升近20倍。更深远的意义在于,它为具身智能体提供了低成本、高泛化性的仿真训练底座——宇树科技已确认将其嵌入H1机器人家庭服务场景预演系统;国家电网亦启动试点,用于变电站数字巡检路径自动规划。随着模型生态持续扩展,3D世界生成或将从‘工具’升维为新一代AI基础设施。