阿里全新AI视频大模型HappyHorse正式发布,接入百炼平台加速具身智能落地
2026年4月11日,阿里巴巴集团正式对外披露其全新自研AI视频大模型HappyHorse,标志着中国在多模态基础模型领域实现关键突破。该模型由通义实验室主导研发,专为高精度、长时序、物理一致的视频生成与理解任务设计,支持从单帧图像到120秒连贯视频的端到端生成,并首次在动态光照、遮挡恢复与跨视角运动建模等硬性指标上超越Gemini-3.1 Pro与Sora-2.5基准。HappyHorse并非孤立模型,而是深度嵌入阿里云百炼平台AI智能体开发体系,开发者可通过低代码界面调用其视频编排、语义编辑、世界状态推理等能力模块,显著降低具身智能体(如服务机器人、数字员工)的场景仿真与行为训练门槛。
据阿里云内部技术白皮书披露,HappyHorse采用‘时空联合稀疏注意力’架构,在保持200万token上下文窗口的同时,将视频推理延迟压缩至行业平均值的62%;其训练数据涵盖超800万小时真实工业监控、医疗内镜、自动驾驶路测及人机协作视频,特别强化了对机械臂轨迹、人体关节动力学与环境物理约束的建模能力。模型已通过国家人工智能测试中心AIGC内容安全三级认证,内置符合《生成式AI服务管理暂行办法》的实时伦理过滤器,可自动拦截暴力、歧视及非授权身份模拟类输出。
业内分析指出,HappyHorse的发布不仅是技术迭代,更是产业范式迁移的信号。它直接服务于阿里正在构建的‘物理世界操作系统’战略——以视频为感知入口、以世界模型为认知中枢、以机器人本体为执行终端。目前,宇树科技H1人形机器人、智元酷拓四足平台均已接入HappyHorse进行虚拟-现实协同训练;在制造业场景中,三一重工试点项目显示,产线异常识别响应时间缩短73%,虚拟调试周期压缩至原有时长的1/5。随着7月15日《人工智能拟人化互动服务管理暂行办法》实施临近,HappyHorse所承载的‘可控可信视频智能’能力,或将成企业级AI合规部署的核心基础设施。