腾讯混元Hy3正式开源:2950亿参数混合专家架构重塑大模型推理范式

2026-05-06 09:04 👁 阅读

2026年4月23日,腾讯正式发布并开源混元Hy3 preview大语言模型,标志着国产超大规模模型在架构创新与工程落地层面实现关键跃迁。该模型是腾讯混元团队在2月完成预训练与强化学习基础设施全面重建后的首个里程碑成果,亦为首席AI科学家姚顺雨入职近四个月后交出的首份技术答卷。Hy3采用快慢思考融合的混合专家(MoE)架构,总参数达2950亿,但激活参数仅210亿,兼顾性能与能效,在256K超长上下文支持下,复杂推理、指令遵循、上下文学习及代码生成等核心能力较前代提升显著,尤其在智能体任务中展现出更强的任务分解与工具调用稳定性。

此次开源不仅释放完整模型权重与推理代码,更配套公开训练框架、评估基准及轻量化部署工具链,大幅降低高校与中小企业接入高阶AI能力的技术门槛。业内分析指出,Hy3对‘激活稀疏性’的极致优化,或将推动行业从‘堆参数’转向‘精调度’的新竞争逻辑;其210亿激活参数即达GPT-5.4级表现,意味着终端侧与边缘端部署可行性显著增强。

影响层面,Hy3已引发寒武纪、昇腾等国产芯片厂商紧急启动适配,预计Q3将上线多款联合优化推理方案;同时,其架构设计已被多家政务与金融大模型团队列为参考蓝本。展望未来,腾讯明确将Hy3作为‘混元智能体生态’底座,计划于2026年Q3推出Hy3-Agent SDK,支持开发者零代码构建垂类Agent工作流。随着开源生态快速聚拢,中国大模型正从‘可用’迈向‘好用’与‘可控’的深水区。