腾讯混元Hy3 Preview开源:2950亿参数混合专家架构重塑复杂推理范式
2026年4月23日,腾讯正式开源混元Hy3 Preview大语言模型,这是首席AI科学家姚顺雨加盟后首份技术答卷,亦是国内首个实现‘快慢思考融合’架构落地的千亿级开源模型。该模型总参数达2950亿,但激活参数仅210亿,依托动态稀疏路由机制,在保持低推理成本的同时,将复杂逻辑链路处理能力提升至新高度。其核心突破在于256K超长上下文支持与原生智能体任务编排能力,已在腾讯内部支撑微信搜一搜实时语义理解、广告创意生成等高并发场景。背景上,Hy3诞生于混元团队对‘大而不强’行业痛点的系统性反思——过去一年,国内多家头部模型在数学证明、多跳事实核查等任务中准确率停滞于62%-68%,主因是传统稠密架构难以兼顾广度与深度。
Hy3采用双轨推理路径:‘快思考’通路处理常规指令与上下文续写,延迟低于380ms;‘慢思考’通路则自动触发于需符号推理、代码调试或跨文档比对的复杂任务,调用专用MoE子模块进行多轮验证。实测显示,其在GAIA基准测试中复杂任务解决率较V3提升41.7%,且代码生成错误率下降63%。产业影响已显现:寒武纪宣布完成Hy3全栈适配,昆仑芯同步推出Hy3定制化推理卡;更值得注意的是,多家券商研究所正将其嵌入投研工作流,替代传统NLP pipeline处理万字级财报分析。
长期来看,Hy3预示着大模型技术路线的重大分野:参数规模竞赛正让位于‘架构效率革命’。随着更多厂商跟进稀疏化、模块化设计,AI推理成本有望在2026年内再降40%,推动智能体从‘演示原型’走向‘生产级工具’。而腾讯选择开源而非闭源,亦释放出构建国产AI生态底层共识的强烈信号——其GitHub仓库已吸引超2.3万开发者提交PR,社区共建的中文法律推理插件包下载量突破17万次。