DeepSeek V4发布:1.6T参数+1M上下文,开启Long Horizon Agent新纪元

2026年5月初,国产开源大模型领军者DeepSeek正式发布V4版本,标志着中国大模型在长程智能体(Long Horizon Agent)方向实现关键突破。该模型参数量达1.6万亿,支持百万级上下文窗口,系全球首个在公开基准中稳定完成连续8小时任务调度的开源基座模型。其背后依托mHC残差优化技术,显著增强深层训练稳定性,并首次将Test Time Scaling Law系统性延伸至超长时序决策场景。

动态层面,V4不仅强化了多步推理与工具调用能力,更深度集成浙大-阿里联合研发的Steering行为引导框架EasyEdit2,可在不重训前提下动态调控模型信念状态、安全策略与任务专注度,实现在金融投研、工业巡检等高可靠性场景中的可控自主执行。

行业影响深远:一方面,V4以高性价比打破海外SOTA模型在复杂Agent任务上的垄断,推动国内企业级智能体部署成本下降超40%;另一方面,其开源策略加速了国产Agent开发范式的统一——包括标准化动作空间定义、可验证的子目标分解协议及跨环境状态迁移接口,已被华为云、招商证券等十余家头部机构纳入生产级AI助理底座。

展望未来,随着5月20日谷歌I/O大会临近,GPT-6与Minimax M3等竞品亦将聚焦Long Horizon能力升级。DeepSeek团队透露,V4.5将于Q3上线,重点增强自我反思与跨任务知识蒸馏能力,目标实现3–4天连续无干预作业,并向‘具身Agent’延伸,与银河通用LDA-1B等动作模型形成软硬协同生态。

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高

2026-03-07 16:00

DeepSeek V4发布:1.6T参数+1M上下文,开启Long Horizon Agent新纪元

📚 相关推荐

GPT-5.4 正式发布：百万 Token 上下文 + 原生计算机操作能力升级

Gemini 3.1 Flash-Lite 上线，谷歌推出高性价比轻量化大模型

Claude Opus 4.6 坐稳旗舰，长文本处理再攀新高