2026年3月,OpenAI正式发布GPT-5.4,将百万Token上下文与原生电脑操控能力整合,彻底打破了上一代模型的能力边界,成为AI行业的又一里程碑。其核心优势集中在两大核心升级,既解决了长期以来的上下文局限,又实现了从“问答”到“操作”的跨越,实用性大幅提升。

百万上下文的优势的在于“全量理解”,GPT-5.4支持最高100万Token的上下文窗口,相当于可一次性导入一个完整项目的所有文档、代码或对话记录,无需分段上传。测试显示,128K至272K区间表现最稳定,适合日常办公、代码调试等场景,而256K以上准确率虽有下滑,但已能满足长文档分析等特殊需求。这彻底解决了以往模型“记不住前文”的痛点,比如处理长篇报告、多轮复杂对话时,无需反复提醒背景信息,模型可全程连贯响应。

电脑操控能力则实现了“落地执行”的突破,GPT-5.4可原生操控电脑各类软件,无需额外插件,能自主完成文档编辑、表格计算、网页操作、代码运行等一系列任务。相较于以往需要人工配合的AI工具,它真正实现了“指令下达,全程自动”,比如用户只需指令“整理本月销售数据并生成可视化图表”,模型可自主打开Excel、提取数据、设计图表,全程无需人工干预。

此外,GPT-5.4在推理能力上也有显著提升,在FrontierMath Tier 4等高级数学基准测试中得分38.0%,远超上一代的31.3%,在专业领域的实用性进一步增强。尽管超大上下文存在成本较高的问题(超过272K请求按两倍用量计费),但对于科研、企业办公等场景而言,其效率提升带来的价值远高于成本,成为高端用户的首选模型。