2026 年 3 月 7 日,旧金山 —— OpenAI 今日正式发布全新一代旗舰模型 GPT‑5.4。作为面向专业工作场景的最新模型,GPT‑5.4 在 API、Codex 与 ChatGPT 全线产品中同步上线,在复杂任务处理效率、工具协同能力与资源使用效率等方面均有显著提升。
OpenAI 表示,GPT‑5.4 能以更少的 Token 完成更加复杂的任务,减少人机往返沟通次数,帮助企业和专业人士在实际业务中获得更高产出。
统一模型,全面升级专业能力
据介绍,GPT‑5.4 将此前在编码领域表现突出的 GPT‑5.3‑Codex 能力整合进同一模型,在保持顶级编程水平的同时,大幅增强长任务处理与前端生成等综合能力。新模型特别针对以下能力进行了优化:
- 知识与内容生产:在真实业务任务上的表现更加稳定、专业、可用。在 GDPval 等专业评测中,GPT‑5.4 在 83% 的对比任务中达到或超越行业专业人士水准,而 GPT‑5.2 为 71%,整体水准显著提升。
- 电脑操作与多模态视觉:GPT‑5.4 原生支持“电脑使用”(computer use),在 OSWorld‑Verified 评测中成绩达到 75%,远高于 GPT‑5.2 的 37.9%。这一能力使其成为构建自动化电脑操作智能体的最佳选择。同时,模型的视觉理解与生成能力也得到强化,并在 API 中引入全新的 original 细节参数,为图像相关场景提供更高质量输出。
- 编码和长上下文任务:GPT‑5.4 在 SWE‑Bench Pro 等专业编码基准上与 GPT‑5.3‑Codex 持平或更优,并具备更低的响应延迟。此外,新模型支持长达 100 万 Token 的上下文窗口,适合需要长时间推理、频繁调用工具并进行多轮自我校验的复杂开发与分析任务。
- 工具调用与动态工具管理:在工具调用方面,GPT‑5.4 引入全新 tool search 能力,允许模型在不破坏缓存的前提下动态加载所需工具,显著改善多工具协同场景下的性能与效率,尤其在关闭深度推理、追求低延迟的应用中效果突出。
- 网页搜索与代理式检索:新模型在“代理式网页搜索”场景下表现大幅提升。在衡量持续浏览与多步检索能力的 BrowseComp 基准上,GPT‑5.4 相比 GPT‑5.2 提升 17 个百分点,而 GPT‑5.4 Pro 版本更是以 89.3% 的成绩刷新纪录。
面向金融、数据分析与客户服务等关键行业
得益于其对复杂知识任务、长文档、多工具协同和电脑操作的综合优化,GPT‑5.4 尤其适用于对准确性和效率要求极高的垂直领域,包括但不限于:
- 金融服务与投研分析
- 大规模数据分析与商业智能
- 客户支持与服务自动化
- 文档、表格与演示文稿的自动生成与整理
- 前端界面原型自动生成与应用搭建
在这些场景中,GPT‑5.4 不仅能给出高质量的专业输出,还能跨文档、表格和演示稿等多种载体进行联动生成与编辑,成为真正意义上的“全链路工作助手”。

