GPT-5.4 重磅发布：更强编码、更高效率的专业级 AI 模型

2026 年 3 月 7 日，旧金山 —— OpenAI 今日正式发布全新一代旗舰模型 GPT‑5.4。作为面向专业工作场景的最新模型，GPT‑5.4 在 API、Codex 与 ChatGPT 全线产品中同步上线，在复杂任务处理效率、工具协同能力与资源使用效率等方面均有显著提升。

OpenAI 表示，GPT‑5.4 能以更少的 Token 完成更加复杂的任务，减少人机往返沟通次数，帮助企业和专业人士在实际业务中获得更高产出。

统一模型，全面升级专业能力

据介绍，GPT‑5.4 将此前在编码领域表现突出的 GPT‑5.3‑Codex 能力整合进同一模型，在保持顶级编程水平的同时，大幅增强长任务处理与前端生成等综合能力。新模型特别针对以下能力进行了优化：

知识与内容生产：在真实业务任务上的表现更加稳定、专业、可用。在 GDPval 等专业评测中，GPT‑5.4 在 83% 的对比任务中达到或超越行业专业人士水准，而 GPT‑5.2 为 71%，整体水准显著提升。
电脑操作与多模态视觉：GPT‑5.4 原生支持“电脑使用”（computer use），在 OSWorld‑Verified 评测中成绩达到 75%，远高于 GPT‑5.2 的 37.9%。这一能力使其成为构建自动化电脑操作智能体的最佳选择。同时，模型的视觉理解与生成能力也得到强化，并在 API 中引入全新的 original 细节参数，为图像相关场景提供更高质量输出。
编码和长上下文任务：GPT‑5.4 在 SWE‑Bench Pro 等专业编码基准上与 GPT‑5.3‑Codex 持平或更优，并具备更低的响应延迟。此外，新模型支持长达 100 万 Token 的上下文窗口，适合需要长时间推理、频繁调用工具并进行多轮自我校验的复杂开发与分析任务。
工具调用与动态工具管理：在工具调用方面，GPT‑5.4 引入全新 tool search 能力，允许模型在不破坏缓存的前提下动态加载所需工具，显著改善多工具协同场景下的性能与效率，尤其在关闭深度推理、追求低延迟的应用中效果突出。
网页搜索与代理式检索：新模型在“代理式网页搜索”场景下表现大幅提升。在衡量持续浏览与多步检索能力的 BrowseComp 基准上，GPT‑5.4 相比 GPT‑5.2 提升 17 个百分点，而 GPT‑5.4 Pro 版本更是以 89.3% 的成绩刷新纪录。

面向金融、数据分析与客户服务等关键行业

得益于其对复杂知识任务、长文档、多工具协同和电脑操作的综合优化，GPT‑5.4 尤其适用于对准确性和效率要求极高的垂直领域，包括但不限于：

金融服务与投研分析
大规模数据分析与商业智能
客户支持与服务自动化
文档、表格与演示文稿的自动生成与整理
前端界面原型自动生成与应用搭建

在这些场景中，GPT‑5.4 不仅能给出高质量的专业输出，还能跨文档、表格和演示稿等多种载体进行联动生成与编辑，成为真正意义上的“全链路工作助手”。

OpenAI 发布全新旗舰模型 GPT‑5.4，大幅提升专业生产力与工具协同能力