OpenAI最强模型GPT-5.4重磅发布 首次支持原生操控电脑 超越人类

哈哈库 新闻资讯 1

3月6日消息,今日,OpenAI正式发布全新大模型GPT-5.4,号称目前能力最强、效率最高的专业工作前沿模型。

相比此前的GPT-5.2,GPT-5.4在推理能力、编程能力以及处理专业办公任务方面都有明显提升,尤其是在电子表格、PPT等复杂办公场景中的表现更加出色。

此次更新带来了两个版本:更擅长复杂推理任务的GPT-5.4 Thinking,以及性能更强、面向企业高端需求的GPT-5.4 Pro。

其中,GPT-5.4 Thinking主要提供给付费用户使用,而GPT-5.4 Pro则针对企业级客户。

GPT-5.4最大亮点之一是OpenAI首次在通用模型中引入原生电脑操控能力。

模型不仅可以生成文本或代码,还能根据屏幕截图直接操作电脑软件、浏览网页,并通过控制鼠标和键盘完成任务,同时还可与电子表格、金融分析工具等企业应用进行深度整合。

在计算机操控基准测试OSWorld-Verified中,GPT-5.4取得了75.0%的任务成功率,超过人类平均水平72.4%,相较GPT-5.2的47.3%实现了大幅提升。

编程能力方面,在Codex开启快速模式后,GPT-5.4的token生成速度可提升约1.5倍,大幅提高代码编写和调试效率。

据了解,GPT-5.4在API及Codex可同时支持最高100万token的上下文窗口,是OpenAI迄今提供的最大上下文容量,适合跨步骤长链路任务的规划、执行与验证。

价格方面,API接口中GPT-5.4的单token定价较GPT-5.2略有上涨:每百万输入token为2.5美元,输出token为15美元。

至于更高性能的GPT-5.4 Pro,每百万输入token价格为30美元,输出token价格为180美元。

不过,由于token效率提升,许多任务的总成本反而会降低。

目前,GPT-5.4 Thinking已向Plus、Team以及Pro订阅用户开放,并取代此前的GPT-5.2 Thinking。

GPT-5.2 Thinking则计划于2026年6月5日正式下线。

抱歉,评论功能暂时关闭!