OpenAI 的最新人工智能突破带来增强的功能和更高的价格标签

简而言之
GPT-5.5 今天在 ChatGPT 和 Codex 中面向 Plus、Pro、Business 和 Enterprise 用户推出,API 访问即将推出,输入令牌为 5 美元/M,输出令牌为 30 美元/M。
该模型在 Terminal-Bench 2.0(测试复杂命令行工作流程的基准测试)上达到了 82.7%,击败了 Claude Opus 4.7 的 69.4% 和 Gemini 3.1 Pro 的 68.5%。
GPT-5.5 使用更少的代币来完成与 GPT-5.4 相同的 Codex 任务,尽管价格更高,但效率更高。
OpenAI 于周四推出了 GPT-5.5,将其本质上定位为针对代理计算机使用的模型。它可以编写和调试代码、浏览网页、填写电子表格,并持续完成多步骤任务,而无需人工照看每一步。
OpenAI 表示,该版本已于今天向 ChatGPT 和 Codex 的 Plus、Pro、Business 和 Enterprise 订阅者推出。
OpenAI 在一份声明中表示:“我们正在发布 GPT-5.5,这是我们迄今为止最智能、最直观使用的模型,也是迈向在计算机上完成工作的新方式的下一步。” “在代理编码、计算机使用、知识工作和早期科学研究领域,进展尤其强劲,这些领域的进展取决于跨环境的推理和随着时间的推移采取行动。
GPT-5.5 简介
一种用于实际工作并为代理提供动力的新型智能,旨在理解复杂的目标、使用工具、检查其工作并完成更多任务。它标志着一种完成计算机工作的新方式。
现已在 ChatGPT 和 Codex 中提供。 pic.twitter.com/rPLTk99ZH5
- OpenAI (@OpenAI) 2026 年 4 月 23 日
OpenAI 的大标题:GPT-5.5 明显比其前身 GPT-5.4 更智能,而且速度并不慢。在实际服务中匹配 GPT-5.4 的每个令牌延迟,同时在基准测试中获得更高的分数,这种效率改进通常不会发生。在相同硬件下运行时,较大的模型往往会更慢。
Terminal-Bench 2.0 测试模型处理需要规划和迭代工具使用的复杂命令行工作流程的能力,GPT-5.5 得分为 82.7%。 Claude Opus 4.7 的利用率为 69.4%,而 Gemini 3.1 Pro 的利用率为 68.5%。这不是边际领先。
在 GDPval(涵盖 44 个实际职业(从金融到法律研究到产品管理)的基准测试知识工作中),GPT-5.5 在 84.9% 的比较中匹配或击败了行业专业人士。
图片来源:OpenAI
正如预期的那样,它也是一个非常好的编码器。 Expert-SWE 是长期编码任务的内部基准,预计人类完成时间中位数为 20 小时,GPT-5.5 的表现优于 GPT-5.4。在对实际 GitHub 问题解决进行评分的 SWE-Bench Pro 上,它达到了 58.6%。 Claude Opus 4.7 得分更高,达到 64.3%,但 OpenAI 声称这可能是因为“人类报告了对部分问题的记忆迹象”
此次发布的市场自代理人工智能蓬勃发展以来一直在快速发展。 GPT-5.4 在 GPT-5.3 发布后两天发布,而小米在大约五周内从 MiMo-V2-Pro 升级到具有完整多模态功能的 MiMo 2.5 Pro。 GPT-5.4 和 GPT-5.5 之间的差距约为七周。现在就是这样的节奏。
但这种模型会对那些并不总是为下一件大事编写代码的日常用户产生影响吗?如果您使用的是免费套餐,则不会:GPT-5.5 不会提供给免费用户。如果您以每月 20 美元的价格购买 Plus,则该服务将于今天推出。我们尝试在 Pro 帐户下对其进行测试,但该模型并未立即可用。
更重要的可能是 GPT-5.5 在 Codex(OpenAI 的代理编码环境)中所做的事情,事实证明它更强大。 MagicPath 首席执行官 Pietro Schirano 在 OpenAI 分享的一段话中表示:“我真的感觉自己正在与更高的智能一起工作,而且几乎有一种尊重感。”
GPT-5.5 Pro 专为更困难、更高精度的工作而设计,正在 ChatGPT 中分别向 Pro、Business 和 Enterprise 用户推出。在 BrowseComp(测试模型在网络上追踪难以找到的信息的能力)上,GPT-5.5 Pro 得分为 90.1%,领先于 Gemini 3.1 Pro 的 85.9%。
根据人工分析指数,该模型平均也是最智能的。 GPT 5.5 报告了代币的更有效和更有用的使用,总体上产生了更好的结果。
图片来源:OpenAI
然而,定价可能会让一些用户感到震惊。该 API 推出时将收取每百万输入代币 5 美元的费用,每百万输出代币收取 30 美元的费用,OpenAI 表示“很快”就会推出。 API 中的 GPT-5.5 Pro 每百万输入代币的成本为 30 美元,每百万输出代币的成本为 180 美元。
这些数字高于 GPT-5.4——每百万输入代币 2.50 美元,每百万输出代币 15.00 美元——而 GPT-5.5 Pro 的定价与 GPT-5.4 Pro 相同。
也就是说,OpenAI 首席执行官 Sam Altman 在 X 上辩称,代币效率的提高抵消了成本——GPT-5.5 用更少的代币完成了相同的 Codex 任务,这意味着即使在更高的每个代币费率下,运行成本也更便宜。
仅供比较,小米 MiMo v2.5 Pro