Claude Opus 4.8 在最新 AI 基准测试中超越 GPT-5.5

Anthropic 推出了 Claude Opus 4.8，代表该公司迄今为止最先进的人工智能系统，现已在全球范围内使用。该版本基于 Opus 4.7 构建，在代码生成、逻辑推理和真实性方面显着增强。隆重推出 Claude Opus 4.8：它建立在 Opus 4.7 的基础上，具有更敏锐的判断力、对自身进展更加诚实、以及比其前辈更长时间独立工作的能力。今天可以以同样的价格购买。 pic.twitter.com/EufxL7T1kb — Claude (@claudeai) 2026 年 5 月 28 日 Anthropic 进行的基准评估表明，与 OpenAI 的 GPT-5.5 和 Google 的 Gemini 3.1 Pro 相比，Opus 4.8 在多个测试类别中提供了卓越的结果。该模型尤其擅长自主编码任务、财务数据分析和计算机交互场景。自主人工智能描述了能够在最少的人工监督下执行复杂操作的技术。随着组织将人工智能驱动的代理集成到其工作流程中，这种功能变得越来越重要。最显着的功能之一是引入了工作量调整控件，现在可以通过 Claude.ai 和 Claude Cowork 获得。此功能使用户能够调节分配给特定请求的计算资源。在处理简单查询时，用户可以降低处理强度以节省时间和计算单元。相反，具有挑战性的项目可以获得增强的处理能力，以进行更彻底的分析。计算单位充当人工智能服务用于量化输入和输出的测量标准。与人工智能系统的每次交互都会消耗这些单元，无论复杂程度如何——从基本问题到复杂的编程请求。降低处理强度意味着减少单位消耗，从而可能减少高使用量组织的费用。在可靠性改进方面，与 Opus 4.7 相比，Opus 4.8 在识别编码错误方面增强了 400%。这对于在实时生产系统中部署模型的软件开发人员来说是一次重大升级。该公司同时推出了 Claude Code 动态工作流程的实验版本。此功能可以协调数百个同步子流程来管理大量代码迁移项目。该系统还经过改进，提高了透明度。据 Anthropic 称，该模型将承认其分析的局限性，并避免提供未经证实的信息。快速模式操作变得更加经济。运营成本降低了 66%，同时维持最终用户每百万个输入代币 10 美元和每百万个输出代币 50 美元的公布费率。标准层定价保持一致，为每百万输入代币 5 美元和每百万输出代币 25 美元。 Opus 4.8 的推出恰逢 Anthropic 即将完成一轮超过 300 亿美元的 IPO 前融资的报道。这项投资可能会使公司估值超过 9000 亿美元。虽然 Anthropic 尚未正式宣布上市计划，但业内消息人士暗示，该公司可能于 2026 年首次上市。这一时间表与 OpenAI 和 SpaceX 正在进行的类似准备工作一致，这两家公司都在考虑公开募股。 Anthropic 由前 OpenAI 团队成员创立，现已成为人工智能领域的主要参与者。通过专家分析发现人工智能、加密货币和技术领域表现最好的股票。