Nvidia (NVDA) 开始向 OpenAI 和 Anthropic 等人工智能巨头运送 Vera CPU

Nvidia (NVDA) 已成功将其 Vera CPU 从发布阶段过渡到全面生产,首批交付给几家重量级人工智能公司。 NVIDIA Corporation、NVDA Ian Buck 担任 Nvidia 超大规模和 HPC 副总裁,上周在充满活力的两天内,直接向 Anthropic、OpenAI、Oracle 云基础设施和 SpaceXAI 交付了首批设备。 NVIDIA 的 Ian Buck 亲自向我们的合作伙伴 @AnthropicAI、@OpenAI、@SpaceX 和 @OracleCloud 交付了首款 NVIDIA Vera CPU。 🎉 Vera 是 NVIDIA 首款定制 CPU,专为代理 AI 时代而打造。这只是开始。通往 Vera 驱动系统的道路开始了…… pic.twitter.com/Ep5PLqcqIa — NVIDIA (@nvidia) 2026 年 5 月 18 日 Buck 的最初目的地是位于旧金山的 Anthropic 南市场区总部,该公司的计算负责人 James Bradbury 在那里接受了交付。 Buck 准备了一块裸露的 Vera CPU 主板,为 Bradbury 提供了详细的技术演练。 “计算扩展是模型进步的关键催化剂,”布拉德伯里说。 “Vera 作为应对代理工作负载挑战的可行生态系统组件的到来令我们感到兴奋。”继 Anthropic 之后,Buck 前往 OpenAI 的 Mission Bay 园区,负责计算基础设施的 Sachin Katti 在外面与他会面。在一次动手演示中,巴克甚至在讨论过程中抓起一把螺丝刀打开机箱并露出内部组件。当天的最后一站,巴克来到了 SpaceXAI 位于帕洛阿尔托的地点。英伟达代表团向埃隆·马斯克提供了全面的系统架构简报。马斯克对核心配置、内存设计和热管理进行了详细询问。 SpaceXAI 目前正在其训练基础设施中测试 Vera 的强化学习任务和基于代理的模拟框架的能力。周一,参观范围向南延伸至位于圣克拉拉的 Oracle AI 客户卓越中心,OCI 的产品和客户成功团队在这里亲自检查了拆封后的系统。 OCI 整体产品管理负责人 Karan Batta 解释道:“OCI 的路线图包括从 2026 年开始部署数十万个 Nvidia Vera CPU,以满足代理 AI 对超大规模持续性能的需求。” OCI 是首家致力于超大规模 Vera 的云服务提供商。 Vera 代表了 Nvidia 的首个定制 CPU 设计,专为代理 AI 工作负载而设计,在这些场景中,模型超越简单的查询响应,执行操作、运行代码、调用工具和维护扩展的上下文状态。虽然 GPU 管理密集计算,但周围的编排基础设施(包括工具调用、数据传输、沙箱和检索操作)需要 CPU 处理能力。 Vera 是专门为这些任务而设计的。该处理器具有 88 个定制 Olympus 内核,提供 1.2 TB/s 内存带宽,并且在最大负载下相对于传统架构实现了 50% 的卓越每内核性能。 “人工智能模型经常需要生成解决方案,而不是检索预先存在的答案,”巴克在甲骨文访问期间解释道。 “模型通常必须创建 Python 代码才能达到正确的响应。这种动态正在推动 CPU 需求的爆炸性增长。” Vera 还充当 Nvidia Vera Rubin NVL72 配置中的主机处理器,通过统一内存框架中的第二代 NVLink-C2C 与 Rubin GPU 连接。 Nvidia 报告称,该配置的运行能效是传统设置的两倍。黄仁勋 (Jensen Huang) 在 3 月份的 GTC San Jose 上推出了 Vera,并将其描述为 Nvidia 即将到来的数十亿美元收入来源。