DeepSeek 发布 V4:挑战科技巨头的最新开源 AI 模型

上周五,中国人工智能公司 DeepSeek 发布了其最新旗舰开源人工智能系统 V4 的预览版。据该公司称,这一最新版本提供了增强的推理能力、成本效率和异常强大的上下文处理能力。 🚀 DeepSeek-V4 Preview 正式上线并开源!欢迎来到高性价比1M上下文长度时代。 🔹 DeepSeek-V4-Pro:总计 1.6T / 49B 活动参数。性能可与世界顶级闭源模型相媲美。🔹DeepSeek-V4-Flash:总计 284B / 13B 活动参数。… pic.twitter.com/n1AgwMIymu — DeepSeek (@deepseek_ai) 2026 年 4 月 24 日该公司推出了两种不同的变体:V4-Pro 和 V4-Flash。 Pro 版本具有 1.6 万亿个参数,而 Flash 版本代表了包含 2840 亿个参数的简化替代方案,专为实现卓越的效率和成本效益而设计。每个变体支持同时处理多达一百万个令牌。这种能力使他们能够在一次操作中分析大量文本,使他们在这个方面与谷歌的 Gemini 竞争。该公司指出,当前的模型只处理文本。 DeepSeek 确认正在开发整合多模式功能,这将使未来版本能够分析图像和视频内容。在标准行业基准 MMLU-Pro 测试中,V4-Pro 提供了与 OpenAI 的 GPT-5.4 相当的结果。性能使其略低于 Google 的 Gemini 和 Anthropic 的 Claude Opus 4.6。特别是在推理基准测试中,V4-Pro 排名第二,仅次于最新的 Gemini 版本。 DeepSeek 强调,V4 已针对与 AI 代理框架(包括 Claude Code、OpenCode 和 CodeBuddy)的集成进行了微调。该组织将 V4 的上下文容量描述为“世界领先,计算和内存成本大幅降低”。行业分析师张毅将其视为一个“拐点”,表明超长上下文功能可以从实验研究环境转变为主流商业应用。人工智能行业专家Max Liu将此次发布形容为中国人工智能行业的“里程碑”,与DeepSeek R1首次亮相时的市场影响相似。这标志着 DeepSeek 自 2025 年初 R1 出现以来首次发布重要的新一代模型。之前的发布在全球技术市场引起了连锁反应,影响了 Nvidia 和 Meta 等公司,因为它证明了一种经济、高效的模型可以与昂贵的专有替代方案相媲美。 DeepSeek 尚未透露哪些半导体芯片为 V4 的训练过程提供支持。今年早些时候,美国当局指控该公司使用了受限制的 Nvidia Blackwell 芯片。随后,The Information 的一篇报道指出,训练是在华为芯片上进行的。华为证实,其Ascend超级节点基础设施采用Ascend 950 AI处理器,可为DeepSeek V4系统提供完整支持。该模型的首次亮相紧随有报道称腾讯和阿里巴巴正在与 DeepSeek 进行投资洽谈,估值超过 200 亿美元。 DeepSeek跻身中国六大人工智能独角兽企业之列。目前可以通过 Hugging Face 访问 V4 的预览版。 DeepSeek 尚未指定完整公开发布的时间表。通过专家分析发现人工智能、加密货币和技术领域表现最好的股票。