技术

深度求索V4:价格仅GPT-5的1/5 无需英伟达

Susan Hill

曾以R1让英伟达股价大跌的中国实验室再次出手,推出规模更大、价格更低、专门适配中国芯片的新版本。V4-Pro是迄今构建的最大开源AI模型,两个版本均已以MIT许可发布在Hugging Face上,价格远低于OpenAI和Anthropic的收费水平。

深度求索发布了V4-Pro和V4-Flash的预览版,两款开源语言模型传达出一个明确命题:处理100万token的上下文不再是容量问题,只是效率问题。V4-Pro总参数量1.6万亿,每次查询激活490亿,足以在一次提示中处理整个代码仓库或一整本书。这是开源模型首次在数学、编程和智能体任务上与头部闭源模型展开正面竞争——而且成本仅为OpenAI和Anthropic目前定价的一小部分。

YouTube video

两款模型的配置

两款模型均以MIT许可发布,权重已公开上线Hugging Face。V4-Flash是精简版本,总参数量2,840亿,激活参数130亿,量化后可在高端笔记本上运行。

V4-Pro是旗舰版:磁盘占用865GB,面向云端部署和研究机构。两款模型共享100万token的上下文窗口——这一跳跃追平谷歌Gemini,也是大多数竞品开源模型的两倍。

混合注意力带来的突破

架构层面的核心设计名为Hybrid Attention:深度求索将两种压缩技术结合,将内存成本压到极致。V4-Pro在相同上下文长度下仅使用V3.2所需算力的27%和缓存的10%。V4-Flash走得更远。

实际运行成本上,用V4-Pro处理100万token提示的花费已低于用上一代模型处理10万token的花费。这不是技术细节,而是长上下文模型跳出实验室演示、进入真正商用产品阶段的经济前提。

价格重构

价格冲击是此次发布最锋利的一击。V4-Flash输入端每百万token仅0.14美元——低于OpenAI的GPT-5.4 Nano。

V4-Pro输入端每百万token 1.74美元,输出端3.48美元——仅为Anthropic对Claude Opus 4.7收费的三分之一、OpenAI对GPT-5.5收费的五分之一。在编程基准测试中,V4-Pro的Codeforces评分达到3,206——深度求索称这一水平相当于全球人类竞赛程序员中的第23名。

地缘政治含义

地缘政治视角的分量不亚于基准测试数据。深度求索将V4针对华为昇腾950芯片和中国寒武纪硅片进行了优化,并未给英伟达或AMD提供性能校准的提前访问权限——这是对行业惯例的反向操作。

此次发布成为多年承受美国出口管制的整条中国技术链的商业压力测试。对欧洲而言,问题变得更加棘手:当北京建起一条完整的主权链——开源权重、国产芯片、自研推理软件——而华盛顿以立法手段关闭自己的那条链时,欧洲的数字主权结构性地依附于两个阵营的基础设施。

需要留意的风险点

值得指出的保留点确实存在。V4目前是预览版本而非正式产品,独立第三方基准测试尚未完成。深度求索自己的技术报告承认,该模型在前沿能力上比GPT-5.4和Gemini 3.1 Pro落后3到6个月。

前代R1上线后数周即在美国多个州、澳大利亚、台湾、韩国、丹麦和意大利遭到禁用或限制,V4在这些市场完全继承同样的监管风险。五角大楼承包商还受美国2026年NDAA法案约束——除非获得明确豁免,否则禁止使用深度求索任何模型。

在这些受限区域之外,访问立刻可用。深度求索的网页端聊天机器人以Expert模式提供V4-Pro、以Instant模式提供V4-Flash,均为免费;开发者可通过API调用,只需将模型名改为deepseek-v4-pro或deepseek-v4-flash即可。

此次发布正好落在DeepSeek-R1于2025年1月20日震动全球AI市场一周年之际,时间点是刻意选择的。预览阶段之后的正式API定价尚未公布,现有的deepseek-chat和deepseek-reasoner端点将于2026年7月24日停用,全部流量届时自动切换至V4。

此番发布的意义超越任何单项基准:这是第一个公开证据,表明一个竞争性大国能够在不依赖美国供应商的情况下交付完整、有竞争力且低成本的AI技术栈——仅凭这一证据,未来任何主权AI战略的坐标都将被重新书写。

讨论

有 0 条评论。