技术

DeepSeek把AI做便宜了,而美国AI泡沫押注它会一直贵下去

Susan Hill

DeepSeek(深度求索),一家脱胎于量化对冲基金的中国实验室,执拗地做着美国AI产业当作不可能来定价的事。它造出逼近前沿的模型,用对手在美国所花的零头来训练,然后把权重公开,任何人都能下载运行。每一次发布都重新点燃同一场争论:整个美国AI板块的估值,建立在一个被DeepSeek悄悄拆解的前提之上——智能必须一直昂贵。

这个前提并不抽象。它撑起在建数据中心里的数千亿美元,撑起几乎每一只指数基金中都有的芯片厂商与云服务商的股价,也撑起许多读者已经在为聊天机器人支付的月费。如果对手以低得多的代价交出可比的结果,还把软件白送,那么为稀缺而昂贵的算力支付的溢价,看起来就不再像护城河,而更像一场下注。

DeepSeek的说法关乎效率,而非魔法。其工程师押注于一种混合专家设计——每次查询只唤醒模型的一部分,大量使用较低精度的计算,并把训练流程调到能在更少、且部分受出口管制的芯片上运行。围绕其一次主要训练被反复引用的数字,低于六百万美元。可比的美国训练,若把整张账单加总,被认为要贵上许多倍。

模型如何发布,和它花了多少同样重要。DeepSeek放出开源权重,于是圣保罗的开发者、华沙的大学实验室、首尔的初创公司,都能把模型拉下来跑在自己的机器上,既不必为每次查询向美国供应商付费,也不必把数据送往海外。这里有个反讽:本想靠切断最强芯片来拖慢中国AI的出口管制,似乎反而把DeepSeek逼向以少博多,而那些精打细算的方法,如今随开源权重所到之处一同流传。

对只是使用这些工具的人来说,立竿见影的效果是选择权。更便宜的模型压低订阅价格,把更能干的助手送进普通笔记本和手机,也削弱了把自己锁定在单一供应商上的理由。原本像是租来的服务,开始像是可以拥有的软件。

谈泡沫需要很大的保留。那个不到六百万美元的数字只涵盖一次最终训练,并不包含让它成为可能的研究、走过的弯路、薪资与硬件,因此把它摆在一家美国实验室的全部开支旁边,是在比较两样不同的东西。开源权重也不等于开源代码;训练数据与完整方法仍然不公开。而且效率这把刀两边都开刃。被问及DeepSeek时,微软(Microsoft)的高层搬出了杰文斯悖论——一个古老的观察:当一种资源用起来更便宜,总消耗往往不降反升。更便宜的智能也许只是意味着世界买得更多,这对卖算力的人是好消息,而非坏消息。

泡沫被宣告死亡,这也不是头一回。同一家实验室曾引发美国历史上单日最大的市值蒸发,一个下午就从一家芯片厂商(英伟达/Nvidia)身上抹去近六千亿美元,随后又看着股价在数周内几乎尽数收复。美国的AI巨头并没有以少花钱来回应。它们募得更多,建得更大。任何关于泡沫终于破裂的断言,都必须经得起这样一个事实:恰恰是桌上押注最大的那些人,正在把赌注翻倍。

DeepSeek真正做到的事,比一只破掉的泡沫更难戏剧化。它拿走了一种安逸的假设——领先的美国实验室被一堵别人爬不上去的资本高墙护着。如果前沿级能力可以被廉价逼近、又能免费分发,价值便不再栖身于拥有模型。它转移到分发,转移到围绕模型搭起的产品,转移到谁握住客户。下一场考试虽未标注日期,却已排上日程:DeepSeek每一次新发布都重新打开同一个问题,落进一个已经承诺要花更多、而非更少的市场,因为它笃信规模仍会取胜。胜负将在未来几个季度的财报电话与资本开支指引中见分晓,而不是在一个宣告战斗早已结束的论坛帖里。

讨论

有 0 条评论。