技术

微软洽谈让Anthropic成为Maia 200首个外部客户

Susan Hill

微软正与Anthropic洽谈供应自研人工智能芯片Maia 200,如果成行,这将是该硅片首次走出微软自己的数据中心。最早由The Information披露、并经CNBC证实的这场讨论,把一段此前主要存在于电子表格上的财务关系,推到了实际运营的层面。

正在讨论的安排范围不大,但分量不轻。Anthropic将在Azure上租用配备Maia 200芯片的服务器,用于推理这一向用户输出Claude回答的高成本环节,而与训练新模型这种更显眼的工作明确区分。推理正是当前每一家前沿实验室持续失血的地方。单次查询的单元经济,乘以数以亿计的用户,就是当下决定AI业务走向的最关键数字。

对微软而言,把Anthropic搬上Maia 200,将是这一长期作为内部研发项目存在的芯片计划所能拿到的最有力的一次商业验证。亚马逊的Trainium和Inferentia已在外部客户手中运行多年。Google的TPU则是大语言模型革命中相当大一部分的静默骨干。Maia则不同,迄今只在微软位于亚利桑那州和爱荷华州的自有设施中部署,运行公司未公开拆解的内部AI负载。一旦拿下全球关注度第二高的前沿实验室,这枚芯片几乎是在一夜之间从内部基础设施变身为商用产品。

财务的逻辑已经摆好。微软在Anthropic持有价值五十亿美元的股权;Anthropic则承诺在Azure上长期投入约三百亿美元的算力支出。这笔钱无论如何都得经过某种硅片来流转。剩下的悬念,也是这桩交易要回答的问题,就是Anthropic会把这些钱烧在向微软租来的Nvidia GPU上,还是微软能够把其中可观的一部分引向自家设计的芯片。

Maia 200是微软第二代推理加速器。这一部件由台积电以3纳米工艺制造,每个封装内连接四颗加速器,被微软定位为以推理为先的硅片,为回答问题而非学习而优化。首席执行官Satya Nadella告诉投资者,与Azure机群中已有的最新GPU硅片相比,这颗芯片可实现「每美元token数提升超过百分之三十」。这是关于成本的说法,而不是关于能力的说法;而在推理领域,能不能让一颗芯片活得足够久以发挥意义,决定权就在成本这把尺上。

从Anthropic这一边看,Maia 200的洽谈与一条更长的脉络吻合。过去一年,这家实验室刻意构筑了一套异构算力栈:跨多家云的Nvidia GPU、与亚马逊价值超过一千亿美元的多年合约下的AWS Trainium芯片,以及部分训练管线使用的Google TPU。再叠加上微软的硅片,这套组合便完整闭合。在前沿实验室中,Anthropic实际上将拥有供应商多样化程度最高的算力架构。这是Dario Amodei几个月来反复传递的策略的运营层表达——把实验室绑住的不是人才,而是算力。

但这一切都还没有定下来。双方都把这场谈判描述为早期阶段,Maia 200也尚未以任何商业形式向Azure的外部客户开放。微软提出的百分之三十数字,本身是供应商在其端到端控制的负载上得出的供应商指标。针对Nvidia当前Hopper或Blackwell世代的独立基准测试,在公开领域仍未出现。战略观感在至少一个方向上也并不轻松——微软是Anthropic最直接的竞争对手OpenAI的最大单一支持者。把Maia算力同时卖给这两家实验室,是微软从未实测过的格局;要让它在合同上可信地分割,绝非轻巧的工程。

接下来的事属于流程。商业条款没有外泄,微软自有设施之外的Maia 200普遍可用时间表也未公布,两家公司都没有确认日程。下一个明确的信号将在微软下一次季度业绩发布上出现,届时任何分量足够的对外承诺客户都得有所披露。在那之前,雷德蒙德与旧金山之间的财务编舞,仍跑在硅片自身之前。

讨论

有 0 条评论。