商业与金融

梁文锋与DeepSeek:用600万美元颠覆AI行业格局的幕后人物

Penelope H. Fritz
梁文锋
梁文锋
出生1985年1月1日
Zhanjiang
职业科技企业家与人工智能研究者
获奖Time 100 u00b7 Nature's 10

DeepSeek问世后的数月里,硅谷始终未能给出答案的那个问题,并非技术层面的疑惑。那是一个哲学命题。如果一支不到两百人的工程师团队,在杭州用美国出口管制本该限制的硬件,能够以极低成本打造出与世界顶尖模型比肩的系统,那么那些巨额投入究竟是为了什么?梁文锋是那个提出这一问题的人。但他没有留下来等待辩论的结果。

他成长的地方是广东省的海滨小城吴川,这里并不出现在通常讲述人工智能起源的叙事中。他的父母都是小学教师。他在初中便自学了高等数学,以湛江地区最高分通过高考,十七岁进入浙江大学。他先后学习了电子信息工程与信息通信工程,并以低成本摄像头目标跟踪算法研究完成了硕士论文。研究课题看似平常,但那种思维底色——用应用数学在约束条件下解决现实问题——将贯穿他此后所做的一切。

2008年金融危机席卷市场之际,他开始尝试将机器学习应用于量化交易。历经成都的探索期和数个早期项目之后,2016年他与两位浙大同学在杭州共同创办了幻方量化(High-Flyer Capital Management)。公司迅速跻身中国最成功的量化对冲基金之列:管理规模超过700亿元人民币,2025年平均收益率超过50%。核心优势在于算法——运行在梁文锋大规模积累的GPU集群上的深度学习模型。到2021年,他购入英伟达A100芯片的数量,已足以昭示一个远超交易公司规模的计划。

这些基础设施成为DeepSeek的根基。2023年7月,梁文锋将其作为幻方量化的分拆公司正式建立。公司的目标并非开发聊天机器人或商业产品,而是他所描述的“人工智能基础研究”——那种没有产品路线图、没有季度目标的工作。DeepSeek约有160名员工,来自刻意选择的多元学科背景,运营预算在OpenAI或谷歌DeepMind的账本上几乎可以忽略不计。2024年底DeepSeek-V3发布时,训练成本估计约为600万美元。2025年1月DeepSeek-R1发布,并登上美国iOS应用商店榜首、超越ChatGPT,此时流传的数字是560万美元。全球最大科技公司耗资数亿美元开发的模型,遭遇了一个实力相当且造价低廉的挑战者。

几乎随即附着在DeepSeek身上的“颠覆者”叙事并非完全有误,但在关键之处存在重要缺失。金融市场讲述的故事——DeepSeek证明了美国的AI投入是浪费、出口管制战略宣告失败——预设了梁文锋团队所做的事可以在任何地方、由任何人、以有限预算复制。这一假设值得细究。幻方量化的GPU基础设施建立于最严格出口限制生效之前。以低训练成本生产高效模型的工程决策,需要极深的专业积累。DeepSeek所证明的,并非大型AI模型可以廉价构建;而是架构创新能够压缩训练特定能力水平的边际成本。两者之间的距离相当大,而公众评论大多将二者混为一谈。

2025年2月,梁文锋与多位中国科技界领军人物一同出席了习近平主持的座谈会。这是他最为显眼的一次公开亮相。此后他便再未出现在公众面前。DeepSeek于2026年4月发布了V4预览版,并据报道正在寻求以百亿美元估值融资3亿美元。他通过直接和间接持股掌握的约84%股权,赋予了他控制权,也显然给了他待在麦克风以外任何地方的自由。

关于私生活,他几乎没有留下任何公开记录。没有经过核实的伴侣或子女信息。在DeepSeek成为全球新闻之前,他没有公开的社交媒体存在;在此之后也没有。

DeepSeek还将发布更多模型。R1发布以来,公司的轨迹没有显示出任何放缓的迹象。真正悬而未决的,是梁文锋是否会在某个时刻现身,就这一切说些什么——抑或是,那些工作将在他选择沉默的地方,继续代他发声。

标签: , , , , ,

讨论

有 0 条评论。