梁文锋与DeepSeek：用600万美元颠覆AI行业格局的幕后人物

梁文锋

出生	1985年1月1日 Zhanjiang
职业	科技企业家与人工智能研究者
获奖	Time 100 u00b7 Nature's 10

DeepSeek问世后的数月里，硅谷始终未能给出答案的那个问题，并非技术层面的疑惑。那是一个哲学命题。如果一支不到两百人的工程师团队，在杭州用美国出口管制本该限制的硬件，能够以极低成本打造出与世界顶尖模型比肩的系统，那么那些巨额投入究竟是为了什么？梁文锋是那个提出这一问题的人。但他没有留下来等待辩论的结果。

他成长的地方是广东省的海滨小城吴川，这里并不出现在通常讲述人工智能起源的叙事中。他的父母都是小学教师。他在初中便自学了高等数学，以湛江地区最高分通过高考，十七岁进入浙江大学。他先后学习了电子信息工程与信息通信工程，并以低成本摄像头目标跟踪算法研究完成了硕士论文。研究课题看似平常，但那种思维底色——用应用数学在约束条件下解决现实问题——将贯穿他此后所做的一切。

2008年金融危机席卷市场之际，他开始尝试将机器学习应用于量化交易。历经成都的探索期和数个早期项目之后，2016年他与两位浙大同学在杭州共同创办了幻方量化（High-Flyer Capital Management）。公司迅速跻身中国最成功的量化对冲基金之列：管理规模超过700亿元人民币，2025年平均收益率超过50%。核心优势在于算法——运行在梁文锋大规模积累的GPU集群上的深度学习模型。到2021年，他购入英伟达A100芯片的数量，已足以昭示一个远超交易公司规模的计划。

这些基础设施成为DeepSeek的根基。2023年7月，梁文锋将其作为幻方量化的分拆公司正式建立。公司的目标并非开发聊天机器人或商业产品，而是他所描述的“人工智能基础研究”——那种没有产品路线图、没有季度目标的工作。DeepSeek约有160名员工，来自刻意选择的多元学科背景，运营预算在OpenAI或谷歌DeepMind的账本上几乎可以忽略不计。2024年底DeepSeek-V3发布时，训练成本估计约为600万美元。2025年1月DeepSeek-R1发布，并登上美国iOS应用商店榜首、超越ChatGPT，此时流传的数字是560万美元。全球最大科技公司耗资数亿美元开发的模型，遭遇了一个实力相当且造价低廉的挑战者。

几乎随即附着在DeepSeek身上的“颠覆者”叙事并非完全有误，但在关键之处存在重要缺失。金融市场讲述的故事——DeepSeek证明了美国的AI投入是浪费、出口管制战略宣告失败——预设了梁文锋团队所做的事可以在任何地方、由任何人、以有限预算复制。这一假设值得细究。幻方量化的GPU基础设施建立于最严格出口限制生效之前。以低训练成本生产高效模型的工程决策，需要极深的专业积累。DeepSeek所证明的，并非大型AI模型可以廉价构建；而是架构创新能够压缩训练特定能力水平的边际成本。两者之间的距离相当大，而公众评论大多将二者混为一谈。

2025年2月，梁文锋与多位中国科技界领军人物一同出席了习近平主持的座谈会。这是他最为显眼的一次公开亮相。此后他便再未出现在公众面前。DeepSeek于2026年4月发布了V4预览版，并据报道正在寻求以百亿美元估值融资3亿美元。他通过直接和间接持股掌握的约84%股权，赋予了他控制权，也显然给了他待在麦克风以外任何地方的自由。

关于私生活，他几乎没有留下任何公开记录。没有经过核实的伴侣或子女信息。在DeepSeek成为全球新闻之前，他没有公开的社交媒体存在；在此之后也没有。

DeepSeek还将发布更多模型。R1发布以来，公司的轨迹没有显示出任何放缓的迹象。真正悬而未决的，是梁文锋是否会在某个时刻现身，就这一切说些什么——抑或是，那些工作将在他选择沉默的地方，继续代他发声。

标签: 人工智能, ceos, 商业, DeepSeek, 科技企业家, 中国科技