都说梁文锋变了。

就在备受瞩目的DeepSeek V4发布前夕,关于这家明星公司首轮融资的消息悄然浮出水面——据悉,DeepSeek正以大约100亿美元的估值寻求新一轮融资。这个信号,与一年前的景象形成了微妙对比。那时,梁文锋对商业化的态度还相当“佛系”,甚至明确回绝了一批慕名而来的投资人。
时间拨回2025年1月,DeepSeek R1横空出世。那个时间点堪称戏剧性:大洋彼岸的英伟达股价单日暴跌17%,市值蒸发近6000亿美元。而DeepSeek,则以一场极其优雅的东方开源革命,用超乎想象的低成本带来了顶尖的模型能力,一战成名。梁文锋这个名字,也随之进入了更广阔的视野。
然而江湖从不等人。转眼间,大模型领域的竞争已进入白热化阶段,世界变化快得让人喘不过气。可外界苦等已久的DeepSeek续作,却迟迟没有登场。
期待,渐渐掺杂了焦急与疑虑。但话说回来,持续“封神”的叙事对任何团队而言,何尝不是一种沉重的负担?
如无意外,DeepSeek V4本周即将揭开面纱。无论结果如何,AI圈的平静注定要被打破了。
梁文锋保持沉默
《三体》里有句话:“任何事情在你怀疑并想突破它的时候,是最吸引人的阶段。”眼下人们对DeepSeek的心态,大抵如此。
自2025年初以来,国内AI赛场可谓锣鼓喧天。智谱、MiniMax、Kimi,还有字节、阿里这些大厂,在Agent和代码能力上已经迭代了数个版本。春节那场“百模大战”更是历历在目,文本、图像、视频多模态全面开花,堪称AI最强春节档。
但DeepSeek呢?仿佛置身事外,不问战事。
多次传闻要上线的V4,至今仍是“只闻楼梯响”。甚至有人调侃,“DeepSeek”已经成了“Next Week”的代名词。
当然,外界的关注从未降温。DeepSeek官方账号上一次宣布模型动态,还要追溯到2025年12月初,发布了DeepSeek-V3.2及其特别版。之后,便是一片静默。
不过,水面之下并非没有波澜。今年1月,DeepSeek团队连续发布了两篇由梁文锋署名的重磅论文,分别探讨“流形约束超连接”和“条件记忆”,目标直指提升大模型的长序列处理能力。到了4月8日凌晨,其产品界面又悄然更新,出现了“快速模式”和“专家模式”的分层入口,甚至还埋下了一个“视觉模式”的彩蛋。
所有这些动作,都被外界一致解读为同一个信号:V4,真的快了。
近期有爆料称,梁文锋在内部沟通中透露,新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。即便如此,DeepSeek官方依旧没有澄清,没有回应。这份定力,倒是相当“DeepSeek”。
任江湖如何喧嚣鼎沸,从梁文锋到整个团队,与外界的互动始终保持着一种近乎极致的克制。这种风格甚至延伸到了日常。有AI猎头聊起,认识的朋友跳槽去DeepSeek后,就像“人间蒸发”了,微信再也得不到回复。这种专注与低调,已然成了这家公司最鲜明的注脚。
人们为什么期待V4
DeepSeek此前对融资的态度,堪称坚决。
早年,中国前首富陈天桥曾与梁文锋深谈四小时,最终投资提议被婉拒。2024年初,联想创投也吃了闭门羹。后来,无论大模型赛道融资多么疯狂,DeepSeek的融资通道始终紧闭。甚至一度有消息传出,梁文锋并不急于引入资本,担心外部投资者会干预公司的独立决策。
专注、低调、不做没把握的事——这成了梁文锋和DeepSeek留给外界最深刻的印象。
回望2025年初,DeepSeek R1的横空出世,在纯强化学习激发推理能力这条少有人走的路上开了先河。它向世界证明了一件事:中国团队完全有能力以极低的成本,做出世界级的模型。
更优雅的是,它选择了开源。
可以说,2025年中国大模型的精彩篇章,正是由这个“DeepSeek时刻”开启的。随后,价格战、开源潮接踵而至,竞争焦点迅速聚焦到AI编程和多模态能力上。
时至今日,作为开源路线的旗帜,DeepSeek身上依然承载着中国人工智能产业的厚望。这份期冀,如今也全部落在了即将亮相的V4身上。
距离上一次重大版本更新已过去15个月。市场传闻,DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口,更关键的是,它将首次实现与华&为昇腾等国产芯片的深度适配。如果属实,这无疑标志着中国AI产业在“去CUDA化”的道路上,迈出了关键一步。
其实早有端倪。2025年DeepSeek V3发布时,就有细心的开发者在模型代码中发现了大量PTX指令的踪迹——这是英伟达GPU的底层汇编语言,比CUDA更接近硬件。当时市场就在猜测,DeepSeek是否已在修炼脱离CUDA生态的“内功”。
隐&隐约约,那个想要做出点不一样东西的梁文锋,依然没变。
中国AI叙事沸腾,别催梁文锋
短短一年,中国AI的叙事已经天翻地覆。
应用端的繁荣肉眼可见。根据国家数据局3月的数据,中国日均Token调用量已突破140万亿,相比两年前的1000亿,增长了超过1400倍。
这波需求冲击,带动了全产业链的景气。从Kimi、智谱、Minimax等模型厂商,到阿里、字节等云服务巨头,再到底层的芯片、服务器、算力调度玩家,无一不在积极备战。
于是,一种声音愈发强烈:DeepSeek,是时候来一波大的了。
但机会越大,竞争就越残酷。就在传闻V4将发布的这个4月,由姚顺宇统筹的腾讯混元大模型也将发布HY 3.0,内部称之为“重大版本迭代”。战鼓已然擂响。
DeepSeek自身的压力也在显现。2026年开年以来,其服务至少出现了7次大规模中断。例如3月29日晚到30日上午,网页端和APP端同时宕机,持续了约12小时。同时,核心人才的流失也引人关注。从2025年底到2026年初,郭达雅、魏浩然、王炳宣等多位研发骨干相继离开。此次融资传闻,也不免让人联想到,是否与稳定团队、给持有期权的核心员工一个市场估值锚点有关。
而那个令人兴奋的“适配国产芯片”传闻,背后则是一项成本极高、工程量浩大的底层重写。业界普遍认为,V4的多次“跳票”,很可能就与这项艰巨的工程密切相关。
“我们不是有意成为一条鲶鱼,只是不小心成了一条鲶鱼。”梁文锋曾如此坦言。时过境迁,或许我们更不该让这个无意成为鲶鱼的团队,去承担商业世界所有“慕强”的叙事压力。
不可否认,DeepSeek曾真真切切地给中国AI带来过一个“破壁时刻”。无论V4能否再次震撼世人,它所展现出的那种独特的世界观和方法论,已经极大地丰富了业界对通用大模型、乃至对顶尖技术人才的理解。
所以,不妨再多一点耐心。好饭,不怕晚。
