梁文锋能否再次创造商业奇迹
过去几年,梁文锋几乎拒绝了所有互联网时代熟悉的剧本。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
当别人忙着融资时,他选择拒绝;当行业争抢入口时,他选择开源;当对手卷参数规模时,他卷的是效率;当多数人把AI视为一门生意时,他谈论的始终是AGI(通用人工智能)。
这使得DeepSeek看起来更像一家“研究机构”,而非典型的创业公司。
然而,2026年春天,变化悄然发生。
GPT-5.5发布不到24小时,DeepSeek-V4预览版便悄然上线。发布后不到五天,价格接连三次下调。紧接着,DeepSeek的“识图模式”开始灰度测试,补上了多模态这块缺失已久的拼图。

与此同时,那个长期婉拒腾讯、阿里和顶级风投的梁文锋,第一次主动打开了融资的大门。
一边将价格打到“骨折”,一边却伸手拿钱;一边坦言算力吃紧,一边承诺未来还要降价。这位把AGI挂在嘴边的创始人,究竟是向商业现实“缴械投降”,还是在酝酿一场更大的风暴?
“反常识”的72小时
4月24日,GPT-5.5发布后不到一天,DeepSeek-V4预览版悄然上线。没有发布会,没有造势,一切符合这家公司一向的作风:事情做完了,放出来,你们自己看。
V4-Pro发布后,最先引发热议的不是其能力,而是价格。相比前代V3.2,V4-Pro的定价起初显得更高。
市场第一反应是:DeepSeek终于要走向“正常商业化”了。但很快,剧情出现反转。
不到一天,官网价格低调更新,直接打到2.5折。随后又一次更新:缓存命中价格永久降至发布价的十分之一。
团队甚至在社交媒体上直接打出了“AGI for Everyone”的标签,强调这是永久定价,而非短期促销。
更耐人寻味的,是官网价格页面里那行不起眼的小字:“受限于高端算力,目前Pro服务吞吐有限,预计下半年昇腾950超节点批量上市后,Pro价格会大幅下调。”

这意味着DeepSeek公开承诺未来还会继续降价,并且这次价格下调绑定的,不再仅仅是自身的技术优化,还有中国国产高端算力的量产节奏。
几乎在同一时间,DeepSeek启动了成立以来的首次外部融资,目标估值从100亿美元迅速抬升至200亿美元乃至更高,腾讯、阿里相继被传洽谈入局。
一边降价,一边融资,看似矛盾的操作背后,回看DeepSeek的发展轨迹,会发现它的野心从来不只是“做一个模型”。
过去两年,全球大模型行业默认的逻辑是模型越强,成本越高,能力越强,价格越贵。无论是OpenAI还是Anthropic,都建立在这套逻辑之上。
但DeepSeek-V4要做的,不是“出售更昂贵的智能”,而是不断降低“智能”的边际成本,试图实现AGI的平权。
这种对“边际成本”的极致追求,其实从DeepSeek的前身——幻方量化时期就开始了。早在2021年,当大多数科技公司还在讨论AI概念时,幻方就已经囤积了上万张A100,自建了“萤火”算力集群。
在高度竞争的市场里,成本结构本身就是最深的护城河。这是梁文锋在幻方时期就想明白的道理,如今被完整地继承到了DeepSeek。
数据对比很直观:DeepSeek V4-Pro处理百万token上下文,成本约5.22美元,缓存命中后可降至3.6美元左右。而同等输入输出量下,GPT-5.5的API成本约35美元,Claude Opus 4.7约30美元。
至于更轻量的V4-Flash,成本甚至不到竞争对手的2%。这已经不再是简单的价格差异,而是形成了“量级差”。
“超低价”的背后,是模型架构、推理系统与算力调度共同优化的结果。V4-Pro支持100万token上下文,在部分长文本场景下,单token推理所需算力相比前代显著下降,KV Cache占用也大幅减少。
过去行业处理长上下文,很大程度上依赖持续堆叠显存和带宽;而DeepSeek尝试通过架构优化,来减少一部分无效计算与资源浪费。
当然,效率上的突破并不等同于全面超越。
根据DeepSeek内部的真实评测,V4目前已成为公司员工日常使用的Agentic Coding模型,使用体验优于Sonnet 4.5,交付质量接近Opus 4.6的非思考模式,但与Opus 4.6的思考模式仍存在一定差距。
开源和低价建立了广泛的影响力,但“一分钱一分货”的道理,在顶级闭源模型身上依然成立。
某种程度上,V4真正改变的,或许不是模型能力的绝对高度,而是行业对于“智能应该值多少钱”的认知。
极客肖恩·多纳霍在社交媒体上分享,自己将部分编程工具切换到DeepSeek之后,月账单下降了90%以上,效果却并未出现明显下滑。

科技博主Simon Willison每次在DeepSeek发布新版本时,都会用同一句提示词生成一张“鹈鹕骑自行车”的SVG图片来测试。这次测试后,他称DeepSeek-V4-Pro是“大型前沿模型中最便宜的一款”。

这几位开发者或许只是个案,但他们背后折射出的趋势值得关注:当价格差拉大到“量级”级别,开发者重新分配算力预算的动机就会急剧增强。
而当越来越多的应用、智能体和开发工具开始基于同一种模型生态构建时,真正形成护城河的,可能就不只是模型能力本身了,还包括开发者的使用习惯、调用路径,以及整个生态的成本惯性。
DeepSeek的目标很明确:用极致的性价比,成为那个被开发者“持续依赖”的选项。
DeepSeek 的“二度奇袭”
时间拉回到2025年1月,DeepSeek R1的发布曾引发全球震动。
其应用迅速登顶苹果中国和美国地区App Store免费榜榜首,英伟达单日市值蒸发约6000亿美元,美国风投家马克·安德森称之为AI领域的“斯普特尼克时刻”。
一个来自杭州的量化团队,用560万美元的训练成本,做出了对标OpenAI顶级模型的效果,并且选择了开源。那时,世界对梁文锋的理解,是“用更少的钱做出更好的模型”。
很多人后来把R1的成功理解为“受限条件下的逆袭”,但这并不完全准确。早在行业真正意识到大模型价值之前,幻方就已经开始大规模采购算力、建设集群。后来外界看到的“低成本奇迹”,更像是一次长期技术积累后的集中爆发。
梁文锋真正厉害的地方在于,他比大多数人更早意识到未来AI竞争的核心,不只是模型能力的比拼,更是算力效率的战争。
然而,当DeepSeek从一匹技术黑马转变为行业的核心玩家时,新的挑战也开始浮现。
过去的DeepSeek,很像一个隐秘的研究组织。背后有幻方量化输血,梁文锋不缺钱,研究员可以心无旁骛地埋头做模型。其官方账号的签名是“用好奇心揭开通用人工智能的奥秘,用长远的眼光回答根本问题”,学术气息浓厚。
但AI行业不会长期尊重“隐士”,尤其当你手里真的握有“真经”的时候。
从2025年底到2026年,多位DeepSeek核心成员相继离开。
V3架构关键开发者罗福莉去了小米,第一代大语言模型核心作者王炳宣加入腾讯,R1核心研究员郭达雅被字节跳动以传闻中“近亿元的总包”招致麾下,多模态方向核心研究员阮翀则转投元戎启行。

过去,大模型公司的目标相对统一:训练更强的基础模型。但到了2026年,行业开始迅速分化,智能体、多模态、端侧AI、机器人、自动驾驶,陆续成为新的战场。
这时候,一位研究员如果想深入研究智能体,去字节会面对真实的月活场景;想让AI理解物理世界,去自动驾驶公司显然更有吸引力。
DeepSeek太专注于把模型本身做到极致。这种组织文化能够吸引最纯粹的研究者,却很难长期承载所有方向。它最强的地方,在某种程度上也成了它最大的桎梏。
主流AI公司争抢的是有经验的工程师,而梁文锋却更青睐顶尖高校的年轻博士生。在他看来,这些人“渴望证明自己”,“可以完全不带功利地投入去做一件事”。
初期,DeepSeek的确可以用技术理想主义吸引天才,但很难长期用理想主义来支付高昂的机会成本,尤其在同行已经开始形成明确市场估值的时候。
近两年,OpenAI、Anthropic不断刷新融资数字,投后估值高达8400亿、3800亿美元。国内的智谱、MiniMax相继挂牌港交所,市值一度突破4000亿和3800亿港元。
大厂提供的是有明确行权价、有IPO预期、有内部回购机制的期权。而不进行外部融资的DeepSeek,则缺乏一个市场化的“度量衡”。在竞争白热化的AI人才市场里,没有明确估值锚点的期权,无异于一张难以兑现的期票。
梁文锋或许正是意识到了这一点,才选择了开放融资。
但这依然是一个极具“梁式色彩”的融资方案。此次融资目标募集金额不低于3亿美元,计划以不低于200亿美元的估值进行。与此同时,工商信息显示,梁文锋在增资后直接持股占比由1%提升至34%,其作为实际控制人的最终受益股份仍为84.29%,表决权比例仍为100%。

他用大约3%的股权,换来了市场对这家公司的价值认证。而董事会的控制权,一票未让。
对比同行,这个数字显得更加意味深长。OpenAI在2026年完成的最新一轮融资,募集1220亿美元,投后估值8520亿美元;Anthropic在2026年2月完成300亿美元G轮融资,投后估值3800亿美元。
3亿美元,放在今天的AI赛道里,甚至比不上同行一轮融资的零头。
梁文锋选择这个体量的融资,目的很明确:为员工手中的期权建立起相对清晰的估值锚点和兑现预期,稳住核心人才,同时确保公司不被短期的增长压力所裹挟。
允许梁文锋再“伟大一次”
R1证明了中国的AI团队有能力做出世界级模型。而在V4之后,梁文锋试图证明的是,中国AI可以建立起自己的“底座标准”,哪怕这条路,注定艰难。
一个值得关注的细节是,V4发布后,华&为昇腾生态的官方账号,专门为DeepSeek-V4做了一场直播。
芯片厂商亲自下场为一款模型站台,这并不常见。它释放的信号超出了产品本身:DeepSeek第一次公开地,将自己的模型发展路线与国产算力的量产节奏深度绑定。
过去几年,中国AI行业有个默认的共识:模型可以开源,算法可以追赶,但英伟达的生态护城河最难撼动。CUDA是英伟达用二十年时间攒下的工具链、算子库、开发框架和开发者习惯,全球AI几乎都默认运行在这套底座之上。
要脱离它,绝非“换块显卡”那么简单。尤其是在训练万亿级参数模型时,难度会被指数级放大。参数规模越大,对显存带宽、通信效率、集群稳定性的要求就越高。
模型团队不仅需要针对国产芯片重写和优化核心算子,甚至还需要自研确定性算子,以保证长时间、大规模训练过程中的精确可复现。
更现实的问题是,在万卡级别的集群里,硬件故障不是意外,而是必然事件。因此,训练框架必须同时具备完整的故障检测、容错与恢复能力。如果效率跑不上去,所谓的低成本就只是空谈。
V4的发布延期超过十五个月,迁移到新算力平台的代价是主要原因之一。
目前,V4的细粒度专家并行方案已经同时在英伟达GPU和华&为昇腾NPU两个平台上完成验证,在通用推理场景中实现了1.5到1.96倍的加速。
推理层面虽然跑通了,但开源代码主体仍基于CUDA,底层工具链尚未完全转移。原因在于昇腾950超节点尚未批量上市,现有产能还撑不起V4-Pro的大规模服务。
不过,DeepSeek已经把下一轮降价,公开写进了国产算力的量产时间表里。昇腾950PR单卡算力达到英伟达H20的2.87倍,是目前国内唯一支持FP4低精度推理的产品,HBM容量高达112GB。规格是真实的,现在只等工业化落地。
梁文锋当年从幻方量化的GPU集群起家,把算力当作研究的弹药。如今,他让中国模型和中国芯片的命运,在商业上深度捆绑,并在所有人面前做出了承诺。这是在芯片封锁的现实下,做出的一个极为务实的选择。
但这条路有个至关重要的前提:模型能力必须始终足够硬。V4把100万上下文做成标配、对智能体能力做专项优化、推出三档推理强度,这些改进不是给评测榜单准备的,而是为真实的企业工作流准备的。只有先在真实的生产场景里证明自己不可替代,DeepSeek的“底座”叙事才能真正成立。
未来,梁文锋和DeepSeek要走的路还很长。国产算力的工业化时间表能否如期兑现?模型能力能否在闭源顶级模型高速迭代的压力下保持竞争力?开发者生态能否形成足够的黏性?……这些问题,就像棋盘上尚未闭合的“气眼”,每一个都关乎生死,而目前,都还没有确切的答案。
在DeepSeek爆火后,被问及“商业公司做无限投入的研究性探索是否疯狂”时,梁文锋曾说过一句话:“我们终其一生所渴望的,就是找到自己,然后成为自己。”
这句话在R1发布后的语境里读,像是一位创始人的理想宣言。如今再读,分量似乎更重了些。
AI竞争的上半场,他用技术效率、定价碘伏和算力豪赌,赢得了继续坐在牌桌上的资格,成就了DeepSeek的第一次“伟大”。
下半场,我们或许可以允许梁文锋再“伟大一次”。这不是因为他已经攻下了某个技术的山头,而是因为他正在为一场注定漫长的远征,搭建那个属于自己的底座。
不诱于誉,不恐于诽,率道而行,端然正己。
这是荀子的精神,如今也成了DeepSeek的信条。
相关攻略
过去几年,梁文锋几乎拒绝了所有互联网时代熟悉的剧本。 当别人忙着融资时,他选择拒绝;当行业争抢入口时,他选择开源;当对手卷参数规模时,他卷的是效率;当多数人把AI视为一门生意时,他谈论的始终是AGI(通用人工智能)。 这使得DeepSeek看起来更像一家“研究机构”,而非典型的创业公司。 然而,20
国内人工智能公司DeepSeek被曝正在推进首轮大规模融资,预计规模高达500亿元人民币,有望创下中国AI领域单轮融资最高纪录。其中,创始人兼CEO梁文锋或将个人出资200亿元领投,占比达40%,展现了极强的信心。国家集成电路产业投资基金等机构也有望参与。融资资金将重点用于技术研发,公司计划于6月发
“确实在接触DeepSeek融资。”一位FA机构的朋友向我们透露。 过去半个月,关于DeepSeek终于开启融资的消息持续发酵。外界在分析这次“反常”举动时,几乎都绕不开一个核心推论:梁文锋需要给内部的核心团队一个明确的估值了。 这也不难理解。过去一年,大模型领域的竞争日趋白热化,关于DeepSee
真是热闹的一周 周一,Kimi刚发完K2 6;周五,万众瞩目的DeepSeek V4就来了。 这种感觉是不是很熟悉?过去一年里,这两家公司的节奏总是如此:不是前后脚发布模型,就是先后抛出重磅技术论文。市场热度刚被一方点燃,技术讨论的接力棒立刻就被另一方接了过去。 回想更早时候,提起中国开源模型,几乎
文 | 字母AIDeepSeek网页和App在连崩10多个小时后终于恢复了。这件事给梁文锋提了个醒,网上都说4月份就要发布DeepSeek-V4了,到时候DeepSeek面临的压力会比现在大得多。怎
热门专题
热门推荐
初次接触赛车模拟器,或是观看职业赛事的方向盘特写镜头,你一定会被那些密集排列的旋钮与按键所吸引。这绝非单纯的视觉装饰,每一个控件都承载着在毫秒间精准调控车辆动态的关键使命。从牵引力控制到刹车平衡,从引擎图谱到实时数据,这些为极速盲操而生的设计,正是区分业余爱好者与专业车手的重要标志。熟练掌握其功能并
本文介绍了在OKX欧易平台首次购买USDT的完整流程,重点强调了入金、下单、划转三个关键步骤的正确顺序。内容涵盖了从法币充值到币币交易,再到资产划转至资金账户的详细操作与注意事项,旨在帮助新手用户理清逻辑,避免因操作顺序错误导致交易失败或资金滞留,实现顺畅的首次加密货币购买体验。
Dota 2 7 41c版本现已更新,对于希望使用五号位英雄上分的玩家而言,当前环境中有几位英雄的表现尤为突出。根据Yandex战队职业选手Malady在最新视频中的深度解析,发条技师、工程师以及树精卫士,均是此版本中极具上分潜力的强势辅助选择。 除了分享强势辅助英雄推荐,Malady也透露了队伍近
近日,一则关于2026年电竞世界杯可能更换举办地的消息在电竞社区引发热议。据独联体知名爆料人harumi透露,原定于沙特阿拉伯利雅得举行的本届赛事,存在将主办地转移至法国的可能性。这一潜在变动,无疑为这项全球顶级电竞赛事的最终落地增添了新的看点与悬念。 目前,电竞世界杯赛事组委会尚未对此传闻发布任何
本文介绍了在访问OKX(欧易)平台时,如何准确识别其官方网站、帮助中心及处理页面跳转问题。重点分析了官方域名的核心特征与常见后缀,并提供了遇到非官方页面时的安全验证步骤与处理建议,旨在帮助用户有效规避风险,确保资产与信息安全。





