DeepSeek与智能下半场趋势判断解读_AI热点日报

DeepSeek与智能下半场趋势判断解读

类型：热点整理2026-06-29

DeepSeekR1推动强化学习与测试时计算新范式出圈，开源引发轰动，但未超越第一梯队。推理模型提升加速智能下半场进程，推动Agent落地。智能技术进步陡峭，阶段性产品难筑护城河，模型即应用趋势凸显。中国AI人才表现令人鼓舞。

# 深入剖析DeepSeek在AI领域的地位与影响，探讨智能下半场的发展方向从24年第三季度开始，我们一直在聊AI的下半场这个概念。OpenAI o1虽然提出了RL叙事，但坦白说，各种原因下它并没有真正破圈。真正推动这一进程、把谜底揭开的，是DeepSeek R1——它解开了RL的谜题，让整个行业迈入了新范式，智能下半场这才算是真正开启了。市场上关于DeepSeek是什么、为什么的讨论已经铺天盖地。相比这些，更有价值的命题其实在后面——这场AI竞赛到底该怎么玩下去？把过去半个月的思考梳理了一下，希望它能成为探索下半场的一张路线图，也方便时不时拿出来复盘。 --- ## Insight 01：DeepSeek超越OpenAI了吗？ DeepSeek超越Meta Llama是没有悬念的，但跟OpenAI、Anthropic、Google这些第一梯队放在一起，距离还是有的。举个例子，Gemini 2.0 Flash在成本上比DeepSeek更低，能力同样强劲，而且是全模态模型。外界其实低估了以Gemini 2.0为代表的第一梯队选手的实力，只是他们没有开源，所以没有收获那么炸裂的轰动效果。所以，DeepSeek让人兴奋不假，但还不能称之为范式级创新。更准确的描述是：它把之前OpenAI o1半遮半掩的范式给开源了，进而把整个生态推到了一个渗透率极高的水平。从第一性原理的角度来看，在Transformer这一代架构下，想超越第一梯队模型厂商是有难度的。同样的技术路径，很难实现弯道超车。今天我们更期待的是有人能探索出下一代的智能架构和范式。DeepSeek用一年时间追上了OpenAI和Anthropic，这已经足够惊艳。对 DeepSeek 和智能下半场的几条判断

## Insight 02：DeepSeek开启新范式了吗？严格意义上说，DeepSeek并没有发明新范式。但它的重要意义在于——让RL和test time compute这个新范式真正出圈了。如果打个比方，OpenAI最初发布的o1是在给行业出了一个谜语，那DeepSeek就是第一个公开解谜的人。在DeepSeek发布R1和R1-zero之前，只有少数人在实践RL和reasoning model，圈子非常小。DeepSeek给大家画出了清晰的路线图，让行业看到这样做确实能提升智能。这就吸引大量AI研究者转向新范式，有人才进入才有算法创新，有开源紧追才有更多计算资源投入。效果也很明显：原本打算不再发新模型的OpenAI，接连发出o3mini，还计划继续发布o3，甚至考虑开源。Anthropic和Google也会加速RL研究。行业对新范式的推进因为DeepSeek而明显加快，中小团队终于可以在不同的领域尝试RL了。另外，reasoning model的提升会进一步推动Agent落地。AI研究者现在对Agent的研究和探索更有信心了。所以，DeepSeek虽然没有发明新范式，但它实实在在地推进整个行业进入了新范式。 ## Insight 03：Anthropic的技术路线和R1有什么不同？从Dario的访谈来看，Anthropic对reasoning model的理解和OpenAI的O系列有些分歧。Dario认为base model和reasoning model应该是一个连续光谱，而不是像OpenAI那样做成独立的模型系列。如果只做O系列，很快就会遇到天花板。这让我想到一个问题：为什么Sonnet 3.5的coding、reasoning和agentic能力突然提升得这么强，而4o一直没追上？答案在于他们做pre training base model的阶段，就已经融入了大量RL工作。核心是先把base model的能力提上来，否则仅仅靠RL去拉升reasoning model，收益迟早会被吃光。 ## Insight 04：DeepSeek的轰动有必然，也有偶然两位早期OpenAI研究员写的《为什么伟大不能被计划》，放在这里来解释DeepSeek也很贴切。从技术角度看，DeepSeek有几个亮点： **开源**是关键因素。OpenAI从GPT-3开始转为闭源公司之后，第一梯队三巨头就不再公开技术细节，硬生生让出了一个开源生态位。Meta和Mistral没有接稳这个位置，DeepSeek这次堪称奇袭，在开源赛道上一马平川。如果给轰动性打100分，智能提升贡献30分，开源贡献70分。之前LLaMA也开源但没有这种效果，说明那时LLaMA的智能水平还不够。 **便宜**这件事，"Your margin is my opportunity"这句话的含金量还在持续上升。 **联网+公开CoT**是王炸组合。这两个点分别带来了极好的用户体验，特别是把模型思考过程公开，让用户对AI更加信任，直接推动了破圈。不过Perplexity反应很快，在DeepSeek服务端不稳定时迅速上线了R-1，反倒承接了大批溢出用户。 **RL泛化**方面，虽然RL是OpenAI o1最先提出来的，但因为运营上的半遮半掩，渗透率一直不高。DeepSeek R-1极大地推动了reasoning model范式的进程，生态接受度大幅提升。当然，DeepSeek在技术上的探索和投入，确实让这个智能成果值得被更多人关注——这是确定性因素。但DeepSeek R-1推出的时间点，又让这场轰动带有偶发性。过去美国一直强调自己在基础技术研究上大幅领先，而DeepSeek原生于中国国内，这也是一个亮点。过程中不少美国科技大佬开始宣扬DeepSeek挑战了美国科技霸主地位，DeepSeek被动卷进了舆论战。再加上R-1发布之前，OpenAI Stargate的5000亿美元事件刚刚发酵，这种巨量投入和DeepSeek团队的智能产出效率对比太鲜明了。DeepSeek让英伟达股价大跌，进一步让舆论发酵——他们肯定也想不到自己成了2025年开年美股第一只黑天鹅。还有一个关键因素：春节是产品的练兵场，移动互联网时代很多超级App都是在春节大爆发的，AI时代也不例外。DeepSeek R-1恰好在春节前发布，大众惊喜的是它的文字创作能力，而不是训练时强调的coding和数学能力。文创更容易被大众用户感知到，也更容易在社交网络上传播。 ## Insight 05：谁受伤？谁受益？我们可以把这个赛场的玩家分成三类：ToC、To Developer和To Enterprise/To Government。 ToC层面，Chatbot受到的冲击最大，心智和品牌关注度被DeepSeek抢走，ChatGPT也不例外。在开发者环节，影响其实很有限。很多用户反馈R-1不如Sonnet，Cursor官方也说Sonnet还是表现出色，用户迁移的比例并不高。第三个维度，To Enterprise和To Government的生意在于信任和需求理解，大型组织做决策的利益考虑很复杂，不会像C端用户那么容易迁移。换个角度，从闭源、开源和算力视角来看这个问题。短期来看，闭源的OpenAI、Anthropic、Google更受冲击：技术神秘感被开源打破了，AI hype中最核心的神秘感溢价消失了。更现实的因素是，市场认为这些闭源公司的潜在客户和市场规模被分走了一些，GPU投入的回本周期变长。作为行业领头羊的OpenAI在其中最"吃亏"——之前捂着技术不开源、半遮半掩、希望多赚技术溢价的美梦，已经无法实现了。但中长期来看，GPU资源充裕的公司还是受益的。一方面，第二梯队的Meta可以快速跟进新方法，capital expenditure更加高效，Meta可能是很大的受益者。另一方面，智能提升还需要更多探索，DeepSeek开源把大家的水平拉齐了，再往下探索又需要10倍甚至更大量级的GPU投入。从第一性原理出发，无论是发展智能还是应用智能，从物理本质上必然要消耗海量算力，这是基础定律决定的，不是技术优化能完全规避的。所以，无论是探索智能还是应用智能，即便短期有质疑，中长期的算力需求也会爆炸。这也解释了马斯克为什么从第一性原理出发，坚持扩建xAI的集群——xAI和Stargate背后的深层逻辑也许是一样的。Amazon等云厂商也已经宣布要增加capital expenditure指引。假设全球的AI研究人才水平和认知都拉齐了，那有更多GPU就可以做更多实验探索，最后的竞争还是会回到计算资源上。 DeepSeek光脚不怕穿鞋的，没有商业化诉求，专注AGI智能技术探索。开源这个动作对推动AGI进程意义很大，加剧了竞争，推动了开放性，颇有鲶鱼效应。 ## Insight 06：蒸馏能超越SOTA吗？有个细节点目前还不确定：如果DeepSeek从pre train阶段就大量使用蒸馏的CoT数据，那做到今天的效果其实不算惊艳，本质上是在第一梯队巨头的肩膀上获得的基础智能，然后再开源出来。但如果pre train阶段没有大量用蒸馏数据，DeepSeek从零开始做pre train做到今天的效果，那就堪称惊艳了。另外，蒸馏能否在base model上超越SOTA，答案应该是不太可能的。但DeepSeek R-1确实非常强，推测是他们的Reward model做得非常好。如果R-1 Zero这条路径靠谱，那是有机会超越SOTA的。 ## Insight 07：No Moat Google之前对OpenAI的一个评价——"No Moat"——放在这里也很应景。DeepSeek这一波，Chatbot用户又出现了大量迁移现象，这给市场一个很重要的启示：智能技术进步非常陡峭，阶段性产品很难形成绝对壁垒。不管是ChatGPT、Sonnet、Perplexity刚建立起来的心智和口碑，还是Cursor、Windsurf这类开发者工具，一旦有了更智能的产品，用户对"上一代"智能的产品几乎毫无忠诚度。今天，不管是模型层还是应用层，想构建护城河都非常困难。 DeepSeek这次也验证了一件事：模型即应用。DeepSeek在产品形式上没有任何创新，核心就是智能加开源。这不禁让人思考：在AI时代，产品和商业模式的创新，是否真的比不上智能本身的创新？ ## Insight 08：DeepSeek应该承接这波Chatbot流量并做大吗？从Chatbot爆火到今天，DeepSeek团队的反应可以明显看出来——他们还没想好怎么用这波流量。要不要接住并积极运营这批流量，本质上是这样一个问题：伟大的商业公司和伟大的research lab能共存于同一个组织吗？这件事非常考验精力和资源分配、组织能力和战略选择。如果是字节、Meta这类大公司，他们的第一反应肯定是要接下来，也有一定的组织基础。但DeepSeek作为research lab组织，承接这波巨量流量的压力必然很大。同时也要思考，这一波Chatbot会是阶段性流量吗？Chatbot是不是未来智能探索的主线下？似乎每个智能阶段都有对应的产品形态，Chatbot只是解锁的其中一个早期形态。对DeepSeek来说，从未来3到5年的视角看，如果今天不去承接Chatbot流量，会不会是一种错过？万一哪天跑出了规模效应呢？如果AGI最终实现了，又会是什么载体来承载它？ ## Insight 09：下一个智能突破的Aha moment从哪来？一方面，第一梯队的下一代模型很关键。但今天我们又处在Transformer的极限边界上，第一梯队能否拿出代际提升的模型，也是一个不确定的问题。OpenAI、Anthropic和Google如果只是回应性地拿出好30%到50%的模型，可能都不够挽回局势——因为他们投入的资源多了10到30倍。另一方面，Agent落地比较关键。Agent需要做长距离多步骤推理，如果模型好5%到10%，领先的效果就会被放大很多倍。所以OpenAI、Anthropic和Google一方面要做Agent产品落地、full stack集成模型加Agent产品，就像Windows加Office的模式；另一方面也要展示出更强大的模型，比如O3完整版、Sonnet 4、3.5 opus为代表的下一代模型。在技术不确定性下，最宝贵的还是天才AI研究者。任何想要探索AGI的组织，都要投入更激进的资源去押注下一个范式。尤其是在今天pre training阶段已经被拉齐的背景下，需要有优秀的人才加上充裕的资源，去探索下一个智能涌现的Aha moment。 ## Insight 10：DeepSeek这一波让我对中国AI人才更有信心，非常鼓舞最后想说：希望技术没有边界。

来源：https://www.53ai.com/news/LargeLanguageModel/2025020724805.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。

DeepSeek与智能下半场趋势判断解读

相关热点

延伸阅读