游乐游手机版
首页/AI热点日报/热点详情

DeepSeek与智能下半场趋势判断解读

类型:热点整理2026-06-29
DeepSeekR1推动强化学习与测试时计算新范式出圈,开源引发轰动,但未超越第一梯队。推理模型提升加速智能下半场进程,推动Agent落地。智能技术进步陡峭,阶段性产品难筑护城河,模型即应用趋势凸显。中国AI人才表现令人鼓舞。
# 深入剖析DeepSeek在AI领域的地位与影响,探讨智能下半场的发展方向 从24年第三季度开始,我们一直在聊AI的下半场这个概念。OpenAI o1虽然提出了RL叙事,但坦白说,各种原因下它并没有真正破圈。真正推动这一进程、把谜底揭开的,是DeepSeek R1——它解开了RL的谜题,让整个行业迈入了新范式,智能下半场这才算是真正开启了。 市场上关于DeepSeek是什么、为什么的讨论已经铺天盖地。相比这些,更有价值的命题其实在后面——这场AI竞赛到底该怎么玩下去?把过去半个月的思考梳理了一下,希望它能成为探索下半场的一张路线图,也方便时不时拿出来复盘。 --- ## Insight 01:DeepSeek超越OpenAI了吗? DeepSeek超越Meta Llama是没有悬念的,但跟OpenAI、Anthropic、Google这些第一梯队放在一起,距离还是有的。举个例子,Gemini 2.0 Flash在成本上比DeepSeek更低,能力同样强劲,而且是全模态模型。外界其实低估了以Gemini 2.0为代表的第一梯队选手的实力,只是他们没有开源,所以没有收获那么炸裂的轰动效果。 所以,DeepSeek让人兴奋不假,但还不能称之为范式级创新。更准确的描述是:它把之前OpenAI o1半遮半掩的范式给开源了,进而把整个生态推到了一个渗透率极高的水平。 从第一性原理的角度来看,在Transformer这一代架构下,想超越第一梯队模型厂商是有难度的。同样的技术路径,很难实现弯道超车。今天我们更期待的是有人能探索出下一代的智能架构和范式。DeepSeek用一年时间追上了OpenAI和Anthropic,这已经足够惊艳。 对 DeepSeek 和智能下半场的几条判断 ## Insight 02:DeepSeek开启新范式了吗? 严格意义上说,DeepSeek并没有发明新范式。但它的重要意义在于——让RL和test time compute这个新范式真正出圈了。如果打个比方,OpenAI最初发布的o1是在给行业出了一个谜语,那DeepSeek就是第一个公开解谜的人。 在DeepSeek发布R1和R1-zero之前,只有少数人在实践RL和reasoning model,圈子非常小。DeepSeek给大家画出了清晰的路线图,让行业看到这样做确实能提升智能。这就吸引大量AI研究者转向新范式,有人才进入才有算法创新,有开源紧追才有更多计算资源投入。 效果也很明显:原本打算不再发新模型的OpenAI,接连发出o3mini,还计划继续发布o3,甚至考虑开源。Anthropic和Google也会加速RL研究。行业对新范式的推进因为DeepSeek而明显加快,中小团队终于可以在不同的领域尝试RL了。 另外,reasoning model的提升会进一步推动Agent落地。AI研究者现在对Agent的研究和探索更有信心了。所以,DeepSeek虽然没有发明新范式,但它实实在在地推进整个行业进入了新范式。 ## Insight 03:Anthropic的技术路线和R1有什么不同? 从Dario的访谈来看,Anthropic对reasoning model的理解和OpenAI的O系列有些分歧。Dario认为base model和reasoning model应该是一个连续光谱,而不是像OpenAI那样做成独立的模型系列。如果只做O系列,很快就会遇到天花板。 这让我想到一个问题:为什么Sonnet 3.5的coding、reasoning和agentic能力突然提升得这么强,而4o一直没追上?答案在于他们做pre training base model的阶段,就已经融入了大量RL工作。核心是先把base model的能力提上来,否则仅仅靠RL去拉升reasoning model,收益迟早会被吃光。 ## Insight 04:DeepSeek的轰动有必然,也有偶然 两位早期OpenAI研究员写的《为什么伟大不能被计划》,放在这里来解释DeepSeek也很贴切。从技术角度看,DeepSeek有几个亮点: **开源**是关键因素。OpenAI从GPT-3开始转为闭源公司之后,第一梯队三巨头就不再公开技术细节,硬生生让出了一个开源生态位。Meta和Mistral没有接稳这个位置,DeepSeek这次堪称奇袭,在开源赛道上一马平川。如果给轰动性打100分,智能提升贡献30分,开源贡献70分。之前LLaMA也开源但没有这种效果,说明那时LLaMA的智能水平还不够。 **便宜**这件事,"Your margin is my opportunity"这句话的含金量还在持续上升。 **联网+公开CoT**是王炸组合。这两个点分别带来了极好的用户体验,特别是把模型思考过程公开,让用户对AI更加信任,直接推动了破圈。不过Perplexity反应很快,在DeepSeek服务端不稳定时迅速上线了R-1,反倒承接了大批溢出用户。 **RL泛化**方面,虽然RL是OpenAI o1最先提出来的,但因为运营上的半遮半掩,渗透率一直不高。DeepSeek R-1极大地推动了reasoning model范式的进程,生态接受度大幅提升。 当然,DeepSeek在技术上的探索和投入,确实让这个智能成果值得被更多人关注——这是确定性因素。但DeepSeek R-1推出的时间点,又让这场轰动带有偶发性。过去美国一直强调自己在基础技术研究上大幅领先,而DeepSeek原生于中国国内,这也是一个亮点。过程中不少美国科技大佬开始宣扬DeepSeek挑战了美国科技霸主地位,DeepSeek被动卷进了舆论战。再加上R-1发布之前,OpenAI Stargate的5000亿美元事件刚刚发酵,这种巨量投入和DeepSeek团队的智能产出效率对比太鲜明了。DeepSeek让英伟达股价大跌,进一步让舆论发酵——他们肯定也想不到自己成了2025年开年美股第一只黑天鹅。还有一个关键因素:春节是产品的练兵场,移动互联网时代很多超级App都是在春节大爆发的,AI时代也不例外。DeepSeek R-1恰好在春节前发布,大众惊喜的是它的文字创作能力,而不是训练时强调的coding和数学能力。文创更容易被大众用户感知到,也更容易在社交网络上传播。 ## Insight 05:谁受伤?谁受益? 我们可以把这个赛场的玩家分成三类:ToC、To Developer和To Enterprise/To Government。 ToC层面,Chatbot受到的冲击最大,心智和品牌关注度被DeepSeek抢走,ChatGPT也不例外。在开发者环节,影响其实很有限。很多用户反馈R-1不如Sonnet,Cursor官方也说Sonnet还是表现出色,用户迁移的比例并不高。第三个维度,To Enterprise和To Government的生意在于信任和需求理解,大型组织做决策的利益考虑很复杂,不会像C端用户那么容易迁移。 换个角度,从闭源、开源和算力视角来看这个问题。短期来看,闭源的OpenAI、Anthropic、Google更受冲击:技术神秘感被开源打破了,AI hype中最核心的神秘感溢价消失了。更现实的因素是,市场认为这些闭源公司的潜在客户和市场规模被分走了一些,GPU投入的回本周期变长。作为行业领头羊的OpenAI在其中最"吃亏"——之前捂着技术不开源、半遮半掩、希望多赚技术溢价的美梦,已经无法实现了。 但中长期来看,GPU资源充裕的公司还是受益的。一方面,第二梯队的Meta可以快速跟进新方法,capital expenditure更加高效,Meta可能是很大的受益者。另一方面,智能提升还需要更多探索,DeepSeek开源把大家的水平拉齐了,再往下探索又需要10倍甚至更大量级的GPU投入。从第一性原理出发,无论是发展智能还是应用智能,从物理本质上必然要消耗海量算力,这是基础定律决定的,不是技术优化能完全规避的。所以,无论是探索智能还是应用智能,即便短期有质疑,中长期的算力需求也会爆炸。这也解释了马斯克为什么从第一性原理出发,坚持扩建xAI的集群——xAI和Stargate背后的深层逻辑也许是一样的。Amazon等云厂商也已经宣布要增加capital expenditure指引。假设全球的AI研究人才水平和认知都拉齐了,那有更多GPU就可以做更多实验探索,最后的竞争还是会回到计算资源上。 DeepSeek光脚不怕穿鞋的,没有商业化诉求,专注AGI智能技术探索。开源这个动作对推动AGI进程意义很大,加剧了竞争,推动了开放性,颇有鲶鱼效应。 ## Insight 06:蒸馏能超越SOTA吗? 有个细节点目前还不确定:如果DeepSeek从pre train阶段就大量使用蒸馏的CoT数据,那做到今天的效果其实不算惊艳,本质上是在第一梯队巨头的肩膀上获得的基础智能,然后再开源出来。但如果pre train阶段没有大量用蒸馏数据,DeepSeek从零开始做pre train做到今天的效果,那就堪称惊艳了。 另外,蒸馏能否在base model上超越SOTA,答案应该是不太可能的。但DeepSeek R-1确实非常强,推测是他们的Reward model做得非常好。如果R-1 Zero这条路径靠谱,那是有机会超越SOTA的。 ## Insight 07:No Moat Google之前对OpenAI的一个评价——"No Moat"——放在这里也很应景。DeepSeek这一波,Chatbot用户又出现了大量迁移现象,这给市场一个很重要的启示:智能技术进步非常陡峭,阶段性产品很难形成绝对壁垒。不管是ChatGPT、Sonnet、Perplexity刚建立起来的心智和口碑,还是Cursor、Windsurf这类开发者工具,一旦有了更智能的产品,用户对"上一代"智能的产品几乎毫无忠诚度。今天,不管是模型层还是应用层,想构建护城河都非常困难。 DeepSeek这次也验证了一件事:模型即应用。DeepSeek在产品形式上没有任何创新,核心就是智能加开源。这不禁让人思考:在AI时代,产品和商业模式的创新,是否真的比不上智能本身的创新? ## Insight 08:DeepSeek应该承接这波Chatbot流量并做大吗? 从Chatbot爆火到今天,DeepSeek团队的反应可以明显看出来——他们还没想好怎么用这波流量。要不要接住并积极运营这批流量,本质上是这样一个问题:伟大的商业公司和伟大的research lab能共存于同一个组织吗? 这件事非常考验精力和资源分配、组织能力和战略选择。如果是字节、Meta这类大公司,他们的第一反应肯定是要接下来,也有一定的组织基础。但DeepSeek作为research lab组织,承接这波巨量流量的压力必然很大。 同时也要思考,这一波Chatbot会是阶段性流量吗?Chatbot是不是未来智能探索的主线下?似乎每个智能阶段都有对应的产品形态,Chatbot只是解锁的其中一个早期形态。对DeepSeek来说,从未来3到5年的视角看,如果今天不去承接Chatbot流量,会不会是一种错过?万一哪天跑出了规模效应呢?如果AGI最终实现了,又会是什么载体来承载它? ## Insight 09:下一个智能突破的Aha moment从哪来? 一方面,第一梯队的下一代模型很关键。但今天我们又处在Transformer的极限边界上,第一梯队能否拿出代际提升的模型,也是一个不确定的问题。OpenAI、Anthropic和Google如果只是回应性地拿出好30%到50%的模型,可能都不够挽回局势——因为他们投入的资源多了10到30倍。 另一方面,Agent落地比较关键。Agent需要做长距离多步骤推理,如果模型好5%到10%,领先的效果就会被放大很多倍。所以OpenAI、Anthropic和Google一方面要做Agent产品落地、full stack集成模型加Agent产品,就像Windows加Office的模式;另一方面也要展示出更强大的模型,比如O3完整版、Sonnet 4、3.5 opus为代表的下一代模型。 在技术不确定性下,最宝贵的还是天才AI研究者。任何想要探索AGI的组织,都要投入更激进的资源去押注下一个范式。尤其是在今天pre training阶段已经被拉齐的背景下,需要有优秀的人才加上充裕的资源,去探索下一个智能涌现的Aha moment。 ## Insight 10:DeepSeek这一波让我对中国AI人才更有信心,非常鼓舞 最后想说:希望技术没有边界。
来源:https://www.53ai.com/news/LargeLanguageModel/2025020724805.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。