游乐游手机版
首页/业界动态/文章详情

DeepSeek V4模型正式发布有哪些核心信息与功能亮点

时间:2026-05-12 08:32
万众瞩目的DeepSeek V4预览版,终于在北京时间4月24日上午揭开了面纱。此前,关于它即将发布的预测几经落空,这次总算是尘埃落定。由于模型刚刚发布,来自第三方和客户的深度评测还在进行中,目前能获取的有效信息确实有限。不过,结合官方技术文档和海外AI社区的初步讨论,我们依然可以梳理出一些关键看点

万众瞩目的DeepSeek V4预览版,终于在北京时间4月24日上午揭开了面纱。此前,关于它即将发布的预测几经落空,这次总算是尘埃落定。由于模型刚刚发布,来自第三方和客户的深度评测还在进行中,目前能获取的有效信息确实有限。不过,结合官方技术文档和海外AI社区的初步讨论,我们依然可以梳理出一些关键看点。

战略聚焦:Agent能力提升,直面行业浪潮

首先,一个明确的信号是,V4的战略重心放在了提升Agent能力上。这无疑顺应了自OpenClaw发布以来席卷行业的“全民养龙虾”趋势。这股浪潮为MiniMax、Kimi、智谱等国内大模型厂商带来了可观的Token增量,但其中最重要、最专业的那部分红利,似乎被Claude稳稳收入囊中。毕竟,Agent能力与编程能力密不可分,而Claude Code至今仍被广泛认为是全球最强大的AI编程工具,地位稳固,连GPT-Codex也难以撼动。

DeepSeek在官方公告开篇最显眼的位置,就宣称“Agent能力大幅提高”,但同时也坦承,“(据评测反馈)仍与Opus 4.6思考模式存在一定差距”。这种坦诚,反而增加了信息的可信度。

在海外社区,部分用户兴奋地将DeepSeek V4视为潜在的“Claude杀手”——这多少反映了一种“天下苦Anthropic久矣”的普遍情绪。不过,从目前已流出的测试数据看,V4在Token性价比上表现突出,但在专业的Agent Benchmark指标上,尚未超越Claude Opus-4.6和GPT-5.4。这里需要提醒的是,Benchmark分数仅供参考,实际用户体验才是关键。Claude在许多基准测试中并非总是领先,却不妨碍它在Agent应用领域几乎一枝独秀。因此,接下来一段时间,专业用户使用V4执行复杂Agent任务的实际反馈,才是真正的试金石。

此外,上下文窗口扩展到1M,结合较低的Token定价,理论上能创造出更高的生产力潜力。当然,这同样需要等待专业客户执行复杂长文本任务后的验证,至少还需要观察两三天。

一个有趣的猜测是:DeepSeek从传闻中的“1月/2月发布”一直推迟到4月底,真实原因或许正是在于打磨Agent能力。毕竟,“龙虾”带来的工作流变革和需求增量超出了许多人的预期。与其仓促推出一个跟不上现实Agentic Workflow需求的模型,不如多花几个月时间,打造一个真正契合市场需求的产品。当然,这仅仅是基于行业动态的合理推测,并无实证。

风格反馈:初期印象与潜在取舍

其次,根据最初一波海外用户的使用反馈,在执行“非深度推理、非数学、非代码”的任务时,例如头脑风暴或文艺创作,V4生成的回答被部分用户评价为“太干”(dry)、“过于正式”,感觉上落后于Claude和GPT的最新版本,甚至有人觉得不如GPT-5.2。

必须强调的是,这些零散的主观感受代表不了全局,况且文艺创作本就不是V4的主要发力方向。不过,这种初期印象如果持续,可能会对消费端用户的偏好产生微妙影响,进而扰动目前互联网大厂在C端AI应用市场的争夺战。

假设V4的回答确实显得“更干”、“更正式”,这有可能是团队为了解决V3/R1时期幻觉率较高问题而采取的一种策略。因为让模型“自由发挥”几乎必然伴随幻觉率上升,而严格限制幻觉,则很可能让回答风格趋向保守和严谨。这同样是一种有待更多测试验证的猜测。

硬件谜题:训练底牌仍未揭晓

第三,也是很多人关心的焦点:DeepSeek V4的技术文档披露了大量训练细节,却唯独对训练硬件(显卡)信息讳莫如深。通篇文档中,“华&为”(Huawei)仅出现一次,“英伟达”(Nvidia)出现三次(不含脚注);“GPU”出现了十四次(不含脚注),但均未指明具体型号,仅有一次例外——文档中提到“We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms.”但这仅代表测试环境,而非训练场景(注:这也是唯一一次提及华&为昇腾NPU)。

因此,DeepSeek V4究竟在什么硬件上训练而成,仍然是个谜。文档中几次提到CUDA,但也不能据此得出完全基于英伟达架构的结论。是否如某些分析师预期的那样,“基于英伟达和华&为昇腾混合架构进行训练”,或者“在后训练环节对昇腾进行了专门优化”?虽然一切皆有可能,但DeepSeek官方对此既未认可,也未否认。相比之下,V3的技术文档开篇就明确宣布由英伟达H800和A100训练而成。

有人根据DeepSeek公告中“预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调”的表述,推断出“V4针对昇腾做了深度优化”,甚至“从1月推迟发布至今就是为了适配昇腾”。虽然不能完全排除这种可能性,但这种逻辑链条显得过于跳跃。这最多只能说明DeepSeek官方会采购或租用一批昇腾算力,并对昇腾推理进行过优化(这是很正常的商业行为)。至于优化程度有多深,乃至是否为了适配而推迟发布,目前均没有任何实证支持。

不过,要间接验证或证伪这一点并不难。V4是开源的,从今天起,会有无数厂商使用自己的算力进行推理。如果它确实基于昇腾训练或为其深度优化,那么可以推断,它在昇腾硬件上的推理效率,应该显著高于或至少不亚于在其他硬件上的表现。或者,昇腾硬件能激发出V4某些独特的性能优势。接下来,只需关注相关的测试新闻,便能轻松了解实际情况(如果始终没有这类新闻,则相当于被证伪了)。

产业涟漪:谁最期待V4的成功?

最后,看看对产业界的影响。除了DeepSeek自身,最期待V4发布并能震撼世界的,恐怕要数腾讯了。就在昨天,腾讯刚刚发布了混元3.0大模型预览版,结果其光芒完全被今天的DeepSeek V4所掩盖。尽管尚未有机会全面试用混元3.0,但考虑到腾讯在基座大模型领域此前的落后幅度不小,想靠一个版本就跃升至世界先进水平,可能性似乎不大。

因此,腾讯若想做好AI生意,无论是面向企业的MaaS(模型即服务)Token销售,还是面向消费者的应用,恐怕在相当一段时间内仍需依赖高质量的第三方开源大模型。国内水平最高、使用最广的开源模型是Qwen,但那属于老对手阿里,腾讯显然不太愿意用。那么,剩下的选择就主要是DeepSeek,以及几天前刚发布新版本的Kimi了。如果DeepSeek真的开放融资,腾讯必然会不惜代价参与其中。V4越成功,就能为腾讯争取到更多宝贵时间:一边努力将自己打造成“国产开源生态”的聚合平台,另一边则竭尽全力追赶自研大模型的技术实力。

现在,最期待V4在用户测试中传来捷报的,恐怕就是腾讯的投资人和管理层了。幸运的是,从最初期的反馈来看,情况似乎还不错,海外社区的评价偏向积极。但这显然还不够,最好是“十分积极”——我们恐怕还得耐心等上一周左右,才能获得更确切的结论。

来源:https://36kr.com/p/3780380688143363
上一篇阿里投资福客AI推动电商AI Agent应用革新 下一篇梁文锋人物深度解读与创业故事分享
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
中关村论坛年会AI未来论坛聚焦跃迁投资共生
业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日,中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛:跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号:人工智能正从技术突破迈向产业落地的关键阶段,而资本信心的背后,映射出产业演进的明确风向。海淀区明确表态,将以开放

泰国CP AXTRA与菜鸟合作复制中国闪购模式
业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日,菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确:菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势,以及多年深耕海外仓的运营经验,全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A

云英谷科技VTDR6135参评SID中国区显示行业奖
业界动态 · 2026-06-30

云英谷科技VTDR6135参评SID中国区显示行业奖

云英谷科技携国内首颗支持1 5KRealRGB显示的AMOLED驱动芯片VTDR6135参评SID中国区显示行业奖。该芯片已量产并用于高端手机,采用28nm制程,支持240Hz刷新率,集成自研APDBI技术与烧屏补偿机制。在ICDT2026大会C06展位展示。

马斯克警告柏林工厂扩张受外部干预需保自主
业界动态 · 2026-06-30

马斯克警告柏林工厂扩张受外部干预需保自主

3月1日消息,特斯拉CEO埃隆·马斯克向柏林工厂的员工传递了一个信号:如果工厂无法在“不受外界干扰”的环境下自主运转,那么后续的扩建计划可能需要延后。这番话源自一段提前录制的视频,由马斯克在得克萨斯州奥斯汀与格伦海德工厂厂长安德烈·蒂里格共同完成录制,随后在柏林超级工厂内部播放给员工观看。 这段视频

高通钱堃博鳌谈构建用户中心智能生态
业界动态 · 2026-06-30

高通钱堃博鳌谈构建用户中心智能生态

高通钱堃指出,AI正重塑人机交互,2026年称为智能体之年。6G被设计为AI原生系统,2026年为标准化关键年,高通已与近60家伙伴达成共识。高通构建以用户为中心的智能生态系统,通过端-边-云协同架构,结合5G 6G技术,并推出AI加速计划,推动个人、物理、工业AI规模化应用。