DeepSeek V4模型正式发布有哪些核心信息与功能亮点

时间：2026-05-12 08:32

万众瞩目的DeepSeek V4预览版，终于在北京时间4月24日上午揭开了面纱。此前，关于它即将发布的预测几经落空，这次总算是尘埃落定。由于模型刚刚发布，来自第三方和客户的深度评测还在进行中，目前能获取的有效信息确实有限。不过，结合官方技术文档和海外AI社区的初步讨论，我们依然可以梳理出一些关键看点

万众瞩目的DeepSeek V4预览版，终于在北京时间4月24日上午揭开了面纱。此前，关于它即将发布的预测几经落空，这次总算是尘埃落定。由于模型刚刚发布，来自第三方和客户的深度评测还在进行中，目前能获取的有效信息确实有限。不过，结合官方技术文档和海外AI社区的初步讨论，我们依然可以梳理出一些关键看点。

战略聚焦：Agent能力提升，直面行业浪潮

首先，一个明确的信号是，V4的战略重心放在了提升Agent能力上。这无疑顺应了自OpenClaw发布以来席卷行业的“全民养龙虾”趋势。这股浪潮为MiniMax、Kimi、智谱等国内大模型厂商带来了可观的Token增量，但其中最重要、最专业的那部分红利，似乎被Claude稳稳收入囊中。毕竟，Agent能力与编程能力密不可分，而Claude Code至今仍被广泛认为是全球最强大的AI编程工具，地位稳固，连GPT-Codex也难以撼动。

DeepSeek在官方公告开篇最显眼的位置，就宣称“Agent能力大幅提高”，但同时也坦承，“（据评测反馈）仍与Opus 4.6思考模式存在一定差距”。这种坦诚，反而增加了信息的可信度。

在海外社区，部分用户兴奋地将DeepSeek V4视为潜在的“Claude杀手”——这多少反映了一种“天下苦Anthropic久矣”的普遍情绪。不过，从目前已流出的测试数据看，V4在Token性价比上表现突出，但在专业的Agent Benchmark指标上，尚未超越Claude Opus-4.6和GPT-5.4。这里需要提醒的是，Benchmark分数仅供参考，实际用户体验才是关键。Claude在许多基准测试中并非总是领先，却不妨碍它在Agent应用领域几乎一枝独秀。因此，接下来一段时间，专业用户使用V4执行复杂Agent任务的实际反馈，才是真正的试金石。

此外，上下文窗口扩展到1M，结合较低的Token定价，理论上能创造出更高的生产力潜力。当然，这同样需要等待专业客户执行复杂长文本任务后的验证，至少还需要观察两三天。

一个有趣的猜测是：DeepSeek从传闻中的“1月/2月发布”一直推迟到4月底，真实原因或许正是在于打磨Agent能力。毕竟，“龙虾”带来的工作流变革和需求增量超出了许多人的预期。与其仓促推出一个跟不上现实Agentic Workflow需求的模型，不如多花几个月时间，打造一个真正契合市场需求的产品。当然，这仅仅是基于行业动态的合理推测，并无实证。

风格反馈：初期印象与潜在取舍

其次，根据最初一波海外用户的使用反馈，在执行“非深度推理、非数学、非代码”的任务时，例如头脑风暴或文艺创作，V4生成的回答被部分用户评价为“太干”（dry）、“过于正式”，感觉上落后于Claude和GPT的最新版本，甚至有人觉得不如GPT-5.2。

必须强调的是，这些零散的主观感受代表不了全局，况且文艺创作本就不是V4的主要发力方向。不过，这种初期印象如果持续，可能会对消费端用户的偏好产生微妙影响，进而扰动目前互联网大厂在C端AI应用市场的争夺战。

假设V4的回答确实显得“更干”、“更正式”，这有可能是团队为了解决V3/R1时期幻觉率较高问题而采取的一种策略。因为让模型“自由发挥”几乎必然伴随幻觉率上升，而严格限制幻觉，则很可能让回答风格趋向保守和严谨。这同样是一种有待更多测试验证的猜测。

硬件谜题：训练底牌仍未揭晓

第三，也是很多人关心的焦点：DeepSeek V4的技术文档披露了大量训练细节，却唯独对训练硬件（显卡）信息讳莫如深。通篇文档中，“华&为”（Huawei）仅出现一次，“英伟达”（Nvidia）出现三次（不含脚注）；“GPU”出现了十四次（不含脚注），但均未指明具体型号，仅有一次例外——文档中提到“We validated the fine-grained EP scheme on both NVIDIA GPUs and Huawei NPUs platforms.”但这仅代表测试环境，而非训练场景（注：这也是唯一一次提及华&为昇腾NPU）。

因此，DeepSeek V4究竟在什么硬件上训练而成，仍然是个谜。文档中几次提到CUDA，但也不能据此得出完全基于英伟达架构的结论。是否如某些分析师预期的那样，“基于英伟达和华&为昇腾混合架构进行训练”，或者“在后训练环节对昇腾进行了专门优化”？虽然一切皆有可能，但DeepSeek官方对此既未认可，也未否认。相比之下，V3的技术文档开篇就明确宣布由英伟达H800和A100训练而成。

有人根据DeepSeek公告中“预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调”的表述，推断出“V4针对昇腾做了深度优化”，甚至“从1月推迟发布至今就是为了适配昇腾”。虽然不能完全排除这种可能性，但这种逻辑链条显得过于跳跃。这最多只能说明DeepSeek官方会采购或租用一批昇腾算力，并对昇腾推理进行过优化（这是很正常的商业行为）。至于优化程度有多深，乃至是否为了适配而推迟发布，目前均没有任何实证支持。

不过，要间接验证或证伪这一点并不难。V4是开源的，从今天起，会有无数厂商使用自己的算力进行推理。如果它确实基于昇腾训练或为其深度优化，那么可以推断，它在昇腾硬件上的推理效率，应该显著高于或至少不亚于在其他硬件上的表现。或者，昇腾硬件能激发出V4某些独特的性能优势。接下来，只需关注相关的测试新闻，便能轻松了解实际情况（如果始终没有这类新闻，则相当于被证伪了）。

产业涟漪：谁最期待V4的成功？

最后，看看对产业界的影响。除了DeepSeek自身，最期待V4发布并能震撼世界的，恐怕要数腾讯了。就在昨天，腾讯刚刚发布了混元3.0大模型预览版，结果其光芒完全被今天的DeepSeek V4所掩盖。尽管尚未有机会全面试用混元3.0，但考虑到腾讯在基座大模型领域此前的落后幅度不小，想靠一个版本就跃升至世界先进水平，可能性似乎不大。

因此，腾讯若想做好AI生意，无论是面向企业的MaaS（模型即服务）Token销售，还是面向消费者的应用，恐怕在相当一段时间内仍需依赖高质量的第三方开源大模型。国内水平最高、使用最广的开源模型是Qwen，但那属于老对手阿里，腾讯显然不太愿意用。那么，剩下的选择就主要是DeepSeek，以及几天前刚发布新版本的Kimi了。如果DeepSeek真的开放融资，腾讯必然会不惜代价参与其中。V4越成功，就能为腾讯争取到更多宝贵时间：一边努力将自己打造成“国产开源生态”的聚合平台，另一边则竭尽全力追赶自研大模型的技术实力。

现在，最期待V4在用户测试中传来捷报的，恐怕就是腾讯的投资人和管理层了。幸运的是，从最初期的反馈来看，情况似乎还不错，海外社区的评价偏向积极。但这显然还不够，最好是“十分积极”——我们恐怕还得耐心等上一周左右，才能获得更确切的结论。

来源：https://36kr.com/p/3780380688143363

DeepSeek V

上一篇阿里投资福客AI推动电商AI Agent应用革新 下一篇梁文锋人物深度解读与创业故事分享

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日，中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛：跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号：人工智能正从技术突破迈向产业落地的关键阶段，而资本信心的背后，映射出产业演进的明确风向。海淀区明确表态，将以开放

业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日，菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确：菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势，以及多年深耕海外仓的运营经验，全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A