DeepSeek新版V3对比实测：代码能力飙升引海外关注_AI热点日报

DeepSeek新版V3对比实测：代码能力飙升引海外关注

类型：热点整理2026-07-04

DeepSeek昨夜悄然发布新版V3，新旧版本对比实测显示代码能力大幅提升，海外用户纷纷热议。 3月24日晚间，DeepSeek在开源社区低调放出了升级后的DeepSeek-V3模型，版本号为DeepSeek-V3-0324。模型参数从上一代V3的6710亿提升至6850亿——尽管增长幅度不算惊人，

DeepSeek昨夜悄然发布新版V3，新旧版本对比实测显示代码能力大幅提升，海外用户纷纷热议。

3月24日晚间，DeepSeek在开源社区低调放出了升级后的DeepSeek-V3模型，版本号为DeepSeek-V3-0324。模型参数从上一代V3的6710亿提升至6850亿——尽管增长幅度不算惊人，但在当前大模型领域，这已是名副其实的“巨无霸”。不过，DeepSeek尚未同步发布新版模型的系统卡，因此更多技术细节仍有待后续披露。

与此同时，DeepSeek还将V3模型的开源许可协议升级为与R1一致的MIT协议。该协议更为宽松，允许模型蒸馏、商业使用等，开发者们因此获得了更大的自主权。

DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户

新版V3上线后，我们第一时间实测了其代码、数学和通用能力，并密切关注了国内外网友的反馈。从初步结果来看，本次升级最显著的提升集中在代码能力上。一位海外AI博主直言：DeepSeek终于能在代码领域与Anthropic的Claude Sonnet 3.5正面交锋。要知道，Claude Sonnet 3.5在程序员群体中一直备受推崇，尽管各类模型在代码评测中的成绩此起彼伏，开发者们仍习惯使用Claude系列。

在实测中，新版DeepSeek-V3在网站开发和UI设计方面的进步尤为突出。输入“设计一个美观的个人博客网站，带有科技感，直接开发成可用网页”指令后，它仅用约2分钟便交付了一个总代码量超过400行、设计精良的网站。据模型自身介绍，该网站采用了粒子背景动画、赛博朋克风格UI（霓虹光效、悬浮动画及科技感配色），标题带有打字机动画效果，按钮具备光波扩散特效。更实用的是，网站实现了响应式设计，可自动适配手机与桌面设备。

而同样指令给到旧版DeepSeek-V3，它仅提供了100多行代码的解决方案，审美水平与新版本差距悬殊。

有网友评价，这次“小更新”带来的改进远超预期，尤其在数学方面。我们将此前实测中难倒旧版V3和R1的一道数学题提交给新版。这次，新版DeepSeek-V3输出的token明显更长，首次输出即达到上限，点击继续生成后还能继续推理。不过最终答案依然错误。但有趣的是，从错误答案中我们观察到一项变化：新版DeepSeek-V3会在给出最终答案后主动进行一定程度的反思，并修正自己的解题过程。

在人文学科类问题上，变化同样明显。例如，用“布须曼人喝不喝牛奶？”这个问题测试，旧版V3的回答仅有三小段，信息量有限。而新版V3采用了更结构化的回答方式，分析更全面，补充了更多背景信息，同时生成速度依然保持理想水平。

这印证了部分网友总结的特点：新版DeepSeek-V3仿佛V3与R1的融合体，更倾向于通过长输出来解决问题。

新版V3已经问世，R2和V4还会远吗？——这或许是众多网友看完评测后的共同期待。

来源：https://www.53ai.com/news/OpenSourceLLM/2025032573961.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。

DeepSeek新版V3对比实测：代码能力飙升引海外关注

相关热点

延伸阅读