游乐游手机版
首页/AI热点日报/热点详情

DeepSeek新版V3对比实测:代码能力飙升引海外关注

类型:热点整理2026-07-04
DeepSeek昨夜悄然发布新版V3,新旧版本对比实测显示代码能力大幅提升,海外用户纷纷热议。 3月24日晚间,DeepSeek在开源社区低调放出了升级后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324。模型参数从上一代V3的6710亿提升至6850亿——尽管增长幅度不算惊人,

DeepSeek昨夜悄然发布新版V3,新旧版本对比实测显示代码能力大幅提升,海外用户纷纷热议。

3月24日晚间,DeepSeek在开源社区低调放出了升级后的DeepSeek-V3模型,版本号为DeepSeek-V3-0324。模型参数从上一代V3的6710亿提升至6850亿——尽管增长幅度不算惊人,但在当前大模型领域,这已是名副其实的“巨无霸”。不过,DeepSeek尚未同步发布新版模型的系统卡,因此更多技术细节仍有待后续披露。

与此同时,DeepSeek还将V3模型的开源许可协议升级为与R1一致的MIT协议。该协议更为宽松,允许模型蒸馏、商业使用等,开发者们因此获得了更大的自主权。

DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户

新版V3上线后,我们第一时间实测了其代码、数学和通用能力,并密切关注了国内外网友的反馈。从初步结果来看,本次升级最显著的提升集中在代码能力上。一位海外AI博主直言:DeepSeek终于能在代码领域与Anthropic的Claude Sonnet 3.5正面交锋。要知道,Claude Sonnet 3.5在程序员群体中一直备受推崇,尽管各类模型在代码评测中的成绩此起彼伏,开发者们仍习惯使用Claude系列。

在实测中,新版DeepSeek-V3在网站开发和UI设计方面的进步尤为突出。输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”指令后,它仅用约2分钟便交付了一个总代码量超过400行、设计精良的网站。据模型自身介绍,该网站采用了粒子背景动画、赛博朋克风格UI(霓虹光效、悬浮动画及科技感配色),标题带有打字机动画效果,按钮具备光波扩散特效。更实用的是,网站实现了响应式设计,可自动适配手机与桌面设备。

而同样指令给到旧版DeepSeek-V3,它仅提供了100多行代码的解决方案,审美水平与新版本差距悬殊。

有网友评价,这次“小更新”带来的改进远超预期,尤其在数学方面。我们将此前实测中难倒旧版V3和R1的一道数学题提交给新版。这次,新版DeepSeek-V3输出的token明显更长,首次输出即达到上限,点击继续生成后还能继续推理。不过最终答案依然错误。但有趣的是,从错误答案中我们观察到一项变化:新版DeepSeek-V3会在给出最终答案后主动进行一定程度的反思,并修正自己的解题过程。

在人文学科类问题上,变化同样明显。例如,用“布须曼人喝不喝牛奶?”这个问题测试,旧版V3的回答仅有三小段,信息量有限。而新版V3采用了更结构化的回答方式,分析更全面,补充了更多背景信息,同时生成速度依然保持理想水平。

这印证了部分网友总结的特点:新版DeepSeek-V3仿佛V3与R1的融合体,更倾向于通过长输出来解决问题。

新版V3已经问世,R2和V4还会远吗?——这或许是众多网友看完评测后的共同期待。

来源:https://www.53ai.com/news/OpenSourceLLM/2025032573961.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。