游乐游手机版
首页/AI热点日报/热点详情

DeepSeek V3新版发布:代码与审美升级,五大维度测评

类型:热点整理2026-07-04
DeepSeek V3模型此次升级力度不小,性能实现显著跃升,直接将上下文窗口拉满至128k,并且依然保持免费、开源、可商用的特性。下面我们快速过一遍核心亮点和实际测试效果。 就在3月24日晚间,几乎毫无征兆,DeepSeek在Hugging Face上悄然更新了V3模型,版本号为DeepSeek-

DeepSeek V3模型此次升级力度不小,性能实现显著跃升,直接将上下文窗口拉满至128k,并且依然保持免费、开源、可商用的特性。下面我们快速过一遍核心亮点和实际测试效果。

就在3月24日晚间,几乎毫无征兆,DeepSeek在Hugging Face上悄然更新了V3模型,版本号为DeepSeek-V3-0324。消息一出,X平台上的用户瞬间沸腾,测试反馈极为热烈。

综合各方评价来看,本次V3模型的前端代码生成能力堪称质的飞跃,审美设计也同步提升。甚至有网友认为其表现可以与Claude 3.7 Sonnet一较高下。用他们的话说,编码能力已经非常接近当前该领域的“标杆”。

DeepSeek官方也在社群中确认,V3模型已完成小版本升级,并同步部署到官网、App和小程序。用户只需关闭“深度思考”功能即可体验到新版能力。

最新版V3的核心更新汇总:

  1. 上下文窗口:从之前的64k直接翻倍至128k,能够处理更长的文本和对话。
  2. 能力提升:代码能力发生质变,审美设计也实现升级。
  3. 开源与许可:老规矩,免费、开源、可商用。

01 模型规模与架构

DeepSeek-V3基础模型参数为685B,每次激活37B参数。它依旧采用“混合专家系统”(MoE)架构,拥有256个“专家”,每个token会激活其中8个。技术细节上,通过多头潜在注意力(MLA)降低推理时的KV缓存,提升效率;采用无辅助损失的负载平衡策略动态调整专家负载;并使用多token预测(MTP)目标来增加训练信号密度。

本次升级,上下文窗口从64k扩展至128k。不过有细心的朋友发现,论文中早已标注128k,但官方API文档仍显示64k,可能是API尚未同步更新。

从基准测试来看,最新版V3在数学、代码、逻辑推理、知识问答等多个维度表现优异,相较V2版本进步显著。

02 实测案例

为验证这些宣传效果,我们上手跑了几个测试,结果如下:

1. 代码能力与审美

  • 输入:要求用Vue 3或React编写一个动态天气卡片组件,包含响应式布局、天气图标、温度、城市搜索、动态背景色和悬停动画,并使用Tailwind CSS。
  • 效果:一次生成就达到不错的效果。输入城市名后能对应显示天气卡片,背景色也会根据天气变化(虽未接API,采用随机数据),响应式布局在移动端和桌面端适配良好。审美确实跟上来了。

2. 数学推理能力

  • 输入:一个长方体长、宽、高分别增加10%、20%、15%,体积增加了多少百分比?
  • 效果:模型给出了清晰的分步计算过程,逻辑清楚,输出速度快,不拖泥带水。

3. 多轮对话与知识问答

  • 输入:先问“量子计算的主要优势是什么?”,然后追问“它与传统计算机在Shor算法上的具体区别是什么?”,再追问“用表格总结一下量子计算和传统计算的主要区别”。
  • 效果:连续追问三次后,上下文关联能力和一致性保持得相当不错。懂量子计算的朋友可以帮忙看看回答质量,欢迎评论区交流。

4. 高难度翻译

  • 输入:将包含文化隐喻的句子“这个算法像‘老黄牛’一样稳定,但缺乏‘灵鹤’的灵活性”翻译成英文,并解释隐喻处理。
  • 效果:翻译效果令人满意。将翻译后的英文再用豆包、百度翻译反译回中文,意思还原度很高,对隐喻部分的解释也到位。

5. 长文本理解与摘要

  • 输入:要求用500字概括DeepSeek-V3-0324论文的主要贡献和方法。
  • 效果:论文本身有几万字且为全英文。模型给出的总结和后续追问都非常准确,信息提取能力很强。值得一提的是,该模型正是用2048个NVIDIA H800 GPU训练出来的。

最后

从代码、数学推理、上下文关联、翻译到长文本处理,这五个维度的测试下来,V3此次的提升是实实在在的。特别是代码生成速度和审美水平,确实有网友认为能够媲美Claude 3.7 Sonnet的感觉。

最后再强调一下,最新版V3模型权重已在HuggingFace开源,可用于研究和商业用途。

可以说,在AI编码领域,东方的一颗新星正在冉冉升起。

DeepSeek,干得漂亮!

来源:https://www.53ai.com/news/OpenSourceLLM/2025032571492.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。