昨晚,DeepSeek在开源社区悄然发布了一项重要更新——升级后的DeepSeek-V3模型正式上线,引发了广泛关注。
新模型版本号为DeepSeek-V3-0324,参数量从原有的6710亿小幅提升至6850亿。不过官方尚未公布系统卡,许多技术细节仍处于保密状态。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
更值得注意的是,此次DeepSeek将开源协议升级为与R1一致的MIT协议。这一更为宽松的许可允许模型蒸馏、商业使用等操作,相当于为开发者彻底解除了限制。
智东西第一时间对新版V3进行了代码生成、数学推理和通用能力等多维度实测,同时也留意到社区中大量用户的反馈。从现有数据来看,升级后的V3在代码和数学等领域确实实现了肉眼可见的性能飞跃。
有海外AI博主直言,DeepSeek终于能在代码领域与Anthropic的Claude Sonnet 3.5正面竞争。要知道,Claude Sonnet 3.5在程序员群体中长期被视为“封神”般的存在——无论其他模型如何刷榜,真正写代码的开发者依然倾向于使用Claude。
在新版DeepSeek-V3的测试中,网站开发与UI设计方面的进步最为惊艳。当输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”这类指令后,模型直接交出了一份令人叹为观止的答卷。
新版V3仅用时2分钟,就生成了一个完整且设计精良的网站,代码超过400行。据模型自述,该网站采用了粒子背景动画、赛博朋克UI(包含霓虹光效、悬浮动画、科技感配色),标题带有打字机动画效果,按钮还具备光波扩散特效。
更难得的是,这个网站采用了响应式设计,能够自动适配手机和桌面端,确保不同设备的用户体验。
而旧版DeepSeek-V3在收到相同指令时,只能勉强输出100多行代码,审美水平被新版甩开了一个档次。
有社区用户评价称,这次“小更新”带来的惊喜远超预期,尤其在数学推理能力方面的改进非常显著。
此前我们测试时,有一道数学题曾让旧版V3和R1都束手无策。这次将同一道题交给新版V3,输出的token总量明显变长,单次输出直接触及上限。点击“继续生成”后,模型仍在持续思考——不过最终答案依然错误。
但有趣的是,即使答案不对,也能观察到新变化:新版V3在给出答案后会主动进行反思,甚至自动修正自己的解题过程。
在文科类问题上,表现也有显著提升。例如我们之前询问过“布须曼人是否喝牛奶”,旧版V3仅回复了三小段文字,信息量有限。而新版V3采用了更结构化的回答模式,分析更加全面,补充了大量背景信息,同时生成速度依然理想。
这也印证了许多网友的总结:新版V3像是V3与R1的结合体,更倾向于通过长输出来解决问题。
新版V3一经发布,网友们的想象力再次沸腾:V3已经到来,R2和V4还会远吗?
