游乐游手机版
首页/科技数码/文章详情

终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先

时间:2026-04-24 12:59
“不诱于誉,不恐于诽,率道而行,端然正己。” 这句话,或许正是对当下AI赛道竞争态势的最佳注脚。就在DeepSeek-V4预览版本上线的当天,其团队发布了一则意味深长的表态:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。

“不诱于誉,不恐于诽,率道而行,端然正己。”

这句话,或许正是对当下AI赛道竞争态势的最佳注脚。就在DeepSeek-V4预览版本上线的当天,其团队发布了一则意味深长的表态:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”紧接着,他们又补充道:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”

这番言论,显然不仅仅是一句客套话。它更像是对近期市场诸多猜测的一次集中回应。4月24日,备受瞩目的全新系列模型DeepSeek-V4的预览版本,终于正式揭开了面纱,并同步宣布开源。这次亮相,带来了几个不容忽视的硬核升级:百万字级别的超长上下文处理能力,以及在Agent能力、世界知识和推理性能上,均实现了国内乃至开源领域的领先水平。值得注意的是,模型这次按规格分为了两个版本:

对于开发者而言,API服务也已同步更新。调用方式相当便捷,只需将model_name参数修改为“deepseek-v4-pro”或“deepseek-v4-flash”即可。

性能解析:Pro与Flash的双线作战

那么,相比前代模型,V4究竟强在哪里?先看旗舰型号DeepSeek-V4-Pro。其Agent能力得到了显著增强,在权威的AgenticCoding评测中,已经达到了当前开源模型的最佳水准,其他相关评测同样表现优异。有消息称,V4-Pro目前已成为公司内部员工使用的AgenticCoding模型。根据内部评测反馈,其使用体验优于Claude的Sonnet 4.5,交付质量则接近OpenAI的Opus 4.6的非思考模式。当然,与Opus 4.6的思考模式相比,仍存在一定差距——这恰恰指明了下一阶段的追赶方向。

在世界知识测评这个关键战场上,V4-Pro的表现同样可圈可点。它大幅领先于其他开源模型,仅以微弱差距稍逊于顶尖的闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码等硬核推理测评中,V4-Pro更是超越了所有已公开评测的开源模型,取得了足以比肩世界顶级闭源模型的优异成绩。

再看另一个版本DeepSeek-V4-Flash。它的定位非常清晰:在保证核心能力的前提下,追求极致的效率。具体来看,Flash版本在世界知识储备方面稍逊于Pro版,但展现出了接近的推理能力。其最大优势在于,由于模型参数和激活更小,能够提供更加快捷、经济的API服务。在Agent测评中,Flash版在处理简单任务时与Pro版旗鼓相当,只是在面对高难度复杂任务时,差距才显现出来。这种差异化的产品策略,显然是为了满足不同场景和预算的用户需求。

技术突破:重新定义注意力机制

此次V4系列最引人瞩目的技术亮点,莫过于其在注意力机制上的创新。它开创了一种全新的方法,在token维度进行压缩,并结合了自研的DSA稀疏注意力(DeepSeekSparseAttention)。这一组合拳,实现了全球领先的长上下文处理能力,并且相比于传统方法,大幅降低了对计算资源和显存的需求。可以说,从现在开始,一百万(1M)上下文将成为DeepSeek所有最新服务的标准配置。

此外,为了提升实际应用体验,DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了专门的适配和优化。这意味着,在代码任务、文档生成等具体应用场景中,其表现将得到进一步提升。

目前,DeepSeek API已同步上线V4-Pro与V4-Flash两个版本,同时支持OpenAI的ChatCompletions接口与Anthropic的接口。访问新模型时,base_url保持不变,只需将model参数改为对应的“deepseek-v4-pro”或“deepseek-v4-flash”即可。两个版本均支持高达1M的最大上下文长度,并且同时提供非思考模式与思考模式。其中,思考模式还支持通过reasoning_effort参数来设置思考强度(high/max)。对于复杂的Agent应用场景,官方建议使用思考模式,并将强度设置为max,以获得更优的结果。

竞争与未来:融资传闻与市场变局

回顾DeepSeek的发展轨迹,其去年春节期间的“现象级”走红,一度将其捧上神坛。然而,国产AI的竞速赛从未停歇。随着智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正面临前所未有的激烈竞争环境。

市场的压力,或许部分解释了近期关于其融资的传闻。4月18日,从多位创投圈人士处获得证实,DeepSeek正在开启其成立以来的首次外部融资。此前据外媒报道,其目标估值可能超过100亿美元。有知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元,以补充资金储备,应对这场成本日益高昂的AI“军备竞赛”。

事实上,在V4正式发布前,一些变化已经悄然发生。4月8日,DeepSeek在其应用界面输入框上方新增了“快速模式”与“专家模式”。网页说明显示,快速模式适合日常对话,追求即时响应,并支持图片和文件中的文字识别;而专家模式则更擅长处理复杂问题。这是DeepSeek在正式页面首次引入分层模式,这一产品细节的调整,当时就让业界对V4版本的更新充满了更多期待。当时便有综合预测指出,DeepSeek大概率在今年4月正式上线V4版本。如今看来,预言已成现实,而新一轮的行业洗牌,或许才刚刚开始。

来源:https://www.163.com/dy/article/KR9CL85P0514R9P4.html
上一篇国际城市观察|人工智能给城市发展带来五大挑战 下一篇荣耀WIN游戏本等多款新品正式发布,荣耀PC家族全面爆发
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo