终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先
“不诱于誉,不恐于诽,率道而行,端然正己。”
这句话,或许正是对当下AI赛道竞争态势的最佳注脚。就在DeepSeek-V4预览版本上线的当天,其团队发布了一则意味深长的表态:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。”紧接着,他们又补充道:“我们将始终秉持长期主义的原则理念,在尝试与思考中踏实前行,努力向实现AGI的目标不断靠近。”
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
这番言论,显然不仅仅是一句客套话。它更像是对近期市场诸多猜测的一次集中回应。4月24日,备受瞩目的全新系列模型DeepSeek-V4的预览版本,终于正式揭开了面纱,并同步宣布开源。这次亮相,带来了几个不容忽视的硬核升级:百万字级别的超长上下文处理能力,以及在Agent能力、世界知识和推理性能上,均实现了国内乃至开源领域的领先水平。值得注意的是,模型这次按规格分为了两个版本:
对于开发者而言,API服务也已同步更新。调用方式相当便捷,只需将model_name参数修改为“deepseek-v4-pro”或“deepseek-v4-flash”即可。
性能解析:Pro与Flash的双线作战
那么,相比前代模型,V4究竟强在哪里?先看旗舰型号DeepSeek-V4-Pro。其Agent能力得到了显著增强,在权威的AgenticCoding评测中,已经达到了当前开源模型的最佳水准,其他相关评测同样表现优异。有消息称,V4-Pro目前已成为公司内部员工使用的AgenticCoding模型。根据内部评测反馈,其使用体验优于Claude的Sonnet 4.5,交付质量则接近OpenAI的Opus 4.6的非思考模式。当然,与Opus 4.6的思考模式相比,仍存在一定差距——这恰恰指明了下一阶段的追赶方向。
在世界知识测评这个关键战场上,V4-Pro的表现同样可圈可点。它大幅领先于其他开源模型,仅以微弱差距稍逊于顶尖的闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码等硬核推理测评中,V4-Pro更是超越了所有已公开评测的开源模型,取得了足以比肩世界顶级闭源模型的优异成绩。
再看另一个版本DeepSeek-V4-Flash。它的定位非常清晰:在保证核心能力的前提下,追求极致的效率。具体来看,Flash版本在世界知识储备方面稍逊于Pro版,但展现出了接近的推理能力。其最大优势在于,由于模型参数和激活更小,能够提供更加快捷、经济的API服务。在Agent测评中,Flash版在处理简单任务时与Pro版旗鼓相当,只是在面对高难度复杂任务时,差距才显现出来。这种差异化的产品策略,显然是为了满足不同场景和预算的用户需求。
技术突破:重新定义注意力机制
此次V4系列最引人瞩目的技术亮点,莫过于其在注意力机制上的创新。它开创了一种全新的方法,在token维度进行压缩,并结合了自研的DSA稀疏注意力(DeepSeekSparseAttention)。这一组合拳,实现了全球领先的长上下文处理能力,并且相比于传统方法,大幅降低了对计算资源和显存的需求。可以说,从现在开始,一百万(1M)上下文将成为DeepSeek所有最新服务的标准配置。
此外,为了提升实际应用体验,DeepSeek-V4针对ClaudeCode、OpenClaw、OpenCode、CodeBuddy等主流的Agent产品进行了专门的适配和优化。这意味着,在代码任务、文档生成等具体应用场景中,其表现将得到进一步提升。
目前,DeepSeek API已同步上线V4-Pro与V4-Flash两个版本,同时支持OpenAI的ChatCompletions接口与Anthropic的接口。访问新模型时,base_url保持不变,只需将model参数改为对应的“deepseek-v4-pro”或“deepseek-v4-flash”即可。两个版本均支持高达1M的最大上下文长度,并且同时提供非思考模式与思考模式。其中,思考模式还支持通过reasoning_effort参数来设置思考强度(high/max)。对于复杂的Agent应用场景,官方建议使用思考模式,并将强度设置为max,以获得更优的结果。
竞争与未来:融资传闻与市场变局
回顾DeepSeek的发展轨迹,其去年春节期间的“现象级”走红,一度将其捧上神坛。然而,国产AI的竞速赛从未停歇。随着智谱、MiniMax、Kimi等大模型公司的迅速迭代,DeepSeek正面临前所未有的激烈竞争环境。
市场的压力,或许部分解释了近期关于其融资的传闻。4月18日,从多位创投圈人士处获得证实,DeepSeek正在开启其成立以来的首次外部融资。此前据外媒报道,其目标估值可能超过100亿美元。有知情人士透露,DeepSeek已开始与投资人接触,计划融资至少3亿美元,以补充资金储备,应对这场成本日益高昂的AI“军备竞赛”。
事实上,在V4正式发布前,一些变化已经悄然发生。4月8日,DeepSeek在其应用界面输入框上方新增了“快速模式”与“专家模式”。网页说明显示,快速模式适合日常对话,追求即时响应,并支持图片和文件中的文字识别;而专家模式则更擅长处理复杂问题。这是DeepSeek在正式页面首次引入分层模式,这一产品细节的调整,当时就让业界对V4版本的更新充满了更多期待。当时便有综合预测指出,DeepSeek大概率在今年4月正式上线V4版本。如今看来,预言已成现实,而新一轮的行业洗牌,或许才刚刚开始。
相关攻略
“不诱于誉,不恐于诽,率道而行,端然正己。” 这句话,或许正是对当下AI赛道竞争态势的最佳注脚。就在DeepSeek-V4预览版本上线的当天,其团队发布了一则意味深长的表态:“感谢每一位用户的信任与支持,大家的肯定、建议和期许,是我们不竭探索、持续进步的动力,也让我们始终坚守初心,专注于不懈的创新。
DeepSeek-V4预览版解析:百万上下文如何成为“标配”? DeepSeek-V4预览版解析:百万上下文如何成为“标配”? DeepSeek发布了V4预览版,并且同步开源。公告里有一句话,分量不轻: “从现在开始,1M(一百万)上下文将是DeepSeek所有官方服务的标配。” OpenAI和Go
据国外媒体报道,长期坚持自有资金研发的AI独角兽DeepSeek近日被曝开启首次对外融资,目标估值超过200亿美元。据悉,互联网巨头腾讯与阿里巴巴均在接洽中。 这事儿挺有意思。一家向来靠自有资金、走独立研发路线的明星公司,突然打开了融资的大门,而且一开口就是超过200亿美元的估值。腾讯和阿里这样的巨
曝两家科技大厂争投DeepSeek 智东西4月22日消息,一则来自外媒The Information的报道,搅动了国内AI创投圈的一池春水。据四位知情人士透露,腾讯与阿里巴巴这两大科技巨头,正在就投资DeepSeek进行洽谈。要知道,就在上周,这家备受瞩目的AI公司才首次被曝出启动外部融资。 与潜在
保险AI的“隐形黑手”:当算法成为拒赔利器 最近一份来自美国科技媒体Digital Trends的行业调查,揭示了一个趋势:全球超过六成的大中型保险公司,已经把AI系统用到了核保风控、理赔核查这类核心业务上。效率提升的另一面,是随之而来的公正性质疑。美国消费者权益组织2024年的调研数据就点明了问题
热门专题
热门推荐
HTML中的dialog标签怎么用? 很多开发者第一次接触 标签时,都会有个美丽的误会:以为把它写进HTML,页面就会自动弹出一个对话框。其实不然,这个标签的默认状态是“隐藏”的。你可以把它想象成一扇关着的门——写了标签只是造好了门框,想让门打开,你得要么手动加上 open 属性,要么用Ja vaS
本文介绍如何在基于 CSS 媒体查询和 checkbox 的响应式导航菜单中,通过重构 HTML 结构并结合轻量 Ja vaScript,实现点击汉堡图标展开菜单、再点击右上角“×”按钮即时收起的功能,解决纯 CSS 方案无法主动关闭的问题。 你是否遇到过这样的场景?在移动端,用户点击汉堡图标打开了
如何用 Array prototype entries 配合 for of 在遍历数组的同时获取索引和值 entries() 返回的是什么类型的迭代器 先说清楚一个核心概念:Array prototype entries() 返回的,是一个标准的数组迭代器对象。这意味着,每次调用它的 next(
伊朗驳斥特朗普所谓“分裂内斗”论调:美方言论被指为心理投射 近日,围绕伊朗国内局势的表述,美伊之间再次上演了一场外交言辞交锋。这场对话的焦点,似乎已悄然发生了转移。 谈判重心的转向与核心关切的明确 根据伊朗外交部发言人纳赛尔·卡纳尼的表态,一个关键信号已经释放:当前伊美谈判的重心,已不再局限于核问题
真正复古的CRT效果需叠加扫描线与亚像素抖动:用repeating-linear-gradient生成2px间距、rgba(0,0,0,0 08)透明度的黑色条纹层,并配以transform: translateX(0 5px) translateY(-0 3px)和steps(1)动画,辅以bac





