DeepSeek V4下周上线!原生多模态架构技术报告同步公开
据金融时报近日消息,DeepSeek即将在下周正式推出其最新一代大模型V4。

据知情人士透露,这是一款具备图像、视频和文本生成能力的多模态模型。在硬件适配方面,DeepSeek将为国产算力提供深度支持,致力于优化V4模型以适配中国制造的芯片,此举有望提振中国市场对半导体产品的需求,并加速AI模型推理环节向本土芯片靠拢。
一位直接了解相关计划的人士透露,DeepSeek预计在发布V4版本的同时,会发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。
V4会有哪些亮点?
截至发稿,DeepSeek尚未对V4的任何信息进行正式回应或确认,所有信息均来自媒体爆料,详细信息多集中在正在进行秘密测试的简化版本V4 Lite上。据悉,关于V4 Lite:
其代号为"sealion-lite",拥有100万个tokens的上下文窗口,相比V3系列的128K有近8倍提升,理论上可一次性处理如《三体》全集体量的长文本;
采用原生多模态架构,意味着模型从预训练阶段就将文本与视觉理解融合,而非后期拼接;
V4 Lite参数规模估算为2000亿,另有推测认为完整版V4参数量可能突破1万亿;
效果显著优于网页端/APP端模型;
泄露的测试示例显示,V4 Lite能用极简代码生成高质量的SVG图像,在代码优化和视觉还原度上被认为超越了DeepSeek V3.2、Claude Opus 4.6等模型,这暗示了其空间推理和结构化输出能力的提升。
回顾DeepSeek的模型迭代之路
DeepSeek已"蛰伏"超一年,其上次重大更新——R1发布于2025年1月20日。
回顾DeepSeek的模型迭代历程,该公司的优化路径十分清晰——提升推理能力、平衡模型性能与推理效率,为大模型"降本"。
DeepSeek已发布的主要模型是两条技术路线的代表:追求综合性能的V系列"全能助手"和专注于复杂推理的R系列"解题专家"。
2024年5月,DeepSeek V2发布,被视为DeepSeek的重大突破,其研究团队提出了多头潜在注意力机制,大幅降低推理时的显存占用和成本,以极低的推理费用出圈,确立了混合专家模型的技术路线。
2024年12月推出的V3是DeepSeek的重要里程碑,其高效的MoE架构确立了强大的综合性能基础。此后,V3系列通过小版本更新不断打磨,持续提升用户体验和模型Agent能力。
其中,2025年8月发布的DeepSeek-V3.1,是一个里程碑式的更新,将V3和R1的能力融合到一个模型中,支持思考模式和非思考模式的自由切换,在SWE-bench等基准上比前代提升超40%;2025年12月推出的V3.2,是DeepSeek将深度思考与工具使用无缝融合的版本,推理能力达到GPT-5水平,在H800集群上,128K序列长度的推理成本显著降低:预填充阶段每百万token成本从0.7美元降至0.2美元,解码阶段从2.4美元降至0.8美元,这一定价使其成为当时同级别模型中长文本推理成本最低的选择之一。
2025年1月发布的R1,是其首代专用推理模型,证明通过大规模强化学习能激发模型的推理能力,通过强化学习,该模型在解决数学问题、代码编程等复杂推理任务上表现卓越,并首创了"深度思考"模式,性能对标OpenAI强模型o1,但推理成本仅为约560万美元不到其十分之一。
可以看出,在大家等待V4期间,DeepSeek一直没有停下脚步,另外,其在多模态能力上的布局比V4更早。从技术演进来看,DeepSeek早在2024年的V3系列和2024年的V2版本中就已经开始布局和实现多模态能力。2025年初发布的Janus系列更是专门的、功能强大的多模态模型。
相关攻略
新智元报道编辑:Aeneas【新智元导读】13小时至暗停摆,一夜「断供」引发全网哀嚎……DeepSeek史上最长宕机震惊了全球,种种迹象表明,V4或已悄然登场,泄露的基准测试显示,或许这就是国产大模
3月31日消息 清明祭祀用品年年翻新,如今更是紧跟潮流,被商家玩出了全新花样。临近清明节,有网友逛电商平台发现,有店铺上架了脑洞十足的AI 纸扎全家桶,还复刻出OpenClaw、DeepSeek、C
DeepSeek又上热搜了。这次不是因为发布了什么新模型,而是因为——它崩了。整整8个小时,写论文的学生、玩角色扮演的网友、深夜找AI吐槽的打工人,全部集体失联。社交媒体上哀嚎一片,有人甚至开玩笑说
3月最后一周,全球两大“明星”AI接连响起警钟。3月29日深夜,DeepSeek突发大规模服务中断,网页端与App同时瘫痪,频繁显示“服务器繁忙”,故障持续超过11个小时,创下成立以来单次故障最长纪
来源:环球时报【环球时报报道 记者 李迅典】3月29日晚至30日上午,国内主流大模型平台DeepSeek经历了一场大规模服务中断。从29日22时开始,网页端与App全面卡顿,频繁弹出“服务器繁忙”提
热门专题
热门推荐
华硕联席CEO许先越:苹果MacBook Neo冲击PC生态圈,定位“笔记本形态iPad” PC行业最近又迎来一个重磅话题。科技媒体PCMag日前报道称,在近期的财报电话会议上,华硕联席CEO许先越发表了一个引人瞩目的判断:苹果推出其最便宜的MacBook Neo笔记本,对整个PC行业而言,无疑是一
安伯尼克 Anbernic RG VITA 系列掌机规格揭晓:紫光展锐 T618 瑞芯微 RK3576 芯片 安伯尼克 Anbernic 于昨日通过视频,正式揭开了RG VITA及VITA Pro两款掌机的详细规格面纱。对于关注掌上游戏设备的玩家来说,这波参数放送,信息量着实不小。 具体两款机型
在龙族卡塞尔之门的战场,皇女零的阵容搭配艺术 想在《龙族卡塞尔之门》的战场上最大化皇女零的威力?阵容的搭配可是一门学问。她自身无疑是核心的输出利器,但要让这把利刃发挥极致,就得围绕她构建一个既能稳固防守、又能创造绝佳输出时机的团队。 核心角色选择:强攻与辅佐的默契 皇女零的定位清晰——核心输出。因此
XRP ETF:2025 年的最新发展 如果说2024年是比特币和以太坊ETF的“破冰之年”,那么2025年的聚光灯,无疑转向了XRP。随着现货比特币和以太坊ETF成为主流金融机构的标准配置,全球市场的目光正聚焦于下一个可能爆发的领域:XRP及其各类交易所交易基金(ETF)。从基于期货的美国产品到已
飞读小说APP:三步“读心术”,精准找到你的下一本心头好 面对海量书库,如何在飞读小说里高效率地挑出那本合胃口的好书?这事说难也简单,关键在于摸清楚平台的推荐逻辑和筛选工具。今天,我们就来把这套“选小说”的实用方法论,给你讲明白。 飞读小说app小说选择方法: 第一步,精准定位你的“阅读舒适区”。打





