游乐游手机版
首页/科技数码/文章详情

DeepSeek上桌吃饭:全村人都在等的AI助手来了

时间:2026-03-07 09:01
上个周末,包括英国《金融时报》在内的一些外媒报道称:DeepSeek V4将在本周一(3月2日)发布。还有报道宣称,V4将针对国产芯片进行优化,是该系列大模型当中第一个完全基于国产算力生态的云云。这

上个周末,包括英国《金融时报》在内的一些外媒报道称:DeepSeek V4将在本周一(3月2日)发布。还有报道宣称,V4将针对国产芯片进行优化,是该系列大模型当中第一个完全基于国产算力生态的云云。这一消息很快被大量国内媒体转载,大家都期待着V4早日露出真容——可是什么都没有发生。

大家盼望DeepSeek V4发布,已经有一个多月了。之前很多人预测它将于春节期间发布,不过也有消息称,春节还太早了一点。其实,春节期间,豆包、千问、GLM……等竞争对手争先恐后地发布新版本,在一定程度上可以视为对DeepSeek的一种“预防性竞争行为”:只要V4发布,其光芒就会过于强大,遮盖一切竞品;所以竞品必须赶紧也拿出高水平的新版本才行。

春节前不久,DeepSeek做了一次更新,扩大了上下文窗口,并一度被误传为“V4已经开始灰度测试”。那段时间,我的朋友圈到处有人在问:“你被V4灰度到了吗?怎么拿邀请码?”事实证明那次更新并不是V4,虽然被广泛称为"V4Lite",但毕竟不是正式版V4;它的跑分处于国产大模型的第一梯队,但更新尚未达到让人眼睛一亮的程度。

我在AI圈的朋友,普遍对DeepSeek V4仍然抱有很大希望,其原因有二:

从梁文锋署名的一系列论文看,DeepSeek团队在基础研发方面是有想法的,正在力图进行创新,其站位高于大部分大模型创业团队;

今年1月底,梁文锋曾颇有自信地预告过不久后的新版本,“根据他的性格,没有把握的事情是不会事先宣传的”。

从DeepSeek团队发表的论文看,最近一段时间它的研发似乎聚焦于两个方向:一个是编程,一个是多模态。前者非常自然,因为AI编程是发展最快、成熟度最高的大模型应用,今年以来发布的Claude Code with Opus 4.6以及ChatGPT-5.3-Codex再次刷新了AI编程的上限。这是一条已经被证实的坦途,DeepSeek的前几个小版本在这方面进步也很大,V4再次取得巨大进展是可以理解的。

后者则是在补齐软肋——DeepSeek迄今最大的弱点就是没有多模态功能,这一点不但限制了它的C端应用,而且限制了它的B端应用。因为B端收入的来源是客户对Token的消耗,多模态的Token消耗比传统的文本生成高了一个、甚至好几个数量级。不久前Seedance 2.0的发布,再次证明了优秀的多模态大模型具备多高的用户基础和商业潜力。从已发表的论文看,DeepSeek肯定不满足做一个“文生文”大模型,已经在多模态方面下了不少工夫。

现在全村人都在等着DeepSeek V4上桌吃饭了,究竟什么时候才能真正开饭呢?我认为,这里有一个非常重要的因素:V3/R1是当时全世界最出色的开源大模型,尤其在推理成本控制方面取得了巨大进展,所以震惊了世界;此时此刻,V4必须也成为全世界最出色的开源大模型(至少是之一),才能再次震惊世界。这是成功者必须面临的问题:成功的标杆越抬越高,每一次的挑战都更大。

还有一个重要因素:当初震惊世界的主要是R1,也就是深度推理大模型。如果没有深度推理功能,至少对于一般用户而言,DeepSeek不会显得那么特殊。假设DeepSeek先推出“普通版本”的V4,过一段时间再推出“深度推理”的R2,市场是否会觉得解渴?当然,有一种更稳妥的方式,就是同时推出V4和R2,不过这需要更多的资源,对于一家仍处于创业级别的公司而言,未必合适。我相信,在决定新版本大模型上线节奏的时候,DeepSeek团队肯定考虑到了上述全部因素。

还有一个问题:大模型开发,比拼的既是基础研发,也是工程执行。我们目前能看到的公开信息,主要是基础研发层面的,例如DeepSeek团队发布的学术论文;我们对于背后的工程课题、工程瓶颈,知之甚少。迄今为止,关于DeepSeek新版本训练过程的一切媒体报道,其实都是捕风捉影,没有得到最新的任何承认,也缺乏第三方信源参考。举个例子:谷歌在大模型基础研发方面一直保持领先,但是在Bard以及Gemini早期,工程执行方面犯下了很多错误,直到2024年下半年才赶上来。如果DeepSeek过去一段时间致力于解决一些工程环节的细节问题,我不会感到奇怪。

假设DeepSeek V4真的像英国《金融时报》报道的那样,全面拥抱国产算力体系的话,在工程方面的挑战就更大了。要知道,哪怕同样是在英伟达框架之内,硅谷大厂把训练任务从Hopper架构转向Blackwell架构,也需要花一段时间;何况是在两个完全不同的框架之间调整?这样的工程问题注定难以在短期内得到解决,能解决就不错了,无法强求。

但是,需要强调的是:目前关于V4训练细节的报道,无论来自外媒还是国内媒体,基本都是根据间接渠道的猜测、整合,从未得到最新的任何认可。真正的训练细节,只有在新版本发布的那一刻才会被外界得知,而且也不可能是全部细节。只能说:一切皆有可能,但不是每种可能性都值得现在就讨论。

话说回来,哪怕在长达一年多没有大版本更新(中间有2-3次小版本更新)的情况下,而且是在极少做市场活动的情况下,DeepSeek APP的MAU仍然超过1亿,在国内AI应用中位居第四或第五名,哪怕是在春节期间砸了重金的元宝也无法超过它(这在一定程度上要感谢V4Lite的更新)。假如现在推出V4,那么DeepSeek仍然有希望一波冲到全国AI前三的水平;假如再晚一些,就不好说了,因为互联网大厂围绕AI的军备竞赛愈演愈烈,DeepSeek在今年面对的竞争密度远高于去年,国内如此,国外也是如此。

不管怎么说,既然市场上频繁传出“DeepSeek V4即将发布”的消息,至少说明新版本发布已经不再遥远了。我非常希望能尽快看到V4,因为迄今为止,DeepSeek仍是我使用频率最高的四个大模型之一(另外三个是GPT、Gemini、Grok),也是我使用频率最高的国产大模型。我一定会在发布之日立即尝试,并且询问AI圈的朋友的使用体验。希望我们都不会失望!

本文没有得到DeepSeek或其任何竞争对手的资助或背书。

来源:https://www.tmtpost.com/7902250.html
上一篇全国人大代表、中国移动董事长楼向平:构建统一绿色电力凭证体系 下一篇GPT-5革新上线:三巨头竞逐升级,重塑AI大模型格局
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个