DeepSeek三天两发故障透露信号:V4版更新在即?
今天傍晚,DeepSeek再度出现服务异常,社交平台上不少用户反馈,对话过程中频繁遭遇“请检查网络后重试”或“服务器繁忙”等提示。目前,服务已恢复正常。


这是三天之内DeepSeek第二次发生服务故障。上周日,平台曾经历上线以来最长的一次中断。
3月29日晚9点35分起,大量用户发现DeepSeek无法发起新对话,已有对话频繁中断,屏幕上反复弹出“服务器繁忙”的提示。当晚11点23分,系统曾短暂恢复,但不到1小时再度崩溃。技术团队随即启动二次修复,直至次日上午10点33分才宣布故障排除。
整个过程持续时间近12小时,波及网页端与App端,修复过程也一波三折。相关话题迅速登上微博热搜引发热议,在海外开发者社区里同样炸开了锅。公开记录显示,DeepSeek网页端此前从未出现超过2小时的服务中断。
这两次宕机,恰逢DeepSeek模型更新周期的敏感节点。近期,关于DeepSeek V4的基准测试数据已在业内流传,坊间传言的发布时间也已多次推迟。
有技术观察人士猜测,DeepSeek近日服务不稳,可能与它正处于“临发布状态”有关。频繁的服务器压力测试、底层架构调整与新模型部署等,都有可能引发服务波动。

还有细心的网友发现了一些“蛛丝马迹”。比如有海外开发者在Zero-shot编码测试中注意到,DeepSeek当前的输出结构比前几天更加清晰,逻辑严谨程度大大提升;也有网友发现,DeepSeek在Web应用程序中进行了升级,输出效果改善明显;还有网友观察到,App端的上传按钮界面进行了更新,而类似这种细微变化,通常预示着后端架构正在或即将经历大幅调整。
虽然V4尚未正式发布,但DeepSeek团队这段时间并没有闲着。过去几个月,DeepSeek接连与北京大学、清华大学合作发布了多篇重磅论文,提前“剧透”了V4的关键技术方向。
1月,由梁文锋署名的论文提出Engram“条件记忆”模块,解决了Transformer的记忆难题。这种将固定知识从Transformer中剥离出来的全新机制,让模型不再需要用昂贵的计算去“死记硬背”,而是通过近乎O的查表操作快速获取知识。

紧接着2月,DeepSeek又发布了DualPath推理框架,专门解决模型在多轮对话场景下越聊越慢的问题。通过一套巧妙的加载机制,这套框架把离线推理的吞吐量提升了近两倍,在线服务的吞吐量也几乎翻了一番,而这一切仅靠软件优化实现,不增加任何硬件成本。
这两项技术突破,一个指向模型架构层面的“记忆与计算分离”,一个指向推理系统层面的“I/O瓶颈突破”,恰好构成了V4从算法到底座的两大技术支柱。
市场和网友们对DeepSeek新版本的期待,并非没有缘由。作为一度搅动大模型价格战的“价格屠夫”,DeepSeek此前以极具竞争力的定价策略,大幅降低了开发者调用大模型的门槛。
在算力成本仍是行业核心痛点的当下,大家渴望DeepSeek能够再次带来成本更低的Token,让更为高效且廉价的大模型能力,惠及更多开发者和应用场景。
橙柿互动·都市快报记者 童蔚
审核 张倩 陈欣文
校对 陈洁珍
相关攻略
亚马逊按下“重启键”:下一代Alexa能否重夺AI语音王座? 科技圈又有新动静了。就在今天,亚马逊发出了人工智能主题活动的邀请函,时间定在2月26日。多方信源,包括路透社的报道均指向一个焦点:亚马逊计划在此次活动上,正式推出其下一代、基于生成式人工智能的Alexa服务。 话说回来,自2014年面世以
派欧算力云产品介绍 人工智能的浪潮正席卷各行各业,企业和开发者们面临一个共同的挑战:如何快速、经济且高效地获取AI算力,将创意迅速转化为市场产品?面对这一需求,一站式AI云服务平台——派欧算力云,提供了颇具吸引力的答案。本文将带你深入剖析派欧算力云的核心功能、独特优势以及应用路径,看它如何为企业的A
京东开源图像模型JoyAI-Image-Edit,从平面修图升级为三维空间重塑 4月7日,京东探索研究院正式宣布,开源自研的JoyAI-Image-Edit图像模型。这不仅是又一个开源工具,更标志着图像生成编辑技术的一次关键转向:从二维平面迈入了三维空间。 简单来说,这个模型被设计为业内首个将“空间
Anthropic启动Project Glasswing计划,集结科技巨头共筑软件安全防线 近日,人工智能公司Anthropic启动了一项名为“Project Glasswing”的新计划。这项计划的核心目标,是借助其尚未公开发布的Claude Mythos Preview模型,来加强全球关键软件基
就在 OpenAI 都停了 Sora,所有人以为 Seedance 2 0 要一统天下的时候,没想到不知哪里冒出来一匹马。 周二晚间,在知名 AI 评测分析平台 Artificial Analysis 上,一个代号为「HappyHorse-1 0」的神秘视频生成模型空降榜首,引发了 AI 社区热议。
热门专题
热门推荐
机器人行业迎来里程碑式突破。以视频生成模型Vidu著称的生数科技,正式发布了名为Motubrain的“世界动作模型”。这并非一次普通迭代,而是被定位为机器人的“物理大脑”,其核心目标在于:用一个统一的通用模型,彻底取代以往依赖多个专用系统拼凑而成的复杂架构。 正如其“一个大脑,无限可能”的口号所揭示
xAI正式进军AI编程智能体领域,于近日发布了专为软件工程与复杂编程任务设计的Grok Build。 简单来说,Grok Build是一款能在终端里直接跑起来的AI编程助手。它被定位为一个具备智能体能力的命令行工具,开发者用自然语言告诉它要做什么,它就能生成代码,甚至帮你搞定一系列编程和自动化任务。
近日,谷歌对其搜索引擎的核心规则进行了重要更新,此次调整直指当前备受关注的AI搜索领域。具体而言,谷歌在其垃圾内容政策中新增了明确条款,正式将“操纵AI搜索结果”的行为列为违规操作,划定了新的质量红线。 根据权威行业媒体Search Engine Land的报道,本次谷歌算法更新的核心在于,将任何企
硅谷的科技巨头们或许曾以为,自己已经远离了AI数据中心带来的电力压力——毕竟,高昂的地价和电费早就把大型数据中心项目“赶”到了别处。但现实总是出人意料,这场能源危机的涟漪,正悄然涌向他们心爱的度假后院。 没错,说的就是太浩湖。这个湾区精英们钟爱的避世天堂,如今正站在一场电力风暴的边缘。距离它必须找到
这项由高通AI研究院(Qualcomm AI Research)主导的创新研究于2026年5月正式发布,论文预印本编号为arXiv:2605 07721。 研究背景:当AI越想越费内存,我们该怎么办 设想一下,手机导航应用会在出发前规划好整条路线,而一位真正智慧的向导则会边走边思考,遇到路障时灵活应





