首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
DeepSeek沉寂五个月后用户期待哪些新功能与突破

DeepSeek沉寂五个月后用户期待哪些新功能与突破

热心网友
18
转载
2026-05-12

关于DeepSeek的讨论,正从最初的技术惊叹,转向更为具体和复杂的审视。市场在问:这家曾以一己之力定义“中国技术理想主义”的公司,能否在沉寂近五个月后,再次证明其技术领导力?它庞大的技术势能,又该如何转化为可持续的商业营收?更进一步,在国产算力生态尚不完善的当下,它能否成为那个用国产AI芯片训练出顶尖模型的“破局者”?

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

四月初,外媒The Information传出消息,称DeepSeek V4或于四月下旬发布,并可能率先支持华&为新一代AI芯片昇腾950PR。随后,该媒体又报道DeepSeek正寻求首轮外部融资,估值不低于100亿美元。尽管这些消息均未得到官方证实,且据《财经》从相关资本机构了解,其估值与融资规模信息并不准确,但每一次传闻都能引发市场的广泛关注与讨论,这本身已成为一个值得玩味的现象。

与频繁发声、高歌猛进的同行们不同,DeepSeek显得异常沉默。自2025年12月1日发布DeepSeek-V3.2后,这家公司已有近五个月没有推出新模型。相比之下,从2025年12月初到2026年4月20日,中美主流11家模型公司至少发布或迭代了50款模型,平均每2.8天就有一款新品问世。DeepSeek的发布节奏,在主流厂商中几乎是最低的。

沉默带来的是性能排名的滑落。那个在2025年初凭DeepSeek-R1惊艳全球、几乎追平当时OpenAI o1的“挑战者”,其最新版本V3.2在多项基准测试中已不再领先。如今,它正站在一个十字路口:是继续坚持研究驱动的低频创新,还是转向更高频的产品迭代与商业化,以应对白热化的市场竞争?

性能光环的褪色与市场份额的韧性

近五个月的“空窗期”,直接反映在性能榜单上。根据Artificial Analysis截至4月20日的测试,DeepSeek-V3.2的综合性能、代码生成(Coding)性能和智能体(Agent)性能,分别位列全球第16、17和15名,落后于OpenAI、Anthropic、谷歌,以及国内的阿里、月之暗面、智谱等公司的旗舰模型。

更关键的是,2026年模型竞赛的焦点已从纯文本推理转向了智能体(Agent)能力,而代码生成能力正是智能体的核心引擎。代码能力的强弱,直接决定了智能体任务的成功率、执行效率和Token消耗成本。在这个新赛道上,DeepSeek-V3.2与头部模型的差距被迅速拉大。行业内的反馈也印证了这一点:前沿开发者在处理高要求的代码或Agent任务时,若不计成本会首选OpenAI或Anthropic;追求性价比则会考虑月之暗面、智谱等国产模型;DeepSeek-V3.2更多被用于对价格敏感、或纯文本对话的场景。

然而,一个有趣的反差是:尽管性能不再领先,DeepSeek的市场份额却依然稳固。在全球开发者平台OpenRouter上,DeepSeek-V3.2的月调用量长期位居全球前五,截至4月20日仍以5.35万亿Token的消耗量排名第三。其市场份额在近五个月内稳定在5%-10%之间。

这份韧性从何而来?答案在于其极致的性价比和彻底的开源策略。DeepSeek-V3.2每百万Tokens的输入/输出价格仅为0.28/0.42美元,是许多国产模型的10%-30%,更是国际巨头旗舰模型的2%-5%。更重要的是,它采用最宽松的MIT开源协议,允许任何形式的商业使用与修改,像种子一样在全球开发者社区中生根发芽。OpenRouter数据显示,不仅V3.2,连2025年发布的V3和R1等旧版本至今仍被广泛使用,它们被集成在各类新兴的Agent工具和AI角色扮演应用中。

这种开源生命力甚至重塑了全球AI市场的区域格局。微软的报告指出,DeepSeek在北美、欧洲采用率不高,但在中国、俄罗斯及许多非洲国家份额快速增长,在俄罗斯的份额甚至高达43%。它正在成为发展中国家降低AI使用门槛、培育下一批十亿级用户的关键推动力。

商业化:克制与观望背后的现实

庞大的市场份额并未转化为清晰的商业收入。DeepSeek被外界视为中国大模型创业公司中,唯一一家放弃“既要又要”、始终专注于研究与开源路线的“异类”。当所有同行都在用巨额亏损换取增长时,DeepSeek的商业化步伐显得异常克制。

目前,其公开的商业化路径仅限于通过官网API调用收费,并未设置App订阅或Token套餐。然而,这条路径本身也充满挑战:开发者完全可以通过其他算力服务商,甚至自行在云端免费部署开源的DeepSeek模型。其开源策略如同一把双刃剑,虽然快速占领了市场,但也意味着主流云厂商部署其模型时,DeepSeek可能无法获得直接收入。

市场密切关注其融资动向,正是因为一旦启动融资,意味着这家公司可能不得不将投资者回报提上日程,大规模商业化或将随之而来。尽管有高管在内部会议中透露“已初步验证找到了一些路径”,但具体是什么,外界仍不得而知。

环顾四周,无论是美国的OpenAI、Anthropic,还是中国的月之暗面、智谱、MiniMax,都已全面转向以产品和收入驱动增长的阶段。这些公司的收入正在快速增长,证明商业化与性能提升并非不可兼得。当然,商业化不等于盈利,上述几家明星公司目前仍处于大规模亏损状态。这或许也是DeepSeek保持克制的理由之一——在找到真正的商业正循环之前,冒进未必是上策。

国产算力的“天堑”与期待

除了商业化,市场对DeepSeek的另一重期待,落在了国产AI芯片上。传闻中V4将适配华&为昇腾芯片,这引发了更深远的猜想:它能否基于国产芯片完成从零开始的训练?

对于模型推理而言,适配国产芯片已是行业常规操作。但训练则是另一回事。这是一个极其复杂的系统工程,涉及数万枚芯片组成的集群、数周不间断的训练,以及芯片、网络、软件、电力散热等环节的精密协同。在万卡规模下,任何故障都可能导致训练中断,造成巨大的时间和算力浪费。

目前,中国主要模型公司的核心训练任务仍依赖于英伟达芯片。尽管谷歌用自研TPU、亚马逊用Trainium芯片成功训练出了顶尖模型,证明了非英伟达路径的可行性,但在国产芯片上,尚未有公开的、关于万亿参数规模且被大规模商用模型的完整成功案例。国产芯片在绝对性能、软件生态成熟度上仍落后主流产品两代以上,训练工程代价高昂。有企业尝试用某国产芯片复现英伟达芯片上的视觉模型,结果训练周期延长20%以上,综合成本翻倍。

正因如此,英伟达创始人黄仁勋才在近期的一次播客中直言,DeepSeek在华&为芯片上首发的那一天,对美国而言将是一个“可怕的后果”。他担心的是,一旦开源模型深度优化并绑定非美国技术栈,将威胁到美国AI生态的全球领导地位。

2025年初,中国市场的焦虑是“缺乏算力,模型能否追上”。到了2026年,这个问题的答案已经清晰——中国已不缺乏便宜好用的基础模型。新的焦虑变成了“能否用国产算力训练出顶尖模型,从而摆脱依赖”。

DeepSeek曾用2048张英伟达H800芯片和558万美元的成本训练出V3,这已被视为一次极限突破。如今,市场的期待情绪再次汇聚到它身上:它能否再次完成一次看似不可能的挑战,为国产AI芯片的模型训练蹚出一条可复制的工程路径?这已不完全是一家公司的技术选择,而是在特定时期,整个行业对一家特殊公司所寄托的特殊期许。

来源:https://36kr.com/p/3777437597586178
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

DeepSeek识图功能上线 多模态视觉理解开启灰度测试
业界动态
DeepSeek识图功能上线 多模态视觉理解开启灰度测试

就在DeepSeek-V4震撼发布并引发行业广泛关注的短短五天后,官方正式启动了多模态识图功能的灰度测试。这标志着其多模态能力已从概念走向实践,进入了实质性的应用验证阶段。无论是移动端App还是网页版界面,输入栏都悄然新增了一个“识图模式”入口,旁边清晰地标注着“图片理解功能内测中”。这一步,完成了

热心网友
05.12
Mac效率神器DeepSeek与Raycast组合键使用指南
AI
Mac效率神器DeepSeek与Raycast组合键使用指南

想在Mac上实现超越系统原生的智能工作体验吗?让AI的思考能力无缝融入你的每一次搜索、每一次快捷键操作,甚至能“理解”你当前的工作上下文?这听起来充满未来感,但通过将DeepSeek模型与效率神器Raycast深度整合,你完全可以在本地构建一套灵活、强大且注重隐私的自动化解决方案。 一、安装并配置R

热心网友
05.12
DeepSeek V4注意力机制革新实现百万字文本高效压缩
AI
DeepSeek V4注意力机制革新实现百万字文本高效压缩

注意力机制正从追求“算得更快”转向“算得更少”。DeepSeekV4通过有损语义融合技术,将长文本压缩为少量概念块,结合全局略读与细节精读,显著降低了计算与显存开销。同时,通过向量加厚、分组输出投影等补偿机制缓解信息丢失,在效率与工程可行性上展现出优势。

热心网友
05.12
DeepSeek与美团LongCat破万亿参数模型释放了哪些行业信号
业界动态
DeepSeek与美团LongCat破万亿参数模型释放了哪些行业信号

近期DeepSeekV4与美团LongCat-2 0-Preview发布,参数均超万亿并支持长上下文。DeepSeekV4成功迁移至华为昇腾,美团全程基于国产芯片训练。这标志着国内AI企业正从依赖国外生态转向自主构建算力底座,通过底层创新攻克硬件适配、软件生态及集群稳定性等难题,推动国产大模型从“能用”向“好用”演进。

热心网友
05.12
苹果M4芯片运行DeepSeek R1速度实测抢先看
AI
苹果M4芯片运行DeepSeek R1速度实测抢先看

在苹果M4芯片上运行DeepSeek R1模型,Qwen2 5-14B-Instruct-4bit(MLX引擎)性能表现最佳,生成速度达到28 tokens s、首token延迟仅0 4秒、内存占用18 7GB;其他版本性能依次为:Unsloth优化6bit版(27 tokens s)、蒸馏4bit

热心网友
05.12

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

耀客传媒AIGC短剧秦岭青铜诡事录上线 AI艺人首次担纲主演
业界动态
耀客传媒AIGC短剧秦岭青铜诡事录上线 AI艺人首次担纲主演

2026年4月15日,一部名为《秦岭青铜诡事录》的短剧正式上线播出。这部剧集的独特之处在于,其两位主演并非真人演员,而是由耀客传媒自主研发的AI数字人演员。这标志着AIGC技术在国产影视剧制作中的应用,实现了从“辅助工具”到“内容主体”的关键跨越。 该剧剧情充满奇幻悬疑元素,核心故事围绕秦岭矿区一桩

热心网友
05.12
5年期日本国债收益率创历史新高 对全球债市影响几何
web3.0
5年期日本国债收益率创历史新高 对全球债市影响几何

5月12日,日本5年期国债收益率升至1 915%的历史新高,反映市场对其货币政策走向的重新定价。收益率上升通常源于利率预期改变,可能预示投资者正消化未来央行调整超宽松政策的可能性。这一变动会影响全球资本流动与外汇市场,为全球宏观投资增添新的观察变量。

热心网友
05.12
韩国拟用AI产业超额利润发放全民红利 存储技术成关键
业界动态
韩国拟用AI产业超额利润发放全民红利 存储技术成关键

韩国政府拟设立“公民红利”机制,将人工智能产业超额利润以现金或消费券等形式分配给全体国民。政策室长金容范表示,AI收益依托国家产业基础,应由全民共享,避免过度集中于少数企业与个人。资金计划来自超额税收,而非直接抽取企业利润,旨在让民众直接获益。

热心网友
05.12
加拿大降低中国电动车关税 奇瑞路特斯加速北美市场布局
业界动态
加拿大降低中国电动车关税 奇瑞路特斯加速北美市场布局

2026年5月,北美汽车市场迎来关键转折点。自年初起,加拿大政府将中国产电动汽车的进口关税从100%大幅调降至6 1%。这一重大政策调整正迅速重塑市场格局,如今,首批来自中国品牌的纯电动及插电混动车型已成功登陆加拿大,开启了全新的竞争篇章。 社交媒体上的实拍视频提供了有力佐证:在加拿大多伦多的停车场

热心网友
05.12
CleanSpark一季度财报:比特币持仓价值9.25亿美元,净亏损3.78亿美元
web3.0
CleanSpark一季度财报:比特币持仓价值9.25亿美元,净亏损3.78亿美元

CleanSpark第一季度营收1 364亿美元,同比下降约24 9%。净亏损达3 783亿美元,较去年同期显著扩大。公司持有现金2 603亿美元,所持比特币总价值达9 252亿美元。总资产29亿美元,总负债19亿美元,股东权益为10亿美元。

热心网友
05.12