首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

热心网友
84
转载
2026-04-20

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

4月下旬的脚步越来越近,整个AI圈的目光都聚焦在DeepSeek V4大模型的发布上。就在昨天,该公司研究人员突然更新了DeepGEMM算子库,这个动作被外界普遍视为V4发布前的关键信号。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

比预期还要高60% DeepSeek V4参数量有望达到1.6万亿

有意思的是,官方显然预判了市场的反应。更新之后,他们特意附加了一条说明,强调这次更新只与DeepGEMM的开发相关,与内部模型的发布计划无关——言下之意很明确:大家先别急着联想,这可不代表V4马上就要来了。

但话说回来,越是这样的“澄清”,往往越会勾起大家的好奇心。原因很简单,这次DeepGEMM的更新亮点实在太多,要说跟V4大模型完全没关系,恐怕很难让人信服。

具体来看,除了新增对FP8_FP4混合算子的支持,以及优化了对NVIDIA Blackwell架构的适配,这次升级在架构层面的两大重点,是Mega MoE和HyperConnection。尤其是Mega MoE,它很可能意味着MoE架构将迎来一次重量级的进化。

Mega MoE的优势,技术社区已经讨论了不少。从Gemini的解析来看,V4激活的专家数量,很可能从V3的256个大幅跃升至数千个。这意味着什么?模型的性能将获得极大提升,同时又能保持灵活性,不会对算力和显存提出过于夸张的要求。

更关键的一点在于,DeepGEMM的这次更新,还隐约透露了V4大模型的参数量级。根据网友的推算,单层MoE的参数大约在253.7亿左右。如果保持60层的设计,那么V4大概率会是一个1.6万亿参数的庞然大物;即便保守估计,采用48层设计,参数量也能达到1.25万亿。

对比之前“V4将是万亿参数模型”的传闻,1.6万亿这个数字,意味着参数量比预期足足高出60%。如果成真,其性能表现绝对值得所有人拉高期待。

退一步讲,即便最终实现的是1.25万亿参数,那也已经是当前V3模型(6700亿参数)的近两倍。再加上Mega MoE技术带来的数千个激活专家,这无疑将是一次彻底的蜕变,很可能成为改变MoE架构大模型发展轨迹的里程碑事件。

来源:https://www.techweb.com.cn/it/2026-04-17/2974411.shtml
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Rewatch AI
AI
Rewatch AI

Rewatch AI是什么 提起开会,很多人都会感到头大——内容记不全,要点理不清,后续跟进更是容易丢三落四。Rewatch AI的出现,恰恰瞄准了这个普遍痛点。这是一款由Rewatch公司开发的AI辅助会议管理工具,核心目标很明确:把团队从繁琐低效的会议事务中解放出来,真正提升生产力。 它究竟怎么

热心网友
04.20
Swyft AI
AI
Swyft AI

Swyft AI是什么 简单来说,Swyft AI就是销售团队背后的“自动化管家”。由Swyft公司开发的这款工具,瞄准了一个普遍痛点:那些耗费销售大量时间的琐碎手动操作。它能够智能地自动化各种与收入相关的动作,比如,直接从你和客户的谈话录音里,提取关键信息并更新到CRM系统里。整个过程不需要人工介

热心网友
04.20
OGBRAIN.AI
AI
OGBRAIN.AI

OGBRAIN AI是什么 在加密货币市场这片信息海洋中航行,一套可靠的导航系统至关重要。今天要介绍的OGBRAIN AI,正是这样一个由专业团队打磨的加密货币数据智能平台。它整合了全面的市场数据与先进的分析工具,目标很明确:为投资者、交易者乃至所有加密爱好者,提供深度的市场洞察,让投资决策从“凭感

热心网友
04.20
Recaster AI
AI
Recaster AI

Recaster AI是什么 如果你在电商运营中,为海量产品图配上精准、又能吸引流量的描述而头疼,那么Recaster AI的出现,或许就是个转机。这款由Recaster团队打造的专属工具,核心目标很明确:帮商家从产品图片里“挖”出信息,并高效转化成针对搜索引擎优化(SEO)的高质量内容。它最大的便

热心网友
04.20
AI Tool Center
AI
AI Tool Center

AI Tool Center是什么 说到一站式AI工具集合,有个平台绕不开,那就是AI Tool Center。它由Creati ai开发,本质是一个AI工具的集散地,目标很明确:帮用户提升工作效率、激发创造力。你可别把它当成一个简单的工具列表,它更像一个精心策划的“智能工具箱”,里面囊括了从自动化

热心网友
04.20

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

HomeworkAI
AI
HomeworkAI

HomeworkAI是什么 如果说有一款工具,能帮你把从微积分到生物学的作业难题拆解得明明白白,那HomeworkAI肯定榜上有名。它不是什么简单的搜题软件,而是一个由专业团队打造的AI学习伙伴,核心目标就是为学生提供步步引导的详细解决方案。无论是为了减轻课业压力,还是为了真正吃透知识点,这个智能平

热心网友
04.20
Whatwide AI
AI
Whatwide AI

Whatwide Productivity是什么 简单来说,Whatwide Productivity是一个帮你“偷懒”的高效工具箱。它由Whatwide公司打造,专门服务于那些日常需要处理大量文档、图像、音频,并且追求高效协作的专业人士。它的核心可以概括为四大支柱:智能文档生成、便捷的图像编辑、精

热心网友
04.20
Mac怎么设置静音启动 Mac开机静音快捷键或命令方法【技巧】
系统平台
Mac怎么设置静音启动 Mac开机静音快捷键或命令方法【技巧】

Mac开机静音全攻略:五种方法,总有一款适合你 经典的Mac开机“Duang”声,是许多用户熟悉的开机仪式。但在某些需要安静的场合,比如深夜、图书馆或会议室,这声清脆的提示音可能就显得有些不合时宜了。如果你也希望自己的Mac在启动时能保持低调,那么恭喜你,方法不止一种。从最便捷的系统设置,到一劳永逸

热心网友
04.20
More Episodes
AI
More Episodes

More Episodes!是什么 剧终意难平,是许多剧迷的共同体验。而今天要聊的这款工具,正是为此而生——More Episodes!。它由开发者tosh打造,核心基于GPT-4技术,专攻一件事:为你那些早已完结、看似再无下文的心爱剧集,续写全新的虚构故事。 简单来说,你可以把它想象成一个“剧集复

热心网友
04.20
区块链与Polkadot关系_区块链与Polkadot的本质区别与联系说明
web3.0
区块链与Polkadot关系_区块链与Polkadot的本质区别与联系说明

在区块链技术飞速演进的今天,互操作性已成为制约行业大规模应用的关键瓶颈。传统的“单链”世界如同一个个信息孤岛,资产与数据难以自由流通。而Polkadot的出现,以其革命性的多链架构,正在从根本上重塑这一格局,为构建一个真正互联的Web3世界提供了全新的解决方案。 Polkadot多链架构:超越单链的

热心网友
04.20