首页 游戏 软件 资讯 排行榜 专题
首页
AI
华为盘古Ultra-MoE-718B V1.1开源:模型权重与技术细节公开下载

华为盘古Ultra-MoE-718B V1.1开源:模型权重与技术细节公开下载

热心网友
39
转载
2025-10-18

10月16日最新消息显示,今年9月,华为盘古718B大模型凭借其不堆数据、专注深度思考的训练策略,在SuperCLUE榜单上一路跃升至开源模型第三位,成为业界广泛关注的焦点。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

华为方面近期正式宣布,openPangu-Ultra-MoE-718B-V1.1 模型已在GitCode平台全面开源,相关模型权重与技术细节悉数公开。

硬件部署要求为:Atlas 800T A2(64GB,≥32卡),支持裸机或Docker两种部署方式。

该模型的特色功能之一是支持通过 /no_think 标记在快慢思考模式间自由切换,并能高效支持多轮工具调用。

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

据华为官方介绍,openPangu-Ultra-MoE-718B-V1.1 是基于昇腾NPU训练的大规模混合专家(MoE)语言模型,总参数量达到718B,激活参数量为39B。该架构创新性地融合了“快思考”与“慢思考”两种能力模式,从而实现更高效、更智能的推理与决策过程。

在9月最新发布的SuperCLUE榜单中,openPangu-718B 稳居开源模型总榜第三位,在数学推理、科学推理、代码生成六大核心维度均取得了优异成绩。特别值得关注的是,其在幻觉控制项上得分高达81.28,甚至超越了部分闭源头部模型,展现出其在输出可靠性方面的技术优势。

与上一版本 openPangu-Ultra-MoE-718B-V1.0 相比,V1.1在Agent工具调用能力方面有了显著提升,幻觉率进一步降低,模型的整体表现与稳定性也得到了全面提升。

华为此次采用了业界领先的Multi-head Latent Attention(MLA)、Multi-Token Prediction (MTP) 以及高稀疏比混合专家架构,并在此基础上引入多项创新设计,以实现更优的性能与训练效率:

Depth-Scaled Sandwich-Norm 与 TinyInit:通过改进层归一化结构和参数初始化方式,显著提升了模型训练的稳定性与收敛速度。

基于EP-Group的负载均衡策略:优化负载均衡损失函数,有效增强专家路由的分布平衡性,提升专家专业化与协同能力。

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

华为盘古 Ultra-MoE-718B-V1.1 正式开源并开放下载,模型权重与技术细节全面公开

本次开源的V1.1版本在多个关键维度上实现了显著提升:

综合能力优化:在MMLU-Pro、GPQA等高难度测评中,快慢思考双模式成绩全面超越V1.0;

幻觉率大幅降低:通过“批判内化”机制,幻觉率从V1.0的10.11%降至3.85%(快思考模式);

工具调用能力增强:升级ToolACE框架,在Tau-Bench等多工具协同任务中表现亮眼;

推荐Int8量化版本:显存占用减少约一半,吞吐提升达20%,精度损失不足1%。

附最新地址:

模型地址:
https://ai.gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1

Int8量化版本:
https://gitcode.com/ascend-tribe/openPangu-Ultra-MoE-718B-V1.1-Int8

来源:https://www.ithome.com/0/889/991.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

问界M8 Max增程版上市,36.98万元起售
编程语言
问界M8 Max增程版上市,36.98万元起售

网易汽车3月25日报道鸿蒙智行旗下家庭智慧旗舰SUV问界M8正式发布年度焕新版本,核心升级集中在智能驾驶感知硬件、外观配色及续航版本,同步推出问界M8 Max增程长续航版,最新起售价36 98万元,

热心网友
04.01
华为千亿研发投入的新高地:押注哪些前沿技术?
科技数码
华为千亿研发投入的新高地:押注哪些前沿技术?

“关山初度尘未洗,策马扬鞭再奋蹄。”在最新披露的2025年经营情况中,华为以一句略带进取意味的表述,为这一年的经营状态定调。3月31日晚间,华为在正式对外发布了2025年整体业绩情况。数据显示,20

热心网友
04.01
OPPO新机4月21日发布,全家桶与友商或同日亮相
网络安全
OPPO新机4月21日发布,全家桶与友商或同日亮相

4月21日OPPO将联合哈苏举办一场影像新品发布会,其中Find X9 Ultra和Find X9s Pro两款旗舰同台亮相,Pad Mini、Watch X3 Mini、Enco Clip2等新品

热心网友
04.01
华为WatchBuds 2四月上市,手表与耳机迎全面升级
礼仪与书信
华为WatchBuds 2四月上市,手表与耳机迎全面升级

【CNMO科技消息】4月1日,有数码博主爆料称,华为WatchBuds2将于本月正式上市。作为华为首款智能手表与无线耳机二合一产品的迭代款,WatchBuds2在延续创新设计的同时,对耳机与手表功能

热心网友
04.01
华为鸿蒙版龙虾/YU7+GT实车曝光,苹果拟用长江存储
网络安全
华为鸿蒙版龙虾/YU7+GT实车曝光,苹果拟用长江存储

今日要闻速览1、苹果拟引入长江存储为国行iPhone供货,破解韩系垄断2、TCL 与索尼收购案落地,成立合资公司 Bravia Inc3、华为鸿蒙手机能养龙虾了!小艺 Claw 开启众测4、Clau

热心网友
04.01

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

比特币重探7万美元,市场已全面消化美伊战争风险?
web3.0
比特币重探7万美元,市场已全面消化美伊战争风险?

清明节假期期间,A 股和港股休市,但比特币行情永不停歇。 4月6日,当多数市场还在假期中沉睡时,比特币已经悄然启动。价格从亚洲早盘的低点67400美元出发,一路向上试探,盘中最高涨破70300美元,不仅刷新了3月26日以来的高位,较日内低点的涨幅也超过了4%。以太坊的表现同样不俗,从2050美元附近

热心网友
04.07
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰
网络安全
魏思琪换上新机!REDMI K90至尊版来了 小米首款风冷旗舰

4月5日消息,日前,REDMI K90至尊版通过3C认证,预计将于本月发布。今日,小米中国区市场部总经理魏思琪用小米新机发布微博,不出意外,这正是即将登场的REDMI K90至尊版,这将是小米首款配

热心网友
04.07
WPS动态交互图表制作指南:让数据变化直观呈现
电脑教程
WPS动态交互图表制作指南:让数据变化直观呈现

WPS演示中图表不随数据更新时,可通过四种方法实现自动同步:一、用OFFSET+COUNTA定义动态名称绑定图表;二、用组合框控件联动VLOOKUP提取数据;三、用数据透视图配合切

热心网友
04.07
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品
科技数码
“链接未来·智汇静安”区块链创新应用优秀场景分享(四)| 信医基于区块链与隐私计算的真实世界研究数据产品

聚焦数字技术,释放创新动能。为集中展示静安区区块链技术从“实验室”走向“应用场”的丰硕成果,挖掘一批可复制、可推广的行业解决方案,加速构建区块链产业生态闭环,静安区数据局特推出“静安区区块链创新应用

热心网友
04.07
天上的马桶与地上的火药桶,都在让美国出糗
科技数码
天上的马桶与地上的火药桶,都在让美国出糗

太空中的马桶堵了,边飞边修还能勉强用。但中东被点燃的火药桶,美国怎么来扑灭?靠一再延期的“最后通牒”?还是靠无底线的轰炸?2300万美元的马桶美国航空航天局4名宇航员1日搭乘“猎户座”飞船升空,执行

热心网友
04.07