阿里开源下一代模型架构Qwen3-Next，模型训练及推理性价比创新高_游乐游手机版

首页/科技数码/文章详情

阿里开源下一代模型架构Qwen3-Next，模型训练及推理性价比创新高

时间：2025-09-12 12:23

9月12日，阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展（Scaling）的未来趋势而设计，采用全新的高稀疏MoE架构，并对经

9月12日，阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展（Scaling）的未来趋势而设计，采用全新的高稀疏MoE架构，并对经典Transformer核心组件进行了重构，创新线性注意力和自研的门控注意力结合的混合注意力机制，实现了模型训练和推理的双重性价比突破。

基于这一新架构，阿里通义“打样”了Qwen3-Next-80B-A3B系列模型，开源指令（Instruct）和推理（Thinking）两大模型版本。新模型总参数 80B 仅激活 3B，性能可媲美千问3旗舰版235B模型，模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%，长文本推理吞吐量提升10倍以上，并可支持百万Tokens超长上下文。

来源：https://www.leiphone.com/category/industrynews/lkwGjOnBOJIVcgKY.html

AI模型开源阿里通义

上一篇小而美的AI生活小秘书：美团首款AI Agent产品“小美”公测 下一篇百年大变局下，律所为什么一定要懂产业懂趋势？

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容，方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

道指破52000谷歌首秀芯片V型反转黄金跳水油价反弹

科技数码 · 2026-07-01

道指破52000谷歌首秀芯片V型反转黄金跳水油价反弹

2026年6月30日，一个值得标记的时间节点。

优步终止与Waymo自动驾驶合作聚合平台战略受质疑

科技数码 · 2026-07-01

优步终止与Waymo自动驾驶合作聚合平台战略受质疑

合作刚刚结束，但余波远未平息。优步与Waymo在凤凰城的Robotaxi试点项目，已于上月画上句号。虽然双方对外口径都颇为客气——“有意义的试点”“富有成效的探索”——但市场显然读出了更多信号：这对亦敌亦友的巨头，正在自动驾驶赛道上悄然拉开距离。凤凰城是Waymo最早向付费乘客开放Robotaxi

光芯片需求爆发半导体企业订单供不应求

科技数码 · 2026-07-01

光芯片需求爆发半导体企业订单供不应求

我国半导体产业装备的国产化进程令人瞩目。就在几年前，许多看似基础的推车、货架乃至无尘服仍需依赖进口，如今短短三年内，国产化率已实现翻倍增长。在2026年“活力中国调研行”广东站活动中，粤芯半导体助理总裁吴昊向澎湃新闻记者透露了他的观察。他指出，当前行业仅在光刻机及部分高端材料等少数环节仍依赖进口，

小米首款NAS智能存储发布 60TB双盘位2.5G网口

科技数码 · 2026-07-01

小米首款NAS智能存储发布 60TB双盘位2.5G网口

2026年6月30日，小米正式推出了旗下首款网络附加存储（NAS）设备——小米智能存储。同时，其专属配套应用“小米智能存储”也已上架小米应用商店。在官方发布的设备使用指南视频中，这款新品首次完整亮相，各项核心配置与功能也随之全面揭晓。先来看看外观设计。该设备采用立式方正造型，搭配钛灰色磨砂工艺，整

刺客信条黑旗重制版六天后发售多平台容量翻倍

科技数码 · 2026-07-01

刺客信条黑旗重制版六天后发售多平台容量翻倍

距离《刺客信条：黑旗》重制版正式发售仅剩六天。这款备受玩家期待的经典重制作品，即将于2026年7月9日登陆PlayStation 5、Xbox Series X|S以及PC平台。目前，各平台的安装空间需求已全面揭晓，为玩家规划存储空间提供了明确参考。根据Xbox官方商店页面数据，Xbox Seri