阿里开源下一代模型架构Qwen3-Next,模型训练及推理性价比创新高
9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展(Scaling)的未来趋势而设计,采用全新的高稀疏MoE架构,并对经典Transformer核心组件进行了重构,创新线性注意力和自研的门控注意力结合的混合注意力机制,实现了模型训练和推理的双重性价比突破。
基于这一新架构,阿里通义“打样”了Qwen3-Next-80B-A3B系列模型,开源指令(Instruct)和推理(Thinking)两大模型版本。新模型总参数 80B 仅激活 3B,性能可媲美千问3旗舰版235B模型,模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%,长文本推理吞吐量提升10倍以上,并可支持百万Tokens超长上下文。
相关攻略
在数字化浪潮席卷的今天,数据处理已成为企业运营与个人工作的核心环节。无论是管理海量客户资料、深度分析销售趋势报告,还是精准追踪复杂项目进度,结构清晰的表格都发挥着无可替代的关键作用。然而,传统依赖人工手动录入、比对纸质文件或杂乱电子文档的方式,不仅耗时费力、成本高昂,还极易引入人为错误,已然成为阻碍
4月28日,医疗AI领域迎来一项突破性进展。阿里巴巴达摩院携手广东省人民医院等权威机构,共同发布了全新的肠癌筛查AI模型——DAMO COCA。该模型创新性地提出了一种基于平扫CT的“无感”肠癌机会性筛查方案,患者无需进行繁琐的肠道准备。临床研究证实,该模型成功从2 7万份平扫CT影像中精准识别出5
谷歌在最近的I O开发者大会上宣布,其新一代大语言模型Gemini3 5Pro将于下个月正式推出。官方透露,该模型目前已在公司内部投入使用,并评价其取得了“非常强”的进步。虽然具体的性能参数和升级细节尚未公开,但此举表明谷歌正在加速其AI模型的迭代进程。在人工智能领域竞争日益激烈的当下,此次更新
谷歌在近期开发者大会上公布了其人工智能业务的最新数据。2026年5月,谷歌AI系统每月处理的Token数量超过3200万亿个,同比激增7倍。旗下Gemini应用的月度活跃用户突破9亿,同比增长超一倍,每日请求量也增长超过7倍。同时,其图像生成模型累计产出图片超500亿张。这些数据反映了谷歌AI服务在
谷歌将通用世界模型ProjectGenie与街景服务结合,能基于真实街景生成可互动的3D虚拟环境。用户可在谷歌地图中选择美国地点并设定风格主题与角色描述,系统即可生成融合现实与想象的动态世界。该功能目前处于实验阶段,仅支持美国地区,未来计划逐步扩展。
热门专题
热门推荐
在现代化仓储物流管理中,实现实时、精准的库存可视化是提升运营韧性与效率的核心环节。近日,知名定制化第三方物流服务商Romark Logistics宣布了一项重要技术升级:在其位于哈兹尔顿的仓储基地正式部署由Dexory提供的AI驱动仓储可视化平台DexoryView。此举标志着Romark Logi
今天,谷歌正式将我们带入了一个新的阶段:AI智能体时代。其推出的Gemini Spark,被定义为一款能够全天候运行的个人AI助手。它的核心使命很明确——接管我们日益复杂的数字生活,并实实在在地替我们处理一些工作。 这款助手的“大脑”是最新发布的Gemini 3 5 Flash模型,而协调其行动的“
近日,《自然》杂志同期发表了两项突破性研究,展示了两种旨在革新科研工作流的AI系统。一款来自谷歌,名为Co-Scientist,强调人机深度协作;另一款由非营利机构FutureHouse开发,其系统更进一步,能对特定生物实验数据进行自动化评估与分析。 尽管谷歌表示其系统架构同样适用于物理学探索,但两
谷歌近期对其“氛围编程”平台进行了重要升级。现在,开发者可以直接在谷歌AI Studio中,通过自然语言对话来构建安卓原生应用。 具体操作流程非常直观:用户只需用日常语言描述自己的应用构思,平台内置的安卓模拟器便会实时生成应用预览。若想在实际设备上测试,只需将安卓手机连接至电脑,即可直接安装体验。更
今天,科大讯飞旗下孵化的AI硬件品牌未来智能,正式发布了其创新产品——viaim讯飞智能体耳机。这款产品的核心突破在于,将先进的办公AI Agent能力,集成到一款日常可佩戴的耳机设备中。它不仅超越了传统录音转写功能,更实现了长期记忆存储、多模型灵活调用与智能复盘分析,目标清晰:将耳机从单纯的音频播





