游乐游手机版
首页/业界动态/文章详情

阿里千问3.5发布:性能比肩Gemini,Token价格仅为GPT的1/18

时间:2026-02-16 18:30
2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3 5-Plus,性能媲美Gemini 3Pro,登顶全球最强开源模型。千问3 5实现了底层模型架构的全面革新,此次发布的Qwen3 5-P

2月16日除夕当天,阿里巴巴开源了全新一代大模型千问Qwen3.5-Plus。这款模型性能足以媲美Gemini 3 Pro,一举登顶全球最强开源模型榜首。千问3.5实现了底层模型架构的全面革新。此次发布的Qwen3.5-Plus版本总参数达到3970亿,但激活参数仅为170亿,实现了“以小博大”的效率突破。其性能不仅超越了参数过万亿的Qwen3-Max模型,部署显存占用还降低了60%,推理效率得到大幅提升,最大推理吞吐量更可跃升19倍。在价格方面,Qwen3.5-Plus的API报价极具竞争力,每百万Token低至0.8元,仅为Gemini 3 Pro的1/18。

与前几代千问大语言模型不同,千问3.5实现了一次关键的代际跃迁——从纯文本模型进化为原生多模态模型。千问3是基于纯文本Tokens进行预训练的,而千问3.5则是在视觉和文本混合token上进行预训练。此外,模型大幅新增了中英文、多语言、STEM和推理等各类数据,让真正“睁开双眼”的大模型学会了更密集的世界知识和推理逻辑。凭借不到40%的参数量,它便获得了超万亿参数的Qwen3-Max基座模型的顶尖性能,在推理、编程、Agent智能体等全方位基准评估中均表现优异。例如,千问3.5在MMLU-Pro知识推理测评中得分87.8,超越了GPT-5.2;在博士级难题GPQA测评中斩获88.4分,高于Claude 4.5;它在指令遵循IFBench中以76.5分刷新了所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中,千问3.5的表现均超越了Gemini 3 Pro和GPT-5.2。

阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为后者1/18图示:阿里开源千问Qwen3.5-Plus,性能媲美Gemini 3Pro

原生多模态训练,也带来了千问3.5视觉能力的飞跃。在多模态推理(MathVison)、通用视觉问答VQA(RealWorldQA)、文本识别和文件理解(CC_OCR)、空间智能(RefCOCO-avg)、视频理解(MLVU)等众多权威评测中,千问3.5均斩获最佳性能。在学科解题、任务规划与物理空间推理等任务上,千问3.5相比千问专项模型Qwen3-VL表现更好,空间定位推理和带图推理能力均大幅增强,推理分析更精细、精准。在视频理解方面,千问3.5支持长达2小时(约1M token上下文)的视频直接输入,适用于长视频内容分析与摘要生成。同时,千问3.5实现了视觉理解与代码能力的原生融合,结合图搜和生图工具,可将手绘界面草图直接转为可用的前端代码,一张截图就能定位并修复UI问题,让视觉编程真正成为生产力工具。

千问3.5性能跃升的背后,是对Transformer经典架构的重大创新突破。千问团队自研的门控技术成果,曾斩获全球AI顶会2025 NeurIPS最佳论文,这一前沿技术已融入到千问3.5创新的混合架构之中。团队结合线性注意力机制与稀疏混合专家MoE模型架构,实现了397B总参数仅激活17B的极致模型效率。同时,千问3.5通过训练稳定优化、多Token预测等一系列技术,使得Qwen3.5性能与Qwen3-Max模型持平,并进一步提升了推理效率:在常用的32K上下文场景中,千问3.5推理吞吐量可提升8.6倍;在256K超长上下文情况下,Qwen3.5推理吞吐量最大提升至19倍,推理效率大幅提升。

阿里发布千问3.5,性能媲美Gemini 3, Token价格仅为后者1/18图示:千问3.5推理效率大幅提升,最大吞吐量提升至19倍

千问3.5的原生多模态训练,是在阿里云AI基础设施上高效完成的。通过系列基础技术创新,千问3.5在文本、图像、视频等混合数据训练吞吐量,几乎100%持平纯文本基座模型训练,大幅降低了原生多模态训练的难度门槛。同时,通过设计精巧的FP8、FP32精度应用策略,在训练稳定扩展到数十万亿个token时,激活内存减少约50%,训练还能提速10%以上,进一步节约了模型训练成本、提升了训练效率。

基于顶尖的视觉能力,千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑,高效完成日常任务。在移动端支持更多主流APP与指令,在PC端可处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3到5倍,并将插件式智能体Agent支持扩展至百万级规模。

1月15日,千问App发布了全球首个消费级AI购物Agent。春节期间,千问AI购物Agent在短短6天时间里帮助用户完成了1.2亿笔订单,在全球首次实现大规模真实世界任务执行和商业化验证。Agent能力大幅增强的千问3.5,将进一步打开千问APP在工作生活中帮人办事的想象空间。

自2024年开源以来,阿里已开源400多个千问模型,覆盖全尺寸、全模态。千问全球下载量突破10亿次,单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和。开发者基于千问开发的衍生模型超20万个,是公认的全球第一开源模型,也是开发者最友好的开源大模型。面向不同国家的AI开发者和企业的需求,千问大模型还在持续演进:千问3.5扩展支持201种语言,将词表大小从15万扩展至25万,最高可提升小语种60%的编码效率。

据悉,千问APP、PC端已第一时间接入Qwen3.5-Plus模型。开发者可在魔搭社区和HuggingFace下载新模型,或通过阿里云百炼直接获取API服务。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型。性能更强的旗舰模型Qwen3.5-Max不久也将发布。


来源:https://www.leiphone.com/category/industrynews/UeoaNe55m7Rc8fOm.html
上一篇阿里千问Qwen3.5重磅发布:登顶最强开源模型 下一篇马斯克:星链超千万用户,即将实现地外运行
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿