阿里千问3.5发布：性能比肩Gemini，Token价格仅为GPT的1/18

时间：2026-02-16 18:30

2月16日除夕当天，阿里巴巴开源全新一代大模型千问Qwen3 5-Plus，性能媲美Gemini 3Pro，登顶全球最强开源模型。千问3 5实现了底层模型架构的全面革新，此次发布的Qwen3 5-P

2月16日除夕当天，阿里巴巴开源了全新一代大模型千问Qwen3.5-Plus。这款模型性能足以媲美Gemini 3 Pro，一举登顶全球最强开源模型榜首。千问3.5实现了底层模型架构的全面革新。此次发布的Qwen3.5-Plus版本总参数达到3970亿，但激活参数仅为170亿，实现了“以小博大”的效率突破。其性能不仅超越了参数过万亿的Qwen3-Max模型，部署显存占用还降低了60%，推理效率得到大幅提升，最大推理吞吐量更可跃升19倍。在价格方面，Qwen3.5-Plus的API报价极具竞争力，每百万Token低至0.8元，仅为Gemini 3 Pro的1/18。

与前几代千问大语言模型不同，千问3.5实现了一次关键的代际跃迁——从纯文本模型进化为原生多模态模型。千问3是基于纯文本Tokens进行预训练的，而千问3.5则是在视觉和文本混合token上进行预训练。此外，模型大幅新增了中英文、多语言、STEM和推理等各类数据，让真正“睁开双眼”的大模型学会了更密集的世界知识和推理逻辑。凭借不到40%的参数量，它便获得了超万亿参数的Qwen3-Max基座模型的顶尖性能，在推理、编程、Agent智能体等全方位基准评估中均表现优异。例如，千问3.5在MMLU-Pro知识推理测评中得分87.8，超越了GPT-5.2；在博士级难题GPQA测评中斩获88.4分，高于Claude 4.5；它在指令遵循IFBench中以76.5分刷新了所有模型纪录；而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等基准中，千问3.5的表现均超越了Gemini 3 Pro和GPT-5.2。

阿里发布千问3.5，性能媲美Gemini 3， Token价格仅为后者1/18 图示：阿里开源千问Qwen3.5-Plus，性能媲美Gemini 3Pro

原生多模态训练，也带来了千问3.5视觉能力的飞跃。在多模态推理（MathVison）、通用视觉问答VQA（RealWorldQA）、文本识别和文件理解（CC_OCR）、空间智能（RefCOCO-avg）、视频理解（MLVU）等众多权威评测中，千问3.5均斩获最佳性能。在学科解题、任务规划与物理空间推理等任务上，千问3.5相比千问专项模型Qwen3-VL表现更好，空间定位推理和带图推理能力均大幅增强，推理分析更精细、精准。在视频理解方面，千问3.5支持长达2小时（约1M token上下文）的视频直接输入，适用于长视频内容分析与摘要生成。同时，千问3.5实现了视觉理解与代码能力的原生融合，结合图搜和生图工具，可将手绘界面草图直接转为可用的前端代码，一张截图就能定位并修复UI问题，让视觉编程真正成为生产力工具。

千问3.5性能跃升的背后，是对Transformer经典架构的重大创新突破。千问团队自研的门控技术成果，曾斩获全球AI顶会2025 NeurIPS最佳论文，这一前沿技术已融入到千问3.5创新的混合架构之中。团队结合线性注意力机制与稀疏混合专家MoE模型架构，实现了397B总参数仅激活17B的极致模型效率。同时，千问3.5通过训练稳定优化、多Token预测等一系列技术，使得Qwen3.5性能与Qwen3-Max模型持平，并进一步提升了推理效率：在常用的32K上下文场景中，千问3.5推理吞吐量可提升8.6倍；在256K超长上下文情况下，Qwen3.5推理吞吐量最大提升至19倍，推理效率大幅提升。

阿里发布千问3.5，性能媲美Gemini 3， Token价格仅为后者1/18 图示：千问3.5推理效率大幅提升，最大吞吐量提升至19倍

千问3.5的原生多模态训练，是在阿里云AI基础设施上高效完成的。通过系列基础技术创新，千问3.5在文本、图像、视频等混合数据训练吞吐量，几乎100%持平纯文本基座模型训练，大幅降低了原生多模态训练的难度门槛。同时，通过设计精巧的FP8、FP32精度应用策略，在训练稳定扩展到数十万亿个token时，激活内存减少约50%，训练还能提速10%以上，进一步节约了模型训练成本、提升了训练效率。

基于顶尖的视觉能力，千问3.5也实现了从Agent框架到Agent应用的新突破。千问3.5可自主操作手机与电脑，高效完成日常任务。在移动端支持更多主流APP与指令，在PC端可处理更复杂的多步骤操作，如跨应用数据整理、自动化流程执行等，显著提升操作效率。同时，千问团队构建了一个可扩展的Agent异步强化学习框架，端到端可加速3到5倍，并将插件式智能体Agent支持扩展至百万级规模。

1月15日，千问App发布了全球首个消费级AI购物Agent。春节期间，千问AI购物Agent在短短6天时间里帮助用户完成了1.2亿笔订单，在全球首次实现大规模真实世界任务执行和商业化验证。Agent能力大幅增强的千问3.5，将进一步打开千问APP在工作生活中帮人办事的想象空间。

自2024年开源以来，阿里已开源400多个千问模型，覆盖全尺寸、全模态。千问全球下载量突破10亿次，单月下载量是DeepSeek、Meta、OpenAI、智谱、Kimi、MiniMax等2到8名总和。开发者基于千问开发的衍生模型超20万个，是公认的全球第一开源模型，也是开发者最友好的开源大模型。面向不同国家的AI开发者和企业的需求，千问大模型还在持续演进：千问3.5扩展支持201种语言，将词表大小从15万扩展至25万，最高可提升小语种60%的编码效率。

据悉，千问APP、PC端已第一时间接入Qwen3.5-Plus模型。开发者可在魔搭社区和HuggingFace下载新模型，或通过阿里云百炼直接获取API服务。阿里很快将继续开源不同尺寸、不同功能的千问3.5系列模型。性能更强的旗舰模型Qwen3.5-Max不久也将发布。

来源：https://www.leiphone.com/category/industrynews/UeoaNe55m7Rc8fOm.html

阿里千问大模型

上一篇阿里千问Qwen3.5重磅发布：登顶最强开源模型 下一篇马斯克：星链超千万用户，即将实现地外运行

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略，采用“1+N+X”布局，联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm，体重69kg，移动速度0 8m s，具备40个自由度，续航超2小时。预计明年一季度发布首款车载组件机器人，已在广州车展展示。

业界动态 · 2026-06-29

中国信科刷新光通信世界纪录每秒可下载1.4万部4K电影

3月25日，光通信领域迎来又一个里程碑：中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司，成功实现了2 5Pb s 24芯光纤超大容量实时光传输，再次刷新了世界纪录。这一研究成果不仅入选国际顶级光通信会议OFC（2026）并荣获“高分论文”称号，还受国际权威SCI

业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查，焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿，不意味着立即召回，但可能引发后续监管措施。

业界动态 · 2026-06-29

doc个人图书馆停服创始人称无偿转让失败

运营长达20年，累计服务8000万用户的360doc个人图书馆，最终还是迎来了谢幕时刻。2026年5月1日，这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失，而是始终未能寻得一位能够安全接管的合适人选。创始人蔡智在告别信中坦言，近两个月来，他一直在尝试将360doc无偿转

业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月，艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证，紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后，折射出一个清晰的市场趋势：移动办公、户外出行、宿舍上网等场景的需求正在快速增长，随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿