游乐游手机版
首页/科技数码/文章详情

阿里推出新一代千问3.5:开源模型的新全球标杆

时间:2026-02-17 11:22
2月16日除夕当天,阿里巴巴开源全新一代大模型千问Qwen3 5-Plus,性能媲美Gemini 3 Pro,登顶全球最强开源模型。据悉,千问3 5实现了底层模型架构的全面革新,此次发布的Qwen3

2月16日除夕当天,阿里巴巴正式开源了全新一代大模型Qwen3.5-Plus,其性能媲美谷歌的Gemini 3 Pro,一举登顶全球最强开源模型的宝座。

据悉,千问3.5实现了底层模型架构的全面革新。此次发布的Qwen3.5-Plus版本总参数量高达3970亿,但激活参数量仅为170亿,真正做到了“以小博大”,性能表现超越了万亿参数的Qwen3-Max模型。在部署方面,显存占用降低了整整60%,推理效率则得到大幅提升,其最大推理吞吐量惊人地提升了19倍。更值得一提的是,Qwen3.5-Plus的API价格颇具竞争力,每百万Token的成本低至0.8元,仅为Gemini 3 Pro的十八分之一。

与前几代千问大语言模型不同,千问3.5实现了从纯文本模型到原生多模态模型的关键跨越。千问3主要基于纯文本Tokens进行预训练,而千问3.5的创新之处在于,它基于视觉和文本混合的Token进行预训练,并且大幅新增了中英文、多语言、STEM学科以及推理等领域的海量数据。这使得“睁开眼睛”的大模型学会了更密集的世界知识和推理逻辑,从而得以用不到40%的参数量,就获得了超越万亿级别Qwen3-Max基座模型的顶尖性能。在推理、编程、Agent智能体等全方位的基准评估中,千问3.5均表现出色。例如,在MMLU-Pro知识推理评测中,千问3.5获得了87.8分,超越了GPT-4o;在博士级难题GPQA测评中以88.4分斩获佳绩,高于Claude 3.5 Sonnet;其指令遵循能力在IFBench基准上以76.5分刷新所有模型纪录;而在通用Agent评测BFCL-V4、搜索Agent评测Browsecomp等关键基准中,千问3.5的表现全面超越了Gemini 3 Pro以及GPT-4o。

原生多模态的训练方式,也为千问3.5带来了视觉能力的飞跃。在包括多模态推理、通用视觉问答、文本识别与文件理解、空间智能以及视频理解在内的众多权威评测体系中,千问3.5均斩获了最佳性能。在学科解题、任务规划与物理空间推理等具体任务上,千问3.5相比其专用视觉模型Qwen3-VL表现更佳,尤其在空间定位推理和带图推理方面的能力大幅增强,推理分析过程也更为细致、精准。在视频理解方面,千问3.5支持长达2小时(相当于1M以上token上下文)的视频直接输入,非常适合用于长视频内容分析与摘要生成。同时,千问3.5实现了视觉理解与代码能力的原生融合,结合图搜和生图工具,可将手绘界面草图直接转换为可用的前端代码。仅仅一张截图,就能定位并修复UI问题,让视觉编程真正成为生产力工具。

千问3.5的原生多模态训练,是在阿里云AI基础设施上高效完成的。通过一系列基础技术创新,千问3.5在处理文本、图像、视频等混合数据的训练吞吐量上,几乎达到了与纯文本基座模型训练持平的水平,这极大地降低了原生多模态训练的难度门槛。与此同时,通过设计精巧的FP8、FP32精度应用策略,当训练规模扩展至数十万亿token时,激活内存减少了约50%以上,训练速度还能提升10%以上,从而进一步节省了模型训练成本,提升了训练效率。

千问3.5也实现了从Agent框架到Agent应用的新突破。它可自主操作手机与电脑,高效完成日常任务,在移动端支持更多主流APP与指令,在PC端则能处理更复杂的多步骤操作,如跨应用数据整理、自动化流程执行等,显著提升操作效率。同时,千问团队构建了一个可扩展的Agent异步强化学习框架,端到端可加速3至5倍,并将插件式智能体Agent的支持规模扩展至百万级。

据悉,千问APP、PC端已在第一时间接入Qwen3.5-Plus模型。开发者可在魔搭社区和HuggingFace平台下载新模型,或通过阿里云百炼平台直接获取API服务。阿里巴巴将持续开源不同尺寸、不同功能的千问3.5系列模型。性能更强的旗舰模型Qwen3.5-Max也即将发布。

来源:https://www.163.com/dy/article/KLV6RDFB053469RG.html
上一篇银河通用机器人:春晚小盖动作并非预设程序表演 下一篇神舟二十一航天员在中国空间站共度新春,祝福祖国繁荣安康
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5

电动汽车电池新国标7月实施热失控不起火不爆炸
科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起,两项关乎电动汽车安全的核心强制性国家标准将正式实施,为行业加装“安全锁”——《电动汽车安全要求》(GB 18384-2025)与《电动汽车用动力蓄电池安全要求》(GB 38031-2025)同步落地。此次标准升级,从整车架构与电池系统两大维度,精准填补了近年来多起事故暴露出的