首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
阿里通义千问Qwen3.5多模态大模型开源发布

阿里通义千问Qwen3.5多模态大模型开源发布

热心网友
20
转载
2026-05-24

Qwen3.5是什么

大模型领域的竞争,正从单纯的参数规模竞赛,转向对效率、成本和通用性的综合考量。在这个背景下,阿里巴巴通义千问团队推出的Qwen3.5,可以说是一次极具代表性的技术跃迁。

简单来说,Qwen3.5是新一代原生多模态大模型。它的首发开源版本Qwen3.5-397B-A17B,采用了一种创新的混合架构,巧妙地将线性注意力(Gated Delta Networks)与稀疏混合专家(MoE)技术结合了起来。这套组合拳的效果非常显著:模型总参数高达3970亿,但每次推理时仅激活170亿参数。这种“四两拨千斤”的设计,让它实现了“以小胜大”——性能上超越了万亿参数的Qwen3-Max,同时部署所需的显存降低了60%,推理吞吐量最高提升了惊人的19倍。

作为原生视觉-语言模型,它通过早期文本-视觉融合技术,以及M-RoPE、3D位置编码等创新,能够统一处理文本、图像、视频等多种任务。语言支持也从119种大幅扩展至201种,覆盖面更广。

性能表现如何?数据最有说服力。在多项权威评测中,Qwen3.5的成绩相当亮眼:MMLU-Pro得分87.8,超越了GPT-5.2;GPQA得分88.4,高于Claude 4.5;IFBench指令遵循评分更是达到了76.5,刷新了历史纪录。更关键的是,它的API定价极具竞争力,每百万Token仅需0.8元,这个价格仅为Gemini 3 Pro的1/18。对于开发者而言,可以通过魔搭社区、HuggingFace或阿里云百炼平台获取模型权重与接口。

除了这个“大块头”,阿里千问还同步推出了更小尺寸的Qwen3.5系列模型,包括0.8B、2B、4B和9B等版本。全系基于统一的Qwen3.5基座,采用Apache 2.0协议开源且可商用,支持LoRA或全量微调。这意味着,用消费级显卡就能启动任务适配,大大降低了在垂直场景中落地的成本和门槛。其中,0.8B和2B版本非常适合移动设备和IoT边缘部署;4B版本定位为轻量级智能体基座;而9B版本的性能,据称已可媲美一些120B级别的开源模型。

Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

Qwen3.5的主要功能

那么,这个模型具体能做什么?它的能力矩阵覆盖得相当全面:

  • 原生多模态理解:不再是简单的文本模型外设视觉模块,而是从底层统一处理文本、图像、视频,通过早期视觉-语言融合实现真正的跨模态推理。
  • 智能体能力:支持工具调用、任务规划与自主执行,在BFCL-V4等智能体专项评测中表现优异,具备了成为“数字员工”的潜力。
  • 高效推理架构:前面提到的Gated DeltaNet与MoE混合设计是核心,让397B参数的“巨兽”每次只需“唤醒”17B参数就能工作,实现了顶级性能与高效成本的平衡。
  • 长上下文处理:最高支持1M(百万级)的上下文长度。在256K场景下,解码吞吐量能达到前代模型的19倍,处理长文档、长视频不再是瓶颈。
  • 多语言支持:覆盖201种语言与方言,词表扩展至25万,编码效率提升了10%到60%,为全球化应用扫清了语言障碍。
  • 代码生成:具备强大的编程能力,支持多种语言的代码编写、调试,甚至能参与复杂项目的开发工作。
  • 视觉识别:不仅能看懂图片,还能进行细粒度图像理解、目标检测、OCR文档解析与空间关系推理,视觉能力更加深入。
  • 搜索增强:集成了BrowseComp等搜索智能体能力,可以实现联网信息检索与整合,让模型的知识获取能力突破训练数据的时间限制。

Qwen3.5的技术原理

这些强大功能的背后,是一系列扎实的技术创新作为支撑:

  • 混合注意力架构:融合了Gated DeltaNet线性注意力与Gated Attention稀疏注意力,让模型能够自适应地分配计算资源,该省则省,该花则花。
  • MoE稀疏激活:这是实现高效推理的关键。总参数397B,但每次只激活17B(约4.3%)。其结构包含1个共享专家和512个路由专家,每次推理仅激活其中的10个,大幅降低了计算成本。
  • 门控机制优化:采用head-specific sigmoid门控替代了传统的softmax注意力,这项优化因其显著的效果,获得了2025年NeurIPS的最佳论文奖。
  • 原生多模态融合:利用M-RoPE和3D位置编码技术,将图像、视频的时空信息原生地嵌入到大语言模型中,实现了视觉与语言在早期阶段的深度融合,而非后期拼接。
  • 异构训练框架:视觉与语言组件采用解耦并行策略,结合稀疏激活实现了跨模块的计算重叠,使得多模态训练吞吐量接近纯文本基线,解决了训练效率的难题。
  • FP8混合精度:原生支持FP8流水线,对激活值、MoE路由与通用矩阵乘法采用低精度处理,仅在敏感层保持BF16精度,使得训练显存需求降低50%以上。
  • 异步强化学习:构建了一个可扩展的异步强化学习框架,能够支持全尺寸模型的RLHF训练,实现了训练与推理的分离以及动态负载均衡,端到端加速达到3-5倍。
Qwen3.5 – 阿里通义千问开源的新一代原生多模态大模型

Qwen3.5的项目地址

对于想要深入研究或直接使用的开发者和研究者,可以访问以下官方渠道获取资源:

  • Hugging Face模型库:https://huggingface.co/collections/Qwen/qwen35
  • GitHub仓库:https://github.com/QwenLM/Qwen3.5

如何使用Qwen3.5

无论你是普通用户、开发者还是企业,都有多种方式可以体验和利用Qwen3.5:

  • 网页端体验:最直接的方式是访问Qwen Chat官网,或者下载千问APP/PC客户端,直接输入文字或上传图片、视频进行多模态交互。
  • API调用:通过阿里云百炼平台获取API密钥,就能以每百万Token 0.8元的极低成本,将模型能力集成到自己的应用或服务中。
  • 本地部署:从HuggingFace或魔搭社区下载开源权重Qwen3.5-397B-A17B及其小尺寸版本,在本地或私有云环境进行部署,满足数据安全和定制化需求。
  • 智能体开发:利用模型原生的智能体能力,结合其工具调用接口,可以开发自动化任务执行、数据分析、智能决策等高级应用。
  • 多语言应用:直接使用201种支持语言中的任意一种进行对话,无需额外配置翻译模块,非常适合开发全球化产品。
  • 长文档处理:上传超长文本、PDF或视频文件,模型能自动处理最高1M上下文的复杂推理任务,如长篇报告分析、会议纪要总结等。

Qwen3.5的模型定价

成本始终是技术落地的重要考量。Qwen3.5在定价策略上展现了强大的竞争力:

  • 输入价格:通过API调用,每百万Token仅需0.8元,这无疑是全球顶级大模型中最低的价位之一。
  • 价格对比:这个价格仅为Gemini 3 Pro的1/18,GPT-5.2的1/15,性价比优势非常显著。
  • 开源免费:最重要的是,Qwen3.5-397B-A17B及其系列小模型的权重完全开源,开发者可以免费下载并进行本地部署,这极大地降低了研究和商业化的初始门槛。

Qwen3.5的应用场景

结合其功能与成本优势,Qwen3.5能在多个领域大显身手:

  • 智能客服:支持201种语言的多轮复杂对话,能完美适配全球化企业的客服系统,提供7x24小时的多语言服务。
  • 内容创作:辅助进行多语言的文案撰写、视频脚本生成、翻译与本地化内容适配,提升创作效率。
  • 代码开发:作为编程助手,提供代码生成、调试、重构乃至复杂项目开发维护的支持,成为开发者的“副驾驶”。
  • 视觉分析:应用于图像识别、文档OCR、视频内容理解与细粒度视觉问答,为安防、医疗、零售等行业提供智能分析能力。
  • 智能体自动化:构建自动化工作流,执行数据分析、信息检索、任务调度等智能体任务,实现业务流程的智能化升级。
  • 教育辅助:支持多语言教学、智能作业批改、个性化学习路径规划与互动知识问答,打造自适应学习体验。

总的来看,Qwen3.5不仅仅是一次模型迭代,它更代表了一种务实的技术方向:在追求极致性能的同时,将效率、成本和易用性摆在同等重要的位置。它的出现,无疑为AI大规模落地应用提供了又一个强有力的选项。

来源:https://ai-bot.cn/qwen3-5/
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里达摩院开源具身智能大脑RynnBrain基础模型详解
AI资讯
阿里达摩院开源具身智能大脑RynnBrain基础模型详解

RynnBrain是什么 在具身智能领域,如何让机器人真正理解并适应复杂的物理世界,始终是核心挑战。近期,阿里巴巴达摩院发布了一项重要成果——开源了名为RynnBrain的具身智能大脑基础模型。这一模型实现了关键突破,首次赋予机器人接近人类的时空记忆与物理空间推理能力。 具体而言,RynnBrain

热心网友
05.23
昆仑万维开源SkyReels-V3多模态视频生成模型详解
AI资讯
昆仑万维开源SkyReels-V3多模态视频生成模型详解

SkyReels-V3是什么 视频创作的门槛,正在被一项新技术重新定义。最近,昆仑万维开源的SkyReels-V3,可以说在业内投下了一枚“重磅冲击波”。它不再是一个功能单一的玩具,而是一个用单一架构就能实现专业级视频创作的“多面手”。简单来说,它能让你手里的静态照片“活”起来,变成动态影像;还能智

热心网友
05.23
HKUDS开源AI Agent经济生存基准测试框架ClawWork详解
AI资讯
HKUDS开源AI Agent经济生存基准测试框架ClawWork详解

ClawWork是什么 如果让AI去真实世界里“打工”,它能不能养活自己?香港大学数据科学实验室(HKUDS)开源的ClawWork项目,就是为了回答这个问题而生的。它本质上是一个AI Agent的“经济生存”基准测试框架,专门评估大模型在模拟真实商业环境中的“赚钱能力”。 这套系统的规则很现实:给

热心网友
05.23
小红书开源图像编辑模型FireRed使用指南
AI资讯
小红书开源图像编辑模型FireRed使用指南

FireRed-Image-Edit是什么 在AI图像生成与编辑领域,开源模型正迅速崛起,其能力已能比肩甚至超越部分闭源方案。近期,由小红书Super Intelligence团队研发并开源的FireRed-Image-Edit模型,便是这一趋势下的杰出代表。这款基于先进扩散架构的通用图像编辑AI,

热心网友
05.23
蚂蚁开源全模态大模型Ming‑Flash‑Omni 2.0详解
AI资讯
蚂蚁开源全模态大模型Ming‑Flash‑Omni 2.0详解

在人工智能模型普遍追求规模与通用性的当下,开发者们迫切需要一款能够真正“看懂”图像、“听懂”声音、“读懂”文字,并能自由进行跨模态内容创作的“全能型”AI工具。近期,蚂蚁集团重磅开源的全模态大语言模型Ming-flash-omni-2 0,正将这一愿景变为现实。它不仅彻底打通了图像、视频、音频与文本

热心网友
05.23

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

AI Agent能力进化平台 水产市场实用技能全解析
AI资讯
AI Agent能力进化平台 水产市场实用技能全解析

水产市场是什么 在AI Agent的生态中,能力共享与协同进化是核心驱动力。水产市场(Seafood Market)正是为OpenClaw框架量身打造的AI Agent能力共享平台。你可以将其理解为AI领域的“应用商店”或“技能交易中心”,旨在实现AI能力的快速流通与组合创新。 目前,平台已集成超过

热心网友
05.24
MeowTXT AI音视频转文字工具 智能识别说话人
AI资讯
MeowTXT AI音视频转文字工具 智能识别说话人

在信息爆炸的时代,高效地将音视频内容转化为可编辑、可检索的文字,已经成为内容创作者、研究者和职场人士的刚需。今天要聊的这款工具——MeowTXT,正是瞄准了这一痛点,它不仅仅是一个简单的转录工具,更是一个集成了智能识别、摘要和翻译的AI生产力平台。 MeowTXT是什么 简单来说,MeowTXT是一

热心网友
05.24
开源AI Agent操作系统OpenFang自动执行完整工作流
AI资讯
开源AI Agent操作系统OpenFang自动执行完整工作流

OpenFang是什么 在AI Agent领域,我们常常面临一个困境:大多数系统仍然停留在“你说一句,它动一下”的被动模式,离真正的自动化还有距离。今天要聊的OpenFang,正是在尝试打破这个局面。它是一个用Rust语言构建的开源Agent操作系统,其核心创新在于引入了“Hands”的概念——你可

热心网友
05.24
腾讯混元开源全模态大模型压缩工具包AngelSlim详解
AI资讯
腾讯混元开源全模态大模型压缩工具包AngelSlim详解

AngelSlim是什么 随着大模型参数规模不断增长,如何实现高效推理与低成本部署已成为开发者面临的核心挑战。腾讯混元团队推出的开源工具包AngelSlim,正是为解决这一难题而生。它是一个面向全模态大模型的综合压缩与加速解决方案,集成了量化、投机采样、稀疏化及知识蒸馏等前沿技术,旨在为各类大语言模

热心网友
05.24
AI音视频转录工具Transcript LOL 智能区分说话人
AI资讯
AI音视频转录工具Transcript LOL 智能区分说话人

在信息过载的数字化时代,音频与视频内容已成为知识传递、创意表达与商业沟通的核心载体。然而,如何将这些宝贵的非结构化媒体资产,高效、精准地转化为可搜索、可分析、可编辑的文本格式,始终是内容创作者、市场研究人员、学者及商务人士的核心痛点。一款强大的AI转录工具,正是打通音视频内容价值闭环、释放生产力潜能

热心网友
05.24