首页 游戏 软件 资讯 排行榜 专题
首页
AI
阿里通义Qwen3-VL开源4B与8B模型,超越GPT-5 Nano

阿里通义Qwen3-VL开源4B与8B模型,超越GPT-5 Nano

热心网友
95
转载
2025-10-16

10月15日最新消息,阿里通义今日正式宣布,其多模态大模型家族Qwen3-VL系列再添新成员——基于Dense架构的Qwen3-VL-8B和Qwen3-VL-4B模型现已开源上线。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

这两款密集架构的视觉理解模型在显存占用上更具优势,同时完整继承了Qwen3-VL系列的全部能力,每个尺寸都提供了Instruct和Thinking两个版本。

其中Qwen3-VL-8B在STEM、VQA、OCR、视频理解和Agent任务等公开评测中表现优异,不仅超越了Gemini 2.5 Flash Lite和GPT-5 Nano,甚至能够媲美上一代超大规模模型Qwen2.5-VL-72B。

而4B版本则在端侧展现出更高的性价比,特别适合需要AI视觉理解的智能终端部署。

超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

超越 GPT-5 Nano,阿里通义 Qwen3-VL 系列全新成员 4B 与 8B 模型开源上线

值得一提的是,这两款视觉理解模型实现了“视觉精准”与“文本稳健”的协同突破:针对小模型常见的“跷跷板”问题(提升视觉能力往往会牺牲文本性能,反之亦然),阿里通过架构创新和技术优化,让模型在保持文本理解能力的同时,增强了多模态感知与视觉理解能力,在小身材里塞进了更强的视觉和文本能力。

新模型现已上线魔搭社区和Hugging Face平台,同时提供FP8量化版本,开源地址如下:

https://modelscope.cn/collections/Qwen3-VL-5c7a94c8cb144b

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

来源:https://www.ithome.com/0/889/591.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场
业界动态
中国第一:阿里通义千问 3.5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场

中国第一:阿里通义千问 3 5-Max-Preview 首发亮相 LM Arena 国际大模型竞技场 大模型赛道的竞争,从来都不缺乏看点。这不,阿里千问家族又添新丁了。3月20日,千问3 5系列的旗舰预览版——Qwen3 5-Max-Preview,正式在全球知名的LM Arena竞技场上线参战,并

热心网友
04.21
下一代OpenClaw来了?“龙虾之父”称将率先支持阿里千问
业界动态
下一代OpenClaw来了?“龙虾之父”称将率先支持阿里千问

4月7日消息,“龙虾之父”彼得·斯坦伯格(Peter Steinberger)在社交媒体上透露称,下一代OpenClaw产品将融入视频生成功能,并率先提供阿里千问大模型的最新支持。据了解,过去的一周

热心网友
04.07
阿里发布国产最强编程模型Qwen3.6-Plus
业界动态
阿里发布国产最强编程模型Qwen3.6-Plus

4月2日,阿里发布千问新一代大语言模型Qwen3 6-Plus。千问3 6拥有原生多模态理解和推理能力,整体性能大幅增强,在智能体编程SWE-bench系列评测、真实世界智能体任务Claw-Eval

热心网友
04.07
阿里千问发布全模态大模型 Qwen3.5-Omni,无缝理解文本、图片、音频及音视频输入
AI
阿里千问发布全模态大模型 Qwen3.5-Omni,无缝理解文本、图片、音频及音视频输入

阿里千问重磅发布Qwen3 5-Omni:全能全模态大模型,解锁音视频实时交互新时代 2025年,阿里千问(通义千问)正式推出了其革命性的Qwen3 5-Omni全模态大型语言模型。此次发布标志着人工智能模型能力边界的重大突破,从传统的文本、图像处理,全面迈入了复杂的音频、视频理解与实时对话交互的新

热心网友
04.01
通义千问Qwen3.5-Omni发布,多模态能力全面领先
业界动态
通义千问Qwen3.5-Omni发布,多模态能力全面领先

3月30日,阿里发布千问新一代全模态大模型Qwen3 5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3 1 Pro,成为目前全球最强的全模态大模型

热心网友
03.31

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Jane Street反击Terraform内线交易诉讼:Do Kwon已认罪!Terra生态崩盘法律责任早有归属
web3.0
Jane Street反击Terraform内线交易诉讼:Do Kwon已认罪!Terra生态崩盘法律责任早有归属

Jane Street这次出手,可以说是雷霆一击。2026年4月24日,这家全球顶尖的高频交易商向纽约南区联邦法院递交了一份驳回动议,目标非常明确:不仅要驳回诉讼,还要“with prejudice”——这意味着一旦成功,Terraform的破产管理人Todd Snyder将彻底失去再次起诉的机会,

热心网友
04.26
怎样优化求职简历
办公文书
怎样优化求职简历

怎样优化求职简历 个人简历,这块毕业生敲开职场大门的“敲门砖”,分量有多重,不言而喻。那么,一份怎样的简历才能真正抓住招聘方的眼球,获得他们的青睐呢? 应届生个人简历要突出职业感 简历是什么?它是面试之前,用人单位了解你的首要窗口。因此,如何在有限的篇幅里,全面、立体地展示自己的综合能力,就成了关键

热心网友
04.26
专家怎样帮你分析简历
办公文书
专家怎样帮你分析简历

为什么是你?为什么是我? 一个共识在求职者中已经相当普遍:HR筛选简历的时间,真的非常有限。粗略浏览可能只需15秒,即便对感兴趣的简历,深入阅读也往往不超过两分钟。那么问题来了,在这电光火石之间,决定一份简历是“淘汰”、“待定”还是“优秀”的关键,究竟是什么? Dell(中国)的人力资源经理Jess

热心网友
04.26
10条写好简历的建议
办公文书
10条写好简历的建议

让简历外表格外醒目 简历的版式设计,其重要性常常被低估。它不需要多么花哨,但必须足够醒目,能在第一时间抓住阅读者的眼球。不妨审视一下你简历上的空白区域——这些留白和边框恰恰是强调正文、引导视觉流向的利器。巧妙地运用各种字体格式,比如斜体、大写、下划线,或者采用首字突出、首行缩进等排版技巧,都能让信息

热心网友
04.26
简历制作的几点要点
办公文书
简历制作的几点要点

拥有一份黄金简历:应届生求职的必备敲门砖 对于应届生来说,不论寻找什么性质的工作,一份含金量高的简历,都是吸引HR眼球、叩开机会之门的必备敲门砖。那么,关键问题来了:如何才能制作出这样一份高质量的简历呢?现实情况似乎并不乐观。近期某网站的求职调查揭示了一个普遍困境:超过七成的应届生,其实并不清楚简历

热心网友
04.26