阿里云近日发布重大更新,正式推出Qwen3-VL系列的dense紧凑版本,面向用户提供4B和8B两种参数规模的选择。每个参数规格均包含Instruct和Thinking两种变体,以适应不同应用场景下的多样化需求。
这一新系列模型在技术层面实现了三项关键突破。首先,通过架构优化设计,显存占用显著降低,使其能够适配更多类型的硬件环境,为开发者提供更灵活的部署方案。其次,尽管参数规模有所精简,模型完整保留了Qwen3-VL系列的全部能力,特别是在多模态任务处理方面,性能表现与原版相比毫不逊色。第三,在STEM学科、视觉问答、光学字符识别、视频理解等多个专业领域,模型均展现出卓越的性能水准。
在基准测试中,Qwen3-VL的4B和8B版本表现尤为亮眼。与Gemini 2.5 Flash Lite和GPT-5 Nano等同类模型相比,新版在STEM & Puzzle、通用VQA等多项任务中均取得了更优异的成绩。部分指标甚至接近半年前发布的旗舰款Qwen2.5-VL-72B,彰显了其在小参数规模下的高效性能。
为简化用户部署流程,阿里云还同步提供了FP8版本,进一步提升模型的运行效率。用户可通过Hugging Face和ModelScope平台获取相关资源,或通过阿里云ModelStudio平台调用Qwen3-VL-8B-Instruct和Qwen3-VL-8B-Thinking的API服务。GitHub上还提供了详细的操作指南,帮助开发者快速上手应用。
从基准测试数据可以看出,Qwen3-VL 4B/8B版本在多个任务类别中的表现均优于Gemini 2.5 Flash Lite和GPT-5 Nano,部分指标甚至达到了Qwen2.5-VL-72B的水准。这一结果有力印证了新版本模型在小参数规模下的强大能力。
如需了解更AI领域的最新资讯,可访问:https://www.aipress.com.cn/
