阿里Qwen发布Qwen3-Omni全模态AI与新版2509图像编辑工具

时间：2025-09-23 15:09

阿里旗下Qwen团队近日动作频频，接连推出两款具有突破性的AI模型——Qwen3-Omni与Qwen-Image-Edit-2509，引发业界广泛关注。其中，Qwen3-Omni作为全球首个原生端到

阿里巴巴旗下Qwen团队近期新品迭出，重磅发布两款革命性AI产品Qwen3-Omni与Qwen-Image-Edit-2509，引发行业热议。其中，Qwen3-Omni开创性地实现了原生端到端全模态架构，为多模态AI技术树立了新标杆。

Qwen3-Omni：重塑多模态交互体验

该产品的最大创新在于其"大一统"架构设计。突破传统多模态模型性能不均衡的局限，它通过统一的深度学习框架实现了文本、图像、音频、视频四大领域的完美协同。在最新性能测试中，该模型包揽36个音视频基准测试中22项的榜首，特别是在长篇语音理解方面展现惊人实力——可精准解析半小时以上的连续对话，处理速度仅为211毫秒。

全球化语言支持体系

语言处理维度同样令人惊艳：支持119种文本语言、19种语音输入和10种语音输出语种。通过创新性的系统提示词调控机制，开发者可以轻松定制模型行为，结合内置的功能调用接口，让不同场景的AI落地变得轻而易举。团队还特别开源了低误差字幕生成模块，为多媒体内容创作提供了专业级工具链。

开发者友好型架构

目前包括Qwen3-Omni-30B-A3B-Instruct在内的多个版本已在Hugging Face平台开放下载，同时提供网页版实时体验。这种开放态度极大降低了开发者的准入门槛。

Qwen-Image-Edit-2509：工业级图像处理革命

同期推出的图像编辑模型在视觉一致性控制上取得质的飞跃。其多图融合技术可以自然衔接人物主体与各类场景元素，单图编辑过程中能完美保持人脸特征稳定，即便是广告产品的品牌元素也能毫发无损。文字编辑功能更是涵盖内容、风格、材质等全维度调整。

智能控制技术突破

该产品的核心技术优势在于创新的ControlNet系统。通过深度图解析、边缘检测等智能调控手段，实现了专业级图像处理的"傻瓜化"操作。这种模块化设计大幅简化了复杂图像处理的工作流程，让非专业人士也能获得专业视觉效果。

从详细技术白皮书展示的对比案例来看，这两款产品不仅彰显了阿里巴巴在AI底层技术上的深厚积累，更通过开源协作模式为行业创新注入了新动能。随着开发者社区的持续壮大，全模态AI的商业化进程必将迎来突破性的发展机遇。

来源：https://www.itbear.com.cn/html/2025-09/965472.html

上一篇欧盟FiDA新规将限制美国科技巨头市场准入 下一篇国产风华3号GPU正式发布首款全功能图形处理器面世

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售，支持4K165Hz与FHD520Hz双模切换，定价1888元。采用FastIPS面板，97%DCI-P3色域，配备升降支架及双HDMI2 1和双DP1 4接口。

科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年，DRAM与NAND闪存的供应持续紧张及价格不断攀升，正逐步传导至终端消费市场。可以预见，下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价，最终连苹果也不得不跟进，宣布提升iPad、Mac及家居设备的价格，以应对存储成本的快速上涨。 TrendForce分析指出，苹果全面