游乐游手机版
首页/科技数码/文章详情

阿里Qwen3.5-Omni发布:多模态能力顶级,视频交互成新突破

时间:2026-03-31 13:04
全球全模态大模型竞赛迎来新变数。3月30日,阿里巴巴正式推出千问系列新一代全模态大模型Qwen3 5-Omni。这款模型在音视频理解、跨模态推理、实时交互等215项第三方评测中拿下SOTA(Stat

全球全模态大模型竞赛迎来新变数。

3月30日,阿里巴巴正式推出千问系列新一代全模态大模型Qwen3.5-Omni。

这款模型在音视频理解、跨模态推理、实时交互等215项第三方评测中拿下SOTA(State of the Art),直接对标并超越了谷歌Gemini-3.1 Pro的诸多核心指标。



Qwen3.5-Omni跑分图

与市面上多数“拼接式”多模态方案不同,Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、视觉数据及超过1亿小时的音视频素材上完成了端到端的原生预训练。

这意味着,Qwen3.5-Omni并非简单地将语音转文字再处理,而是真正具备对视频画面、人物情绪、对话逻辑的深层次理解能力。

据最新披露,Qwen3.5-Omni支持113种语言及方言的语音识别(包括毛利语、海南方言等小语种),以及36种语言的语音合成。在考察抗噪能力的WenetSpeech测试中,其错误率远低于Gemini;而在Multi-Lingual 30语言语音生成评测中,表现同样压过Gemini-2.5-Pro-TTS一头。



Qwen3.5-Omni跑分图

更值得关注的是其实时交互的“情商”——Qwen3.5-Omni能精准区分用户的有效指令与随口附和,自主判断是否需要调用工具获取实时信息(如天气查询),对话流畅度已接近真人水平。

如果说年初爆火的Vibe Coding还停留在文字/图片生成代码阶段,Qwen3.5-Omni则直接将这一概念推进到了音视频维度。

用户只需打开摄像头,对着草图或实物口述需求,哪怕是包含复杂产品逻辑的描述,模型也能直接输出带UI界面的产品原型代码。有意思的是,这一能力并非人工刻意调教的结果,而是模型在扩展原生多模态能力过程中自然涌现的副产品。

这种所见即所得的编程方式,对于产品经理、设计师乃至普通用户而言,意味着从想法到原型的路径被压缩到了分钟级。

除此之外,Qwen3.5-Omni在专业内容生产领域同样展现出降本增效的潜力。

模型可对视频画面主体、人物关系、情绪起伏进行像素级拆解,自动完成章节切片与时间戳标注,支持超过10小时的长音频输入。以往需要数小时的人工后期梳理工作,如今可被缩短至秒级。短视频平台、直播平台、内容审核机构、游戏厂商等内容密集型行业,或将成为首批受益者。

难能可贵的是,阿里在商业化路径上延续了千问系列的高性价比策略。

目前,Qwen3.5-Omni已通过阿里云百炼平台开放Plus、Flash、Light三档API接口,普通用户也可在Qwen Chat免费体验。定价方面,每百万Tokens输入价格不到0.8元人民币,不足Gemini-3.1 Pro的十分之一。

据第三方数据,千问系列目前稳居中国企业级大模型调用市场头把交椅,覆盖互联网、金融、消费电子及汽车等行业的超100万家企业客户。

过去半年,市场注意力被OpenAI和谷歌多模态迭代牵引,国内厂商多被质疑为跟随者。但这次,阿里在音视频理解、方言识别和实时交互等细分维度实现了反超,且选择了完全开放的API策略。这或许正是中国AI企业在全球化竞争中找到的有效路径:不追求在所有榜单上霸榜,但在特定高价值场景建立不可替代性。

如今大模型技术门槛被抹平,剩下的就是执行力的较量了。

来源:https://www.163.com/dy/article/KPBJVO7Q051100B9.html
上一篇苹果在华申请多项AI图形商标,布局下一代视觉技术 下一篇手机影像AI再进化:核心入口如何洞察用户真实场景
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo