首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里Qwen3.5-Omni新突破:音视频交互登顶,全模态能力全球领先

阿里Qwen3.5-Omni新突破:音视频交互登顶,全模态能力全球领先

热心网友
35
转载
2026-04-01

全球全模态大模型竞赛迎来新变数。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

3月30日,阿里巴巴正式推出千问系列新一代全模态大模型Qwen3.5-Omni。

这款模型在音视频理解、跨模态推理、实时交互等215项第三方评测中拿下SOTA(State of the Art),直接对标并超越了谷歌Gemini-3.1 Pro的诸多核心指标。

Qwen3.5-Omni跑分图

与市面上多数“拼接式”多模态方案不同,Qwen3.5-Omni采用混合注意力MoE架构,在海量文本、视觉数据及超过1亿小时的音视频素材上完成了端到端的原生预训练。

这意味着,Qwen3.5-Omni并非简单地将语音转文字再处理,而是真正具备对视频画面、人物情绪、对话逻辑的深层次理解能力。

据最新披露,Qwen3.5-Omni支持113种语言及方言的语音识别(包括毛利语、海南方言等小语种),以及36种语言的语音合成。在考察抗噪能力的WenetSpeech测试中,其错误率远低于Gemini;而在Multi-Lingual 30语言语音生成评测中,表现同样压过Gemini-2.5-Pro-TTS一头。

Qwen3.5-Omni跑分图

更值得关注的是其实时交互的“情商”——Qwen3.5-Omni能精准区分用户的有效指令与随口附和,自主判断是否需要调用工具获取实时信息(如天气查询),对话流畅度已接近真人水平。

如果说年初爆火的Vibe Coding还停留在文字/图片生成代码阶段,Qwen3.5-Omni则直接将这一概念推进到了音视频维度。

用户只需打开摄像头,对着草图或实物口述需求,哪怕是包含复杂产品逻辑的描述,模型也能直接输出带UI界面的产品原型代码。有意思的是,这一能力并非人工刻意调教的结果,而是模型在扩展原生多模态能力过程中自然涌现的副产品。

这种所见即所得的编程方式,对于产品经理、设计师乃至普通用户而言,意味着从想法到原型的路径被压缩到了分钟级。

除此之外,Qwen3.5-Omni在专业内容生产领域同样展现出降本增效的潜力。

模型可对视频画面主体、人物关系、情绪起伏进行像素级拆解,自动完成章节切片与时间戳标注,支持超过10小时的长音频输入。以往需要数小时的人工后期梳理工作,如今可被缩短至秒级。短视频平台、直播平台、内容审核机构、游戏厂商等内容密集型行业,或将成为首批受益者。

难能可贵的是,阿里在商业化路径上延续了千问系列的高性价比策略。

目前,Qwen3.5-Omni已通过阿里云百炼平台开放Plus、Flash、Light三档API接口,普通用户也可在Qwen Chat免费体验。定价方面,每百万Tokens输入价格不到0.8元人民币,不足Gemini-3.1 Pro的十分之一。

据第三方数据,千问系列目前稳居中国企业级大模型调用市场头把交椅,覆盖互联网、金融、消费电子及汽车等行业的超100万家企业客户。

过去半年,市场注意力被OpenAI和谷歌多模态迭代牵引,国内厂商多被质疑为跟随者。但这次,阿里在音视频理解、方言识别和实时交互等细分维度实现了反超,且选择了完全开放的API策略。这或许正是中国AI企业在全球化竞争中找到的有效路径:不追求在所有榜单上霸榜,但在特定高价值场景建立不可替代性。

如今大模型技术门槛被抹平,剩下的就是执行力的较量了。

来源:https://www.leikeji.com/article/75808
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

告别千人一面:阿里Wan2.7图像模型如何破解AI标准脸
业界动态
告别千人一面:阿里Wan2.7图像模型如何破解AI标准脸

4月1日,阿里巴巴发布图像生成与编辑统一模型Wan2 7-Image。直击当前 AI 生图领域“标准脸”审美疲劳和“色彩盲盒”等痛点,该模型可实现“千人千面”,捏出“活人感”,全新的“调色盘”功能可

热心网友
04.01
阿里Qwen3.5-Omni新突破:音视频交互登顶,全模态能力全球领先
科技数码
阿里Qwen3.5-Omni新突破:音视频交互登顶,全模态能力全球领先

全球全模态大模型竞赛迎来新变数。3月30日,阿里巴巴正式推出千问系列新一代全模态大模型Qwen3 5-Omni。这款模型在音视频理解、跨模态推理、实时交互等215项第三方评测中拿下SOTA(Stat

热心网友
04.01
通义千问Qwen3.5-Omni发布,多模态能力全面领先
业界动态
通义千问Qwen3.5-Omni发布,多模态能力全面领先

3月30日,阿里发布千问新一代全模态大模型Qwen3 5-Omni,在音视频理解、识别、交互等215项任务中取得SOTA(性能最佳),超越Gemini-3 1 Pro,成为目前全球最强的全模态大模型

热心网友
03.31
阿里QoderWork移动端打通钉钉微信飞书,一键调用AI
业界动态
阿里QoderWork移动端打通钉钉微信飞书,一键调用AI

3月27日消息,阿里桌面Agent应用QoderWork全面打通钉钉、微信和飞书三大主流IM,用户可直接在手机上与QoderWork对话,随时随地调度桌面AI助手的全部能力,远程完成文件整理、数据处

热心网友
03.27
阿里千问上车红旗汽车:一句话智能指挥座舱各项功能
编程语言
阿里千问上车红旗汽车:一句话智能指挥座舱各项功能

3月26日消息,阿里AI助手千问正式接入红旗汽车智能座舱,这是继AI眼镜之后,千问进一步拓展至更高复杂度的车载场景,加速进入物理世界,迈向全场景AI助手。据悉,千问很快就会首次搭载在红旗HS6 PH

热心网友
03.26

最新APP

你说我猜
你说我猜
休闲益智 04-01
律动轨迹
律动轨迹
休闲益智 04-01
归离九阙
归离九阙
棋牌策略 04-01
一念通天
一念通天
角色扮演 04-01
恶魔秘境
恶魔秘境
角色扮演 04-01

热门推荐

汽水音乐网页版访问入口在哪-汽水音乐网页版如何获取访问入口
手机教程
汽水音乐网页版访问入口在哪-汽水音乐网页版如何获取访问入口

在数字时代,聆听音乐的全新窗口 在当下的数字生活中,音乐已经成为不可或缺的精神食粮。对于广大音乐爱好者来说,一个优质、稳定的在线音乐平台,是实现随时放松与享受的关键。汽水音乐网页版的推出,正是这样一个值得关注的音乐平台入口。它通过网页端的便捷访问,为用户提供了一种流畅、舒适且高效的全新听歌体验,让好

热心网友
04.01
Find N6搭载汇顶创新方案 带来全面拉满的使用体验
科技数码
Find N6搭载汇顶创新方案 带来全面拉满的使用体验

OPPO Find N6折叠屏旗舰与OPPO Watch X3智能手表震撼发布,汇顶科技核心技术赋能 3月17日,OPPO正式发布年度重磅新品——OPPO Find N6大折叠屏旗舰手机与新一代安卓旗舰智能手表OPPO Watch X3。作为其长期深度技术合作伙伴,汇顶科技以多项前沿创新方案,全面加

热心网友
04.01
《重返未来:1999》3.5绿松石蛇俱乐部版本正式上线!
游戏资讯
《重返未来:1999》3.5绿松石蛇俱乐部版本正式上线!

《重返未来:1999》3 5版本「绿松石蛇俱乐部」更新解析:新角色、心相与福利一览 各位玩家久等了!《重返未来:1999》备受瞩目的3 5版本「绿松石蛇俱乐部」现已正式揭晓更新计划。本次版本更新维护将于3月5日上午6:00正式启动,预计持续至10:00。根据以往游戏维护的经验,实际开服时间可能根据情

热心网友
04.01
比特币的价格被定义为多少美元
web3.0
比特币的价格被定义为多少美元

比特币的价格被定义为多少美元 想用一个固定的美元数字来定义比特币的价格?这恰恰误解了它的本质。比特币的价格,从来不是一个由某个中心化机构或公式敲定的“标价”,而是一个由全球无数参与者通过实时交易、持续博弈形成的动态共识。它不像传统货币,由政府权威背书并规定面值。它的价值根基,源于那被广泛认可的、程序

热心网友
04.01
中旅旅行app昵称修改方法
游戏攻略
中旅旅行app昵称修改方法

中旅旅行APP昵称修改步骤详解 想为你的中旅旅行APP账户设置一个更具个性的ID名称吗?修改昵称的流程实际上非常简单便捷,全程仅需一分钟左右即可完成。接下来,我们将通过三个清晰的操作步骤,手把手教你如何快速更换中旅旅行账号的昵称,轻松打造专属的旅行名片。 第一步:打开应用并进入个人主页 首先,请确保

热心网友
04.01