首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里千问3.5-Omni全模态大模型详解与应用前瞻

阿里千问3.5-Omni全模态大模型详解与应用前瞻

热心网友
24
转载
2026-03-31

IT之家 3 月 30 日消息,阿里千问今晚发布全模态大模型 Qwen3.5-Omni。

IT之家附核心亮点如下:

无缝理解文本、图片、音频及音视频输入,支持细粒度、带时间戳的音视频 Caption 生成;215 项 SOTA 霸榜,在音频及音视频分析、推理、对话、翻译等任务超过 Gemini3.1-Pro;自然涌现的 Audio-Visual Vibe Coding 能力;支持语义打断、音色克隆及语音控制,让对话体验更自然;支持 256K 超长上下文与 113 种语言识别,可处理 10 小时音频或 1 小时视频。原生支持 WebSearch 和复杂 Function Call,不仅能聊天,更能帮你做事。

视频创作与剪辑

上传一段视频,Qwen3.5-Omni-Plus 能够遵循指令生成细粒度,结构化,带时间戳的准确 Caption:画面里是谁、说了什么话、背景音乐从哪一秒开始变化、镜头切了几次、每一帧发生了什么...... 还能帮你判断这段视频有没有敏感内容,将长视频变成可搜索的结构化笔记。

根据音视频指令,生成网页内容

根据你的要求,Qwen3.5-Omni 能直接生成可运行的代码。这也是本次我们最惊喜的发现:未进行专门训练,模型自然涌现出了 Vibe Coding 能力。它可以根据画面逻辑生成 Python 代码或前端原型…… 让创意验证从“看”到“做”只需一步。

更像真人的实时对话

和 Qwen3.5-Omni 聊天,更像是在跟真人交流。它懂得倾听的分寸:咳嗽声或随口附和不会让它误停下来,但你的真正插话它能瞬间接住。你还能指令它“小声点”、“用开心的语气”,像人一样自由控制声音的大小、语速与情绪,让对话体验更自然。

专属音色克隆

上传一段你的录音,就能定制专属的 AI Assistant 音色。克隆后的声音自然度高、稳定性强,支持多种语言生成。你可以打造一个“数字分身”式助手,让它用你的声音去沟通、去陪伴,让交互更具个性化。

智能任务执行

不止是聊天,Qwen3.5-Omni 还能帮你办事。询问“明天北京天气如何,推荐一家酒店”,它能自主判断是否需要联网搜索,调用工具查询实时信息并给出完整建议…… 原生支持 WebSearch 和复杂工具调用,让模型真正成为你的执行助手。

相比上一代,Qwen3.5-Omni 在长上下文、多语言、音视频理解能力上都有明显提升,同时新增了语义打断、音色克隆、语音控制等实时交互能力,让对话体验更接近真人。配合 ARIA 技术,语音输出的稳定性和自然度也进一步改善。


Qwen3.5-Omni-Plus 在音频 / 音视频的理解、推理和交互任务上,共取得 215 项 SOTA 成绩,涵盖音视频、音频、语音识别、语音翻译等多个方向。

其中,通用音频理解、推理、识别、翻译、对话全面超越 Gemini-3.1 Pro,音视频理解能力总体达到 Gemini-3.1 Pro 水平。同时,视觉和文本能力与同尺寸 Qwen3.5 模型持平。


▲ Audio-Visual(音视频)


Audio(音频理解)


▲ Text(文本能力)


Speech Generation(语音生成)

用户可以通过阿里云百炼搜索 Qwen3.5-Omni 调用 API,提供了 Plus、Flash、Light 三种尺寸,满足不同场景需求。

来源:https://www.163.com/dy/article/KPA64SVU0511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

2026年人类或将失去对人工智能的最终控制权
AI
2026年人类或将失去对人工智能的最终控制权

三天前,《纽约时报》刊登了一篇看似平静却暗藏玄机的深度报道。它没有冲上热搜,也未引爆Hacker News,甚至在中文互联网的讨论中也踪迹寥寥。但恰恰是这篇文章,很可能成为2026年春天乃至未来数年,理解人工智能发展轨迹的一个关键性坐标。 文章的标题平实而直接——《How Do You Measur

热心网友
05.18
6集文献纪录片《辜鸿铭》即将播出
娱乐
6集文献纪录片《辜鸿铭》即将播出

一部展现清末民初文化学者辜鸿铭传奇一生的文献纪录片《辜鸿铭》,将于近日在中央新影发现之旅频道播出。 这部纪录片想做的,是借助影像的力量,带观众穿越百年的世界风云,跨越东西方文化的藩篱,去真正走近并理解辜鸿铭这个人。全片共6集,每集48分钟,从《生在南洋》《认识西洋》《寻祖归宗》,到《文以载道》《西风

热心网友
04.24
【深一度】让城市成为故事“主角”
娱乐
【深一度】让城市成为故事“主角”

一座城市如何被记住? 过去,答案或许是地标建筑;后来,可能是一支精美的宣传片。但如今,风向正在悄然转变——《太原之约》的出现,让我们看到了一种新的可能:城市,正在从“被讲述的对象”转变为“会讲故事的主体”。 从背景板到故事主角:一场叙事的深层变革 一部微短剧,究竟能为一座城市带来什么?《太原之约》开

热心网友
04.23
科氪 | 变革传统同传设备,亮亮视野推出全球首创AR+AI会议翻译系统,部署中关村论坛
科技数码
科氪 | 变革传统同传设备,亮亮视野推出全球首创AR+AI会议翻译系统,部署中关村论坛

在2026中关村论坛主会场,全球首创的AR+AI会议翻译系统正式亮相 2026中关村论坛的主会场,迎来了一项突破性部署。亮亮视野与智谱AI联合推出并落地了全球首个AR+AI会议翻译系统,为大会主论坛及多场平行论坛提供了核心的翻译保障。这套系统深度融合了AR眼镜与大模型能力,其指标颇为亮眼:支持54种

热心网友
04.18
中关村论坛这套AR+AI翻译系统,有望拆掉国际会议的“信息围墙”|聚焦中关村论坛
科技数码
中关村论坛这套AR+AI翻译系统,有望拆掉国际会议的“信息围墙”|聚焦中关村论坛

中关村论坛参会人员佩戴眼镜照片(亮亮视野展台提供) 本报(chinatimes net cn)记者张玫 北京报道 一场没有同传耳机的国际论坛 3月27日,由中国残联、北京市政府主办,北京市残联承办的2026中关村论坛年会科技助残论坛在北京举行。 如果你在现场,可能会发现一个有趣的现象:部分参会者并未

热心网友
04.18

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

异人之下手游陆瑾连招技巧 安卓版技能玩法教学
游戏攻略
异人之下手游陆瑾连招技巧 安卓版技能玩法教学

陆瑾是《异人之下》手游中操作门槛较高的角色,主打中近距离压制。其核心在于普攻攒炁,并衔接常技【太冲震恚】与【曲泉交忿】进行输出。关键技能【五雷符】可攻可守,成功防御反击可重置冷却。连招依赖“反手”逻辑与精准预判,形成攻防循环。投技【双龙探爪】与【戾走急脉】则需把握时机,分别用于破防与针。

热心网友
05.20
欧易投资策略指南:新手如何制定稳健的Web3投资计划
web3.0
欧易投资策略指南:新手如何制定稳健的Web3投资计划

投资策略需要明确目标与风险偏好,合理分配资金。通过研究项目基本面、关注市场周期与情绪,建立多元化组合。执行中需设定清晰的买卖规则,利用工具辅助决策,并保持长期视角与纪律性,避免情绪化操作。定期复盘与调整是策略持续有效的关键。

热心网友
05.20
异人之下手游巴伦技能强度解析与安卓实战教程
游戏攻略
异人之下手游巴伦技能强度解析与安卓实战教程

巴伦是《异人之下》手游中的近战压制型角色,核心玩法在于追击与倒地连招。其技能“破势突击”衔接流畅,“极速连斩”可追击倒地目标,“飞身十字固”抓取伤害高,“逆势突围”用于防守反击。角色操作上限高,需练习掌握连招循环,但对战远程角色时较为吃力。

热心网友
05.20
谷歌Gemini 3.5 Pro模型正式发布 性能大幅提升下月上线
AI
谷歌Gemini 3.5 Pro模型正式发布 性能大幅提升下月上线

谷歌宣布Gemini3 5Pro模型下月发布,已在内部广泛使用且进步显著。具体技术细节、性能参数及开放计划尚未公布,更多信息将于下月揭晓。

热心网友
05.20
谷歌AI Ultra订阅计划上线 每月100美元起享高级功能
AI
谷歌AI Ultra订阅计划上线 每月100美元起享高级功能

谷歌在2026年I O大会上推出月费100美元的新AI订阅计划,旨在填补其现有20美元与250美元两档服务之间的市场空白。该计划面向需要更多资源的高级用户和小型团队,提供比基础版更强的性能,同时避免企业级的高昂成本,以竞争中高端市场。

热心网友
05.20