首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里发布开源AI模型Qwen3-Omni,首个端到端全模态大模型

阿里发布开源AI模型Qwen3-Omni,首个端到端全模态大模型

热心网友
81
转载
2025-09-23

阿里云于今日(9月23日)正式推出开源项目Qwen3-Omni、Qwen3-TTS,以及对标谷歌Nano Banana的全新图像编辑工具Qwen-Image-Edit-2509。

\

Qwen3-Omni作为全球首个原生端到端全模态AI模型,突破性地实现了文本、图像、音频和视频等多模态数据的同步处理能力。其创新的流式输出技术不仅支持实时文本交互,更能以自然语音方式呈现结果,有效解决了传统多模态建模必须权衡不同功能的行业难题。

这款多语言全模态基础模型具有以下显著优势:

行业领先的跨模态性能:基于文本预训练与混合多模态训练相结合的独特架构,在保持单模态文字和图像处理能力的前提下,音频及视频处理水平达到行业新高度。

\

在36项核心测评指标中,22项位居世界领先地位,其中的32项在开源领域保持第一。特别是在语音识别(ASR)、音频理解和语音对话等关键场景,其综合表现与Gemini 2.5 Pro旗鼓相当。

\

多语言支持能力:可处理119种文本语言、19种语音输入语言及10种可输出语音语言。语音输入覆盖全球主要语种,输出则包括英、中、法、德等10种常用语言。

技术创新亮点:采用MoE架构的"思考者-表达者"设计,结合AuT预训练技术实现卓越的泛化能力,并通过多码本设计实现超低延迟。

同步推出的Qwen3-TTS语音合成系统突破性地提供17种人声音色选择,每种音色均支持10种语言输出。除国际通用语种外,还特别加入了闽南语、粤语等8种中国地方方言。

\

在专业评测中,Qwen3-TTS-Flash的表现全面超越SeedTTS、MiniMax等竞品,在语音稳定性和音色逼真度等关键指标上达到行业最高水准。

\

Qwen-Image-Edit-2509作为月度迭代产品,其核心升级在于显著提升了图像编辑一致性,这一改进方向与字节最新的即梦4.0模型不谋而合。

\

与8月版本相比,新版主要具备三大特性:

1. 突破性支持多图合成编辑,可完美处理1-3张图像的组合场景,包括人物合影、商品展示等典型应用。

2. 单图编辑一致性获得全面提升,特别在人物肖像、商品展示和文字修改等高频使用场景表现突出。

3. 原生整合ControlNet插件,支持深度图、边缘图等多种高级图像控制方式。

此外,阿里云同期还开源了Qwen3-Next-80B-A3B-Instruct-FP8和Qwen3-Next-80B-A3B-Thinking-FP8两个专业模型。

来源:https://www.donews.com/news/detail/1/6135970.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

思必驰携手阿里云深化AI战略合作
AI资讯
思必驰携手阿里云深化AI战略合作

思必驰与阿里云达成全面AI合作,共同打造智能座舱行业标杆。双方将围绕行业模型共建、算力赋能及千问大模型融合等方面深度协同,强化思必驰“超级天琴2 0”的端云协同与场景推理能力,借助阿里云技术提升车载AI交互体验与落地效率,助力中国汽车智能化发展。

热心网友
05.22
阿里云重塑自身定位打造能运行智能体的云计算平台
科技数码
阿里云重塑自身定位打造能运行智能体的云计算平台

阿里云发布“AgenticCloud”战略,全面重构云服务以适配智能体时代。平头哥推出真武M890芯片提升算力,通义千问模型强化Agent能力,并推出“千问云”服务平台,将云资源转化为智能体可直连的标准化接口。阿里云从芯片、模型到平台进行端到端升级,旨在为大规模智能体应用提供全栈解决方案。

热心网友
05.21
阿里云百炼平台接入智谱GLM-5.1与MiniMax M2.7第三方模型
AI资讯
阿里云百炼平台接入智谱GLM-5.1与MiniMax M2.7第三方模型

阿里云百炼平台宣布引入智谱GLM-5 1、MiniMaxM2 7等多家第三方模型,已正式上架开售。此举旨在打造开放的AI云平台,提供一站式多模型服务。此前平台已接入DeepSeek等模型,其API定价具备市场竞争力。

热心网友
05.20
阿里通义CoPaw 1.0发布:定制模型与多智能体安全升级
AI资讯
阿里通义CoPaw 1.0发布:定制模型与多智能体安全升级

2025年3月31日,阿里通义实验室正式推出CoPaw智能体框架的1 0版本。此次重大更新,标志着这一基于AgentScope生态构建的智能体开发平台,实现了从架构到能力的全面进化。其核心依然由框架层、记忆层与模型层三层构成,但各项具体功能已得到显著增强,旨在解决开发者在实际部署与应用中的核心挑战。

热心网友
05.20
游戏AI开发为何首选阿里云头部厂商合作案例解析
AI资讯
游戏AI开发为何首选阿里云头部厂商合作案例解析

游戏云市场格局已定,阿里云持续领跑 2025年,全球游戏产业总收入达到1960亿美元的历史新高,规模堪比中等国家GDP。然而,在亮眼数字背后,行业正面临严峻挑战:剔除通胀影响后,实际购买力仅与2024年持平。更令开发者压力倍增的是,3A大作的开发成本已攀升至平均2亿美元,团队规模动辄上千人,但游戏首

热心网友
05.19

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

英特尔Titan Lake处理器全系支持LPDDR6内存
业界动态
英特尔Titan Lake处理器全系支持LPDDR6内存

英特尔下一代TitanLake处理器全系支持LPDDR6内存。面向主流笔记本的U、P及高能效PX系列还将兼容LPDDR5X与DDR5,为设备设计提供灵活性。U、P、PX系列采用Intel18A工艺的新CPU模块,而B、BX系列沿用旧架构。高端PX系列集成GPU采用台积电N2P工艺,配备16个Xe核心,旨在提升图形性能。

热心网友
05.23
比特币巨鲸4.96亿美元空单引发市场对去中心化公信的深度讨论
web3.0
比特币巨鲸4.96亿美元空单引发市场对去中心化公信的深度讨论

一只鲸鱼做空比特币 4 96 亿美元,触发市场公信讨论 最近,链上数据捕捉到的一笔大额交易,瞬间吸引了所有市场参与者的目光:一只比特币巨鲸,悄然开立了价值近5亿美元的空单。这笔操作如同一块投入平静湖面的巨石,不仅激起了短线的价格波澜,更将市场深层的公信机制与交易透明度问题,再次推到了讨论的中心。 鲸

热心网友
05.23
四海兄弟故乡成就快速达成攻略
游戏攻略
四海兄弟故乡成就快速达成攻略

解锁《四海兄弟》“故乡没那么快”成就需耐心探索:深入隐秘角落,留意环境细节;积极与居民互动,收集对话线索;完成相关支线任务,关注伏笔;并注意特定时段触发的事件。成就进度可累积,坚持全面探索方能最终达成。

热心网友
05.23
鬼谷子最强出装推荐与实战打法攻略
游戏攻略
鬼谷子最强出装推荐与实战打法攻略

鬼谷子是战术型辅助,核心在于技能运用与合理出装。二技能是关键控制,配合大招的群体伪装可发起突袭。出装以冷却缩减和生存能力为主,如冷静之靴、极寒风暴和魔女斗篷。实战中需把握进场时机,从侧翼切入控制敌方核心,并注意与队友配合衔接伤害。

热心网友
05.23
AI音效生成工具OptimizerAI自动为视频添加背景音乐
AI教程
AI音效生成工具OptimizerAI自动为视频添加背景音乐

在游戏开发、动画制作、视频创作等数字内容领域,专业音效设计是提升作品沉浸感与专业度的关键。然而,传统音效制作流程往往依赖昂贵的专业设备与庞大的素材库,对独立开发者、小型团队及个人创作者构成了较高的技术门槛与成本压力。近期,一款名为OptimizerAI的人工智能音效生成平台备受关注,它致力于通过AI

热心网友
05.23