阿里发布开源AI模型Qwen3-Omni,首个端到端全模态大模型
阿里云于今日(9月23日)正式推出开源项目Qwen3-Omni、Qwen3-TTS,以及对标谷歌Nano Banana的全新图像编辑工具Qwen-Image-Edit-2509。

Qwen3-Omni作为全球首个原生端到端全模态AI模型,突破性地实现了文本、图像、音频和视频等多模态数据的同步处理能力。其创新的流式输出技术不仅支持实时文本交互,更能以自然语音方式呈现结果,有效解决了传统多模态建模必须权衡不同功能的行业难题。
这款多语言全模态基础模型具有以下显著优势:
行业领先的跨模态性能:基于文本预训练与混合多模态训练相结合的独特架构,在保持单模态文字和图像处理能力的前提下,音频及视频处理水平达到行业新高度。

在36项核心测评指标中,22项位居世界领先地位,其中的32项在开源领域保持第一。特别是在语音识别(ASR)、音频理解和语音对话等关键场景,其综合表现与Gemini 2.5 Pro旗鼓相当。

多语言支持能力:可处理119种文本语言、19种语音输入语言及10种可输出语音语言。语音输入覆盖全球主要语种,输出则包括英、中、法、德等10种常用语言。
技术创新亮点:采用MoE架构的"思考者-表达者"设计,结合AuT预训练技术实现卓越的泛化能力,并通过多码本设计实现超低延迟。
同步推出的Qwen3-TTS语音合成系统突破性地提供17种人声音色选择,每种音色均支持10种语言输出。除国际通用语种外,还特别加入了闽南语、粤语等8种中国地方方言。

在专业评测中,Qwen3-TTS-Flash的表现全面超越SeedTTS、MiniMax等竞品,在语音稳定性和音色逼真度等关键指标上达到行业最高水准。

Qwen-Image-Edit-2509作为月度迭代产品,其核心升级在于显著提升了图像编辑一致性,这一改进方向与字节最新的即梦4.0模型不谋而合。

与8月版本相比,新版主要具备三大特性:
1. 突破性支持多图合成编辑,可完美处理1-3张图像的组合场景,包括人物合影、商品展示等典型应用。
2. 单图编辑一致性获得全面提升,特别在人物肖像、商品展示和文字修改等高频使用场景表现突出。
3. 原生整合ControlNet插件,支持深度图、边缘图等多种高级图像控制方式。
此外,阿里云同期还开源了Qwen3-Next-80B-A3B-Instruct-FP8和Qwen3-Next-80B-A3B-Thinking-FP8两个专业模型。

相关攻略
思必驰与阿里云达成全面AI合作,共同打造智能座舱行业标杆。双方将围绕行业模型共建、算力赋能及千问大模型融合等方面深度协同,强化思必驰“超级天琴2 0”的端云协同与场景推理能力,借助阿里云技术提升车载AI交互体验与落地效率,助力中国汽车智能化发展。
阿里云发布“AgenticCloud”战略,全面重构云服务以适配智能体时代。平头哥推出真武M890芯片提升算力,通义千问模型强化Agent能力,并推出“千问云”服务平台,将云资源转化为智能体可直连的标准化接口。阿里云从芯片、模型到平台进行端到端升级,旨在为大规模智能体应用提供全栈解决方案。
阿里云百炼平台宣布引入智谱GLM-5 1、MiniMaxM2 7等多家第三方模型,已正式上架开售。此举旨在打造开放的AI云平台,提供一站式多模型服务。此前平台已接入DeepSeek等模型,其API定价具备市场竞争力。
2025年3月31日,阿里通义实验室正式推出CoPaw智能体框架的1 0版本。此次重大更新,标志着这一基于AgentScope生态构建的智能体开发平台,实现了从架构到能力的全面进化。其核心依然由框架层、记忆层与模型层三层构成,但各项具体功能已得到显著增强,旨在解决开发者在实际部署与应用中的核心挑战。
游戏云市场格局已定,阿里云持续领跑 2025年,全球游戏产业总收入达到1960亿美元的历史新高,规模堪比中等国家GDP。然而,在亮眼数字背后,行业正面临严峻挑战:剔除通胀影响后,实际购买力仅与2024年持平。更令开发者压力倍增的是,3A大作的开发成本已攀升至平均2亿美元,团队规模动辄上千人,但游戏首
热门专题
热门推荐
英特尔下一代TitanLake处理器全系支持LPDDR6内存。面向主流笔记本的U、P及高能效PX系列还将兼容LPDDR5X与DDR5,为设备设计提供灵活性。U、P、PX系列采用Intel18A工艺的新CPU模块,而B、BX系列沿用旧架构。高端PX系列集成GPU采用台积电N2P工艺,配备16个Xe核心,旨在提升图形性能。
一只鲸鱼做空比特币 4 96 亿美元,触发市场公信讨论 最近,链上数据捕捉到的一笔大额交易,瞬间吸引了所有市场参与者的目光:一只比特币巨鲸,悄然开立了价值近5亿美元的空单。这笔操作如同一块投入平静湖面的巨石,不仅激起了短线的价格波澜,更将市场深层的公信机制与交易透明度问题,再次推到了讨论的中心。 鲸
解锁《四海兄弟》“故乡没那么快”成就需耐心探索:深入隐秘角落,留意环境细节;积极与居民互动,收集对话线索;完成相关支线任务,关注伏笔;并注意特定时段触发的事件。成就进度可累积,坚持全面探索方能最终达成。
鬼谷子是战术型辅助,核心在于技能运用与合理出装。二技能是关键控制,配合大招的群体伪装可发起突袭。出装以冷却缩减和生存能力为主,如冷静之靴、极寒风暴和魔女斗篷。实战中需把握进场时机,从侧翼切入控制敌方核心,并注意与队友配合衔接伤害。
在游戏开发、动画制作、视频创作等数字内容领域,专业音效设计是提升作品沉浸感与专业度的关键。然而,传统音效制作流程往往依赖昂贵的专业设备与庞大的素材库,对独立开发者、小型团队及个人创作者构成了较高的技术门槛与成本压力。近期,一款名为OptimizerAI的人工智能音效生成平台备受关注,它致力于通过AI





