阿里语音大模型斩获Speech Arena国内第一全球第五

时间：2026-05-31 08:57

5月28日，AI领域迎来一则备受关注的消息：在全球权威评测平台Artificial Analysis的语音排行榜（Speech Arena）上，阿里云语音大模型Fun-Realtime-TTS-Preview斩获1190分的Elo评分，位列全球第五、国产第一。这一成绩标志着国产语音模型在国际舞台上的

5月28日，AI领域迎来一则备受关注的消息：在全球权威评测平台Artificial Analysis的语音排行榜（Speech Arena）上，阿里云语音大模型Fun-Realtime-TTS-Preview斩获1190分的Elo评分，位列全球第五、国产第一。这一成绩标志着国产语音模型在国际舞台上的一次硬核实力展示。

更值得关注的是，在ASR（语音转文字）、Chat（端到端语音理解与对话）以及TTS（文字转语音）三大核心赛道上，该模型均夺得全国第一，实现了语音交互领域的“大满贯”。换言之，从“听得准”到“聊得棒”再到“说得好”，阿里这套语音模型在每个环节都达到了国内顶尖水准。

阿里语音大模型在Speech Arena斩获国内第一全球排名第五

事实上，语音大模型的能力可以拆解为三个层次：首先是“听得准”，即ASR能力，确保机器精准识别用户话语；其次是“说得好”，即TTS能力，让发声自然流畅；最后是“聊得棒”，即Chat能力，这才是语音交互的灵魂——实现有来有回的意图理解与回应。这三个层次既各自独立又相互依存，共同构建完整的语音交互体验。缺少任何一环，体验都会大打折扣。

这背后还有一个值得关注的看点：在此之前，阿里语音大模型家族中的另两款模型——Fun-Realtime-ASR和Fun-Realtime-AudioChat，已在该平台上登顶，分别拿下“听准”“听懂”“会聊”三项指标的全球第一，整体表现甚至超越GPT-Realtime-2等国际顶尖语音模型。因此，此次TTS模型的突破，相当于补齐了最后一块拼图。

从落地层面来看，阿里语音大模型家族已深度融入千问App、高德地图、钉钉等国民级应用。无论是地图语音导航中的“我要去XX”，还是钉钉内将会议录音转为文字纪要，背后很可能都是这些模型在实时运作。此外，他们还提供企业级定制接口，支持金融、医疗等特定行业场景的灵活适配。更值得一提的是，阿里语音团队开源的FunASR、CosyVoice等多款模型，在GitHub上累计获得数万星标，深受海内外开发者青睐——这正是一个生态的真正活力所在。

阿里语音大模型在Speech Arena斩获国内第一全球排名第五

总而言之，语音交互正从“能听懂”向“会聊天”加速进化，而阿里云的这一系列动作，无疑为国产语音模型在全球赛道上亮出了关键底牌。

来源：https://m.mydrivers.com/newsview/1125583.html

Speech

上一篇比亚迪腾势Z9GT两月交付超万台，26.98万起 下一篇三星内存涨价获利丰厚台积电称无法效仿

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-06-30

中关村论坛年会AI未来论坛聚焦跃迁投资共生

3月30日，中关村国际创新中心成为人工智能领域瞩目的焦点——2026中关村论坛年会人工智能主题日的重要活动“AI未来论坛：跃迁·投资·共生”在此正式拉开帷幕。本次论坛传递出一个清晰的信号：人工智能正从技术突破迈向产业落地的关键阶段，而资本信心的背后，映射出产业演进的明确风向。海淀区明确表态，将以开放

业界动态 · 2026-06-30

泰国CP AXTRA与菜鸟合作复制中国闪购模式

3月27日，菜鸟集团与泰国正大集团旗下核心零售企业CP AXTRA正式签署战略合作协议。此次合作的核心目标十分明确：菜鸟将充分发挥自身在数字供应链技术、仓储自动化领域的技术优势，以及多年深耕海外仓的运营经验，全力支持CP AXTRA在泰国及东盟国家打造一套线上线下一体化的即时零售物流网络。 CP A