首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

热心网友
28
转载
2026-04-20

阿里通义发布Fun-ASR1.5语音识别大模型:支持30种语言与汉语七大方言,识别准确率大幅提升

近日,语音识别技术领域迎来重大突破。阿里通义实验室正式推出其新一代语音识别大模型——Fun-ASR1.5。此次发布并非简单的功能升级,其展现出的强大技术包容性与广泛适用性,已在行业内引起广泛关注。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

那么,这款语音识别模型的核心优势是什么?答案在于其“一体化”的设计理念。Fun-ASR1.5基于统一的大模型架构,实现了前所未有的识别广度:仅凭单一模型,即可流畅处理全球30种主流语言,并全面覆盖汉语的七大方言体系及二十余种地方口音。更令人印象深刻的是,它甚至能够尝试对富有韵律的古诗词吟诵进行精准文本转写,这充分验证了其卓越的模型泛化与适应能力。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

实际测试数据充分证明了其性能。在典型的方言语音识别任务中,Fun-ASR1.5表现突出,其字错误率(CER)实现了高达56.2%的相对降低。目前,该模型对5种方言的识别准确率已超过90%,另有15种方言的准确率稳定在80%以上。这意味着,对于绝大多数带有地方口音的普通话,模型已具备可靠的实用化基础,能满足多种场景下的高精度转写需求。

当然,高精度的语音转文字只是第一步。Fun-ASR1.5的智能化还体现在深度的文本后处理能力上。模型能够自动为冗长的口语化句子添加恰当的标点符号,并将口语中频繁出现的数字、日期、金额、手机号码等信息,自动转换为符合规范的书面格式。这一功能看似细节,却在实际应用中至关重要。

试想,在整理会议录音、处理访谈内容、或生成司法庭审笔录时,大量的人工工时往往消耗在繁琐的文本校对与格式规整上。Fun-ASR1.5的推出,正是为了显著减少这类重复性劳动,让专业人士能将精力集中于内容分析、信息提炼与核心决策等更具价值的工作。

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

对于广大开发者和企业用户而言,Fun-ASR1.5的接入与使用也非常便捷。目前,用户可以通过两种主要途径体验该模型:一是直接通过阿里云百炼平台调用其API服务,快速集成至自有产品或工作流中;二是前往魔搭社区,免费在线体验Fun-ASR1.5的全部功能,亲身测试其多语言、多方言的实时识别效果。

相关体验地址如下:

阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr

魔搭社区:https://modelscope.cn/studios/iic/FunAudio-ASR

来源:https://m.mydrivers.com/newsview/1117046.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里通义千问AI如何重塑淘宝智能购物新体验
业界动态
阿里通义千问AI如何重塑淘宝智能购物新体验

阿里巴巴将通义千问AI与淘宝深度整合,以对话式交互替代传统搜索。用户可通过自然语言描述需求,AI能理解并完成浏览、比价和下单等全流程。该智能体接入超40亿商品,并能调动物流、售后等服务,提供一站式支持。淘宝APP内还将上线AI购物助手,新增虚拟试穿、价格追踪等功能,旨在让购物更智能便捷。

热心网友
05.11
通义千问 API 调用价格一年下降 97%
AI
通义千问 API 调用价格一年下降 97%

世界互联网大会乌镇峰会开幕:AI驱动的新价值时代 在乌镇峰会的全体会议上,阿里巴巴集团CEO吴泳铭抛出了一个鲜明的判断:当下人工智能对千行百业生产力的推动,其所能创造的价值规模,将远远超越过去互联网所实现的“连接”。这不仅仅是一个技术趋势的预言,更像是对未来三十年发展重心的重新锚定。 从“连接”到“

热心网友
04.29
通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3 等竞品,暂未开源
AI
通义千问 Qwen 2.5-Max 超大规模 MoE 模型号称优于 Deepseek V3 等竞品,暂未开源

通义千问 Qwen 2 5-Max:阿里云发布超大规模MoE模型,性能表现引关注 新年伊始,国内AI领域就迎来一则重磅消息。阿里云正式公布了其全新的通义千问 Qwen 2 5-Max 模型,定位为超大规模混合专家模型。目前,开发者已能通过API调用体验其能力,普通用户也可以直接登录Qwen Chat

热心网友
04.28
阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系
业界动态
阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

阿里通义发布Fun-ASR1 5语音识别大模型:支持30种语言与汉语七大方言,识别准确率大幅提升 近日,语音识别技术领域迎来重大突破。阿里通义实验室正式推出其新一代语音识别大模型——Fun-ASR1 5。此次发布并非简单的功能升级,其展现出的强大技术包容性与广泛适用性,已在行业内引起广泛关注。 那么

热心网友
04.20
阿里云 CoPaw 宣布更名为 QwenPaw,深化通义千问开源生态整合
AI
阿里云 CoPaw 宣布更名为 QwenPaw,深化通义千问开源生态整合

阿里云桌面Agent工具CoPaw正式更名QwenPaw,深化开源生态整合 4月12日,开源社区迎来一则动态更新:阿里云旗下的桌面Agent工具CoPaw,发布了全新的1 1 0版本,并正式宣布更名为QwenPaw。 项目团队表示,这次品牌重塑绝非简单的“换马甲”,而是标志着项目进入了一个全新的开源

热心网友
04.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

PUBG赏金行动5月13日上线玩法解析与体验分享
游戏攻略
PUBG赏金行动5月13日上线玩法解析与体验分享

PUBG全新限时合作模式“赏金行动”将于5月13日正式上线!本次更新是PUBG与经典合作劫案游戏《收获日》的开发商Starbreeze深度联动,共同打造的全新PvE合作玩法。模式开放时间将持续至6月10日,为玩家提供了充足的时间来深入体验这场独特的团队劫案冒险。 该模式的核心玩法是“团队合作劫案”。

热心网友
05.11
小红书启动新一轮期权回购计划在职离职员工价格不同
科技数码
小红书启动新一轮期权回购计划在职离职员工价格不同

小红书近期启动今年首次期权回购,在职员工每股25 5美元,离职员工每股21美元。回购价较去年3月上涨2 2倍,为去年4月以来第三次回购。公司期权授予价已调至每股30美元,潜在收益显著。近期有基金以高估值出售老股,市场看好其利润增长与估值支撑。

热心网友
05.11
字节跳动推出多闪挑战微信社交霸主地位
科技数码
字节跳动推出多闪挑战微信社交霸主地位

字节跳动旗下社交应用“多闪”与“可颂”月活显著增长。公司调整策略,依托抖音生态,以兴趣社交连接用户,通过游戏化功能增强粘性,并瞄准年轻群体对轻松社交的需求,尝试以兴趣链部分替代传统关系链,旨在盘活生态内熟人关系,探索差异化路径。

热心网友
05.11
荣耀600系列5月发布 肖战代言影像旗舰点亮四城地标
科技数码
荣耀600系列5月发布 肖战代言影像旗舰点亮四城地标

荣耀600系列将于5月发布,由代言人肖战助阵,并通过北京、上海等四城地标大屏进行线下预热。国际版与国行版设计风格各异,后者后盖融入“幸运星”图案。新系列搭载骁龙8至尊版平台,配备2亿像素主摄与3 5倍长焦镜头,并新增AI物理按键以提升智能交互体验。

热心网友
05.11
摩根大通看好比亚迪三大亮点 H股目标价120港元评级增持
科技数码
摩根大通看好比亚迪三大亮点 H股目标价120港元评级增持

摩根大通报告指出,比亚迪电话会议透露三大积极信号:国内销量指引达350万至400万辆,高于市场预期;海外需求强劲,150万辆目标或可上调;搭载新技术的车型将推动产品结构升级,显著提升平均售价与盈利能力。基于此,摩根大通维持“增持”评级,H股目标价120港元。

热心网友
05.11