阿里通义实验室推出语音识别大模型Fun-ASR1.5
阿里通义实验室发布Fun-ASR1.5:语音识别大模型实现多语言与方言精准转写
2024年4月20日,阿里通义实验室正式推出新一代语音识别大模型Fun-ASR1.5。此次发布的模型,在“大而全”的技术路线上实现了显著突破。它基于统一的大模型架构,仅凭单一模型即可覆盖以往需要多个专用模型才能应对的复杂识别场景。具体而言,该模型能够无缝支持全球30种主流语言的语音转写,并特别针对中文语音识别进行了深度优化。它不仅能够精准识别汉语普通话,更能全面覆盖汉语的七大方言体系,处理超过20种地方口音,甚至对古诗词吟诵这类富含韵律和文化特色的语音,也能实现高准确率的文本转写。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
那么,Fun-ASR1.5的实际效果究竟如何?权威测试数据提供了有力证明。在典型的方言识别任务中,该模型的字错误率(CER)实现了高达56.2%的相对下降。这一数据意味着语音识别的准确性与鲁棒性取得了质的提升。目前,该模型已有5种方言的识别准确率突破90%大关,更有15种方言的识别准确率稳定维持在80%以上。这一系列卓越的性能指标,为在方言多样、口音复杂的实际应用环境中部署高精度语音识别服务,扫清了关键技术障碍,展现出强大的实用化潜力。
相关攻略
阿里通义实验室发布Fun-ASR1 5:语音识别大模型实现多语言与方言精准转写 2024年4月20日,阿里通义实验室正式推出新一代语音识别大模型Fun-ASR1 5。此次发布的模型,在“大而全”的技术路线上实现了显著突破。它基于统一的大模型架构,仅凭单一模型即可覆盖以往需要多个专用模型才能应对的复杂
想让AI教孩子学会“侬好”?新技术如何助力上海话传承?日前,由华东师范大学国际汉语文化学院与阿里巴巴团队联合发起的上海方言保护计划正式启动,希望通过构建高质量的上海方言智能语音数据库,来助力AI听懂
IT之家 3 月 16 日消息,据《西藏日报》报道,3 月 15 日,全球首个藏语大语言模型 DeepZang 在拉萨正式发布,标志着我国在民族语言 AI 领域实现从“跟跑”到“领跑”的战略性跨越,
参加活动时自曝在新剧里要完全说上海话,还要学习四川方言!拍一部剧要学习两种方言,杨紫自曝压力好大,她真的一直都在突破自己!近日杨紫又上热搜了!其一是因为她直接顶着新剧《玉兰花开君再来》里的民国微卷短
【CNMO科技消息】近日,小米电视小爱迎来重要功能更新,重点围绕方言交互、视频问答、应用商店控制等场景进行优化,进一步提升用户智能语音体验。此次更新需将小米电视系统升级至小米澎湃OS 3,并建议将电
热门专题
热门推荐
Clusterly AI是什么 在内容创作领域,效率和质量常常难以兼得,而一款名为Clusterly AI的工具,正试图打破这个僵局。它由Clusterly公司开发,本质上是一个专为提升在线可见性而生的智能内容引擎。无论是内容创作者、独立博主,还是企业营销团队,都可以借助它快速生产出那些搜索引擎青睐
海尔燃气热水器Wi-Fi连接失败?别慌,这通常不是机器故障 当您发现海尔燃气热水器无法连接Wi-Fi时,请不要急于联系售后维修。根据海尔官方技术报告与售后大数据分析,超过90%的联网问题并非热水器硬件损坏,而是由于网络配置步骤存在疏漏,或家庭无线网络环境未满足设备接入的特定要求。只要您能准确识别并避
Ellmo Genzers是什么 说起企业级的AI应用工具,现在市面上选择不少,但真正能把数据安全、功能实用和多语言支持这三件事同时做好的,其实并不多。今天要聊的Ellmo Genzers,就是由GenZ Technologies推出的一款专为组织设计的语言模型操作平台。它的目标很明确:帮助企业安全
在第139届广交会的展馆内 浙江诺特电器创始人汪和平的展位,面积不过十平方米,却总是围满了人。他正用一台双屏翻译机,和一位印度客商流畅地交流着产品细节。这位在饮水机外贸行业摸爬滚打了二十多年的企业家,早已习惯用科技工具打破沟通壁垒,再用差异化的产品,牢牢抓住全球采购商的目光。 时间拉回到2004年,
松下按摩椅究竟是泰国制造还是马来西亚生产? 首先明确核心信息:松下按摩椅的主要生产基地在泰国,同时马来西亚工厂也承担部分型号的区域化组装任务。根据松下电器官方公布的全球制造布局,其东南亚地区的核心产能确实集中于泰国工厂。该生产基地自2010年代初期投入运营以来,一直负责中高端按摩椅系列的研发试制与批





