首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Meta开源语音识别模型,支持1600种语言打破全球沟通壁垒

Meta开源语音识别模型,支持1600种语言打破全球沟通壁垒

热心网友
49
转载
2025-11-27

11月11日,Meta基础人工智能研究(FAIR)团队正式发布"全语种自动语音识别系统"(Omnilingual ASR),该系统可支持1600多种语言的语音转写,显著拓展了当前语音识别技术的应用边界。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源

当前大多数语音识别工具主要面向几百种资源丰富的语言,这些语言通常具备大量转录音频数据。而全球现存的7000余种语言中,绝大多数因缺乏标注训练数据而难以获得AI技术支持。Omnilingual ASR的诞生正是为了弥合这一数字鸿沟。

据Meta透露,在其支持的1600种语言中,有500种语言首次被任何AI系统所覆盖。FAIR团队将该系统视为构建"通用语音转写系统"的重要里程碑,有望助力消除全球语言障碍,促进跨语言交流与信息普惠。

值得注意的是,系统识别精度与训练数据量呈正相关。根据Meta公布的结果,Omnilingual ASR在测试的1600种语言中,对其中78%的语言实现了低于10%的字错误率(CER);对于至少拥有10小时训练音频的语言,达到此精度标准的比例更高达95%;即便是音频时长不足10小时的"低资源语言",仍有36%实现了低于10% CER的优异表现。

为推动后续研究与应用落地,Meta同步发布了"全语种ASR语料库"——一个涵盖350种代表性不足语言的大规模转录语音数据集。该语料库采用知识共享署名许可协议(CC-BY)开放获取,旨在支持开发者与研究人员针对特定本土语言需求,构建或适配定制化的语音识别模型。

该系统的核心创新在于其"自带语言"功能,该功能基于上下文学习机制实现。借鉴大语言模型的技术思路,用户仅需提供少量配对的语音与文本样本,系统即可直接从中学习,无需重新训练或依赖高算力资源,就能轻松添加新的语言支持。

Meta表示,理论上该方法可将Omnilingual ASR的语言支持能力扩展至5400余种,远超当前行业水平。尽管对极低资源语言的识别质量尚未达到完全训练的水平,但该技术首次为众多此前完全缺乏语音识别能力的语言社区提供了可行的解决方案。

Meta以Apache 2.0开源许可协议发布Omnilingual ASR全部模型,允许研究人员与开发者自由使用、修改及商用;配套数据集则采用CC-BY协议开放。该模型家族包含从适用于低功耗设备的轻量级30亿参数版本,到追求"顶尖精度"的700亿参数版本,满足不同应用场景需求。所有模型均基于FAIR自主研发的PyTorch框架fairseq2构建。

来源:https://www.ithome.com/0/896/642.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

上海滨江惊进化龙虾,百种虾类上演生存竞争
科技数码
上海滨江惊进化龙虾,百种虾类上演生存竞争

“安装龙虾送Token”“OpenClaw实战应用”“OpenClaw攻防实战”……周六一早,2026全球开发者先锋大会就迎来了汹涌人潮,“龙虾”相关体验区更是人气爆棚,现场一片“百虾大战”的景象。

热心网友
03.29
知声AI年收入12亿,硬核增长与盈利未来可期
AI
知声AI年收入12亿,硬核增长与盈利未来可期

智东西作者|三北编辑|漠影智东西3月26日报道,刚刚,云知声交出了一张“硬核成绩单”。该公司2025年营收12 1亿元,同比增长29%;其中大模型相关收入达6 1亿元,同比暴涨1076%,首次撑起半

热心网友
03.27
新加坡理工团队开发超高精度语音识别模型
科技数码
新加坡理工团队开发超高精度语音识别模型

这项由新加坡Knovel工程实验室开展的研究成果,发表于2026年3月17日的arXiv预印本(编号:arXiv:2603 16184v1),为多语言自动语音识别领域带来了令人瞩目的突破。对于那些想

热心网友
03.26
连续24年建言两会,科技代表解析中国AI领跑关键
科技数码
连续24年建言两会,科技代表解析中国AI领跑关键

全文共2199字,阅读大约需要5分钟“未来每个人都将拥有专属的人工智能助手,它可通过车载、手机、家居、床头、厨房等各类终端与我们交互”。北京商报记者丨魏蔚2026年全国两会期间,全国人大代表、科大讯

热心网友
03.11
对话刘庆峰:AI硬件形态重塑,迈向无边界未来
科技数码
对话刘庆峰:AI硬件形态重塑,迈向无边界未来

2026年全国两会期间,全国人大代表、科大讯飞董事长刘庆峰的公文包里多了一件特别的 "随行装备 "——一台能装进口袋的智能办公本。这不仅是一台录音设备,更是一个搭载着自主可控大模型的 "随身秘书 ",会议内

热心网友
03.11

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08