游乐游手机版
首页/科技数码/文章详情

Meta开源语音识别模型,支持1600种语言打破全球沟通壁垒

时间:2025-11-27 21:13
11 月 11 日消息,Meta 基础人工智能研究(FAIR)团队推出了“全语种自动语音识别系统”(Omnilingual ASR),该系统可支持 1600 多种语言的语音转写,大幅拓展了当前语音

11月11日,Meta基础人工智能研究(FAIR)团队正式发布"全语种自动语音识别系统"(Omnilingual ASR),该系统可支持1600多种语言的语音转写,显著拓展了当前语音识别技术的应用边界。

打破全球语言壁垒:Meta 推出支持 1600 种语言的语音识别系统并开源

当前大多数语音识别工具主要面向几百种资源丰富的语言,这些语言通常具备大量转录音频数据。而全球现存的7000余种语言中,绝大多数因缺乏标注训练数据而难以获得AI技术支持。Omnilingual ASR的诞生正是为了弥合这一数字鸿沟。

据Meta透露,在其支持的1600种语言中,有500种语言首次被任何AI系统所覆盖。FAIR团队将该系统视为构建"通用语音转写系统"的重要里程碑,有望助力消除全球语言障碍,促进跨语言交流与信息普惠。

值得注意的是,系统识别精度与训练数据量呈正相关。根据Meta公布的结果,Omnilingual ASR在测试的1600种语言中,对其中78%的语言实现了低于10%的字错误率(CER);对于至少拥有10小时训练音频的语言,达到此精度标准的比例更高达95%;即便是音频时长不足10小时的"低资源语言",仍有36%实现了低于10% CER的优异表现。

为推动后续研究与应用落地,Meta同步发布了"全语种ASR语料库"——一个涵盖350种代表性不足语言的大规模转录语音数据集。该语料库采用知识共享署名许可协议(CC-BY)开放获取,旨在支持开发者与研究人员针对特定本土语言需求,构建或适配定制化的语音识别模型。

该系统的核心创新在于其"自带语言"功能,该功能基于上下文学习机制实现。借鉴大语言模型的技术思路,用户仅需提供少量配对的语音与文本样本,系统即可直接从中学习,无需重新训练或依赖高算力资源,就能轻松添加新的语言支持。

Meta表示,理论上该方法可将Omnilingual ASR的语言支持能力扩展至5400余种,远超当前行业水平。尽管对极低资源语言的识别质量尚未达到完全训练的水平,但该技术首次为众多此前完全缺乏语音识别能力的语言社区提供了可行的解决方案。

Meta以Apache 2.0开源许可协议发布Omnilingual ASR全部模型,允许研究人员与开发者自由使用、修改及商用;配套数据集则采用CC-BY协议开放。该模型家族包含从适用于低功耗设备的轻量级30亿参数版本,到追求"顶尖精度"的700亿参数版本,满足不同应用场景需求。所有模型均基于FAIR自主研发的PyTorch框架fairseq2构建。

来源:https://www.ithome.com/0/896/642.htm
上一篇华为周销量TOP30机型减少,Mate80与Nova15将至引期待 下一篇宁德时代与广汽十年携手,共创智能电动车生态与换电新未来
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
津产氢能自行车亮相智博会:零排放续航80公里1分钟快速补能
科技数码 · 2026-05-30

津产氢能自行车亮相智博会:零排放续航80公里1分钟快速补能

在正在举行的世界智能产业博览会上,一款墨绿色的氢能源自行车成为了荣程集团展台最吸睛的存在——不少参观者路过时都忍不住停下来,仔细端详,甚至亲自上去试一把。说实话,在满场智能科技产品中,这个既低调又带着未来感的家伙,确实让人眼前一亮。 据现场工作人员介绍,这款氢能自行车一次充能就能跑大约80公里,日常

张维为:Manus并购被叫停 硬核管控守AI根基
科技数码 · 2026-05-30

张维为:Manus并购被叫停 硬核管控守AI根基

我国叫停Meta收购AI企业Manus的交易。张维为指出,该企业依托中国数据、算力成长后迁至新加坡变外企,依据进出口技术管理规定审核是守护核心资产的必要举措,硬核管控守住AI根基。

电投绿能拟投10万千瓦风电项目 合锻智能不涉及AI算力
科技数码 · 2026-05-30

电投绿能拟投10万千瓦风电项目 合锻智能不涉及AI算力

多家上市公司发布公告:利通电子与合锻智能澄清不涉及AI算力业务;电投绿能拟投建两个风电项目;獐子岛拟建设深海筏式养殖项目;精测电子控股子公司签订5 16亿元销售合同;中国建筑联合体中标高速公路项目;万隆光电拟收购中控信息100%股份。

英伟达三个月密集投资光子技术至少65亿美元
科技数码 · 2026-05-30

英伟达三个月密集投资光子技术至少65亿美元

英伟达正斥巨资布局光子技术,力求从底层突破AI大规模部署的能耗瓶颈。自今年3月以来,英伟达已向多家光子技术企业累计承诺投入至少65亿美元,成为这一新兴领域出手最为果断的战略买家之一。光子技术以光信号替代电信号传输数据,被业界视为打破AI基础设施扩张瓶颈的核心路径——这已不再是概念,而是正在落地的现实

2026年3000元预算手机推荐 荣耀600续航影像双突破
科技数码 · 2026-05-30

2026年3000元预算手机推荐 荣耀600续航影像双突破

2026年5月登场,荣耀600直接给3000元预算段的手机市场扔了一颗“重磅冲击波”——8600mAh超大电池、2亿像素全焦段4K Live影像、IP69K全维防护、0 98mm极窄四等边屏幕,四项核心配置几乎都做到了同档位顶格。国补后到手价仅2804元起,这在一众竞品中显得格外扎眼。以往这个价位,