首页 游戏 软件 资讯 排行榜 专题
首页
AI
OpenAI Whisper语音系统发布 英文识别准确率接近人类

OpenAI Whisper语音系统发布 英文识别准确率接近人类

热心网友
26
转载
2026-05-15

2022年9月21日,OpenAI正式发布了名为“Whisper”的全新神经网络模型。该模型在英语语音识别任务中展现出接近人类水平的准确性与鲁棒性,标志着语音AI技术迈入新阶段。

Whisper本质上是一个先进的自动语音识别(ASR)系统。其核心创新在于训练数据的规模与多样性:研究团队从公开网络资源中采集了高达68万小时的多语言、多任务监督数据进行模型训练。如此海量且覆盖广泛的数据集,显著提升了系统在面对不同口音、复杂背景噪音以及专业领域术语时的识别稳定性与适应能力。

这一成果直指语音识别领域的长期挑战。以往研究表明,无监督预训练虽能优化音频编码器,但由于缺乏与之匹配的高质量解码器及针对性的微调策略,模型整体性能与泛化能力往往受限。相比之下,采用大规模有监督数据进行预训练的语音识别系统,通常表现出更强的稳健性与通用性。

OpenAI的Whisper正是将“弱监督”语音识别推向全新规模——其构建的数据集体量远超现有所有高质量语音数据的总和。团队进一步验证了基于超大规模数据训练的模型,在“零样本”条件下迁移至其他标准测试集时的卓越表现。这种方法的关键优势在于,它完全避免了针对特定数据集进行繁琐微调的过程,能够直接输出高精度的语音转写结果,极大提升了技术应用的便捷性与效率。

来源:https://www.leiphone.com/category/academic/EOKX8hIvu3E6SWYP.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenAI联手律所起诉苹果致其股价下跌09
科技数码
OpenAI联手律所起诉苹果致其股价下跌09

周四,一则来自知情人士的消息在科技圈投下了一枚石子:苹果与OpenAI之间为期两年的“蜜月期”似乎走到了尽头,双方关系正趋于紧张。问题的核心在于,OpenAI方面认为,这场合作并未带来预期的回报,甚至可能准备诉诸法律手段。 据悉,OpenAI的法务团队已经行动起来,正与一家外部律师事务所合作,评估一

热心网友
05.15
ChatGPT手机端集成Codex编程工具 加速移动AI开发竞争
科技数码
ChatGPT手机端集成Codex编程工具 加速移动AI开发竞争

OpenAI将Codex集成至ChatGPT移动应用,使手机成为“移动控制台”,支持代码查看、测试与指令操作。此举提升了开发灵活性,优化了移动体验,是对竞争对手的回应,也符合其构建“超级应用”的战略。该功能已在iOS和Android平台预览推出。

热心网友
05.15
OpenAI用药建议致19岁少年死亡引发AI医疗安全争议
AI
OpenAI用药建议致19岁少年死亡引发AI医疗安全争议

美国一家庭起诉OpenAI,指控其ChatGPT提供了错误用药建议,导致一名19岁青年在混合服用卡痛叶与Xanax等药物后死亡。诉讼指出,AI未明确警告该组合可能致命。OpenAI回应称,涉事对话发生于旧版本,强调AI不能替代专业医疗,并正与专家合作改进安全措施。此事引发对AI医疗辅助安全边界与责任归属的深刻反思。

热心网友
05.15
苹果Mac用户请尽快升级ChatGPT应用
科技数码
苹果Mac用户请尽快升级ChatGPT应用

TanStack开源库遭遇供应链攻击,意外波及OpenAI。OpenAI内部两台员工设备受影响,部分凭证材料被窃。这些凭证能为产品签署证书,OpenAI决定撤销相关证书。Mac版ChatGPT桌面应用需在6月12日前更新,否则将无法启动。Windows和iOS版本不受影响。用户数据未被访问,公司核心系统未遭入侵。

热心网友
05.15
马斯克起诉OpenAI案最新进展结案陈词阶段
科技数码
马斯克起诉OpenAI案最新进展结案陈词阶段

马斯克起诉OpenAI案进入结案陈词阶段。马斯克指控OpenAI背离非营利初衷,违反信托义务并转向营利,其律师质疑奥特曼信誉并指责微软协助不当行为。OpenAI律师反驳称马斯克证词矛盾,且其本人也曾试图控制公司获利。诉讼结果可能取决于是否在法定时效内提起,并将影响OpenAI未来发展与IPO进程。

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

银河麒麟系统SSH公钥登录配置与安全远程连接指南
系统平台
银河麒麟系统SSH公钥登录配置与安全远程连接指南

在麒麟操作系统上配置SSH公钥登录,不仅能免去每次输入密码的繁琐,更能显著增强远程连接的安全性。整个过程并不复杂,核心步骤围绕密钥生成、公钥部署和服务端配置展开。本文将详细介绍几种主流方法,涵盖从自动化部署到手动配置,助你轻松完成麒麟系统SSH密钥登录设置。 一、使用ssh-keygen与ssh-c

热心网友
05.15
银河麒麟系统登录循环故障解决方法与桌面修复指南
系统平台
银河麒麟系统登录循环故障解决方法与桌面修复指南

登录循环闪退应先删 Xauthority和 ICEauthority文件、修复 tmp权限为1777、重置ukui mate dconf配置、清理磁盘空间、重装lightdm并重新配置。 在银河麒麟操作系统中输入密码后,屏幕一闪又回到登录界面,这种“登录循环”问题确实令人困扰。这通常并非硬件故障,而

热心网友
05.15
GUSD稳定币详解:项目背景、核心用途与投资风险全解析
web3.0
GUSD稳定币详解:项目背景、核心用途与投资风险全解析

GUSD是一种与美元1:1锚定的合规稳定币,由Gemini交易所发行并受纽约州金融服务部监管。其核心价值在于为加密世界提供透明、受监管的美元等价物,主要应用于交易、支付和价值存储。投资者需关注其中心化托管风险、监管政策变化及智能合约潜在漏洞,理解其作为传统金融与加密市场桥梁的定位与局限。

热心网友
05.15
Win11如何设置默认音频输出设备与调整音量
系统平台
Win11如何设置默认音频输出设备与调整音量

在Windows 11系统中,确保系统音频稳定输出到指定设备(如已连接的耳机或已配对的蓝牙音箱),核心在于正确配置默认音频输出设备。您可以通过任务栏快速设置、系统设置应用、控制面板声音对话框、音量混合器下拉菜单或Win+Ctrl+V快捷键这五种主流方案,实现即时切换或永久性配置,彻底解决声音输出错乱

热心网友
05.15
宏胜集团高管变动与业务外包调整深度解析
AI
宏胜集团高管变动与业务外包调整深度解析

宏胜集团近期发生重要人事与业务调整。总裁办主任叶雅琼、销售总经理吴汀燕、法务部部长周卓盈及生产管理科科长吴潘潘等多位高管已离职,该消息已获接近集团人士证实。与此同时,集团启动了部分非生产业务的外包运作,显示出其正在优化内部结构与运营模式。这一系列变动可能意味着公司正处于战略调整期,旨在聚焦核心业务并

热心网友
05.15