首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
压力美英独角兽,广东AI语音模型Vocu V3夺全球榜首创收

压力美英独角兽,广东AI语音模型Vocu V3夺全球榜首创收

热心网友
92
转载
2025-12-19

在全球AI语音合成的巅峰较量中,来自广州煋谷科技的自研模型Voci V3(海外版,国内版名为悟声)系列,成功登顶全球榜首!

全球权威AI平台Hugging Face最新的TTS Arena榜单显示,经过全球用户海量盲测,Voci V3凭借出众的语音质量与情感表现力,位列语音测评榜第一,超越了美国知名独角兽厂商Inworld、英国语音独角兽Eleven Labs等强劲对手。在该榜单上,来自上海的MiniMax位列第7,阿里通义CosyVoice2.0则排在第24位。


具体来看,在全球权威平台Hugging Face的TTS Arena榜单上,广州煋谷科技的自研Voci V3模型稳居第一。

问鼎语音合成领域的“试金石”榜单

TTS Arena被称为全球AI语音合成领域的“终极擂台”,其革命性在于彻底颠覆了传统测评体系。过去,行业多依赖字错率等冰冷数据或小范围主观评分,难以甄别顶尖模型间的细微差距。而Hugging Face TTS Arena引入了类似国际象棋的Elo社区评分机制:全球用户随机听取两款模型的合成音频后进行匿名投票,凭借最直接的主观偏好决出高下。这种基于海量真实反馈、动态更新的排行榜,成为全球公认的衡量语音合成技术实力的“试金石”。

南方都市报、南都大数据研究院了解到,此次登顶全球第一的煋谷科技Voci V3新一代语音合成模型,于2025年10月发布,上线3个月用户量便突破百万大关。其核心驱动力是自研的“悟声”语音合成算法,实现了从“感知文本”到“再生语音”的关键跨越,能深度理解文本语义与情感脉络,自动匹配动漫、商务、影视剧等丰富音色与口音,精准演绎细腻的情感起伏。在音色克隆方面,仅需3秒声音样本,即可实现瞬时克隆,相似度高达99.5%以上。

据悉,“悟声”语音合成算法已通过“深度合成服务算法备案”,在智能客服、媒体创作、文旅数字人、互动娱乐等诸多领域落地应用。目前,悟声音音合成算法V3.1版本也已正式发布,专业克隆与音色转换能力进一步升级,全面支持中文、英语、韩语、法语、德语、西班牙语、葡萄牙语等全球数十种语言,以及粤语等方言,在情感张力、相似度、稳定性、自然度、语义理解能力等方面表现领先,达到影视级性能。网友们评价其“拟人化很厉害,比起千篇一律的机械音生动太多”“多语言跨语言无缝支持”等。


广州煋谷科技有限公司创始人谢伟铎向英伟达全球副总裁及管理层面团队介绍产品与技术愿景。

让AI语音承载更多情感与温度

如何让语音合成的声音更加拟人化,更富有人类情感?煋谷科技表示,主要源于其在数据、算法上的双重深耕。在数据采集环节,构建全链路全球化自研管道,内置AI模型智能把关数据质量与情感提取,为模型训练提供“精品教材”。算法层面,持续迭代升级,对底层技术的重投入使模型具备“举一反三”能力,能挖掘数据深层关联,提升表达的丰富性、生动性。

除AI生成能力外,煋谷科技还构建了“创造—应用—守护”的安全闭环,尝试解决音频深度合成的潜在风险。凭借自研的VocaMark音频隐形水印技术与VocaAntiFake音频鉴伪专家大模型,实现对AI生成音频的无痕溯源与高精度鉴别,并能抵御翻录、剪辑等恶意混淆攻击手段。

2025年10月24日,据《广东省生成式人工智能服务已备案信息公开公告》,煋谷科技自研的另一款大模型“元语文”正式通过生成式人工智能服务备案。据悉,由“元语文”驱动的AI虚拟主播“木几萌”,2024年初发布后曾登上多个平台全站热榜前十,其粉丝总量至今仍超过其他所有同类竞品的总和。

煋谷科技创始人谢伟铎表示,团队将继续深耕技术创新,让AI语音承载更多情感与温度,为全球语音合成领域的发展持续贡献智慧与方案。目前煋谷科技已获得奇绩创坛的种子轮投资,以及多家机构算力支持,正与顶级资本与产业巨头紧密接洽Pre-A轮融资。

采写:南都N视频记者 袁珅贤(受访者供图)

来源:https://www.163.com/dy/article/KH528QCK05129QAF.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里官方揭秘欢乐马项目源自ATH郑波团队
AI资讯
阿里官方揭秘欢乐马项目源自ATH郑波团队

周二晚间,AI领域迎来了一则重磅消息。在权威AI评测平台Artificial Analysis的榜单上,一个名为「HappyHorse-1 0」的神秘模型异军突起,一举登顶视频生成能力排行榜,引发了业界的广泛关注与热议。 这一成绩极具含金量。无论是文本生成视频,还是图像生成视频,HappyHorse

热心网友
05.19
世界模型AI直播预约开启引爆人工智能新浪潮
AI资讯
世界模型AI直播预约开启引爆人工智能新浪潮

当AI开始学会“脑补”物理世界的运行规律,并尝试模拟一个动态变化的真实环境时,我们距离那个传说中的通用人工智能(AGI)究竟还有多远? 进入2026年以来,“世界模型”毫无悬念地成为了科技圈最炙手可热的核心议题。它标志着一个关键的范式转变:人工智能正从被动地“感知当下”,迈向主动地对时空与动态变化进

热心网友
05.19
世界模型第二期直播预约AI技术前沿与应用解析
AI资讯
世界模型第二期直播预约AI技术前沿与应用解析

上周三关于“世界模型”的线上沙龙反响空前热烈,这充分表明,从被动感知迈向主动推演,这条被视为实现通用人工智能(AGI)的核心技术路径,正深度吸引着整个AI行业的关注。鉴于持续高涨的讨论热度,我们决定加开一场深度分享会。 那么,这条充满潜力却又极具挑战性的前沿赛道,目前进展到了何种阶段?顶尖的研究者们

热心网友
05.19
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域
科技数码
许哲诚计算性设计展演评析:数字逻辑与物质建构的生成境域

数字逻辑与物质建构的深度对话 ——评许哲诚“境域·生成”计算性设计展演 □ 丁雅力(江苏省美术馆策展人) 当代设计与造物的核心范式,正经历着由计算性设计带来的深刻变革。2026年3月20日,南京艺术学院教师许哲诚于南京莫玄空间呈现的“境域·生成”个人专场展演,正是这一前沿趋势的集中体现。本次展览超越

热心网友
05.18
具身智能研发框架Dexbotic重塑机器人开发流程
AI资讯
具身智能研发框架Dexbotic重塑机器人开发流程

近日,开源具身智能原生框架Dexbotic宣布正式支持以RLinf作为其分布式强化学习后端。对具身智能开发者而言,这不仅是一次普通的工程适配,更意味着VLA模型研发中长期存在的「SFT与RL割裂」问题,正在被真正打通。 这是一种典型的「乐高式协作」:双方不强行Fork、不粗暴揉合代码,而是保持清晰边

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

苹果50周年总部庆典音乐会盛大举行
iphone
苹果50周年总部庆典音乐会盛大举行

为庆祝成立50周年,苹果在全球多地门店举办系列庆祝活动。最盛大的庆典在其总部ApplePark举行,员工齐聚草坪,传奇音乐人保罗·麦卡特尼登台献唱,首席执行官蒂姆·库克也参与其中。这场科技与艺术交融的盛会,既是对过往传奇的致敬,也寓意着新篇章的开启。

热心网友
05.20
苹果公司成立50周年库克内部信回顾从车库到25亿台销量历程
iphone
苹果公司成立50周年库克内部信回顾从车库到25亿台销量历程

苹果公司成立五十周年之际,首席执行官蒂姆·库克发布内部信回顾历程。信中指出,公司从车库中的一台原型机起步,如今全球活跃设备已达25亿台。库克强调,未来需主动创造而非等待,并鼓励员工铭记创新精神,共同把握机遇,开创下一个五十年。

热心网友
05.20
库克揭秘iPod爆红背后 苹果如何打造世界级供应链体系
iphone
库克揭秘iPod爆红背后 苹果如何打造世界级供应链体系

苹果CEO库克在专访中回顾了iPod的诞生历程。该产品以口袋装千首歌的能力革新了音乐消费方式。其爆红要求苹果在三个月内生产约1500万台,这极大考验了供应链。此次极限压力测试为苹果锻造出世界级供应链能力奠定了基础。库克还透露,首台原型机播放的第一首歌是《HeyJude》。

热心网友
05.20
段永平清仓阿里加仓英伟达拼多多 罕见布局Web3投资Circle
web3.0
段永平清仓阿里加仓英伟达拼多多 罕见布局Web3投资Circle

知名投资人段永平家族办公室持仓市值升至约200亿美元。本季度清仓阿里,减持苹果、台积电;重仓AI与电动车赛道,大幅增持英伟达并新建仓特斯拉,拼多多获增持。其首次跨足Web3领域,建仓稳定币发行商Circle,显示对合规区块链基础设施的关注。

热心网友
05.20
Mac放大镜功能开启指南 轻松看清屏幕细节
系统平台
Mac放大镜功能开启指南 轻松看清屏幕细节

Mac内置的“缩放”辅助功能可放大屏幕细节。通过系统设置开启该功能后,可选择画中画或全屏模式。用户可使用修饰键配合触控板手势、快捷键组合、双击Control+Option或鼠标智能缩放等多种方式灵活操作,满足不同场景下的查看需求。

热心网友
05.20