首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
压力美英独角兽,广东AI语音模型Vocu V3夺全球榜首创收

压力美英独角兽,广东AI语音模型Vocu V3夺全球榜首创收

热心网友
68
转载
2025-12-19

在全球AI语音合成的巅峰较量中,来自广州煋谷科技的自研模型Voci V3(海外版,国内版名为悟声)系列,成功登顶全球榜首!

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

全球权威AI平台Hugging Face最新的TTS Arena榜单显示,经过全球用户海量盲测,Voci V3凭借出众的语音质量与情感表现力,位列语音测评榜第一,超越了美国知名独角兽厂商Inworld、英国语音独角兽Eleven Labs等强劲对手。在该榜单上,来自上海的MiniMax位列第7,阿里通义CosyVoice2.0则排在第24位。


具体来看,在全球权威平台Hugging Face的TTS Arena榜单上,广州煋谷科技的自研Voci V3模型稳居第一。

问鼎语音合成领域的“试金石”榜单

TTS Arena被称为全球AI语音合成领域的“终极擂台”,其革命性在于彻底颠覆了传统测评体系。过去,行业多依赖字错率等冰冷数据或小范围主观评分,难以甄别顶尖模型间的细微差距。而Hugging Face TTS Arena引入了类似国际象棋的Elo社区评分机制:全球用户随机听取两款模型的合成音频后进行匿名投票,凭借最直接的主观偏好决出高下。这种基于海量真实反馈、动态更新的排行榜,成为全球公认的衡量语音合成技术实力的“试金石”。

南方都市报、南都大数据研究院了解到,此次登顶全球第一的煋谷科技Voci V3新一代语音合成模型,于2025年10月发布,上线3个月用户量便突破百万大关。其核心驱动力是自研的“悟声”语音合成算法,实现了从“感知文本”到“再生语音”的关键跨越,能深度理解文本语义与情感脉络,自动匹配动漫、商务、影视剧等丰富音色与口音,精准演绎细腻的情感起伏。在音色克隆方面,仅需3秒声音样本,即可实现瞬时克隆,相似度高达99.5%以上。

据悉,“悟声”语音合成算法已通过“深度合成服务算法备案”,在智能客服、媒体创作、文旅数字人、互动娱乐等诸多领域落地应用。目前,悟声音音合成算法V3.1版本也已正式发布,专业克隆与音色转换能力进一步升级,全面支持中文、英语、韩语、法语、德语、西班牙语、葡萄牙语等全球数十种语言,以及粤语等方言,在情感张力、相似度、稳定性、自然度、语义理解能力等方面表现领先,达到影视级性能。网友们评价其“拟人化很厉害,比起千篇一律的机械音生动太多”“多语言跨语言无缝支持”等。


广州煋谷科技有限公司创始人谢伟铎向英伟达全球副总裁及管理层面团队介绍产品与技术愿景。

让AI语音承载更多情感与温度

如何让语音合成的声音更加拟人化,更富有人类情感?煋谷科技表示,主要源于其在数据、算法上的双重深耕。在数据采集环节,构建全链路全球化自研管道,内置AI模型智能把关数据质量与情感提取,为模型训练提供“精品教材”。算法层面,持续迭代升级,对底层技术的重投入使模型具备“举一反三”能力,能挖掘数据深层关联,提升表达的丰富性、生动性。

除AI生成能力外,煋谷科技还构建了“创造—应用—守护”的安全闭环,尝试解决音频深度合成的潜在风险。凭借自研的VocaMark音频隐形水印技术与VocaAntiFake音频鉴伪专家大模型,实现对AI生成音频的无痕溯源与高精度鉴别,并能抵御翻录、剪辑等恶意混淆攻击手段。

2025年10月24日,据《广东省生成式人工智能服务已备案信息公开公告》,煋谷科技自研的另一款大模型“元语文”正式通过生成式人工智能服务备案。据悉,由“元语文”驱动的AI虚拟主播“木几萌”,2024年初发布后曾登上多个平台全站热榜前十,其粉丝总量至今仍超过其他所有同类竞品的总和。

煋谷科技创始人谢伟铎表示,团队将继续深耕技术创新,让AI语音承载更多情感与温度,为全球语音合成领域的发展持续贡献智慧与方案。目前煋谷科技已获得奇绩创坛的种子轮投资,以及多家机构算力支持,正与顶级资本与产业巨头紧密接洽Pre-A轮融资。

采写:南都N视频记者 袁珅贤(受访者供图)

来源:https://www.163.com/dy/article/KH528QCK05129QAF.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

迈向通用智能:Echo预测智能如何走出关键一步
AI
迈向通用智能:Echo预测智能如何走出关键一步

机器之心发布大模型能否预测未来?UniPat AI 构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型 EchoZ-1 0。在其公开的 General

热心网友
03.30
AI预测市场崛起:黑马模型胜率如何超越人类
AI
AI预测市场崛起:黑马模型胜率如何超越人类

新智元报道编辑:Aeneas【新智元导读】大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1 0。

热心网友
03.30
MicroCoder突破大模型训练瓶颈:用算法数据框架提升经验
AI
MicroCoder突破大模型训练瓶颈:用算法数据框架提升经验

MicroCoder团队 投稿量子位 | 公众号 QbitAI新一代代码模型的训练动态已与旧模型截然不同,主流强化学习方法和数据集在其上几乎“失效”。微软亚洲研究院与剑桥大学、普林斯顿联合推出Mic

热心网友
03.30
上海数月造出极耐碱蛋白:从卷模型到拼数据,语料普惠计划升级2.0
科技数码
上海数月造出极耐碱蛋白:从卷模型到拼数据,语料普惠计划升级2.0

上海一家蛋白质研发平台公司,采集了马里亚纳海沟、盐湖等极端环境下依然存活的微生物,并标注温度、压强、PH值等多维指标,形成尤为珍贵的蛋白质数据集,随后借由AI大模型能力,仅数月就改造出一种耐碱性提升

热心网友
03.30
算法催更与老板发愁:AI垃圾视频正淹没YouTube
业界动态
算法催更与老板发愁:AI垃圾视频正淹没YouTube

3月30日消息,随着AI技术的普及,视频平台YouTube正面临前所未有的内容治理挑战。一方面,平台积极鼓励创作者引入AI工具以提升内容生产的效率与边界;另一方面,平台也明确表示将严厉打击低投入、批

热心网友
03.30

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

vivo X300 Ultra 摄影师套装开箱:重塑复古影像,专业拍摄体验
网络安全
vivo X300 Ultra 摄影师套装开箱:重塑复古影像,专业拍摄体验

三月的丽江,春风载着光影的诗意,vivo于此启幕春季新品发布会,年度影像旗舰vivo X300 Ultra将如约登场。我们有幸提前执掌这款被赋予“专业V单”称号的新机,今日便与你一同,沉浸式解锁这台

热心网友
03.30
悟空浏览器悬浮搜索用法详解,轻松启用高效搜索窗
电脑教程
悟空浏览器悬浮搜索用法详解,轻松启用高效搜索窗

悟空浏览器支持五种调出搜索悬浮窗的方式:一、地址栏长按;二、左边缘手势滑动;三、启用chrome: flags中的“Enable search bubble UI”;四、侧边栏添

热心网友
03.30
13年前就拥抱增程动力的宝马,如何看待增程式车型?
科技数码
13年前就拥抱增程动力的宝马,如何看待增程式车型?

快科技3月30日消息,日前,宝马产品负责人贝恩德·克尔伯在接受BMW Blog采访时明确表示,公司对增程车型持观望态度,虽技术上完全可行,但现实需求尚未明确,暂未做出量产决策。这一表态与宝马研发负责

热心网友
03.30
腾讯AI全景亮相中国网络媒体论坛郑州举行
科技数码
腾讯AI全景亮相中国网络媒体论坛郑州举行

大象新闻·大象财富记者 李莉 张迪驰3月29日,以“发挥主流媒体引领力 激发多元主体创造力——共创繁荣网络内容生态”为主题的2026中国网络媒体论坛在河南郑州开幕。腾讯携AI全景亮相,展示“从效率伙

热心网友
03.30
铂智第二款纯电上市,广汽丰田新能源转型稳步推进
科技数码
铂智第二款纯电上市,广汽丰田新能源转型稳步推进

3月29日,广汽丰田首款大型纯电轿车铂智7正式上市。新车推出600km和700km两种续航版本共5款配置,限时补贴权益后售价区间为14 78万元至19 98万元。作为广汽丰田继铂智3X之后的第二款纯

热心网友
03.30