首页 游戏 软件 资讯 排行榜 专题
首页
AI
阿里通义千问语音模型新版发布:3秒录音复制9种语言及18种方言

阿里通义千问语音模型新版发布:3秒录音复制9种语言及18种方言

热心网友
11
转载
2025-12-16

12月15日消息,据通义大模型官方公众号今日下午宣布,两款"百聆"语音模型现已正式开源,并且迎来了全面升级。据介绍,该模型只需3秒录音样本,就能让你的声音无缝切换多达9种通用语言和18种地方方言,同时还能精准复刻说话者的情绪——无论是普通话、粤语、日语、英语,还是开心、愤怒等语气,都能轻松驾驭。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

能力升级

Fun-CosyVoice3 模型升级:首次发声延迟降低50%,中英文混合语音识别准确率显著提升,新增支持9种语言、18种方言口音,并具备跨语种声音克隆与情感控制能力;

Fun-ASR 模型能力增强:在噪声环境下的识别准确率高达93%,新增歌词与演唱识别功能,支持31种语言自由混合输入、并覆盖多种方言口音,同时将流式识别模型的首字延迟降低至160毫秒。

正式开源

Fun-CosyVoice3(0.5B)开源:该模型提供零样本音色克隆能力,支持本地化部署与二次开发;

Fun-ASR-Nano(0.8B)开源:作为Fun-ASR的轻量化版本,推理成本更低,模型完全开源,支持本地部署与个性化微调。

根据最新了解,本次Fun-CosyVoice3大模型完成了多项关键升级:

首包延迟降低50%,支持双向流式合成,真正实现"输入即发声",适用于语音助手、直播配音、无障碍阅读等实时交互场景;

中英文混合词错误率相比前代大幅降低56.4%,无论是包含专业术语、大小写混排的文本,还是需要进行语码转换的句子,模型都能精准、自然地发音;

在零样本语音合成评测中,内容一致性与音色相似度全面提升,复杂场景下的字符错误率相对降低26%,效果已接近真人录音水平;

支持9种通用语言、18种中文方言、9种情感控制,并具备跨语种音色复制能力——仅需一段普通话录音样本,即可生成粤语、日语、英语等多种语言的语音,同时保持高度一致的音色特征。

而此次开源的Fun-CosyVoice3-0.5B模型提供了零样本音色克隆功能,用户只需提供一段3秒以上的参考音频,即可复制其音色并合成新的语音内容,并且支持本地部署和二次开发。

Fun-ASR则致力于让AI"听得懂"。其基于数千上万小时真实语音数据训练,已在钉钉"AI听记"、视频会议等场景中大规模落地。最新版本重点优化了嘈杂环境鲁棒性、多语言自由混合输入、中文方言与口音覆盖、歌词识别、定制化能力,并将流式识别模型的首字延迟降低到160毫秒。

阿里通义百聆推出语音模型新版本:3秒录音即可“复制”9种语言、18种方言

Fun-CosyVoice3-0.5B 开源地址:

https://github.com/FunAudioLLM/CosyVoice(GitHub)

https://funaudiollm.github.io/cosyvoice3/(GitHub.io)

https://www.modelscope.cn/studios/FunAudioLLM/Fun-CosyVoice3-0.5B(体验demo)

https://modelscope.cn/models/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(国内模型仓库)

https://huggingface.co/FunAudioLLM/Fun-CosyVoice3-0.5B-2512(海外模型仓库)

Fun-ASR-Nano-0.8B 开源地址:

https://github.com/FunAudioLLM/Fun-ASR(GitHub)

https://funaudiollm.github.io/funasr/(GitHub.io)

https://modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano/(国内体验demo)

https://huggingface.co/spaces/FunAudioLLM/Fun-ASR-Nano(海外体验demo)

https://modelscope.cn/models/FunAudioLLM/fun-asr-nano-2512(国内模型仓库)

https://huggingface.co/FunAudioLLM/Fun-ASR-Nano-2512(海外模型仓库)

来源:https://www.ithome.com/0/905/119.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

黄仁勋谈中国AI发展机遇与未来趋势
AI
黄仁勋谈中国AI发展机遇与未来趋势

近日,全球科技界迎来一场高规格访问:十余位美国顶尖科技企业首席执行官随代表团抵达中国。名单星光熠熠,包括苹果公司蒂姆·库克、英伟达创始人黄仁勋、特斯拉首席执行官埃隆·马斯克等业界领袖,堪称“硅谷天团”集体亮相。 在此次访问中,英伟达创始人兼CEO黄仁勋的发言尤为引人关注。他公开向媒体表示:“人工智能

热心网友
05.14
四川人工智能一号创新工程激活新质生产力
科技数码
四川人工智能一号创新工程激活新质生产力

四川将“人工智能+”列为全省“一号创新工程”,旨在将其作为驱动未来发展的核心引擎。该工程聚焦基础研究、产业生态、场景应用与人才支撑,推动人工智能与实体经济深度融合,以科技创新培育新质生产力,重塑经济竞争力,为高质量发展注入动力。

热心网友
05.14
国内人工智能大模型发展现状与未来趋势分析
业界动态
国内人工智能大模型发展现状与未来趋势分析

当前,国内人工智能领域的竞争已进入白热化阶段,一场围绕大模型技术的“百模大战”全面展开。在这场技术与商业应用的双重竞赛中,实在智能的实践路径尤为独特。该公司将自研的垂直大模型“TARS(塔斯)”与超自动化技术进行深度融合,成功开辟了一条聚焦垂直行业、深入具体业务场景的创新道路。 实在智能公司成立于2

热心网友
05.14
中国诚通郭祥玉与中国电信刘桂清举行工作会谈
科技数码
中国诚通郭祥玉与中国电信刘桂清举行工作会谈

5月14日,中国诚通总经理郭祥玉与中国电信总经理刘桂清在京座谈。双方围绕深化战略合作、服务国家大局深入交流,一致同意在基金投资、新兴产业培育及人工智能、云计算等前沿科技领域加强协同。此次会谈标志着两家央企合作进入新阶段,将通过优势互补共同培育新质生产力,推动高质量。

热心网友
05.14
未来企业家评选增设人工智能专项奖
科技数码
未来企业家评选增设人工智能专项奖

国家规划推动“人工智能+”与社会经济深度融合。第二届“未来企业家”评选增设“未来人工智能先锋企业家”奖,提升创新权重,旨在发掘以技术与远见引领未来的新一代商业领袖。当前AI竞争正从基础模型转向行业精耕,关键在于技术与实体经济的结合及综合能力比拼。该奖项聚焦在AI关键领域实现。

热心网友
05.14

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领克GT概念跑车北京车展首发 百公里加速仅2秒
科技数码
领克GT概念跑车北京车展首发 百公里加速仅2秒

领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。

热心网友
05.14
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
科技数码
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售

微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4

热心网友
05.14
中芯国际一季度净利润13.61亿元 同比增长0.4%
科技数码
中芯国际一季度净利润13.61亿元 同比增长0.4%

中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。

热心网友
05.14
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
AI
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭

热心网友
05.14