阿里通义开源Fun-CosyVoice 3.0.5B:零样本音色克隆功能详解
12月15日,阿里通义正式开源Fun-CosyVoice3-0.5B版本。该模型具备零样本音色克隆能力,用户只需提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,同时支持本地部署与二次开发。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
此外,通义还推出了轻量化版本Fun-ASR-Nano模型,总参数量压缩至0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。
值得一提的是,通义进一步增强了Fun-ASR模型,其在噪声场景下的准确率达到93%,并新增歌词与说唱识别功能。

相关攻略
3月2日,阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3 5与Fun-AudioGen-VD。最新宣称,无论是精细控制声音表达,还是从零设计音色与场
12月24日消息,阿里通义百聆家族近日开源新一代语音交互模型Fun-Audio-Chat-8B。新模型兼具高智商和高情商,具备出色的共情能力,与之对话,仿佛与懂你的人聊天。在OpenAudioBen
7月29日消息,7月28日晚,阿里AI“四连发”再落一子,电影级视频生成模型通义万相Wan2 2正式开源,并全面接入通义APP。据悉,Wan2 2此次开源的文生视频模型和图生视频模型均为业界首个使用
12 月 15 日消息,今天下午,通义大模型通过最新公众号宣布,两款“百聆”语音模型正式开源,两款模型迎来升级。根据介绍,其只需 3 秒录音,就能让你的声音无缝切换语种、方言与情绪 —— 普通话、
12月15日,阿里通义宣布开源Fun-CosyVoice3-0 5B,该版本提供了zero-shot音色克隆能力,只需要你提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和
热门专题
热门推荐
惠普部分型号支持主板集成RAID功能,用户可在系统启动阶段进入RAID配置环境,完成磁盘阵列的创建与维护操作。1、 开机过程中,根据屏幕提示,同时按下 Ctrl + I 组合键,即
F5公司已发布解决方案指南,强烈建议各组织立即遵循最新缓解步骤。 美国网络安全和基础设施安全局(CISA)已将新披露的F5 BIG-IP系统漏洞纳入其已知已利用漏洞(KEV)目录,警告该漏洞正在真实
helium10 chrome插件怎么安装?helium10浏览器扩展安装故障排查解答在电商运营的世界里,helium10可是一款相当强大的工具。而它的chrome插件安装,对于很
3月29日消息,据报道,此前,许先生以所在公司名义花费85万元购置了一辆玛莎拉蒂,后续在苏州某玛莎拉蒂4S店完成维保及延保办理。2019年5月,该车行驶中突发熄火故障,送至该4S店检修后,店方告知需
幻兽帕鲁中的帕鲁农场充满了奇幻与趣味,吸引了众多玩家想要体验。那么,它该如何下载安装呢?接下来为大家详细介绍。首先,要确定你的设备系统是否支持。幻兽帕鲁目前支持多种主流移动设备系统





