首页 游戏 软件 资讯 排行榜 专题
首页
AI
阿里通义开源Fun-CosyVoice 3.0.5B:零样本音色克隆功能详解

阿里通义开源Fun-CosyVoice 3.0.5B:零样本音色克隆功能详解

热心网友
51
转载
2025-12-15

12月15日,阿里通义正式开源Fun-CosyVoice3-0.5B版本。该模型具备零样本音色克隆能力,用户只需提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,同时支持本地部署与二次开发。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

此外,通义还推出了轻量化版本Fun-ASR-Nano模型,总参数量压缩至0.8B,推理成本更低,现已开源,支持本地部署与定制化微调。

值得一提的是,通义进一步增强了Fun-ASR模型,其在噪声场景下的准确率达到93%,并新增歌词与说唱识别功能。

阿里通义开源Fun-CosyVoice3-0.5B 提供零样本音色克隆能力

来源:https://tech.ifeng.com/c/8p6hBddgWJU
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

阿里通义语音双模型上线:一句话即可生成高质量语音
AI
阿里通义语音双模型上线:一句话即可生成高质量语音

3月2日,阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3 5与Fun-AudioGen-VD。最新宣称,无论是精细控制声音表达,还是从零设计音色与场

热心网友
03.02
通义千问开源语音模型:省下近50%的GPU算力
业界动态
通义千问开源语音模型:省下近50%的GPU算力

12月24日消息,阿里通义百聆家族近日开源新一代语音交互模型Fun-Audio-Chat-8B。新模型兼具高智商和高情商,具备出色的共情能力,与之对话,仿佛与懂你的人聊天。在OpenAudioBen

热心网友
12.24
全面接入!阿里开源通义Wan2.2 首创电影级美学控制系统
科技数码
全面接入!阿里开源通义Wan2.2 首创电影级美学控制系统

7月29日消息,7月28日晚,阿里AI“四连发”再落一子,电影级视频生成模型通义万相Wan2 2正式开源,并全面接入通义APP。据悉,Wan2 2此次开源的文生视频模型和图生视频模型均为业界首个使用

热心网友
12.18
阿里通义千问语音模型新版发布:3秒录音复制9种语言及18种方言
AI
阿里通义千问语音模型新版发布:3秒录音复制9种语言及18种方言

12 月 15 日消息,今天下午,通义大模型通过最新公众号宣布,两款“百聆”语音模型正式开源,两款模型迎来升级。根据介绍,其只需 3 秒录音,就能让你的声音无缝切换语种、方言与情绪 —— 普通话、

热心网友
12.16
阿里通义开源Fun-CosyVoice 3.0.5B:零样本音色克隆功能详解
AI
阿里通义开源Fun-CosyVoice 3.0.5B:零样本音色克隆功能详解

12月15日,阿里通义宣布开源Fun-CosyVoice3-0 5B,该版本提供了zero-shot音色克隆能力,只需要你提供一段3秒以上的参考音频,即可复刻其音色并合成新语音,并且支持本地部署和

热心网友
12.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

领克GT概念跑车北京车展首发 百公里加速仅2秒
科技数码
领克GT概念跑车北京车展首发 百公里加速仅2秒

领克首款GT概念跑车亮相北京车展,由中欧团队联合打造。新车采用经典GT比例与低趴宽体设计,配备液态金属蓝涂装与2+2座舱,设有高性能模式按键可激活空气动力学套件。车辆采用后驱布局与AI智能运动控制系统,百公里加速约2秒,设计融合瑞典极简美学并参考全球用户反馈。

热心网友
05.14
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升
科技数码
英伟达RTX 5070移动版GPU发布 12GB显存性能大幅提升

英伟达推出12GB显存版RTX5070移动GPU,与8GB版同步上市。两者均基于Blackwell架构,核心规格相同,仅显存容量不同。此举旨在缓解GDDR7芯片供应压力,为OEM提供灵活配置,加速笔记本产品布局,更大显存可更好满足游戏与AI应用需求。

热心网友
05.14
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售
科技数码
微星新款雾面WOLED显示器MAG 276QRY28与276QRDY54正式发售

微星将于5月15日推出两款26 5英寸雾面WOLED显示器MAG276QRY28和276QRDY54,售价分别为2499元和6299元。均采用第四代WOLED面板,具备QHD分辨率、VESADisplayHDRTrueBlack500认证、1500尼特峰值亮度及99 5%DCI-P3色域覆盖。276QRY28刷新率为280Hz,高阶款276QRDY54支持4

热心网友
05.14
中芯国际一季度净利润13.61亿元 同比增长0.4%
科技数码
中芯国际一季度净利润13.61亿元 同比增长0.4%

中芯国际2026年第一季度营收176 17亿元,同比增长8 1%;净利润13 61亿元,同比增长0 4%。公司预计第二季度收入环比增长14%至16%,毛利率指引上调至20%至22%。这反映出公司在行业复苏中展现出财务韧性,并通过运营优化增强了短期增长势头。

热心网友
05.14
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升
AI
AI图像处理训练数据存在色差问题 16种算法经小改动全面提升

手机修图、相机降噪、视频去雾……这些我们日常使用的图像处理功能,其背后都离不开人工智能(AI)技术的驱动。通常,AI模型的训练逻辑是:向模型展示大量“低质图像”与“优质图像”的配对数据,让它学习如何将前者转化为后者。然而,天津大学计算机视觉团队近期发表的一项研究(arXiv:2604 08172)揭

热心网友
05.14