首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Qwen3-TTS上新:阿里通义自研语音模型,可复刻可定制

Qwen3-TTS上新:阿里通义自研语音模型,可复刻可定制

热心网友
61
转载
2025-12-24

12月24日,据IT之家消息,阿里通义今日正式发布Qwen3-TTS家族的两款新模型:声音创作模型Qwen3-TTS-VD-Flash和声音克隆模型Qwen3-TTS-VC-Flash。两款模型的核心亮点整理如下:

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

声音创作:Qwen3-TTS-VD-Flash能够理解复杂的自然语言指令,实现对音色、韵律、情感乃至人物设定的精细化调控,真正掌握从“说什么”到“如何说”的完整表达。用户得以自由定义想要的声音效果,彻底摆脱只能依赖现有音色进行克隆,或从有限预设音色库中做选择的束缚。在InstructTTS-Eval评测中,其综合表现显著优于GPT-4o-mini-tts和Mimo-audio-7b-instruct;在角色扮演测试中,其表现也超越了Gemini-2.5-pro-preview-tts。

声音克隆:Qwen3-TTS-VC-Flash支持仅需3秒音频即可完成高质量的语音克隆,并能在克隆音色的基础上,流畅生成中文、英文、德语、意大利语、葡萄牙语、西班牙语、日语、韩语、法语、俄语等全球十大主流语言的语音。在MiniMax TTS多语言测试集上,其平均词错误率(WER)全面低于MiniMax、ElevenLabs及GPT-4o-Audio-Preview,展现出优异的准确性。

高表现力:无论是Qwen3-TTS-VD-Flash还是Qwen3-TTS-VC-Flash,均能生成高度拟人化、富有表现力的音色。它们能够稳定可靠地输出与输入文本高度契合的语音内容,并能根据文本语义自动调节语气节奏,呈现出自然生动的表达效果。

鲁棒的文本能力:Qwen3-TTS-VD-Flash和Qwen3-TTS-VC-Flash具备强大的文本解析能力,可自动处理复杂的文本结构,精准提取关键信息。面对多样化、非规范的文本格式时,两者均展现出较强的鲁棒性(IT之家注:robustness,指系统在内部结构或外部环境发生变化时,维持功能稳定运行的能力)。

定制化声音形象:Qwen3-TTS支持通过自然语言描述生成定制化的声音形象。用户可以随意输入声学属性、人设描述、背景信息等自由描述,轻松创造出符合自己期望的声音形象。

可控生成:在InstructTTS-Eval评测中,Qwen3-TTS的综合表现显著优于GPT-4o-mini-tts和Mimo-audio-7b-instruct,在角色扮演测试中也超越了Gemini-2.5-pro-preview-tts,显示出精准的指令跟随与生成控制能力。


高效语音克隆:Qwen3-TTS支持仅凭约3秒的音频样本实现高质量的语音克隆,并可基于克隆出的音色生成多语种语音。同时,模型对复杂文本和带有噪音的原始音频都具有较高的鲁棒性。

多语种声音克隆:在MiniMax TTS多语言测试集上,Qwen3-TTS在中文、英文、法语、意大利语等各项评测中的内容稳定性优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview;其平均词错误率(WER)在所有参评模型中排名第一。


相关文档:Qwen3-TTS-Voice-Design API 文档

相关文档:Qwen3-TTS-Voice-Clone API 文档

来源:https://www.163.com/dy/article/KHII66RM0511B8LM.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI音乐工作站融资百万美元,智能吉他团队再获数亿营收
科技数码
AI音乐工作站融资百万美元,智能吉他团队再获数亿营收

作者|黄楠编辑|袁斯来编者按:当出海越来越成为一家中国公司核心战略时,如何征战全球市场就成为一个极其专业的话题。在全球化的演变中,已有不少中国品牌站立潮头。鉴于此,硬氪特推出「Insight全球」专

热心网友
03.10
MiniMax推出OpenClaw新技能,实现音色定制与完整歌曲创作
AI
MiniMax推出OpenClaw新技能,实现音色定制与完整歌曲创作

IT之家 3 月 9 日消息,今日,MiniMax 宣布将 MiniMax Speech 语音模型和 Music 音乐模型的开放平台接口进行了深度封装,并正式上架到了 OpenClaw 生态中。IT

热心网友
03.09
卡西欧SX-C1复古采样器体验:16键打击垫与掌机外观设计解析
娱乐
卡西欧SX-C1复古采样器体验:16键打击垫与掌机外观设计解析

IT之家 1 月 25 日消息,据科技媒体 The Verge 昨天报道,卡西欧 SX-C1 复古采样器原型机最近在 NAMM 展会亮相,外观看起来像是把任天堂 Game Boy 和罗兰 SP-40

热心网友
01.25
华为FreeClip 2耳机支持豆包App唤醒,适配安卓
科技数码
华为FreeClip 2耳机支持豆包App唤醒,适配安卓

IT之家 1 月 25 日消息,华为正式显示,华为 FreeClip 2 耳夹耳机在 Android 设备上有与豆包联动的能力,可以通过手势和语音的唤醒形式使用豆包 App,实现与豆包 App 的问

热心网友
01.25
小度智能音响升级后音色惹争议,百度官方已正式致歉
科技数码
小度智能音响升级后音色惹争议,百度官方已正式致歉

IT之家 1 月 21 日消息,今天上午,百度旗下“小度小度”官微发布致歉信称,2025 年底开始陆续为已售设备免费升级“超能小度”大模型服务,部分智能音箱的助手默认音色发生变化,有用户反馈称新音色

热心网友
01.21

最新APP

暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26
儿童画画
儿童画画
休闲益智 03-25
疯狂猜词
疯狂猜词
休闲益智 03-25

热门推荐

显示器颜色校正教程:5步解决偏色与颜色不准
电脑教程
显示器颜色校正教程:5步解决偏色与颜色不准

首先使用系统内置工具校准显示器颜色,调整伽马、亮度、对比度和色彩平衡;其次可借助专业校色仪进行硬件级校准并生成ICC配置文件;接着检查并更换高质量视频线缆以确保信号稳定;然后更新显

热心网友
03.29
萤石云监控删除录像教程:清理云端历史视频记录
手机教程
萤石云监控删除录像教程:清理云端历史视频记录

1、第一步,在手机中打开萤石云应用程序,然后单击萤石云智能相机设备进入,见下图,转到下面的步骤。2、第二步,执行完上面的操作之后,可以检查摄像机的实时监控屏幕,此时,单击右上角的三

热心网友
03.29
机械方方果实获取攻略:《洛克王国》世界任务指南
游戏攻略
机械方方果实获取攻略:《洛克王国》世界任务指南

《洛克王国:世界》是由腾讯IEG魔方工作室群开发的大世界精灵收集养成战斗游戏,在游戏中有许许多多不同的精灵,游戏中可以用果实来产生精灵,那么有不少小伙伴好奇机械方方果实怎么获得,下

热心网友
03.29
33岁男星泰国暴尸疑点披露:最新调查揭秘致命真相
娱乐
33岁男星泰国暴尸疑点披露:最新调查揭秘致命真相

近日,泰国普吉岛的一则噩耗引发全球关注——33岁的英国真人秀男明星乔丹·赖特,被发现溺亡于当地一处排水沟中。无独有偶,就在上个月,一名中国女子在泰国芭提雅参加泳池派对后失联,最终被警方发现其不幸遇害

热心网友
03.29
电脑CPU是核心:查看位置、功能与选购指南
电脑教程
电脑CPU是核心:查看位置、功能与选购指南

CPU位于主板中央偏上、散热器正下方的专用插槽中,可通过机箱目视、系统软件(如msinfo32、HWiNFO64)或主板说明书图示三步精准定位。如果您想定位电脑中负责核心运算与指令

热心网友
03.29