阿里千问Qwen3-TTS开源上线:通义全系列语音模型开放
据相关消息,1月22日,通义千问团队宣布Qwen3-TTS系列模型正式开源上线。Qwen3-TTS是一套功能强大的语音生成系统,全面支持音色克隆、音色创造、超高质量拟人化语音合成,并能基于自然语言描述实现精准的语音控制,为开发者和用户提供最全面的语音生成解决方案。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
依托创新的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,Qwen3-TTS实现了对语音信号的高效压缩与强表征能力。它不仅完整保留了副语言信息和声学环境特征,还能通过轻量级的非DiT架构,实现高速、高保真的语音还原。该模型采用Dual-Track双轨建模,达成了极致的双向流式生成速度,首个音频包仅需等待一个字符的处理时间。
Qwen3-TTS多码本全系列模型均已开源,包含1.7B和0.6B两种参数量规格。其中1.7B模型能够达到顶尖性能,具备强大的控制能力;0.6B模型则在性能与效率之间取得了出色平衡。该系列模型覆盖了10种主流语言(包括中文、英文、日语、韩语、德语、法语、俄语、葡萄牙语、西班牙语及意大利语)以及多种方言音色,能够充分满足全球化应用需求。
同时,模型具备强大的上下文理解能力,可根据指令和文本语义自适应调整语气、节奏与情感表达,并对输入文本噪声的鲁棒性有显著提升。目前模型已在开源平台发布,用户也可通过官方API进行体验。
相关攻略
北京商报讯(记者 陶凤 王天逸)2月10日,壁仞科技最新发文称,由上海创智学院孵化的模思智能及OpenMOSS团队正式发布并开源了MOSS-TTS Family。模型发布后,壁仞科技旗舰产品壁砺 1
智通财经APP获悉,1月22日,据千问Qwen官微消息,Qwen3-TTS全家桶开源上线。Qwen3-TTS是由Qwen开发的一系列功能强大的语音生成,全面支持音色克隆、音色创造、超高质量拟人化语音
IT之家1月22日消息,据千问 Qwen 微信公众号消息,Qwen3-TTS 多码本全系列模型已开源,包含1 7B 和0 6B 两种尺寸,1 7B 可以达到极致性能,0 6B 均衡性能与效率。据介绍
IT之家 12 月 24 日消息,阿里通义今日官宣,Qwen3-TTS 家族新推出两款模型,音色创造模型 Qwen3-TTS-VD-Flash 和音色克隆模型 Qwen3-TTS-VC-Flash。
12月24日,阿里升级语音模型家族Qwen3-TTS,发布音色创造Qwen3-TTS-VD(VoiceDesign)和音色克隆Qwen3-TTS-VC(VoiceClone)两款全新模型,在生成效果
热门专题
热门推荐
《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照
雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战
借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动
冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让
iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消





