阿里通义语音双模型上线:一句话即可生成高质量语音
3月2日,阿里通义实验室语音团队正式推出两款支持自由风格指令生成的模型——Fun-CosyVoice3.5与Fun-AudioGen-VD。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,这两款模型实现了对语音表达和音频场景的精准控制。用户仅需通过自然语言指令,即可直接生成所需的语音效果,无论是细腻的情绪表达,还是从零开始设计音色与场景,都能轻松实现。
其中,Fun-CosyVoice3.5专注于多语种复刻与精细化表达控制。用户可以直接用自然语言描述表达方式,例如“语气再坚定一些”“稍微压低音调,语速放慢一点”“带一点情绪起伏”……模型能准确理解并生成对应的语音表现。此外,针对生僻字、复杂语句等容易读错的场景,Fun-CosyVoice3.5进行了专项优化,将生僻字读错率从15.2%降至5.3%,

而Fun-AudioGen-VD则主打音色设计与场景化音频生成。它支持根据自然语言描述,生成目标音色、情绪表达和完整听觉场景。不仅如此,Fun-AudioGen-VD不仅能生成语音,还能生成语音所处的“世界”,为用户打造沉浸式的听觉体验。

相关攻略
IT之家 4 月 6 日消息,荣耀全场景软件主理人 @荣耀席迎军 今日再度分享了 MagicBook 全新 AI UI。他透露,他的电脑在升级最新版本后,性能大幅度提升,而且可玩性更高。有网友询问了
IT之家 4 月 3 日消息,科技媒体 Android Authority 昨日发布博文,报道称在安卓 17 Beta 3 更新中,发现谷歌正在酝酿“通知规则”功能,用户可以针对特定应用、联系人设定
IT之家 3 月 17 日消息,科技媒体 Android Authority 今天发布博文,报道称三星承认 Galaxy S26 Ultra 旗舰手机的“防窥屏”技术存在瑕疵,在特定视角和最高亮度下
IT之家 3 月 17 日消息,小度上周宣布接入 OpenClaw 龙虾生态,小度智能家居 Skills 已登陆 ClawHub。IT之家注意到,小度去年就已完成智能家居控制能力的 MCP 化升级,
IT之家 3 月 10 日消息,AI 理想同学的最新账号今日宣布,理想 AI 眼镜 Livis 再进化,带来了佩戴检测 + 一气呵成两大开关、连续语音抓拍等功能。IT之家附理想 AI 眼镜 Livi
热门专题
热门推荐
当代互联网技术飞速进步,口号已成为普遍被使用的短语 在信息爆炸的今天,一句精炼有力的口号,往往能迅速传递品牌或活动的核心理念,甚至演变为一种深入人心的文化符号。那么,哪些标语能够真正触动人心,将抽象的服务宗旨转化为具体可感的信任呢?本文将聚焦于医疗健康这一特殊领域,为您深度解读一组关于文明就医与人文
微软年度开发者盛会概览微软Build大会是该公司每年面向全球开发者、工程师和技术决策者举办的最重要技术盛会。它不仅是微软展示其最新技术成果、平台更新和未来愿景的舞台,更是开发者们获取前沿知识、学习最佳实践以及直接与产品团队交流的核心渠道。大会通常持续数日,包含主题演讲、技术深度解析、实践工作坊以及丰
《大航海时代起源》:在无垠海域中,书写你自己的航海史诗 《大航海时代起源》(英文名“Uncharted Waters Origin”)的核心魅力,正如其名,在于开启一段关于自由探索、跨洋贸易与开拓未知疆域的宏大冒险。游戏从角色创建伊始,便将命运的舵盘交予玩家。性别、外貌乃至性格倾向,这些基础的自定义
《完美证据》:一场“慢”与“快”的七年对赌 在当下追求“拍完即播”的影视快消时代,《完美证据》的出现,宛如一位闯入百米赛道的马拉松选手。当行业竞逐速度时,它却历经七年打磨才姗姗来迟。观众不禁好奇:耗时如此之久,这部剧究竟在打磨什么?它的“慢”,是否藏着独特的价值? 审视其时间线,最值得玩味的或许不是
AI食谱生成器是什么 简单说,它是一种能帮你“凭空变出”菜谱的智能助手。这工具由多个技术团队合力开发,核心目标很明确:让每个人,无论是经常下班的上班族,还是爱钻研美食的厨艺爱好者,都能根据手边有的食材和个人口味,快速获得一份专属的烹饪方案。它让做饭这件事,从“今晚吃什么”的难题,变得轻松、个性,甚至





