游乐游手机版
首页/科技数码/文章详情

Soul X吉利AIC推三大零样本歌声合成技术:支持普通话、粤语与英语

时间:2026-02-10 13:13
过去一年,生成式人工智能在音乐行业的应用正不断创造新体验,但歌唱语音合成领域(SVS,Singing Voice Synthesis)整体进展相对缓慢。为拓展这一领域,近日,Soul App AI

去年,生成式人工智能在音乐领域的应用不断催生新的体验,但歌唱语音合成技术(SVS)的整体发展步伐却相对平缓。

为了推动该领域的进展,Soul App AI 团队近期联合吉利汽车研究院人工智能中心、天津大学视听认知计算团队以及西北工业大学的音频语音与语言处理研究组,共同开源了歌声合成模型 SoulX-Singer。这是一个面向实际应用场景设计的高质量零样本歌声合成模型,拥有超过42000小时的训练数据,覆盖多种语言、音色及演唱风格。其在稳定性、可控性与泛化能力方面,均已达到当前开源SVS模型的领先水准。

\

尽管此前歌声合成领域已涌现出不少优秀成果,但由于训练数据规模有限或控制方式单一等因素,相关模型在实际使用中仍面临诸多挑战。SoulX-Singer 的发布,恰恰提供了一个真正鲁棒、灵活可控且面向场景落地的零样本歌声合成方案,为歌声合成技术在用户原创音乐创作等方向的实践应用探索带来了积极意义。

SoulX-Singer 也延续了Soul AI团队的开源工作传统。此前,该团队已陆续开源了播客语音合成模型 SoulX-Podcast、实时数字人生成模型 SoulX-FlashTalk,在语音、歌声、实时数字人、视频等多个领域,提供了切实可用的多模态生成方案。

来源:https://www.itbear.com.cn/html/2026-02/1140969.html
上一篇国产6x6“雪豹”极地载具亮相,助力南极考察迈向新阶段 下一篇睿数信息RayZoom+G200三维方案,助力晴川阁数字文保新实践
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
多点触控技术实际应用案例分享
科技数码 · 2026-06-30

多点触控技术实际应用案例分享

多点触控技术借助电容或光学感应实现多指同时识别,重塑了移动设备交互、创意设计、教育协作及零售公共服务等场景,未来将与增强现实、智能家居等技术深度融合,使人机交互更自然高效。

MultiTouch多点触控全面教程指南:从入门到实际使用
科技数码 · 2026-06-30

MultiTouch多点触控全面教程指南:从入门到实际使用

多点触控技术使屏幕同时识别多指操作,涉及传感、坐标追踪和手势识别。基础手势如双指缩放、旋转及多指滑动提升效率。在创意软件中实现画布控制与参数调节,游戏带来沉浸式操控。保持屏幕清洁、用指腹触碰可优化体验。

Lily Camera无人机空中拍摄真实应用案例与心得分享
科技数码 · 2026-06-30

Lily Camera无人机空中拍摄真实应用案例与心得分享

LilyCamera是一款无需遥控器的抛飞式自拍无人机,通过视觉与GPS追踪实现自动跟拍,瞄准运动与旅行场景。但因技术、供应链和资金问题未能量产。其概念推动了行业跟拍功能发展,强调用户体验简化与工程务实的平衡。

Lily相机使用中常见问题解决方法
科技数码 · 2026-06-30

Lily相机使用中常见问题解决方法

使用中遇到开不了机、连不上或画质模糊等问题,可先充满电、重启设备、检查镜头及App版本。续航下降可调整高耗电设置,充不进电需用原装配件并清理接口。定期更新固件与应用能解决多数故障,官方支持与用户论坛可获取进一步帮助。

Lily Camera从入门到实际使用的完整详细教程指南
科技数码 · 2026-06-30

Lily Camera从入门到实际使用的完整详细教程指南

LilyCamera是一款抛飞即用的自动跟拍相机,通过计算机视觉与GPS追踪技术,配合腕带追踪器实现无需遥控器的极简操作。其理念影响了后续消费级无人机和运动相机的视觉跟踪系统发展。适用于跑步、骑行等动态场景,充分体现了对用户使用场景的深刻洞察。