AI初创公司Resemble AI正式推出了其开源文本转语音模型“Chatterbox Turbo”,只需短短5秒的语音样本,即可克隆出高质量的人声。

据最新评估显示,该模型在语音自然度与保真度方面已超越ElevenLabs和Cartesia等主流方案,其首句响应延迟可控制在150毫秒以内,能够广泛适配实时智能体、自动化客服、互动游戏、数字人应用及社交平台等低延迟需求场景。

Chatterbox Turbo遵循MIT开源协议,允许免费商用、自由修改及二次分发。目前模型已上线Hugging Face、RunPod、Modal、Replicate与Fal等主流平台,全部源代码托管于GitHub。
https://www.php.cn/link/1fe6eda65dcd46c3a5ad1789c3bf08f5
https://www.php.cn/link/0a8f8b227be2d04a675082cc9d51c127
Resemble AI同步提供了云端托管服务,并正研发面向极致实时性的优化版本。模型内嵌了名为“PerTh”的可检测音频水印,以助力监管机构与内容平台识别AI生成语音。
源码地址:点击下载
