近日,豆包语音团队发布了"AI多人有声剧"自动化解决方案。该方案支持多角色、表现力强劲的TTS语音合成播报,同时实现了全自动AI后期制作流程。从小说文本到高品质的多人有声剧作品,全部由AI端到端完成。
据了解,"AI多人有声剧"自动化解决方案依托高自然度的多角色智能朗读技术,配合AI后期自动添加音乐、音效和特效,并执行智能混音,可全自动生成能够媲美真人水准的有声剧作品。这套方案不仅让听书体验的自然流畅度和沉浸感大幅提升,而且整个生产流程无需人工参与,能显著降低制作成本、缩短制作周期,高效覆盖更多书籍资源。

"AI多人有声剧"自动化解决方案支持从小说文本到完整成品有声剧的全自动生产。该方案可自动进行角色划分,准确率超过98%,同时其语音大模型通过对海量文本与语音的多模态预训练,原生地将文本和语音模态融合,引入思维链信息,具备强大的文本理解能力和语音演绎能力,多人播报效果发音自然、情感丰富。
此外,方案中的画本预测模型基于多角色播声音频,实现了从小说文本到带有音效、人声特效、环境音、配乐画本的全流程预测,在获取画本信息后执行音频召回与合成、智能动态调整音频参数,并融合多角色TTS最终合成"有声剧"成品。
目前,首批通过"AI多人有声剧"方案端到端创作的作品已在番茄小说APP上线,效果超出预期,并获得书友好评,为听书行业注入了全新活力。未来,"AI多人有声剧"方案将持续升级迭代,覆盖更多有声内容品类,小说更新后用户即可同步享受精品有声剧。
