近日,快手旗下可灵AI平台重磅推出数字人生成服务,用户仅需上传角色图片并输入文字或语音,即可生成1080p高清分辨率、48帧率的高流畅度数字人视频,单条视频最长支持60秒内容创作。该功能已正式启动公测,正分批向平台用户开放体验。
这项创新技术深度融合多模态理解与视频生成算法,具备以下核心优势:
- 语音口型同步技术达到像素级精确匹配
- 支持微表情控制和15种基础动作模板
- 采用新一代DiT架构,时序建模误差率降低67%
在智能化表现方面,系统通过3000万小时视频数据训练,可精准识别7种基础情绪特征,并根据语音语义自动适配点头、眨眼等28种微动作。特别是在多语言支持上,可灵AI实现了中文普通话、英语、日语等12种语言的语音驱动,方言识别准确率高达92%。
现开放三种数字人生成模式:
- 基础版:0.12元/秒(会员专享)
- Pro版:0.25元/秒(含高级动作模组)
- 定制版:支持API对接(需商务洽谈)
目前该功能已率先在可灵AI游戏平台上线测试,预计三季度将开放Web端创作入口。技术团队透露,下一步将重点优化细节渲染算法,计划年内实现4K分辨率支持,同时拓展电商直播、在线教育等垂直场景的应用深度。
