快手旗下AI平台可灵近日重磅推出创新数字人生成功能,只需上传一张角色图片并输入文字或音频,即可自动合成1080p/48帧率的动态视频,单次最长可生成1分钟时长的数字人内容。目前该功能正在分批向用户开放公测。

核心技术解析
这项突破性的数字人技术深度融合了多模态理解能力和视频生成算法。核心架构采用基于Transformer的DiT模型,在处理时序数据和实现精细控制方面优势显著。系统能够精准识别面部特征,理解音频语义,并智能匹配相应的表情动作:
- 唇形同步准确度高达95%以上
- 支持15种基础表情自动生成
- 可实现80种以上的面部微表情控制
多场景应用支持
在角色多样性方面表现尤为突出,无论是真人形象、动漫角色还是动物拟人化形象,均可高质量实现。语言支持更覆盖中文、英文、日文、韩文等主流语种,并持续扩充中:
- 企业形象代言人定制
- 虚拟主播内容创作
- 多语言教育视频制作
- 个性化社交内容生成
商业化落地前景
平台采用阶梯定价策略,普通用户起步价为0.15元/秒,开通会员后可享0.12元/秒的优惠价格。目前功能正处于公测优化阶段,已陆续向申请用户开放体验权限。据内部消息透露,后续将开放API接口,与第三方平台深度整合,构建更完整的AI数字人开发生态。
