9月18日,快手旗下可灵AI宣布推出突破性的数字人视频生成功能。这项创新技术仅需上传一张角色图片和一段文字或音频,就能输出1080P高清画质、48帧率、最长1分钟的数字人视频作品。据悉,该功能已开启渐进式公测,正在逐步向更多用户开放。

这款数字人功能创新性地融合了多模态理解技术与视频生成模型,在三大核心能力上表现突出:口型同步精确度、情感表达细腻度和动作控制精细度。其采用的DiT(Diffusion Transformer)架构在处理时序数据时展现出独特优势,能够智能解析人物面部特征、精准理解语音语义,并根据说话内容自适应匹配恰当的表情和细微动作,从而实现从头到尾的角色一致性保障。
特别值得一提的是,可灵AI数字人在角色多样性和语言适配性方面优势明显。系统兼容真人、动漫形象、萌宠等多种角色类型,同时支持中英文、日语、韩语等多语种转换。在定价方面,配合平台会员优惠,数字人生成成本最低可达0.12元/秒,具有较高性价比。
当前可灵AI数字人正处于公测推广期,用户可通过官方渠道申请体验。展望未来,随着技术迭代完善和API接口对外开放,这项数字人技术有望与各类第三方平台深度整合,构建更丰富的应用生态场景。
