几个月前,AI还原历史人物图像的项目火了一把,一度成为AI副业领域的爆款玩法。当时,AI技术让那些模糊的黑白老照片、手绘残卷甚至残缺的画像,重现了古人的容貌——既考验了AI图像处理的极限,也完成了一次对历史文化的致敬。
如今,这项技术又向前跨了一大步:不只是还原图像,还能让这些历史人物“开口说话”。借助自然语言处理与AI语音合成,AI能够模拟古人的语言风格和思维逻辑,让他们吟诵自己的诗词,或对时局发表见解,仿佛真的穿越千年而来,和我们完成一场跨越时空的对话。这种AI历史人物复原体验,对历史研究、文化传承乃至教育娱乐领域,都带来了全新的可能。
下面通过一个实例,说明AI怎样还原历史人物图像,并让他/她说出自己的名言或诗词。我们以东汉才女蔡文姬为例,让她朗诵自己创作的《悲愤诗》。
蔡文姬名琰,字文姬(一说字昭姬),陈留郡圉县人,文学家蔡邕之女。她博学多才,擅长文学、音乐、书法,是当时的杰出女性文学家。人生经历磕绊坎坷——初嫁卫仲道,丈夫去世后回家;东汉末中原大乱,归降的南匈奴趁势叛乱,她被左贤王掳走,在匈奴生下两个孩子;后来曹操统一北方,用重金将她赎回,并嫁给了董祀。《悲愤诗》是她归汉后所作的五言古诗,以情纬事,是中国诗歌史上第一首文人创作的自传体长篇叙事诗,情感深沉,叙事生动。这里节选其中几句:
“汉季失权柄,董卓乱天常。
志欲图篡弑,先害诸贤良。
逼迫迁旧邦,拥主以自强。
海内兴义师,欲共讨不祥。
卓众来东下,金甲耀日光。
平土人脆弱,来兵皆胡羌。
猎野围城邑,所向悉破亡。
斩截无孑遗,尸骸相撑拒。”
一、AI还原蔡文姬图像
1、用AI工具让原图变清晰,去除不必要的元素
在百度搜索“蔡文姬历史人物”图片,选择正面像,比如下面这张:

原图比较模糊,需要先用AI把它变清晰。打开“百度AI图片助手”,上传这张图片,点击右侧的“变清晰”进行AI图像修复:

重新生成并裁剪为3:4比例的图片如下:

2、AI还原图像
使用AI绘画工具Comfyui中的“古人画像还原成真人照片”工作流,实现历史人物写实化:

打开该工作流页面后,点击“在线运行工作流”进入创作界面:

在“加载图像”处,上传上一步编辑好的图片:

如果直接点击“开始生图”,默认会使用工作流作者选择的大模型和Controlnet模型(XL模型,需要付费)。所以需要手动更改模型:在“Checkpoint加载器”中选择“麦橘写实模型”(其他写实模型也可以):

在第一个“Controlnet模型”中选择canny SD15模型,强度设为0.9:

在第二个“Controlnet模型”中选择Tile SD15,强度设为0.5:

因为蔡文姬是女性,在“CLIP文本编码器”中把默认提示词里的“man”改为“woman”:

设置完成后,点击左上角“开始生图”。稍等片刻,生成的图片如下:

二、生成蔡文姬朗诵《悲愤诗》(节选)视频
1、图生视频
打开即梦AI,进入“AI视频”生成页面,选择“图片生视频”,上传上一步生成的图片。运动速度选“适中”,生成时长选12秒,其他默认:

点击“立即生成”,即梦会生成一段12秒的视频。由于节选的诗句朗读时间超过12秒,需要再生成两段12秒的视频。至于需要生成多长的视频,可以在即梦AI的“视频生成”-“对口型”页面里,填入文本、选择音色、调整语速后点击试听,系统会自动给出时长。

为了让视频之间过渡自然,可以采用角色一致的方法生成多段视频(即保持人物形象、背景一致),然后把三段视频导入剪映合并(注意不要做其他编辑),导出合并后的视频。需要注意的是,即梦AI对口型一次视频时长不能超过30秒,而合并后的视频约36秒,所以需要裁剪到30秒以内。
2、对口型
再次打开即梦AI,进入“AI视频”-“视频生成”页面,选择“对口型”。在“角色”处上传上一步合并后的视频;在“文本朗读”文本框中粘贴《悲愤诗》节选内容;选择音色为“悲伤女声”;生成效果选“标准”:

三、后期剪辑
最后还可以将生成的视频导入剪映进行后期处理,比如添加背景音乐、片头片尾、封面等。这一步这里就不再展开了,感兴趣的可以自己尝试。
