最近,一股AI合影的风潮席卷了社交网络。周杰伦在各个角落“低调现身”,马斯克和黄仁勋被“抓拍”到在西湖边喝奶茶,甚至奥特曼与爱因斯坦也能同框自拍。这些看似随手一拍、充满生活气息的照片,其实都出自AI之手。
如果你也想创作这种“以假乱真”的趣味合照,其实并不复杂。借助GPT-4o,普通人也能轻松上手。下面就来拆解一下具体的操作思路。
工具选择
尝试过多种AI生图工具后,会发现GPT-4o在捕捉这种“随手拍”的真实感上表现尤为出色。它不需要过于复杂的专业提示词,用自然语言描述就能得到不错的效果,并且支持多轮对话进行持续微调。
操作入口很简单:访问ChatGPT官网,选择GPT-4o模型即可。免费用户有试用额度,Plus用户则享有更高的使用上限。
提示词模板
核心在于一套高效的提示词模板。你可以直接复制下面的框架,只需替换【】中的内容:
“生成一张极其普通、毫无特色的iPhone自拍照,无明确主题或构图——像随手拍的快照。画面包含人行道、背景绿篱、轻微运动模糊、曝光过度、角度尴尬、构图混乱,整体刻意平庸。角色是【周杰伦+普京】,背景为【长城】,9:16比例。”
举个例子,用这个模板生成周杰伦和普京的合影,效果是这样的:
生成雷军和乔布斯的合影,则是这种风格:
是不是瞬间就有了那种“真实抓拍”的味道?
当然,在生成过程中还有一些小技巧可以提升效果:
如果要生成亚洲名人(比如周杰伦),可以在提示词中补充“风格真实自然”、“肤色细腻”、“避免卡通化”等描述,有助于AI更准确地刻画人物特征。
如果想模仿“偷拍感”,可以加入“路人模糊虚化”、“逆光剪影”等元素。
人物的表情也是让照片生动的关键。在提示词中加入“微笑”、“悲伤”或“尴尬”等情绪关键词,能让人物状态更鲜活。
「不完美」提示词拿捏松弛感
很多一眼就能被认出的AI图片,往往“完美”得过了头:专业的构图、极致的光影、毫无瑕疵的皮肤……一切都太精致,反而失去了生活的烟火气。
这时,“不完美”就成了营造真实感的灵魂。我们可以在需求中刻意加入一些生活化的瑕疵,比如动态模糊(模拟手抖或运动轨迹)、曝光不均(局部过曝或欠曝)、尴尬构图(非常规的拍摄角度)。这些元素能有效触发AI对生活随机性的模仿能力。
具体操作时,可以根据想象中角色所处的场景和其“拍摄习惯”,针对性增加“尴尬”细节。例如,在基础模板上增加:“夜间灯光不均,使用前置镜头,聚焦面部+旅游松弛感”。
于是,一张充满“直男自拍”风格的猫猫旅游图就诞生了:
(提示词示例:请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,夜间灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。使用的是前置镜头,聚焦面部,主角是狸花猫有旅游的松弛感,背景是夜间亮灯的巴黎铁塔。)
这里有个细节需要注意:提示词里需要明确指定猫的品种。如果只写“主角是猫”,结果可能会出人意料,比如得到一张真正的“直男”照片:
打造故事感场景
一张好的图片,本身就在讲述一个故事。最近社交平台上流行的梗图就是很好的例子:中年鲁迅与北大合影,配文诉说离职感慨;草地上掉落的榴莲旁,愤怒的牛顿质问是谁把榴莲放上了苹果树。
这些爆款文案的幽默感,目前AI还很难完全领会。如果直接在提示词里写“主角是牛顿,背景是榴莲掉在地上,显示牛顿被榴莲砸到后表情愤怒。”
得到的可能只是一张略显荒诞的搞笑图片:
单看图片,很难联想到经典的“牛顿笑话”。
但只要对背景稍加限定,效果就大不相同:
(提示词示例:请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,阳光或店内灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。主角是牛顿,背景是榴莲掉在树下的草地上,显示牛顿被榴莲砸到后表情愤怒。)
对于名人角色,其性格和身份已有公众认知,因此只要设置好场景和互动细节,就很容易生成符合预期的图片。
但如果想让动物角色毫无违和感地融入特定场景,就需要更精确地定义它们“扮演”的角色。例如,原本想生成一张壮志凌云的飞天小猫,但只得到了一个怂怂的乘客:
这时,如果在提示词中增加更多描述性细节,比如:“照片略带高空飞行带来的震动和运动模糊”,“主角是飞行员狸花猫,带有飞行战斗的紧迫感,背景是从机舱往外看出去正在飞行的战斗机群。”
整个画面的故事感和氛围立刻变得截然不同:
思路拓展与尝试
掌握了前面的核心思路后,完全可以在基础模板上自由发挥,创造出各种以假乱真的“照骗”。
例如,使用最近比较热门的豆包AI,输入类似的提示词进行创作,并选择人像摄影风格。
(提示词示例:图片风格为「人像摄影」,请你画一张及其平凡无奇的iPhone对镜自拍照,主角是穿着JK风格cos服的可爱女孩,在自己精心布置的可爱风格的房间内的落地镜前用后置摄像头随手一拍的快照。照片开启了闪光灯,略带点快门速度不够导致的运动模糊(若模糊需要整体的模糊,轻微程度),构图混乱,突出女生对镜自拍的镜子中反射的房间环境(以第一人称),突出模糊的光影关系,整体呈现出一种平庸和日常感,比例 「9:16」。)
最终的成片效果相当不错,既保留了精致感,又不失真实的生活气息,某种程度上可以满足对画面质感有要求的用户。
说到底,关键还是回到最初的模板:敲定你的主角和背景,然后通过细节的描述,让你心中的那个趣味场景,在AI的“镜头”下变得栩栩如生。
