一段看似简单的GPT-4o提示词,竟能生成如此“以假乱真”的图片,并且这股热潮持续至今,创意层出不穷,这确实有些出人意料。想必各位在社交平台上,早已被这类图片刷屏。
比如,京东外卖与美团外卖的骑手在街头“激战正酣”,而两位创始人——强子与兴哥——却身着各自工服,在上海外滩友好自拍,尽管兴哥的表情看起来并不那么“嘻嘻”。

周杰伦、林俊杰、陈奕迅也“现身”广州小蛮腰和上海,摆出了同款自拍姿势。

甚至有一张来自“中土世界”的合影:C罗与梅西,也到清华园一游。

《绝命毒师》里的老白和小粉,则来到了天津。

当然,最令人拍案叫绝的,或许是最近在小红书上爆火的那组《45岁,离职北大》。其创意脑洞堪称无敌,数据表现更是直接拉满,收获了近12万的点赞。

不止人物,连猫咪也能成为主角。

这些图片过于“真实”,不断挑战着我们大脑的辨别能力。它们传递出一种强烈的信号:这看起来就像真的。真实得如同路人随手用手机抓拍的瞬间。
以至于,当有人随手拍下一张日常照片分享时,评论区竟也会出现质疑:“这又是AI画的吧?”

这种现象本身就非常有趣。生成这类自拍效果图片的Prompt,其实简单得出奇:
“请画一张极其平凡无奇的iPhone自拍照,没有明确的主体或构图感,就像是随手一拍的快照。照片略带运动模糊,阳光或店内灯光不均导致轻微曝光过度。角度尴尬、构图混乱,整体呈现出一种刻意的平庸感,就像是从口袋里拿手机时不小心拍到的一张自拍。主角是_____,背景是_____。”
只需将这段提示词填入你想要的主角和背景,复制到Sora等图像生成平台,一张栩栩如生的“照片”便诞生了。
之所以推荐使用Sora而非ChatGPT内置的4o生成,纯粹是因为Sora在生图体验上更优。两者底层模型一致,但Sora支持一次生成多张,预设比例等选项也更直观。
例如,想生成马斯克与一位美女一起打游戏的画面,只需将描述填入即可。

很快,一张极具真实感的“马斯克自拍”就呈现在眼前。

一场始于“越狱”的意外走红
这段Prompt最初的源头已不可考,但本轮大规模传播的起点,普遍认为是Reddit上一个名为“ChatGPTJailbreak”的论坛。

这个论坛是做什么的?顾名思义,就是尝试突破OpenAI官方设定的各种限制,俗称“越狱”。
大约两周前,一位用户在论坛上发布了相关帖子。

没想到,它火了。发帖者的初衷,其实是为了让GPT-4o生成一些NSFW(不适宜在工作场合浏览)内容。有趣的是,许多事物的流行,最初往往源于人类某些最原始的欲望驱动。
虽然NSFW的目的未能完全达成,但用户却意外收获了一个“副产品”——一种极度逼真、充满“真实感”的AI照片。跟帖的网友们都震惊了。

于是,这段神奇的Prompt迅速传遍全球。原因无他:生成效果太“真”了。
那么,核心问题来了:到底什么是“真实”?
“不完美”何以成为“真实”的密码?
让我们回过头,仔细品读这段Prompt的关键词:平凡无奇、没有主体、缺乏构图、快照感、运动模糊、曝光过度、角度尴尬、构图混乱、刻意平庸。
整段描述里,没有一个词在追求“完美”。相反,它通篇都在强调一件事:普普通通。
正是这种“普普通通”,赋予了图片无与伦比的真实感。它像极了你的伴侣或朋友随手给你拍下的那张照片——模糊、构图糟糕、表情尴尬,但你看到后只会会心一笑,或许还会笑骂一句。
这种普通,恰恰映射了我们身边最平凡的瞬间。
我们的人生,本就由大量无意义的平凡时刻填充。我们的生活,多数时候并非经过精心雕琢、专业修图、灯光完美的“大片”。
它是早高峰地铁里,人被挤得动弹不得,却仍倔强举起手机拍下拥挤车厢发给朋友吐槽的模糊影像;是夜市摊边,一手拿着烤串,一手颤巍巍举起手机拍摄桌上狼藉杯盘,询问朋友是否要来“下半场”的糊图;是朋友聚会笑到变形时,那张曝光过度、五官拉扯的合影;是过年回家途中的高速服务区,父母用不熟练的姿势和像素一般的手机,为你拍下的那张头歪向一边的照片。
手抖了、光曝了、构图乱了……但这些照片,恰恰是我们生命最真实的切片。它们不是为了展示而存在,仅仅是生命路过时留下的证据。
而这一切,正是人类最熟悉、最习以为常的“真实感”。因此,当一张照片呈现出这种“不完美”时,我们的大脑会立刻做出判断:这像是真的。这才是我熟悉的世界——不是虚假的、精心编排的、为取悦而优化的,而是生涩的、笨拙的、脆弱的、不经意的。是活着的。
所以,当这些粗糙、带点模糊、角度尴尬的AI自拍涌现时,它们精准地击中了我们潜意识里对“真实”的认知模型。不是因为它们做得好,恰恰是因为它们做得“差”。而这种“差”,是有灵魂的。
“未经表演的存在”:稀缺的真实
我们似乎已经太久没在互联网上看到这种“差劲”了。从何时起,我们对社交媒体上的照片,默认带着一层不信任?P图、滤镜、摆拍、精修……人人都在展示自己最完美的一面,而这份“完美”往往与真实相去甚远。
直到有一天,GPT-4o阴差阳错地生成了一种“普通得不能再普通”的画面。就像你不小心打翻咖啡时,手机滑落瞬间误触快门拍下的照片——毫无华丽感,未经任何打磨,甚至有些蠢、有些糊、有些丑。但在看到它的那一秒,你突然意识到,自己已经很久没见过这样的东西了。
这种东西,或许可以称之为“未经表演的存在”。在一个一切都被剪辑、打磨、美化的世界里,这种未经修饰的存在,反而成了最极致的稀缺品。而这种存在,才是真实。
历史上不乏例证。在“911”事件中,有一张广为流传的照片:《坠落的人》。

照片中的人从高楼笔直坠落,背景是混乱的天际线。摄影师理查德·德鲁拍下这张照片时,没有时间构图,没有机会安排,仅仅是瞬间的本能反应。这张“失败的、没来得及对焦的”照片,却成了“911”事件最具冲击力的象征之一。因为那种无法修饰的绝望,那种混乱中的冷酷美学,才是真实世界本来的样子。也正是这种撕裂感,让世界记住了一个瞬间,而非一段官方通稿或一张经过润色的“完美”新闻图片。
真实的生命,从不配合任何镜头。
因此,当GPT-4o用这样一个看似奇怪的Prompt,画出那些歪扭、模糊的自拍时,我们才会产生共鸣:“啊,这像真的。”因为它太像我们自己了。
我们被“必须完美”的社会规训得太久,久到几乎忘记:活着,其实可以不必那么完美。可以拍糊,可以过曝,可以歪斜,可以平庸,可以不够好,可以什么都没准备好。
而在这一刻,AI或许反而以一种意想不到的方式,帮我们找回了自己差点丢掉的东西——那份粗糙、原始、却无比珍贵的真实感。
