
使用Midjourney生成单人肖像,对许多用户而言已非难事。然而,当画面需要包含两个或更多人物时,如何撰写提示词才能让AI准确理解,避免人物特征混淆或画面崩坏,便成为一项颇具挑战性的任务。
本文将系统拆解一套清晰、高效的Midjourney多人像提示词撰写方法,手把手教你如何精准描述多人物场景,提升出图成功率与画面质量。
设计素材不用愁!10 组高质量中秋节主题 Midjourney 提示词
中秋佳节将至,我们照例为您精选了一批高质量的Midjourney中秋主题提示词,助您轻松创作节日视觉内容。
阅读文章 >
本方法可归纳为四个核心步骤,若需融合两个特定人物形象,还可增加一个可选步骤。完整流程如下:
① 使用关键词设定通用场景
② 通过扩充关键词描述来增加细节
③ 描述图像的其他组成部分
④ 描述整体氛围或艺术美感
如需在一张图像中融合两个人物特征,可在此方法基础上增加步骤5,即使用--cref参数:
⑤ --cref URL-showing-two-characters-in-one-image
一、使用关键词设定通用场景
第一步,用一个简洁的陈述句搭建画面基础框架。此句无需过长,核心是确立主要人物与事件,细节可后续补充。这并非绝对规则,但若在生成多人场景时遇到困难,从此结构入手往往能更顺畅。
例如,一个基础描述可以是:
三位朋友坐在公园长椅上

我们可以进行初步优化:
三位外貌不同的朋友坐在公园的长椅上 (若省略“不同”,Midjourney可能生成外貌相似的人物)

进一步优化,注入更多关系与情感氛围:
三位不同的挚友亲密地并肩坐在公园的长椅上。(若省略“挚友”与“亲密地并肩”,画面可能显得较为普通)

二、通过调整关键词来增加人物细节
场景框架确立后,接下来是为人物填充具体特征。一个实用技巧是:采用“回调”(call-back)方式增加细节。即重复或呼应前文已使用的关键词,这能强化AI对新细节与已设定场景之间关联性的理解。
延续上述场景:三位不同的挚友亲密地并肩坐在公园的长椅上。
现在,开始具体描述中间的朋友:
推荐写法是使用清晰简单的句子:中间的朋友是一位美丽的亚洲女性,身着白色羊毛开衫与灰色西裤,梳着马尾辫。The friend in the middle is a beautiful Asian woman in a white cardigan and grey trousers with a ponytail.
需要避免的写法有两种:
1. 未与前文建立明确关联:莉莉在中间,是个梳着马尾辫的亚洲女性,穿着白色羊毛衫和灰色西裤。(“莉莉”这一新名字突然出现,与上文的“朋友”关联较弱)
2. 句式复杂,核心信息模糊:中间穿着白色羊毛衫和灰色裤腿裤的是莉莉。


使用相同方法,描述另外两位朋友:
左边的朋友站立着,手捧一个花盆,是一位穿着灰色毛衣与黄色长裤、拥有黑色头发的亚洲男性。
The friend on the left is standing holding a flower pot, an Asian male wearing a grey jumper and yellow trousers with black hair
右边的朋友是一位穿着黑色毛衣与黑色长裤、黑色头发并佩戴项链的亚洲男性。
The friend on the right is an Asian male wearing a black jumper and black trousers with black hair and a necklace
三、描述画面中的环境与背景
人物刻画完成后,需丰富环境细节。一个重要原则是:将环境和背景的描述置于提示词的末尾。此举旨在防止背景信息干扰或覆盖前面已精心设定的人物特征。
以下是几个逐步优化的示例:
初级描述(对V6等模型可能过于模糊):有绿植和房屋。
更清晰:前景有几盆绿植。背景是精致的房屋。
具体而生动:前景摆放着几盆茂盛的虎皮兰与兰花。背景中,木结构房屋配有精致的黑色门窗。
若在此步骤添加细节后出现画面崩坏,有效的解决策略是将提示词回滚至上一步状态,再尝试更简洁或更聚焦的描述方式。



四、描述整体氛围或艺术风格
最后一步,为图像设定整体基调。同样,此部分内容应置于提示词末尾。需注意,像“艺术”这类过于宽泛、缺乏具体视觉指向的词汇,效果通常不佳。
若目标为摄影风格:
笼统:Photo.
较好:彩色摄影
最佳:指明具体的灵感来源,如摄影师姓名或出版物风格:“彩色摄影,风格源自 David Bellemere”
prompt:colour photography,by David Bellemere



若目标为非摄影类艺术风格:
笼统:艺术。
较好:数字艺术
最佳:使用形容词并指定具体的艺术家或艺术流派:“迪士尼风格的CG艺术”。



如果不确定选用哪位艺术家的风格,可以访问 Midlibrary.io 等网站进行探索,寻找创作灵感。

五、融合两个人物图像:可选添加 --cref 参数
这是一项进阶技巧,主要用于将两个(有时是三个)特定人物的形象特征融合到一张新图像中。
使用--cref参数的具体操作流程如下:
① 首先,找到一张包含你喜爱的人物风格的图片作为参考。

② 将这张参考图片上传至Discord,获取其图片链接。




将图片链接与你已撰写好的详细提示词结合,并在末尾添加 --cref 参数。例如:
prompt:三位不同的挚友亲密地并肩坐在公园的长椅上,中间的朋友是一位美丽的亚洲女性,身穿白色开衫和灰色长裤,扎着马尾辫。右边的朋友是一位身着黑色毛衣、黑色长裤、黑色头发、佩戴项链的亚洲男性,左边的朋友是一位身着灰色毛衣、黄色长裤、黑色头发、手捧花盆的亚洲男性,前景是几盆郁郁葱葱的虎皮兰和兰花。彩色摄影,David Bellemere风格 --v 6.1 --cref

③ 接下来,即可开始生成,结果将尝试融合参考图中的人物特征。


六、一个公式化的提示词组合结构
为便于记忆与应用,可将上述步骤总结为一个公式化的提示词组合结构:
通用场景:[人物数量与关系]在[具体地点]进行[何种活动]
增加人物细节:[各位置人物]:发型+服装+动作+细节特征+情绪+种族;
丰富场景细节:[地点环境]:室内/户外/时间段/用途/具体物件…
设定艺术风格:[风格]:照片/插画/数字艺术+特定艺术家风格/艺术流派
掌握这套从搭建场景、细化人物、丰富环境到最终定调的逻辑流程,再结合--cref等进阶工具,你便能更从容地驾驭Midjourney,高效生成符合预期的多人物复杂场景图像。
