Midjourney人物描述技巧如何精准控制画面中的多个角色

时间：2026-05-20 14:59

使用Midjourney生成单人肖像，对许多用户而言已非难事。然而，当画面需要包含两个或更多人物时，如何撰写提示词才能让AI准确理解，避免人物特征混淆或画面崩坏，便成为一项颇具挑战性的任务。本文将系统拆解一套清晰、高效的Midjourney多人像提示词撰写方法，手把手教你如何精准描述多人物场景，提

使用Midjourney生成单人肖像，对许多用户而言已非难事。然而，当画面需要包含两个或更多人物时，如何撰写提示词才能让AI准确理解，避免人物特征混淆或画面崩坏，便成为一项颇具挑战性的任务。

本文将系统拆解一套清晰、高效的Midjourney多人像提示词撰写方法，手把手教你如何精准描述多人物场景，提升出图成功率与画面质量。

设计素材不用愁！10 组高质量中秋节主题 Midjourney 提示词

中秋佳节将至，我们照例为您精选了一批高质量的Midjourney中秋主题提示词，助您轻松创作节日视觉内容。

阅读文章 >

本方法可归纳为四个核心步骤，若需融合两个特定人物形象，还可增加一个可选步骤。完整流程如下：

① 使用关键词设定通用场景

② 通过扩充关键词描述来增加细节

③ 描述图像的其他组成部分

④ 描述整体氛围或艺术美感

如需在一张图像中融合两个人物特征，可在此方法基础上增加步骤5，即使用--cref参数：

⑤ --cref URL-showing-two-characters-in-one-image

一、使用关键词设定通用场景

第一步，用一个简洁的陈述句搭建画面基础框架。此句无需过长，核心是确立主要人物与事件，细节可后续补充。这并非绝对规则，但若在生成多人场景时遇到困难，从此结构入手往往能更顺畅。

例如，一个基础描述可以是：

三位朋友坐在公园长椅上

我们可以进行初步优化：

三位外貌不同的朋友坐在公园的长椅上（若省略“不同”，Midjourney可能生成外貌相似的人物）

进一步优化，注入更多关系与情感氛围：

三位不同的挚友亲密地并肩坐在公园的长椅上。（若省略“挚友”与“亲密地并肩”，画面可能显得较为普通）

二、通过调整关键词来增加人物细节

场景框架确立后，接下来是为人物填充具体特征。一个实用技巧是：采用“回调”（call-back）方式增加细节。即重复或呼应前文已使用的关键词，这能强化AI对新细节与已设定场景之间关联性的理解。

延续上述场景：三位不同的挚友亲密地并肩坐在公园的长椅上。

现在，开始具体描述中间的朋友：

推荐写法是使用清晰简单的句子：中间的朋友是一位美丽的亚洲女性，身着白色羊毛开衫与灰色西裤，梳着马尾辫。The friend in the middle is a beautiful Asian woman in a white cardigan and grey trousers with a ponytail.

需要避免的写法有两种：

1. 未与前文建立明确关联：莉莉在中间，是个梳着马尾辫的亚洲女性，穿着白色羊毛衫和灰色西裤。（“莉莉”这一新名字突然出现，与上文的“朋友”关联较弱）

2. 句式复杂，核心信息模糊：中间穿着白色羊毛衫和灰色裤腿裤的是莉莉。

使用相同方法，描述另外两位朋友：

左边的朋友站立着，手捧一个花盆，是一位穿着灰色毛衣与黄色长裤、拥有黑色头发的亚洲男性。

The friend on the left is standing holding a flower pot, an Asian male wearing a grey jumper and yellow trousers with black hair

右边的朋友是一位穿着黑色毛衣与黑色长裤、黑色头发并佩戴项链的亚洲男性。

The friend on the right is an Asian male wearing a black jumper and black trousers with black hair and a necklace

三、描述画面中的环境与背景

人物刻画完成后，需丰富环境细节。一个重要原则是：将环境和背景的描述置于提示词的末尾。此举旨在防止背景信息干扰或覆盖前面已精心设定的人物特征。

以下是几个逐步优化的示例：

初级描述（对V6等模型可能过于模糊）：有绿植和房屋。

更清晰：前景有几盆绿植。背景是精致的房屋。

具体而生动：前景摆放着几盆茂盛的虎皮兰与兰花。背景中，木结构房屋配有精致的黑色门窗。

若在此步骤添加细节后出现画面崩坏，有效的解决策略是将提示词回滚至上一步状态，再尝试更简洁或更聚焦的描述方式。

四、描述整体氛围或艺术风格

最后一步，为图像设定整体基调。同样，此部分内容应置于提示词末尾。需注意，像“艺术”这类过于宽泛、缺乏具体视觉指向的词汇，效果通常不佳。

若目标为摄影风格：

笼统：Photo.

较好：彩色摄影

最佳：指明具体的灵感来源，如摄影师姓名或出版物风格：“彩色摄影，风格源自 David Bellemere”

prompt：colour photography，by David Bellemere

若目标为非摄影类艺术风格：

笼统：艺术。

较好：数字艺术

最佳：使用形容词并指定具体的艺术家或艺术流派：“迪士尼风格的CG艺术”。

如果不确定选用哪位艺术家的风格，可以访问 Midlibrary.io 等网站进行探索，寻找创作灵感。

五、融合两个人物图像：可选添加 --cref 参数

这是一项进阶技巧，主要用于将两个（有时是三个）特定人物的形象特征融合到一张新图像中。

使用--cref参数的具体操作流程如下：

① 首先，找到一张包含你喜爱的人物风格的图片作为参考。

② 将这张参考图片上传至Discord，获取其图片链接。

将图片链接与你已撰写好的详细提示词结合，并在末尾添加 --cref 参数。例如：

prompt：三位不同的挚友亲密地并肩坐在公园的长椅上，中间的朋友是一位美丽的亚洲女性，身穿白色开衫和灰色长裤，扎着马尾辫。右边的朋友是一位身着黑色毛衣、黑色长裤、黑色头发、佩戴项链的亚洲男性，左边的朋友是一位身着灰色毛衣、黄色长裤、黑色头发、手捧花盆的亚洲男性，前景是几盆郁郁葱葱的虎皮兰和兰花。彩色摄影，David Bellemere风格 --v 6.1 --cref

③ 接下来，即可开始生成，结果将尝试融合参考图中的人物特征。

六、一个公式化的提示词组合结构

为便于记忆与应用，可将上述步骤总结为一个公式化的提示词组合结构：

通用场景：[人物数量与关系]在[具体地点]进行[何种活动]

增加人物细节：[各位置人物]：发型+服装+动作+细节特征+情绪+种族；

丰富场景细节：[地点环境]：室内/户外/时间段/用途/具体物件…

设定艺术风格：[风格]：照片/插画/数字艺术+特定艺术家风格/艺术流派

掌握这套从搭建场景、细化人物、丰富环境到最终定调的逻辑流程，再结合--cref等进阶工具，你便能更从容地驾驭Midjourney，高效生成符合预期的多人物复杂场景图像。

来源：https://www.uisdc.com/midjourney-56

上一篇Midjourney风格代码大全 78条高级感sref指令实战指南 下一篇ChatGPT 4o制作微信表情包上架全流程指南

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略，在大模型的内容采信规则下已经基本失效。取而代之的，是生成式引擎优化（GEO）。它不再关注外链数量，而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG（检索增强生成）架构真正看重的核心指