先说几个关键点:想在Pika里生成主人出镜、场景真实的宠物短片,提示词必须把人和空间的位置关系写清楚。否则,AI很容易把宠物和人揉成一团模糊的色块,或者干脆忽略掉环境中的细节。很多人写“a person with dog”这类笼统的提示词,结果往往不尽人意——这就是问题所在。
先锁定人群身份与动作
提示词开头必须具体到人物是什么样、在做什么。比如“a young woman in denim jacket smiling and gently scratching her golden retriever's ear”,不要只写“a person with dog”。Pika对泛指代词的识别能力有限,如果只笼统地写“一个人”,生成的时候很可能会得到无脸人形或者肢体比例失调的剪影。
如果需要多人同时出镜,可以用“two children sitting cross-legged on grass, laughing as a fluffy white cat bats at a feather toy near their feet”这类句式。关键在于带上位置锚点(比如on grass)和互动动词(sitting, laughing, bats at),而不是简单地用“with”连接——否则人物很容易“飘”在空中。另外,当人数超过三个时,Pika容易丢失个体特征,所以更推荐“a couple + one child”这样的组合,而不是直接写“three people”。
再嵌入可信的生活化场景
场景的写法有两条路径。一条是堆细节:比如“in a sunlit living room with wooden floor, potted monstera plant in corner, soft rug under paws”,把材质(wooden)、光影(sunlit)、植物品种(monstera)和空间逻辑(corner, under paws)都写进去。这样描述比单纯写“at home”效果要好上三倍不止。
另一条路径是把宠物行为和场景元素直接绑定,比如“kitten chasing dust motes floating in afternoon light through kitchen window”。这里的“dust motes”“afternoon light”“kitchen window”三者构成了物理上的因果关系链,Pika可以据此推测窗户的位置、光线的角度和空气的质感,生成更自然的画面。场景名词一定要带限定词,单独写“park”“bedroom”“garden”是远远不够的——这类缺乏参照物的描述,常常会让画面变成空旷的灰色平面。
最后用分隔符强制角色-场景解耦
怎么写才能让Pika把人物、宠物、场景分清楚?一个很有效的做法是用英文冒号加空格来明确切分三个部分,格式像这样:
Person: a senior man wearing round glasses, feeding kibble from palm → Pet: tabby cat rubbing cheek against his wrist → Scene: small balcony with drying laundry, potted basil, city skyline blurred in distance
每个箭头后面的内容至少包含一个动态动词(feeding, rubbing, blurred)和一个不可替换的实体名词(kibble, basil, skyline)。形容词堆砌在这里帮不上什么忙,反而会混淆AI的判断。另外,删掉所有“beautiful”“cute”“adorable”这类主观修饰词——它们会干扰Pika对物理关系的理解,导致猫突然悬浮或者老人的手部变形。

