刚接触 Lovart 那会儿,说实话,它的表现让人有点沮丧。
这个号称首个设计AI Agent的工具,整合能力确实够硬——GPT-Image、Gemini、Liblib AI、11 Labs、可灵视频生成,再加上结构化排版工具,全都开箱即用。可上手就是另一回事了。
别人生成的图,视觉、构图、氛围感全线在线,动不动就是神图级别;自己产出的图呢,乍看也不算差,但怎么看怎么像“功能图”——没情绪、没表达,甚至没人想点开看第二眼。
那段时间经常刷别人的作品,一边惊叹一边纳闷:明明用的是同一套AI工具,为什么别人做出来像艺术,自己做出来像模板?
问题的核心,其实不在工具,而在一个更根本的地方——有没有故事想讲。
AI确实越来越会画画,越来越会剪片。但关键在于,你有没有什么东西想让它帮你说?当认真拆解别人的prompt,也回头问自己:这张图是给谁看?想表达什么?
真正的差异在于:那些让人眼前一亮的好作品,背后都有一句“想对谁说的话”。它们不炫技、不抓马,但就是动人。因为它们用AI工具把情绪可视化了,让观者瞬间读懂作者的意图。

更好的路径是像设计师一样去感受生活、记录情绪、表达观点。这不意味着非要做出一个爆款海报或短片,而是重新学会:到生活的细节里去——光线怎么透过窗帘照到地板,记录一个想法——比如“AI可以生成图,但它读不懂我今天的心情”,然后用文字、图像、音频、视频,讲一个小小的故事。
第一个用Lovart做的“多模态作品”是这样的:
一张图,是夜晚十点的楼道灯光,带有孤独患者会喜欢的画面感。用AI音频生成器配了一段lo-fi小片段;用GPT生成了对应的alt文案:“这个世界没有忽略你,只是你还在安静发光”;最后让AI生成了一个8秒的短视频,用同样的文字加图像组合出来
很简单,不花哨。但发出去后,有朋友说:“你那个图,好像让我想起了之前一个深夜走路回家的瞬间。”
就在那一刻意识到——AI不只是用来“生产内容”的,它也可以成为讲故事的出口。那些没能说出口的情绪,也许可以交给AI先试着说说看。
Lovart这类工具,集合了太多“生产能力”——图像、排版、视频、音频……但真正重要的是:它能不能把人心里那些情绪、想法、回忆这些“没有形状的东西”,变成能看见、能听见、能点开的内容?
现在的Lovart还在不断更新中,确实也有一些不完美的地方:前端生成的内容暂时还不能直接结构化编辑,Prompt写起来还有点依赖经验……但这些都不妨碍继续用它,去讲一个个小故事。
更好的做法是:用设计师的脑子、创作者的心情去写Prompt。不是凑词,也不是堆关键词,而是像写一段心里话一样去写。
以前可能会写:“生成一套电商风格图,用红色调,有年轻感,适合女装品牌。”看上去有点用,但其实并不清楚想要的细节——不想要包包,模特也希望是中国的。
后来写得更清晰了(目标感也更明确):
“请生成一套适用于抖音直播间预热视频封面的视觉图,受众是18-30岁的女性消费者,画面以科技蓝和低饱和灰为主色调,风格要轻盈现代,同时保留左下角区域放置直播文案,构图参考HAY与3CE的品牌封面风格,整体要有时尚氛围感但不过度复杂。”
其实只需把脑子里的场景、受众、氛围、用法写清楚就可以了。
以下是一些真实的组合搭配案例,重点在于“真实好落地”,每一个prompt都写成完整的一段,方便直接参考或修改:
情绪图 + 独白文字 + 配音:
适用于短视频片头或vlog开场,做一句话情绪共鸣内容。图像提示词:“请生成一张黄昏时分的城市街道图,光线从建筑缝隙间穿过,地面有反光但没有行人,整体氛围宁静略带孤独,画面需要构图干净,具有留白感。”音频提示词:“请用温柔低沉的女性声音,朗读这段话:‘很多时候你以为你没被看见,其实只是你还没到发光的那一刻。’节奏稍慢,停顿自然,带一点晚风的氛围。”最终产出是一张氛围图加AI读白,轻轻地说出那句话,像朋友在深夜和你说话。
产品视频 + 背景音乐 + 钩子文案:
视频提示词:“请生成一段10秒的视频,展示一款护肤品在清晨光线下的镜头语言,瓶身需有水珠,背景为白色极简场景,镜头由近到远,过渡柔和,整体调性像SK-II广告风格。”音频提示词:“请生成一段舒缓电子风的背景音乐,节奏平稳,音色干净,适合作为护肤品广告背景使用。”文案提示词:“请写一句主打‘真实肤感’的产品钩子文案,要求不浮夸,具有自然感,例如‘养出素颜自带滤镜的光’。”最终视频有了真实的品牌感:镜头、音乐、文案稳稳落地,甚至可以直接投放。
电商视频设计:
“请生成一段8-10秒的视频,展示一款面向18-30岁女性消费者的护肤产品,整体风格参考OLAY或SK-II的广告,镜头需要突出瓶身细节、光泽质感和清晨自然光的氛围,场景为白色极简梳妆台或浴室台面,画面风格干净克制,节奏温柔舒缓,镜头从侧面扫过瓶身并慢慢上摇,最后定格在品牌LOGO处,背景音乐为轻柔电子氛围音,整个视频传递自然、纯净、高级感的产品印象。”
这个prompt融合了产品展示节奏、画面氛围、光线构图、镜头语言、受众感知等要素,能生成较为完整的电商视频场景。
这几个组合还在持续使用,计划做成一个“生活影像系列”。不是为了出圈,而是为了记得:有在认真感受、记录、表达。
Lovart是工具,但不是流水线。它是与世界对话的一种方式。现在不再焦虑“怎么写prompt更精准”,更在意的是:还有没有什么想说的?有没有在好好感受?那些图、那些声音、那些画面,不就是心里那些没说出来的话吗。
如果AI能帮我们把它们说出来,那不是很浪漫吗?
以上就是用Lovart做内容的一些真实记录和心得。Lovart提供了一个很低门槛的创作环境,但真正有分量的内容,永远来自每个人对世界的那点“看见”。
文章里提到的每个案例、每段prompt,都可以直接拿去试。关键是找到自己想说的那句话,然后让AI帮你把它变成可以看见、听见的内容。
