想象一下,只需对AI说一句“让柏树在量子漩涡中燃烧”,它就能立刻生成你想要的图像——这不再是科幻电影中的场景,而是谷歌Gemini 2.0正在实现的现实。谷歌研究院最新推出的多模态模型Gemini 2.0,正彻底变革图像编辑的工作流程:仅需一句话,就能完成一键P图。
不得不说,当年熬夜自学Photoshop时幻想的“超能力”,如今已经真正走进现实。
一、先来看一下实际效果
案例1: 人像编辑
比如,想让闭着眼的模特睁开眼睛?一句话即可完成:

想让模特更精致一些,戴上贝雷帽?同样只需一句话:
案例2: 风景图编辑
想把图片中的汽车去除?没问题:
再画一辆特斯拉?也可以:
当然,目前出图效果与Midjourney等专业工具相比还有一定差距,但随着模型持续迭代,这一点无需担心。
二、使用教程
访问网址:https://aistudio.google.com/,将右侧模型选择为“Gemini 2.0 Flash Experimental”。目前完全免费(每分钟10次请求,每天1500次请求),谷歌在这方面相当慷慨。
注意输出格式要选择“图片和文本均支持”的版本。
然后就可以开始愉快地体验了。更多有趣的案例,等待你自己去探索。
最后的话
Gemini 2.0揭示的不仅是图像编辑的演进路径,更是人类认知范式的变革——那些曾被工具栏束缚的想象力,正在语言与算法的共振中重构为全新的巴别塔。
在这个重新校准的创作坐标系里,我们每个人都是德拉克洛瓦与图灵的后裔——我们的句子开始具备重量,形容词获得色彩温度,而每个未被言说的念头,都正在等待属于它的像素涅槃。
未来已来,期待每一天。
