首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
最强AI图像生成工具对比实测:比PS更强大的新选择

最强AI图像生成工具对比实测:比PS更强大的新选择

热心网友
50
转载
2025-12-17

最近两周,“手办化”突然就火了。

事情是这样的,大约在两周之前,大模型竞技场LMArena上架了一个只闻其名,不见其身的神秘模型——“nano banana”,按照官方说法,这是一个顶尖的图像生成与编辑模型,能实现前所未有的创作控制力。

结果呢?整个互联网的AIGC玩家,都在用它变身“手办大师”。

不开玩笑,小雷是真被这玩意给刷屏了,这两天一打开群聊,就能看到无法无天的群友们在拿这玩意疯狂整活,有把自己头像做成限量版GK模型的,有把自家猫狗“手办化”的,甚至还有给刚发布的《黑神话:钟馗》弄雕像和游戏盒的,推特上的国外网友玩得更是乐此不疲,看得我都有点心痒痒的。

幸好,这次我们不用眼巴巴地羡慕了。

640.webp

(图源:LMArena)

随着Google的正式发布,如今Gemini 2.5 Flash Image已经通过Gemini API和Google AI Studio向公众开放预览,用户只需访问官网,就能直接体验到下一代图像模型的威力。

最重要的是,这玩意在AI Studio里进行测试是完全免费的,对于我们这种热爱尝鲜的玩家来说,简直是把探索未来的门槛给直接铲平了。

话不说多,我们这边直接开整!

Gemini 2.5 Flash Image让人人成手办大师

想体验这个功能的话,其实还蛮简单的就是了。

打开Google AI Studio网页版,在Generate media选项卡下就能找到Gemini 2.5 Flash Image。界面非常直观,一个提示词输入框,一个上传图片的区域,这就是通往新世界的大门。

要做的事情很简单,上传一张图片,然后用自然语言告诉它我们想要生成的内容就像。

image.webp

(图源:Gemini)

话不多说,先来看图。

首先,我们准备一张自己想要进行“手办化”的图片,可以是动漫,也可以是真人,甚至不必是全身照,比如这张来自漫画《捉摸不透的刑警织子桑》里的有阿谷織子的单人图就很不错。

接下来,输入提示词:

Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.

最终成品如下:

新建项目 (6).webp

(图源:雷科技自制)

不得不说,Gemini对“手办质感”的理解已经超出了我的预期。

这张图的生成效果达到了以假乱真的水准,无论是手办本身的材质(蕾丝、皮革、肌肤)、包装盒上的文字和品牌Logo,还是背景电脑屏幕上复杂的建模界面都很不错,只有高度模糊的背景能看出些端倪。

再来些热门的,比如说《黑神话:钟馗》:

1756369336163-ae472dc8-3eeb-4c04-8644-7c4b35276574.webp

(图源:雷科技自制)

接着试一下大家都关心的名人,比如说马斯克:

新建项目 (7).webp

(图源:雷科技自制)

从结果来看,转换效果可以说是几无失手,非常成熟。

如果你想玩点更高级的,我们把这张生成的图片,扔进同样是豆包视频生成中,用提示词“画面外的人从两边伸出亚洲人的双手,拿起手办把玩并展示桌上手办的视频”,生成一段把玩手办的视频。

IMG_zmujsv.webp

(图源:雷科技自制)

如果用提示词“360度缓慢旋转这个手办,转台拍摄”,就能生成一段平滑的环绕展示视频。

IMG_veoqzt.webp

(图源:雷科技自制)

最后还可以用Meshy或者腾讯混元3D,将手办3D建模化,我们就能得到一个可以自由旋转、缩放的3D模型。

屏幕截图 2025-08-28 171431.webp

(图源:雷科技自制)

虽说后两步借助了其他工具,但由Gemini 2.5 Flash Image产出的高质量初始素材,是整个工作流成功的基石。这种打破次元壁的做法,让每个人都能低成本地实现从一个想法到3D产品的完整流程,在过去是很难想象的。

修图能力更强了,其实是终极版PS?

不过,人人都在玩手办化,是不是有点大材小用了?

我们不妨转换一下思路,把它当成终极版的PS来用?

举个例子吧,比如说那些珍贵的、但因年代久远而模糊破损的老照片,它能不能修复呢?

我上传了一张黑白老照片,照片上有划痕和噪点,清晰度也很低。

AI-repair-before.webp

(图源:X)

接下来,输入提示词:

Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.

Generated Image August 28, 2025 - 5_22PM.webp

(图源:Gemini)

答案是,“完全可以,而且效果惊人”。

可以看到,Gemini 2.5 Flash Image不仅清除了物理损伤,还通过算法补全了缺失的细节,面部的纹理和眼神光都得到了合乎逻辑的重现。上色的效果也偏近自然,没有出现早期AI上色那种“塑料感”,充满了温暖的时代气息。

再试试设计行业里源远流长的梗,“把白天改成黑夜”这种要求,它能不能实现呢?

e82a6e8607be43ca83c84683930f78b4.webp

(图源:雷科技)

提示词:

Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.

Generated Image August 28, 2025 - 5_29PM.webp

(图源:Gemini)

只能说,Gemini 2.5 Flash Image在语义理解和光影重构这块,已经达到了很出彩的水平。它不仅仅是简单地调暗画面,而是真正理解了“夜晚”、“灯光”、“下雨”这些概念,并合乎物理逻辑地对整个画面进行了重新渲染。

最后,我也试了一下它的风格切换能力。这次就拿《Panty&Stocking》里的画面做例子:

ps.webp(图源:X)

提示词:

Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.

download.webp(图源:Gemini)

很有意思,它不仅做到了“三次元化”,还微妙地捕捉到了王家卫电影那种独特的色彩、光影和氛围感。

这种跨越媒介和导演风格的无缝切换,为艺术创作提供了更多可能。

不算完美,却堪称图片AIGC新标杆

不可否认,Gemini 2.5 Flash Image的发布,标志着AI在图像生成领域实现了重大突破。

就像我展示的那样,曾经需要专业人士花费数小时在PS里用蒙版、图层、笔刷精雕细琢的工作,如今只需一句自然语言就能瞬间完成,甚至修图效果比我这种半吊子还要好上不少,属实有点惭愧。

目前该模型在预览阶段,并非完美无瑕。

在处理极其复杂的、包含大量人物的场景时,Gemini偶尔还是会出现轻微的逻辑错误或细节失真。对于一些过于抽象或违反物理常识的指令,它的理解能力也还有提升空间。

不管怎么说,Gemini 2.5 Flash Image算是为AI图片生成应用树立了一个新的标杆。

可以预见的是,随着技术的不断成熟和成本的降低,未来手机、电脑的相册和编辑器都可能会原生集成这项功能,就像AI消除、AI扩图那样走进寻常百姓家。无论是专业设计师还是普通用户,每个人都有机会轻松上手,将自己脑海中的创意和对美的理解,更直观、更高效地展现出来。

修图有手就行?或许真的不是梦。

来源:https://www.leikeji.com/article/71375
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

人力资源经理岗位说明书撰写指南 AI工具高效生成技巧
AI教程
人力资源经理岗位说明书撰写指南 AI工具高效生成技巧

人力资源经理统筹公司人力资源事务,涵盖招聘、培训等多方面职责,其岗位说明书既是企业选人的标准,也是员工履职的指南。借助AI写作工具,可提升说明书撰写效率。

热心网友
05.26
WPS智能PPT制作指南:高效完成年终总结与项目汇报
AI教程
WPS智能PPT制作指南:高效完成年终总结与项目汇报

WPS智能PPT能一键生成美观模板并快速整理内容,帮助用户高效制作高质量PPT。无论是年终总结、项目汇报还是学习成果展示,其AI功能可将繁杂文字转化为生动图表与清晰讲解脉络,使汇报从沉重负担变为轻松分享。

热心网友
05.26
餐饮业年终总结:AI技术如何优化管理与营销策略
AI教程
餐饮业年终总结:AI技术如何优化管理与营销策略

餐饮行业面临同质化竞争与成本攀升挑战。通过系统性收集反馈优化服务流程,策划线上促销并调整菜单结构,同时加强团队建设。年度顾客满意度提升20%,线上销售额增长30%,人均消费额提高15%。未来将探索AI技术在经营决策、精准营销等领域的应用,以数据驱动业务持续增长。

热心网友
05.26
WPS一键生成PPT技巧演示制作更轻松高效
AI教程
WPS一键生成PPT技巧演示制作更轻松高效

WPS提供了多种高效生成PPT的方法。使用模板可直接套用预设风格;导入文档能智能识别结构并转换为幻灯片;快速创建功能则可根据主题和要点自动生成草案。这些方法旨在简化基础操作,让用户更专注于内容打磨与演示构思。

热心网友
05.26
年度工作总结怎么写附详细范文与实用撰写技巧
AI教程
年度工作总结怎么写附详细范文与实用撰写技巧

年度工作总结通过关键项目复盘与个人反思,系统回顾项目从规划到落地的全过程,梳理经验与不足,旨在为未来工作提供参考与规划依据。

热心网友
05.26

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

资金费率详解:合约交易中为何持续支付费用及其计算规则
web3.0
资金费率详解:合约交易中为何持续支付费用及其计算规则

资金费率是永续合约锚定现货价格的关键机制。当合约价高于现货价时,多头需向空头支付费用;反之则由空头付费。费率每8小时结算,通过经济激励促使价格回归。持续付费通常表明持有多单且市场处于正费率状态。交易者可结合现货持仓与空头合约进行套利,赚取费率收益。

热心网友
05.26
人力资源经理岗位说明书撰写指南 AI工具高效生成技巧
AI教程
人力资源经理岗位说明书撰写指南 AI工具高效生成技巧

人力资源经理统筹公司人力资源事务,涵盖招聘、培训等多方面职责,其岗位说明书既是企业选人的标准,也是员工履职的指南。借助AI写作工具,可提升说明书撰写效率。

热心网友
05.26
九号鼹鼠自平衡20与同频双闪技术首发引领两轮智能出行新阶段
科技数码
九号鼹鼠自平衡20与同频双闪技术首发引领两轮智能出行新阶段

九号公司发布鼹鼠自平衡2 0与同频双闪两项核心技术。前者通过算法与系统协同实现车辆自主平衡,提升低速与驻停时的操控便利与安全;后者基于统一授时与软总线架构,实现多车灯光精准同步,增强车队辨识与协同体验。两项技术体现了九号在底层智能架构上的系统突破,推动两轮出

热心网友
05.26
毒液突击队难以捉摸成就解锁方法详解
游戏资讯
毒液突击队难以捉摸成就解锁方法详解

想要在《毒液突击队》中解锁“难以捉摸”成就?这项挑战对玩家的潜行技巧要求极高,但只要掌握正确方法,成功触发的难度将大大降低。其核心秘诀在于:保持全程隐匿状态,确保没有任何敌人察觉到你的存在。 成就目标解析 “难以捉摸”成就的达成条件非常严格:在指定的任务关卡中,你必须完全避免进入敌人的“警觉”或“发

热心网友
05.26
千问模型如何优化智能推荐系统的内容理解模块
AI资讯
千问模型如何优化智能推荐系统的内容理解模块

推荐系统常因语义、多模态和意图理解不足产生偏差。通义千问系列模型可针对性补强:通过轻量模型重排序提升相关性,多模态模型确保图文匹配,指令模型解析用户行为提炼兴趣标签,OCR提取图像文字,并结合PID控制算法动态融合多源信息,依据实时反馈自动优化权重。

热心网友
05.26