首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
“小香蕉”生图模型实测:性能全面超越主流竞品

“小香蕉”生图模型实测:性能全面超越主流竞品

热心网友
72
转载
2025-08-30

前一阵子,大模型竞技场 LMArena 里面悄咪咪地出现了一个神秘的图片模型 —— nano-banana,在一众生图模型里面乱杀。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这个小香蕉无名无姓,可一旦在 LMArena 抽到它,对手必被吊打。

这个神秘的模型在生图一致性上强得惊人,对提示词的理解和完成度也好得可怕。大伙儿你一票我一票,迅速把它送上了榜单第一位。

就在众人纷纷猜测新模型到底出身哪个高门大户的时候,谷歌 AI Studio 的产品 Leader 跳出来发了一个香蕉,暗戳戳地认领了 nano-banana。

而就在昨天,nano-banana 终于正式上线谷歌 AI Studio,直接去 Gemini 那里就能玩,不用竞技场费事抽卡了。

谷歌在官方博客里是这么秀肌肉的:开局一张脸,以后不管是啥场景,啥服装,啥表情,都能让人一眼看出来你还是你。

把几张照片搓在一起,生成的结果既能保证原来的形象不崩,又能保证新图片看起来不违和。

还能多轮对话改同一张图,每次只改一点点,其它部分就像是妈生原图一样,丝毫不变。

官方的案例看起来是挺吊的,还没玩上的差友也别急,咱这就带大伙儿一起体验一下。

为了感受一下其它模型和 nano-banana 的差距,我们先上 LMArena 去抽了几波卡。

结果是,一共抽了十几轮,只要谜底里有 banana,你一定会盲选 banana。。。有些对比还是非常惨烈的。

像是让人物手里加一根香蕉,右边 seededit 的手崩了,香蕉的颜色也过于鲜艳,和整体画风不搭,但左边基本挑不出啥毛病。

再比如让鲁迅不要抽烟改拿笔,右边这个细节变了一堆不说,笔头还冒着烟呢。

这么看来,nano-banana 比现在的生图模型都强是没啥疑问的。但它具体强在哪些方面呢?我们又去谷歌 Studio 有针对性地测了测。

先说结论,我们觉得 nano-banana 最强的点,是它对图片有了更深入的理解,保证了一致性。而在强一致性的基础上,修图、换风格、做 3D 手办。。。它非常全面,啥都干得挺好。

比如这种一键试穿,需要把平铺的各种服饰 P 到人的身上,而 nano-banana 对细节的把控非常到位。

鞋本来提供的是侧面图,但它画出了正面的样子。服饰上各种 logo 拼的都是对的,甚至 T 恤上原本镜像的 ‘SAINT LAURENT’,在生图的过程中也变回来了。

我们还试了试人脸的不同角度生成,这个效果是真的很厉害。

下面这三张图,只有第一张是真实照片,后面两张都是生成的。

这种面部方向的调整在老模型里是很难实现的,因为要通过一张平面图理解一张立体的脸各个角度长啥样很难,但 nano-banana 的完成度也非常高。

另外,我们还测了一些合照拉郎配。

可以看得出,在这种合照里,它做的不只是把两个人物拼在一起,而是学习到了面部特征。这样生成的新图片即使表情不太样,还是能让人一眼看出这是小马小札。

还有大伙儿最爱的 3D 手办系列,分分钟把 100 多斤的火锅压缩成茶杯犬,化身桌面可爱小摆件,火锅群里的同事们纷纷求出货。

最牛的还属这一张 —— 火锅前阵子右后腿皮肤病剃秃了一块,而生成的图片居然注意到了这一点,一致性真拉满了。

不过有一说一,nano-banana 的图像风格变换比较中规中矩,倒是没啥特别的。

但在这个过程中,我们发现它不光在处理图片,还在偷偷 “ 认人 ”。

像是下面这张图,在我们没有告诉谁是谁的情况下,它还是认出来左边是搞火箭的马斯克,右边是 META 的扎克伯格。

我们又试了几个地标开盒,看看它有没有 GPT 那样的推理能力。

但实际上它只在地标建筑物上比较好使,更像是图像识别 + 记忆检索,只能说有一点推理能力,但不多。


左 nano-banana 答错,右 GPT 5 Thinking 答对

除了上述的优点,它的缺点其实也不少。。。最大的问题就是,谷歌好像给它做了不少安全性调教,经常这也不行,那也不行,有时候真摸不清哪个关键词又触犯天条了。

其次是对提示词要求比较高,往好了说,是 nano-banana 对提示词的遵循能力强,但实际上对用户来讲,得多花不少时间打磨提示词,有点折磨。

谷歌自己也表示,别让 Gemini 猜你的心思,有啥想要的尽管说出来。

所以要是出来的效果不好,写提示词的时候就得尽量详细一些,什么要动,什么不要动通通列明白,才能保证强一致性。

最后,比起咱心目中的 P 图白月光 FLUX,它在局部小范围修图上效果还是差了一点,所以还是建议大伙儿精修找 FLUX,上面各种整大活儿再用 nano-banana。


左原图,中 nano-banana,右 FLUX

总的来说,nano-banana 强就强在它对图片的理解能力是目前最好的,而且各种任务上的一致性都不错,没有大短板。

更大的好消息是,小香蕉已经被整合进了 2.5 Flash 版本,即使没有 pro 会员,免费的账户也可以使用。

只要左上角选择 2.5 Flash,对话框 tools 选择 Image 即可。

LMAreana 上也依然可用,只要 prompt 开头输入 “ 使用 nano-banana 模型生成 ” ,有极高概率可以抽到。

或者有些整合网站像是 LibLib,Fal-ai 等等也有第三方提供的 nano-banana。

感兴趣的差友赶紧去试试吧,欢迎回来评论区返图哦。

来源:https://news.mydrivers.com/1/1071/1071121.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

香港科技大学AI动画上色技术:一张设计稿自动完成整部动画
AI
香港科技大学AI动画上色技术:一张设计稿自动完成整部动画

制作一部动画片,其繁复程度不亚于建造一座精美的城堡。每一帧画面都需要画师们先勾勒线稿,再一笔一笔填充颜色,确保角色在整部作品中始终保持一致。这个过程如同手工为成千上万张画片逐一上色,不仅耗时耗力,还极易出现色彩偏差。 如今,一项来自香港科技大学与蚂蚁集团的合作研究,带来了一个颇具革命性的解决方案——

热心网友
05.13
卡内基梅隆大学测试AI数字员工TheAgentCompany办公室工作能力
AI
卡内基梅隆大学测试AI数字员工TheAgentCompany办公室工作能力

清晨步入办公室,开启电脑准备投入工作时,你是否曾想象过,未来与你并肩协作的,可能并非人类同事,而是一位AI数字员工?这一仿佛科幻作品的场景,正由卡内基梅隆大学的研究团队逐步变为现实。 这项由卡内基梅隆大学主导,联合杜克大学等多家机构完成的研究成果,已于2024年12月发布于arXiv预印本平台(论文

热心网友
05.13
西安电子科大突破AI知识蒸馏技术缩小模型差距
AI
西安电子科大突破AI知识蒸馏技术缩小模型差距

一项由西安电子科技大学人工智能学院联合意大利特伦托大学、清华大学自动化系以及合肥工业大学计算机科学与信息工程学院共同完成的研究,为人工智能领域带来了一个值得关注的技术突破。该研究发表于2026年3月的arXiv预印本平台(论文编号:arXiv:2603 02554v1)。 在AI模型的世界里,一直存

热心网友
05.13
香港中文大学Lyra框架:AI多模态交互实现视听说一体化智能对话
AI
香港中文大学Lyra框架:AI多模态交互实现视听说一体化智能对话

这项由香港中文大学、智谱科技与香港科技大学联合研发的创新成果,已于2024年12月在arXiv预印本平台正式发布,论文编号为arXiv:2412 09501v1。 想象一下我们日常交流的场景:我们一边倾听对方的话语,一边观察其表情与手势,然后综合所有信息给出回应。这种多感官协同工作对人类而言轻而易举

热心网友
05.13
卡耐基梅隆大学研究揭示:最强AI并非最佳数据教师,合成数据生成能力深度解析
AI
卡耐基梅隆大学研究揭示:最强AI并非最佳数据教师,合成数据生成能力深度解析

这项由卡耐基梅隆大学联合KAIST AI、华盛顿大学、NEC欧洲实验室和斯科普里大学圣西里尔和美多迪乌斯大学共同完成的重要研究,发表于2025年的arXiv预印本(编号:2412 03679v2),揭示了一个反直觉的发现:在AI的世界里,解题能力最强的模型,未必是生成训练数据最好的“老师”。 当下,

热心网友
05.13

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

RPA机器人如何应对复杂决策场景
业界动态
RPA机器人如何应对复杂决策场景

当RPA机器人面临复杂决策场景时,企业通常可以采取以下几种经过验证的有效策略来应对,确保自动化流程的顺畅与准确。 借助人工智能技术 一种广泛应用的解决方案是将RPA与人工智能技术深度融合,特别是机器学习与自然语言处理。通过集成AI的预测分析与模式识别能力,RPA能够处理非结构化数据并应对模糊的业务情

热心网友
05.13
智能制造与人工智能融合应用策略指南
业界动态
智能制造与人工智能融合应用策略指南

当智能制造与人工智能技术深度融合,这不仅是两种前沿科技的简单叠加,更是一场旨在重塑全球制造业竞争格局的系统性变革。其核心目标在于,通过深度嵌入人工智能等前沿技术,全面提升制造业的智能化水平、生产效率与国际竞争力。那么,如何有效推进这场深度融合?以下六大关键策略构成了清晰的行动路线图。 1 加强关键

热心网友
05.13
RPA机器人上线后如何持续优化提升性能
业界动态
RPA机器人上线后如何持续优化提升性能

对于已经部署了RPA的企业而言,项目上线远不是终点。要让自动化投资持续产生价值,对机器人性能进行持续优化是关键。这就像保养一台精密的机器,定期维护和调校,才能确保其长期高效、稳定地运行。 那么,具体可以从哪些方面着手呢?以下是一些经过验证的优化方向。 一、并行处理与任务分解 首先,看看任务执行本身。

热心网友
05.13
分布式数据采集系统架构设计与实现方案
业界动态
分布式数据采集系统架构设计与实现方案

面对海量数据源的高效抓取需求,分布式数据采集架构已成为业界公认的核心解决方案。该架构通过精巧的设计,协调多个采集节点并行工作,并将数据汇聚至中央处理单元,最终实现数据的集中分析与深度洞察。这套系统看似复杂,但其核心原理可拆解为几个关键组件的协同运作。 一、系统核心组成 一套典型的分布式数据采集系统,

热心网友
05.13
Gate.io注册奖励与邀请页开户页区别详解 新手必看指南
web3.0
Gate.io注册奖励与邀请页开户页区别详解 新手必看指南

Gate io平台活动页面多样,新手易混淆注册奖励、邀请与正常开户页。本文梳理三者核心区别:注册奖励页通常含专属链接与限时福利;邀请页强调社交分享与返利机制;正常开户页则提供基础功能与安全验证。清晰辨识有助于用户高效参与活动,避免错过权益或操作失误,提升在Web3领域的入门体验。

热心网友
05.13