谷歌又亮出了一张重量级底牌。
在Gemini 3 Pro横扫各大评测榜单之后不久,谷歌最新的图像生成模型Nano Banana Pro(官方名称为Gemini 3 Pro Image)正式登场。
此次升级的核心是将内核从Gemini 2.5 Flash替换为能力更强的Gemini 3 Pro,多模态推理性能实现大幅跃升。再加上接入了谷歌搜索的知识库,新模型对画面元素、文字内容乃至整体构图的理解能力都迈上了新台阶。
上线后不久,Nano Banana Pro便在LMarena的文生图和图生图排行榜上双双夺冠,取得了SOTA(当前最优)成绩。更有趣的是,紧随其后的第二名,依然是自家的上一代产品Nano Banana。这种“断层式领先”,足以证明其强大实力。
不过,想要直接体验官方版本,存在一定门槛。Gemini官网对网络环境要求较高,不少用户反馈访问困难,而且还有使用次数限制。若通过AI Studio调用API,生成一张图片的成本大约为一元钱,对于日常试用来说,成本确实偏高。
那么,有没有更便捷、更经济的体验方式呢?当然有。下面为大家盘点十个可以免费或低成本体验Nano Banana Pro的实用渠道。
01. 如何免费使用Nano Banana Pro
工具1:Flowith
Flowith是一款画布式AI智能体工具,集成了国内外超过40种顶尖AI模型,其中就包含最新的Nano Banana 2(即Nano Banana Pro)。它的最大优势在于国内网络可直接访问,无需借助特殊工具,并且目前处于限时免费阶段。
在对话框下方选择图片生成模式,将生图模型切换为Nano Banana 2。你可以自由调整图片比例,清晰度最高可选4K。单张图片的生成时间大约在一分钟左右。
提示词示例:用手帐风格,生成“东坡肉”菜谱的制作过程。
文字渲染能力一直是图像模型的难点。过去Nano Banana生成的中文文本常常不够理想,但Nano Banana Pro在这方面做了重点优化。从实际效果来看,文字的准确率大幅提升,排版也更具设计感。
根据官方模型卡的多语言基准测试数据,Nano Banana Pro在中文文本渲染上的错误率仅为13%,甚至比一向以中文见长的Seedream v4 4k表现更稳定。其整体错误率更是低至8%,远优于上一代Gemini 2.5 Flash Image的56%。
工具2:Lovart
Lovart是由LiblibAI推出的专业设计Agent,也在第一时间接入了Nano Banana Pro模型。在特定活动期间(例如11月21日至23日),该平台曾向所有用户开放免费使用。
使用时,在输入框右下角选择Nano Banana Pro模型即可。
提示词示例:给图中的文言文生成彩色的注解,帮助初中生理解。
模型准确识别并理解了图中的文言文《卫风•氓》。整段重绘下来,仅有一个错字——“垝”。对于多音字“氓”的读音判断(应为méng,模型写成了máng)虽不够完美,但整体表现已远超以往。
更重要的是,Nano Banana Pro不仅基本准确地重绘了全文,保留了原文的排版和重点字标红的样式,还对内容进行了理解。它提取的关键词准确,释义恰当,甚至能正确解析出故事从“爱情萌芽”到“婚姻悲剧”的结构脉络。
这显示出,Nano Banana Pro并非简单的“看图说话”,而是通过多模态推理真正理解了图片内容,再借助强大的文字渲染能力,将这些信息重新组织和表达出来。
提示词示例:图中是傅里叶变换公式,请生成一个清晰、彩色注释的版本,用通俗易懂的方式解释每个部分的含义,并说明这个公式的作用,帮助读者建立直观理解。
模型对公式结构的识别非常准确,信息解读也基本到位(尽管彩色箭头的指向存在少许偏差)。这标志着Nano Banana Pro已经具备了“结构化生成+知识输出”的复合能力,成为一个真正能将知识可视化的图像模型。
工具3:海螺视频
海螺视频是MiniMax推出的AI多模态创作工具,支持生成图像、视频、声音、音乐以及提升视频画质。它对国内用户友好,无需特殊网络环境。
非会员用户每天可免费生成50张图片。会员用户在特定活动期间(如截至12月3日)可享受无限次生成。
提示词示例:制作一张解释Embedding在大型语言模型(LLM)中作用的信息图。
得益于接入Google Search知识库,Nano Banana Pro在制作信息图方面表现尤为突出。除了专业知识,查询实时信息如天气、赛事结果也同样准确。它还支持一比一的跨语言翻译。
提示词示例:保留原图的排版和结构,将中文文字内容翻译成英文。
工具4:Hailuo AI
这是海螺视频的海外版本,功能与权益与国内版基本一致。
提示词示例:把这篇文章内容转换成一张白板板书的实拍图片:用可视化方式解释核心概念,包含示意图、箭头、框选和中文文字说明,使用不同颜色。【此处可粘贴长文、论文或技术文档】
输入Nano Banana Pro的官方介绍后,生成的板书逻辑清晰,重点突出,颜色区分合理。这意味着,那些冗长的文章、艰深的论文或复杂的技术文档,未来都可以交给它来快速提炼和可视化。
工具5:TapNow
TapNow是一个专业的AI视觉内容创作平台,通过灵活的画布和前沿AI模型,支持从脚本撰写、分镜设计到成片的全流程创作。
新用户注册赠送200积分。使用Nano Banana Pro生成图片,单张消耗20积分。
网站支持中文界面,操作直观。点击添加节点,选择图片节点,然后在新建的节点中选择Banana Pro模型,并可自由调整图片比例。
提示词示例:将参考图变成超清晰、逼真的生活照,且不改变构图、人物和场景。
提示词示例:不改变场景和布局,让镜头聚焦到前景中的郁金香上,前景中的花变清晰,人物和背景保持不变。
提示词示例:不改变场景和布局,让镜头聚焦到女孩,让人物变清晰,前景和背景中的花保持不变。
Nano Banana Pro支持生成1K、2K或4K分辨率的高清图片,具备将模糊图片变清晰的能力。更突出的是,它支持通过自然语言指令精准调节画面焦点,轻松控制画面中哪些部分清晰、哪些部分虚化。
工具6:Banana Lab
Banana Lab平台每日赠送20积分。使用Nano Banana Pro生成图片会消耗积分,1K、2K、4K清晰度分别对应消耗1、2、4积分。需要注意的是,生成的图片需在24小时内下载,否则可能被系统清理。
提示词示例:等距视角的3D插画,呈现一个微型的水下珊瑚礁世界,里面有梦幻的贝壳、会发光的水母、带有水蓝与珊瑚粉色光效以及风格化的海底场景。
模型展现了强大的空间构图能力,能够稳定驾驭复杂场景的比例、层次和视角。同时,其风格化表现力也有显著提升,无论是光效、材质还是整体调性,都能做到和谐统一。
提示词示例:不改变画面内容,增强光影层次,增加暗部细节,对高光进行柔化,整体色调调整为电影质感的青橙色。
提示词示例:在不改变场景和构图的前提下,把整体光影调整为阴暗系,降低亮度,提高对比度,让阴影更深、更厚重,画面呈现冷色调的暗黑氛围。
从示例可以看出,模型对光影和色调的控制非常细腻,能够准确响应专业的后期调整指令。
工具7:ZenMux
ZenMux定位为企业级AI模型聚合平台,提供统一的API接口,支持访问全球领先的大型语言模型。
在首页顶部菜单栏点击“Models”,选择“Google:Gemini 3 Pro Image”(注意选择带有“Free”标识的选项)。
在输入框底部的“Skills”中选择图像生成或图像编辑能力。
提示词示例:设计一套类似即刻App的UI界面图片。
生成的界面图片已经非常接近真实的应用设计稿,排版、结构、风格都清晰明确,几乎可以直接用作产品原型。
工具8:YouMind
YouMind是一款专注于提升创作效率和信息整合深度的AI工具。每月可免费获取2000积分,使用Nano Banana Pro生成图片每张大约消耗15积分。
该平台收录了大量优秀的案例提示词,方便用户参考和使用。
新建一个项目后,在输入框下方选择生成图片,并选用Nano Banana Pro模型。
提示词示例:以咖啡色卡通熊作为主角,制作漫画。每张图片包含2个4格漫画,每个4格漫画加上笑点,总共8个4格漫画串联成故事。
生成的漫画风格统一,角色一致性也保持得不错,展现了模型在连续性创作上的潜力。
工具9:LMArena
LMArena是由加州大学伯克利分校推出的创新AI模型评估平台。用户可以在这里测试和体验国内外各种AI模型,甚至包括一些预发布版本,且完全免费。
在首页切换到“Direct Chat”模式,选择Gemini 3 Pro模型。
点击输入框中的生成图片按钮,模型便会自动切换到Nano Banana Pro。
提示词示例:生成一张超逼真的黄鹤楼图像,日落时分。图像中包含全面且清晰易读的中文注释,显示建筑特征、历史元素和文化细节等,所有注释要简短、准确,并提供有用的信息。
工具10:Gemini 官网
最后,当然也可以直接在Gemini官网体验。在对话框中选择图片生成工具,并同时选择思考模型(即Gemini 3 Pro)。
提示词示例:用连环画的风格,生成一个黛玉力战三英夺宝刀的故事。
02. 一些分享
经过一番实测,Nano Banana Pro的表现确实令人印象深刻。以往使用AI图像模型,多少会抱着“差不多就行”的心态,对一些小失误也能容忍。
但Nano Banana Pro这次的升级,带来了质的改变。信息准确率大幅提升,排版和风格也更加稳定可靠,即使是密集的中文排版也很少出错。
这种进步,根源在于底层能力的跃升。Gemini 3 Pro带来的多模态推理能力,加上Google Search知识库的支撑,让模型不再是简单的“画图工具”。具体来看,其能力边界得到了显著拓展:
- 支持多图混合与一致性保持:可一次性输入最多14张图片进行混合生成,并保持人物与风格的高度一致。
- 强大的多语言文本渲染:能直接渲染多语言文本,并保持原有的设计风格。
- 复杂内容生成:可生成信息图、食谱图解、故事板等具有逻辑结构的内容。
- 专业级编辑控制:支持2K/4K分辨率、多种比例,并能通过指令调节光线、镜头、色彩、景深等专业参数。
过去,业界讨论图像模型,焦点往往还停留在“图像是否好看”、“风格是否统一”上。而Nano Banana Pro将这条边界向前推进了一大步。它整合了视觉生成、知识理解和结构化表达,更像是一个视觉智能体的雏形。
可以预见,未来的图像模型绝不会仅仅定位于创作工具。它将成为高效的内容工具、直观的教学工具,是真正能够融入工作流、提升生产力的智能伙伴。



