科技界迎来重要更新,谷歌宣布将在Gemini平台上推出一项名为Nano Banana Pro的创意功能升级,主要面向设计师、营销人员以及教育工作者群体。用户可通过Gemini应用中的“Thinking”模型直接使用该功能,其最突出的优势在于拥有强大的版式控制能力。
在图像生成方面,这项功能能够输出最高达4K分辨率的图片,并支持自由设定多种宽高比。从适合演示和印刷品的16:9比例,到适配社交媒体帖子的9:16规格,多样化的比例设置确保输出内容可以直接满足不同发布渠道的格式要求,无需创作者进行额外的后期调整。
本次升级的一大技术亮点是引入了“高级文本渲染”技术。该技术显著提升了图像中文字和拼写的精准度,可以清晰地生成包含复杂文本元素的海报、菜单、邀请函,甚至是数据密集型的信息图表。对于需要大量文字展示的创意设计场景,这项技术无疑提供了有力支撑。
Nano Banana Pro还对概念设计流程进行了优化。用户只需上传一张二维草图,再配合提示词,就能让Gemini将其渲染成具有照片级真实感的三维产品图像。这项功能方便创作者探索不同材质和光影效果,为产品设计的初期阶段提供了更直观、高效的呈现方式,有助于快速迭代设计方案。
在图像编辑与合成领域,这项功能同样表现卓越。它支持用户同时上传多达六张图片,进行场景融合或元素提取。例如,创作者可以将不同场景中的元素组合在一起,创造出全新的视觉效果;或者从多张图片中提取特定元素,用于新的创作中,极大地丰富了设计的可能性。
其中,“风格迁移”功能可以将参考图像的整体色调或视觉风格应用到另一张照片上,让创作者能够快速实现风格的统一或转换。而更具创新性的“画布引导”功能,允许用户直接在上传的图片上通过涂鸦、画圈或添加注释等方式下达视觉指令。这种直观的交互方式,让AI能够更准确地理解创作者的修改意图,并快速执行相应操作。
与先前发布的版本相比,Nano Banana Pro的核心价值在于将多图像合成、高可靠性排版以及宽高比控制等关键功能整合进单一工作流中。这种集成化设计有效减少了创作者在不同专业软件之间来回切换的繁琐操作,避免了因软件切换导致的工作流程中断和数据丢失等问题,显著提升了工作效率,为创意工作者提供了更加便捷、高效的设计工具。
