谷歌近日宣布开放其图像生成模型Nano Banana的API接口,开发者可以通过Gemini API将该技术集成到自有产品中。企业客户还能实现批量调用功能,满足大规模内容生产需求。
为满足不同用户需求,Google AI Studio平台继续提供使用入口,用户在Build板块输入简单的文字指令即可快速生成定制化应用场景。
两大核心功能升级
首先是画幅比例自定义功能。用户在AI Studio中可以自由设置多种常见宽高比,包括16:9的电影银幕比例、9:16的竖屏短视频比例以及4:3的传统比例等。这种灵活性让创作者可以轻松适配不同平台的展示需求,比如16:9适合营造宏大场景的视觉冲击力,而9:16则更适合移动端的全屏展示。
第二大升级是新增纯图像输出模式。该模式下系统仅返回图像文件,去除了文本描述内容,有效降低token消耗并避免信息干扰。这对于需要实时预览效果的电商商品展示或设计工具来说尤其实用。
价格与性能表现
根据最新定价方案,图像生成服务按token计费,每百万token收费30美元。以1024x1024像素的标准分辨率计算,单张图像约消耗1290个token,成本控制在0.039美元左右。需要特别注意的是,相比Gemini 2.5 Flash的文本生成服务,图像生成的成本高出约12倍。
在实际测试中,不同画幅比例展现出各自的场景优势:经典的4:3比例自带复古质感,尤其适合创作带有怀旧气息的城市夜景;而符合人眼视域的3:2比例在风光摄影中表现优异,为后期处理保留了充足的裁剪空间。
市场表现与技术应用
在当前AI应用市场中,尽管Reddit等社区因Sora邀请码交易热闹非凡,但Gemini系列应用仍在苹果App Store保持领先地位。新涌现的短视频类AI应用尚不足以撼动其市场主导优势。
