在今年的Google I/O开发者大会上,谷歌正式发布了其Workspace生产力套件的最新成员——Pics,这是一款集成AI能力的智能设计与图像生成工具。该产品的核心理念是降低专业设计的门槛,让视觉创作变得如同编辑文档一样直观高效。用户仅需输入简单的文字描述,即可快速生成适用于社交媒体、营销海报、演示文稿等多种场景的高质量视觉素材。此举意味着谷歌正凭借其深厚的办公生态与用户基础,强势进入由Canva、Adobe Express以及Anthropic旗下Claude Design等工具主导的AI设计软件市场。
目前,许多生成式AI图像工具存在一个共同局限:生成图片后难以进行局部、精准的二次编辑与调整。谷歌Pics针对这一痛点进行了重要优化。它创新性地引入了双向交互编辑模式:用户可以像在Google文档中添加评论一样,直接点击图片的任意区域,通过文字指令提出修改要求;同时,也能手动拖拽、调整文本、图形等元素的位置、大小与样式。这种将AI生成与精细化手动控制相结合的设计,使得从创意构思到成品打磨的整个工作流程更加无缝、灵活。
实现这些功能的核心,是谷歌全新研发的Nano Banana2模型。据报道,该模型在三个方面实现了显著提升:首先是更精准的文本理解与渲染能力,确保图片中嵌入的标语、标题等文字内容清晰准确;其次是融入了更丰富的现实世界知识图谱,使生成的图像场景、物体关系更符合逻辑与常识;最后是致力于输出更精细、逼真的视觉质量,在细节表现上更为出色。作为Workspace的原生应用,Pics天然具备强大的团队协作基因,用户生成的设计作品可以轻松地一键分享给同事协同编辑,或直接下载、打印,无缝融入现有工作流程。
目前,谷歌Pics已开启小范围测试体验,并计划于今年夏季正式面向订阅了Google AI Ultra(或相应高级服务)的用户全面推出。从行业趋势来看,AI应用的发展正从早期的多模态内容生成,逐步深化至与企业具体工作流程的深度整合与协同。Pics的推出,不仅补全了谷歌办公自动化生态中“视觉内容创作”这一关键环节,也标志着大模型技术进入应用层的新阶段——其重点不再仅是生成内容,更在于实现对办公资产(如图片、设计稿)的精细化控制、智能编辑与高效协同,这将为企业和创作者带来新一轮的生产力提升与技术红利。
