在今年的谷歌I/O开发者大会上,一项关于“世界模型”技术整合的重要发布,揭示了人工智能向物理世界理解和交互迈进的关键一步。谷歌正式宣布,将其前沿的通用世界模型Project Genie的核心能力,与覆盖全球的谷歌街景服务进行深度融合。
简而言之,Project Genie的核心优势在于生成高度多样化且具备交互性的虚拟环境。它超越了传统图像生成模型,能够构建出可供用户自由探索和互动的动态场景。这一特性使其在AI智能体模拟训练、沉浸式虚拟体验开发以及游戏内容生成等领域展现出巨大潜力。
此次与谷歌街景的结合,标志着Genie的应用边界实现了从“纯粹虚拟”到“虚实融合”的重大跨越。现在,该模型能够基于真实的街景图像数据,快速生成一个既植根于现实地理信息,又允许深度交互的3D模拟世界。这为训练人工智能系统或机器人如何在复杂、多变的真实城市环境中进行精准导航、自主移动和智能交互,提供了一个前所未有的高效“数字沙盒”。
那么,用户如何亲身体验这一创新功能呢?操作流程非常直观:首先,在Google Maps应用中点击一个特定地点的图钉(目前该功能优先支持美国境内的地点),然后为其选择一个富有创意的视觉风格主题,例如“石器时代”或“海洋世界”。

接下来,用户可以进一步描述一个自定义的角色,比如自己喜爱的书籍或电影中的英雄人物。系统将综合真实的街景底图与用户输入的创意元素,实时生成一个独一无二的、基于现实场景却又充满想象力的互动世界,供用户探索。
需要指出的是,这项融合了街景与AI生成技术的创新应用,目前仍处于实验性原型阶段,其应用范围存在一定限制。现阶段,它主要支持基于美国境内的地点来生成互动图像。谷歌官方表示,团队正在积极优化模型,计划未来逐步将服务扩展到全球更多国家和地区,但具体的推广路线图与详细时间表尚未对外公布。
