一张随手拍摄的照片,一部随身携带的手机,你就能即刻踏入由AI实时构建的立体世界。这不再是科幻电影的专属情节,而是如今触手可及的现实体验。
4月27日,蚂蚁灵光App正式推出“体验世界模型”功能,成为业内首个让普通用户在移动端亲手操作、沉浸式体验世界模型的AGI产品。其操作便捷性令人惊叹:仅需上传一张图片,即可在手机上开启一段长达60秒的3D世界探索。整个过程如同操控一款手游——通过虚拟摇杆自由移动视角,在其中漫步、环顾、观察细节。从指令发出到开始探索,仅需秒级响应。这不仅标志着“世界模型”这一前沿概念首次在手机端成功运行,其分钟级的长时一致性生成与实时交互流畅度,也为AGI产品的实用化落地设立了新的行业标杆。

(图说:在灵光APP中,点击左下角「➕」号上传图片,再点击「生成图中世界」,即可开启体验)
在人工智能研究领域,世界模型普遍被认为是实现AGI(通用人工智能)的关键路径之一。它本质上构建了一座连接数字虚拟空间与物理现实世界的桥梁。此次灵光App上线的功能,其核心驱动力来自蚂蚁集团自研的灵波LingBot-World-Fast世界模型。值得关注的是,这一强大模型已对外开源,为整个行业的技术创新与生态发展提供了重要的基础设施支持。
那么,具体该如何使用这一功能呢?灵光App设计了极为直观的交互入口。用户打开应用,在对话框内上传任意一张照片,系统便会智能推荐数个操作指令,直接点击“生成图中世界”即可。用户也可以使用更自然的表达,例如输入“帮我用第一人称视角探索这张图里的场景”,系统同样能够准确理解并自动触发世界模型的生成流程。指令下达后,探索几乎瞬间开启。
进入生成的世界后,用户体验极为流畅。产品团队针对移动端的使用场景进行了深度优化,其中最引人注目的设计便是引入了手游式的双摇杆操控逻辑。屏幕左侧的虚拟摇杆控制行进方向,实现前后左右的自由移动;右侧摇杆则负责调整观察视角,支持360度全方位浏览这个即时生成的3D环境。这套操作方式与主流3D手游高度一致,用户无需任何学习成本即可轻松上手,真正实现了“零门槛探索AI世界”。
当然,将世界模型成功部署到移动端面临诸多挑战。巨大的计算需求、严格的延迟控制、以及终端设备性能的差异,都是必须克服的工程难题。为了突破这些瓶颈,灵光技术团队采用了高效的低延迟流式传输方案,将系统响应时间压缩至百毫秒级别。正是这一技术突破,使得“秒级开启3D探索”成为现实,彻底改变了业界以往认为世界模型“算力要求高、部署门槛高、难以实用化”的固有认知。
灵光App负责人蔡伟在谈及此功能时表示,这是团队在探索智能体应用边界过程中的又一次重要实践。他指出,此前灵光推出的“闪应用”功能,已实现通过自然语言指令在30秒内生成一个应用,本质上是将程序开发能力赋予了普通用户。而此次的世界模型功能,延续了同一核心理念:持续洞察并满足用户未被发掘的深层需求,致力于将最前沿的AI体验带给每一位普通用户。
目前,这一充满想象力的功能已面向所有用户全面开放。如果您对手机端AI世界探索感兴趣,可以立即前往各大应用商店下载灵光App,亲身体验用手机漫步AI生成世界的奇妙感受。
