游乐游手机版
首页/AI热点日报/热点详情

谷歌AI智能体手机端上线 Gemini能实时看懂屏幕交流

类型:热点整理2026-07-04
谷歌又一次把“未来感”拉满了。就在不少人还在讨论ChatGPT如何霸占话题榜时,Gemini悄悄上线了一个真正能让手机“活起来”的功能——实时屏幕共享与摄像头交互。这意味着,AI不再只是那个躲在对话框里的文字生成器,而是能跟你一起看、一起听、一起分析眼前世界的“数字伙伴”。 事情是这样的:一位用户在

谷歌又一次把“未来感”拉满了。就在不少人还在讨论ChatGPT如何霸占话题榜时,Gemini悄悄上线了一个真正能让手机“活起来”的功能——实时屏幕共享与摄像头交互。这意味着,AI不再只是那个躲在对话框里的文字生成器,而是能跟你一起看、一起听、一起分析眼前世界的“数字伙伴”。

事情是这样的:一位用户在激活Gemini悬浮窗后,意外发现了一个全新的按钮——「与Live共享屏幕」。点下去,手机屏幕上的所有内容,Gemini都能实时看见并理解。你说“Gemini,你能看到我的屏幕吗?”它立刻回答:“没问题,我看到时间是8点50,温度71度,日期3月23日。”你再问“哪个APP跟我的职业最相关?”它扫一眼屏幕:“嗯,似乎是Code Editor。”你让它帮忙播放视频,它则会礼貌地解释:“因为我们正在实时对话,无法直接控制手机,但可以跟你聊天、进行头脑风暴。”——这已经不只是“识别”,而是真正理解上下文了。

同步上线的还有实时视频功能。在完整的Gemini Live界面打开视频流,右下角有个按钮,一键切换到前置摄像头。Gemini就像被装上了眼睛,能实时分析摄像头捕捉到的画面,回答你提出的各种问题。本月谷歌发布的演示视频里,有人刚做完釉陶,想上色却举棋不定,直接把成品放在镜头前问Gemini:“这个配什么颜色好?”它就能基于视觉信息给出建议。这种“看世界”的能力,让AI从虚拟助手升级为现实世界的“第二双眼睛”。

Project Astra:从愿景到现实

其实,这项功能的背后是谷歌酝酿已久的计划——Project Astra。早在2024年3月的I/O大会上,DeepMind负责人Demis Hassabis就透露了这个想法。他描述了一个“能看见世界、知道物体是什么以及放在哪里、能够回答问题和帮助做几乎所有事情”的通用助手。当时的Demo还很早期,而现在,“Gemini Live共享屏幕”成了Project Astra第一次真正落地的产品。可以说,这也是2025年AI Agent元年里,关于“AI与物理世界交互”这个方向最清晰的预告片。

当AI能够实时观看你的屏幕、你的房间、你手中的物件,并基于这些信息与你自然对话,人机交互的边界就被彻底打破了。这不是简单的“识图”,而是深层次的语义融合——屏幕上的时间、温度、App图标、摄像头里的瓷碗颜色,都能成为对话的上下文。谷歌这次新功能的推出,毫不意外地让自己在AI助手领域的领先地位再次得到巩固。毕竟,能同时搞定“看屏幕”和“看世界”的,目前还真找不出第二家。

据谷歌官方消息,这项功能会在3月下旬,作为Google One AI高级计划的一部分,向Gemini高级订阅用户逐步推送。虽然目前只面向部分用户开放,但可以预见,一旦普及,将彻底改变我们使用手机的方式——AI不再是后台的沉默引擎,而是随时待命的“同桌伙伴”。

来源:https://www.53ai.com/news/zhinengyingjian/2025032406395.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。