首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
OpenClaw Peekaboo v3正式发布 新增手眼功能一日三更

OpenClaw Peekaboo v3正式发布 新增手眼功能一日三更

热心网友
46
转载
2026-05-11

OpenClaw的专属Computer Use工具Peekaboo v3正式回归了,而且一回来就进入了高频更新模式。这补上了OpenClaw生态里最缺的那一环:让AI不仅能回复消息,更能真正“看见”屏幕、“动手”操作真实的桌面环境。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

可以说,OpenClaw终于要长出“眼睛”和“手”了。

过去几个月,OpenClaw的热度经历了一轮典型的周期:从概念引爆时的沸腾,到逐渐落地后的平稳。当项目跑起来、用户开始上手后,社区的讨论焦点很自然地从一个问题转向了另一个。大家不再问“这是什么”,而是开始追问“它还能做什么”。

于是,一个被暂时搁置的老问题重新浮出水面:AI能接收指令、调用工具,但它的能力边界终究要触及真实世界。桌面上的按钮、菜单、弹窗、输入框,才是绝大多数实际工作的“最后一公里”。如果一个智能体(Agent)只能在聊天框里给出建议,那就像坐在副驾驶上指路的人——嘴上说得头头是道,手却始终碰不到方向盘。

Peekaboo就是在这样的背景下回归的。它的名字本身就很有趣,“躲猫猫”恰如其分地描述了自动化面对桌面环境时的常态:按钮藏在弹窗里,菜单躲在系统栏中,窗口一动坐标全变,焦点一跑输入落空。人类可以凭直觉和经验即时修正,而AI则需要一套更可靠、更结构化的“眼睛”和“手”来应对。Peekaboo要补上的,正是这套关键的能力。

从停更到一日三更

Peekaboo的v3.0.0-beta 3版本自去年年末发布后,曾沉寂了一段时间。那时,项目的主要维护者Peter将精力转向了更宏大的OpenClaw项目。这完全可以理解,OpenClaw本身就像一张需要精心编织的大网,要对接各种消息平台、构建网关、处理本地运行、支撑Agent调度,还要确保普通用户能顺利安装和稳定使用。

于是,Peekaboo暂时退居幕后。但变化发生在最近两周。先是v3.0.0-beta 4版本出来试水,紧接着在前天,正式版v3.0.0发布。正式版落地后,更新节奏骤然加快,甚至出现了一天之内连续发布v3.1.0、v3.1.1、v3.1.2三个版本的情况。

这种更新密度通常只有两种可能:要么是出现了重大Bug,维护者正在紧急“救火”;要么是方向终于对齐,积累已久的功能开始集中释放。从目前的情况看,Peekaboo更接近后者。过去几个月,OpenClaw已经搭好了渠道、网关和Agent调度的基础框架。现在,是时候补上那门最重要的“实践课”了。

Peekaboo到底在补什么

对于普通用户而言,可以把Peekaboo理解为一套面向macOS的、为AI赋能的自动化工具集。它的核心能力包括截图、识别窗口、读取UI元素、定位按钮,并能执行点击、打字、滚动、切换应用、操作菜单等一系列动作。

传统自动化脚本最怕环境变化。按钮位置稍微一换,窗口被遮挡一下,或者突然弹出一个对话框,脚本就可能像踩空楼梯一样,瞬间“宕机”进入错误分支。对于Agent来说,这个问题更复杂,因为它需要“边看、边想、边操作”,任何一步识别错误、点击失误或等待超时,都可能导致后续步骤全盘出错。

Peekaboo的价值,就在于将杂乱的桌面环境,转化为Agent能够理解和操作的“结构化工作场域”。它不仅仅是截一张图丢给模型看,更重要的是把图片中的控件、窗口、文本、按钮之间的层级和关系整理出来,形成一套可追踪、可复盘、可持续操作的“现场记录”。AI“看到”的不再是一片混沌的像素,而是一张带有明确坐标和语义的“桌面地图”。

这就好比给一个熟读菜谱的厨师配齐了明亮的厨房、顺手的砧板和锅铲。没有这些,厨艺永远停留在理论阶段;有了这些,才有可能真正开火做出佳肴。

为什么现在才变得关键

Peekaboo并非横空出世的新事物,其初版早在去年6月就已上线。问题在于,当时的模型能力尚未完全到位。视觉模型或许能“看图”,但未必能稳定理解复杂的图形界面布局和控件关系;“计算机使用”(Computer-Use)能力则常常显得生疏,动作大、心里虚,偶尔还会出现令人啼笑皆非的操作。

最近的变化在于,模型的视觉理解能力和计算机操作能力双双跨过了一个临界点。单项的进步看起来可能只是多识别一个图标、点击更准一点、多理解一步逻辑,但当这些进步叠加起来时,整体体验就会发生质变。Agent不再仅仅是实验室里偶尔成功的演示,而是开始接近能够可持续、可靠地跑完一个完整流程的“工具”状态。

正是在这个阶段,底层自动化工具的价值被急剧放大。模型再聪明,也需要稳定、可靠的输入和执行环境。没有Peekaboo这样的“桥梁”,AI对桌面的理解就容易停留在“截图问答”的层面——它能描述屏幕上有什么,却无法可靠地完成下一步的具体操作。Peekaboo所做的,正是把“看见”和“动手”这两个环节无缝地连接起来。

OpenClaw为什么需要它

OpenClaw最初打动人的地方,在于它将Agent能力嵌入了各种日常的消息渠道。用户可以从Telegram、Slack、iMessage、WhatsApp等最熟悉的入口直接发起任务。这个设计精准地捕捉到了一个现实痛点:人们已经懒得为每一个AI功能单独打开一个新网页,也不愿在不同工具之间来回搬运任务上下文。最顺手的入口,往往就是那个一直在用的聊天窗口。

然而,聊天窗口终究只是入口。真正的工作场景,常常发生在电脑里的各种应用和网页中。无论是处理一个网站后台、检查一个本地软件、运行一个模拟器、填写一张复杂表单,还是点击某个配置项、查看一张报错截图,都需要与真实的图形界面交互。

OpenClaw可以把任务从聊天窗口接进来,Agent也可以规划出执行步骤,但如果没有一个能直接操作屏幕的本地执行层,它最终只能把步骤清单发回给用户,让人自己动手。这就形成了一个尴尬的局面:用户叫来了一个“助手”,结果“助手”只是递回一张“待办事项清单”。

Peekaboo的接入,正在改变OpenClaw的角色。它不再仅仅是一个多渠道消息网关或Agent调度台,而是有机会演进为一个能在用户本机环境里真正“办事”的智能系统。用一句话概括:OpenClaw负责“谁来找我”、“要做什么”、“交给哪个Agent处理”;而Peekaboo则负责“屏幕上现在有什么”、“目标按钮在哪里”、“这一下具体该怎么操作”。

开发工具,潜力巨大

社区里已经出现了颇具启发性的用例。有人演示了如何利用Peekaboo,在浏览器中驱动远程的iOS模拟器进行应用探索。

流程大致是:先让Peekaboo分析一张移动应用(如Little Vault)的启动页截图,识别出其中的Logo、标题、标语、“创建保险库”主按钮、登录入口以及右上角的语言选择器等元素。随后,系统将这个屏幕状态注册下来,点击“Create Your Vault”按钮,等待界面跳转,再次截图,并基于新的屏幕状态继续探索。

这段演示的有趣之处,不在于单纯的“AI看懂了一张图”,而在于看懂之后的一系列连贯动作:注册屏幕状态、选择操作目标、执行点击、等待反馈、根据新状态决定下一步。这其中的每一步都可能出错,而每一步也都可以被清晰地记录和复盘。这正是Agent从“玩具”迈向“工具”的关键分界线。Peekaboo使得这些动作变得可观察、可复盘、可延续。对于OpenClaw而言,这等于在远程指令与本地执行之间,铺设了一条坚实可靠的轨道。

Peter忙着更新些什么

翻看最近几天的更新日志,内容似乎有些工程上的“琐碎”:调整模型目录、完善工具模式(schema)、优化打包产物、规范版本标记、修正捕获路径、改进守护进程(daemon)调度策略等等。

这些术语放在发布公告里可能不够“吸睛”,但它们恰恰是决定一个Agent产品能否真正稳定跑起来的“地基”。AI工具最怕遇到一种场景:演示时行云流水,一旦用户自己安装,各种权限问题、路径错误、模型加载失败、窗口捕获异常、输入法冲突、操作延迟等问题便接踵而至。最终用户只能无奈地得出结论:“未来”确实来了,只是还没轮到自己的电脑。

Peekaboo近期的连续更新,修补的正是这类影响实际体验的“脏活累活”。它致力于让命令行界面(CLI)、模型上下文协议(MCP)、桌面应用、远程Agent以及不同模型之间的协作摩擦降到最低,让每一次截图、点击、窗口选择都更加可预期、可依赖。这里没有什么惊天动地的“神迹”,只有大量细致入微的工程优化。而这些工作做得越多,用户在实际使用时就越感知不到它的存在。

一个好工具的最高境界,往往是“没有存在感”。按钮该点就点,窗口该找就找,任务该继续就继续,一切顺畅自然。Peekaboo现在正朝着这个方向扎实地补课。

它让OpenClaw从会聊天变成会干活

回顾一下,OpenClaw过去主要解决的是“连接”问题:人从哪里发消息,消息如何被接收和处理,结果又如何返回。而Peekaboo解决的是“执行”问题:Agent接到任务规划后,能否真实地“看到”桌面,能否准确地找到可操作对象,能否一步步地将计划推进下去。

只有当这两个问题合二为一,才真正接近普通人所期待的“AI助手”模样。接入了Peekaboo的OpenClaw,开始更像一位在线的值班工程师:能够登录系统、查看屏幕状态、排查问题、点击配置、执行流程,让人产生一种“可以把事情托付给它”的信任感。

这也是Peekaboo对OpenClaw生态的深层意义。它正将OpenClaw从“消息处理系统”向“本地操作系统扩展层”推进一步。再往前展望,OpenClaw或许将不再仅仅是AI能力的入口,而有望成为AI操作个人电脑、管理个人工作流的本地核心控制层。真正的智能助理,正在从概念走向桌面。

来源:https://36kr.com/p/3804769591893511
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

OpenClaw Peekaboo v3正式发布 新增手眼功能一日三更
业界动态
OpenClaw Peekaboo v3正式发布 新增手眼功能一日三更

OpenClaw的专属Computer Use工具Peekaboo v3正式回归了,而且一回来就进入了高频更新模式。这补上了OpenClaw生态里最缺的那一环:让AI不仅能回复消息,更能真正“看见”屏幕、“动手”操作真实的桌面环境。 可以说,OpenClaw终于要长出“眼睛”和“手”了。 过去几个月

热心网友
05.11
OpenClaw人人养虾:远程网关搭建
AI
OpenClaw人人养虾:远程网关搭建

从零搭建可远程访问的 Gateway 实例:一份手把手指南 今天,我们来一步步搭建一个属于自己的、可远程访问的 Gateway 实例。整个过程清晰直接,即便是新手,跟着做也能顺利完成。 准备工作 开始之前,需要准备好这几样东西: 项目 说明 云服务器 至少 1 核 CPU、1 GB 内存 域名 例如

热心网友
05.06
OpenClaw人人养虾:openclaw nodes
AI
OpenClaw人人养虾:openclaw nodes

查看已连接的节点列表 概要 openclaw nodes [选项] 描述 想知道你的分布式部署里,到底有哪些“虾兵蟹将”在岗吗?openclaw nodes这个命令就是你的“监控大屏”。它能帮你列出所有当前连接到网关的节点,把它们的运行状态、类型、能力,乃至健康检查结果都清晰地展示出来。说白了,这就

热心网友
05.06
敏感操作沙箱化:OpenClaw安全模式配置与权限隔离指南
AI
敏感操作沙箱化:OpenClaw安全模式配置与权限隔离指南

敏感操作沙箱化:OpenClaw安全模式配置与权限隔离指南 当您使用OpenClaw执行代码运行、网页抓取或文件解析这类敏感操作时,是否担心一个误指令就可能波及主机文件、泄露密钥,甚至触发越权命令?这种顾虑非常必要。将高风险行为严格限制在隔离的“沙箱”环境中,是保障系统安全的核心策略。下面,我们就来

热心网友
04.30
OpenClaw群聊管理实战:自动审核入群与关键词回复
AI
OpenClaw群聊管理实战:自动审核入群与关键词回复

一、配置Events事件源与路由规则 想让OpenClaw帮你自动打理群聊?第一步得确保它能“听见”群里的动静。整个系统的运转核心在于Events(事件)系统,它负责识别来自不同平台的消息,并将它们精准分发到对应的处理模块(Skill)。如果这里没配好,消息就像石沉大海,后续的自动审核和回复都无从谈

热心网友
04.29

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

OKX提币审核中怎么办 常见原因与等待期间应对指南
web3.0
OKX提币审核中怎么办 常见原因与等待期间应对指南

当在OKX欧易平台提币遇到“审核中”状态时,通常意味着交易触发了平台的安全风控流程。常见原因包括账户安全验证、大额提现、新设备登录或涉及高风险资产。等待期间,用户应保持耐心,检查账户信息是否完整,并可通过官方渠道查询进度。理解这一机制有助于更顺畅地进行资产管理。

热心网友
05.11
小米澎湃OS 3发布2026母亲节专属水印与门店花卉活动
科技数码
小米澎湃OS 3发布2026母亲节专属水印与门店花卉活动

小米澎湃OS3系统已全量上线母亲节限定水印,采用手绘康乃馨花束设计,用户需将相册编辑应用升级至2 3 0以上版本方可在5月13日前使用。同时,小米汽车于5月9日至10日推出门店活动,到店扫码可领取鲜花,每家门店至少备有30支。

热心网友
05.11
刺客信条黑旗记忆重置地图新增岛屿与探索内容
游戏资讯
刺客信条黑旗记忆重置地图新增岛屿与探索内容

《刺客信条:黑旗重置版》扩展了探索区域,新增岛屿与城市。玩家可招募三名拥有特殊能力的新船员,并体验更丰富的角色剧情。游戏以罗盘系统取代小地图,优化探索沉浸感,支持按键自定义,并计划加入经典操作模式。将于7月10日登陆PS5、XSX S及PC平台。

热心网友
05.11
欧易OKX新手入门指南:从官网注册到交易下载完整教程顺序
web3.0
欧易OKX新手入门指南:从官网注册到交易下载完整教程顺序

面对海量的欧易平台教程,新手常感无从下手。本文提供一份清晰的入门顺序指南,建议用户首先熟悉官网结构与安全公告,随后完成账户注册与基础安全设置。接着下载官方App并掌握基本操作,最后从现货交易开始实践,逐步学习更复杂的交易类型。遵循此路径可系统性地建立认知,安全高效地开启数字资产交易之旅。

热心网友
05.11
比亚迪闪充技术如何平衡充电速度与用户实际需求
科技数码
比亚迪闪充技术如何平衡充电速度与用户实际需求

比亚迪“闪充”技术实测充电速度领先,引发安全性与实用性讨论。行业数据显示日常仍以慢充为主,快充多用于应急。虽大功率快充可能影响电池寿命,但适度放宽充电时间或更利于技术落地。其核心价值在于提供灵活补能选择,服务于更自由从容的用车体验。

热心网友
05.11