谷歌推出Gemini 2.5 Computer Use模型:聚焦浏览器操作与界面交互新突破
谷歌近期推出了一款名为“Gemini 2.5 计算机使用”的新型人工智能模型,该模型专注于通过浏览器与网络交互,使AI智能体能够在专为人类设计的用户界面中执行任务。这一创新旨在填补当前AI在非API依赖型系统操作中的空白,例如自动填写并提交网页表单等场景。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
据介绍,该模型的核心能力源于其“视觉理解与推理”技术,能够解析用户请求并转化为具体的浏览器操作。谷歌透露,这一特性使其不仅适用于用户界面测试,还可操作那些仅面向人类用户、未开放API接口的系统。此前,谷歌已在AI Mode智能体功能和研究项目“Mariner”中验证了类似技术,例如通过AI根据食材清单自动将商品添加至购物车。
在竞争层面,谷歌此次发布恰逢OpenAI于年度开发者日推出ChatGPT新应用次日。OpenAI正持续强化其“ChatGPT智能体”功能,该功能可代理用户完成复杂任务。与此同时,Anthropic公司已于去年推出Claude AI模型的“计算机使用”版本,形成三足鼎立之势。
谷歌通过演示视频展示了新模型的实际运行效果,并特别说明视频播放速度已加速至3倍。测试数据显示,该模型在网页和移动端基准测试中表现优于现有主流方案。与竞品不同的是,谷歌明确限制模型仅在浏览器环境中运行,无法操控整个计算机系统。最新强调,当前版本“未针对桌面操作系统层级控制进行优化”,目前支持包括打开浏览器、文本输入、页面元素拖放等13种基础操作。
开发者可通过Google AI Studio和Vertex AI平台获取该模型,Browserbase平台则提供在线演示服务。用户可实时观察模型完成“玩2048游戏”或“浏览Hacker News热门话题”等任务,直观体验其与浏览器环境的交互能力。
热门专题
热门推荐
商业帝国大亨:一款点击就能征服宇宙的财富游戏? 近期,手游圈的目光似乎被一款名为《商业帝国大亨》的新作吸引了。不少玩家都在询问:这款游戏到底好不好玩?值不值得投入时间?今天,我们就来深入剖析一下它的玩法核心与特色,看看它能否满足你对“商业帝国”的想象。 1 核心玩法评析:从点击屏幕到宇宙财团 如果
异环一咖舍店铺装修方案分享:店铺经营怎么装修 在《异环》的世界里,经营自己的店铺无疑是件充满乐趣的事。看着人气攀升、收入增长,那份成就感不言而喻。不过,很多新手玩家容易踏入一个误区:一上来就冲着最华丽的摆件去,结果投入巨大,收益提升却未必理想。今天,我们就来聊聊如何用最精明的策略,搞定你的“一咖舍”
鸣潮3 3版本声骸管理方案推荐 随着鸣潮3 3版本的到来,一次全面的声骸系统更新在所难免。特别是针对那些拥有特殊机制的角色,如何高效管理你的声骸库存,成了不少指挥官当前的头等大事。好消息是,新版本支持通过方案码一键导入配置,这无疑大大提升了效率。那么,当前版本有哪些值得关注的方案,又该如何灵活运用呢
梦幻西游神木林175级装备搭配推荐 先来看头盔的选择。这是一件130级的罗汉金钟男头,套装点化成了蜃气妖,并且打上了13锻月亮石。对于神木林这样的法系门派来说,蜃气妖套能直接提升灵力,是核心选择之一。而罗汉金钟这个特技,在高端任务和PK中的重要性不言而喻,关键时刻一个罗汉,往往能扭转战局。用高锻数的
梦幻西游魔王寨175装备搭配推荐 先来看头盔的选择。一件160级附带光辉之甲特技、且激活了长眉灵猴套装效果的头盔,无疑是法系门派的上乘之选。更难得的是,它还额外附加了4 58%的法术暴击伤害属性。为了最大化生存能力,这颗头盔被打上了16锻月亮石,将防御堆砌到了一个相当可观的程度。对于追求极致输出的魔





