游乐游手机版
首页/科技数码/文章详情

谷歌Antigravity 2.0使用评测功能强大但对比Claude与Codex仍有差距

时间:2026-05-21 07:21
谷歌在I O大会上推出Antigravity2 0,回应ClaudeCode等AI编程工具。新版从AI集成开发环境转向以任务为中心的通用智能体,界面更简洁,支持多模型。实际测试显示其能有效完成开发任务,新增斜杠命令强化持续执行等能力。但与竞品相比,其在权限管理、撤销功能等细节上仍有不足,体验尚需完善。

AI领域的风云人物Andrej Karpathy加入Anthropic的消息,时机选得颇为巧妙。就在谷歌I/O 2026大会召开前几小时,这位OpenAI创始成员、前特斯拉AI负责人正式宣布了他的新去向。这无疑让Anthropic在AI领域的技术与心智优势,又添上了一块重要砝码。

过去一年,Claude Code已经悄然成为许多开发者口中“最接近能干活”的AI编程工具。它界面并不花哨,甚至初看更像一个终端工具。但恰恰是这种深入开发者最熟悉的命令行、代码库和本地工作流的策略,让它更早地跨越了“技术演示”与“日常使用”之间的那道鸿沟。

谷歌显然注意到了这一变化。在凌晨的I/O大会上,谷歌正式推出了Antigra vity 2.0,作为对Claude Code和Codex的回应。这一次,它没有选择继续深耕IDE内的AI助手路线。发布会已过去数小时,各种“云解读”早已铺天盖地,我们不妨结合实际上手体验,来聊聊更具体的看法。

谷歌终于不想只做一个AI IDE了

在1.0时代,谷歌对Antigra vity的定位是“AI时代的Agent-First IDE”。本质上,它仍然是一个以AI为核心的集成开发环境。开发者打开它,预期行为依然是写代码、看文件、跑项目,只是AI从一个被动的助手变成了更主动的协作者。

然而,首次打开Antigra vity 2.0,最直观的感受是:它已经不太像那个“加了AI的IDE”了,其形态反而更接近OpenAI的Codex或Anthropic的Claude Code。

界面简洁了许多:左侧是项目列表,右侧是对话区域。代码编辑器不再占据视觉中心。用户不再是先进入代码窗口再寻求AI辅助,而是先开启一段对话,由AI来接手任务、理解项目、操作文件并最终交付结果。

截屏2026-05-20 18.24.17.png

图片来源:

这个转变至关重要。过去,我们习惯于将Antigra vity放在Cursor、Windsurf、Trae这类AI IDE的框架里讨论。但Antigra vity 2.0更像是一次从“AI编程智能体”向“通用个人助理”的升级,写代码只是它最重要、也最适合展示能力的场景之一。

这也解释了为何它看起来与Codex、Claude Code越来越像。三者的共同点在于,都在将开发工具的重心从“编辑器”迁移到“任务中心”。过去开发者打开工具是为了进入一个项目;现在打开这些AI智能体工具,更像是为了交代一个目标。

流程变成了:用户提出需求,AI读取项目、规划步骤、申请权限、修改文件、运行命令、最后汇报结果。开发者的角色也随之演变,从亲手编写每一行代码,转变为判断需求、授权操作、审查结果的人。

不过,Antigra vity 2.0并非简单照搬。它最大的不同,在于模型选择上反而更加开放。

截屏2026-05-20 11.08.40.png

图片来源:

Codex基本绑定OpenAI自家模型,Claude Code也主要围绕Anthropic的Claude模型构建。而Antigra vity 2.0除了接入谷歌自家最新模型(如新上线的Gemini-3.5-Flash-High/Medium),也保留了第三方模型选项,包括Claude-Opus-4.6-Thinking、Claude-Sonnet-4.6-Thinking,以及GPT-OSS-120B-Medium。

这或许是谷歌聪明的地方。它当然希望用户使用Gemini,但也清楚,开发者不会仅仅因为“这是谷歌”就放弃Claude或OpenAI。与其强行将用户锁在自家生态里,不如先把Antigra vity打造成一个足够好用的工作台,让Gemini在真实任务中证明自己的实力。

那么,实际表现究竟如何?

一个能干好活的助手,但细节还没有跟上来

我们尝试让它开发一个能够压缩GIF图的macOS应用,要求除了提供各种手动调整选项外,还必须支持一键智能压缩至5MB以下的功能,并采用Material Design风格。

截屏2026-05-20 18.26.03.png

图片来源:

最终生成的应用相当可用。UI设计质感在线,自动适配了深色/浅色主题切换。更重要的是,功能基本满足了需求:既能手动调整参数压缩GIF,也能一键智能压缩,成功将测试文件从9.37 MB压缩到了5 MB以内。

截屏2026-05-20 17.34.46.png

Antigra vity 出炉的 macOS App,图片来源:

一个有趣的细节是,AI甚至“知道”微信有5MB的上传限制。当然,手动调整的选项目前还偏少,增加更多可调参数可能是下一步迭代的方向。但就整体效果而言,已经相当不错了。

Antigra vity 2.0真正与1.0拉开差距的地方,在于它开始围绕“持续执行任务”来设计产品。这次新增的几个斜杠命令就很有代表性:/goal、/grill-me、/schedule、/browser。

/goal用于交给AI一个持续目标,让它自动推进;/grill-me则相反,要求AI在动手前先深度追问,对齐需求细节;/schedule用于设置定时或周期任务;/browser则强制启用浏览器能力,让AI可以基于网页信息继续工作。

这四个命令,实际上对应了当前AI智能体最关键的四个能力痛点:持续执行、需求澄清、定期任务、外部信息连接。

尤其是/grill-me,值得单独一提。当前许多AI编程工具的问题,不在于不会写代码,而在于太急于写代码。用户一句话还没说完,它已开始修改文件;需求中存在模糊边界,它也会自行脑补。最终结果可能改动很大,但方向或许从一开始就错了。

截屏2026-05-20 18.29.12.png

图片来源:

因此,让AI先反问,反而是一种进步。但实际体验后也能明显感觉到,Antigra vity 2.0的细节尚未完全到位。

最突出的问题在于授权模式。

截屏2026-05-20 18.13.19.png

Antigra vity 2.0,图片来源:

截屏2026-05-20 18.13.51.png

Codex 的三种权限模式,图片来源:

Codex和Claude Code在实际使用中,通常会在对话框附近提供清晰的权限模式切换,例如默认权限、自动审查、完全访问等。用户可以快速决定,当前任务是让AI每一步都询问,还是允许它更主动地执行命令、修改文件。

Antigra vity 2.0在这方面就显得有些繁琐。它缺少一个便捷的授权模式切换设计,导致在实际使用中,AI会频繁申请权限,不断打断任务流程。对于一个强调“智能体优先”的工具来说,这个问题会被放大。因为智能体的价值正在于连续执行,一旦每几步就卡在权限申请上,体验就会从“调度一个助手”降级为“不断给助手盖章”。

与此同时,Antigra vity 2.0目前还不支持撤销修改。

这在实践中相当棘手。AI有时会直接修改文件内容,但结果未必令人满意。更麻烦的是,有些问题并非某几行代码写错,而是一开始的需求描述就有偏差。此时用户最需要的不是让AI继续修补,而是快速回退到修改前的状态。

Codex在这方面更为成熟,它支持撤销修改,让用户可以更放心地授权AI操作。因为你知道即便它跑偏了,也能轻松回退。Antigra vity 2.0缺少这一能力,会使用户在授权时更加谨慎,从而削弱智能体主动执行的体验。

截屏2026-05-20 18.30.16.png

Codex 可以撤销编辑,图片来源:

AI编程工具本质上是在与用户交换信任。它越想表现得主动,就越需要提供清晰的回滚机制。没有撤销功能,用户就会下意识收紧权限;权限收紧后,智能体的连续执行能力又会被削弱。这是一个非常直接的连锁反应。

另外,谷歌这次几乎在全线产品中都上线了额度机制,Antigra vity 2.0也不例外。问题在于,查看额度依然不够方便,必须进入设置界面才能看到。这听起来是个小问题,但对于高频使用AI智能体的开发者而言,额度已经成了一种新的“电量”。

截屏2026-05-20 18.20.32.png

Antigra vity 设置页,图片来源:

截屏2026-05-20 19.16.19.png

Codex 查看额度,图片来源:

模型调用并非无限,尤其是在多智能体、长上下文、持续任务、浏览器调用叠加的场景下,用户自然会关心剩余额度,并据此决定接下来该使用高配模型,还是切换到更便宜、更快的模型。

这也是Antigra vity 2.0从AI IDE走向通用智能体工作台后必须补上的产品细节。它不仅要展示模型能力,还要让用户能够清晰地管理成本、权限、任务和风险。

与Codex相比,Antigra vity 2.0还有一个明显差异:最终回答更为详细。

Codex的思考和操作过程其实也很具体,它会告知正在读取哪些文件、执行什么命令、修改哪些内容,过程并不黑箱。但在最终总结时,Codex往往比较克制,通常只是简要说明做了什么、改了哪里、下一步建议是什么。

Antigra vity 2.0则倾向于在最终回答中给出更完整的汇报。它会把自己做了什么、大体修改了哪些内容、新增了什么、涉及哪些文件,都重新梳理一遍。对于刚上手的用户来说,这种详细的汇报能带来更强的安心感,因为你不需要从一堆操作日志中自行拼凑结果,它会主动提供一个结构化的交代。

截屏2026-05-20 18.22.38.png

这很像谷歌当前许多AI产品的风格:信息给得更满,解释更充分,但有时也难免显得稍微啰嗦。

绝地反击Claude Code/CodeX?言之尚早

那么,Antigra vity 2.0能让谷歌实现绝地反击吗?现在下结论还为时过早。

从产品形态来看,Antigra vity 2.0是谷歌在AI编程工具领域最值得认真看待的一次调整。它终于不再仅仅强调模型能力,而是承认开发者的工作流正在进入一个新阶段:人不再只是让AI补几行代码,而是开始向AI分派任务、设置边界、检查结果,并让多个智能体围绕一个项目持续协作。

这件事本身意义重大。但从上手感受来看,Antigra vity 2.0也尚未达到“一出手即改变格局”的程度。

Claude Code已经通过终端工作流证明了自己,Codex正借助ChatGPT的入口拓宽场景。Antigra vity 2.0要追上它们,依靠的不会是一次I/O发布会,也不会是几个漂亮的智能体演示。

但它至少让谷歌重新回到了这场竞争的牌桌上。真正的答案,还要看未来是否有更多人愿意每天打开它。

来源:https://www.leikeji.com/article/76894
上一篇海信激光电视X1 Pro发布:27999元起享院线级画质与非遗声场 下一篇谷歌AI付费墙体验:免费用户友好但功能受限
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5

电动汽车电池新国标7月实施热失控不起火不爆炸
科技数码 · 2026-07-01

电动汽车电池新国标7月实施热失控不起火不爆炸

自2026年7月1日起,两项关乎电动汽车安全的核心强制性国家标准将正式实施,为行业加装“安全锁”——《电动汽车安全要求》(GB 18384-2025)与《电动汽车用动力蓄电池安全要求》(GB 38031-2025)同步落地。此次标准升级,从整车架构与电池系统两大维度,精准填补了近年来多起事故暴露出的