谷歌与字节编程能力为何仍是短板
最近,《纽约时报》旗下播客的一段采访引发了不小的讨论。谷歌CEO桑达尔·皮查伊在访谈中坦率承认,在AI编程(AI Coding)这个赛道上,谷歌确实落后了。

这多少有些令人意外。毕竟,谷歌在AI领域的实力有目共睹:手握Gemini系列模型,坐拥庞大的搜索、安卓、云服务生态,还有自研的TPU硬件。在刚刚过去的I/O大会上,谷歌几乎把AI能力塞进了每一个核心产品入口。
它并非没有布局AI编程。Antigra vity已经被推向前台,Gemini CLI和Gemini Code Assist也一直在为开发者提供服务。但问题在于,做了不等于做成了;生态全面,也不意味着能自动拿下市场。
如今一提到AI编程工具,开发者们最先想到的,往往还是Claude Code、Codex和Cursor。编程,已经成为AI智能体(Agent)最早跑通、也最卷的战场。几乎所有前沿AI公司都在向这里进军,就连并非以编程见长的DeepSeek,也开始围绕Agent Harness招兵买马。
可以说,AI编程未必是每家AI公司的起点,却正在成为前沿玩家们共同的战略落点。
这种局面下,谷歌的处境并非孤例。在国内,字节跳动面临着相似的尴尬。两者都拥有从模型到应用再到基础设施的完整AI生态,但在AI编程这个具体领域,字节的Trae和谷歌的Antigra vity一样,都还只是众多可选项中的一个名字,远未成为开发者绕不开的“必需品”。
如果这些巨头想在以智能体为核心的新时代,继续维持其“全家桶”式的平台地位,那么,补齐AI编程这块短板,已是迫在眉睫。
01 没拿下程序员
谷歌在AI编程上的核心问题,并非缺少产品,而是缺少真正拥趸的用户。
市场数据很能说明问题。Codex拥有超过400万的周活跃用户,而Claude Code则在开发者心智上取得了显著胜利。今年2月,The Pragmatic Engineer面向软件工程师的AI工具调查显示,Claude Code以46%的占比成为最受喜爱的工具。Business Insider在5月23日的报道中也指出,在众多创业公司内部,Claude Code已成为处理复杂工程任务时的首选。
相比之下,Antigra vity似乎乏善可陈,它更像是一个背靠谷歌生态大厦的“附属品”,而非一个凭借自身实力赢得口碑的独立产品。
从开发者的实际体感来看,Antigra vity也未能建立起足够的信任。大约五个月前,就有人专门整理了Reddit社区里超过100条关于Antigra vity的讨论,将最常见的痛点归纳为几类:额度机制混乱、性能消耗资源、安全担忧、模型选择问题,以及智能体擅自删除或改坏代码。

按理说,这些问题本应在后续更新中得到解决。Antigra vity 2.0的发布,曾被视作谷歌追赶AI编程浪潮的一个重要节点。然而,更新后的社群反响,依然算不上乐观。

目前最大的争议点在于,Antigra vity 2.0将产品形态从原本偏向集成开发环境(IDE)的体验,突然转向了一个更偏向“智能体管理器”(Agent Manager)的界面。用户熟悉的编辑器、文件树、终端、版本控制和扩展环境变得难以寻觅,不得不被迫适应一套全新的交互逻辑。
或许谷歌认为这是在向更智能、更自动化的未来迈进。但事实是,在尚未充分建立用户信任之前,就试图让开发者从“可控的IDE协作”模式,直接跳转到“黑盒式的智能体调度”模式,这几乎等同于放弃了原有的产品路径,也连带疏远了原先积累的那批用户。
更令人头疼的是,额度混乱的问题不仅没解决,反而变本加厉。
从5月20日开始,Gemini的限额机制从按调用次数计费,转向了更接近实际算力消耗的口径。Antigra vity官方声称Pro用户享有每5小时刷新的额度,但同时却又设置了每周上限。用户无法预知一次智能体任务会消耗多少算力,也不清楚自己何时会触及周限额天花板。一旦在长任务中途遭遇限额,整个开发流程就可能被强行打断。

更要命的是底层模型的表现。谷歌最新发布的Gemini 3.5 Flash虽然以速度见长,但在编程任务的稳定性和准确性上仍存疑虑。
有用户吐槽,自己只是让Gemini 3.5 Flash提供一个代码重构计划,它却直接开始动手修改代码,随后声称重构成功,但核心目标基本没完成,最后甚至在没有得到许可的情况下,恢复了一个无关的文件。

还有用户抱怨,即便明确给出了目标文件、行号和具体的修改指令,3.5 Flash仍然会反复探索同一批文件,而不是直接执行代码改动。在这个过程中,Token像不要钱似地被大量消耗。

总结来看,Antigra vity面临的是一个“三重困境”:产品形态突变,让用户感觉熟悉的工作台被拆解;额度规则不透明,长任务缺乏确定性保障;底层模型在真实代码库中的执行稳定性仍受质疑。这三者叠加,使得Antigra vity至今未能向开发者证明,它是一个值得托付和信赖的日常工具。
02 谷歌已经开始补课
当然,谷歌并非没有意识到问题的严重性。
在最近的采访中,皮查伊其实把谷歌的短板说得很清楚:如果比较文本、多模态、语音、音频、推理和整体智能,谷歌仍然极具竞争力;但具体到AI编程、工具使用、复杂指令遵循和长周期任务执行这些领域,谷歌确实有所落后。
他特别指出,谷歌过去在编程领域,可能缺乏像Claude Code或Cursor那样连贯的数据流和极致聚焦的产品体验。
这也正是谷歌当前一系列追赶动作的内在逻辑。
过去很长一段时间,谷歌面向开发者的AI工具线比较分散:Gemini Code Assist、Gemini CLI、Antigra vity、以及Firebase的相关工具各自为战,缺乏一个清晰统一的主入口。I/O大会之后,谷歌开始着手整合,将这条产品线向Antigra vity集中。Gemini CLI和Gemini Code Assist面向个人用户的能力,正逐步迁移到Antigra vity CLI和Antigra vity 2.0中。
谷歌迫切需要一个统一的入口,将Gemini真正嵌入复杂的软件工程流程,从而获取足够多的真实任务数据、失败案例、工具调用记录以及长周期任务数据,用以反哺模型迭代。
然而,同样是切入真实工作流,不同玩家的策略截然不同。Claude Code的做法是让智能体贴着开发者原有的终端和代码库工作;Cursor的策略是把AI深度集成进IDE,让人随时可以查看、修改和接管。反观Antigra vity 2.0,其产品形态则显得颇为激进——它直接将开发者“抬高”了一层,推到一个智能体管理器中,去查看任务进度、等待结果交付。
这种设计并非没有道理,甚至可能是未来的方向之一。但前提是,用户已经对这个智能体建立了充分的信任。而Antigra vity恰恰在尚未建立这种信任时,就先削弱了开发者熟悉的IDE协作体验。这或许只能解释为“不破不立”,但其中的阵痛和用户适应期,恐怕还需要一段时间来消化。
除了整合产品入口,谷歌也在补强其背后的智能体基础设施。官方已经开放了Antigra vity SDK的预览版,允许开发者基于这套框架构建自己的定制化智能体。
这背后,多少能看到Claude Code的“他山之石”。Claude Code的成功,不仅仅归功于Claude模型本身,更在于Anthropic将模型置入了一套成熟的Agent Harness(智能体驾驭系统)之中。许多开发者青睐Claude Code,正是因为它足够贴近真实的开发现场——终端、代码库、Git操作、测试、报错信息都近在眼前。谷歌显然也在吸收这套经验。
在组织层面,据The Information报道,Google DeepMind已经组建了一支针对AI编程模型能力的专项小组,由研究员和工程师集中攻关,旨在改善Gemini的代码能力。这支团队由Google DeepMind的研究工程师Sebastian Borgeaud牵头,DeepMind的首席技术官Koray Ka vukcuoglu乃至谷歌联合创始人Sergey Brin据称也参与其中。
所有这些动作都表明,谷歌已经开始全力补课。但这并不能直接证明,它一定能追上领先者。
回顾历史,谷歌并不缺少“集中力量补短板”的时刻。在社交网络时代,它曾推出Google+追赶Facebook;在移动通讯时代,也尝试用Allo对标WhatsApp、iMessage和Messenger。这些产品背后,同样有谷歌账号体系、搜索流量、安卓入口和强大的工程资源支撑,但最终都未能真正改变市场格局。
这并非预言Antigra vity会重蹈覆辙。AI编程与社交、通讯是完全不同的市场,谷歌手中也确实掌握着Gemini、云服务、开发者工具和企业客户这些更贴近软件工程的资产。但历史提醒我们一件事:巨头的资源只能把产品推到用户面前,却无法替产品赢得用户的使用习惯和心智认同。
如今的Antigra vity,已经被谷歌推到了更重要的战略位置。但它仍需证明,自己不是一个被强行整合出来的入口,而是一个真正能够承接开发者日常工作、提升生产效率的可靠工具。
对此,皮查伊倒是显得信心十足。他在采访中表示,自己对此“非常、非常乐观”,并相信谷歌终将“突破这一关”。

03 全家桶救不了不稳定的Agent
字节跳动的境遇,与谷歌有着惊人的相似性。
字节手中同样握有一套相当完整的AI“全家桶”:从面向大众的豆包、即梦,到内容生产的剪映、CapCut,再到企业协作的飞书、云服务火山引擎、智能体平台扣子,最后到AI编程工具Trae。从普通用户到内容创作者,从企业服务到基础设施,从智能体平台到开发工具,字节几乎在每一层都已完成布局。
然而,具体到AI编程这个细分战场,Trae和Antigra vity一样,都尚未成为开发者心目中那个不可或缺的“王牌工具”。
字节当然也在奋力追赶。Trae早已不只是一个AI IDE,它推出了Trae SOLO,试图切入用户的真实工作流;也开源了Trae Agent,旨在弥补开发者心智和技术信任上的短板。从招聘动向和产品迭代来看,Trae已被字节打造成一条完整的产品线,覆盖了智能体基础架构、AI编程环境、模型算法、开发者运营乃至企业客户服务等多个方向。
谷歌有Gemini、Antigra vity、Google Cloud、Firebase、Android、Workspace;字节有豆包、Trae、飞书、火山引擎、扣子和庞大的内容生态。它们本质上都不是单点工具公司,而是追求协同效应的平台型公司。
从收入结构看,AI编程对它们而言,更像是一个战略入口:开发者入口、云服务入口、企业研发流程的入口。
谷歌的财报显示,Google Services(搜索、YouTube、订阅等)仍是绝对的收入支柱,而Google Cloud则是增长最快的业务之一。字节虽未上市,但据路透社等第三方机构披露,其核心收入同样主要来自抖音/TikTok等内容平台上的广告、电商、直播等变&现模式。
这意味着,谷歌不靠Antigra vity也能活得很好,字节没有Trae也不会伤筋动骨。但是,如果它们想在以智能体为主导的新时代,继续保持平台级公司的统治力,就不能长期缺失这个关键的“开发者入口”。
微软已经证明了开发工具的战略价值,这种价值未必体现在直接收入上。VS Code是免费的,GitHub长期也不靠软件授权赚钱,但它们成功锁住了全球开发者的核心工作流。一个工程师在哪里写代码、管理代码、调用AI,最后就很可能在哪里部署应用、采购云服务、接入企业级工具链。
AI编程遵循着同样的逻辑。谁能拿下开发者每天打开的第一个工作台,谁就更容易向后延伸,承接云服务、模型调用、数据库、应用部署、监控、安全以及企业协作等一系列需求。
谷歌和字节都拥有强大的生态,但AI编程市场并非一个仅靠生态导流就能轻松取胜的战场。对于开发者而言,最关键的永远是:这个工具背后的模型,在真实的、复杂的代码库里,到底能不能稳定、可靠地干活。
一个合格的编程智能体,要解决的远不止是“生成一段代码”(这种工作聊天机器人也能做)。它需要知道应该查看哪些文件,忽略哪些无关文件;需要精准理解用户的真实意图,而不是进行反复无效的探索;需要能够根据报错信息持续修复;需要懂得何时该自动执行,何时该先询问确认;需要尽可能少地制造垃圾文件,避免误改生产代码,减少将Token浪费在无效的搜索循环上。
而这些能力的根基,最终都回归到底层模型。
Antigra vity暴露的许多问题,表面上看是产品设计问题:智能体管理器过于“黑盒”、额度不透明、任务易中断、文件改动不可控。但往深处看,很多也是模型能力问题:如果模型足够强大,能够准确判断该看哪里、该改哪里、何时该停止,那么用户对“不可靠”的感知就不会如此强烈。
这也解释了为何Claude Code和Codex能够率先脱颖而出。Claude Code的成功,首要原因在于Claude模型本身在代码理解、长上下文处理、工具调用和复杂任务规划上足够强悍;Codex亦然,OpenAI能将其打造成大规模的开发者入口,依靠的正是模型在软件工程任务上的持续迭代和优化。
当然,产品设计至关重要。智能体驾驭系统(Harness)、权限控制、操作回滚、插件生态、移动端审批、第三方工具接入……这些环节都不可或缺。但它们本质上都是为了给强大的模型提供一个更好的“发挥舞台”。如果模型本身不够稳定、不够聪明,再完善的生态也只会将这种不稳定性放大。只有当模型足够强大时,优秀的产品设计和生态整合,才有机会将技术能力转化为牢不可破的工作流习惯。
因此,AI编程的竞争,拼到最后可以分为三个层次:第一层是模型能力,这是基石;第二层是工具与框架,这是桥梁;第三层才是生态协同,这是放大器。
谷歌和字节都不缺第三层的生态。它们面临的真正挑战在于,能否将第一层的模型能力、第二层的智能体框架,与开发者真实的工作流,整合成一个稳定、高效、可信赖的系统。
巨头们固然可以把入口铺得又广又满,但倘若底层模型无法稳健支撑复杂的软件工程任务,这块“技术软肋”就会一直暴露在竞争对手面前。生态可以把开发者带到门口,而模型和产品的终极稳定性,才决定了他们是否会真正留下来,并为之付费。
相关攻略
最近,《纽约时报》旗下播客的一段采访引发了不小的讨论。谷歌CEO桑达尔·皮查伊在访谈中坦率承认,在AI编程(AI Coding)这个赛道上,谷歌确实落后了。 这多少有些令人意外。毕竟,谷歌在AI领域的实力有目共睹:手握Gemini系列模型,坐拥庞大的搜索、安卓、云服务生态,还有自研的TPU硬件。在刚
信息学竞赛是升学重要路径,选择专业C++机构至关重要。优编程体系完整、获奖率高;学而思课程标准化,利于打基础;极客晨星线上灵活,便于入门;有道小图灵算法专业,适合专项提升;小码王线上线下结合,体验均衡。家长应依据孩子基础、目标与习惯,选择最契合的机构。
选择少儿编程机构需结合孩子年龄、兴趣与家庭规划。不同机构各有侧重:如编程猫趣味启蒙,核桃编程性价比高,西瓜创客重实践,童程童美覆盖全年龄段,傲梦提供一对一辅导。家长应关注思维培养,细查退费政策,根据孩子认知阶段选择,并通过试听课做出合适决定。
随着AI编程工具的发展,普通人可通过自然语言描述创建应用或小部件,满足个性化需求。谷歌和苹果等公司正降低开发门槛,让用户能快速生成个人应用或自动化指令。这些功能虽非革命性,却使手机更贴合个人习惯,标志着移动端个性化进入新阶段。
在当今软件开发领域,一种名为“Vibe coding”(氛围编码)的创新范式正迅速崛起。它并非旨在颠覆传统的编程思维,而是致力于消除创意构思与最终实现之间的技术隔阂。简而言之,这是一种基于自然语言描述和直觉驱动的开发模式。其核心优势在于,无论是专业开发者还是业务人员,都能通过向大型语言模型清晰阐述业
热门专题
热门推荐
在《和平精英》的激烈对决中,手雷不仅是范围杀伤武器,更是扭转战局、攻破敌阵的核心战术道具。许多玩家都曾遇到过手雷扔不准、错失良机的困扰。其实,游戏内自带了一个能极大提升投掷命中率的实用功能——丢雷轨迹线。这项功能无需在外部设置菜单中预先开启,其所有操作都集成在实战投掷界面中,关键在于对局时的灵活调用
2026年5月29日至6月2日,全球肿瘤学界的年度盛典——美国临床肿瘤学会(ASCO)年会将于芝加哥隆重举行。作为肿瘤领域最具影响力的国际学术会议,ASCO年会始终是前沿科研突破的风向标和临床治疗理念的策源地。本届大会,中国创新力量的表现格外引人瞩目:由中国学者主导并入选口头报告、快速口头报告等核心
EverMail AI是什么 在邮件营销的实际工作中,营销人员常常面临两难选择:使用模板群发效率高但缺乏个性,手动撰写又耗时耗力。如何实现大规模个性化沟通,是提升转化率的关键。EverMail AI正是为解决这一核心痛点而生的智能解决方案。 简单来说,EverMail AI是一款基于人工智能技术的电
OKX欧易:全球领先的数字资产服务平台 在数字资产的世界里,选择一个可靠、功能全面的交易平台,无疑是开启旅程的第一步。OKX欧易,正是这样一个备受全球用户信赖的数字资产服务平台。它集成了比特币(BTC)、以太坊(ETH)、狗狗币(DOGE)等主流数字资产的交易服务,凭借其强大的功能、清晰友好的用户界
《和平精英》全新推出的“奥特精英和平蛋”活动,已成为近期玩家热议的焦点。该活动为玩家提供了一个获取“荣耀勋章”的全新途径,而勋章正是抽取奥特曼主题限定奖励的关键道具。奖池内包含终极赛罗飞行器、多款人气角色套装及枪械皮肤等珍稀物品,对于奥特曼系列爱好者与皮肤收藏家来说,这是一次极具吸引力的机会。 奥特





