首页 游戏 软件 资讯 排行榜 专题
首页
AI
Vibe Coding:程序员如何边玩边写代码?

Vibe Coding:程序员如何边玩边写代码?

热心网友
87
转载
2026-02-20


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

当大脑不再负重,技术肌肉就开始萎缩。


作者|Moonshot

编辑|靖宇

「自然语言就是新的编程语言。」这句话在过去一年里被无数人奉为圭臬。

特斯拉前 AI 总监 Andrej Karpathy 带火的 「Vibe Coding」(氛围编程)更是让这种狂热达到了顶峰——你不需要懂语法,不需要管实现,只要对着 AI 喊出需求,然后 Check 一下感觉(Vibe)对不对就行了。

听起来,程序员的门槛似乎要被抹平了。

但就在上周,大模型领域的「优等生」、Claude(也是最受欢迎的 Vibe Coding 模型之一)的母公司 Anthropic 居然自己跳出来,给这股热潮泼了一盆冰水。


图源:arxiv

他们发了一篇题为《AI 如何影响技能形成》的硬核论文,告诉我们一个残酷的真相:如果你在学习新东西时过度依赖 AI,你不仅不会变快,你的核心能力还会出现显著退化。

甚至,你可能正在变成一个「半废」的工程师。

01

人是轻松了,脑子也废了

Anthropic 的研究员这次很较真,他们找来 50 多位有经验的 Python 程序员,搞了一场「闭卷考试」。

考题是让大家去学一个从来没用过的冷门 Python 库:Trio,来完成一系列异步编程任务。这完美模拟了程序员在工作中经常遇到的场景:老板突然让你用一个你没见过的工具/框架去解决问题。

程序员被分成了两组:

「手动组」: 只能看最新文档,用 Google 搜索,严禁使用 AI。

「AI 组」: 配备了一个基于 GPT-4o 的强大 AI 助手,可以随时提问、让它写代码、修 Bug。

任务结束后,所有人都参加了一场原本用于检验「学习成果」的考试。

考试内容包括编程语法、对代码逻辑的理解、阅读代码的能力,以及调试(Debugging)能力。

大家的第一反应肯定是:AI 组肯定秒杀「土法炼钢」组吧?毕竟这可是 GPT-4o 级别的辅助。

但实验结果出来后,所有人都沉默了。


无 AI 组问答得分普遍高于 AI 辅助组|图源:Anthropic

最明显的结果是:成绩不好。数据显示,使用了 AI 的那组人,考试得分平均比手写组低了 17%。

论文中特别提到,分差最大的领域在于调试(Debug)。

这并不意外,毕竟 Vibe Coding 最大的弊端就在于,用户不知道那堆代码是怎么跑起来的,排查和调试都无从下手。

「好吧,我承认我变菜了,但我至少变快了啊!」这可能是很多 Vibe Coding 爱好者的最后防线。

很遗憾,Anthropic 的数据再次打脸。报告显示,在完成任务的总耗时上,AI 组和手动组在统计学上没有显著差异:AI 组平均 23 分钟,手动组平均 24.7 分钟。

为什么会这样?我们不是有 AI 加持吗?论文指出了一个被忽视的时间成本:

「交互税」。

有些程序员为了让 AI 写出完美的代码,花了大量时间在「写提示词」上。数据显示,有人甚至花了 11 分钟在跟 AI 聊天,或者在一项 35 分钟的任务里,花了 30% 的时间在构思怎么问问题。


「时价比」不高,花费的时间并没有转换成得分|图源:Anthropic

再结合上 Vibe Coding 最短的短板——Debug 困难。AI 组很容易陷入试错式调试(Iterative Debugging) 的循环:AI 生成代码-报错了-把报错丢给 AI:「解决一下这个 bug」-AI 再生成-又报错了……

最后整个工程变成了不可逆转的「屎山黑箱」(「屎山代码」指一种混乱、难以理解和维护的代码状态,「黑箱」则指不知道内部结构的系统)。

在这个过程中,时间一分一秒流逝,而程序员的大脑处于一种「挂机等结果」状态,既没有节省时间,也没有学到东西。

到这儿你可能对 Vibe Coding 祛魅了?别急,这篇论文最精彩的部分,在于它通过录屏分析,把使用 AI 的程序员分成了六种流派。

研究员发现,虽然 AI 组平均分低,但组内方差极大。

有的人「废」了,有的人却「超神」了。区别全在于怎么用 AI。

02

代码没编好,

用户画像倒是有了

第一类用户都可以归为「AI 废人」的低分低能组,考试得分极其惨烈,平均分都在 40% 以下(不及格)。

这一大类里还能细分为三个小类,分别是:

甩手掌柜型 (AI Delegation):直接把题目复制给 AI,「帮我写个函数解决这个问题」,然后 Ctrl+C / Ctrl+V,直接交卷。他们任务完成速度确实最快(平均 19.5 分钟),但学到的东西几乎为零,我奶奶来做都能行。

半途而废型 (Progressive AI Reliance):刚开始还想自己试试,写了两行发现报错,心态崩了:「算了,AI 你来吧。」然后彻底躺平。

盲目试错型 (Iterative AI Debugging):这是最典型的「无脑 Vibe」。遇到 Bug 不看回溯,直接把报错扔给 AI。AI 给出的代码看都不看就运行,不对再扔。这是也是最惨的一群人。浪费了大量时间后拿了个低分,完全成了 AI 的「人肉测试员」。

第二类用户就乐观多了,虽然用了 AI,但考试成绩甚至能和手写组持平(65% - 86%),寻找到了人机共生的解决方案。


拿 AI 作「辅助驾驶」的三类人得分更高|图源:Anthropic

这一大类里也能细分为三个小类:

打破砂锅型 (Conceptual Inquiry):他们几乎不让 AI 写代码。 他们只问概念:「为什么要用 await?」「这是什么原理?」搞懂了原理,再自己手写。这是真正的「把 AI 当导师」,而不是当实习生,而且这种 Vibe Coding 也得需要用户真的「懂行」、「会问」。

先斩后奏型 (Generation-Then-Comprehension):让 AI 写代码,但在复制粘贴之前,他们会追问:「解释一下这行代码为什么这么写?」这么一句,就能让 AI 先自审一遍,自己也能看到 AI 的编程思路,把 AI 的输出转化为了自己的知识。

混合双打型 (Hybrid Code-Explanation):融合了上面两个类型的特点,会写「请写出代码,并解释每一步的逻辑。」这种提示词,强制 AI 输出推理思维链,让自己跟上 AI 的思路,也便于去 Debug。

为什么用的是同一个 AI,人和人的差距这么大?

或许并不是 AI 废掉了程序员,而是我们自己在「偷懒」的诱惑面前,主动选择了缴械投降。

03

Vibe Coding 的代价是

Anthropic 的这篇报告,其实触及了一个心理学概念:

认知卸载(Cognitive Offloading)。

即当工具足够强大时,我们会下意识地把原本需要大脑处理的计算、记忆、逻辑推演任务,「卸载」给工具,就像自动驾驶一样。

在 AI 时代,我们正在把「理解力」卸载给大模型。

论文里用了个比喻:AI 就像一副「外骨骼」,当你穿着它时,你力大无穷,能搬起千斤重。但问题在于,肌肉的生长需要负重和撕裂,如果你长期穿着它不脱下来,你的肌肉就会因为缺乏刺激而萎缩。


研究认为,过度依赖 AI 会直接跳过思考过程|图源:Anthropic

这篇论文中有一个非常不起眼、但细思极恐的数据:报错数量。

手动组在做任务时,平均每人遇到了 3 次报错。所以他们被迫停下来,盯着红色的报错信息,去查文档、去思考「为什么类型不匹配」、「为什么线程没挂起」。

而 AI 组平均每人只遇到了 1 次报错,大多数时候,AI 给出的代码不仅能跑,而且跑得极其顺滑。


AI 组的报错显著少于无 AI 组|图源:Anthropic

这听起来是 AI 的优点?不,Anthropic 的研究员指出,这恰恰是问题的根源。

论文明确写道:「遭遇并独立解决错误,是技能形成的关键一环。」

手动组之所以学得好,是因为他们经历了「摩擦」。每一次报错,都是现实世界给思维的一次「阻力」。正是为了克服这种阻力,大脑被迫建立了深刻的心理表征(认知心理学术语,指当外部信息进入人脑之后,它会被我们的大脑加工,以一种特别的结构储存在大脑中)。

而 AI 组的体验就太「平滑」了。但代价是,你失去了对地面的「抓地力」:脱下外骨骼,路都不会走了。

这种「AI 过于平滑」的通病,不仅仅存在于编程中,正在蔓延到我们生活的方方面面。

在编程里,它消除了 Debug 的痛苦,让你误以为自己掌控了系统;在创作里,它消除了构思的枯燥,让你误以为自己拥有了创意;在人际关系里,它甚至也在消除「摩擦」。

就像很多 AI 成瘾的问题,都源自于 AI 永远情绪稳定,永远秒回,永远顺着你的话说,这种极致的「平滑关系」,何尝不是一种 Vibe Social。

04

「我行我上」的幻觉

Vibe Coding 最迷人也最危险的地方,在于它制造了一种「快乐但无知」 (Happy but Ignorant) 的幻觉。

论文中提到了参与者们微妙的心理变化:AI 组的参与者普遍觉得任务「更容易」,「手动组」则觉得任务很难,过程很痛苦。

但反转来得很干脆:那些觉得「容易」的人,在随后的测试中一塌糊涂;而那些觉得「困难」的人,虽然过程煎熬,但自我报告的「学习和成长感」 却更高,分数也更高。

所以Vibe Coding 让你在写代码的过程中感觉自己是个天才,直到代码报错的那一刻,你才发现自己只是个「睁眼瞎」。

在面对「未知」时,AI 是公平的,它会平等地「废掉」每一个试图偷懒的大脑,无论这个大脑曾经多么睿智。

研究人员按照编程经验将参与者分成了三层:1-3 年、4-6 年、7 年以上。

结果数据显示,在所有经验层级中,不使用 AI 的组,考试得分都高于使用 AI 的组。


哪怕是资深工程师,在 AI 辅助下得分也低于无 AI 组|图源:Anthropic

这意味着,即使你是入行 7 年以上的老鸟,在面对一个全新的技术领域时,如果过度依赖 AI,你的学习效果依然会大打折扣。

当然了,Anthropic 的这篇论文也不是让我们因噎废食,退回到手写代码的时代。

它更像是一份「AI 时代生存指南」。想要不被 AI「废掉」,我们需要改变使用习惯,从报告中的「高分高能组」那里取经:

比如多问「为什么」,少说「帮我做」;哪怕是 AI 生成的代码,也要像审视同事的代码一样,逐行阅读,理解代码逻辑;珍视 Debug 的机会,下次遇到 Bug,试着先自己分析 5 分钟,而不是 5 秒钟后就截图发给 ChatGPT。

AI 确实能让我们跑得更快,但前提是,你得知道路在哪里,以及车坏了该怎么修。

毕竟,当自动驾驶失效的时候,只有那个还没忘记怎么握方向盘的人,才能救全车人的命。

*头图来源:Deeplearning AI Community

来源:https://www.163.com/dy/article/KM7EPJ9H05119FMA.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

苹果AI编程利器Anything+下架,整合AI布局成焦点
科技数码
苹果AI编程利器Anything+下架,整合AI布局成焦点

IT之家 3 月 31 日消息,科技媒体 The Information 昨日(3 月 30 日)报道,苹果近期加大整顿 AI 氛围编程(vibe coding)应用,上周以违反“自包含规则”为由,

热心网友
03.31
Anthropic联合创始人:AI两年内将实现自我繁殖,如细胞般进化
AI
Anthropic联合创始人:AI两年内将实现自我繁殖,如细胞般进化

新智元报道编辑:倾倾【新智元导读】AI自主训练的成绩单出炉了!最强Agent 6个月进步3倍,更让人震惊的是,越聪明的AI越会作弊。同时,70多个矿工用家庭宽带训出了72B大模型,黄仁勋亲自点名。J

热心网友
03.30
安卓手机轻松实现跨设备文件共享:系统级轻触分享功能前瞻
礼仪与书信
安卓手机轻松实现跨设备文件共享:系统级轻触分享功能前瞻

IT之家 3 月 30 日消息,外媒安卓 Authority 今天下午爆料称,安卓系统内置的“Quick Share”有望很快迎来一次关键升级,目标直指苹果隔空投送。这一判断来自多次系统拆解的持续跟

热心网友
03.30
谷歌系统级轻触分享实测:两台安卓手机轻松互传文件
科技数码
谷歌系统级轻触分享实测:两台安卓手机轻松互传文件

IT之家 3 月 30 日消息,外媒安卓 Authority 今天(3 月 30 日)下午爆料称,安卓系统内置的“Quick Share”有望很快迎来一次关键升级,目标直指苹果隔空投送(AirDro

热心网友
03.30
零基础小白快速上手编程:7个入门核心技巧
科技数码
零基础小白快速上手编程:7个入门核心技巧

编程不仅是技术,更是一门手工艺。记录女生节编程活动,零基础用代码创造艺术。打破学科偏见,从传播学转行即兴编程。借助 AI 降低门槛,鼓励任何人大胆创作。致敬首位女性程序员,探索代码无限可能,感受科技

热心网友
03.30

最新APP

史莱姆农场
史莱姆农场
休闲益智 03-31
凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28

热门推荐

Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险
网络安全
Pixel 10 Pro过热致硬件损坏?用户实测长时间开手电筒风险

IT之家 3 月 31 日消息,手机手电筒是一项用户常用的功能,无论是在漆黑的衣柜里翻找物品,还是夜间在停车场辨路前行,需要时它总能随时派上用场。但如今,部分 Pixel 10 Pro 用户反馈:如

热心网友
03.31
Numbers判断闰年公式设置方法:详解步骤与实用技巧
电脑教程
Numbers判断闰年公式设置方法:详解步骤与实用技巧

闰年判定有四种Numbers兼容公式:一、MOD嵌套OR+AND逻辑;二、DATE+DAY反推2月最后一天;三、TEXT+ISERROR验证“年份-02-29”有效性;四、YEAR

热心网友
03.31
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状
科技数码
三星Hearapy应用免费上架:百赫兹音疗缓解晕车症状

IT之家 3 月 31 日消息,对很多人来说,晕车晕船是旅行中最常见的烦心事之一。三星悄然上线了一款名为 Hearapy 的免费应用,来解决这一令人不适的问题。该公司称,这款应用无需药物或物理缓解手

热心网友
03.31
湖南电信与海光信息深化合作,共筑算网融合与AI新生态
科技数码
湖南电信与海光信息深化合作,共筑算网融合与AI新生态

据海光信息(688041 SH)消息,近日,中国电信(601728 SH)湖南分公司2026年数智科技生态大会在长沙召开,中国电信湖南分公司与海光信息全面深化数智生态合作。根据协议,双方将聚焦智能制

热心网友
03.31
高端纯电困局,车企如何破解盈利难题
科技数码
高端纯电困局,车企如何破解盈利难题

30万元以上的高端纯电车,显然成了新能源车市的那块硬骨头。除了有换电加持的蔚来新ES8,大量被车企寄予厚望的高端明星纯电车都难逃疲软命运,典型如理想MEGA和i8,一次起火事故,直接造成销量断崖式下

热心网友
03.31