首页 游戏 软件 资讯 排行榜 专题
首页
AI
Vibe Coding:程序员如何边玩边写代码?

Vibe Coding:程序员如何边玩边写代码?

热心网友
43
转载
2026-02-20


当大脑不再负重,技术肌肉就开始萎缩。


作者|Moonshot

编辑|靖宇

「自然语言就是新的编程语言。」这句话在过去一年里被无数人奉为圭臬。

特斯拉前 AI 总监 Andrej Karpathy 带火的 「Vibe Coding」(氛围编程)更是让这种狂热达到了顶峰——你不需要懂语法,不需要管实现,只要对着 AI 喊出需求,然后 Check 一下感觉(Vibe)对不对就行了。

听起来,程序员的门槛似乎要被抹平了。

但就在上周,大模型领域的「优等生」、Claude(也是最受欢迎的 Vibe Coding 模型之一)的母公司 Anthropic 居然自己跳出来,给这股热潮泼了一盆冰水。


图源:arxiv

他们发了一篇题为《AI 如何影响技能形成》的硬核论文,告诉我们一个残酷的真相:如果你在学习新东西时过度依赖 AI,你不仅不会变快,你的核心能力还会出现显著退化。

甚至,你可能正在变成一个「半废」的工程师。

01

人是轻松了,脑子也废了

Anthropic 的研究员这次很较真,他们找来 50 多位有经验的 Python 程序员,搞了一场「闭卷考试」。

考题是让大家去学一个从来没用过的冷门 Python 库:Trio,来完成一系列异步编程任务。这完美模拟了程序员在工作中经常遇到的场景:老板突然让你用一个你没见过的工具/框架去解决问题。

程序员被分成了两组:

「手动组」: 只能看最新文档,用 Google 搜索,严禁使用 AI。

「AI 组」: 配备了一个基于 GPT-4o 的强大 AI 助手,可以随时提问、让它写代码、修 Bug。

任务结束后,所有人都参加了一场原本用于检验「学习成果」的考试。

考试内容包括编程语法、对代码逻辑的理解、阅读代码的能力,以及调试(Debugging)能力。

大家的第一反应肯定是:AI 组肯定秒杀「土法炼钢」组吧?毕竟这可是 GPT-4o 级别的辅助。

但实验结果出来后,所有人都沉默了。


无 AI 组问答得分普遍高于 AI 辅助组|图源:Anthropic

最明显的结果是:成绩不好。数据显示,使用了 AI 的那组人,考试得分平均比手写组低了 17%。

论文中特别提到,分差最大的领域在于调试(Debug)。

这并不意外,毕竟 Vibe Coding 最大的弊端就在于,用户不知道那堆代码是怎么跑起来的,排查和调试都无从下手。

「好吧,我承认我变菜了,但我至少变快了啊!」这可能是很多 Vibe Coding 爱好者的最后防线。

很遗憾,Anthropic 的数据再次打脸。报告显示,在完成任务的总耗时上,AI 组和手动组在统计学上没有显著差异:AI 组平均 23 分钟,手动组平均 24.7 分钟。

为什么会这样?我们不是有 AI 加持吗?论文指出了一个被忽视的时间成本:

「交互税」。

有些程序员为了让 AI 写出完美的代码,花了大量时间在「写提示词」上。数据显示,有人甚至花了 11 分钟在跟 AI 聊天,或者在一项 35 分钟的任务里,花了 30% 的时间在构思怎么问问题。


「时价比」不高,花费的时间并没有转换成得分|图源:Anthropic

再结合上 Vibe Coding 最短的短板——Debug 困难。AI 组很容易陷入试错式调试(Iterative Debugging) 的循环:AI 生成代码-报错了-把报错丢给 AI:「解决一下这个 bug」-AI 再生成-又报错了……

最后整个工程变成了不可逆转的「屎山黑箱」(「屎山代码」指一种混乱、难以理解和维护的代码状态,「黑箱」则指不知道内部结构的系统)。

在这个过程中,时间一分一秒流逝,而程序员的大脑处于一种「挂机等结果」状态,既没有节省时间,也没有学到东西。

到这儿你可能对 Vibe Coding 祛魅了?别急,这篇论文最精彩的部分,在于它通过录屏分析,把使用 AI 的程序员分成了六种流派。

研究员发现,虽然 AI 组平均分低,但组内方差极大。

有的人「废」了,有的人却「超神」了。区别全在于怎么用 AI。

02

代码没编好,

用户画像倒是有了

第一类用户都可以归为「AI 废人」的低分低能组,考试得分极其惨烈,平均分都在 40% 以下(不及格)。

这一大类里还能细分为三个小类,分别是:

甩手掌柜型 (AI Delegation):直接把题目复制给 AI,「帮我写个函数解决这个问题」,然后 Ctrl+C / Ctrl+V,直接交卷。他们任务完成速度确实最快(平均 19.5 分钟),但学到的东西几乎为零,我奶奶来做都能行。

半途而废型 (Progressive AI Reliance):刚开始还想自己试试,写了两行发现报错,心态崩了:「算了,AI 你来吧。」然后彻底躺平。

盲目试错型 (Iterative AI Debugging):这是最典型的「无脑 Vibe」。遇到 Bug 不看回溯,直接把报错扔给 AI。AI 给出的代码看都不看就运行,不对再扔。这是也是最惨的一群人。浪费了大量时间后拿了个低分,完全成了 AI 的「人肉测试员」。

第二类用户就乐观多了,虽然用了 AI,但考试成绩甚至能和手写组持平(65% - 86%),寻找到了人机共生的解决方案。


拿 AI 作「辅助驾驶」的三类人得分更高|图源:Anthropic

这一大类里也能细分为三个小类:

打破砂锅型 (Conceptual Inquiry):他们几乎不让 AI 写代码。 他们只问概念:「为什么要用 await?」「这是什么原理?」搞懂了原理,再自己手写。这是真正的「把 AI 当导师」,而不是当实习生,而且这种 Vibe Coding 也得需要用户真的「懂行」、「会问」。

先斩后奏型 (Generation-Then-Comprehension):让 AI 写代码,但在复制粘贴之前,他们会追问:「解释一下这行代码为什么这么写?」这么一句,就能让 AI 先自审一遍,自己也能看到 AI 的编程思路,把 AI 的输出转化为了自己的知识。

混合双打型 (Hybrid Code-Explanation):融合了上面两个类型的特点,会写「请写出代码,并解释每一步的逻辑。」这种提示词,强制 AI 输出推理思维链,让自己跟上 AI 的思路,也便于去 Debug。

为什么用的是同一个 AI,人和人的差距这么大?

或许并不是 AI 废掉了程序员,而是我们自己在「偷懒」的诱惑面前,主动选择了缴械投降。

03

Vibe Coding 的代价是

Anthropic 的这篇报告,其实触及了一个心理学概念:

认知卸载(Cognitive Offloading)。

即当工具足够强大时,我们会下意识地把原本需要大脑处理的计算、记忆、逻辑推演任务,「卸载」给工具,就像自动驾驶一样。

在 AI 时代,我们正在把「理解力」卸载给大模型。

论文里用了个比喻:AI 就像一副「外骨骼」,当你穿着它时,你力大无穷,能搬起千斤重。但问题在于,肌肉的生长需要负重和撕裂,如果你长期穿着它不脱下来,你的肌肉就会因为缺乏刺激而萎缩。


研究认为,过度依赖 AI 会直接跳过思考过程|图源:Anthropic

这篇论文中有一个非常不起眼、但细思极恐的数据:报错数量。

手动组在做任务时,平均每人遇到了 3 次报错。所以他们被迫停下来,盯着红色的报错信息,去查文档、去思考「为什么类型不匹配」、「为什么线程没挂起」。

而 AI 组平均每人只遇到了 1 次报错,大多数时候,AI 给出的代码不仅能跑,而且跑得极其顺滑。


AI 组的报错显著少于无 AI 组|图源:Anthropic

这听起来是 AI 的优点?不,Anthropic 的研究员指出,这恰恰是问题的根源。

论文明确写道:「遭遇并独立解决错误,是技能形成的关键一环。」

手动组之所以学得好,是因为他们经历了「摩擦」。每一次报错,都是现实世界给思维的一次「阻力」。正是为了克服这种阻力,大脑被迫建立了深刻的心理表征(认知心理学术语,指当外部信息进入人脑之后,它会被我们的大脑加工,以一种特别的结构储存在大脑中)。

而 AI 组的体验就太「平滑」了。但代价是,你失去了对地面的「抓地力」:脱下外骨骼,路都不会走了。

这种「AI 过于平滑」的通病,不仅仅存在于编程中,正在蔓延到我们生活的方方面面。

在编程里,它消除了 Debug 的痛苦,让你误以为自己掌控了系统;在创作里,它消除了构思的枯燥,让你误以为自己拥有了创意;在人际关系里,它甚至也在消除「摩擦」。

就像很多 AI 成瘾的问题,都源自于 AI 永远情绪稳定,永远秒回,永远顺着你的话说,这种极致的「平滑关系」,何尝不是一种 Vibe Social。

04

「我行我上」的幻觉

Vibe Coding 最迷人也最危险的地方,在于它制造了一种「快乐但无知」 (Happy but Ignorant) 的幻觉。

论文中提到了参与者们微妙的心理变化:AI 组的参与者普遍觉得任务「更容易」,「手动组」则觉得任务很难,过程很痛苦。

但反转来得很干脆:那些觉得「容易」的人,在随后的测试中一塌糊涂;而那些觉得「困难」的人,虽然过程煎熬,但自我报告的「学习和成长感」 却更高,分数也更高。

所以Vibe Coding 让你在写代码的过程中感觉自己是个天才,直到代码报错的那一刻,你才发现自己只是个「睁眼瞎」。

在面对「未知」时,AI 是公平的,它会平等地「废掉」每一个试图偷懒的大脑,无论这个大脑曾经多么睿智。

研究人员按照编程经验将参与者分成了三层:1-3 年、4-6 年、7 年以上。

结果数据显示,在所有经验层级中,不使用 AI 的组,考试得分都高于使用 AI 的组。


哪怕是资深工程师,在 AI 辅助下得分也低于无 AI 组|图源:Anthropic

这意味着,即使你是入行 7 年以上的老鸟,在面对一个全新的技术领域时,如果过度依赖 AI,你的学习效果依然会大打折扣。

当然了,Anthropic 的这篇论文也不是让我们因噎废食,退回到手写代码的时代。

它更像是一份「AI 时代生存指南」。想要不被 AI「废掉」,我们需要改变使用习惯,从报告中的「高分高能组」那里取经:

比如多问「为什么」,少说「帮我做」;哪怕是 AI 生成的代码,也要像审视同事的代码一样,逐行阅读,理解代码逻辑;珍视 Debug 的机会,下次遇到 Bug,试着先自己分析 5 分钟,而不是 5 秒钟后就截图发给 ChatGPT。

AI 确实能让我们跑得更快,但前提是,你得知道路在哪里,以及车坏了该怎么修。

毕竟,当自动驾驶失效的时候,只有那个还没忘记怎么握方向盘的人,才能救全车人的命。

*头图来源:Deeplearning AI Community

来源:https://www.163.com/dy/article/KM7EPJ9H05119FMA.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

雷科技到底是谁?!!!悟空给出的答案,太抓人了!
科技数码
雷科技到底是谁?!!!悟空给出的答案,太抓人了!

从零到一:用AI生成一份专业的媒体影响力报告 但凡在内容或运营团队待过的人,大概都对制作《媒体影响力报告》这类活儿记忆犹新。那过程,堪称一场跨部门接力赛:运营同事得先从各个平台后台手动扒拉数据,计算阅读量、粉丝增长和互动率;拿到一堆冰冷数字后,还得拉着账号负责人反复琢磨定位和文案;最后,抱着半成品火

热心网友
05.01
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机
科技数码
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机

封面新闻记者 邹阿江 图由航空工业成飞提供 2026年“五一”国际劳动节前夕,航空工业成飞的技术专家聂海平,荣获了一枚全国五一劳动奖章。 消息传来,身边同事都说,“大师”拿奖是实至名归。可聂海平自己呢,还是那副老样子——摆摆手,说自己不过是个普通人,幸运地站在一个好平台上,干着点自己感兴趣的事儿罢了

热心网友
05.01
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀
业界动态
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀

编辑 | 王凤枝 “AI时代,每天干3个小时就足够了。” 这句话出自前亚马逊资深工程师、技术大牛史蒂夫·雅吉(Steve Yegge)之口,算得上是对当前AI狂热的一剂清醒剂。 当整个行业都在为“10倍提效”而欢呼雀跃时,雅吉却点出了一个被普遍忽视的代价:在AI的高强度辅助下,程序员的产出固然爆炸式

热心网友
04.22
你的代码为什么又长又乱?可能是函数没用好
业界动态
你的代码为什么又长又乱?可能是函数没用好

一、概述 每天重复相同的操作,是不是感觉有点枯燥?比如,你每天都要煮饭,得经历洗米、加水、按下煮饭键这三步。如果每次都要从头到尾念叨一遍这个过程,那可就太费劲了。 别担心,函数就是来拯救你的。在Python的世界里,函数就像一个“一键煮饭”的智能按钮。你只需要把那些重复的步骤打包成一个固定的“命令”

热心网友
04.22
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定
业界动态
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定

吃透Pandas两大“数据汇总神器”:透视表与交叉表实战指南 在数据处理的工具箱里,如果说基础的清洗、筛选是基本功,那么多维度、交叉式的数据汇总,往往就是区分新手与熟手的分水岭。面对诸如“按地区加品类统计销售额”、“分析不同省份的商品订单分布”这类需求,如果还停留在手动分组、多层循环的老路上,不仅代

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

免费在线OCR工具TextIn使用指南与功能详解
AI
免费在线OCR工具TextIn使用指南与功能详解

在文档数字化与智能处理领域,一款高效精准的在线工具能极大提升工作效率。今天重点评测的TextIn Tools,正是这样一个集OCR识别、格式转换于一体的全能型免费平台。它由上海合合信息科技开发,该公司在人工智能文字识别领域拥有超过17年的技术积累,实力深厚。我们熟悉的“扫描全能王”、“名片全能王”等

热心网友
05.19
AI在线PPT美化工具 智能优化演示文稿设计
AI
AI在线PPT美化工具 智能优化演示文稿设计

还在为制作PPT而烦恼吗?排版耗时、素材难寻、风格杂乱……这些常见困扰,或许一个智能工具就能高效化解。 WPS智能PPT,是一款基于先进人工智能技术的在线演示文稿辅助平台。其核心优势在于:用户仅需输入文本内容,内置的AI引擎便能自动进行视觉设计与美化,快速生成多种风格的精美版式供您挑选。这极大地简化

热心网友
05.19
超办AI平台:集成主流大模型的一站式解决方案
AI
超办AI平台:集成主流大模型的一站式解决方案

在追求高效办公的今天,各类AI工具不断涌现,但能够真正实现“一站式”智能集成的平台却屈指可数。本文将深入介绍的“超办AI”,正是这样一个致力于将多种AI能力深度融合,直接赋能日常工作效率的集成化平台。 超办AI是什么?一站式AI办公平台详解 简而言之,超办AI是一个智能办公解决方案平台。其核心理念非

热心网友
05.19
论文关键词如何激发学术灵感与创新思路
AI
论文关键词如何激发学术灵感与创新思路

学术灵感:AI驱动的中文论文写作辅助工具全解析 在科研写作过程中,从选题构思到初稿完成,研究者往往需要投入大量时间与精力。是否存在一种高效工具,能够在研究起点——即灵感激发与论文框架构建阶段——提供实质性帮助?本文将深入探讨的“学术灵感”平台,正是这样一款专注于中文论文写作场景的AI智能助手,旨在提

热心网友
05.19
造物云AI在线3D营销设计平台:一站式创意解决方案
AI
造物云AI在线3D营销设计平台:一站式创意解决方案

在视觉营销主导的数字化时代,一个名为“造物云”的在线3D营销设计平台正在重塑内容生产的规则。它本质上是一个基于浏览器的云端设计工具,其核心价值在于,让用户无需依赖复杂的专业软件或高昂的硬件,就能独立创作出具有商业摄影品质的3D渲染图片和动态视频。这为品牌营销、电商展示和社交媒体内容创作开辟了高效的新

热心网友
05.19