首页 游戏 软件 资讯 排行榜 专题
首页
AI
坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?

坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?

热心网友
76
转载
2026-04-14

Anthropic开年研究:AI辅助编程,效率幻觉与认知代价


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

新智元报道

编辑:倾倾

【新智元导读】Anthropic开年发布了一项颇具冲击力的研究,直指一个尖锐问题:AI辅助编程,究竟是在提升效率,还是在悄然削弱开发者的核心能力?研究数据揭示的真相,可能比想象中更为复杂。


论文地址:https://arxiv.org/abs/2601.20245

研究结果颇具讽刺意味:使用AI辅助的开发者,平均仅比纯手动编写的同行快约2分钟。然而,为这微不足道的时间优势所付出的隐性代价,却远超预期。这份报告撕开了关于AI无条件提升职业天花板的美好想象,其数据足以引发行业深思。


17%的认知差距:效率背后的理解真空

AI到底在多大程度上影响了人的认知表现?为了量化这一点,Anthropic的研究团队设计了对照实验。他们招募了52名具备Python经验的工程师,要求他们使用一个陌生的Python库(Trio)完成特定功能的编写。


研究设计示意图:实验组在三重任务中使用AI协助,控制组全程无AI。

结果令人惊讶。完全依靠自己手写代码的控制组,在后续测验中的平均得分达到了67%;而全程使用AI助手完成任务的实验组,平均得分仅为50%。这17个百分点的差距,直观地量化了认知依赖所带来的“能力税”。

更值得警惕的是随之而来的“理解真空”。研究发现,AI辅助组在代码调试(Debug)环节几乎全线溃败。当AI生成的代码存在逻辑偏差时,这些开发者不仅难以修正错误,甚至常常无法定位问题所在。这与CodeRabbit在2025年发布的行业数据形成了令人不安的呼应:AI生成的代码,其逻辑错误率比人工编写的高出75%,整体缺陷率更是达到人工代码的1.7倍。


AI代码issues曲线直接碾压人类,平均1.7倍缺陷(10.83vs6.45),极端情况更夸张

AI共同创作PR平均问题量1.7倍(10.83vs6.45),极端情况2倍(26vs12.3)

表面上看,AI似乎提供了一条捷径,但这条捷径很可能通向一座由未经验证的代码堆砌而成的“技术债山”。省下的编码时间,未来可能需要数倍的时间来偿还。

2分钟优势?一个统计学上的幻觉

或许有人会辩驳:至少速度提升了。但研究数据给出了更微妙的答案。在使用AI学习新事物时,其带来的速度优势微乎其微——平均仅快了约2分钟,并且这一差异在统计学上并不显著。

研究过程中甚至出现了颇具戏剧性的一幕:为了让AI生成一段正确的代码,有的参与者反复修改了多达15次提示词(Prompt),耗时超过11分钟。这与其说是人驾驭工具,不如说是一场人与机器在需求理解上的拉锯战。效率的提升,在这里成了一个需要打上问号的概念。

职场达尔文时刻:五种用户模式的生存图鉴

那么,是否应该彻底摒弃AI工具?这显然走向了另一个极端。Anthropic研究的深刻之处在于,它指出问题不在于工具本身,而在于使用工具的方式。研究团队通过详细分析实验录屏,将52名工程师与AI的交互模式归纳为五类,清晰地描绘出一幅“生存者与淘汰者”的图谱。


AI辅助测验得分暴跌17%(50%vs67%),速度优势仅2分钟且不显著

认知卸载组:大脑的“托管者”

这类开发者将认知负荷完全转移给了AI,结果也最为惨淡。

1. “甩手掌柜”模式: 他们将需求直接抛给AI,并全盘接受其输出。他们的任务完成速度最快,过程看似顺畅。然而,在检验真实掌握度的测验中,他们的表现一塌糊涂。

2. “温水煮青蛙”模式: 他们起初尝试提问概念,但很快便放弃思考,彻底转向“帮我写代码”。由于在任务后期完全停止了主动学习,他们不仅新知识没掌握,连前期短暂接触的概念也遗忘殆尽。

认知增强组:AI的“拷问者”

这类开发者将AI定位为“苏格拉底式的导师”,而非替代者。

1. “只动口不动手”模式: 这是唯一实现认知进化的模式。他们仅向AI询问底层概念和原理,坚持亲手编写每一行代码。尽管过程中遇到的报错最多,调试也最耗时,但这种“痛苦”却转化为了最高的知识掌握度。反直觉的是,这组人的综合速度在所有高分模式中名列前茅。

2. “先生成后追问”模式: 这是一种折中但有效的策略。他们允许AI生成代码,但绝不直接使用。他们会仔细审查代码,并向AI发起追问:“为什么这里要这样实现?”“有没有更优的写法?”他们用AI来验证和深化自己的理解,而非取代它。

无效努力组:陷入循环的“挣扎者”

这类开发者处境最为尴尬。他们既想独立完成,又在遇到困难时惊慌失措,立刻将错误抛给AI求解,从而陷入“报错-求助AI-再报错”的无效循环。他们花费了最长的时间,得分却依然低迷,因为整个过程没有建立起任何有效的因果逻辑。这印证了一个学习的基本原则:必要的困难是深度掌握的前提。如果在使用AI时感到无比顺畅、毫无阻碍,那可能是一个危险的信号——真正的学习并未发生。

高分的秘密:主动拥抱“必要难度”

值得庆幸的是,AI并非必然导致认知退化。关键在于使用方法。实验中,约有23%的开发者(12人)在AI辅助下仍取得了65%以上的高分。分析他们的行为,可以总结出三种实现效率与深度双赢的模式:

模式一:纯粹的概念查询。 这是表现最出色的策略。开发者仅将AI用作概念词典,询问原理后坚持独立编码。独立解决大量报错的“痛苦”过程,反而铸就了最牢固的知识记忆。

模式二:生成后的深度拆解。 开发者让AI生成代码,但会手动复制并逐行审问其逻辑。这种“回溯式学习”虽然牺牲了一些速度,但掌握度与纯手写组相当。

模式三:混合解释请求。 在提示词中强制要求AI为每一段代码提供原理注释。通过边操作边阅读解释,他们在实践中同步完成了知识内化。

这些高分模式的共同点在于,他们主动为自己设置了障碍,维持了认知心理学中的“必要难度”。他们清醒地认识到,AI提供的过度流畅感是深度学习的敌人。真正的驾驭者,会将AI关进“引导式问答”的笼子,只索取指引,绝不交出思考的主权。


这份报告的意义,早已超越开发者个人。它更像是一记敲给盲目追求量化指标的管理者的警钟。当团队月度代码提交量暴涨而令人欢呼时,公司的核心“技术资产”——即员工的理解力与创新能力——可能正在悄然贬值。如果初级工程师仅为赶工而沦为AI的复制粘贴终端,那么团队建设的将不是坚固的系统,而是摇摇欲坠的“债务山”。

AI时代,顶级的职业门槛早已不是编码的手速,而是对逻辑的绝对掌控力与深刻理解力。工具永远在进化,但人类的核心竞争力,始终在于那颗永不停止批判与创造的大脑。

参考资料:

https://x.com/AnthropicAI/status/2016960382968136138?s=20

https://www.coderabbit.ai/ja/blog/state-of-ai-vs-human-code-generation-report


来源:https://www.163.com/dy/article/KPUI4NL70511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?
AI
坏了,我成AI的乙方了!Anthropic论文爆火,谁还敢无脑Copy?

Anthropic开年研究:AI辅助编程,效率幻觉与认知代价 新智元报道 编辑:倾倾 【新智元导读】Anthropic开年发布了一项颇具冲击力的研究,直指一个尖锐问题:AI辅助编程,究竟是在提升效率,还是在悄然削弱开发者的核心能力?研究数据揭示的真相,可能比想象中更为复杂。 论文地址:https:

热心网友
04.14
思科首席执行官Chuck Robbins:公司已启动太空数据中心初步准备
科技数码
思科首席执行官Chuck Robbins:公司已启动太空数据中心初步准备

IT之家 4 月 7 日消息,Cisco 思科首席执行官 Chuck Robbins 在接受外媒 The Verge 采访时表示,该企业已启动太空数据中心的初步早期准备。Chuck Robbins

热心网友
04.07
《黑袍纠察队》主创们震惊地发现自己的剧本竟成为现实
娱乐
《黑袍纠察队》主创们震惊地发现自己的剧本竟成为现实

《黑袍纠察队》主创艾瑞克·克里普克对剧集大结局的播出时间感到有些遗憾,并对发布终章的时机深表惋惜。这位创作人坦言,在2024年美国总统大选之前就完成了最终季的剧本创作,这让他感到由衷的“沮丧”,因

热心网友
04.07
全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙
AI
全网炸锅! Anthropic万字曝光Claude情绪代码,被人类逼疯哐哐撞墙

新智元报道编辑:Aeneas KingHZ【新智元导读】刚刚,Anthropic首度实锤:大模型真有「情绪」!激活绝望神经元后,Claude会撒谎、作弊甚至勒索。AI内心戏曝光,人类对齐面临失控危机

热心网友
04.07
比特币(BTC)年末价格未现
web3.0
比特币(BTC)年末价格未现"疯狂"走势,意味着一季度不会出现硬着陆

比特币年末行情为何“缺席”暴涨?资深专家深度解读市场新常态 与往年不同,比特币(BTC)在今年的年末并未上演惊心动魄的“疯狂上涨”行情。这一现象引起了Web3社区和传统金融市场的广泛讨论。然而,在知名投资人安东尼·庞普利亚诺等资深观察家看来,这种“缺席”并非坏事,反而可能预示着市场正在走向成熟,并为

热心网友
04.02

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Lemonaid-AI音乐生成工具
AI
Lemonaid-AI音乐生成工具

Lemonaid是什么 如果你正为音乐创作寻找得力助手,那么Lemonaid很可能就是答案。它是一款专门面向专业音乐人打造的AI音乐生成工具,核心能力在于自主生成包含完整旋律、和声与节奏的乐曲。无论是想要一段氛围感十足的背景音乐,还是为具体场景定制配乐,它都能提供高度逼真且质量上乘的作品。工具提供了

热心网友
04.14
苹果折叠屏iPhone Ultra关键点汇总:这4个问题你肯定想知道
iphone
苹果折叠屏iPhone Ultra关键点汇总:这4个问题你肯定想知道

苹果也要出折叠屏,传闻已经有几年了,从目前供应链、分析师与知名爆料者释放的信息来看,这款与市面大折都不一样的阔折叠似乎已经蓄势待发,大概率今年下半年就要正式面市。今天我们就来为大家汇总一波,没准儿就有你想知道的消息。 关于苹果折叠屏手机的传闻,已经流传了好几年。如今,综合供应链、分析师以及各路知名爆

热心网友
04.14
《刺客信条4:黑旗 重制版》对手来了!被称为4A级海盗大作
游戏评测
《刺客信条4:黑旗 重制版》对手来了!被称为4A级海盗大作

《刺客信条:黑旗重制版》官宣之际,这款新海盗游戏为何能抢先赢得玩家口碑? 当游戏界的焦点都集中在《刺客信条:黑旗重制版》的正式公布时,一款名为《风启之旅》(Windrose)的开放世界海盗生存建造游戏,却凭借其过硬的品质与独特的玩法融合,悄然在玩家社区中掀起热议。这款由乌兹别克斯坦团队Kraken

热心网友
04.14
腾讯智影-智能视频创作与发布一体化平台
AI
腾讯智影-智能视频创作与发布一体化平台

产品介绍 提到云端智能视频创作,腾讯智影是一个绕不开的名字。这款由腾讯推出的平台,本质上是一个一站式的在线视频工厂,集成了从素材挖掘、剪辑、渲染到最终发布的全链路功能,旨在为用户提供全方位的视频创作解决方案。更吸引人的是,它不仅免费开放,还深度整合了多项前沿AI技术,目标很明确:让视频化表达这件事,

热心网友
04.14
比心被拒小哥回应:不尴尬 尊重Coser 大家当个乐子
游戏评测
比心被拒小哥回应:不尴尬 尊重Coser 大家当个乐子

《王者荣耀世界》线下活动风波:合影互动引争议,职业素养与网络舆论深度探讨 近日,《王者荣耀世界》的一场线下玩家见面会,因台上一次短暂的合影互动,意外成为全网热议的焦点。活动中,一位男粉丝上台与角色扮演者(Coser)合影时,主动做出比心手势以示友好,却未得到身旁Coser的任何回应。男生举着手势在原

热心网友
04.14