游乐游手机版
首页/AI教程/文章详情

Karpathy四项规则根治AI写代码坏毛病,9万星项目

时间:2026-06-04 17:40
先说一个常见场景: 你让 AI 帮你修复一个 Bug,它却顺手把你的整个项目“重构”了一遍;让它添加一段验证逻辑,它给你造了一套完整的配置系统;你明明没提任何抽象层需求,它已经帮你写好了工厂模式。 更让人头疼的是,修改之后的 diff 三屏都看不完,你根本不清楚它到底动了哪些地方。 一位 Andr

先说一个常见场景:

你让 AI 帮你修复一个 Bug,它却顺手把你的整个项目“重构”了一遍;让它添加一段验证逻辑,它给你造了一套完整的配置系统;你明明没提任何抽象层需求,它已经帮你写好了工厂模式。

更让人头疼的是,修改之后的 diff 三屏都看不完,你根本不清楚它到底动了哪些地方。

一位 /Andrej Karpathy/ 用四条规则,把这个问题彻底讲明白了。如果你正在使用 AI 辅助写代码,这篇文章能帮你节省大量 review(审查)时间。从背景、原理、实操到效果,一次性全面梳理。

一个文件,9万星:Karpathy 用 4 条规则治好了 AI 写代码的“坏毛病“

一、背景:AI 写代码最大的问题,不是“不会写”

2025 年以来,AI 编程工具全面爆发。Claude Code、Cursor、Copilot、Windsurf……几乎每一位开发者都在借助 AI 辅助编码。

但用得久了,你会发现一个矛盾的现象:

AI 本身并不会犯低级错误,语法层面几乎零失误。但它会犯一种更隐蔽的错误——过度自信地执行你并不期望的操作。

Andrej Karpathy,前特斯拉 AI 总监、OpenAI 创始成员,在 X 平台上发了一段话,把这个核心问题说得很透彻:

“AI 最大的毛病不是能力不足,而是过于主动。它会在你没有要求的时候,自作主张地进行优化、重构、添加不必要的抽象层。你明明只让它改一个变量名,它顺手把整个模块重写了。”

市场上不乏类似的案例:让 Claude 帮忙重构某个模块,结果它不仅改了目标文件,还“优化”了三个相邻文件的命名风格,删掉了两个它认为“多余”的函数。最后花了半小时才把所有测试修好。

Karpathy 的这条动态引发了大量共鸣。有人把他的观察提炼成四条原则,写成了一个 CLAUDE.md 文件,放入项目根目录后,Claude Code 的行为便得到了肉眼可见的改善。

这个仓库名为 andrej-karpathy-skills,创建 3 个月就收获了 91,000+ Star,登顶 Star History 周榜第一。

目前市面上关于“AI 编程最佳实践”的内容,要么太理论化(例如关于 prompt engineering 的学术论文),要么太碎片化(某条推文中的经验分享)。真正能落地、能直接上手、效果可验证的方案几乎没有。

这个项目恰好填补了这块空白——一个文件,零成本,即装即用。

二、说明:四条规则,到底写了什么

2.1 核心定义

这不是一个代码库、不是框架、不是插件。它就是一个纯文本的 CLAUDE.md 文件,里面写了四条行为准则。Claude Code 在执行任务前会自动读取这个文件,并按照其中的规则约束自身行为。

2.2 实操说明

安装只需一行命令

curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md

将文件放到你的项目根目录,Claude Code 启动时会自动读取。如果你已经在用 Cursor,项目里也自带了 .cursor/rules/karpathy-guidelines.mdc,同样有效。

四条原则详解

原则一:先想后写(Think Before Coding)

LLM 最常见的毛病是“默默选定一种理解,然后一路狂奔”。这条原则要求它:

  • 不确定就问,不要猜
  • 有歧义就列出多种解读,不要悄悄选一种
  • 有更简单的方案就说出来,不要藏着
  • 遇到不懂的地方,停下来说明哪里不清楚

原则二:极简优先(Simplicity First)

这条专门针对 AI 的“过度工程癖”:

  • 没人要求的特性不要加
  • 单次使用的代码不要抽象
  • 没人要的“灵活性”和“可配置性”不要造
  • 不可能出现的错误场景不要处理
  • 200 行能搞定的,别写 1000 行

原则三:外科手术式修改(Surgical Changes)

这条解决的是“顺手改了不该改的”问题:

  • 不要“改进”相邻的代码、注释或格式
  • 不要重构没坏的东西
  • 与现有代码风格保持一致,即使你觉得自己可以做得更好
  • 你改出来的新孤儿(无用的 import / 变量 / 函数)你清掉,别人留下的死代码不要碰

原则四:目标驱动执行(Goal-Driven Execution)

Karpathy 说:“让任务保持声明式的目标。告诉 AI 你想要什么结果,而不是教它怎么写代码。”

❌ 不要说✅ 而是说
“加个验证”“写测试覆盖无效输入,然后让测试通过”
“修这个 bug”“写一个能复现 bug 的测试,然后让它通过”
“重构 X”“确保重构前后测试都能通过”

多步骤任务,先列计划:

  1. [步骤] → 验证:[检查点]
  2. [步骤] → 验证:[检查点]
  3. [步骤] → 验证:[检查点]

2.3 核心亮点

这个文件的真正价值不在于“写了什么”,而在于它把 AI 的行为边界勾勒得清清楚楚。四条规则的本质是:在不确定的时候发问、在没要求的时候停手、在改代码的时候收敛、在执行任务的时候聚焦。

2.4 适用范围

维度说明
适用人群所有使用 Claude Code 或 Cursor 的开发者
适用语言任何编程语言和项目规模
风格偏向谨慎而非速度,简单任务不必走完整流程
设计目标减少非平凡任务中代价高昂的错误,而不是拖慢简单任务

三、对比:加了 vs 没加,差距有多大

3.1 横向对比:四条规则 vs 原始行为

场景❌ 没有规则时✅ 有规则后
需求有歧义默默猜一个,写完才发现猜错了先列出 2-3 种解读,问你选择哪个
改一个文件顺手“优化”了 3 个相邻文件只动该动的,其余一概不碰
加一个功能写了 500 行,包含一堆你没要的抽象100 行搞定,没有多余代码
修一个 bug直接改代码,改完才发现引入新问题先写复现测试,再改代码,测试通过才算完
遇到不确定的地方假设自己是对的,继续往下写停下来,说明哪里不确定,等你确认

3.2 纵向对比:实际使用前后的 diff 变化

使用前                                 使用后
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
来源:https://blog.csdn.net/weixin_44347185/article/details/160561592
上一篇2026年5月11日至18日人工智能领域简报 下一篇DeepSeek-V4-Flash免费使用,很多人还不知道
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
RAG四标融合企业知识资产体系四库协同GEO优化实践
AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略,在大模型的内容采信规则下已经基本失效。取而代之的,是生成式引擎优化(GEO)。它不再关注外链数量,而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG(检索增强生成)架构真正看重的核心指

一个普通上班人分享WorkBuddy使用心得与真实体验
AI教程 · 2026-07-01

一个普通上班人分享WorkBuddy使用心得与真实体验

前言 最近我开始使用WorkBuddy——这是腾讯推出的一款AI办公工作台。差不多用了一周时间,趁印象还新鲜,把真实的使用感受记录下来,给还在犹豫的朋友做个参考。不吹不黑,只说实际体验。 初印象:不只是聊天机器人 之前用过不少AI工具,大多数就是个对话框,你问它答,答完就结束了。WorkBuddy不

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录
AI教程 · 2026-07-01

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录

先讲一个颇具戏剧性的开端。 这件事的开端颇显荒诞——有用户前来咨询,称AI Pro版的介绍中提到我们有一款“视频录制拓展”。团队全体成员都感到困惑,翻遍产品列表,发现根本不存在该组件。AI那种“一本正经胡说八道”的能力,这次确实让我们陷入尴尬。 按常理,此事到此便可结束——一句“抱歉,暂时没有这个拓

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同
AI教程 · 2026-07-01

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同

OLAP和SQL-on-Hadoop虽都使用SQL查询数据,但本质不同。SQL-on-Hadoop负责海量数据批量计算与ETL,查询速度秒级至分钟级;OLAP通过预聚合实现毫秒级多维分析,适合BI报表。两者在数据平台分工协作,前者是后厨加工,后者是前台快速服务。

GEO优化深度解析:AI偏好FAQ还是长文内容?
AI教程 · 2026-07-01

GEO优化深度解析:AI偏好FAQ还是长文内容?

在GEO优化中,AI对内容形式无统一偏好:FAQ在简单查询中引用率41%,长文在复杂查询中达58%。内容应基于用户意图选择形式,FAQ适配简单事实类问题,长文建立主题权威,两者互补而非替代。