首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Karpathy开源AI研究员项目:630行代码炼就通宵模型

Karpathy开源AI研究员项目:630行代码炼就通宵模型

热心网友
37
转载
2026-03-08

如果你有一块 NVIDIA GPU,睡前启动一个脚本,第二天早上醒来就能收获一百次 LLM 训练实验的结果,其中一部分还确实比你手动调参调得更好,是不是听起来有些难以置信?

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

但这就是 Andrej Karpathy 今天凌晨开源的新项目 autoresearch 所做的事。项目上线不到几个小时,他在 X(原 Twitter)上的发布帖浏览量突破百万,GitHub 仓库迅速收获超过 2,500 颗星。整个仓库的核心代码只有约 630 行 Python。


图丨相关推文(来源:X)

autoresearch 做的事情,一句话就能说清:把一个简化过的大语言模型训练环境交给 AI 智能体(AI Agent),让它在你睡觉的时候自主跑实验。智能体修改代码,启动训练,五分钟后检查结果,如果验证损失降低了就保留改动,没降低就回退,然后继续下一轮。你早上醒来,面前是一串实验日志,和一个可能变好了的模型。

过去几年里,Karpathy 开源了一系列以极简主义著称的项目:2020 年的 micrograd 和 minGPT,2024 年的 nanoGPT,2024 年用纯 C 和 CUDA 写的 llm.c,2025 年覆盖 LLM 全流程的 nanoc h a t,以及 2026 年 2 月那个仅用 243 行纯 Python、零外部依赖实现 GPT 训练和推理的 microgpt。每一次迭代都在做同一件事,剥除抽象层,把复杂系统压缩到人类可以在一杯咖啡时间里读完的代码量。

autoresearch 延续了这条线索,只是这一次,它不再是给人看的教学工具,而是给 AI 用的实验平台。

整个仓库只有三个核心文件。prepare.py 负责下载训练数据和训练一个 BPE(Byte Pair Encoding,字节对编码)分词器,这个文件是固定的,智能体不能动。

train.py 是约 630 行的训练脚本,包含完整的 GPT 模型定义、优化器(项目使用了 Muon 和 AdamW 的组合)和训练循环,这是智能体唯一可以编辑的文件,模型架构、超参数、批大小、学习率,所有东西都可以改。

program.md 是一个 Markdown 文件,充当给智能体的指令手册,由人类编写和迭代。这里的核心设计哲学是:人类编写指导智能体行为的"元程序",智能体负责编写和修改实际的训练代码。

训练的时间预算被硬性固定为 5 分钟墙钟时间(wall clock time),不管你的硬件配置如何。这个设计选择有两个好处:

第一,不同实验之间的结果可以直接比较,不管智能体把模型改大了还是改小了;第二,autoresearch 会为你的特定硬件找到 5 分钟内能达到的最优配置。代价是不同人在不同 GPU 上得到的结果无法互相对照。评估指标是 val_bpb(validation bits per byte,验证集上的每字节比特数),越低越好,且与词表大小无关,这样即便智能体改变了分词方案,实验结果也能公平对比。


(来源:GitHub)

按照这个节奏,每小时可以跑大约 12 个实验,一整夜大约 100 个实验。Karpathy 在 README 里附了一张图:83 次实验中保留了 15 次改进,验证损失从接近 1.000 逐步下降到 0.975 附近。图上每个点是一次完整的训练运行,绿色点表示被采纳的改动,灰色点是被丢弃的。

你可以看到智能体尝试了各种各样的策略,调整 batch 大小、修改学习率调度、切换激活函数、引入余弦衰减等,有些管用,大多数没用,但整体趋势是持续向下的。

autoresearch 的训练代码来源于 Karpathy 在 2025 年发布的 nanoc h a t 项目的简化版。nanoc h a t 是一个覆盖 LLM 全栈的实验框架,从分词到预训练、微调、评估、推理到聊天界面全部包含在内,设计目标是在 8 块 H100 GPU 组成的单节点上跑完全流程。

据 Karpathy 公布的数据,用 nanoc h a t 训练一个 GPT-2 级别能力的模型大约需要花费 48 美元(约 2 小时的 8×H100 节点),而 2019 年 GPT-2 的训练成本约为 43,000 美元(nanoc h a t GitHub,2025)。autoresearch 把 nanoc h a t 进一步精简到单 GPU 环境,砍掉了分布式训练、复杂配置和多阶段流水线,只留下一个能跑、能改、能比较的最小单元。

智能体在一个 git 分支上工作。每当它找到一个更好的配置,就提交一个 commit。你可以在 git log 里看到完整的实验演化史。这种设计让所有改动都是可审查和可回滚的,同时也构成了一份天然的研究日志。Karpathy 建议使用 Claude Code 或 OpenAI Codex 这类代码智能体来驱动实验循环,并且把所有权限关掉,智能体只需要读写 train.py 和执行训练命令的能力。

不过,这个项目目前只支持 NVIDIA GPU,测试环境是 H100。Karpathy 在 README 中坦承:支持 CPU、MPS(Apple Silicon)或其他平台在技术上完全可行,但会让代码膨胀,而他不确定自己是否愿意在这个方向上投入精力。他更倾向于让社区来做 fork 和适配。

其实 AI 科研系统也并不算新鲜,但 autoresearch 和那些企业级或科研级系统之间有一个重要的区别:它是刻意做小的。Karpathy 没有搭建一个多智能体编排框架,没有设计复杂的通信协议,没有引入什么记忆模块或检索增强生成(Retrieval-Augmented Generation, RAG)管线。他做的事情和过去六年做的事情一样,把一个概念压缩到你能在周末下午读完并跑起来的规模。一块 GPU,一个文件,一个循环。

README 顶部有一段虚构的引言,大意是:将来 AI 研究完全由自主智能体集群在天空中的计算集群上完成,代码库已经经历了 10,205 次迭代,变成了一个超越人类理解的自修改二进制程序,没有人能验证智能体对版本号的说法是否正确。Karpathy 标注的日期是 2026 年 3 月,然后附言:这个项目讲的是这一切是如何开始的。

参考资料:

1. https://x.com/karpathy/status/2030371219518931079

2. https://github.com/karpathy/autoresearch

来源:https://www.163.com/dy/article/KNH52DEK05119734.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

雷科技到底是谁?!!!悟空给出的答案,太抓人了!
科技数码
雷科技到底是谁?!!!悟空给出的答案,太抓人了!

从零到一:用AI生成一份专业的媒体影响力报告 但凡在内容或运营团队待过的人,大概都对制作《媒体影响力报告》这类活儿记忆犹新。那过程,堪称一场跨部门接力赛:运营同事得先从各个平台后台手动扒拉数据,计算阅读量、粉丝增长和互动率;拿到一堆冰冷数字后,还得拉着账号负责人反复琢磨定位和文案;最后,抱着半成品火

热心网友
05.01
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机
科技数码
全国五一劳动奖章获得者聂海平:突破国外技术壁垒 用代码“敲”出属于中国的铺丝机

封面新闻记者 邹阿江 图由航空工业成飞提供 2026年“五一”国际劳动节前夕,航空工业成飞的技术专家聂海平,荣获了一枚全国五一劳动奖章。 消息传来,身边同事都说,“大师”拿奖是实至名归。可聂海平自己呢,还是那副老样子——摆摆手,说自己不过是个普通人,幸运地站在一个好平台上,干着点自己感兴趣的事儿罢了

热心网友
05.01
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀
业界动态
每天3小时就够了,技术大牛:在AI时代坚持8小时工作制,你不是在努力,是在自杀

编辑 | 王凤枝 “AI时代,每天干3个小时就足够了。” 这句话出自前亚马逊资深工程师、技术大牛史蒂夫·雅吉(Steve Yegge)之口,算得上是对当前AI狂热的一剂清醒剂。 当整个行业都在为“10倍提效”而欢呼雀跃时,雅吉却点出了一个被普遍忽视的代价:在AI的高强度辅助下,程序员的产出固然爆炸式

热心网友
04.22
你的代码为什么又长又乱?可能是函数没用好
业界动态
你的代码为什么又长又乱?可能是函数没用好

一、概述 每天重复相同的操作,是不是感觉有点枯燥?比如,你每天都要煮饭,得经历洗米、加水、按下煮饭键这三步。如果每次都要从头到尾念叨一遍这个过程,那可就太费劲了。 别担心,函数就是来拯救你的。在Python的世界里,函数就像一个“一键煮饭”的智能按钮。你只需要把那些重复的步骤打包成一个固定的“命令”

热心网友
04.22
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定
业界动态
Pandas 精通十:透视表/交叉表实战,复杂数据汇总一键搞定

吃透Pandas两大“数据汇总神器”:透视表与交叉表实战指南 在数据处理的工具箱里,如果说基础的清洗、筛选是基本功,那么多维度、交叉式的数据汇总,往往就是区分新手与熟手的分水岭。面对诸如“按地区加品类统计销售额”、“分析不同省份的商品订单分布”这类需求,如果还停留在手动分组、多层循环的老路上,不仅代

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

阿里云百炼记忆库解决AI多轮对话遗忘难题
业界动态
阿里云百炼记忆库解决AI多轮对话遗忘难题

2026年4月9日,阿里云旗下的AI开发平台“百炼”正式发布了名为“记忆库”的全新功能。这项功能的核心价值,在于为AI Agent赋予跨会话的长期记忆能力,旨在彻底解决多轮对话中信息丢失与遗忘的行业核心痛点。目前,该功能正处于限时免费公测阶段。官方性能数据显示,其在关键指标上表现突出:记忆检索性能大

热心网友
05.12
全链网30官方报价6.7946 最新行情分析与解读
web3.0
全链网30官方报价6.7946 最新行情分析与解读

今天外汇市场的表现,可以说是在平静中透着一丝韧性。北京时间下午四点半,在岸软妹币对美元汇率官方收盘价定格在6 7946。 这个数字背后有两个值得玩味的对比:一是比起前一个交易日的官方收盘价,小幅上扬了8个基点;二是相较于昨晚夜盘的收盘价,则回升了17个基点。虽然波动幅度不大,但这种日内低开后的企稳回

热心网友
05.12
北境墓碑全收集攻略 遥遥西土地图点位详解
游戏攻略
北境墓碑全收集攻略 遥遥西土地图点位详解

《遥遥西土》北境区域共有十个墓碑等待收集。首个墓碑位于地图北部悬崖下方,玩家需跳至崖底才能发现,其旁另有一座墓碑作为参照。具体位置与探索方法可参考相关视频攻略。

热心网友
05.12
归环好彩骰获取途径大全与快速入手方法
游戏攻略
归环好彩骰获取途径大全与快速入手方法

归环好彩骰”是游戏的核心机制,通过投掷骰子组合牌型获得奖励。它将叙事、战斗与成长深度整合,玩家的选择与骰点结果直接影响剧情走向和战斗效果。机制简单易上手,无时间压力,提供即时强反馈。游戏结合“万相卡”与角色流派,支持多样策略,平衡随机性,提升了内容探索深度与复用价值。

热心网友
05.12
植物大战僵尸抽卡重置版上线时间确定 开服日期与预约指南
游戏攻略
植物大战僵尸抽卡重置版上线时间确定 开服日期与预约指南

《植物大战僵尸》抽卡重置版已上线,核心玩法融合塔防与抽卡。游戏包含七阶卡池系统,顶级卡牌稀缺。新增超百种原创植物,僵尸行为更复杂,关卡设计多样。随机植物模式增加变数,roguelike元素提升重复可玩性。版本持续更新,社区活跃。

热心网友
05.12