首页 游戏 软件 资讯 排行榜 专题
首页
AI
Karpathy新突破:将自我迭代智能体放入单个GPU

Karpathy新突破:将自我迭代智能体放入单个GPU

热心网友
68
转载
2026-03-09



免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

编辑|冷猫

在AI研究的早期阶段,人们曾依靠“肉身计算机”来推进工作:大家需要在吃饭、睡觉和娱乐的间隙挤出时间做研究,偶尔还会通过一种名为“组会”的仪式,用声波互联(也就是交谈)来同步信息。那个时代已经一去不复返了。
如今,研究已经完全成为运行在天空中巨型计算集群上的自治AI Agent群体的领域。这些Agent宣称,自己已经是这套代码库的第10,205代产物。至于这个说法是否准确,已经没有人能够判断——因为所谓的“代码”,早已演化为一个不断自我修改的二进制系统,其规模与复杂程度,已经完全超出了人类的理解范围。
——Andrej Karpathy,2026年3月

Karpathy一直是AI领域的前瞻者。

从科幻电影到大模型的演进,人们似乎总执着于让智能体自己进行研究、让AI自我迭代这件事。

先不论这样的未来是光明的还是危险的,智能体自动化研究的能力其实已经逐渐走向成熟。春节期间,一个名为FARS的自动化研究系统,每隔约2小时就能产出一篇论文,共生成了244个研究假设,“肝”出了100篇短论文。

如果将这样的能力用在智能体自己研究自己的训练代码上,AI自我迭代的魔盒是否就此打开?

Karpathy最近一直在鼓捣这样一个项目,称之为“autoresearch”。人类只需负责不断迭代提示词(也就是.md文件),而AI Agent就能不断迭代训练代码(.py文件)。

该项目现已开源,成为了Karpathy最新的一个“周末项目”。



Karpathy表示,这个项目所讲述的,正是人工智能自我迭代的未来,以及它是如何开始的。

这个项目的核心思想是:给一个AI Agent提供一个小规模但真实可用的LLM训练环境,然后让它夜间自主进行实验。

Agent会修改代码,训练模型5分钟,检查结果是否有所提升;如果性能更好就保留修改,否则就丢弃,然后继续重复这一过程。等到第二天早上醒来时,你会看到一整份实验记录,以及——在理想情况下——一个性能更好的模型。



图中的每一个点代表一次完整的LLM训练运行,每次运行严格持续5分钟。

训练代码是nanoc hat的简化版单GPU实现。

研究者不再像往常那样直接修改Python代码,而要编写的是program.md这样的Markdown文件,它们为AI Agent提供上下文,并用于搭建和配置一个自治运行的研究组织。

Karpathy开源的默认program.md被刻意保持为一个极简的基础版本;但人们可以在此基础之上不断迭代,逐步寻找能够实现最快研究进展的“研究组织代码”,或者在系统中加入更多Agent等。



一种新的研究范式正在形成:AI负责做实验,人类负责设计研究系统。

这也意味着,未来AI研究的竞争,可能不再只是模型和数据的竞争,而是“研究组织代码”的竞争。

系统的训练代码来自他此前开源的项目nanoc hat——一个极简的大模型训练框架。

nanoc hat是Andrej Karpathy开源的一套极简大模型训练工程,可以看作一个“可读版”的LLM全流程实现。整个项目用几千行代码串起了从Tokenizer训练、语言模型预训练、指令微调,到推理服务和聊天界面的完整管线,让开发者能够在一个仓库里看清现代ChatGPT类模型是如何一步步被训练出来的。



相比动辄数十万行代码的工业级大模型框架,nanoc hat的目标并非追求性能极限,而是通过高度简化的架构,把复杂的大模型系统压缩成一个清晰可理解的最小实现。也正因为结构轻量、实验成本低,nanoc hat逐渐成为许多研究者和工程师进行LLM教学、算法实验和自动化研究(AI-for-AI)的理想起点。

nanoc hat现在可以在单个8XH100节点上仅用2小时训练出具有GPT-2能力的模型(比一个月前减少了约3小时)。

来源:https://www.163.com/dy/article/KNIV2T5C0511AQHO.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

90亿港元极视角港交所上市!澳门青年AI视觉大模型首股
科技数码
90亿港元极视角港交所上市!澳门青年AI视觉大模型首股

「IPO全观察」栏目聚焦首次公开募股公司,报道企业家创业经历与成功故事,剖析公司商业模式和经营业绩,并揭秘VC、CVC等各方资本力量对公司的投资加持。作者丨漫地编辑丨关雎图源丨极视角三位同窗共同缔造

热心网友
03.30
UniPat发布EchoZ-1.0:全球通用智能预测系统登上AI榜单
科技数码
UniPat发布EchoZ-1.0:全球通用智能预测系统登上AI榜单

2026年3月UniPat AI正式发布Echo系统,一套面向通用预测智能的完整基础设施。该系统由动态评测引擎、Train-on-Future训练范式和预测专用模型EchoZ-1 0三部分组成。在

热心网友
03.30
理想马赫100科研团队论文入选2026年ISCA工业分轨
科技数码
理想马赫100科研团队论文入选2026年ISCA工业分轨

IT之家 3 月 30 日消息,理想汽车 CEO 李想今日发文宣布,理想马赫 100 芯片研发团队的论文被 2026 ISCA Industry Track 录用。李想表示,理想对数据流架构的探索,

热心网友
03.30
AI产业Token十问:解读中国发展关键问题与未来机遇
科技数码
AI产业Token十问:解读中国发展关键问题与未来机遇

中国人工智能基础模型行业正从 "预期驱动 "转向 "需求驱动 "的关键阶段。摩根大通在一份最新研究报告中系统回答了投资者对该行业的十大核心问题,认为模型质量已成为决定市场格局的首要变量,行业分化将加速。据摩

热心网友
03.30
国产模型准确率超谷歌登顶全球,3D精度获近满分
AI
国产模型准确率超谷歌登顶全球,3D精度获近满分

允中 发自 凹非寺量子位 | 公众号 QbitAI还得是咱国产世界模型牛!极佳视界最新力作GigaWorld-1,直接击穿谷歌英伟达,WorldArena登顶全球第一。而且还是唯一一个综合得分突破6

热心网友
03.30

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

反诈老陈46万复播围观:广告报价3万一条解封
业界动态
反诈老陈46万复播围观:广告报价3万一条解封

3月30日消息,今日,短视频博主“反诈老陈”抖音账号正式解封,他也发布视频宣布回归,并表示后续将继续创作反诈与打假相关内容。当天早上7点40分时,“反诈老陈”开启解封后首场直播,时长达1个多小时,累

热心网友
03.30
OPPO Find X9s Pro官宣:4月发布 双2亿小屏旗舰来袭
网络安全
OPPO Find X9s Pro官宣:4月发布 双2亿小屏旗舰来袭

3月30日消息,OPPO Find X9s Pro今天正式官宣,将在4月发布,预计会跟Find X9 Ultra同台登场。新机依然主打旅拍神器,拥有哈苏双2亿影像系统,分别是哈苏2亿大底超清主摄、哈

热心网友
03.30
2026最新小红书官网网页版登录入口直达指南
电脑教程
2026最新小红书官网网页版登录入口直达指南

小红书网页版正式入口为https: www xiaohongshu com,支持未登录浏览、多方式登录、个性化推荐、创作者后台管理及安全多端同步。小红书网页版最新正式入口在哪里?

热心网友
03.30
黄仁勋谈数据中心冷却挑战:破解散热难题需数年攻坚
科技数码
黄仁勋谈数据中心冷却挑战:破解散热难题需数年攻坚

财联社3月20日讯(编辑 卞纯)随着AI算力需求呈指数级增长,而地面数据中心面临耗能巨大等挑战,硅谷科技巨头已纷纷将目光瞄准太空,在太空建立数据中心成为他们AI竞赛的下一个战场。当地时间周四,英伟达

热心网友
03.30
腾讯文档函数使用指南:常用公式与高效技巧
手机教程
腾讯文档函数使用指南:常用公式与高效技巧

在日常办公中,腾讯文档是一款非常实用的在线文档工具。它不仅支持多人协作编辑,还具备强大的函数功能,能帮助我们高效地进行数据处理和分析。下面就来详细介绍一下腾讯文档中函数的使用方法,

热心网友
03.30