游乐游手机版
首页/AI教程/文章详情

Karpathy知识库方案很好但并非为你量身打造

时间:2026-06-23 14:39
两种知识库方案:Karpathy主张AI沉淀知识成个人百科,范凯强调知识转化为产出与行动;另有认知底座型,用于理解复杂行业。搭建知识库需先明确自身目标。

之前我们聊过 Karpathy 的个人知识库搭建方案,不少朋友根据教程成功完成了部署。但在实际操作之后,有人提出了一个非常现实的问题:

工具安装并不难,可工具装好之后,究竟该往里面填充什么内容,反倒成了最大的困扰。

最近,国内的范凯——JavaEye 创始人,早期写博客的老玩家应该都很熟悉——在 Karpathy 方案的基础上进行了一次大刀阔斧的改造。改造后的方案反响热烈,很多人评价“比原版更实用、更好上手”。

将这两个方案放在一起仔细对比后,我们发现了一个有趣的现象——

它们本质上并非同一类解决方案。

从表面上看,两者都采用了 Obsidian + LLM + Markdown 这套技术组合,但背后的设计理念却截然不同。而那种“搭建完成后不知该放什么”的困惑,其根源几乎都指向一个很少有人提出的前置问题:这个知识库方案,到底是针对哪类用户设计的?

搭建知识库的第一步,从来都不是选择工具,而是先认清自己的真实需求。

一、Karpathy 的出发点:让知识持续积累,避免每次从零开始

上一篇我们介绍的是 Karpathy 方案的操作层面,这次我们进一步深挖:他为什么这样设计。

回想一下所有使用 AI 的人都经历过的场景——

上周你刚和 AI 深入探讨过某个问题,讨论得相当透彻。这周开启一个新对话,想接着上次的思路继续推进,结果 AI 完全不了解背景,只能从基础概念开始重新讲解。之前所有的上下文都丢失了。

Karpathy 指出的正是这个痛点。他的解决方案非常直接:让 LLM 将每次对话中产生的有价值知识,沉淀为 Markdown 格式的笔记文件。下次再提问时,AI 会先查阅已有的笔记,在前面的基础上向前推进。知识就像滚雪球一样越积越多,相互之间的引用也会越来越密集。

上一篇中提到的三层架构和四个核心动作,都是基于这个底层逻辑延伸出来的。其中最精妙的设计是 Lint——让 AI 定期扫描整个知识库,查找矛盾点、孤立信息和过时内容。用 Karpathy 的话来说(大意):维护知识库最累人的不是阅读和思考,而是日常的记账整理工作(bookkeeping)。阅读文章、判断价值是人类应该做的事情;而格式化内容、更新链接、检查信息是否过时——这些完全可以交给 AI。

在这种设计思路下,知识库的最终目标就是 Wiki 本身。AI 维护得越好,Wiki 就越完整;Wiki 越完整,AI 下一次回答时就有越扎实的基础。Wiki 本身就是目的。

对于 Karpathy 这样的研究者来说,这套方案几乎无可挑剔——研究者的核心工作本来就是“让知识沉淀下来,形成体系”。

但问题来了:对于那些并非研究者的人来说,“将知识沉淀到 Wiki 里”就是终点了吗?

二、范凯的出发点:知识如果只存不用,等于一无所有

你可能也有过类似的感受——

花了大量精力整理了几百条笔记,做了非常完善的结构目录。一个月后打开 Obsidian,突然问自己:这些内容我最近真正用过吗?大多数情况下,答案是没有。笔记安安静静地躺在硬盘里,就像一座永远装修不完的房子,你从来没有真正在里面生活过。

范凯在他的改造文章里开门见山地指出:

基于这个核心出发点,范凯进行了三项关键的调整。

改动一:将三层架构扩展为五层。

Karpathy 的原版设计是三层架构(Raw Sources / Wiki / Schema)。范凯将其拆解为五层:

  • Notes/(输入层)— 网页剪藏、碎片化想法、与 AI 的对话记录
  • Knowledge/(知识层)— 方法论总结、读书笔记、原创深度思考
  • Software/(技能层) — 工具使用技巧、开发笔记与心得
  • LifeOS/(行动层)— 投资决策、健康管理、保险规划等具体落地事项
  • Writing/(产出层)— 视频脚本、文章创作、运营标准流程

中间三个层级是并行运行的管线,各自管理自己的领域。最底部的 Writing/ 产出层是 Karpathy 方案中完全没有的内容。范凯的原话是:

在 Karpathy 那里,弹药库本身就是目标;而在范凯这里,弹药库只是一个中间站,真正开枪发射才是最终目的。

而 LifeOS/(行动层)这一设计也容易被忽略。范凯强调,投资笔记不能写了就算完,必须能够指导真实的交易决策;健康计划要能够转化为每周的具体训练安排。知识不仅需要“产出成果”,更需要“落地执行”,变成实际行动。

改动二:在输入层中新增了一个 Conversation 子目录。

Karpathy 的 Raw Sources 是一个统一的收纳容器。范凯则将输入内容拆分为三类:Clippings(网页剪藏)、Inbox(碎片化想法)、Conversation(与 AI 进行的有价值的对话记录)。

范凯的原话是:

改动三:AI 先提供建议方案,由人来做最终决策。

范凯自己说,这是“跟 Karpathy 最大的分歧点”。

Karpathy 的模式是让 LLM 主导维护 Wiki,人类参与审阅。范凯在试用后发现问题不少:AI 对于“这篇文章应该放到哪个类别”的判断经常不准确——比如把内容创作方法论放在了 Knowledge/ 目录,而不是更合适的 Writing/Knowledge/ 目录;或者本应合并到已有文档的内容,却被单独新建了一个文件。

因此他增加了一条规则:AI 先列出分类方案,等人确认后再执行修改。用他的话说,分类体系反映的是你自己的思维结构,AI 可以提供建议,但最终的决定权必须掌握在你手里。虽然多了一步——只是看一眼表格而已——但能避免大量返工工作。

这三项改动的背后都有一个共同的出发点:知识必须流动起来,必须能够转化为实际的东西,必须能够真正落地执行。

三、两种方案,同一个基础框架

Karpathy · 让知识积累沉淀

范凯 · 让知识发挥作用

核心出发点

避免 AI 每次都从零开始,让知识不断积累

知识如果只存不用,就等于不存在

最终目标

Wiki 知识库本身

Wiki 之后的成果产出与行动落实

架构设计

三层(Raw / Wiki / Schema)

五层(输入 / 知识 / 技能 / 行动 / 产出)

AI 的角色定位

主要负责维护执行,人类参与审阅

提供参谋建议方案,人类决策拍板执行

最关注的风险

矛盾信息、孤立节点、过时内容

内容积压、无法产出、笔记吃灰

典型的提问方式

“X 和 Y 之间存在什么关系”

“这些素材可以组合成什么内容”

交叉引用策略

密集链接,由 AI 自动维护

少即是多,只保留强关联引用

你的个人需求和出发点,决定了你应该选择哪个方案。

四、还有第三种出发点

除了“让知识持续积累”和“让知识转化为产出”之外,是否存在第三种方向?
答案是肯定的。

笔者就属于这第三种。从事的是 AI + 保险这个交叉领域——一边是变化极其迅速的 AI 技术,另一边是变化极为缓慢的传统行业。在这种岗位上,每天接触到的信息极其碎片化:某条监管文件中的一段话、某个 AI 模型的新能力、竞争对手的一个新功能、与业务方的一次争论、一篇论文里的工程细节。这些东西单独看似乎都没有太大意义,但组合在一起,才是你对这个行业的真实认知。

这种出发点既不是“将知识积累成百科全书”,也不是“将知识转化为内容产出”,而是——将一个陌生且复杂的行业,逐步装入自己的认知体系之中。

这种知识库更像一块不断积累、不断变厚的“认知底座”。平时可能并不频繁翻阅,但每一次关键的结构判断、每一次与业务方的对齐沟通,都悄然建立在这个基础之上。

为什么从事 AI + 传统行业的人需要这种特殊形态?因为仅靠公司提供的文档,很难真正装进自己的脑子。公司文档能够告诉你“我们目前是怎么做事的”,但无法告诉你“为什么这样做、下次遇到变化时应该如何判断”。这种“为什么”和“如何判断”的能力,只能通过自己在每一天的实践中慢慢对齐、消化和沉淀。

这种“认知底座”有几个反常规的设计思路,甚至有些是与 Karpathy 的方案相悖的(例如 Raw 层不能“只进不出”)。我们会在下一篇中单独详细讨论。

如果你也在从事 AI + 传统行业(保险、医疗、金融、政务),那么下一篇内容应该会引起你的共鸣。

五、两个自检问题

在动手改造你的知识库之前,请花一分钟回答两个核心问题。

问题一:你希望这个知识库最终变成什么样的存在?
→ 一本越写越厚的“个人百科全书”——你的出发点接近 Karpathy,可以直接沿用上一篇的方案
→ 一个能够持续产出内容的“弹药库”——你的出发点接近范凯,需要增加产出层和行动层
→ 一块让你对复杂行业理解越来越透彻的“认知底座”——属于第三种,敬请期待下一篇

问题二:如果半年后这个知识库失败了,你会如何描述它失败的原因?
→ “它没有帮助我思考得更深入”——你是积累型用户
→ “它没有帮助我写出更多内容”——你是产出型用户
→ “它没能帮助我把这个行业真正装入脑子里”——你是第三种用户

答案大概率会指向同一个方向。这就是搭建知识库真正意义上的第一步——不是选择使用 Obsidian 还是 Notion,而是先认清自己的真实出发点和根本需求。

· · ·

“搭建好了,然后呢”——这是上一篇内容发布后最常被问到的问题。答案不是再装一个新的插件,而是退后一步,想清楚你到底要用这个知识库做什么。

工具本身是中性的,但不同的方法背后有不同的立场。你的出发点,决定了这些工具和方法在你手中会呈现出怎样的价值。

下一篇再见。


来源:https://cloud.tencent.com.cn/developer/article/2695339
上一篇AI大模型进化史最近几年发展历程全面盘点 下一篇认知底座:AI与传统行业从业者的第三种知识库方案
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
企业组织级AI赋能具体实施方法
AI教程 · 2026-06-30

企业组织级AI赋能具体实施方法

前段时间收到一位读者的留言,希望聊聊企业级、组织级的AI赋能究竟该怎么落地。巧的是,前几天刚看到一份咨询调研机构的数据:对近一两年所有企业级AI赋能项目的统计显示,超过90%的甲方企业认为,AI赋能在核心业务价值链上没有发挥任何实质性作用。除了AI辅助办公、企业智能知识库这类边缘应用起到了一些辅助效

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统
AI教程 · 2026-06-30

Scrapy与Redis分布式架构的日本电商多平台数据聚合系统

从事日本电商数据聚合工作时,最大的难点在于要同时应对雅虎拍卖、煤炉(Mercari)、乐天和亚马逊日本站等截然不同的平台。以往使用单机爬虫,经常出现运行中崩溃的情况——单点故障、带宽利用率不足、数据存储混乱,这三大痛点令人困扰。 本文分享一套基于Scrapy + Redis的分布式爬虫方案,专门解决

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置
AI教程 · 2026-06-30

详细PuTTY 0.81安装教程 SSH远程连接与自定义路径设置

​ PuTTY(简称PT)是一款轻量级开源SSH Telnet客户端,凭借简洁高效的特性,多年来始终是系统管理员与开发者进行远程连接的首选利器。本教程将详细介绍PuTTY 0 81版本的完整安装过程,并指导您自定义安装路径,以便更灵活地管理SSH远程连接工具。 安装准备 首先需要说明的是,整个安装流

在线教育系统必备功能:直播课堂与题库考试架构
AI教程 · 2026-06-30

在线教育系统必备功能:直播课堂与题库考试架构

很多人一想到做在线教育系统,第一反应往往是先把直播间和课程播放器搭起来,觉得“能看课”就万事大吉了。真到落地那天才发现,系统能不能顺滑跑起来,关键全藏在那些细节里——课程怎么组织、学习进度怎么记、考试怎么处理、后台怎么管得住。前端看起来就几个页面,后端其实是一整条业务链路。不管你是要做在线教育APP

ZStack源码级AI诊断套件让故障排查秒出答案
AI教程 · 2026-06-30

ZStack源码级AI诊断套件让故障排查秒出答案

一次故障排查,到底要花多少时间? 运维人员处理私有云、虚拟化平台的问题,流程大致都是这样:先翻日志看现象,再去文档里找对应机制,然后搜社区有没有类似案例,最后综合判断给出答复。简单问题半小时,复杂问题可能要跨天——而这些时间里,大部分精力耗在了“找信息”而不是“做决策”上。 类似的问题,也许每天都在