用 Hermes 打造 LLM Wiki 知识库:Karpathy 方法实战指南

前言

你用过 RAG 吗?

把一堆文档扔给 AI,它帮你检索、回答问题。
听起来很美,但用久了你会发现一个问题:每次提问,AI 都在从头翻你的文档

上周它帮你总结过的东西,这周再问,它又重新读一遍原始材料,可能还得出不同的结论。
知识不会积累,问一次用一次,用完就丢。

2026 年 4 月,Karpathy 发了一个 GitHub Gist,提出了一个叫 LLM Wiki 的模式。
核心思路很简单:别让 AI 每次都重新翻文档,让它把知识编译成结构化的 wiki,持续维护

Hermes Agent 内置了一个 llm-wiki skill,把这个模式落地了。
今天来看看怎么用。

RAG 和 Wiki 的区别

传统 RAG 的工作方式是”即时检索”:你问一个问题,系统从原始文档里找最相关的片段,拼进上下文,让 LLM 生成回答。

LLM Wiki 的思路完全不同:知识先编译,再查询

Wiki 里的页面已经做好了交叉引用,矛盾已经被标记,综合分析已经反映了所有已收录的来源。
你问问题的时候,直接读 wiki 页面就行,不需要重新解析原始文档。

Karpathy 是这么说的:

Obsidian 是 IDE,LLM 是程序员,wiki 是代码库。

三层架构

LLM Wiki 的目录结构分三层,Hermes 的 llm-wiki skill 按这个思路设计了具体的组织方式:

**第一层 raw/**:存放原始材料,网页文章、PDF 论文、会议记录等。
这些文件一旦存入就不再修改,是知识的”源代码”。

第二层 wiki 页面:由 Agent 创建和维护的 markdown 文件。
分成四种类型:

  • **entities/**:实体页面,比如某个工具、某个人物、某个产品
  • **concepts/**:概念页面,比如”RAG 是什么””向量数据库原理”
  • **comparisons/**:对比页面,比如”Docker vs Podman”
  • **queries/**:有价值的查询结果归档

第三层 SCHEMA.md:Hermes 把这个配置文件命名为 SCHEMA.md(Karpathy 原始模式中叫 CLAUDE.md 或 AGENTS.md)。
它定义了 wiki 的领域范围、命名规范、标签分类、页面创建门槛等。
这是让 Agent 成为”纪律严明的 wiki 维护者”而不是”随便聊天的 AI”的关键。

三大核心操作

收录(Ingest)

把一篇新文章喂给 wiki,Agent 会:

  • 保存原始文件到 raw/articles/,计算 sha256 用于后续检测内容变化
  • 识别文章中提到的实体和概念
  • 检查 wiki 里是否已有相关页面,避免重复创建
  • 创建或更新 wiki 页面,添加交叉引用
  • 更新 index.md 索引和 log.md 日志

一篇来源文章可能触发 5-15 个 wiki 页面的更新。
这就是”知识复利”的效果。

查询(Query)

对 wiki 提问,Agent 会:

  • 先读 index.md 找到相关页面
  • 大型 wiki(100+ 页面)还会全文搜索
  • 读取相关页面后综合回答,引用来源页面
  • 如果这个回答有长期价值,归档到 queries/ 目录

查询结果被归档后,下次遇到类似问题就不用重新推理了。

健康检查(Lint)

定期让 Agent 检查 wiki 的健康状况:

  • 孤儿页面(没有被其他页面引用的页面)
  • 断链(wikilink 指向不存在的页面)
  • 过时内容(有新来源提及但页面超过 90 天没更新)
  • 矛盾标记(contested: true 的页面需要人工审查)
  • 标签一致性(所有标签必须在 SCHEMA.md 的分类表里)

用 Hermes 实战

Hermes Agent 内置了 llm-wiki skill,直接用斜杠命令 /llm-wiki 就能激活完整的工作流。

初始化 Wiki

对 Hermes 发送:

1
/llm-wiki 帮我创建一个 wiki,领域是 AI 工具和开发技术。

Hermes 会创建目录结构,生成定制化的 SCHEMA.mdindex.mdlog.md

你也可以自定义 wiki 路径,在 ~/.hermes/.env 中设置:

1
WIKI_PATH=~/my-wiki

不设置的话默认在 ~/wiki

收录一篇文章

1
/llm-wiki 帮我把这篇文章收录到 wiki:https://example.com/some-article

Hermes 会用 web_extract 抓取内容,保存到 raw/articles/,然后自动创建或更新相关 wiki 页面。

你也可以一次性收录多篇文章,Hermes 会批量处理,减少重复更新。

提问

1
/llm-wiki 我的 wiki 里关于 Docker 的内容有哪些?

Hermes 会搜索 wiki,找到所有 Docker 相关页面,给你一个结构化的回答。

健康检查

1
/llm-wiki 帮我检查一下 wiki 的健康状况。

Hermes 会运行完整的 lint 流程,报告问题并给出修复建议。

和 Obsidian 配合

Wiki 目录就是一个普通的 markdown 文件夹,可以直接用 Obsidian 打开。

[[wikilinks]] 在 Obsidian 里会渲染成可点击的链接,Graph View 能直观看到知识网络的连接关系。

如果你装了 Dataview 插件,还能用 YAML frontmatter 做高级查询,比如”列出所有标签包含 llm 的页面”。

使用建议

不要追求完美分类:知识的边界是模糊的,先把内容收录进去,交叉引用会帮你建立连接。

收录比查询更重要:wiki 的价值在于积累。
读到好文章就告诉 Hermes “收录一下”,比等到要用再翻文档高效得多。

定期做健康检查:每月跑一次 lint,清理断链和过时内容。

善用 confidence 标记:对于只有一个来源支撑的观点,标记 confidence: medium,避免弱证据被当成定论。

知识管理的本质不是收集信息,而是让信息在需要的时候出现,并且是已经整理好的状态

LLM Wiki 让这件事第一次变得真正可行。