游乐游手机版
首页/AI教程/文章详情

开放知识格式(Open Knowledge Format)面向全球用户全新版本正式推出

时间:2026-06-18 16:44
尽管基础模型的能力正在快速提升,但其发挥作用的瓶颈却日益集中于上下文信息的匮乏——尤其在构建智能体(Agent)系统时,这一问题尤为突出。虽然这些模型已能够协助编写代码、归纳文档、分析数据集,但要生成准确且可执行的结果,它们依然需要获取正确的信息。 因此,今天正式发布Open Knowledge F

尽管基础模型的能力正在快速提升,但其发挥作用的瓶颈却日益集中于上下文信息的匮乏——尤其在构建智能体(Agent)系统时,这一问题尤为突出。虽然这些模型已能够协助编写代码、归纳文档、分析数据集,但要生成准确且可执行的结果,它们依然需要获取正确的信息。

推出 Open Knowledge Format(开放知识格式)

因此,今天正式发布Open Knowledge Format(OKF)——一种开放规范,将LLM Wiki模式标准化为可移植、可互操作的格式。这是一个与厂商无关、同时适用于智能体和人类的标准,用于表示现代AI系统所需的元数据、上下文及经过整理的知识。

当前推出的OKF v0.1,将知识表示为由Markdown文件构成的目录结构,借助YAML Front Matter存储元数据。同时定义了一套简洁约定,使不同来源创建的知识库能够被各类智能体直接使用,无需额外转换。

就是这么简单:无需复杂的压缩方案,无需新的运行时环境,也无需专用SDK。一个OKF文档集合具备以下特点:

  • 就是Markdown —— 可在任何编辑器中阅读,直接在GitHub上渲染,也能被各种搜索工具索引
  • 就是文件 —— 可以打包传输、托管于任意Git仓库,也能挂载到任何文件系统上
  • 就是YAML Front Matter —— 用于存储少量需要结构化查询的字段,如类型(type)、标题(title)、描述(description)、资源链接(resource)、标签(tags)和时间戳(timestamp)

如果你用过Obsidian、Notion、Hugo,或过去一年里各类LLM Wiki模式,对这种结构应该不会陌生。OKF的作用,正是将这些模式中实现互操作所需的关键约定正式规范化。

接下来,探讨OKF试图解决的问题、工作原理、如何上手使用以及未来发展方向。

碎片化的上下文环境

在大多数组织中,基础模型依赖的信息主要来自内部知识,例如:

  • 数据表的结构定义
  • 企业内部对某项指标的业务含义
  • 事故处理手册
  • 不同系统之间的数据关联路径
  • 旧API的弃用通知

目前,这些知识碎片分散在各种系统中:

  • 拥有各自API的元数据目录
  • Wiki、第三方系统或共享网盘
  • 代码注释、文档字符串(docstring)或Notebook单元格
  • 少数资深工程师的头脑中

当AI智能体需要回答“如何根据事件流计算周活跃用户(Weekly Active Users)?”时,它不得不从这些分散且彼此不兼容的信息源中拼凑答案。每个厂商都有自己的目录系统、SDK和知识图谱模型,而这些知识几乎无法在不同产品或组织之间自由迁移。

最终结果是:每个智能体开发者都在重复解决相同的上下文组装问题;每个目录产品厂商都在重复设计类似的数据模型;而知识本身则被锁定在最初创建它的平台中。

将知识视为持续演进的Wiki

开发团队正在改变构建AI智能体的方式。

与其让模型一遍又一遍地搜索相同文档、查找相同事实,不如为智能体提供一个共享的Markdown知识库,并让它随着时间不断完善。这种方式下,智能体负责阅读和更新文件,而团队则负责维护内容,像管理代码一样管理知识。

知名AI研究者和教育者Andrej Karpathy在他的LLM Wiki文章里把这个观点阐述得非常透彻:

那些让人们最终放弃维护个人Wiki的繁琐工作,恰恰是LLM最擅长处理的事情。

类似的“知识即Wiki(Knowledge-as-Wiki)”模式正在不断涌现,只是名称不同。例如:

  • 与编程智能体结合的Obsidian Vault
  • AGENTS.md、CLAUDE.md等约定文件
  • 包含index.md、log.md等文件,并供智能体在执行任务前查阅的仓库
  • 数据团队内部的“元数据即代码(Metadata as Code)”仓库

这种模式既有吸引力又十分强大,但每个实现都各自为政。Karpathy的Wiki、你团队的Wiki,以及某个厂商导出的知识目录,虽然看起来都很相似(Markdown、Front Matter、交叉链接),却并未被设计成能够互相协作。

目前缺少统一标准来回答:

  • 每个文档应该包含哪些字段?
  • 不同文件名分别代表什么含义?

因此,这些Wiki中沉淀的知识依然局限在原始团队内部。每当构建新的智能体时,人们都不得不重复投入大量工作。

缺少的不是新服务,而是统一格式

解决这个问题并不需要再创造一个新的知识服务平台。

真正需要的是一种格式(Format),一种能够:

  • 让任何人无需SDK就能生成
  • 让任何人无需额外集成就能使用
  • 在不同系统、组织和工具之间自由迁移
  • 与代码一起存放在版本控制系统中
  • 同时适合人类阅读和智能体解析,且无需额外转换层

OKF正是为此而设计。

OKF如何工作:一屏看懂设计

一个OKF Bundle(知识包)本质上是一个由Markdown文件组成的目录,每个文件表示一个概念(Concept)。

概念可以是任何需要记录的对象,例如:

  • 数据表
  • 数据集
  • 指标
  • 操作手册(Playbook)
  • 运维手册(Runbook)
  • API

每个概念对应一个文件,文件路径就是该概念的唯一标识:

sales/
├── index.md
├── datasets/
│   ├── index.md
│   └── orders_db.md
├── tables/
│   ├── index.md
│   ├── orders.md
│   └── customers.md
└── metrics/
    ├── index.md
    └── weekly_active_users.md

每个概念文档包含两部分:

  • YAML Front Matter:存储结构化字段
  • Markdown正文:存储其他所有内容
---
type: BigQuery Table
title: Orders
description: One row per completed customer order.
resource: https://...
tags: [sales, revenue]
timestamp: 2026-05-28T14:30:00Z
---

# Schema

| Column | Type | Description |
|---------------|-----------|------------------------------------------|
| `order_id` | STRING | Globally unique order identifier. |
| `customer_id` | STRING | FK to [customers](/tables/customers.md). |

# Joins

Joined with [customers](/tables/customers.md) on `customer_id`.

不同概念之间通过标准Markdown链接互相关联,从而将整个目录组织成一个知识图谱(Graph)。这种关系网络比文件系统天然提供的父子层级关系更加丰富。

此外,知识包还可以选择包含:

  • index.md:帮助智能体逐层浏览目录结构
  • log.md:记录知识变更历史

完整的OKF v0.1规范(包括兼容性要求、交叉链接规则以及少量保留文件名)只需一页纸即可说明。

设计背后的三项原则

1. 尽可能少做限制

OKF对每个概念只强制要求一个字段:type(类型)。

除此之外:

  • 类型如何定义
  • 是否增加其他字段
  • 正文应包含哪些章节

都由知识生产者自行决定。

规范只定义互操作的基础接口,而不限制具体内容模型。

2. 生产者与消费者解耦

OKF明确区分谁负责编写知识、谁负责消费知识。

例如:

  • 人工编写的知识包可以被AI智能体使用
  • 元数据导出工具生成的知识包可以被可视化工具浏览
  • 一个LLM生成的知识包可以被另一个LLM查询

格式本身就是双方的契约,两端工具可以独立演进和替换。

3. 格式,而非平台

OKF不依赖任何:

  • 云平台
  • 数据库
  • 模型提供商
  • 智能体框架

未来也不会要求使用专有账号或SDK来读取、写入或提供服务。

我们将其作为开放标准发布,因为知识格式的价值来自于有多少参与者共同使用它,而不是由谁拥有它。

随规范一起发布的内容

为了让OKF更具体、更容易上手,我们同时发布了生产端和消费端的参考实现:

  • 一个知识增强智能体(Enrichment Agent):遍历BigQuery数据集,为每张表和视图生成OKF概念文档,然后通过第二轮LLM分析权威文档,补充引用来源、Schema信息和关联路径。
  • 一个静态HTML可视化工具:将任何OKF知识包转换为交互式知识图谱,生成单个独立HTML文件。无需后端、无需安装,数据也不会离开当前页面。

这些示例均由参考智能体生成,并作为符合OKF规范的真实案例提交到代码仓库中。

需要强调的是,这些只是概念验证(Proof of Concept)。

参考智能体展示的是一种生成OKF的方式,而不是唯一方式;参考可视化工具展示的是一种消费OKF的方式,而不是唯一方式。我们期待未来出现更多样化的生产工具和消费工具,共同扩展整个生态。

下一步计划

OKF v0.1是一个起点,而非最终版本。

随着更多知识生产者和消费者加入,以及我们逐步理解智能体在实际应用中真正需要怎样的知识表示方式,这一格式还会持续演进。

我们从第一天起就选择开放发布,因为只有这样,知识格式才能真正成为行业标准。

无论你是在构建:

  • 知识目录系统
  • 知识增强流水线
  • 面向AI智能体的Wiki
  • 或任何与AI知识管理相关的产品

都欢迎参与进来。

接下来,你可以:

  • 阅读规范文档(非常简短)
  • 为你的数据源编写生产者(Producer),例如数据库、文档站点或其他系统
  • 开发消费者(Consumer),例如可视化工具、搜索索引或知识推理智能体
  • 使用参考实现处理自己的数据
  • 提交Issue、PR或扩展提案

代码仓库、规范文档和示例知识包均已发布在GitHub。OKF本身才是最重要的成果。我们发布的工具只是为了让这一格式真正落地,并降低尝试成本。无论你的知识目前以何种形式存在,OKF的目标都是成为未来不同系统之间交换知识的通用语言(lingua franca)。

来源:https://cloud.tencent.com.cn/developer/article/2691109
上一篇豆包TOP50高频问题:5款语音转文字工具架构与场景实测 下一篇语音转写工具快速选型指南:4类主流方案场景解析
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
CapCut AI Docker 一键部署:镜像拉取、端口映射与数据目录配置教程
AI教程 · 2026-06-30

CapCut AI Docker 一键部署:镜像拉取、端口映射与数据目录配置教程

CapCutAI容器化部署需先确认镜像来源与授权范围,再完成环境准备、镜像拉取、端口映射、数据目录挂载和启动验证,适合本地试用、团队内网演示与轻量化AI剪辑服务管理。

CapCut AI Windows本地安装配置2026最新版含下载与环境要求
AI教程 · 2026-06-30

CapCut AI Windows本地安装配置2026最新版含下载与环境要求

CapCutAI与剪映AI在Windows端适合短视频、口播、课程和营销素材剪辑,安装前需确认系统、显卡、存储与网络条件,优先选择官方渠道下载,并完成账号、素材目录、硬件加速和导出参数配置。

Veo新手保姆级安装教程:从下载到首次运行
AI教程 · 2026-06-30

Veo新手保姆级安装教程:从下载到首次运行

Veo适合用文字生成短视频,新手应先确认官方入口、准备账号与设备环境,再按网页或应用方式完成启用。首次运行重点在提示词、参数、素材合规与结果保存,避免使用非官方安装包。

Veo本地模型运行下载路径设置与性能优化指南
AI教程 · 2026-06-30

Veo本地模型运行下载路径设置与性能优化指南

Veo本地模型部署需先确认模型来源与硬件条件,再完成下载校验、目录规划、路径配置和推理参数优化。重点关注显存占用、依赖版本、缓存位置、授权范围与常见报错处理。

Veo安装失败解决指南:常见报错与日志排查及升级回滚方案
AI教程 · 2026-06-30

Veo安装失败解决指南:常见报错与日志排查及升级回滚方案

Veo安装失败通常与系统环境、依赖版本、网络源、权限和缓存有关。排查时应先确认版本要求,再查看安装日志,按报错类型处理,并提前备份项目,确保升级与回滚可控。