Google Cloud анонсировала Open Knowledge Format (OKF) — новую спецификацию, которая превращает разрозненные документы в унифицированные Markdown-файлы и делает знания переносимыми между системами. Формат развивает идею «LLM-вики», недавно популяризированную Андреем Карпати, и превращает её в совместимый стандарт. OKF v0.1 представляет знания в виде каталога Markdown-файлов с YAML-метаданными (frontmatter). Спецификация минималистична: обязательно только поле type, а также несколько опциональных — title, description, resource, tags и временные метки, плюс тело документа в Markdown для всего остального. Концепты связываются стандартными Markdown-ссылками, образуя граф знаний. Пакет OKF читаем в любом редакторе, отображается на GitHub и индексируется поисковыми инструментами.
Разрозненные знания замедляют работу ИИ-агентов
Большинство организаций знакомы с проблемой, которую решает OKF. Знания разбросаны по каталогам метаданных, вики, комментариям в коде, ячейкам ноутбуков и головам инженеров. Когда ИИ-агенту нужно написать SQL-запрос к определённому набору данных, ему приходится собирать информацию по кусочкам из всех этих источников.
Как отмечают в Google Cloud, сейчас каждый разработчик агентов решает проблему контекста с нуля, а каждый поставщик каталогов заново изобретает одни и те же модели данных. Хранилища Obsidian, подключенные к агентам-кодировщикам, конвенционные файлы AGENTS.md и CLAUDE.md, репозитории «метаданных как кода» в командах данных — все они следуют одному шаблону. Но каждое решение собрано под свои нужды и не рассчитано на совместимость с другими. Знания остаются запертыми в породившей их системе. Именно этот разрыв OKF и призван устранить.
Минимализм и переносимость
OKF требует всего одно поле (type). Какие типы существуют, какие дополнительные поля содержит документ и как устроено тело — решает производитель. Поставщик и потребитель независимы. Пакет, созданный человеком, может использоваться ИИ-агентом. А пакет, сгенерированный машиной, — отображаться в визуализаторе. OKF работает с любым облачным провайдером, базой данных или фреймворком агентов.
Вместе со спецификацией Google Cloud выпускает несколько эталонных реализаций. Среди них — агент обогащения, который сканирует наборы данных BigQuery и создаёт документ OKF для каждой таблицы; статический HTML-визуализатор; и три примера пакетов: для GA4 e-commerce, Stack Overflow и Bitcoin.
Google Cloud также обновила свой Knowledge Catalog, чтобы он мог принимать OKF и передавать его агентам. Спецификация и код доступны на GitHub. Интеграция с Knowledge Catalog задокументирована отдельно.