Компании тратят миллиарды долларов на ИИ-агентов и инфраструктуру, чтобы изменить бизнес-процессы. В реальных задачах успехи невелики: агенты часто не схватывают суть бизнес-данных, правил и процедур.
Интеграции через API-менеджмент, протокол контекста модели (MCP) и подобные технологии проходят гладко. А вот чтобы агенты разобрались в смысле данных применительно к конкретному бизнесу, приходится попотеть. Корпоративные данные разбросаны по разным системам в структурированном и неструктурированном виде, и их анализ требует понимания специфики домена.
Возьмем термин "customer": в CRM для продаж он обозначает одну группу людей, а в финансовой системе — только платящих клиентов. "Product" для одного отдела — это SKU, для другого — семейство продуктов, для третьего — маркетинговый набор. Без четких связей и определений данные о "продажах продуктов" толкуют по-разному.
Чтобы агенты объединяли информацию из разных систем, им нужно разбираться в вариантах представлений. Они должны осознавать контекст данных, уметь выбирать подходящие для задачи и находить их. Схемы систем меняются, качество сбора данных хромает — это добавляет путаницы, и агенты теряются, не зная, как реагировать.
Данные еще классифицируют по категориям вроде PII (персонально идентифицируемой информации), чтобы соблюдать GDPR и CCPA. Маркировка должна быть точной, а агенты обязаны ее учитывать. Демо с агентами собрать нетрудно, но запуск в продакшен на живых бизнес-данных — совсем другая история.
Онтология как единый источник истины
Для рабочих решений с агентами нужна онтология — четкие бизнес-определения понятий, их иерархия и связи. Она привязывает термины к доменам бизнеса, создает общую базу данных, унифицирует имена полей и присваивает классификации.
Онтология бывает доменной — для здравоохранения или финансов — или заточенной под структуру компании. Ее разработка требует времени, зато процессы стандартизируются, а для ИИ-агентов закладывается крепкий фундамент.
Хранить онтологию можно в запросных форматах вроде триплсторов. Сложные правила с многошаговыми связями удобнее моделировать в графах с метками свойств, таких как Neo4j. Графы еще помогают находить новые связи и отвечать на запутанные вопросы. Публичные онтологии вроде FIBO (Finance Industry Business Ontology) и UMLS (Unified Medical Language System) — отличная база, но их адаптируют под нужды компании.
Как начать с онтологии
С готовой онтологией агенты получают четкие ориентиры. Их просят ориентироваться на онтологию при поиске данных и связей. При необходимости агентный слой выдает ключевые детали онтологии и помогает с данными. Бизнес-правила и политики встраивают прямо в онтологию — агенты их соблюдают. Так агенты крепко стоят на земле и получают барьеры на основе реального бизнес-контекста.
Агенты, настроенные на онтологию, держатся в рамках и не выдумывают из-за особенностей больших языковых моделей (LLM). Например, политика гласит: статус займа остается "pending", пока все связанные документы не получат флаг verified, установленный в "true". Агенты обходятся этим правилом, определяют недостающие документы и запрашивают базу знаний.
Вот пример реализации:

Как показано, агент распознавания документов (DocIntel) обрабатывает структурированные и неструктурированные данные, заполняя базу Neo4j по онтологии домена бизнеса. Агент поиска данных в Neo4j находит нужное и передает другим агентам для выполнения процессов. Агенты общаются по протоколу вроде A2A (agent to agent). Протокол AG-UI (Agent User Interaction) позволяет строить универсальные интерфейсы для отображения работы агентов и их ответов.
Такой подход блокирует выдумки: агенты идут строго по онтологическим путям, сохраняя классификации и связи данных. Масштабирование просто — добавляют новые активы, связи и политики, агенты их автоматически учитывают. Правила на уровне системы, а не отдельных сущностей, помогают контролировать галлюцинации. Если агент выдумает "customer", проверка связанных данных в поиске выявит несоответствие и устранит проблему. Система растет вместе с бизнесом, справляясь с его динамикой.
Такая архитектура усложняет поиск данных и требует графовых баз, но для крупных компаний это правильные барьеры. Агенты получают указания для координации сложных процессов.