Bruin CLI: инструмент для работы с данными
Bruin CLI — это открытый CLI-инструмент, который объединяет загрузку данных, их преобразование, проверку качества и управление. С его помощью создают конвейеры данных на SQL и Python, загружают информацию из разных источников, проводят проверки качества и выполняют другие задачи. Основная идея — сделать командную строку удобной для эффективной работы.
Интеграция с ИИ-агентами
С появлением ИИ-агентов стало ясно, что их можно задействовать в задачах data engineering. Агенты уже умеют работать с CLI-инструментами и запускать команды shell, так что Bruin CLI тоже подходит для этого.
Первые эксперименты включали создание файла AGENTS.md с инструкциями по использованию Bruin. Это сработало на базовом уровне, но возникли сложности с поддержкой: каждая новая функция или флаг требовала обновления документации. Кроме того, файл приходилось вручную распространять среди пользователей.
Дальше рассмотрели MCP-серверы. Они хорошо подходят для предоставления удаленных возможностей, но для CLI-инструмента пришлось бы создавать отдельный инструмент для каждой команды и подкоманды. Это привело бы к большому объему поддержки, дублированию кода и переполнению контекста множеством инструментов.
Оптимальное решение: три инструмента для документации
В итоге выбрали компромисс — предоставлять только навигацию по документации, без самих команд. Получилось три инструмента:
bruin_get_overviewbruin_get_docs_treebruin_get_doc_content
ИИ-агент через MCP запрашивает документацию, изучает возможности и формирует правильную команду CLI. Затем он просто запускает Bruin CLI в shell. Так меньше ручной работы для разработчиков, а новые функции CLI сразу становятся доступны всем.
Подключение агентов к хранилищам данных
Теперь Bruin CLI позволяет связать ИИ-агентов вроде Cursor, Claude Code, Codex или любых других, поддерживающих MCP-серверы, с хранилищем данных. Поскольку вся метадата DWH хранится в Bruin, агент автоматически получает доступ к нужной бизнес-логике.
Вот короткое видео с демонстрацией инструмента:
Всё полностью открыто, запускать можно где угодно.
Bruin MCP сразу работает с такими системами:
- BigQuery
- Snowflake
- Databricks
- Athena
- Clickhouse
- Synapse
- Redshift
- Postgres
- DuckDB
- MySQL