Databricks строит Lakebase для ИИ-агентов

Эксперты Databricks и Infosys разбирают, почему данные — ключ к корпоративному ИИ: от подготовки инфраструктуры до governance и agentic приложений. Они описывают Lakebase, Unity Catalog, примеры с 92% точностью и 95% фейлов без основы. Будущее — автоматизация, новые бизнесы на unified стеке.

Данные определяют успех ИИ в компаниях

Искусственный интеллект занимает центральное место в стратегиях многих фирм, однако основной барьер на пути к широкому внедрению — состояние их данных. Потребительские ИИ-инструменты поражают скоростью и простотой, но руководители бизнеса осознают: для развертывания ИИ в масштабах предприятия нужна надежная инфраструктура данных — единая, управляемая и подходящая под задачи.

Разрыв между амбициями по ИИ и готовностью компаний становится ключевой проблемой новой волны цифровой трансформации. Как отмечает Бавеш Патель, старший вице-президент Databricks по выходу на рынок, эффективность ИИ напрямую зависит от информации в организации. Часто эта информация разбросана по устаревшим системам, изолированным приложениям и разным форматам, из-за чего ИИ не может выдавать надежные результаты с нужным контекстом.

Главное преимущество для большинства фирм — собственные данные плюс внешние источники, добавленные к ним, подчеркивает Патель. Чтобы ИИ приносил пользу, данные нужно собирать в открытые форматы, строго управлять ими и обеспечивать доступ для разных отделов. Без такой базы компании рискуют получить некачественный ИИ, предупреждает он. Требуется переход от изолированных SaaS-платформ и разрозненных панелей к единой открытой архитектуре данных, которая объединяет структурированные и неструктурированные данные, сохраняет актуальный контекст и применяет жесткие правила доступа. При правильной подготовке фирмы достигают реальных результатов: повышают эффективность, автоматизируют сложные процессы и даже запускают новые направления бизнеса.

Фокус на ценности особенно важен, считает Раджан Падманабхан, технический директор подразделения Infosys по аналитике данных и ИИ, поскольку бизнесу нужны точные выводы для решений. Вместо разовых экспериментов передовые компании связывают внедрение ИИ с ключевыми метриками, используя рамки управления, чтобы быстро отсеивать неэффективное.

Большой потенциал — в повышении грамотности бизнес-пользователей по ИИ, говорит Патель. Они хотят понять суть технологии, ее компоненты и шаги по внедрению — от технологий до обучения персонала. По мере эволюции ИИ-агентов от помощников к автономным системам, управляющим процессами и транзакциями, победят те, кто заложит фундамент сейчас.

Новый подход — переход от систем выполнения или взаимодействия к системам действий, отмечает Падманабхан. Будущее корпоративного ИИ зависит от способности превращать разрозненную информацию в стратегический актив для умных решений и новых моделей работы.

Полный транскрипт беседы

Меган Татум: Из MIT Technology Review, я Меган Татум, и это Business Lab — подкаст, помогающий руководителям бизнеса разобраться в технологиях, выходящих из лабораторий на рынок.

Недавние прорывы в ИИ открывают мощные применения в промышленности, но слабые модели данных тормозят многие компании. Особенно agentic ИИ требует большего доступа к данным, контекста и защит. Существующие модели часто фрагментированы или изолированы, данные низкого качества. Нужен апгрейд под ИИ.

Ключевые слова: переосмысленные данные.

Гости: Бавеш Патель, старший вице-президент Databricks по выходу на рынок, и Раджан Падманабхан, технический директор Infosys по аналитике данных и ИИ.

Добро пожаловать, Бавеш и Раджан.

Раджан Падманабхан: Спасибо, рад быть здесь.

Бавеш Патель: Спасибо за приглашение.

Меган: Спасибо, что присоединились. Бавеш, начнем с вас: что подразумевают данные, готовые к ИИ? Какие новые требования ИИ предъявляет к данным и как это меняет их структуру и использование?

Бавеш: Отличный вопрос. Мир увлечен ИИ благодаря его возможностям, доступным сотням миллионов пользователей. В бизнесе качество и эффективность ИИ зависят от внутренних данных. Но в большинстве компаний данные заперты в разных приложениях и системах. Трудно понять полный обзор: что есть, насколько надежно, свежо ли. Эти данные питают ИИ, так что без контроля качества, точности и доступа вы получите плохой ИИ. Клиенты тратят силы на очистку, организацию и контроль доступа — это топливо хорошего ИИ.

Меган: Это базовая вещь, но ее легко упустить. Раджан, какой эффект дает наличие данных, готовых к ИИ, для раскрытия потенциала технологий?

Раджан: Продолжая мысль Бавеша, данные и ИИ тесно связаны. Потребительский ИИ отличается от корпоративного и agentic ИИ: бизнесу нужен контекст из всех данных — структурированных, неструктурированных, пользовательских. Платформы вроде Databricks помогают с моделями, grounding на своих данных. Третий аспект — точность вывода, ключевой барьер для бизнеса. Успешные клиенты требуют точности выше 92% — это must-have. Готовые к ИИ данные сейчас — главный фактор успеха.

Меган: Если это так критично, с чего начать строительство модели данных для ИИ?

Бавеш: Раджан прав: бизнес сталкивается с другими вызовами, чем потребительский ИИ. Сначала — контроль над данными. Многие заперты в проприетарных SaaS или системах без связей. Проанализируйте данные: что критично, как связаны. Открытые форматы, каталог данных, связи между активами, управление — первый шаг. Как ChatGPT собрал интернет-данные для трансформеров, так и фирмам нужен обзор всех данных. Не делайте случайные проекты — фокусируйтесь на бизнес-ценности. Дорожная карта ИИ, привязанная к организации данных, — основа успеха.

Меган: Ценность ключева. Infosys и Databricks помогают фирмам в трансформации. Раджан, примеры влияния на интеграцию продвинутого и agentic ИИ?

Раджан: Мы разработали рамку из шести элементов, начиная с ценности. Для крупного производителя продуктов питания применили 3M-фреймворк: measurable (измеримость), business value (бизнес-ценность), responsible (ответственность). Помогли приоритизировать инвестиции. Большинство фирм не 'рождены с ИИ', у них legacy-данные для контекста. Использовали инструменты Databricks вроде Lakebridge, AI-ассистентов для composable-сервисов. Затем подготовка данных: структурированные, неструктурированные. Unity Catalog, открытые форматы сделали данные доступными. Agent Bricks позволил создать отраслевые агенты для CPG (HR, закупки, маркетинг), разблокировав 8-9 агентных продуктов для реальных задач.

Комплексная рамка, сервисы Infosys и возможности Databricks дают устойчивые результаты, видимые в многих проектах.

Меган: Звучит как реальный прорыв. Бавеш, вы запустили операционную БД для ИИ-агентов и приложений. Как это помогает и чем отличается?

Бавеш: Databricks представила Lakebase — OLTP-БД для ИИ-приложений. В фирмах два типа данных: исторические для аналитики (Lakehouse как data warehouse) и операционные. Lakehouse продвигает ИИ: тысячи пользователей нуждаются в данных, но BI-дашборды медленные. Genie позволяет спрашивать данные на естественном языке с контекстом, root cause анализом на ваших данных — демократизация доступа.

Теперь Lakebase для OLTP: агенты нуждаются в базе для оркестрации, контекста workflow. Агент автоматизирует кампанию в маркетинге, отслеживая шаги в реальном времени. Lakebase — современная Postgres с разделенными compute/storage, serverless, branching. Агенты быстро запускают/останавливают. Объединяет OLTP/OLAP в одной системе без копирования данных, единого управления доступом. ИИ-приложения будущего снимут рутину, Lakebase — быстрее, дешевле, безопаснее.

Меган: Измерение ценности — приоритет для лидеров. Раджан, насколько оно важно для систем данных под ИИ? Как мониторить эффективность?

Раджан: Это основа успеха agentic ИИ. В примере с продуктовой компанией: как в цифровую эру эволюционировали KPI, так и для ИИ — привязка исходов к метрикам. Для оптимизации расходов на закупки: классификация трат, снижение затрат. Databricks-инструменты вроде metrics view переводят телеметрию в измеримые исходы через Genie. Если ценность есть — ускорьте; нет — fast failure, pivot. Три аспекта: метрики заранее, AI compass room для стейкхолдеров (маркетинг, supply chain, CFO). Шестьслойная рамка (value office, AI readiness, transformation fabric, governance, operations по experience SLA) обеспечивает успех.

Меган: Много практических способов. Управление и безопасность — часть AI-ready данных? Бавеш, сценарии и влияние на модели?

Бавеш: Управление — prerequisite успеха. MIT-отчет: 95% ИИ-проектов не дают ценности — из-за production. Данные в открытых форматах: ваш competitive edge (клиенты, drugs, credit). Governance: поиск данных, доверие, свежесть, источник (аналитика/реал-тайм). Контроль доступа (PDF с заказами, clinical trials). Семантика данных, Unity Catalog для discovery, access, semantics. Agent sprawl как SaaS: мониторинг производительности, feedback, costs. Фокус на repeatable governance для flywheel use cases. Databricks инвестировал в governance давно — Unity Catalog как 'мозг'. ИИ ускоряет: авто-маппинг активов.

Меган: Раджан, agentic ИИ добавляет сложности в governance?

Раджан: Как self-driving cars: автономия с правилами. Ограничения (скидка не >70%, bonus от CFO). Инструменты доступа, entitlements по identity. Sharing (MCP/UCP). Learning/relearning. Для агентов: compliance, constraints, identity, sharing. Расширяйте Unity Catalog на tools, MCP, agents с grounding. Начинайте сразу, интегрируйте в value measurement — как car по правилам.

Меган: Что ждет впереди? Бавеш, ключевые use cases на 2-3 года?

Бавеш: Три категории: 1) productivity (copilots как Genie с контекстом). 2) Автоматизация процессов (маркетинг, rebates — недели в дни/часы). 3) Business reimagination (банк создал ML/LLM для treasury forecast, сотни млн выручки). Retail: hourly data для supply chain, targeted 360 customer. Agentic commerce. Открытая платформа Databricks для multi-cloud, multi-models (Gemini multimodal, Claude code). Не lock-in.

Бизнес берет лидерство, растет AI literacy. Мы помогаем executives понять building blocks.

Меган: Раджан, что вас вдохновляет?

Раджан: Сейчас labor shift (эффективность). Далее business shift: от execution/engagement к action. Пример: lifecycle продукта в manufacturing — с 5 dept быстрее с veracity. Agentic commerce, agent-to-agent/human payments, content monetization. Economy shift: новые продукты. Unified analytical/operational core (Lakebase). Domain service mesh над core (SAP BDC). Agents как FTEs: agentic grid для collaboration. Начните с unified data/integration/governance — 100X ROI.

Перестройка стека данных под нужды ИИ

Данные определяют успех ИИ в компаниях

Полный транскрипт беседы

Горячее