От случайных рекомендаций к глубокой персонализации без навязчивости
Когда многие компании даже не задумывались об агентском поведении или инфраструктурах, Booking.com уже "наткнулась" на них со своей собственной системой контекстных рекомендаций. Этот ранний опыт позволил компании избежать ажиотажа вокруг ИИ-агентов и применить дисциплинированный, многоуровневый и модульный подход к разработке моделей: небольшие специализированные модели для быстрого и дешевого вывода, крупные языковые модели (LLM) для рассуждений и понимания, а также собственные оценки, настроенные на домен, когда требуется высокая точность. Благодаря этой гибридной стратегии в сочетании с избирательным сотрудничеством с OpenAI, Booking.com удалось удвоить точность в ключевых задачах поиска, ранжирования и взаимодействия с клиентами.
Как отметил Пранав Патак, руководитель разработки ИИ-продуктов в Booking.com, в интервью VentureBeat: "Стоит ли создавать узкоспециализированных агентов и иметь армию из сотни таких помощников? Или лучше оставить их более универсальными, но тогда придется больше работать над их координацией? Это баланс, который мы все еще пытаемся найти, как и вся индустрия".
От догадок к персонализации без нарушения границ
Системы рекомендаций являются основой платформ Booking.com для взаимодействия с клиентами. Однако традиционные инструменты рекомендаций были скорее инструментами угадывания, чем настоящими рекомендациями. С самого начала Пранав Патак и его команда решили избегать универсальных решений. По их мнению, цена и рекомендации должны основываться на контексте клиента.
Изначально Booking.com использовала небольшую языковую модель масштаба BERT для определения намерений и тем. Эта модель анализировала запросы клиентов, чтобы определить, можно ли решить проблему самостоятельно или необходимо передать запрос человеку. "Мы начали с архитектуры, где нужно вызывать инструмент, если обнаружено определенное намерение и структура запроса", — объяснил Патак. "Это было очень похоже на первые агентские архитектуры в плане рассуждений и вызова инструментов".
С тех пор команда разработала эту архитектуру дальше, добавив LLM-оркестратор, который классифицирует запросы, запускает генерацию с дополненным поиском (RAG) и вызывает API или более мелкие специализированные языковые модели. "Мы смогли масштабировать эту систему довольно хорошо, потому что она была так близка по архитектуре, что с несколькими доработками у нас теперь есть полноценный агентский стек", — сказал Патак.
В результате Booking.com наблюдает двукратное увеличение точности определения тем, что освобождает время человеческих агентов на 1.5–1.7 раза. Все больше тем, даже сложных, которые ранее требовали эскалации, автоматизируются. Это способствует развитию самообслуживания и позволяет людям сосредоточиться на уникальных проблемах клиентов.
Найти баланс между разработкой и покупкой
По мере развития агентов Booking.com сталкивается с ключевым вопросом: насколько узкоспециализированными должны быть агенты? Вместо того чтобы выбирать между множеством высокоспециализированных агентов или несколькими универсальными, компания стремится к обратимым решениям и избегает "односторонних дверей", которые могут закрепить архитектуру на долгие годы.
Стратегия Патака заключается в следующем: обобщать там, где это возможно, специализировать там, где это необходимо, и сохранять гибкость дизайна агентов для обеспечения устойчивости. Команда тщательно оценивает варианты использования: где нужны более универсальные агенты для повторного использования или более специализированные для конкретных задач.
Важным фактором является также задержка. Когда критически важна точность фактов и отсутствие галлюцинаций, команда использует более крупную и медленную модель; но в случае поиска и рекомендаций скорость имеет решающее значение.
Чему другие компании могут научиться у опыта Booking.com
Путь Booking.com в области ИИ может служить важным примером для других предприятий. Оглядываясь назад, Патак признает, что они начали с довольно сложного технологического стека. Теперь они находятся в хорошем положении с этим стеком.
- Если вы только начинаете работать с LLM или агентами — стандартные API могут быть вполне достаточными.
- Не начинайте со сложных решений — решайте самые простые проблемы очевидными способами.