В роли специалиста по данным ваша основная задача заключается в использовании данных для решения бизнес-задач и создания ценности, обычно через разработку моделей. Это подразумевает проведение ряда экспериментов, в ходе которых множество идей проходит итерации, пока не будет выбрано оптимальное решение для бизнес-предложения. Оценка наилучшей модели обычно осуществляется путем минимизации или максимизации определенного показателя производительности, например, среднеквадратичной ошибки для регрессионных моделей или F1-меры для моделей бинарной классификации.
Тем не менее, разработка модели представляет собой лишь одну составляющую всего процесса. Вокруг вашей модели возникают два ключевых вопроса: решает ли ваше решение исходную проблему и какую пользу оно приносит бизнесу. Ответы на эти вопросы могут дать только заинтересованные стороны проекта, поскольку именно они определяют требования и критерии успеха. В идеальном сценарии эти аспекты были бы четко сформулированы, но на практике это часто не так. Требования могут быть довольно расплывчатыми и общими, иногда сводясь к простым формулировкам, таким как предотвращение оттока клиентов или защита клиентов от мошенничества. В подобных ситуациях специалисты по данным и заинтересованные стороны должны совместно работать над уточнением этих вопросов и определением того, что подразумевается под успехом. Для этого им необходимо достигнуть взаимопонимания, поскольку отсутствие такового может привести к недоразумениям и конфликтам, которые в итоге обрекут проект на провал.
За время моей профессиональной деятельности я неоднократно наблюдал, как заинтересованные стороны и специалисты по данным используют разные языки общения: одни ориентированы на бизнес, другие — на данные. В результате даже перспективные проекты не достигают цели, не вызывают должного интереса и не доходят до этапа внедрения. Я убежден, что для успеха в роли выдающегося специалиста по данным необходимо уметь преодолевать разрыв между бизнесом и техникой. Демонстрация влияния ваших решений через бизнес-результаты и показ потенциальной выгоды — это ключ к получению поддержки от заинтересованных сторон. В этой статье я хочу описать некоторые принципы, которые помогли мне улучшить коммуникацию при взаимодействии с бизнесом в целом.
Уточнение требований и представление результатов
Начало нового проекта — это период интенсивной активности: множество стартовых встреч, сбор команды, настройка доступа и многое другое. Однако, как специалист по данным, вы, возможно, не участвовали в этапе, который определил необходимость проекта. Это решают заинтересованные стороны и владельцы продукта, обычно на уровне руководства организации. Таким образом, высокоуровневые цели проекта формируются до того, как специалист по данным присоединяется к работе.
Поскольку требования уже определены, специалист по данным может сразу перейти к экспериментам, не уделяя должного внимания целям проекта. Он знает общую направленность и считает этого достаточным для продвижения. Но крайне важно на этом этапе потратить время на преобразование бизнес-вопроса в набор четких требований. Это гарантирует:
- Отсутствие неоднозначностей между специалистами по данным и остальным бизнесом
- Ясное понимание того, что именно нужно решить
- Четкие метрики, определяющие достижение цели
Вернемся к примеру с запросом заинтересованной стороны о защите клиентов от мошенничества. Такой запрос может вести по разным путям, и уточнение требования критически важно для точного попадания в цель. Поэтому необходимо организовывать встречи для задавания уточняющих вопросов. Примеры таких вопросов:
- Хотим ли мы предотвращать мошенничество в момент его совершения или предупреждать клиентов о рисках?
- Нужен ли ответ в формате да/нет или более детализированный?
- Предпочтительно ли автономное принятие решений или дополнение существующих процессов?
- Как часто будет запускаться решение? Это оффлайн-пакетная обработка или онлайн в реальном времени?
- Есть ли операционные ограничения, о которых нужно знать?
Например, требование реального времени для защиты от мошенничества сильно отличается от предсказания риска для клиента в ближайшие 30 дней. Такие вопросы помогут направить вас к решениям, достойным дальнейшего изучения.
Завершение экспериментов над проектом может быть таким же напряженным, как и начало. На этом этапе вы выбираете лучшее решение и представляете его бизнесу. Это решающий момент, поскольку нет гарантии, что ваше решение будет принято и перейдет к дальнейшему развитию в продукт. Внедрение любого нового процесса, такого как модель, в рабочую среду влечет затраты, которые нужно взвесить против выгоды. Учитываются вопросы ответственности за развертывание и мониторинг, а также обслуживание, если производительность перестанет соответствовать требованиям. Необходимо оценить частоту нежелательных исходов, их возможную тяжесть и последствия. Также стоит подумать об дополнительном операционном влиянии. Для платформы обнаружения мошенничества подумайте о:
- Как часто детектор пропустит мошеннические транзакции?
- Как часто детектор ошибочно классифицирует легитимные транзакции как мошеннические, влияя на клиентов?
- Каков общий объем транзакций, помеченных как мошеннические, и хватает ли операционных ресурсов для проверки всех случаев?
Чтобы развеять сомнения, нужно убедительно представить свое решение — его создание недостаточно. При демонстрации решения следует:
Начинать с проблемы, а не с технологии
Легко сосредоточиться на технических аспектах решения, таких как используемая модель или конвейер обработки данных. Ведь именно здесь вы провели последние месяцы, и хочется показать усилия по решению проблемы. Поэтому при презентации заинтересованным сторонам возникает искушение говорить о one-hot encoding, среднем заполнении пропусков и использовании библиотеки Optuna для настройки гиперпараметров модели LightGBM.
Проблема в том, что приоритетом заинтересованных сторон является не механизм работы модели, а ее возможности. Их интересует, как решается бизнес-вопрос и какая выгода получается. В этом случае нужно переориентировать представление результатов на бизнес-аспекты, акцентируя внимание на том, что решено, а не как. Следовательно, стоит реже использовать фразы вроде:
Мы разработали бинарную классификацию на LightGBM для обнаружения мошенничества
И чаще — вроде:
Предлагаемое решение повышает возможности текущих систем по обнаружению мошенничества
Бизнес-результаты против производительности модели
Связанно с предыдущим, часто акцент делается на отчетах о производительности модели. Метрики вроде F1, AUC дают объективный способ выбрать лучшую модель, и вы хотите передать эту информацию заинтересованным сторонам. Для специалиста по данным разница между recall 0.8 и 0.9 очевидна.
Однако для заинтересованных сторон производительность модели не раскрывает ценность для бизнеса. Им нужно знать влияние на текущие процессы и процедуры. Специалисты по данным должны представлять производительность в терминах бизнес-KPI. Полезно всегда учитывать:
Генерирует ли это доход, экономит ли деньги или время? Если да, то насколько?
Четкое量化 ценности решения повысит вовлеченность и шансы на принятие. Поэтому реже говорите:
Наша модель LightGBM достигла recall 0.9
И чаще:
Наше решение может выявлять мошенничество на 10 млн фунтов ежегодно
Никогда не игнорируйте объяснимость
Возможность понять и обосновать решения вашей модели — ключ к доверию заинтересованных сторон. Если вы реализуете систему для одобрения ипотечных заявок, например, важно уметь объяснить отказы, если клиенты оспорят их. Это также гарантирует отсутствие предвзятостей или дискриминации, которые могут привести к юридическим или регуляторным проблемам.
Объяснимость позволяет проводить проверки или опровергать предубеждения о полезности данных. Внедрение объяснимости на всех этапах дает уверенность заинтересованным сторонам в тщательном подходе. Ключевые моменты:
- Уметь указать, на какие признаки опирается модель
- Уметь объяснить решение через его признаки
Это подразумевает выбор моделей с хорошей объяснимостью (регрессия, деревья решений и т.д.) или использование сторонних библиотек (SHAP, LIME и т.п.).
Представление результатов для максимальной вовлеченности
После завершения экспериментов и выбора решения следующий шаг — поделиться результатами с заинтересованными сторонами для получения одобрения. Обычно это делается через презентацию, где нужно обосновать проблему и показать, почему ваше решение оптимально. Это критический момент для ясной коммуникации. Я видел, как сильные предложения проваливались из-за презентаций, которые не захватывали аудиторию или даже отталкивали ее. Создание увлекательной презентации — это искусство и навык, требующий практики.
Общие рекомендации как ориентиры:
Знайте аудиторию и цель
При начале работы над презентацией спросите себя:
Что я пытаюсь продать и кому?
Хотя фиксация работы в презентации полезна, для получения поддержки проекта фокусируйтесь на ключевом сообщении. Попытка охватить слишком много приведет к путанице и размытию сути. Спросите: «Что одно я хочу, чтобы аудитория запомнила?» — и структурируйте вокруг этого.
Уровень технических и проектных знаний аудитории влияет на подачу. Если заинтересованная сторона хорошо знакома с темой, можно опираться на общие знания. Если нет, тщательно подумайте, что можно предположить, чтобы все следовали за сообщением. Если у заинтересованной стороны технический бэкграунд, можно добавить детали о методах, но минимально. Как обсуждалось ранее, акцент на бизнес-выгодах.
Стиль имеет значение
Следование за презентацией зависит от многих факторов. Аудитория одновременно слушает и смотрит на экран, так что стиль сильно влияет. При проектировании эти советы помогли максимизировать эффект:
- Используйте тему: от бизнеса или стокового сайта — предустановленные цвета, размеры шрифтов и т.д. делают разницу
- Применяйте разделители для направления взгляда: обрамление ключевых моментов цветными блоками помогает вести аудиторию
- Не перегружайте текстом и визуалами: избегайте длинных абзацев, держите графики крупными и простыми
Только суть, без воды
Время с заинтересованными сторонами ограничено. Нужно произвести впечатление, удержать внимание и убедить в решении. Балансируйте фон, теорию, решение и влияние. Каждая слайд должна нести пользу. Способы:
- Начинайте с результатов: это не детектив, сразу покажите, что продаете
- Используйте заголовки для воздействия: они суммируют слайд и дают ключевую информацию
- Приводите примеры: для объяснения используйте данные, не абстракции
Заключение
В этой статье рассмотрено значение взаимодействия с заинтересованными сторонами для демонстрации ценности предлагаемых решений в области данных. Уточнение требований и ориентация на бизнес-влияние обеспечивают интерпретируемость результатов и возможность действий. Все это воплощается в создании увлекательной презентации, показывающей умение превращать требования в практические исходы.