Электричество стало одним из главных ресурсов для развития искусственного интеллекта. Однако скорости обработки данных в ИИ-системах опережают возможности операторов дата-центров по согласованию с энергосетями, из-за чего приходится снижать нагрузку на 30%.
«В этих фабриках ИИ тратится уйма электричества зря», — заявил CEO Nvidia Дженсен Хуанг на ключевом докладе ежегодной конференции GTC. Компания подчеркнула: каждый неиспользуемый ватт — это упущенная выручка.
Сегодня израильский стартап Niv-AI выходит из стелс-режима с $12 млн seed-инвестиций. Средства пойдут на точное измерение энергопотребления GPU с помощью новых сенсоров и создание инструментов для его оптимизации.
Компания из Тель-Авива основана в прошлом году CEO Томером Тимором и CTO Эдвардом Кизисом. Инвесторы: Glilot Capital, Grove Ventures, Arc VC, Encoded VC, Leap Forward и Aurora Capital Partners. Niv-AI не раскрывает оценку своей стоимости.
Фронтирные лаборатории запускают тысячи GPU одновременно для обучения и работы продвинутых моделей. При переключении между вычислениями и обменом данными с другими ускорителями возникают всплески спроса на энергию, длящиеся миллисекунды.
Такие пики усложняют управление энергопотреблением дата-центров от сети. Чтобы не остаться без света, они закупают резервные аккумуляторы для пиков или ограничивают работу GPU. В обоих случаях падает отдача от вложений в дорогую аппаратную часть.
«Нельзя дальше строить дата-центры по старым схемам», — считает Лиор Хэндлсман, партнер Grove Ventures и член совета директоров Niv-AI.
Первый этап плана Niv — разобраться в ситуации. Стартап устанавливает сенсоры на уровне стоек, фиксирующие энергопотребление GPU с точностью до миллисекунд. Это на своих серверах и у партнеров по дизайну. Задача — выявить энергопрофили разных задач глубокого обучения и разработать способы их сглаживания, чтобы высвободить скрытые мощности дата-центров.
Инженеры планируют собрать данные и обучить на них ИИ-модель. Она будет прогнозировать и выравнивать нагрузки по всему дата-центру — своего рода «копилот» для специалистов.
Через 6–8 месяцев система заработает в нескольких дата-центрах США. Идея timely: гиперскейлеры сталкиваются с проблемами поиска земли и цепочек поставок для новых объектов. Основатели видят в своем продукте недостающий «слой интеллекта» между дата-центрами и энергосетью.
«Сеть опасается, что дата-центр резко заберет слишком много энергии в неподходящий момент, — объясняет Тимор. — Мы решаем задачу с двух сторон. С одной — помогаем дата-центрам задействовать больше GPU и эффективнее тратить уже оплаченную энергию. С другой — формируем предсказуемые профили потребления для сетей».