Инструменты генеративного ИИ вроде DALL-E, Midjourney и Stable Diffusion создают фотореалистичные изображения. Но они потребляют огромные объемы энергии. Два свежих исследования демонстрируют: термодинамические вычисления способны генерировать такие картинки, тратя в десять миллиардов раз меньше энергии.
Большинство ИИ-генераторов изображений опираются на алгоритмы диффузионных моделей. Разработчики загружают в них большие коллекции фото, постепенно насыщая их шумом, пока изображения не превратятся в помехи с экрана не настроенного аналогового телевизора. Потом учат нейросети обращать этот процесс: по запросу модели начинают создавать совершенно новые изображения.
Цифровые операции, которые добавляют шум и восстанавливают картинки из помех, требуют колоссальных затрат энергии. Новая технология на основе термодинамических вычислений позволит обойтись гораздо меньшими расходами по сравнению с обычным цифровым оборудованием, убежден Стивен Уайтлэм, научный сотрудник Лоуренс Беркли Нэшнл Лаборатории в Калифорнии.
Задействуя естественный шум
Термодинамические вычисления используют физические схемы, реагирующие на шум — например, случайные тепловые колебания в окружающей среде, — чтобы выполнять расчеты с минимальными энергозатратами. Пример — прототип чипа от нью-йоркского стартапа Normal Computing: восемь резонаторов, связанных особыми куплерами. Разработчики настраивают эти куплеры под конкретную задачу, словно собирая персональный калькулятор. Затем возбуждают резонаторы, вводя шум в сеть резонаторов и куплеров. После стабилизации системы в равновесии считывают результат по новой конфигурации резонаторов.
В статье Nature Communications от 10 января Уайтлэм с коллегой показал, как построить термодинамическую нейросеть. Такой подход открывает путь к генерации изображений термодинамическим методом.
Методика Уайтлэма проста: термокомпьютеру дают набор изображений. Далее естественные случайные взаимодействия между компонентами системы позволяют изображениям деградировать, пока связи между элементами не достигнут равновесия. Следующий шаг — расчет вероятности того, что термокомпьютер с текущими связями сумеет обратить эту деградацию. Наконец, подстраивают параметры связей, чтобы вероятность выросла до максимума.
Симуляции на стандартных компьютерах, описанные 20 января в Physical Review Letters, подтвердили: такая тренировка учит термокомпьютер генерировать изображения рукописных цифр. Причем без энергоемких цифровых нейросетей и псевдослучайных генераторов шума.
«Исследование намекает: реально создать аппарат для задач машинного обучения вроде генерации изображений с заметно меньшим энергопотреблением, чем сегодня», — отмечает Уайтлэм.
Уайтлэм подчеркивает: термодинамические компьютеры пока далеки от уровня цифровых нейросетей. «Неясно, как сконструировать термокомпьютер, сопоставимый с DALL-E по качеству изображений. Придется еще потрудиться над аппаратной реализацией».
Несмотря на потенциальное превосходство в энергоэффективности, полностью реализовать его на практике окажется непросто. «Ближайшие варианты, скорее всего, займут промежуточное положение между идеалом и нынешними цифровыми системами».