Воссоединение Маккартни и Леннона на сцене
28 апреля 2022 года на долгожданном концерте в Спокане, штат Вашингтон, Пол Маккартни поразил зрителей новаторским использованием ИИ: он вышел на сцену вместе с реалистичной копией своего давнего партнера по группе Джона Леннона, давно покинувшего этот мир.
Инженеры применили свежие достижения в обработке аудио и видео: взяли последнее совместное выступление дуэта в Лондоне 1969 года, выделили голос и образ Леннона из исходной записи и восстановили их с поразительной реалистичностью.
Годами специалисты обучали машины распознавать изображения и звуки, чтобы подобные мгновения стали реальностью. Когда Маккартни и Леннон словно воссоединились через годы и расстояния, зал замер в тишине, а многие зрители не сдержали слез.
ChatGPT и взрыв интереса к ИИ
Позже в том же году мир охватила новая волна восторга от прорыва в разговорных системах ИИ. Впервые системы, способные в реальном времени выдавать свежие, подходящие по контексту реплики на любые темы, стали общедоступными благодаря ChatGPT. Миллиарды пользователей получили возможность напрямую общаться с ИИ, что разожгло воображение, породив шквал творческих замыслов, ожиданий и опасений.
Специалисты по генерации языкового контента в ИИ ликовали от такого прогресса. Однако этот восторг затмила досада от лавины публикаций и мнений самозваных знатоков, уверявших, что генеративный ИИ способен на невозможное, а те, кто его игнорирует, останутся в прошлом.
Генеративный ИИ против предиктивного: в чем разница
Такая шумиха порождает путаницу относительно сути ИИ и его настоящих возможностей. Главная проблема в том, что генеративный ИИ отвлекает от разновидности, которая по-настоящему меняет жизнь к лучшему или даже спасает ее: предиктивного ИИ. В отличие от генеративных задач, предиктивный ИИ работает с ограниченным, заранее известным набором вариантов ответов — системе нужно лишь проанализировать данные и выбрать верный. Простой пример: направьте камеру смартфона на растение, и ИИ назовет его Western sword fern.
Генеративные же задачи лишены фиксированных правильных ответов: модель комбинирует фрагменты из обучающих данных, чтобы создать что-то новое, например, оригинальное изображение такого папоротника.
Демонстрации с чатботами, заменой лиц и синтетическим видео поражают воображение, генерируя клики и продажи — зрители фантазируют о сверхчеловеческом ИИ, сулящем изобилие или гибель. Тем временем предиктивный ИИ незаметно совершенствует прогнозы погоды и безопасность продуктов, упрощает производство музыки высокого качества, сортирует фото и рассчитывает оптимальные маршруты в пути. Мы интегрируем его в рутину, не задумываясь, — это признак его незаменимости.
Прогресс предиктивного ИИ за два десятилетия
Чтобы оценить масштабы достижений предиктивного ИИ и его перспективы, взглянем на путь последних 20 лет. В 2005 году ИИ не мог отличить человека от карандаша. К 2013-му он все еще ненадежно распознавал птиц на фото, а разница между пешеходом и бутылкой из-под Coca-Cola ставила его в тупик (оказывается, бутылки немного похожи на людей без головы).
Развертывание таких систем в реальности казалось фантастикой. Но за последние 10 лет предиктивный ИИ идеально определяет не просто птиц, а конкретные виды; он радикально улучшил критически важные медицинские услуги, такие как выявление опасных поражений и аритмии сердца. Благодаря ему сейсмологи лучше прогнозируют землетрясения, а метеорологи — наводнения. Точность взлетела в потребительских приложениях: от распознавания мелодии по напеву до обнаружения препятствий для автопилота, делая беспилотные авто реальностью.
Перспективы и гибридные подходы
В ближайшем будущем предиктивный ИИ позволит точно выявлять опухоли и предсказывать ураганы задолго до угрозы, воплощая мечты миллионов. Это может показаться менее зрелищным, чем создание собственного аниме в стиле Studio Ghibli, но вполне заслуживает ажиотажа.
Предиктивные системы обретают дополнительную мощь, когда сочетают генеративные методы в рамках строгих ограничений. Такие гибриды охватывают визуализацию одежды и переводы между языками. Скоро они дадут возможность клонировать свой голос на иностранном языке вживую — идеально для путешествий, хотя и с рисками подделок. Здесь еще простор для роста, но генеративный ИИ приносит пользу именно на базе надежного предиктивного фундамента.
Аналогия с изображением кошки
Чтобы понять различие между этими классами ИИ, представьте задачу: показать, как выглядит кошка. Генеративный путь — нарезать фрагменты из разных фото кошек (возможно, с чужих ресурсов) и склеить идеальную картинку. Именно такая виртуозность современных генеративных моделей поражает.
Предиктивный вариант проще: найти и указать на реальное фото кошки. Он экономичнее, точнее и честно ссылается на источник. Генеративный ИИ создает правдоподобные образы; предиктивный находит настоящие. Ошибка в том, что генеративные системы воспринимают как поиск, а не творчество, приводит к серьезным промахам: отмене судебных решений и отзыву научных публикаций.
Почему хайп путает понятия
Путаницу подпитывает привычка расхваливать ИИ, не уточняя его тип (часто и не зная). Легко спутать ИИ с генеративным или языковыми моделями, полагая, что все остальное вытекает само. Это логично: термин подразумевает "интеллект", а мы связываем его с языком (хотя никто точно не знает, что такое интеллект). Фраза "искусственный интеллект" специально придумана в 1950-х для эффекта и намеков на человечность. Сейчас она обозначает набор технологий обработки данных. Некоторые предлагают звать это просто "математическими вычислениями".
Предпочтение генеративному ИИ как якобы главному типу проблематично: он тратит гораздо больше энергии, чем предиктивный. Плюс использует работы людей вопреки их воле и вытесняет рабочие места, созданные благодаря тем же работам, — без отдачи. ИИ силен, но не ценой обмана авторов.
Уроки для развития ИИ
Привлекательность ИИ связана с простотой диалогового интерфейса. Но сейчас он чрезмерно полагается на генеративные методы там, где хватило бы предиктивных, — это сбивает пользователей с толку и несет затраты на энергию, использование чужого труда и потерю рабочих мест.
Мы увидели лишь намек на возможности ИИ: нынешний ажиотаж отражает потенциал, а не реальность. Генеративные подходы истощают ресурсы, уступая в репрезентативности, точности и уважении к вкладу людей.
Если перенаправить внимание с шумихи вокруг генерации на предиктивные инновации, уже меняющие быт, получится ИИ полезный, справедливый и экологичный. Системы, помогающие врачам выявлять болезни раньше, ученым предугадывать бедствия и людям передвигаться безопаснее, принесут максимум пользы.
Будущее полезного ИИ определят не самые яркие шоу, а методичный прогресс, делающий технику надежной. Соединив предиктивную мощь с грамотным обращением к данным и удобными языковыми интерфейсами, ИИ оправдает ожидания.