На прошлой неделе компания OpenAI представила Sora — приложение в стиле TikTok, которое предлагает бесконечную ленту видео, полностью сгенерированных искусственным интеллектом, каждое длительностью до 10 секунд. В приложении можно создать «камео» себя — сверхреалистичную аватару, имитирующую внешность и голос пользователя, — и вставлять камео других людей в свои видео, в зависимости от установленных ими разрешений.
Для некоторых, кто искренне верил в обещание OpenAI создать ИИ на благо всего человечества, это приложение кажется насмешкой. Бывший исследователь OpenAI, ушедший основывать стартап по ИИ для науки, назвал Sora «бесконечной машиной для генерации мусора в стиле TikTok на базе ИИ».
Несмотря на это, приложение стремительно взлетело на вершину чарта в американском App Store от Apple. После того как я установил Sora, я быстро понял, какие типы видео сейчас набирают популярность: съёмки в стиле bodycam, где полицейские останавливают домашних животных или персонажей с товарными знаками, таких как Спанч Боб и Скуби-Ду; дипфейк-мемы с Мартином Лютером Кингом-младшим, обсуждающим Xbox; и бесконечные вариации с Иисусом Христом, адаптирующимся к современной жизни.
Не менее быстро у меня возникло множество вопросов о будущем Sora. Вот что удалось выяснить на данный момент.
Сможет ли оно удержаться?
OpenAI делает ставку на то, что значительная аудитория захочет проводить время в приложении, где можно забыть о сомнениях в подлинности контента и погрузиться в поток чистого ИИ. Один рецензент описал это так: «Это успокаивает, потому что вы точно знаете, что всё, через что скроллите, не настоящее, в отличие от других платформ, где приходится гадать, реально ли это или нет. Здесь всё ИИ, круглосуточно».
Для кого-то это звучит как кошмар. Но судя по успеху Sora, многим это нравится.
Что же привлекает пользователей? Есть два возможных объяснения. Первое — Sora как временный хайп, где люди выстраиваются в очередь, чтобы посмотреть, на что способен передовой ИИ сейчас (по моему опыту, это интересно минут пять). Второе, на которое рассчитывает OpenAI, — это настоящий сдвиг в том, какой контент приковывает внимание, и пользователи останутся, потому что Sora открывает уровень фантастического творчества, недоступного в других приложениях.
Несколько предстоящих решений могут повлиять на удержание аудитории: как OpenAI внедрит рекламу, какие ограничения наложит на контент с авторскими правами (см. ниже) и какие алгоритмы разработает для распределения контента.
Сможет ли OpenAI это потянуть финансово?
OpenAI пока не приносит прибыли, но это не редкость для Кремниевой долины. Однако необычно, что компания вкладывается в платформу для генерации видео — самую энергоёмкую (а значит, дорогую) форму ИИ на сегодняшний день. Энергозатраты на это значительно превышают те, что нужны для создания изображений или ответов на текстовые запросы в ChatGPT.
OpenAI это понимает и присоединилась к проекту стоимостью полтриллиона долларов по строительству дата-центров и новых электростанций. Но Sora — где сейчас можно бесплатно и без ограничений генерировать видео на базе ИИ — повышает ставки: сколько это будет стоить компании?
OpenAI предпринимает шаги к монетизации (например, теперь можно покупать товары прямо через ChatGPT). 3 октября генеральный директор Сэм Альтман в блог-посте написал, что «нам придётся как-то зарабатывать на генерации видео», но не вдаваясь в детали. Можно представить персонализированную рекламу и дополнительные покупки внутри приложения.
Всё же тревожно думать о том объёме выбросов, который может возникнуть, если Sora наберёт популярность. Альтман точно описал углеродный след одного запроса к ChatGPT как ничтожно малый. Но он не указал, какой он для 10-секундного видео из Sora. Вопрос времени, когда исследователи ИИ и климата начнут требовать этих данных.
Сколько исков на подходе?
Sora переполнена персонажами с авторскими правами и товарными знаками. Оно позволяет легко создавать дипфейки умерших знаменитостей. Видео используют музыку с авторскими правами.
На прошлой неделе Wall Street Journal сообщил, что OpenAI разослала письма держателям авторских прав, уведомляя, что тем придётся отказаться от участия в платформе Sora, если они не хотят, чтобы их материалы использовались, — это не стандартный подход. Законодательство о том, как компаниям ИИ следует обращаться с материалами под авторским правом, ещё не устоялось, и можно ожидать исков, оспаривающих такую практику.
В блог-посте на прошлой неделе Альтман написал, что OpenAI «получает много откликов от обладателей прав», желающих большего контроля над использованием своих персонажей в Sora. Он отметил, что компания планирует предоставить этим сторонам более «детальный контроль» над персонажами. Тем не менее, «могут быть редкие случаи, когда генерации просочатся, хотя не должны», — добавил он.
Ещё одна проблема — простота использования камео реальных людей. Люди могут ограничивать, кто использует их камео, но какие рамки будут для того, что эти камео смогут делать в видео Sora?
Это уже заставляет OpenAI реагировать. Руководитель Sora Билл Пиблз 5 октября опубликовал пост, что пользователи теперь могут ограничивать применение своего камео — запрещать появление в политических видео или произнесение определённых слов, например. Насколько это сработает? Неужели это лишь вопрос времени, пока чьё-то камео не используют для чего-то вредного, откровенного, незаконного или хотя бы жуткого, спровоцировав иск, где OpenAI признают ответственным?
В целом, мы ещё не видели Sora в полном масштабе (OpenAI по-прежнему раздаёт доступ по инвайт-кодам). Когда это случится, думаю, оно станет мрачным тестом: сможет ли ИИ создавать видео, так тонко настроенные на бесконечное вовлечение, что они превзойдут «реальные» видео в борьбе за наше внимание? В итоге Sora проверяет не только технологии OpenAI — она проверяет нас и то, сколько реальности мы готовы обменять на бесконечный скролл симуляций.