Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Gemini и Whisk теперь генерируют видео с помощью Veo 2

Google представил генерацию видео в Gemini Advanced и анимацию изображений в Whisk с использованием модели Veo 2. Функции доступны подписчикам Google One AI Premium и позволяют создавать высококачественные восьмисекундные ролики из текстовых запросов или изображений.

15 апреля 2025 г.
3 мин
11

Пользователи Gemini Advanced теперь могут создавать и делиться видео с использованием передовой модели Veo 2. В Gemini можно преобразовывать текстовые запросы в динамичные видеоролики, а в Google Labs через эксперимент Whisk доступна анимация изображений.

Создание видео в Gemini

Veo 2 представляет собой значительный прорыв в генерации видео, способный производить высококачественные ролики с кинематографическим реализмом. Модель лучше понимает физику реального мира и движение человека, обеспечивая плавную анимацию персонажей, реалистичные сцены и детализированную визуализацию в различных стилях.

Для генерации видео необходимо выбрать Veo 2 из выпадающего списка моделей в Gemini. Функция создаёт восьмисекундные клипы разрешением 720p в формате MP4 с соотношением сторон 16:9. Существует ежемесячный лимит на создание видео, о приближении к которому пользователь получает уведомление.

Процесс создания видео прост: достаточно описать желаемую сцену — будь то короткая история, визуальная концепция или конкретный сюжет — и Gemini воплотит идею в жизнь. Чем детальнее описание, тем больше контроля над результатом. Это открывает множество творческих возможностей, позволяя экспериментировать с нереалистичными комбинациями, различными визуальными стилями от реализма до фантастики или быстро визуализировать короткие идеи.

Созданными видео легко делиться на мобильных устройствах: достаточно нажать кнопку «Поделиться» для загрузки на платформы like TikTok или YouTube Shorts.

Примеры сгенерированных видео

  • Запрос: Медленный панорамный план огромной ледяной пещеры в сумрачном свете. Бледно-голубой свет проникает сверху, освещая фигуры из замороженных конфет в стенах льда. Две фигуры в белых экзокостюмах с включёнными фонарями на шлемах движутся через центр. Передать масштаб и безмолвие пещеры.
  • Запрос: Анимированный кадр с крошечной мышью в больших очках, читающей книгу под светом светящегося гриба в уютном лесном убежище.
  • Запрос: Аэросъёмка травянистого утёса над песчаным пляжем, где волны разбиваются о берег, а скалистый островок поднимается из океана near побережья, освещённый тёплым золотистым светом восхода или заката, передавая serene красоту тихоокеанского побережья.
  • Запрос: Таймлапс плавящегося мороженого в воксельном стиле под ясным голубым небом. Розовые, серые и белые шарики медленно теряют форму, стекая по жёлтому блочному рожку, который держит большая воксельная рука в синем рукаве. Акцент на процессе плавления, подчёркивая изменение текстуры и формы воксельных элементов по мере деформации и стекания мороженого, создавая красочное пиксельное таяние на фоне ярко-синего неба.

Доступность функции

Генерация видео постепенно становится доступной пользователям Gemini Advanced по всему миру на веб- и мобильных платформах, начиная с сегодняшнего дня и в течение следующих нескольких недель. Функция доступна для подписчиков Google One AI Premium на всех языках, поддерживаемых Gemini. Попробовать можно на сайте gemini.google.com.

Анимация изображений в Whisk

Whisk, эксперимент Google Labs, представленный в декабре, помогает быстро исследовать и визуализировать идеи с использованием текстовых и графических подсказок. Теперь с Whisk Animate можно анимировать созданные изображения.

Whisk Animate позволяет превращать изображения в яркие восьмисекундные видео с помощью Veo 2. Функция доступна для подписчиков Google One AI Premium в более чем 60 странах начиная с сегодняшнего дня. Подписчики могут опробовать её на labs.google/whisk.

Подход к безопасности

Были приняты важные меры для обеспечения безопасного опыта генерации видео. Это включает extensive red teaming и оценку, направленные на предотвращение создания контента, нарушающего политики Google. Кроме того, все видео, сгенерированные с Veo 2, помечены SynthID — цифровым водяным знаком, встроенным в каждый кадр, который указывает на искусственное происхождение видео.

Результаты Gemini в основном определяются пользовательскими запросами, и, как и любой генеративный ИИ-инструмент, могут быть случаи генерации контента, который некоторые сочтут неприемлемым. Обратная связь собирается через кнопки «нравится/не нравится», и улучшения вносятся непрерывно. Подробнее о подходе можно прочитать на сайте Gemini.

Наслаждайтесь созданием видео в приложении Gemini и Whisk как подписчики Google One AI Premium.