SynthID от Google DeepMind встраивает водяные знаки ИИ

Google DeepMind разработала SynthID — фреймворк для незаметных водяных знаков в ИИ-контенте: текст, изображения, аудио, видео. Водяные знаки выдерживают типичные изменения и обнаруживаются детекторами. Это помогает бороться с дипфейками, дезинформацией и повышает прозрачность ИИ.

Введение

С ростом мощности контента, созданного ИИ, разграничить его с материалами от человека становится сложнее. Чтобы справляться с угрозами вроде дезинформации, дипфейков и неправильного использования синтетики, Google DeepMind выпустила SynthID — набор инструментов для встраивания незаметных цифровых водяных знаков в ИИ-контент с последующей надёжной проверкой.

Водяные знаки добавляются на этапе генерации, что позволяет подтверждать источник материала и укреплять прозрачность плюс доверие к ИИ. SynthID охватывает текст, изображения, аудио и видео с методами, заточенными под каждый формат. Здесь разберём устройство SynthID, принципы работы и применение водяных знаков для текста.

В основе SynthID лежит фреймворк для водяных знаков и их обнаружения в ИИ-контенте. Он внедряет незаметные сигналы в генерируемый ИИ текст, изображения и видео. Сигналы переживают сжатие, масштабирование, обрезку и типичные изменения. В отличие от подходов на метаданных, таких как Coalition for Content Provenance and Authenticity (C2PA), SynthID действует на уровне модели или пикселей. Вместо присоединения метаданных после создания он прячет подпись внутри самого контента — невидимую или неслышимую для людей, но распознаваемую сканерами.

SynthID создаётся незаметным для глаз и ушей, стойким к искажениям и легко обнаруживаемым программами.

SynthID встроен в модели Google: Gemini для текста, Imagen для изображений, Lyria для аудио и Veo для видео. Есть также портал SynthID Detector для проверки загруженного контента.

Почему SynthID важен

Генеративный ИИ производит реалистичный текст, изображения, аудио и видео, неотличимые от человеческих. Это создаёт опасности:

дипфейковые видео и поддельные материалы
дезинформация и обманный контент
незаконное использование ИИ-материалов без раскрытия

SynthID оставляет метки происхождения, чтобы платформы, исследователи и пользователи могли отследить источник и понять, синтетический ли контент.

Технические принципы водяных знаков SynthID

Подход SynthID опирается на стеганографию — сокрытие сигналов в данных так, чтобы их присутствие не ощущалось, но с ключом или детектором сигналы извлекались.

Главные цели:

водяные знаки не портят качество для пользователей
они выдерживают сжатие, обрезку, шум и фильтры
водяной знак чётко показывает, что контент от модели с SynthID

Вот как SynthID реализует это для разных форматов.

Текст

Водяные знаки на основе вероятностей

SynthID встраивает сигналы при генерации текста, корректируя распределения вероятностей, которые большие языковые модели (LLM) используют для выбора следующего токена (слова или его части).

Метод использует вероятностный характер генерации текста: лёгкие корректировки не влияют на качество, но оставляют след для отслеживания.

Изображения и видео

Водяные знаки на уровне пикселей

Для изображений и видео SynthID прячет водяной знак прямо в пикселях. Во время генерации, например в диффузионной модели, значения пикселей слегка меняются в ключевых местах.

Изменения ниже порога человеческого восприятия, но несут машинно-читаемый узор. В видео водяной знак применяется к каждому кадру, что позволяет детектировать его даже после обрезки, сжатия, шума или фильтров.

Аудио

Кодирование на основе спектрограммы

Для аудио водяной знак внедряется через спектральное представление звука.

преобразовать звуковую волну в представление время-частота (спектрограмму)
зашифровать узор водяного знака в спектрограмме с учётом психоакустики (восприятия звука)
восстановить волну из изменённой спектрограммы, чтобы водяной знак оставался неслышимым для уха, но видимым для детектора SynthID

Такой способ сохраняет обнаружимость после сжатия, добавления шума или изменения скорости — хотя сильные трансформации ослабляют сигнал.

Обнаружение и проверка водяных знаков

После встраивания детектор SynthID сканирует контент на наличие скрытой подписи.

Портал SynthID Detector позволяет загружать материалы для поиска водяных знаков. Детектор подсвечивает зоны с сильным сигналом для точной проверки подлинности.

Сильные стороны и ограничения SynthID

SynthID выдерживает типичные трансформации: обрезку, изменение размера, сжатие изображений и видео, добавление шума, конвертацию аудио. Для текста справляется с лёгкими правками и перефразировками.

Но радикальные правки, жёсткое перефразирование или не-ИИ изменения снижают вероятность обнаружения. Детектор SynthID работает в основном с контентом от интегрированных моделей Google, а не от внешних без поддержки SynthID.

Применение и влияние

Основные сценарии SynthID:

проверка оригинальности — отделение ИИ-контента от человеческого
борьба с дезинформацией через отслеживание синтетических материалов в обманных историях
помощь СМИ, платформам compliance и регуляторам в фиксации источников
поддержка исследований и академической честности для ответственного ИИ

Постоянные идентификаторы в ИИ-выходах повышают прозрачность и доверие в экосистемах генеративного ИИ. С ростом распространения водяные знаки могут стать нормой в индустрии и науке.

Заключение

SynthID — шаг вперёд в отслеживании ИИ-контента с криптостойкими незаметными водяными знаками прямо в медиа. Благодаря корректировке вероятностей токенов для текста, изменениям пикселей для изображений и видео, кодированию спектрограммы для аудио, SynthID балансирует невидимость, стойкость и обнаружимость без ущерба качеству.

По мере эволюции генеративного ИИ такие технологии, как SynthID, помогут обеспечивать ответственное использование, пресекать злоупотребления и сохранять доверие в эпоху повсеместной синтетики.

SynthID: что это такое и как работает

Введение

Почему SynthID важен

Технические принципы водяных знаков SynthID

Текст

Водяные знаки на основе вероятностей

Изображения и видео

Водяные знаки на уровне пикселей

Аудио

Кодирование на основе спектрограммы

Обнаружение и проверка водяных знаков

Сильные стороны и ограничения SynthID

Применение и влияние

Заключение

Горячее

Тревожный сигнал: реальная цена ИИ от Google и Amazon

Alibaba запрещает сотрудникам использовать Claude Code

Последний экзамен человечества — отвлекающий манёвр?

Gemini Spark от Google теперь доступен на Mac

Anthropic представила Claude Science — ИИ-помощника для учёных

Сейчас в тренде