аудио

52 публикаций по теме

аудио

Prompted Playlists в Spotify теперь поддерживают подкасты

Spotify ввела поддержку подкастов в ИИ-функцию Prompted Playlists для премиум-пользователей в США, Канаде, Великобритании и других странах. Пользователи задают промты для персонализированных подборок с настройками обновлений и объяснениями выбора эпизодов. Еженедельно платформа помогает открыть более 34 млн новых подкастов.

2 мин

вчера

Новости

Gemini 3.1 Flash Live — самая естественная голосовая ИИ-модель Google

Google анонсировала Gemini 3.1 Flash Live — топовую голосовую ИИ-модель с быстрыми откликами и естественными беседами. В тестах Big Bench Audio она набирает 95,9% на высоком уровне мышления и доступна по низкой цене через API и сервисы компании в 200+ странах.

2 мин

26 марта 2026 г.

Новости

Физические ИИ-устройства для записи и транскрипции встреч

Физические ИИ-устройства вроде Plaud Note, Mobvoi TicNote и других записывают очные встречи, транскрибируют речь и создают саммари. Они компактны, носимы или размером с карту, многие без обязательных подписок. Модели различаются по микрофонам, автономности и бесплатным минутам транскрипции.

5 мин

20 марта 2026 г.

Новости

ИИ на птичьих трелях распознаёт китовые сигналы

Модель Perch 2.0 от Google DeepMind, обученная на звуках птиц, точно классифицирует вокализации китов благодаря transfer learning. Тесты на морских датасетах с использованием спектрограмм и логистической регрессии показали результаты на уровне или лучше других моделей. Подход экономит ресурсы и помогает в мониторинге океанских млекопитающих.

4 мин

18 марта 2026 г.

Статьи

Запуск PersonaPlex: ИИ речь-в-речь локально

Руководство объясняет установку PersonaPlex от NVIDIA на Linux для локального запуска полнодуплексной модели ИИ речь-в-речь. Система поддерживает прерывания, естественные диалоги и веб-интерфейс в браузере, модель весит 16.7 ГБ. Доступны пресеты голосов и кастомные шаблоны для общения.

8 мин

11 марта 2026 г.

Новости

Spotify расширяет ИИ-плейлисты Prompted Playlists на новые страны

Spotify сделал доступными ИИ-плейлисты Prompted Playlists для премиум-пользователей в Великобритании, Ирландии, Австралии и Швеции. Пользователи описывают желаемое звучание, а сервис генерирует подборку с учётом истории прослушиваний, трендов и объяснениями для треков. Функция в бета-версии с лимитами, компания активно внедряет ИИ в другие разделы.

3 мин

23 февраля 2026 г.

Новости

ИИ меняет звук совместной работы

Shure и Zoom используют ИИ для революции в аудиокоммуникациях: от шумоподавления до агентных ассистентов. Пандемия ускорила инновации, сделав звук основой продуктивности в гибридном мире. Будущие разработки обещают бесшовные связи без забот о технике.

18 мин

16 февраля 2026 г.

Новости

ИИ вернул музыканту голос после БАС

БАС лишил музыканта Патрика Дарлинга голоса, но ИИ от ElevenLabs позволил воссоздать клон по старым записям и вернуться к композициям. С помощью voice clone и музыкального генератора он сочинил песню и впервые за два года выступил на сцене с группой. Технология уже помогает жертвам БМН и других болезней творчески самовыражаться.

4 мин

13 февраля 2026 г.

Новости

ИИ окрестили Ozempic музыкальной индустрии

Генераторы ИИ вроде Suno тайно проникают в производство хитов: продюсеры создают семплы и демо, но молчат из страха критики, а ИИ уже в чартах Billboard. В хип-хопе более половины семплов — от ИИ, сессионщики теряют работу. Неопределенность с копирайтом и конкуренция с гигантами вроде Google усложняют ситуацию.

4 мин

30 марта 2026 г.

Новости

Talat: ИИ-заметки с встреч остаются на вашем Mac

Talat — локальное Mac-приложение для ИИ-заметок с встреч, альтернатива облачным сервисам вроде Granola. Оно транскрибирует аудио в реальном времени, суммирует ключевые моменты и хранит данные только на устройстве, с гибкими настройками моделей. Разовая покупка за 49 долларов в предрелизе, пробный период 10 часов.

4 мин

24 марта 2026 г.

Новости

Rebel Audio: ИИ-платформа для подкастов новичкам

Rebel Audio предлагает all-in-one платформу с ИИ для новичков в подкастинге: от записи до монетизации. Проект привлёк $3,8 млн инвестиций, рынок подкастов вырастет до $114,5 млрд к 2030 году. Команда включает ветеранов индустрии, внедрены меры против рисков ИИ-контента.

5 мин

18 марта 2026 г.

Новости

Генерация музыки ИИ становится массовой с MusicFX DJ

Google DeepMind выпустил MusicFX DJ — веб-инструмент для генерации музыки ИИ в реальном времени по текстовым запросам на базе Lyria RealTime. Пользователи комбинируют до 10 слоёв, управляют с помощью слайдеров интенсивности, хаоса и плотности, получая 48 кГц стерео. Сервис упрощает творчество, доступен через API и поднимает вопросы этики в ИИ-музыке.

6 мин

16 марта 2026 г.

Новости

Сотрудники OpenAI намекают на новую омни-модель

Сотрудники OpenAI своими постами в X вызвали обсуждения новой омни-модели как преемницы GPT-4o. Исследователь Brandon McKinzie поддержал идею улучшений. Компания параллельно создает аудио BiDi для естественных прерываемых диалогов с прототипом, который пока нестабилен.

1 мин

9 марта 2026 г.

Новости

Particle: ИИ-приложение выделяет ключевые клипы из подкастов для новостей

Новостное ИИ-приложение Particle от бывших инженеров Twitter запустило Podcast Clips: функция извлекает релевантные фрагменты из подкастов и добавляет их к новостям в ленте. Пользователи слушают клипы или читают подсвеченные транскрипты, а для персоналий вроде Сэма Альтмана собирается персональный фид выступлений. Вышла подписка Particle+ за $2.99/мес с премиум-опциями и версия для Android.

4 мин

23 февраля 2026 г.

Новости

Модель DeepMind распознаёт китов по пению птиц

Биоакустическая модель Perch 2.0 от Google DeepMind, обученная в основном на звуках птиц, лучше специализированных систем распознаёт китовые вокализации. Это достижение объясняют масштабами данных, сложностью птичьих звуков и эволюционными сходствами. Такой подход ускоряет анализ новых морских открытий.

4 мин

14 февраля 2026 г.

Новости

ByteDance продвинула ИИ-видео с Seedance 2.0

ByteDance представила Seedance 2.0 — продвинутую мультимодальную модель для генерации видео длиной 4–15 секунд с аудио. Она использует референсы из видео для контроля камеры и редактирования, но пока доступна только в бета-версии. Выпуск усилил конкуренцию в Китае, подняв акции ИИ-компаний.

3 мин

9 февраля 2026 г.

аудио

Prompted Playlists в Spotify теперь поддерживают подкасты

Gemini 3.1 Flash Live — самая естественная голосовая ИИ-модель Google

Физические ИИ-устройства для записи и транскрипции встреч

ИИ на птичьих трелях распознаёт китовые сигналы

Запуск PersonaPlex: ИИ речь-в-речь локально

Spotify расширяет ИИ-плейлисты Prompted Playlists на новые страны

ИИ меняет звук совместной работы

ИИ вернул музыканту голос после БАС

ИИ окрестили Ozempic музыкальной индустрии

Talat: ИИ-заметки с встреч остаются на вашем Mac

Rebel Audio: ИИ-платформа для подкастов новичкам

Генерация музыки ИИ становится массовой с MusicFX DJ

Сотрудники OpenAI намекают на новую омни-модель

Particle: ИИ-приложение выделяет ключевые клипы из подкастов для новостей

Модель DeepMind распознаёт китов по пению птиц

ByteDance продвинула ИИ-видео с Seedance 2.0

Сейчас в тренде

Популярные темы