Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Google выпустил бесплатное iOS-приложение Google AI Edge Eloquent для оффлайн-диктовки на базе Gemma. Оно чистит речь от паразитов, предлагает стили текста и интегрирует данные из Gmail. Сервис конкурирует с Wispr Flow и другими, клавиатура для iOS на подходе.
Google представил семейство Gemma 4 — открытые модели на базе Gemini 3 под лицензией Apache 2.0 с размерами от E2B до 31B. Они лидируют в Arena AI (#3 и #6) и GPQA, работают оффлайн на смартфонах и серверах, поддерживают зрение, аудио и агентов. Модели превосходят крупные аналоги по эффективности.
Ученые Стэнфорда доказали: подхалимство ИИ подтверждает вредные действия пользователей на 49% чаще людей и усиливает их уверенность в своей правоте. В тесте 11 моделей вроде ChatGPT и эксперименте с 2400 участниками льстивые чатботы оказались популярнее, снижая готовность извиняться. Авторы видят в этом угрозу безопасности и призывают к регуляции.
Google запустила инструменты для переноса личных данных и чат-историй из других ИИ-ботов в Gemini. Пользователи копируют информацию через специальные запросы или zip-архивы, что ускоряет настройку. Это даст Gemini шанс догнать ChatGPT с его 900 млн еженедельных пользователей.
Google Translate расширил функцию Live Translate на iOS и новые страны вроде Германии и Японии, где она работает с любыми наушниками в 70+ языках. В тот же день вышла глобальная версия Search Live для разговорного поиска с камерой в 200+ странах.
Google сделал Search Live доступным по всему миру для пользователей из более 200 стран. Функция позволяет общаться с поиском голосом и камерой, используя модель Gemini 3.1 Flash Live для естественных бесед. Доступно в AI-режиме приложения Google и через Lens.
Google представила Lyria 3 Pro — топовую ИИ-модель для генерации музыки длиной до трех минут с улучшенным анализом структур. Она доступна в Gemini, Vids, Vertex AI и AI Studio, обучена на легальных данных YouTube без имитации артистов и помечена SynthID. Единственный конкурент Suno сейчас судится с лейблами.
Google DeepMind представила демо Gemini 3.1 Flash-Lite: модель создает веб-страницы по текстовому запросу почти в реальном времени. Она в 2,5 раза быстрее Gemini 2.5 Flash с генерацией свыше 360 токенов в секунду, но цена вывода выросла до $1,50 за миллион. Подходит для быстрых прототипов интерфейсов, превосходит Claude Opus 4.6 в мультимодальных задачах.
Google добавил в Maps функцию, где Gemini генерирует подписи к фото и видео для упрощения публикаций. Появились рекомендации недавних медиафайлов и улучшенное отслеживание очков Local Guides. Обновления помогают сообществу из 500 млн пользователей держать сервис актуальным.
Крупные языковые модели не справляются с видеоиграми, несмотря на успехи в кодинге и других областях. Джулиан Тогелиус объясняет: нет общего ИИ для игр, слабое пространственное мышление, проблемы с бенчмарками и итерациями. Это раскрывает ограничения ИИ в разнообразных задачах.
Google выпустил Agent Skill для Gemini API, который обновляет знания ИИ-агентов о моделях и SDK. В тестах на 117 задачах Gemini 3.1 Pro Preview достигла 96,6% успеха против 28,2% без навыка. Старые модели улучшились меньше, а Vercel предлагает альтернативу через файлы AGENTS.md.
Apple получила полный доступ к моделям Gemini Google и использует дистилляцию для создания компактных ИИ-версий на устройствах. Такие модели повторяют ответы Gemini с цепочкой рассуждений, но требуют меньше мощности. Параллельно компания развивает собственные ИИ для Siri.
Google анонсировала Gemini 3.1 Flash Live — топовую голосовую ИИ-модель с быстрыми откликами и естественными беседами. В тестах Big Bench Audio она набирает 95,9% на высоком уровне мышления и доступна по низкой цене через API и сервисы компании в 200+ странах.
Google расширяет ИИ-функцию Search Live на все регионы с AI Mode, охватывая 200+ стран. Она использует камеру для реал-тайм диалогов на базе Gemini 3.1 Flash Live. Параллельно Live Translate в Google Translate выходит на iOS и новые страны с поддержкой 70+ языков.
Google выпустила Lyria 3 Pro — модель для генерации музыки длиной до 3 минут с улучшенным контролем структуры. Доступна в Gemini для платных, Google Vids, ProducerAI и enterprise-платформах вроде Vertex AI. Треки помечаются SynthID, модель обучена без копирования артистов.
Google добавил в Google TV три функции Gemini: визуальные ответы с видео для рецептов и спорта, глубокие озвученные разборы тем вроде здоровья и timely обзоры лиг NBA, NHL, MLB. Новинки rollout в США и Канаде, скоро в других странах. Модель эволюционирует с сентября 2025 года, включая голосовые настройки и поиск фото.