Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Вице-президент Google Cloud Даррен Моури предупредил, что стартапы-обертки LLM и агрегаторы ИИ рискуют не выжить без уникальных преимуществ. Индустрия требует глубоких рвов, как у Cursor или Harvey AI, а агрегаторам угрожает давление от провайдеров моделей. Перспективны vibe-кодинг, биотех, климаттех и прямые ИИ-инструменты для потребителей.
Google DeepMind интегрировала модель Lyria 3 в Gemini, которая создаёт полноценные 30-секундные треки с вокалом, текстами и обложкой из текстового промпта или медиафайлов. Функция учитывает авторские права с помощью фильтров, жалоб и водяных знаков SynthID, доступна пользователям старше 18 лет. ИИ-музыка эволюционирует быстро, вызывая судебные споры, в то время как Suno остаётся лидером рынка.
Биоакустическая модель Perch 2.0 от Google DeepMind, обученная в основном на звуках птиц, лучше специализированных систем распознаёт китовые вокализации. Это достижение объясняют масштабами данных, сложностью птичьих звуков и эволюционными сходствами. Такой подход ускоряет анализ новых морских открытий.
ИИ-агент Aletheia от Google DeepMind самостоятельно написал математическую статью, опроверг конъектуру и нашел ошибку в криптографии. Однако из 200 ответов на открытые задачи Эрдёша полезными оказались только 6,5%. Исследователи дали советы по работе с ИИ и предложили систему оценок достижений.
Isomorphic Labs из Google DeepMind запустила IsoDDE — систему, которая вдвое точнее AlphaFold 3 в предсказании белок-лигандных структур для нетипичных случаев. Она быстро находит новые места связывания на белках и оценивает прочность взаимодействия дешевле лабораторных методов. Компания уже использует инструмент в разработке лекарств.
Google DeepMind представил AlphaGenome — ИИ-инструмент для анализа некодирующей ДНК, которая составляет 98% генома и управляет регуляцией генов. Модель предсказывает 11 биологических сигналов на уровне одной пары оснований и обрабатывает участки до миллиона букв ДНК. Это помогает в исследованиях рака, редких болезней и разработке лекарств.
Google DeepMind добавил в Gemini 3 Flash функцию Agentic Vision: модель теперь активно изучает изображения через Python-код, повышая точность на 5–10%. Стартапы уже используют это для анализа чертежей, а видео демонстрируют разметку и математику. Пока не все работает автоматически, но расширения на подходят.
Модель D4RT от Google DeepMind реконструирует динамичные сцены из видео в 4D и работает до 300 раз быстрее аналогов. Она объединяет ключевые задачи в единую систему на базе Scene Representation Transformer, что ускоряет обработку и повышает точность. Технология перспективна для роботов, AR и шагов к AGI.
Бывший ведущий исследователь DeepMind Дэвид Сильвер привлекает 1 млрд долларов на seed-раунд для стартапа Ineffable Intelligence, чтобы создать супер-интеллект на базе обучения с подкреплением, обходя большие языковые модели. Компания получит оценку в 4 млрд долларов, инвесторы — Sequoia, Nvidia, Google и Microsoft. Сильвер следует тренду среди топ-специалистов вроде Sutskever и Hassabis, сомневающихся в трансформерах.
Google запустил в бета-версии генерацию музыки в приложении Gemini с использованием модели Lyria 3 от DeepMind. Пользователи создают треки по текстовым описаниям, фото или видео, регулируя стиль и темп. Функция расширяется на YouTube Dream Track глобально, с защитой от копирования артистов и водяными знаками SynthID.
Google DeepMind представила обновленный режим «Gemini 3 Deep Think», который теперь доступен в приложении Gemini для подписчиков и через API Vertex AI. Модель лидирует в тестах на логическое мышление, академические знания и программирование, достигая уровня золотых медалей на олимпиадах. Улучшения особенно заметны в абстрактных задачах.
Стартап Apptronik, спин-аут Университета Техаса, расширил раунд Series A до $935 млн при оценке $5,3 млрд. Деньги пришли от Google, Mercedes-Benz и других на разработку гуманоидного робота Apollo для embodied AI. Компания работает в этой сфере с 2013 года, участвовала в DARPA-челлендже.
Waymo разработала Waymo World Model на базе Genie 3 от Google DeepMind для генерации реалистичных сценариев автономного вождения, включая редкие события вроде торнадо или слонов. Модель использует видео-знания для создания камерных и лидарных данных, помогая лучше готовить флот к неожиданностям. Система предлагает три способа контроля симуляций и оптимизирована для масштабных тестов.
Google DeepMind предоставил доступ к Project Genie подписчикам Google AI Ultra в США. Этот инструмент генерирует интерактивные миры в реальном времени с помощью текста или изображений. Технология перспективна для обучения ИИ-агентов в симулированных условиях.
Nvidia представила новые ИИ-модели Earth-2 для прогнозов погоды, которые превосходят конкурентов вроде GenCast от Google. Они включают инструменты для среднесрочных, краткосрочных прогнозов и ассимиляции данных, ускоряя расчеты на GPU. Это делает точные предсказания доступными не только для богатых стран.
Гендиректор DeepMind Демис Хассабис удивлён, что OpenAI спешит с рекламой в ChatGPT для 800 млн пользователей. Он считает, что в ассистентах реклама рискует подорвать доверие, и Google осторожно наблюдает за рынком. Пользователи уже отвергали похожие фичи, а Gemini фокусируется на персонализации.