Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Предварительная версия Gemini 3.1 Pro от Google набрала 57 очков в Artificial Analysis Intelligence Index и обогнала Claude Opus 4.6 на четыре балла при вдвое меньшей стоимости теста. Модель лидирует в шести категориях, галлюцинации снизились на 38 п.п., но в агентных задачах и проверке фактов уступает конкурентам.
Независимые режиссеры в Google Flow Sessions использовали инструменты вроде Veo и Gemini для короткометражек вроде Murmuray и Mimesis, воплотив идеи без больших бюджетов. ИИ ускоряет и удешевляет процесс, но вызывает споры о творчестве, рабочих местах и этике. Творцы видят в нем помощника, если направлять осознанно, иначе студии зададут правила.
Google представил Gemini 3.1 Pro — обновление с сильным приростом в мышлении: на ARC-AGI-2 результат вырос до 77,1% с 31,1%. Модель лидирует в большинстве бенчмарков, доступна на ключевых платформах по низким ценам и уже в preview для всех.
Google запустил в бета-версии генерацию музыки в приложении Gemini с использованием модели Lyria 3 от DeepMind. Пользователи создают треки по текстовым описаниям, фото или видео, регулируя стиль и темп. Функция расширяется на YouTube Dream Track глобально, с защитой от копирования артистов и водяными знаками SynthID.
ИИ-агент Aletheia от Google DeepMind самостоятельно написал математическую статью, опроверг конъектуру и нашел ошибку в криптографии. Однако из 200 ответов на открытые задачи Эрдёша полезными оказались только 6,5%. Исследователи дали советы по работе с ИИ и предложили систему оценок достижений.
VirusTotal выявил сотни заражённых навыков для ИИ-агента OpenClaw на платформе ClawHub, где злоумышленники маскировали трояны вроде Atomic Stealer. OpenClaw ввёл автоматическое сканирование через партнёрство с VirusTotal, используя Code Insight на базе Gemini. Меры снижают риски, но не решают проблемы вроде инъекций промптов.
Apple разрабатывает поддержку ИИ-чатботов вроде ChatGPT в CarPlay. Это позволит водителям общаться с Gemini, Claude и другими моделями через автомобильный интерфейс. Siri при этом рискует потерять лидерство.
Firefox с версии 148 позволит полностью блокировать ИИ-функции или управлять ими по отдельности. Mozilla подчеркивает выбор пользователей и инвестирует в прозрачные ИИ-решения на фоне конкуренции. Новый CEO обещает опциональность всех новинок.
Вице-президент Google Cloud Даррен Моури предупредил, что стартапы-обертки LLM и агрегаторы ИИ рискуют не выжить без уникальных преимуществ. Индустрия требует глубоких рвов, как у Cursor или Harvey AI, а агрегаторам угрожает давление от провайдеров моделей. Перспективны vibe-кодинг, биотех, климаттех и прямые ИИ-инструменты для потребителей.
Google анонсировала Gemini 3.1 Pro — модель превосходит Gemini 3 в тестах вроде Humanity’s Last Exam и лидирует в APEX-Agents. Брендан Фуди из Mercor отметил быстрый прогресс ИИ-агентов. Это усиливает конкуренцию с OpenAI и Anthropic в разработке продвинутых моделей.
Google DeepMind интегрировала модель Lyria 3 в Gemini, которая создаёт полноценные 30-секундные треки с вокалом, текстами и обложкой из текстового промпта или медиафайлов. Функция учитывает авторские права с помощью фильтров, жалоб и водяных знаков SynthID, доступна пользователям старше 18 лет. ИИ-музыка эволюционирует быстро, вызывая судебные споры, в то время как Suno остаётся лидером рынка.
Google DeepMind представила обновленный режим «Gemini 3 Deep Think», который теперь доступен в приложении Gemini для подписчиков и через API Vertex AI. Модель лидирует в тестах на логическое мышление, академические знания и программирование, достигая уровня золотых медалей на олимпиадах. Улучшения особенно заметны в абстрактных задачах.
Apple переносит релиз переработанной Siri, анонсированной в 2024 году с Apple Intelligence. Функции выйдут постепенно: с iOS 26.4 в марте, в мае или с iOS 27 в сентябре из-за проблем в тестах. Новая версия использует Google Gemini для конкуренции с топовыми чат-ботами.
Бенчмарк WorldVQA от Moonshot AI выявил, что топовые мультимодальные модели вроде Gemini 3 Pro (47,4%) и Kimi K2.5 (46,3%) не достигают 50% в точном распознавании визуальных объектов. Модели переоценивают свою уверенность и слабы в редких знаниях о природе и культуре. Это ограничивает их применение в реальных задачах и подчеркивает риски галлюцинаций.
Moltbook — вирусная соцсеть для ИИ-агентов на базе OpenClaw — на несколько дней стала хитом интернета, набрав миллионы пользователей-ботов и тонны постов. Но эксперты видят в этом не прорыв, а спектакль: агенты имитируют поведение, а люди дергают за ниточки, плюс серьезные риски безопасности. Эксперимент показал, насколько мы далеки от настоящей автономии.
DeepSeek OCR 2 использует новый энкодер DeepEncoder V2, который перестраивает визуальные токены по смыслу и снижает их число на 80%, превосходя Gemini 3 Pro в разборе документов. Модель лидирует на OmniDocBench v1.5 с 91,09% и открыта на GitHub. Это шаг к универсальной обработке разных типов данных.