Компания Google представила Gemini 3 — значительное обновление своей основной мультимодальной модели. По словам разработчиков, обновленная версия демонстрирует улучшенные способности к рассуждениям, более плавную работу с различными типами данных, включая голос, текст и изображения, а также функционирует в роли агента.
Предыдущая версия, Gemini 2.5, уже поддерживает мультимодальный ввод, позволяя пользователям предоставлять изображения, рукописный текст или аудиозаписи. Однако для получения ответа в желаемом формате требуется четкое указание, а по умолчанию модель выдает обычный текстовый блок.
Gemini 3 вводит концепцию "генеративных интерфейсов", благодаря которой модель самостоятельно определяет оптимальный тип вывода для заданного запроса, создавая визуальные макеты и динамические представления вместо простого текста.
Например, при запросе рекомендаций по путешествиям модель может сформировать интерфейс, напоминающий веб-сайт, с модулями, изображениями и дополнительными вопросами вроде "Сколько дней вы планируете провести в поездке?" или "Какие виды активностей вам интересны?". Кроме того, она предлагает кликабельные варианты для дальнейшего взаимодействия.
Если нужно разъяснить какую-то идею, Gemini 3 может нарисовать схему или создать простую анимацию, если сочтет визуальное представление более подходящим.
"Генерация визуального макета создает погружающий вид в стиле журнала с фотографиями и модулями", — отметил Джош Вудворд, вице-президент Google Labs, Gemini и AI Studio. "Эти компоненты не только эстетичны, но и побуждают пользователя к вводу данных для уточнения результатов".
Вместе с Gemini 3 Google запускает Gemini Agent — экспериментальную функцию для выполнения многоэтапных задач прямо в приложении. Агент интегрируется с сервисами вроде Google Calendar, Gmail и Reminders. После предоставления доступа он способен сортировать почту или управлять расписанием.
Как и другие подобные агенты, он разбивает задания на отдельные этапы, отображает прогресс в реальном времени и запрашивает подтверждение у пользователя перед продолжением. Google позиционирует эту функцию как шаг к созданию универсального агента. Доступ к ней откроется на веб-версии для подписчиков Google AI Ultra в США с 18 ноября.
Общий подход напоминает "кодирование по настроению", когда пользователь описывает конечную цель простыми словами, а модель самостоятельно формирует необходимый интерфейс или код.
Обновление также усиливает интеграцию Gemini с существующими продуктами Google. В поисковой системе ограниченная группа подписчиков Google AI Pro и Ultra теперь может переключиться на Gemini 3 Pro — версию с акцентом на рассуждения — для получения более детальных обзоров, генерируемых ИИ на основе логического анализа, а не стандартного режима AI Mode.
Для шопинга Gemini теперь использует Google Shopping Graph, который, по данным компании, включает свыше 50 миллиардов описаний товаров, чтобы создавать персонализированные руководства по рекомендациям. Достаточно задать вопрос, связанный с покупками, или ввести соответствующий поисковый запрос, и модель сгенерирует интерактивный обзор в стиле Wirecutter с ценами и деталями продуктов, без перехода на внешние ресурсы.
Разработчикам Google продвигает генерацию программного обеспечения по одному запросу. Компания анонсировала Google Antigravity — платформу для разработки, которая служит универсальным пространством для создания и управления кодом, инструментами и рабочими процессами на основе единственного промпта.
Дерек Ни, генеральный директор Flowith — платформы для агентских приложений на базе ИИ, — в беседе с MIT Technology Review отметил, что Gemini 3 Pro устраняет ряд недостатков предыдущих моделей. Среди улучшений — более точное понимание визуального контента, качественная генерация кода и повышенная эффективность при длительных задачах, что критично для создателей ИИ-приложений и агентов.
"Учитывая преимущества в скорости и стоимости, мы внедряем новую модель в наш продукт", — добавил он. "Мы полны оптимизма относительно ее возможностей, но требуется дополнительное тестирование, чтобы оценить пределы".