Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Gemini 2.5: Самые интеллектуальные модели становятся ещё лучше

Google анонсировала major обновления для моделей Gemini 2.5, включая enhanced производительность, новые возможности как Deep Think и improved безопасность. 2.5 Pro лидирует на coding и educational платформах, while 2.5 Flash становится более efficient. Новые features как нативный аудиовыход и computer use further расширяют applicability моделей для developers и enterprises.

20 мая 2025 г.
12 мин
3

Обновления моделей Gemini 2.5

Gemini 2.5 Pro продолжает оставаться любимой моделью разработчиков для программирования, а версия 2.5 Flash улучшается благодаря новому обновлению. Мы также добавляем новые возможности в наши модели, включая Deep Think — экспериментальный режим расширенного мышления для 2.5 Pro.

В марте была представлена Gemini 2.5 Pro, наша самая интеллектуальная модель на сегодняшний день, а две недели назад мы предоставили раннее обновление для разработчиков, позволяющее создавать впечатляющие веб-приложения. Сегодня мы делимся дополнительными обновлениями для серии моделей Gemini 2.5:

  • Помимо впечатляющей производительности 2.5 Pro на академических тестах, она теперь лидирует на популярных платформах WebDev Arena и LMArena, а также в области помощи в обучении.
  • Мы добавляем новые возможности для 2.5 Pro и 2.5 Flash: нативный аудиовыход для более естественного общения, улучшенные меры безопасности и возможности компьютерного использования от Project Mariner. 2.5 Pro станет ещё лучше благодаря Deep Think — экспериментальному режиму расширенного мышления для сложной математики и программирования.
  • Мы продолжаем инвестировать в опыт разработчиков, вводя сводки мыслей в Gemini API и Vertex AI для большей прозрачности, расширяя бюджеты мышления для 2.5 Pro и добавляя поддержку инструментов MCP в Gemini API и SDK для доступа к открытым инструментам.
  • 2.5 Flash теперь доступна всем в приложении Gemini, а обновлённая версия будет общедоступна в Google AI Studio для разработчиков и в Vertex AI для предприятий в начале июня, с последующим выпуском 2.5 Pro.

Этот значительный прогресс — результат неустанных усилий команд Google по улучшению технологий и их безопасному внедрению.

2.5 Pro демонстрирует лучшую производительность

Недавно мы обновили 2.5 Pro, чтобы помочь разработчикам создавать более насыщенные и интерактивные веб-приложения. Мы рады видеть положительные отзывы пользователей и продолжаем вносить улучшения на основе их反馈.

Новая 2.5 Pro лидирует на популярной платформе программирования WebDev Arena с оценкой ELO 1415. Она также возглавляет все рейтинги LMArena, которые оценивают человеческие предпочтения в различных измерениях. Благодаря контекстному окну в 1 миллион токенов, 2.5 Pro обладает передовой производительностью в понимании длинного контекста и видео.

С включением LearnLM, нашего семейства моделей, созданных с участием образовательных экспертов, 2.5 Pro теперь является ведущей моделью для обучения. В прямых сравнениях, оценивающих педагогику и эффективность, эксперты предпочли Gemini 2.5 Pro другим моделям в разнообразных сценариях. Она превзошла топовые модели по всем пяти принципам науки обучения, используемым для создания ИИ-систем.

Подробнее читайте в обновлённой карточке модели Gemini 2.5 Pro и на странице технологий Gemini.

Deep Think

Исследуя границы возможностей мышления Gemini, мы начинаем тестировать режим расширенного мышления под названием Deep Think, который использует новые исследовательские техники, позволяющие модели рассматривать несколько гипотез перед ответом.

2.5 Pro Deep Think получает впечатляющий результат на USAMO 2025, одном из самых сложных математических тестов. Она также лидирует на LiveCodeBench, сложном тесте для соревновательного программирования, и набирает 84.0% на MMMU, который проверяет мультимодальное мышление.

Поскольку мы определяем границы с 2.5 Pro DeepThink, мы уделяем дополнительное время проведению更多的 оценок безопасности и получению обратной связи от экспертов. Мы сделаем её доступной доверенным тестерам через Gemini API для сбора отзывов перед широким выпуском.

Улучшенная версия 2.5 Flash

2.5 Flash — наша самая эффективная рабочая модель, предназначенная для скорости и низкой стоимости, и теперь она лучше во многих аспектах. Она улучшилась по ключевым тестам для мышления, мультимодальности, программирования и длинного контекста, став ещё более эффективной, используя на 20-30% меньше токенов в наших оценках.

Новая 2.5 Flash теперь доступна для предварительного просмотра в Google AI Studio для разработчиков, в Vertex AI для предприятий и в приложении Gemini для всех. В начале июня она станет общедоступной для production-использования.

Подробнее читайте в обновлённой карточке модели Gemini 2.5 Flash и на странице технологий Gemini.

Новые возможности Gemini 2.5

Нативный аудиовыход и улучшения Live API

Сегодня Live API представляет предварительную версию аудиовизуального ввода и нативного аудиодиалога, позволяя напрямую создавать разговорные experiences с более естественным и выразительным Gemini.

Он также позволяет пользователю управлять тоном, акцентом и стилем речи. Например, можно указать модели использовать драматический голос при рассказе истории. И он поддерживает использование инструментов для поиска от вашего имени.

Вы можете экспериментировать с ранними функциями, включая:

  • Аффективный диалог, где модель обнаруживает эмоции в голосе пользователя и отвечает соответствующим образом.
  • Проактивное аудио, где модель игнорирует фоновые разговоры и знает, когда отвечать.
  • Мышление в Live API, где модель использует возможности мышления Gemini для поддержки более сложных задач.

Мы также выпускаем новые предварительные версии для текста в речь в 2.5 Pro и 2.5 Flash. Они впервые поддерживают нескольких говорящих, позволяя тексту в речь с двумя голосами через нативный аудиовыход.

Как и нативный аудиодиалог, текст в речь выразителен и может захватывать тонкие нюансы, такие как шёпот. Он работает на более чем 24 языках и seamlessly переключается между ними.

Эта возможность текста в речь будет доступна сегодня позже в Gemini API.

Компьютерное использование

Мы внедряем возможности компьютерного использования Project Mariner в Gemini API и Vertex AI. Компании, такие как Automation Anywhere, UiPath, Browserbase, Autotab, The Interaction Company и Cartwheel, исследуют её потенциал, и мы рады расширить её для экспериментов разработчиков этим летом.

Улучшенная безопасность

Мы значительно увеличили защиту от угроз безопасности, таких как косвенные инъекции prompts. Это когда malicious инструкции встраиваются в данные, которые извлекает ИИ-модель. Наш новый подход к безопасности помог значительно увеличить уровень защиты Gemini против атак косвенных инъекций prompts во время использования инструментов, сделав Gemini 2.5 нашей самой безопасной семейством моделей на сегодня.

Подробнее о нашей работе в области безопасности, ответственности и защиты читайте в блоге Google DeepMind.

Улучшенный опыт для разработчиков

Сводки мыслей

2.5 Pro и Flash теперь будут включать сводки мыслей в Gemini API и Vertex AI. Сводки мыслей организуют сырые мысли модели в clear формат с заголовками, ключевыми деталями и информацией о действиях модели, таких как использование инструментов.

Мы надеемся, что с более структурированным и streamlined форматом процесса мышления модели, разработчики и пользователи найдут взаимодействие с моделями Gemini более понятным и debug-дружественным.

Бюджеты мышления

Мы запустили 2.5 Flash с бюджетами мышления, чтобы дать разработчикам больше контроля над стоимостью, балансируя latency и качество. И мы расширяем эту возможность до 2.5 Pro. Это позволяет контролировать количество токенов, которые модель использует для мышления перед ответом, или даже отключать её возможности мышления.

Gemini 2.5 Pro с бюджетами будет общедоступна для стабильного production-использования в ближайшие недели, вместе с нашей общедоступной моделью.

Поддержка MCP

Мы добавили нативную поддержку SDK для определений Model Context Protocol (MCP) в Gemini API для более лёгкой интеграции с открытыми инструментами. Мы также исследуем способы развёртывания MCP серверов и других hosted инструментов, упрощая создание агентских приложений.

Мы постоянно innovating новые подходы для улучшения наших моделей и опыта разработчиков, включая повышение их эффективности и производительности, и продолжаем реагировать на обратную связь разработчиков, так что пожалуйста, продолжайте её предоставлять! Мы также удваиваем усилия в фундаментальных исследованиях — pushing границы возможностей Gemini. Скоро будет больше.

Узнайте больше о Gemini и её возможностях на нашем сайте.

Заключение

Обновления Gemini 2.5 представляют собой значительный шаг вперёд в развитии искусственного интеллекта, предлагая улучшенную производительность, новые возможности и enhanced безопасность. Эти innovations не только benefit разработчиков и enterprises, но и способствуют broader adoption ИИ-технологий в различных сферах, от образования до автоматизации. Будущие релизы продолжат расширять границы, делая ИИ более intelligent, accessible и secure для всех пользователей.