Новый этап в развитии ИИ-моделей
Сегодня мы представляем стабильную версию Gemini 2.5 Flash-Lite — самой быстрой и экономичной модели в семействе Gemini 2.5 с ценой $0.10 за 1 миллион входных токенов и $0.40 за 1 миллион выходных токенов. Эта модель создана для максимальной эффективности затрат на интеллектуальные операции, обладая встроенными возможностями рассуждений, которые можно активировать для более сложных задач. Развивая успех моделей 2.5 Pro и 2.5 Flash, Gemini 2.5 Flash-Lite завершает линейку 2.5 моделей, готовых к масштабному использованию в продакшене.
Лучшее сочетание скорости и экономичности
Gemini 2.5 Flash-Lite предлагает оптимальный баланс между производительностью и стоимостью, не жертвуя качеством, особенно для задач, чувствительных к задержкам, таких как перевод и классификация.
Ключевые преимущества модели:
- Высокая скорость: Gemini 2.5 Flash-Lite демонстрирует меньшую задержку по сравнению с моделями 2.0 Flash-Lite и 2.0 Flash на широком спектре запросов.
- Экономичность: Это самая доступная модель в семействе 2.5 с ценой $0.10 за 1 миллион входных токенов и $0.40 за выходные токены, что позволяет обрабатывать большие объемы запросов с минимальными затратами. Также мы снизили стоимость аудиовходов на 40% по сравнению с превью-версией.
- Интеллектуальные возможности: Модель показывает более высокое качество результатов по сравнению с 2.0 Flash-Lite в различных тестах, включая программирование, математику, науку, рассуждения и мультимодальное понимание.
- Полная функциональность: При работе с 2.5 Flash-Lite доступно окно контекста до 1 миллиона токенов, управляемые бюджеты мышления и поддержка встроенных инструментов, таких как Grounding с Google Search, Code Execution и URL Context.
Практическое применение Gemini 2.5 Flash-Lite
С момента запуска модели уже реализованы успешные кейсы внедрения. Вот некоторые из них:
- Satlyt разрабатывает децентрализованную платформу для космических вычислений, которая преобразует обработку спутниковых данных для реального суммирования телеметрии на орбите, автономного управления задачами и анализа связи между спутниками. Скорость 2.5 Flash-Lite позволила сократить задержку критической диагностики на борту на 45% и снизить энергопотребление на 30% по сравнению с базовыми моделями.
- HeyGen использует ИИ для создания аватаров в видео и применяет Gemini 2.5 Flash-Lite для автоматизации планирования видео, анализа и оптимизации контента, а также перевода видео на более чем 180 языков. Это обеспечивает глобальный персонализированный опыт для пользователей.
- DocsHound преобразует демонстрации продуктов в документацию, используя Gemini 2.5 Flash-Lite для обработки длинных видео и извлечения тысяч скриншотов с низкой задержкой. Это ускоряет создание комплексной документации и обучающих данных для ИИ-агентов по сравнению с традиционными методами.
- Evertune помогает брендам анализировать их представление в различных ИИ-моделях. Gemini 2.5 Flash-Lite значительно ускоряет анализ и генерацию отчетов, позволяя быстро сканировать и синтезировать большие объемы выходных данных моделей для предоставления клиентам динамических и своевременных инсайтов.
Начало работы с моделью
Для использования Gemini 2.5 Flash-Lite укажите "gemini-2.5-flash-lite" в вашем коде. Если вы используете превью-версию, переключитесь на "gemini-2.5-flash-lite", которая представляет собой ту же базовую модель. Псевдоним превью Flash-Lite будет удален 25 августа.
Готовы начать работу? Опыйте стабильную версию Gemini 2.5 Flash-Lite в Google AI Studio и Vertex AI.