Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Allen AI выпустил SERA — открытые агенты для кодирования, адаптируемые к приватным репозиториям всего за 400 долларов обучения. Топ-модель SERA-32B лидирует в бенчмарке SWE-Bench-Test Verified с 54,2% успеха. Всё доступно на Hugging Face с инструкциями по быстрому запуску.
Adobe представила сервис AI Foundry, позволяющий предприятиям создавать кастомные генеративные модели ИИ на базе Firefly, адаптированные под их бренд. Эти модели помогают в генерации контента для рекламных кампаний и обеспечивают персонализацию без замены человеческих креативщиков. С 2023 года Firefly использовался для создания более 25 миллиардов активов.
Gemma 3 270M — это компактная модель с 270 миллионами параметров, разработанная для эффективной тонкой настройки задач. Она предлагает высокую энергоэффективность, сильное следование инструкциям и готовность к производственному квантованию, делая передовые ИИ-возможности доступными для устройств и исследовательских приложений.
Статья показывает три альтернативы grid search для настройки гиперпараметров: случайный поиск, байесовская оптимизация и последовательное деление пополам. На примерах с случайным лесом и датасетом MNIST демонстрируется код на Python с использованием scikit-learn и Optuna. Байесовская оптимизация дала максимальную точность, а деление пополам — наибольшую скорость.
Исследование выявило "серебряные пули" — универсальные конфигурации агентных ИИ-процессов, которые обеспечивают высокую производительность на различных наборах данных. Эти конфигурации превосходят случайную инициализацию и трансферное обучение на начальных этапах, восстанавливая около 75% от оптимальной производительности при меньших затратах. Они служат эффективной отправной точкой для оптимизации с помощью syftr.
Показаны все статьи (5)