Институт Allen AI представил SERA — набор открытых агентов для программирования, которые легко подстраивать под закрытые кодовые хранилища. Ведущая модель SERA-32B решает 54,2% задач в бенчмарке SWE-Bench-Test Verified при контексте 64K, опережая другие открытые модели аналогичного класса.
Как сообщает AI2, дообучение занимает 40 дней на GPU, а затраты составляют от 400 долларов — чтобы выйти на уровень прошлых открытых результатов, — до 12 000 долларов для показателей ведущих коммерческих моделей. Теперь небольшие команды реально могут настраивать такие агенты на своих приватных данных. SERA опирается на упрощенный метод под названием "Soft-verified Generation", обходящийся без идеально правильных примеров кода. Технические детали — в блоге Allen AI.
Эти модели поддерживают работу с Claude Code и стартуют всего с двух строк кода, по словам разработчиков из Allen AI. Сама линейка моделей, код и руководства доступны на Hugging Face под лицензией Apache 2.0.