Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

OpenAI и Ginkgo запустили лабораторию под GPT-5

OpenAI и Ginkgo Bioworks создали автономную лабораторию, где GPT-5 управляет оптимизацией бесклеточного синтеза белков. За шесть циклов затрат снизились на 40 процентов, выход вырос на 27 процентов, но есть ограничения по применимости и необходимость человеческого контроля. Проект поднимает вопросы биобезопасности.

6 февраля 2026 г.
6 мин
20

OpenAI совместно с биотехнологической фирмой Ginkgo Bioworks интегрировала языковую модель GPT-5 в автоматизированную лабораторию для улучшения бесклеточного синтеза белков. Достижения ощутимы, хотя есть серьезные ограничения.

В математике или физике проверки идей возможны чисто вычислительными методами. Биология требует реальных экспериментов в лаборатории, которые требуют времени и средств. Именно здесь помогает проект OpenAI и Ginkgo Bioworks.

Компании объединили GPT-5 с полностью автоматизированной облачной лабораторией, чтобы доработать бесклеточный синтез белков (CFPS). В этой технологии белки создаются без выращивания живых клеток: аппаратура из клеток переносится в контролируемую смесь для работы. Такой подход применяется в разработке лекарств, диагностике и производстве промышленных ферментов. Как указано в сопутствующей публикации, его используют и для коммерческого выпуска конъюгата антитело-лекарство.

Доработка CFPS — сложная задача. Смеси включают множество взаимодействующих элементов: ДНК-шаблоны, клеточные экстракты (лизаты с аппаратурой), источники энергии, соли и кофакторы. Возможных комбинаций огромное количество, а влияние мелких изменений предсказать интуитивно почти невозможно. Ранние попытки с машинным обучением давали лишь небольшие сдвиги.

Шесть циклов, свыше 36 тысяч реакций, затраты ниже на 40 процентов

За шесть последовательных циклов система проверила более 36 тысяч вариантов составов реакций на 580 автоматизированных планшетах с микроячейками. Каждая такая пластина содержит множество лунок для параллельного проведения реакций. Стоимость производства тестовой флуоресцентной белковой метки sfGFP снизилась с 698 долларов за грамм до 422 долларов за грамм — это на 40 процентов лучше, чем в работе ученых из Northwestern University от августа 2025 года.

При этом выход белка вырос на 27 процентов — с 2,39 до 3,04 грамма на литр реакционной смеси. Затраты только на реагенты уменьшились на 57 процентов — с 60 до 26 долларов за грамм.

Для сравнения авторы приводят цену коммерческого набора CFPS от NEB — около 800 тысяч долларов за грамм. Однако цифры не полностью сопоставимы.

GPT-5 разрабатывает планы, роботы выполняют

Процесс работает в замкнутом цикле. GPT-5 создает цифровые планы экспериментов. Система проверки на базе Python-библиотеки Pydantic оценивает, насколько они научно обоснованы и реализуемы на оборудовании лаборатории. Только после этого планы передаются в облачную лабораторию Ginkgo Bioworks в Бостоне.

Там модульные роботы под названием Reconfigurable Automation Carts (RACs) проводят опыты самостоятельно. Каждый такой кар держит одно устройство — дозатор жидкостей, инкубатор или измерительный прибор. Роботизированные манипуляторы и рельсы перемещают планшеты между станциями. Программное обеспечение Catalyst от Ginkgo управляет всем процессом.

По завершении измерения данных возвращаются к GPT-5. Модель их разбирает, выдвигает гипотезы и готовит следующий цикл экспериментов. Участие людей ограничивалось подготовкой, загрузкой и выгрузкой реагентов и расходников. За полгода накопилось около 150 тысяч точек данных.

В первом цикле GPT-5 подбирала составы реакций без каких-либо примеров или результатов опытов — только на основе знаний из своей тренировки. Даже в таком режиме без подсказок (zero-shot) модель выдавала рабочие, хоть и не идеальные, варианты.

Доступ к инструментам обеспечил ключевой прорыв

На старте результаты измерений сильно варьировались: отклонения между повторами на одной пластине достигали 40 процентов. Чтобы повысить точность, сотрудники Ginkgo вручную подкорректировали концентрации реагентов и растворов. Отклонения снизились до медианы в 17 процентов. Таким образом, процесс не был полностью самостоятельным.

Самый заметный скачок случился с третьего цикла. Тогда GPT-5 впервые получила доступ к компьютеру, интернету, пакетам для анализа данных и свежему препринту с лучшими результатами от Northwestern. Плюс расширенные метаданные: сырые данные, отчеты об ошибках дозаторов и реальные времена инкубации.

С третьего цикла модель объединяла свои данные с знаниями из литературы. За два месяца (циклы 3–5) система обошла предыдущий рекорд. Правда, параллельно улучшили ДНК-шаблон и лизат, так что вклад каждого фактора разделить сложно.

GPT-5 опередила экспертов в выводах

GPT-5 рекомендовала нуклеозидмонофосфаты (NMPs), фосфат калия и рибозу еще до доступа к упомянутому препринту. Авторы той работы независимо выделили те же вещества как ключевые. Модель пришла к похожим умозаключениям, опираясь только на тренировку и свежие эксперименты.

GPT-5 вела читаемые записи лабораторного журнала с разборами данных и гипотезами. В частности, она отметила, что дешевый буфер HEPES сильно влияет на выход белка, фосфаты требуют узкого диапазона концентраций и pH, а добавка спермидина (вещество, стабилизирующее нуклеиновые кислоты) повышает эффективность.

Модель также разобрала экономику: сейчас более 90 процентов затрат на реакцию CFPS приходится на лизат и ДНК. Чтобы снизить цену, эффективнее повышать выход на единицу этих дорогих компонентов, чем экономить на второстепенных.

Из более чем 20 новых реагентов, предложенных GPT-5, несколько вошли в оптимальные составы: NMPs, глюкоза, фосфат калия и каталаза.

Ошибок мало, зато вопросов много

Ошибок в дизайне было немного. Из 480 планшетов лишь две имели критические проблемы — меньше одного процента. В одном случае модель изменила заданный объем, чтобы добавить реагенты. В другом сбой в конвертации единиц привел к пластине только с глюкозой и рибозой, где белок не синтезировался.

Ограничения проекта значительны. Результаты получены только для одного белка (sfGFP) и одной системы CFPS. Неясно, подойдут ли найденные составы для других белков. При тесте на двенадцати дополнительных белках гель-электрофорезом (стандартный метод) выявил лишь шесть. Для остальных нужна доработка. Контроль людей требовался на протяжении всего времени для улучшения протоколов и работы с реагентами.

OpenAI и Ginkgo Bioworks намерены распространить метод на другие биопроцессы. Способность ИИ-моделей самостоятельно улучшать лабораторные протоколы вызывает вопросы. OpenAI ссылается на свой Preparedness Framework для оценки рисков в биобезопасности. Конкретных шагов в публикации не называют.