Стандарт MCP от Anthropic для доступа к данным стал нормой в отрасли. Исследователи из Шанхайской лаборатории искусственного интеллекта предлагают аналогичный подход для научных задач.
Существующие ИИ-системы для исследований, такие как A-Lab, ChemCrow и Coscientist, обычно действуют обособленно, привязанные к узким рабочим процессам, которые плохо сочетаются за пределами одной организации. Протокол научного контекста (SCP) решает эту проблему. Команда из Шанхайской лаборатории искусственного интеллекта создала открытый стандарт, чтобы запустить "глобальную сеть автономных научных агентов". Главная суть — общий протоколный слой для безопасного и прозрачного взаимодействия ИИ-агентов, ученых и лабораторного оборудования.
Протокол научного контекста опирается на Model Context Protocol (MCP) от Anthropic, выпущенный в ноябре 2024 года — нынешний основной стандарт для связи моделей ИИ с внешними источниками данных. MCP подходит для обычных взаимодействий с инструментами, но, по словам разработчиков, ему не хватает ключевых возможностей для научных процессов: структурированного описания полных протоколов экспериментов, поддержки высокопроизводительных тестов с множеством параллельных запусков и координации команд специализированных ИИ-агентов.
SCP развивает MCP четырьмя способами: добавляет детальные метаданные экспериментов, заменяет прямое общение на центральный хаб, вводит умную оркестрацию процессов через API потоков экспериментов и обеспечивает интеграцию лабораторных устройств с помощью унифицированных драйверов.
Разработчики называют SCP "необходимой основой для масштабируемых научных исследований с участием агентов из разных организаций". Спецификацию и готовую реализацию выложили в открытый доступ на GitHub.
Научные исследования с ИИ
SCP опирается на два столпа. Первый — унифицированная интеграция ресурсов: протокол задает общий формат для описания и доступа к научным ресурсам, от программных инструментов и моделей ИИ до баз данных и реального лабораторного оборудования. Благодаря этому агенты ИИ могут находить и объединять функции из разных платформ и учреждений.
Второй столп — управление полным циклом экспериментов. Безопасная система с центральным хабом SCP и распределенными серверами SCP охватывает все этапы: регистрацию, планирование, выполнение, контроль и хранение. Здесь задействована детальная аутентификация и полностью отслеживаемые процессы, включая как вычисления, так и физические операции в лаборатории.
Центральный хаб SCP — это "мозг" всей конструкции. Он выступает глобальным реестром для инструментов, наборов данных, агентов и приборов. Когда ученый или агент ИИ формулирует исследовательскую задачу, хаб задействует модели ИИ для разбора запроса и расчленения его на конкретные операции.
Система создает несколько вариантов планов выполнения и предлагает лучшие из них с обоснованиями: структура зависимостей, примерное время, риски экспериментов и оценки затрат. Выбранные сценарии сохраняются в структурированном формате JSON — это договор между всеми участниками, гарантирующий воспроизводимость.
На этапе запуска хаб следит за ходом, проверяет итоги и при аномалиях выдает оповещения или активирует запасные варианты. Это особенно ценно для многоступенчатых процессов, сочетающих симуляции и реальные лабораторные тесты, считают авторы.
Команда собрала на базе SCP платформу Internal Discovery, где сейчас доступно свыше 1600 совместимых инструментов. Биология лидирует с 45,9%, за ней физика — 21,1%, химия — 11,6%. Остальное делят механика с материаловедением, математика и информатика.
По назначению вычисления впереди с 39,1%, базы данных — 33,8%. Услуги моделей — 13,3%, лабораторные операции — 7,7%, поиск литературы — 6,1%. Инструменты охватывают предсказание структур белков, докинг молекул и даже инструкции для автоматического пипетирования в роботизированных лабораториях.
Применение от разбора протоколов до поиска лекарств
Авторы приводят примеры сценариев. В одном случае ученый загружает PDF с лабораторным протоколом. Система сама вытаскивает шаги эксперимента, переводит их в формат, понятный машинам, и запускает на роботизированной установке.
Другой пример — скрининг лекарств под контролем ИИ: из 50 молекул вычисляют показатели "лекарственной пригодности" и токсичности, отсеивают по критериям, готовят структуру белка для докинга и отбирают двух перспективных кандидатов. Всё проходит как скоординированный процесс, где разные серверы SCP обмениваются запросами к базам, расчетами и анализами структур. На деле эти кейсы ещё предстоит проверить.