Новая система на базе искусственного интеллекта разрабатывает белки, которые эффективно взаимодействуют с целевыми молекулами, открывая перспективы для улучшения создания лекарств, изучения заболеваний и других областей.
Все биологические процессы в организме, начиная от роста клеток и заканчивая иммунными реакциями, опираются на взаимодействия между молекулами, известными как белки. Подобно тому, как ключ подходит к замку, один белок может соединяться с другим, регулируя важные клеточные механизмы. Инструменты для прогнозирования структуры белков, такие как AlphaFold, уже предоставили значительные знания о том, как белки взаимодействуют друг с другом для выполнения своих функций, но эти инструменты не способны создавать новые белки для прямого управления такими взаимодействиями.
Ученые способны разрабатывать новые белки, которые надежно связываются с целевыми молекулами. Такие связывающие агенты помогают исследователям ускорять достижения в широком спектре направлений, включая разработку медикаментов, визуализацию клеток и тканей, понимание и диагностику болезней, а также устойчивость урожая к вредителям. Хотя недавние подходы на основе машинного обучения в проектировании белков добились заметного прогресса, процесс остается трудоемким и требует обширных экспериментальных проверок.
Мы представляем AlphaProteo – нашу первую систему искусственного интеллекта для создания новых, высокоэффективных белковых связывающих агентов, которые могут служить основой для исследований в биологии и здравоохранении. Эта технология способна ускорить понимание биологических процессов и способствовать открытию новых препаратов, разработке биосенсоров и многому другому.
AlphaProteo генерирует новые белковые связывающие агенты для разнообразных целевых белков, включая VEGF-A, связанный с раком и осложнениями диабета. Это первый случай, когда инструмент ИИ успешно спроектировал белковый связывающий агент для VEGF-A.
Кроме того, AlphaProteo демонстрирует более высокие показатели успеха в экспериментах и affinities связи в 3–300 раз лучше, чем у ведущих существующих методов, на семи протестированных целевых белках.
Изучение сложных механизмов связывания белков
Проектирование белковых связывающих агентов, которые плотно фиксируются на целевом белке, представляет собой сложную задачу. Классические методы требуют значительных временных затрат и включают несколько этапов интенсивной лабораторной работы. После синтеза связывающих агентов они проходят дополнительные экспериментальные циклы для повышения affinities связи, чтобы обеспечить достаточную прочность для практического применения.
Обученная на обширных данных о белках из Банка данных белков (PDB) и более чем 100 миллионах предсказанных структур от AlphaFold, система AlphaProteo освоила множество способов, которыми молекулы соединяются друг с другом. Получив структуру целевой молекулы и набор предпочтительных зон связывания на ней, AlphaProteo предлагает кандидат на роль белка, который фиксируется на цели именно в этих зонах.
Иллюстрация предсказанной структуры белкового связывающего агента, взаимодействующего с целевым белком. В синем цвете показана предсказанная структура связывающего агента, созданная AlphaProteo, предназначенная для фиксации на целевом белке. В желтом – целевой белок, конкретно рецептор-связывающий домен шиповидного белка SARS-CoV-2.
Демонстрация эффективности на ключевых целевых белках для связывания
Для проверки AlphaProteo мы спроектировали связывающие агенты для различных целевых белков, включая два вирусных белка, участвующих в инфекциях – BHRF1 и рецептор-связывающий домен шиповидного белка SARS-CoV-2 (SC2RBD), а также пять белков, задействованных в раке, воспалениях и аутоиммунных заболеваниях: IL-7Rɑ, PD-L1, TrkA, IL-17A и VEGF-A.
Наша система показывает конкурентоспособные уровни успеха в связывании и лидирующие показатели прочности фиксации. Для семи целей AlphaProteo в вычислительных моделях создала кандидатов на роль белков, которые при экспериментальной проверке надежно взаимодействовали с запланированными белками.
Сетка иллюстраций предсказанных структур семи целевых белков, для которых AlphaProteo успешно сгенерировал связывающие агенты. В синем цвете – примеры связывающих агентов, протестированных в лаборатории; в желтом – целевые белки, а в темно-желтом выделены зоны предполагаемого связывания.
Для одной из целей, вирусного белка BHRF1, 88% кандидатных молекул успешно зафиксировались при тестировании в лаборатории Google DeepMind Wet Lab. В среднем, по результатам проверок, связывающие агенты AlphaProteo фиксируются в 10 раз прочнее, чем лучшие существующие методы проектирования.
Для другой цели, TrkA, наши связывающие агенты превосходят по прочности лучшие ранее спроектированные варианты для этой цели, прошедшие несколько этапов экспериментальной оптимизации.
Столбчатая диаграмма, отображающая экспериментальные показатели успеха in vitro для результатов AlphaProteo по каждой из семи целевых белков в сравнении с другими методами проектирования. Более высокие показатели успеха означают, что требуется меньше тестов для выявления эффективных связывающих агентов.
Столбчатая диаграмма, иллюстрирующая лучшие значения affinities для дизайнов AlphaProteo без экспериментальной оптимизации по каждой из семи целевых белков в сравнении с другими методами. Более низкие значения affinities указывают на более плотную фиксацию связывающего белка на цели. Обратите внимание на логарифмическую шкалу вертикальной оси.
Подтверждение результатов
Помимо in silico валидации и тестирования AlphaProteo в собственной лаборатории, мы привлекли группы исследователей Питера Черепанова, Кэти Бентли и Дэвида Л.В. Бауэра из Института Фрэнсиса Крика для проверки белковых связывающих агентов. В различных экспериментах они углубленно изучили некоторые из наиболее сильных связывающих агентов для SC2RBD и VEGF-A. Группы подтвердили, что взаимодействия этих агентов соответствуют предсказаниям AlphaProteo. Более того, они установили, что связывающие агенты обладают полезными биологическими свойствами. Например, некоторые связывающие агенты для SC2RBD предотвращали заражение клеток SARS-CoV-2 и некоторыми его вариантами.
Результаты работы AlphaProteo свидетельствуют о том, что она может существенно сократить время на начальные эксперименты с белковыми связывающими агентами для множества применений. Тем не менее, мы осознаем ограничения системы: она не смогла спроектировать успешные связывающие агенты против восьмой цели – TNFɑ, белка, связанного с аутоиммунными заболеваниями, такими как ревматоидный артрит. Мы выбрали TNFɑ для строгой проверки AlphaProteo, поскольку вычислительный анализ показал крайнюю сложность проектирования для нее. Мы продолжим совершенствовать и расширять возможности AlphaProteo, стремясь в итоге справляться с такими трудными задачами.
Достижение прочной фиксации обычно является лишь первым этапом в создании белков, полезных для реальных применений, и в процессе исследований и разработки предстоит преодолеть множество дополнительных препятствий в биоэнергетике.
К ответственной разработке проектирования белков
Проектирование белков – это быстро развивающаяся технология, полная потенциала для продвижения науки в областях от понимания факторов, вызывающих заболевания, до ускорения создания тестов на диагностику вспышек вирусов, поддержки более устойчивых производственных процессов и даже очистки загрязнителей из окружающей среды.
Чтобы учесть возможные риски в области биобезопасности, опираясь на наш долгосрочный подход к ответственности и безопасности, мы сотрудничаем с ведущими внешними экспертами для формирования поэтапного распространения этой работы и внесения вклада в усилия сообщества по разработке лучших практик, включая новый AI Bio Forum от NTI (Nuclear Threat Initiative).
В будущем мы будем взаимодействовать с научным сообществом для применения AlphaProteo к значимым задачам биологии и изучения ее ограничений. Мы также исследуем применения в разработке лекарств в Isomorphic Labs и с нетерпением ждем будущих достижений.
В то же время мы продолжаем повышать показатели успеха и affinities алгоритмов AlphaProteo, расширять спектр решаемых задач проектирования и сотрудничать с исследователями в области машинного обучения, структурной биологии, биохимии и других дисциплин для создания ответственного и всестороннего предложения по проектированию белков для сообщества.