Обновление прогресса: Наша новейшая модель AlphaFold демонстрирует заметно повышенную точность и расширяет охват за пределы белков на другие биологические молекулы, включая лиганды.
С момента выхода в 2020 году AlphaFold радикально изменил подход к пониманию белков и их взаимодействий. Google DeepMind и Isomorphic Labs совместно разрабатывают основу для более мощной модели ИИ, которая охватывает не только белки, но и весь спектр биологически значимых молекул.
Мы делимся обновлением о достижениях в создании следующего поколения AlphaFold. Эта модель способна генерировать прогнозы для почти всех молекул в Банке данных белковых структур (PDB), часто достигая атомной точности.
Она открывает новые горизонты понимания и существенно повышает точность в нескольких ключевых классах биомолекул, таких как лиганды (малые молекулы), белки, нуклеиновые кислоты (ДНК и РНК), а также молекулы с посттрансляционными модификациями (PTM). Эти типы структур и комплексов жизненно важны для постижения биологических процессов в клетке и ранее были труднодоступны для точного прогнозирования.
Расширенные возможности и производительность модели способствуют ускорению прорывов в биомедицине и реализации эры 'цифровой биологии', предоставляя свежие insights в функционирование путей заболеваний, геномику, биор возобновляемые материалы, иммунитет растений, потенциальные терапевтические мишени, механизмы разработки лекарств, а также платформы для белковой инженерии и синтетической биологии.
За пределами свертывания белков
AlphaFold стал фундаментальным прорывом в прогнозировании структуры одиночных белковых цепей. Затем AlphaFold-Multimer расширил функционал на комплексы из нескольких белковых цепей, а AlphaFold2.3 улучшил эффективность и охват для более крупных комплексов.
В 2022 году прогнозы структур для почти всех известных науке каталогизированных белков были свободно опубликованы в Базе данных структур белков AlphaFold в партнерстве с Европейским институтом биоинформатики EMBL (EMBL-EBI).
На сегодняшний день базу AlphaFold использовали 1,4 миллиона пользователей из более чем 190 стран, и ученые по всему миру применяли ее прогнозы для продвижения исследований, от ускорения создания вакцин против малярии и развития открытий в области лекарств от рака до разработки ферментов, разлагающих пластик для борьбы с загрязнением.
Здесь мы демонстрируем выдающиеся способности AlphaFold в прогнозировании точных структур за пределами свертывания белков, создавая высокоточные модели для лигандов, белков, нуклеиновых кислот и посттрансляционных модификаций.
Производительность по комплексам белок-лиганд (a), белкам (b), нуклеиновым кислотам (c) и ковалентным модификациям (d).
Ускорение открытий в фармацевтике
Первичный анализ подтверждает, что наша модель значительно превосходит AlphaFold2.3 в некоторых задачах прогнозирования белковых структур, актуальных для фармацевтики, например, в связывании антител. Кроме того, точное моделирование структур белок-лиганд является ценным инструментом для разработки лекарств, поскольку помогает ученым выявлять и конструировать новые молекулы, способные стать препаратами.
Текущий стандарт в отрасли — использование 'методов докинга' для определения взаимодействий между лигандами и белками. Эти методы предполагают наличие жесткой референсной структуры белка и предполагаемого положения связывания лиганда.
Наша новейшая модель устанавливает новый эталон в прогнозировании структур белок-лиганд, опережая лучшие известные методы докинга, без необходимости в референсной структуре белка или локализации кармана лиганда — что позволяет прогнозировать для полностью новых белков, не имеющих ранее структурного описания.
Она также способна одновременно моделировать позиции всех атомов, отражая полную внутреннюю гибкость белков и нуклеиновых кислот при взаимодействии с другими молекулами — функция, недоступная в методах докинга.
Вот, к примеру, три недавно опубликованных случая с терапевтическим значением, где прогнозы нашей модели (показаны цветом) тесно соответствуют экспериментально определенным структурам (показаны серым):
- PORCN: Молекула антиракового препарата на клинической стадии, связанная с мишенью, вместе с другим белком.
- KRAS: Тернарный комплекс с ковалентным лигандом (молекулярный клей) важной мишени для рака.
- PI5P4Kγ: Селективный аллостерический ингибитор липидной киназы с множественными импликациями для заболеваний, включая рак и иммунные расстройства.
Прогнозы для PORCN (1), KRAS (2) и PI5P4Kγ (3).
Isomorphic Labs применяет эту модель следующего поколения AlphaFold для дизайна терапевтических лекарств, помогая быстро и точно характеризовать различные типы макромолекулярных структур, значимых для лечения болезней.
Новое понимание биологии
Открывая моделирование структур белков и лигандов вместе с нуклеиновыми кислотами и молекулами, содержащими посттрансляционные модификации, наша модель предлагает более быстрый и точный инструмент для изучения фундаментальной биологии.
Один из примеров — структура CasLambda, связанного с crRNA и ДНК, входящего в семейство CRISPR. CasLambda обладает способностью редактирования генома, аналогичной системе CRISPR-Cas9, известной как 'генетические ножницы', которые позволяют изменять ДНК животных, растений и микроорганизмов. Меньший размер CasLambda может сделать его более эффективным для редактирования генома.
Прогнозируемая структура CasLambda (Cas12l), связанного с crRNA и ДНК, как часть подсистемы CRISPR.
Способность последней версии AlphaFold моделировать такие сложные системы подчеркивает, как ИИ помогает глубже понимать эти механизмы и ускорять их применение в терапии. Дополнительные примеры приведены в нашем обновлении прогресса.
Продвижение научных исследований
Значительный скачок производительности нашей модели иллюстрирует потенциал ИИ в существенном усилении научного понимания молекулярных машин, составляющих тело человека и весь мир природы.
AlphaFold уже стимулировал крупные научные достижения по всему миру. Теперь следующее поколение AlphaFold способно продвигать научные исследования с цифровой скоростью.
Наши команды в Google DeepMind и Isomorphic Labs добились существенного прогресса в этой ключевой работе, и мы с нетерпением ждем возможности поделиться дальнейшими результатами.