Белок является важной частью жизни любого человека, но несмотря на то, что мы живем в XXI веке, когда нейросети рисуют картины, а 3D-принтеры — полноценные органы, полностью изучить белок ученым пока не представлялось возможности. В частности, биологи на протяжении последних 50 лет пытались определить трехмерную структуру белка: если ее понять, то можно узнать, как он взаимодействует с другими веществами, в том числе лекарствами. До недавнего времени механизм сворачивания белка так и оставался неизвестным, пока команда DeepMind, подразделение Google, которое занимается созданием нейросетей, не решила воспользоваться для решения этой задачи искусственным интеллектом.
Как определить структуру белка?
В чем же проблема определить трехмерную структуру белка? Белки склонны принимать форму без посторонней помощи, руководствуясь только законами физики. До этого у биологов было представление, как это сделать, но все упиралось во время. Для решения этой задачи необходимо определить аминокислотную последовательность белка и проанализировать связи между членами этой последовательности. Вот только эта последовательность может состоять даже из 101 аминокислоты, между которыми будет, соответственно, 100 связей. Плюс у каждой из них может быть три возможных состояния.
В итоге у конечного белка будет невероятно много вариантов структур - 3 в сотой степени. Чтобы перебрать их все, человеку потребуются тысячи лет.
Конечно, столько времени в запасе ни у кого нет, поэтому десятки лет ученые пытались решить эту задачу другим способом. Не получалось, до появления AlphaFold — алгоритма, который команда DeepMind разработала специально для этой цели.
Что такое AlphaFold?
Первую версию этого алгоритма DeepMind показала еще два года назад. AlphaFold оказался более точным, чем конкуренты, в прогнозировании трехмерной структуры белков из списка составляющих. Нейросети достаточно «скормить» последовательность аминокислот, а на выходе она покажет расстояние и углы связей между ними, что позволяет восстановить структуру белка.
Разработчики продолжили работу над алгоритмом, и 30 ноября 2020 года показали AlphaFold 2, который стал еще более точным. Идея в том, чтобы рассмотреть последовательность аминокислот в виде графа: его вершины — это аминокислотные остатки, а ребра — связи между ними. А затем дать задачу нейросети с блоком внимания исследовать его, учитывая уже известных похожих и эволюционно родственных белков. После этого из получившихся связей алгоритм выстраивает конечную трехмерную структуру белка.
Но любой нейросети нужны входные данные, на которые она может опираться, и в этом случае ученые загрузили информацию о структурах примерно 170 тысяч белков. Весь процесс обучения занял несколько недель — по сравнению с тысячами лет, о которых велась речь в начале статьи, это настоящий прорыв. Алгоритм представили на недавней конференции CASP, где AlphaFold2 занял первое место, набрав 92,4 из 100 возможных баллов (исходит из правильности расположенных аминокислотных остатков в цепочке белка). Прошлая версия алгоритма набирала максимум 60 баллов.
Зачем нужно определять структуру белка?
Это открытие позволит создать новые лекарственные препараты против болезней, поскольку с помощью структуры ученые будут знать, как работает белок, как он сворачивается и взаимодействует с другими элементами, чтобы его можно было безболезненно использовать в лекарствах. Также структура белка позволяет понять, как болезни распространяются и влияют на организм человека.
Например, болезнь Паркинсона развивается из-за накопления в организме белка альфа-синуклеина: он скручивается и образует внутри нейронов токсичные клубки — тельца Леви. Последние затем поражают нейроны в головном мозге. Однако откуда именно появляется этот белок, ученые до сих пор точно не знают. Понимание трехмерной структуры белка поможет ответить на этот вопрос.
То же самое касается болезни Альцгеймера, путь распространения которой пролегает через нарушение связи между нейронами, особенными клетками, которые обрабатывают и передают электрические и химические связи между областями мозга. Это приводит к смерти клеток мозга и накоплению двух типов белка, амилоида и тау.
Точное взаимодействие между этими двумя белками в значительной степени неизвестно. Одна из трудностей диагностики болезни Альцгеймера заключается в том, что у нас нет надежного и точного способа измерения этих белковых накоплений на ранних стадиях заболевания.
AlphaFold 2 поможет диагностировать болезнь Альцгеймера на более ранних стадиях и даст возможность для создания нужного лекарства.
Это важнейшее открытие за последние 50 лет, — говорит Джон Моулт, биолог из Университета Мэриленда, который стал соучредителем CASP в 1994 году с целью разработки вычислительных методов для точного предсказания структур белков. — В каком-то смысле проблема решена.
Возможность точно предсказать структуру белков по их аминокислотной последовательности станет огромным благом для медицины. Это значительно ускорит исследования по пониманию строительных блоков клеток и позволит быстрее и эффективнее открывать новые лекарства.
Подпишитесь на нас в Яндекс.Дзен, чтобы получить доступ к закрытым материалам, которые не публикуются даже на сайте.
Как еще может использоваться AlphaFold 2
AlphaFold 2 вряд ли сделает ненужными лаборатории, которые используют экспериментальные методы для определения структуры белков. Но алгоритм показал, что менее качественные и простые для сбора экспериментальные данные — это все, что нужно для создания хорошей структуры белка.
Я думала, что эта проблема не будет решена при моей жизни, — говорит Джанет Торнтон, биолог из Европейской лаборатории молекулярной биологии.
Она надеется, что этот подход поможет пролить свет на функцию тысяч неизвестных белков в геноме человека и разобраться в вариациях генов, вызывающих болезни, которые бывают у разных людей.
Создание AlphaFold 2 также знаменует собой поворотный момент для DeepMind. Компания наиболее известна тем, что использует ИИ для освоения таких игр, как го, но ее долгосрочная цель — разработать программы, способные превосходить возможности человеческого интеллекта. Решение грандиозных научных задач, таких как предсказание структуры белков, является одним из наиболее важных, которое может сделать искусственный интеллект. Только подумайте, что будет дальше — ведь нас ждут удивительные открытия!