Искусственный интеллект для физики белка
Член-корреспондент РАН Алексей Финкельштейн (Институт белка РАН, биологический факультет МГУ), кандидат физико-математических наук Наталья Богатырёва (Институт белка РАН), кандидат физико-математических наук Дмитрий Иванков (Центр молекулярной и клеточной биологии Сколковского института науки и технологий)
Не так давно мировая наука получила в своё распоряжение новую разновидность искусственного интеллекта — программу AlphaFold. Порой можно услышать, что эта программа заменяет собой целую область молекулярной биологии.
Не так давно мировая наука получила в своё распоряжение новую разновидность искусственного интеллекта — программу AlphaFold. Порой можно услышать, что эта программа заменяет собой целую область молекулярной биологии — ту, где занимаются пространственными структурами белков. AlphaFold действительно использует весьма и весьма успешный алгоритм в предсказании трёхмерных «портретов» белковых молекул. Однако прежде чем говорить о революционном успехе, нужно уточнить, что именно предсказывает искусственный интеллект этой программы, как он это делает и что он «знает».
В чём сила программы AlphaFold
Белки — это и молекулярные машины, и строительные блоки, и оружие живой клетки. Белки образованы полипептидными цепями, обычно весьма длинными, включающими сотни аминокислотных остатков. Клетка синтезирует белки из двадцати основных аминокислот, последовательность которых в полипептидных цепях кодируется генами. Но ни один белок не существует в виде прямой «палки» из сшитых друг с другом аминокислот. Аминокислотные остатки полипептидной цепи неизбежно взаимодействуют между собой. Физико-химические взаимодействия определяют геометрию связей между атомами, их сближение и отталкивание, их отношения с окружающей средой — водой, ионами, другими молекулами. Полипептидная цепь многократно изгибается, накладывается сама на себя — будучи изначально неупорядоченной, она приобретает определённую, трёхмерную структуру. Происходит то, что называется самоорганизацией, или сворачиванием белка. Именно в свёрнутом виде белок, можно сказать, становится самим собой. Биологические функции белков тесно связаны с тем, как выглядят их трёхмерные (3D) структуры.
Многие тысячи таких пространственных структур уже определены экспериментально — с помощью рентгеноструктурного анализа, ядерного магнитного резонанса и криоэлектронной микроскопии. Эти трёхмерные «портреты» белков хранятся — в виде огромных наборов 3D-координат всех атомов белка — в компьютерном банке белковых данных PDB (Protein Data Bank) и других подобных банках. Однако рентгеноструктурный анализ, ядерный магнитный резонанс и криоэлектронная микроскопия весьма трудоёмки. Поэтому миллиарды белков из самых разных организмов, от вирусов и бактерий до позвоночных, до сих пор остаются с неизвестными пространственными структурами. А их полезно знать — в частности (но не только), для создания новых лекарств...
Продолжение статьи читайте в номере журнала