Полёт бабочки, или немного о пользе структурной геномики
Кандидат физико-математических наук Антон Чугунов, главный редактор сайта «Биомолекула» (Институт биоорганической химии РАН).
Томас Стайц (Thomas Steitz), американский кристаллограф, специалист по структуре рибосомы, лауреат Нобелевской премии по химии 2009 года.
Современная наука о белках давно вышла за рамки лабораторных экспериментов. Она всё интенсивнее впитывает новые информационные технологии. Неудивительно, что она стала тяготеть к экстенсивному принципу — изучить всё, что можно, «про запас» и сохранить в компьютерных базах данных. Одним из первенцев этой идеологии стал проект «геном человека», который произвёл на свет общедоступную базу химических структур всех человеческих генов. Лет пятнадцать назад, одновременно с геномным проектом, стартовала и другая научная инициатива, пока ещё далёкая от своего завершения, — структурная геномика. Её цель — определение пространственного строения максимального числа «ключевых» белковых молекул.
ЗАЧЕМ ОПРЕДЕЛЯЮТ СТРУКТУРУ БЕЛКОВ
Без преувеличения, белки в живой клетке выполняют все существующие в природе функции: это и катализ, и регуляция биохимических реакций, и связывание сигнальных молекул с поверхностью клетки, и защита от чужеродных белков, и транспорт молекул через клеточные мембраны, и «чтение/запись» генетической информации, не говоря уж о «каркасной» функции.
Химическая структура белка закодирована в генах. С помощью современных технологий уже прочитаны генетические последовательности более 600 видов живых существ, и одно из них — человек. Как грибы после дождя появляются геномы отдельных людей. А раз известны гены, значит, известна и аминокислотная последовательность кодируемых ими белков. А вот как «работают» белки и какие функции они выполняют в живой клетке, для большинства белков остаётся загадкой, равно как и их пространственное строение.
«Жизнедеятельность» белковой молекулы в клетке определяется не столько её химическим составом, сколько пространственной конфигурацией. Вспомним прионы – возбудителей коровьего бешенства. Они меняют пространственную конфигурацию белков головного мозга, что приводит к постепенной гибели нейронов.
В компьютерные базы данных занесено более восьми миллионов белковых структур. Пространственное же строение установлено лишь примерно для 60 тысяч белков. Причина такого отставания в том, что методики определения пространственного строения биомолекул всё ещё относятся к разряду самых сложных технологий биофизики и биохимии.
Каким образом белковая молекула организуется в пространстве? Молекулы матричной РНК переносят генетическую информацию с ДНК на рибосомы — молекулярные машины наноскопического размера, синтезирующие по этому коду аминокислотную белковую цепочку. Сошедшая с «верфи» рибосомы белковая молекула самоорганизуется — сворачивается, приобретая уникальную, только ей присущую пространственную структуру, а следовательно, и функцию. Нобелевский лауреат по химии 1972 года Кристиан Анфинсен доказал, что трёхмерное строение белка полностью определяется последовательностью аминокислотных остатков в его составе. Однако физико-химические законы, управляющие процессом сворачивания, так сложны, что теоретически предсказать пространственную структуру белка по его аминокислотной последовательности с абсолютной точностью невозможно.
В то же время трёхмерные структуры белков весьма востребованы: они нужны фундаментальной науке, они могут найти применение и в нанотехнологиях, и в фармацевтике, и в медицине. К примеру, проектирование нового лекарства возможно лишь с учётом структуры белков-«мишеней», на которые это лекарство будет действовать. В общем, знать, как свёрнут и упакован белок в пространстве, не только интересно, но и совершенно необходимо.
КАК ОПРЕДЕЛЯЮТ СТРУКТУРУ БЕЛКА
Определение структуры белковой молекулы происходит в несколько последовательных этапов, которые иногда затягиваются на годы кропотливой работы.
Получение исходного образца, содержащего требуемый белок. Чаще всего для получения белка в больших количествах используют методы генной инженерии — в ДНК микроорганизма (например, широко известной кишечной палочки Escherichia coli) «встраивают» искусственно синтезированный ген, называемый вектором. В результате клетка начинает вырабатывать требуемый белок. В некоторых случаях добиться устойчивого синтеза в бактериальных клетках очень непросто. Тогда приходится выделять требуемый белок непосредственно из биологического препарата, что более трудоёмко.
Очистка образца тоже весьма сложный этап, потому что бактериальная клетка (как и любая другая) представляет собой фантастическую смесь десятков тысяч молекул разных типов, и разделить их, не упустив при этом интересующую молекулу, бывает непросто. Обычно для этого используют несколько стадий — центрифугирование, гель-электрофорез, хроматографическую очистку. (Хроматография — физико-химический метод, позволяющий фракционировать (разделять) смеси в зависимости от свойств входящих в них компонентов.)
Определение структуры очищенного белка производится в основном с помощью рентгеноструктурного анализа (РСА) и спектроскопии ядерного магнитного резонанса (ЯМР).
Первый метод основан на предварительной процедуре кристаллизации белка, в результате которой он переходит в высокоупорядоченную форму — «кристалл», при облучении которого рентгеновскими лучами возникает чёткая дифракционная картина. Её анализ позволяет установить взаимное пространственное расположение атомных групп. Основная сложность этой технологии — подбор условий кристаллизации. Настоящего понимания процесса пока нет, и обычно приходится перебирать массу вариантов, прежде чем удаётся приблизиться к успеху.
ЯМР-исследование основано на изучении магнитных явлений, возникающих при поглощении электромагнитной энергии атомными ядрами с ненулевым спином.Излишне говорить, что оба упомянутых метода компьютеризированы по последнему слову техники и программного обеспечения — иначе анализ экспериментальных данных занимал бы годы работы.
СТРУКТУРНАЯ ГЕНОМИКА КАК МЕЖДУНАРОДНЫЙ ПРОЕКТ
Логичным продолжением расшифровки (секвенирования) генома стал проект по определению пространственной структуры всех кодируемых в ДНК белков. На самом деле перед структурной геномикой стоит задача определения структуры не всех известных белков, а минимально возможного их числа, достаточного для подробной характеристики основных белковых семейств. Дело в том, что белки возникли не каждый сам по себе: они имеют общих предшественников и в ходе эволюции сохранили сходство пространственного строения. Если структура родственного белка известна, то интересующую структуру можно просчитать на компьютере с приемлемой точностью.
Инициатива международного научного сообщества, направленная на создание базы данных трёхмерных структур как можно большего числа белков, называется структурной геномикой (СГ; также её можно называть структурной протеомикой — не путать с «обычной» протеомикой). В этом направлении работают как «традиционные» лаборатории, где учёные «по старинке» определяют структуры интересных им белков, так и огромные центры, в которых структуры белков расшифровываются автоматизированным «поточным методом».
В мире существует довольно много научных центров (в Японии, Израиле, Канаде, Европе, США), поставивших определение структуры белков «на поток». Программа, финансируемая американским Национальным институтом здравоохранения, носит название «Protein Structure Initiative» (PSI; программа по структурным исследованиям белков). Она направлена не только собственно на изучение строения белковых молекул (результаты экспериментов немедленно депонируются в общедоступную базу Protein Data Bank), но и на совершенствование методик определения структуры, кристаллизации и бактериального синтеза белков. Протоколы всех экспериментов тоже общедоступны.
Проект PSI сейчас находится во второй фазе (1 июля 2005 г. — 30 июня 2010 г.). По результатам первой фазы работ PSI-1, длившейся почти пять лет (с сентября 2000-го), было обнародовано более 1000 структур белков. В рамках PSI-2 в США работают четыре высокопроизводительных центра, «выдающие» каждый по 100–200 новых структур в год, шесть специализированных центров, направленных на усовершенствование технологий, и два центра компьютерного моделирования. В настоящее время такие центры структурной геномики, где производство структур поставлено на конвейер, по всему миру выдают около половины всех новых структур белков, и почти две трети из них — результат работы американских PSI-центров.
Регистрация кандидатов на исследование в 23 центрах структурной геномики по всему миру производится в базе TargetDB, цель которой — избежать дублирования и информировать коллег и общественность о ходе работ. В учётной записи каждого белка-мишени прописан весь его путь от гена до структуры, «со всеми остановками» (условия синтеза, выделения, очистки, кристаллизации и анализа данных), что облегчает работу другим исследовательским группам, желающим подключиться к процессу.
Ещё одна общедоступная база — PepcDB — посвящена протоколам получения белков в бактериях, методам очистки и кристаллизации — ведь именно эти процедуры определяют огромный объём рутинной работы. Многие белкИ, заявленные в качестве мишеней, так и не удаётся довести до готовой структуры. Для оповещения научного сообщества о результатах своей деятельности представители структурных центров нередко проводят интернет-конференции и on-line семинары («вебинары»).
В среднем в центрах PSI на определение одной белковой структуры расходуется примерно 66 000 долларов. Цифра не маленькая, хотя в «традиционных» (не «поточных») лабораториях расходы в два раза выше. Но, несмотря на очевидные преимущества, поточная технология не универсальна: она годится в основном для «простых» мишеней, вроде водорастворимых бактериальных белков. Сложные же случаи по-прежнему исследуются в «традиционных» научных коллективах, вкладывающих в процесс намного больше идей и ручного труда.
КАКОЙ БЕЛОК ДОСТОИН ИЗУЧЕНИЯ, ИЛИ С ЧЕГО НАЧАТЬ?
На сегодня для почти 70% общего числа белковых семейств структурные данные отсутствуют. Это означает, что число потенциальных мишеней крайне велико, и перед исследователями встаёт вопрос: какие семейства белков и какие белковые молекулы выбрать для изучения в первую очередь?
Объединённый центр структурной геномики (Joint Center for Structural Genomics, JCSG) — один из четырёх высокопроизводительных центров в рамках проекта PSI, который базируется в исследовательском институте Скриппса в Ла-Хойе (Калифорния, США). По мнению его директора Йена Вильсона (Ian Wilson), учёные имеют дело с постоянно расширяющейся «вселенной белков», так что для выбора конкретных мишеней требуются весьма чёткие правила. В PSI введён такой регламент: для каждого центра 70% мишеней определяют централизованно, через специальную комиссию. Стратегия поиска оптимизируется таким образом, чтобы число структур, которые планируется получить после завершения проекта, оставаясь реалистичным, было всё-таки достаточно большим. Оставшиеся 30% делятся пополам: одна половина — на выбор самого центра, другая — предлагается сторонними исследователями, не занятыми в программах по структурной геномике.
Работа идёт наиболее эффективно, когда каждый центр сам решает, какой именно белок в «выданном» ему семействе сто`ит исследовать в первую очередь, поскольку в разных научных центрах работают на разных наборах геномных ДНК и применяют разные методики.
САМОЕ ТРУДНОЕ — ВЫРАСТИТЬ КРИСТАЛЛ
Около 90% структур белков в рамках программ PSI исследуется с помощью рентгеноструктурного анализа, и лишь 10% приходится на долю спектроскопии ЯМР. Последней, впрочем, отводится большая роль во вспомогательных задачах: идентификации типа пространственной укладки, определении стабильности и взаимодействий белка с другими молекулами и т.д.
Для определения структуры белка необходимо произвести большое количество очень чистого вещества, иначе не удастся вырастить кристалл и получить с его помощью чёткую картину дифракции рентгеновских лучей.
В центрах структурной геномики большинство операций автоматизировано, но роботы справляются далеко не со всеми процедурами. Они не могут определить, в какой капле возник качественный кристалл, и извлечь его оттуда. В висячей капле, внутри которой зарождаются (или не зарождаются) столь желанные белковые кристаллы, очень сложно что-либо увидеть из-за кривизны поверхности, неоптимального освещения и других оптических факторов.
В Объединённом центре JCSG «сбором урожая» занимаются специально обученные лаборанты. Они аккуратно извлекают из капель кристаллы и помещают их в алюминиевые кассеты, которые отправляются на синхротрон Стэнфордского университета (Stanford Synchrotron Radiation Laboratory). В Стэнфорде кассету с кристаллами белка помещают в автоматическую систему (Stanford Auto-Mounter), и на этом вмешательство людей практически заканчивается! Роботизированная рука сама открывает контейнер, достаёт кассету и помещает её на пути сфокусированного рентгеновского луча. Исследователи могут наблюдать процесс получения дифракционной картины на экране компьютера. Когда сбор данных оканчивается, автоматически запускается программа первичной обработки структурных данных.
Далеко не для каждого кристалла можно установить структуру: около половины кристаллов оказываются слишком мелкими, чтобы получить дифракционную картину; в большинстве же капель кристаллов не оказывается вовсе.
СТРУКТУРНАЯ ГЕНОМИКА В РОССИИ
В нашей стране, хотя она не является членом консорциумов по структурной геномике, структурные исследования также проводятся. Например, этим занимаются в Институте кристаллографии РАН (г. Москва), Институте биоорганической химии РАН (г. Москва), Институте белка (г. Пущино).
основные этапы расшифровки структур биомакромолекул остаются в общих чертах теми же, что и за границей, однако имеются и свои особенности. У нас больше привыкли к «ручному» отбору условий кристаллизации. Обусловлено это скорее экономическими, нежели принципиальными соображениями, однако в каждом из подходов есть свои и достоинства и недостатки. Основное достоинство роботизированного метода — намного меньшие затраты времени на поиск оптимальных условий, при которых белок образует кристалл. Решающее преимущество «ручного» способа — возможность «справиться» с действительно сложными и интересными объектами, перед которыми «пасует» робот, осуществляющий перебор по довольно примитивной программе.
Оценку качества полученных кристаллов производят на дифрактометрах в Институте кристаллографии РАН. Далее (из-за отсутствия в РФ достаточного количества стабильных источников синхротронного излучения, пригодных для изучения белковой структуры) запакованный в капилляр образец отправляют на синхротроны в Германию (Гамбург) или во Францию (Гренобль). И тут из-за возникающих по дороге административных преград (таможня не всегда «даёт добро» на вывоз или ввоз биоматериалов) или непредсказуемо меняющихся условий перевозки образца (температура, влажность), к сожалению, нередко большая работа пропадает втуне.
В результате «съёмки» кристалла получается набор дифракционных данных, который преобразуется в один из стандартных кристаллографических форматов компьютерных файлов. На основе этих данных и происходит «решение» и уточнение структуры биомакромолекул. И это делается снова в России, куда полученная информация пересылается по сети или на компакт-дисках.
Надо сказать, что далеко не все учёные испытывают энтузиазм по поводу программы структурной геномики. Примером скептицизма научного сообщества может служить эпиграф к этой статье. Одной из основных концепций PSI является тезис о том, что достаточно знать структуру похожего белка, чтобы с помощью компьютерных программ предсказать структуру той молекулы, которая нас интересует. Именно этот тезис наиболее часто подвергается критике. По мнению оппонентов структурной геномики, никогда нельзя быть полностью уверенным в результате компьютерного моделирования, его обязательно нужно проверять экспериментально. А зачем тогда зря тратить время и деньги?
На самом же деле существенного противоречия между структурной геномикой и «традиционными» подходами к определению структуры нет: поточный метод позволяет накопить багаж структурных знаний по всем основным белковым семействам. Структура из базы может подарить учёному идею хорошего эксперимента, который будет проводиться уже с гораздо большей тщательностью и продуманностью, нежели может обеспечить автомат по очистке и кристаллизации белка. Например, изучение процесса связывания молекулы с рецептором на поверхности клеточной мембраны вовсе не входит в задачи структурной геномики, а является на 100% областью, в которой в обозримом будущем будет «вкалывать» человек, а не робот.
То же самое касается и строения макромолекулярных комплексов, в состав которых входят десятки или даже сотни белковых субъединиц. Ну и, наконец, многие белки-«мишени» оказываются просто «не по зубам» структурным консорциумам. Кстати, структурные работы, проведённые вручную, цитируются значительно чаще, а следовательно, и выше ценятся.
Не следует относиться к поточной технологии как к Святому Граалю. Иначе не избежать типичного обывательского разочарования, с которым часто можно столкнуться, например, обсуждая геномные технологии: «Ну, прочитали геном, и чего?» Действительно, чего? От всех болезней людей не вылечили, лишней пары рук не изобрели, только понавыводили мышей светящихся да ещё холодоустойчивые помидоры с генами лосося. Прорывы в способах лечения некоторых болезней, недостижимые до секвенирования генома человека, конечно, есть, но пока они станут стандартом de facto в обычных больницах и пока их смысл постигнет широкая общественность, пройдёт ещё не одна пятилетка. Технология — а структурная геномика это, несомненно, всего лишь поставленная «на поток» технология — очередной этап, который позволит более эффективно двигаться в бесконечном пути научного познания. А практические приложения нового знания долго ждать себя не заставят.
В статье использованы материалы с сайта biomolecula.ru, журналов «Structure», «Nature Structural & Molecular Biology», «Nature methods», «Science» и других научных изданий.
Читайте в любое время