Редактор для генома
Кирилл Стасевич
Любой геном можно сравнить с текстом. Или с книгой — так даже нагляднее: есть книги потолще, есть книги потоньше, есть сложные, есть простые.
Нобелевскую премию по химии 2020 года присудили «за разработку метода редактирования генома». Лауреатами стали Эммануэль Шарпантье из Института инфекционной биологии Общества Макса Планка (Берлин, Германия) и Дженнифер Даудна из Калифорнийского университета (Беркли, США). Метод (или систему) редактирования генома CRISPR-Cas9 специалисты называют методом молекулярных ножниц. Так что это такое?Любой геном можно сравнить с текстом. Или с книгой — так даже нагляднее: есть книги потолще, есть книги потоньше, есть сложные, есть простые. В книге буквы соединены в слова. Азотистые основания, из которых состоит ДНК, называют генетическими буквами — это аденин (А), тимин (Т), гуанин (G) и цитозин (C). И они тоже складываются в «слова» — соединяясь по три, азотистые основания кодируют аминокислоты. А «слова»-тройки складываются в предложение — последовательность большой белковой молекулы, состоящей из множества аминокислот.
Как и в любом тексте, в геноме тоже случаются ошибки, которые называют мутациями. Большинство мутаций ни на что не влияют. Случаются мутации, которые приносят пользу. И есть мутации, которые вредны. Если ошибки-«мутации» происходят в обычном тексте, их исправят корректоры и редакторы. У живых клеток тоже есть свои корректоры и редакторы, исправляющие погрешности в ДНК — специальные ферменты, входящие в так называемые системы репарации (за расшифровку механизмов ДНК-репарирующих систем в 2015 году дали Нобелевскую премию по химии). Но они не всегда исправляют то, что нужно исправить. Может, стоило бы сконструировать какой-нибудь молекулярный редактор, который мы запускали бы в клетку, и он исправлял бы в ней нежелательные мутации?
Метод CRISPR-Cas9 — как раз один из таких редакторов. В последние годы о нём говорят и пишут чрезвычайно много. Может показаться, будто это единственный метод редактирования генома. На самом деле нет: идея переписывать генетический текст в ДНК возникла давно, и по мере развития молекулярной биологии стали появляться соответствующие экспериментальные техники. Но по-настоящему совершенный метод редактирования генома должен быть точным, универсальным и удобным. Точный метод будет вносить правки только туда, куда нужно, без непредсказуемой самодеятельности. Универсальность означает, что можно выбрать для правки любое место в любой хромосоме. А удобство означает скорость и простоту в обращении. CRISPR-Cas9 не абсолютно точен, не абсолютно универсален и не слишком прост, но для сегодняшней науки он стал поистине революционным.
Однако оценить в полной мере его революционность неспециалисту мешает то, что за CRISPR-Cas9 стоит чрезвычайно непростая наука. Для начала, как расшифровывается CRISPR? Это Clustered Regularly Interspaced Short Palindromic Repeats — короткие палиндромные повторы, регулярно расположенные группами. А Cas9 — это CRISPR-ассоциированный (CRISPR-associated) белок 9. Что это за повторы, где эти группы и почему с ними ассоциированы какие-то белки?
Бактерии против вирусов
Биологи не с нуля придумали CRISPR-Cas9, а подсмотрели её у бактерий и архей. У них CRISPR-Cas9 работает как система противовирусной защиты. В конце 80-х годов XX века в ДНК кишечной палочки и других микробов открыли странные структуры: группы из палиндромных участков, между которыми находились какие-то другие генетические последовательности. Палиндромами называют последовательности нуклеотидов, которые одинаково читаются от конца к началу и от начала к концу, например, как слово «топот». Открытые группы палиндромных последовательностей назвали CRISPR. Но самое интересное было в том, что находилось между палиндромами — а между ними находились фрагменты вирусных последовательностей.
Когда бактериальный вирус (или бактериофаг) нападает на бактерию, он впрыскивает в неё свою нуклеиновую кислоту и начинает размножаться. Бактерия может погибнуть, а может выжить и избавиться от вируса. Выжившие бактерии встраивают фрагменты вирусной ДНК* в свой геном, в участки CRISPR. То есть, образно говоря, CRISPR — это картотека, хранящая информацию о вирусных атаках. Если в клетке снова окажется чужая ДНК, бактерия сравнит её с картотекой CRISPR и, если найдёт совпадение, быстро уничтожит, не дав вирусу ни шанса. Хотя фрагменты вирусных последовательностей в CRISPR довольно короткие, их вполне хватает, чтобы узнать вирус. Так мы, открыв книгу без обложки, быстро поймём, с чем имеем дело, если увидим в каком-нибудь предложении имя Анны Карениной.
Разумеется, здесь не обойтись без белков. CRISPR-последовательность в ДНК сначала копируется в одну большую РНК, потом эта РНК разрезается на кусочки. Эти кусочки должны прочно связаться с чужой ДНК, то есть между их нуклеотидами должны образоваться комплементарные водородные связи. Если какие-то нуклеотиды провзаимодей-ствовали, а какие-то нет — значит, перед нами никакой не вирус. Но если кусок РНК, синтезированный на картотеке CRISPR, и чужая ДНК сцепились друг с другом, как родные, эту нуклеиновую кислоту надо резать.
Все эти процедуры выполняют белки Cas. Сейчас их в сумме насчитывается уже девяносто три, их гены хранятся в бактериальной хромосоме рядом с CRISPR-картотекой (откуда и аббревиатура Cas — «CRISPR-ассоциированные»). Не все девяносто три белка работают вместе во всех бактериях и археях. Систем CRISPR-Cas есть более двадцати разновидностей, которые отличаются и набором белков, и некоторыми особенностями работы. (В дальнейшем мы будем говорить о системе CRISPR-Cas9, в которой работает белок Cas9.) Но в целом все они заняты одним и тем же: пополнением картотеки CRISPR, поиском потенциально опасных ДНК в клетке, истреблением вирусов и пр. Часто картотеку CRISPR и обслуживающие её белки Cas называют бактериальным иммунитетом. Конечно, иммунная система животных работает совсем иначе, однако у них есть и кое-что общее: и наш иммунитет, и система CRISPR-Cas узнают и уничтожают опасного чужака по памяти о прошлых инфекциях. У нас память о прошлых инфекциях хранят специальные иммунные клетки, у бактерий — специальный участок в бактериальной хромосоме.
Молекулярные хитрости «бактериального иммунитета»
Хотя впервые на последовательности CRISPR обратили внимание ещё в конце 1980-х, окончательно подтвердить гипотезу о «бактериальном иммунитете» удалось только к 2007 году, а потом ещё несколько лет ушло на то, чтобы расшифровать молекулярный механизм. Чтобы подойти к исследованиям нынешних лауреатов, надо чуть дальше зайти в «дебри» молекулярной биологии. Как сказано выше, CRISPR-участок ДНК со всеми вирусными последовательностями копируется в длинную РНК. Но в таком длинном виде эта РНК работать не может — её нужно нарезать на небольшие фрагменты. Каждый фрагмент несёт в себе образец какого-то одного вируса, и с ним теперь удобно работать Cas-белкам. Длинная РНК, синтезируемая на ДНК с CRISPR, называется pre-crRNA, что означает предшественник CRISPR-RNA. Она должна созреть, то есть разделиться на маленькие кусочки, на множество crRNA, или CRISPR-RNA.
Эммануэль Шарпантье с коллегами сумела описать, как созревает pre-crRNA. Оказалось, что тут нужна другая РНК, которая закодирована в бактериальной хромосоме в некотором отдалении от участка CRISPR-Cas — так называемая tracrRNA (trans-encoded crRNA — транс-кодируемая crRNA, где приставка транс- указывает на то, что tracrRNA закодирована не в той же цепи ДНК, что pre-crRNA, а в параллельной, или, говоря более корректно, комплементарной). Небольшая tracrRNA садится на длинную pre-crRNA в тех местах, где её надо разрезать. Белки Cas, в свою очередь, связываются со спаренными РНК и прочнее скрепляют их друг с другом. Следом приходит фермент, который разрезает длинную pre-crRNA и немного подрезает tracrRNA. В результате получается комплекс из белка Cas и двух РНК — crRNA, в которой записан фрагмент вируса, и вспомогательной tracrRNA.
Роль tracrRNA не ограничивается тем, что она помогает созреть длинной pre-crRNA. Расшифровывая механизм CRISPR-Cas9, Эммануэль Шарпантье начала сотрудничать с Дженнифер Даудной, которая до этого много занималась Cas-белками. Вместе они выяснили, что tracrRNA нужна ещё и для того, чтобы белок Cas9 смог расщепить вирусную ДНК. То есть чтобы узнать, вирус это или не вирус, нужна crRNA, но для того, чтобы фермент сработал и разрушил вирусный геном, нужна РНК-напарница — tracrRNA. Открытие двойной роли tracrRNA стало одним из главных событий в расшифровке механизма системы CRISPR-Cas9.
Рождение генетического редактора
В какой-то момент Даудне и Шарпантье пришла в голову идея, что обе РНК — crRNA и tracrRNA — можно объединить в одну молекулу. Должна была получиться одна РНК, которая бы приводила белок Cas9 к нужному участку в ДНК и одновременно заставляла эту ДНК разрезать. Такую гибридную РНК удалось создать — её назвали sgRNA (то есть single-guideRNA — РНК-проводник). Следующая мысль напрашивалась сама собой: последовательность РНК-проводника в той её части, которая взаимодействует с ДНК, может быть любой. Значит, мы можем синтезировать искусственную направляющую РНК и с её помощью нацелить Cas9 на любой участок в любой ДНК — в ДНК растительной клетки, в ДНК мыши, в ДНК человека, в конце концов.
Опишем в общих чертах, как работает редактор CRISPR-Cas9. Представим, что у нас в каком-то гене есть опасная мутация. Никакой библиотеки CRISPR тут уже не требуется — мы сами синтезируем РНК, которая по своей последовательности совпадает с мутантным участком в ДНК. Эта РНК будет проводником для белка Cas9 — мы вручаем её белку и отправляем в клетку. (Биотехнологические ухищрения, с помощью которых нужные белки и нуклеиновые кислоты попадают в нужную клетку, описывать не будем — это отдельная большая тема.) Cas9 находит нужный мутантный участок и режет ДНК (одну цепь или сразу две — зависит от модификации метода). Но разрезать — не значит исправить. Мы не хотим вообще выключить мутантный ген — мы хотим, чтобы он стал работать, как надо. То есть неправильную, мутантную генетическую букву нужно отредактировать — вырезать её из ДНК и вставить вместо неё правильную. Но сам Cas9 ничего из ДНК не вырезает и не вставляет — он её просто режет.
Исправлением ДНК занимаются так называемые системы репарации ДНК — о них упоминалось в самом начале. Это сложные белковые комплексы, которые распознают различные дефекты в ДНК. Системы репарации есть в любой клетке, и когда в ДНК появляется разрыв, они приходят, чтобы его зашить. Но клетка не просто сшивает разрыв, она заменяет целый кусок ДНК, в который входит и место разрыва, и ещё несколько десятков генетических букв по обе стороны от него. Вместо повреждённого фрагмента синтезируется новый. Чтобы синтезировать такую заплатку, нужен шаблон с правильной последовательностью генетических букв. Обычно системы репарации используют в качестве шаблона другую, неразорвавшуюся цепь ДНК или соответствующий участок из гомологичной хромосомы. Но мы можем предложить и свой шаблон для латания ДНК. Для этого вместе с системой CRISPR-Cas9 мы отправляем в клетку образец ДНК — копию той последовательности, которую хотим отредактировать, только в ней будут уже нужные нам правки. То есть система CRISPR-Cas9 нужна для того, чтобы включить клеточные механизмы ремонта генома, которые в нужном месте перепишут ДНК в соответствии с нашими указаниями.
Как уже говорилось, до появления CRISPR-Cas9 в руках у исследователей были и другие методы редактирования ДНК. Суть их в общих чертах такая же: разрезать ДНК в строго определённом месте, чтобы потом этот разрез залатать в соответствии с некоторым образцом. Но CRISPR-Cas9 оказался намного удобнее. Дело в том, что в других генетических редакторах нужное место в ДНК ищет белок, который потом либо сам режет ДНК-цепи, либо это делает белок-напарник. То есть это сугубо белковые редакторы. Они созданы на основе таких белков, которые от природы взаимодействуют с определёнными последовательностями в ДНК — их нужно только перепрограммировать, чтобы они искали в ДНК другие последовательности букв, другие «слова». Однако перенацелить белок с одной последовательности ДНК на другую довольно непросто, и эту задачу не всегда удаётся успешно решить: белковые молекулы устроены сложно и могут не выдержать подобного экспериментального вмешательства.
С CRISPR-Cas9 всё иначе — тут не белок ищет цель, а РНК-проводник. Направляющая РНК состоит из двух частей: одна — поисковая, которая найдёт в ДНК участок для редактуры, и вторая часть, которая в нужный момент активирует фермент Cas9. Нуклеиновые кислоты взаимодействуют между собой намного проще, чем с белками, так что синтезировать РНК, нацеленную на конкретную ДНК-последовательность, тоже намного проще, чем перепрограммировать для этого белковую молекулу. Более того, РНК можно нацелить на самые разные по-следовательности ДНК, так что с точки зрения редактируемого текста для CRISPR-Cas9 нет ничего недоступного. Однако, структура РНК-проводника такова, что на какое бы «слово» в ДНК она ни была направлена, Cas9 будет с ней работать. Изменять сам белок Cas9 не требуется — он просто идёт туда, куда его ведёт РНК-проводник. В этом смысле система CRISPR-Cas9 проста и универсальна.
Триумф генетического редактора
Разумеется, не только Шарпантье и Даудна изучали бактериальную систему CRISPR-Cas9. Но именно они указали на её ключевые особенности: на то, что белком Cas9 управляют две РНК (crRNA и tracrRNA), что эти две РНК можно объединить в одну и что весь аппарат CRISPR-Cas9 можно направить туда, куда необходимо. Статья Шарпантье и Даудны о том, как приспособить CRISPR-Cas9 для биотехнологических нужд, вышла в 2012 году, и с тех пор число работ по этой теме растёт лавинообразно. Систему CRISPR-Cas9 модифицируют, совершенствуют, испытывают на самых разных организмах: на дрожжах, дрозофилах, круглых червях, на табаке и рисе, на клетках мышей, свиней, собак и людей. Одни варианты CRISPR-Cas9 позволяют резать только одну цепь ДНК, другие варианты режут обе цепи ДНК сразу или же вообще режут не ДНК, а РНК. Есть версии метода, в которых используется дефектный фермент: он не умеет резать ДНК, но зато связан с другим белком, который способен включать или выключать активность тех или иных генов: «увечный» Cas9 с помощью РНК-проводника приходит к нужному гену и просто садится на его ДНК, а белок-пассажир уже дальше делает свою работу.
Революционное значение метода вполне очевидно: включая и выключая гены, внося в них разные мутации, мы лучше понимаем, как они работают в организме, как взаимодействуют между собой и т. д., и с CRISPR-Cas9 подобные исследования стали проходить намного быстрее. Если же говорить о практике, то легко понять, сколь огромные возможности открываются перед нами в смысле исправления вредных мутаций, истребления раковых клеток и т. д. В 2014 году в «Nature Biotechnology» была опубликована статья, авторы которой описывали мышей, избавленных от тирозинемии. Это тяжёлая болезнь обмена веществ, при которой из строя выходят и почки, и печень, и нервная система. Как легко догадаться, мышей от неё избавили, исправив с помощью CRISPR-Cas9 соответствующий кусок в ДНК. Есть исследования, в которых с помощью CRISPR-Cas9 останавливают гибель фоторецепторов в сетчатке и предотвращают слепоту у животных, предрасположенных к пигментному ретиниту — наследственному дегенеративному заболеванию, заканчивающемуся полной слепотой. Минувшим октябрём в «Nature Communications» появилась работа, в которой рассказывалось, как CRISPR-Cas9 помогает целенаправленно истребить у мышей раковые клетки, не тронув здоровые.
Но мыши мышами, а что же люди? У людей CRISPR-Cas9 тоже потихоньку начинают применять. Для примера здесь можно вспомнить прошлогоднее сообщение биотехнологических компаний «CRISPR Therapeutics» и «Vertex Pharmaceuticals», чьи сотрудники вылечили двух пациентов с генетическими заболеваниями крови, бета-талассемией и серповидноклеточной анемией. Смысл лечения был в том, чтобы отредактировать гены у стволовых клеток крови, из которых получаются эритроциты. Редактирование прошло успешно, и кровь больных пришла в норму.
Правда, когда говорят о «человеческом» использовании CRISPR-Cas9, то чаще вспоминают недавние скандалы, связанные с редактированием генов у человеческих эмбрионов. В том, чтобы редактировать именно эмбрион, есть свой смысл: если заранее известно, что ребёнку от родителей достались опасные мутации, что ему суждено стать больным на всю жизнь, то почему бы не исправить ему гены в самом начале? Это проще, чем исправлять гены у полностью сформировавшегося человека. Однако тут возникают разнообразные этико-юридиче-ские вопросы, связанные с проблемой субъектности эмбриона. Вопросы эти до поры до времени вяло тлели в научном сообществе, пока в 2015 году китайские исследователи из Университета Сунь Ятсена не опубликовали в журнале «Protein & Cell» работу, где описывали, как им удалось с помощью метода генной инженерии CRISPR-Cas9 отредактировать геном человеческих эмбрионов. Никто не думал, что эмбрион человека отредактируют так скоро. Этико-юридические дискуссии вышли на новый уровень и достигли апогея, когда в 2018 году в Китае на свет появились две девочки, которых с помощью CRISPR-Cas9 сделали устойчивыми к ВИЧ (во всяком случае, так утверждают исследователи, которые пытались редактировать их эмбрионы).
Сомнения относительно «редактирования» человека основываются не только на том, как нам относиться к эмбриону, но и на особенностях самого метода. Мы говорили, что CRISPR-Cas9 позволяет точно редактировать определённое место в ДНК, но точность его не абсолютна. За последние годы был опубликован ряд работ, которые говорят, что CRISPR-Cas9 пока ещё мало подходит для редактирования человеческих генов — из-за того, что очень велик риск незапланированных мутаций. Проблема в большой вариабельности наших генов: одна и та же последовательность ДНК у двух разных людей может отличаться на одну или несколько букв. Хотя на функции гена такие замены часто никак не влияют, из-за них редактирующая машина Cas9 с направляющей РНК может приземлиться, кроме как в нужном месте, ещё в десятке, а то и в сотне других точек в геноме — по некоторым оценкам, число ошибок может доходить до 10 000. Но у человека есть и такие гены, которые вообще не провоцируют CRISPR-Cas9 ни на какие ошибки, и с ними CRISPR-Cas9 работает исключительно точно.
Вообще точность CRISPR-Cas9 в применении к человеческой ДНК остаётся предметом дискуссий — некоторые исследователи полагают, что данные о множестве CRISPR-ошибок не вполне корректны и всё не так страшно. Однако, если говорить о медицинских перспективах метода, нужно абсолютно точно представлять, что с его помощью можно редактировать, а что нет, и можно ли довести точность аппарата CRISPR-Cas9 до 100%. Так что если кто-то в связи с CRISPR-Cas9 ждёт появления «дизайнерских детей» или каких-нибудь генетически модифицированных супер-солдат, ждать придётся ещё долго.
Вместе с тем трудно не признать, что с появлением CRISPR-Cas9 наука уже никогда не будет прежней. Мы привели лишь несколько примеров того, как используют CRISPR-Cas9; чтобы кратко перечислить все возможности этого метода, пришлось бы посвятить ему целый журнальный номер. С помощью CRISPR-Cas9 собираются справиться с устойчивыми к лекарствам бактериями, которые стали одной из больших медицинских проблем; с помощью CRISPR-Cas9 создают системы диагностики, в миллионы раз более чувствительные, чем другие диагностические методы; с помощью CRISPR-Cas9 малярийных комаров лишают способности переносить малярию. И даже если до редактирования человека дело так и не дойдёт, CRISPR-Cas9 уже принёс современной науке много полезного.
***Среди бактериальных систем CRISPR-Cas есть очень сложные, в которых участвуют сразу несколько белков Cas — например, один ищет нужный участок в ДНК, а другой эту ДНК разрезает. А вот у бактерии Streptococcus pyogenes система CRISPR-Cas оказалась сравнительно простой: её белок Cas9 одновременно удерживает направляющую РНК и сам режет ДНК в том месте, где РНК укажет. Шарпантье и Даудна исследовали систему CRISPR-Cas9 у Streptococcus pyogenes, и для геномного редактора был выбран именно Cas9 как наиболее удобный из Cas-белков. Впрочем, стоит добавить, что сейчас есть варианты редактора CRISPR-Cas, использующие и другие Cas-белки.
***Гомологичные хромосомы — это пары хромосом с одинаковым набором генов и одинаковым строением. В паре гомологичных хромосом одна приходит от отца, вторая от матери; и в той, и в другой одни и те же гены расположены в одной и той же последовательности, но варианты этих генов могут быть разные. Например, ген бета-глобина (одного из белков, которые входят в состав гемоглобина) расположен в хромосоме 11, а точнее, в каждой из двух одиннадцатых хромосом, в отцовской и в материнской. Если ген бета-глобина на материнской хромосоме будет повреждён, репарирующие белки исправят повреждения, взяв за образец соответствующий участок на отцовской хромосоме, и наоборот.
Комментарии к статье
* Для простоты будем говорить о ДНК, хотя среди бактериофагов есть и такие, которые хранят свои гены в РНК.
Читайте в любое время