на что меняется урацил в рнк
ДНК и гены
ДНК ПРОКАРИОТ И ЭУКАРИОТ
Справа крупнейшая спираль ДНК человека, выстроенная из людей на пляже в Варне (Болгария), вошедшая в книгу рекордов Гиннесса 23 апреля 2016 года
Дезоксирибонуклеиновая кислота. Общие сведения
Дезоксирибонуклеи́новая кислота (ДНК) — макромолекула (одна из трёх основных, две другие — РНК и белки), обеспечивающая хранение, передачу из поколения в поколение и реализацию генетической программы развития и функционирования живых организмов. ДНК содержит информацию о структуре различных видов РНК и белков.
В клетках эукариот (животных, растений и грибов) ДНК находится в ядре клетки в составе хромосом, а также в некоторых клеточных органоидах (митохондриях и пластидах). В клетках прокариотических организмов (бактерий и архей) кольцевая или линейная молекула ДНК, так называемый нуклеоид, прикреплена изнутри к клеточной мембране. У них и у низших эукариот (например, дрожжей) встречаются также небольшие автономные, преимущественно кольцевые молекулы ДНК, называемые плазмидами.
С химической точки зрения ДНК — это длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов. Каждый нуклеотид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы. Связи между нуклеотидами в цепи образуются за счёт дезоксирибозы (С) и фосфатной (Ф) группы (фосфодиэфирные связи).
Рис. 2. Нуклертид состоит из азотистого основания, сахара (дезоксирибозы) и фосфатной группы
В подавляющем большинстве случаев (кроме некоторых вирусов, содержащих одноцепочечную ДНК) макромолекула ДНК состоит из двух цепей, ориентированных азотистыми основаниями друг к другу. Эта двухцепочечная молекула закручена по винтовой линии.
В ДНК встречается четыре вида азотистых оснований (аденин, гуанин, тимин и цитозин). Азотистые основания одной из цепей соединены с азотистыми основаниями другой цепи водородными связями согласно принципу комплементарности: аденин соединяется только с тимином (А-Т), гуанин — только с цитозином (Г-Ц). Именно эти пары и составляют «перекладины» винтовой «лестницы» ДНК (см.: рис. 2, 3 и 4).
Рис. 2. Азотистые основания
Последовательность нуклеотидов позволяет «кодировать» информацию о различных типах РНК, наиболее важными из которых являются информационные, или матричные (мРНК), рибосомальные (рРНК) и транспортные (тРНК). Все эти типы РНК синтезируются на матрице ДНК за счёт копирования последовательности ДНК в последовательность РНК, синтезируемой в процессе транскрипции, и принимают участие в биосинтезе белков (процессе трансляции). Помимо кодирующих последовательностей, ДНК клеток содержит последовательности, выполняющие регуляторные и структурные функции.
Рис. 3. Репликация ДНК
Расположение базовых комбинаций химических соединений ДНК и количественные соотношения между этими комбинациями обеспечивают кодирование наследственной информации.
Образование новой ДНК (репликация)
По завершении дупликации образуются две самостоятельные спирали, созданные из химических соединений родительской ДНК и имеющие с ней одинаковый генетический код. Таким путем ДНК способна перерывать информацию от клетки к клетке.
Более подробная информация:
СТРОЕНИЕ НУКЛЕИНОВЫХ КИСЛОТ
Дезоксирибонуклеиновая кислота (ДНК) относится к нуклеиновым кислотам. Нуклеиновые кислоты – это класс нерегулярных биополимеров, мономерами которых являются нуклеотиды.
НУКЛЕОТИДЫ состоят из азотистого основания, соединенного с пятиуглеродным углеводом (пентозой) – дезоксирибозой (в случае ДНК) или рибозой (в случае РНК), который соединяется с остатком фосфорной кислоты (H2PO3–).
Азотистые основания бывают двух типов: пиримидиновые основания – урацил (только в РНК), цитозин и тимин, пуриновые основания – аденин и гуанин.
Рис. 5. Структура нуклеотидов (слева), расположение нуклеотида в ДНК (снизу) и типы азотистых оснований (справа): пиримидиновые и пуриновые
Атомы углерода в молекуле пентозы нумеруются числами от 1 до 5. Фосфат соединяется с третьим и пятым атомами углерода. Так нуклеинотиды соединяются в цепь нуклеиновой кислоты. Таким образом, мы можем выделить 3’ и 5’-концы цепи ДНК:
Рис. 6. Выделение 3’ и 5’-концов цепи ДНК
Две цепи ДНК образуют двойную спираль. Эти цепи в спирали сориентированы в противоположных направлениях. В разных цепях ДНК азотистые основания соединены между собой с помощью водородных связей. Аденин всегда соединяется с тимином, а цитозин – с гуанином. Это называется правилом комплементарности (см. принцип комплементарности ).
Правило комплементарности:
A–T G–C |
Например, если нам дана цепь ДНК, имеющая последовательность
3’– ATGTCCTAGCTGCTCG – 5’,
то вторая ей цепь будет комплементарна и направлена в противоположном направлении – от 5’-конца к 3’-концу:
5’– TACAGGATCGACGAGC– 3’.
Рис. 7. Направленность цепей молекулы ДНК и соединение азотистых оснований с помощью водородных связей
РЕПЛИКАЦИЯ ДНК
Репликация ДНК – это процесс удвоения молекулы ДНК путем матричного синтеза. В большинстве случаев естественной репликации ДНК праймером для синтеза ДНК является короткий фрагмент РНК (создаваемый заново). Такой рибонуклеотидный праймер создается ферментом праймазой (ДНК-праймаза у прокариот, ДНК-полимераза у эукариот), и впоследствии заменяется дезоксирибонуклеотидами полимеразой, выполняющей в норме функции репарации (исправления химических повреждений и разрывов в молекле ДНК).
Репликация происходит по полуконсервативному механизму. Это значит, что двойная спираль ДНК расплетается и на каждой из ее цепей по принципу комплементарности достраивается новая цепь. Дочерняя молекула ДНК, таким образом, содержит в себе одну цепь от материнской молекулы и одну вновь синтезированную. Репликация происходит в направлении от 3’ к 5’ концу материнской цепи.
Рис. 8. Репликация (удвоение) молекулы ДНК
ДНК-синтез – это не такой сложный процесс, как может показаться на первый взгляд. Если подумать, то для начала нужно разобраться, что же такое синтез. Это процесс объединения чего-либо в одно целое. Образование новой молекулы ДНК проходит в несколько этапов:
Рис. 9. Схематическое изображение процесса репликации ДНК: (1) Отстающая цепь (запаздывающая нить), (2) Ведущая цепь (лидирующая нить), (3) ДНК-полимераза α ( Polα ), (4) ДНК-лигаза, (5) РНК-праймер, (6) Праймаза, (7) Фрагмент Оказаки, (8) ДНК-полимераза δ ( Polδ ), (9) Хеликаза, (10) Однонитевые ДНК-связывающие белки, (11) Топоизомераза.
Далее описан синтез отстающей цепи дочерней ДНК (см. Схему репликативной вилки и функции ферментов репликации)
Нагляднее о репликации ДНК см. видео →
5) Непосредственно сразу после расплетания и стабилизации другой нити материнской молекулы к ней присоединяется ДНК-полимераза α (альфа) и в направлении 5’→3′ синтезирует праймер (РНК-затравку) – последовательность РНК на матрице ДНК длиной от 10 до 200 нуклеотидов. После этого фермент удаляется с нити ДНК.
СТРОЕНИЕ РНК
Рибонуклеиновая кислота (РНК) — одна из трёх основных макромолекул (две другие — ДНК и белки), которые содержатся в клетках всех живых организмов.
Последовательность нуклеотидов позволяет РНК кодировать генетическую информацию. Все клеточные организмы используют РНК (мРНК) для программирования синтеза белков.
Затем матричные РНК (мРНК) принимают участие в процессе, называемом трансляцией, т.е. синтеза белка на матрице мРНК при участии рибосом. Другие РНК после транскрипции подвергаются химическим модификациям, и после образования вторичной и третичной структур выполняют функции, зависящие от типа РНК.
Рис. 10. Отличие ДНК от РНК по азотистому основанию: вместо тимина (Т) в РНК представлен урацил (U), который также комплементарен аденину.
ТРАНСКРИПЦИЯ
Транскрипция – это процесс синтеза РНК на матрице ДНК. ДНК раскручивается на одном из участков. На одной из цепей содержится информация, которую необходимо скопировать на молекулу РНК – эта цепь называется кодирующей. Вторая цепь ДНК, комплементарная кодирующей, называется матричной. В процессе транскрипции на матричной цепи в направлении 3’ – 5’ (по цепи ДНК) синтезируется комплементарная ей цепь РНК. Таким образом, создается РНК-копия кодирующей цепи.
Рис. 11. Схематическое изображение транскрипции
Например, если нам дана последовательность кодирующей цепи
3’– ATGTCCTAGCTGCTCG – 5’,
то, по правилу комплементарности, матричная цепь будет нести последовательность
5’– TACAGGATCGACGAGC– 3’,
а синтезируемая с нее РНК – последовательность
3’– AUGUCCUAGCUGCUCG – 5’.
ТРАНСЛЯЦИЯ
Рассмотрим механизм синтеза белка на матрице РНК, а также генетический код и его свойства. Также для наглядности по ниже приведенной ссылке рекомендуем посмотреть небольшое видео о процессах транскрипции и трансляции, происходящих в живой клетке:
Рис. 12. Процесс синтеза белка: ДНК кодирует РНК, РНК кодирует белок
ГЕНЕТИЧЕСКИЙ КОД
Генетический код, общий для большинства про- и эукариот. В таблице приведены все 64 кодона и указаны соответствующие аминокислоты. Порядок оснований — от 5′ к 3′ концу мРНК.
Таблица 1. Стандартный генетический код
Среди триплетов есть 4 специальных последовательности, выполняющих функции «знаков препинания»:
Свойства генетического кода
1. Триплетность. Каждая аминокислота кодируется последовательностью из трех нуклеотидов – триплетом или кодоном.
2. Непрерывность. Между триплетами нет никаких дополнительных нуклеотидов, информация считывается непрерывно.
3. Неперекрываемость. Один нуклеотид не может входить одновременно в два триплета.
4. Однозначность. Один кодон может кодировать только одну аминокислоту.
5. Вырожденность. Одна аминокислота может кодироваться несколькими разными кодонами.
6. Универсальность. Генетический код одинаков для всех живых организмов.
Пример. Нам дана последовательность кодирующей цепи:
3’– CCGATTGCACGTCGATCGTATA– 5’.
Матричная цепь будет иметь последовательность:
5’– GGCTAACGTGCAGCTAGCATAT– 3’.
Теперь «синтезируем» с этой цепи информационную РНК:
3’– CCGAUUGCACGUCGAUCGUAUA– 5’.
Синтез белка идет в направлении 5’ → 3’, следовательно, нам нужно перевернуть последовательность, чтобы «прочитать» генетический код:
5’– AUAUGCUAGCUGCACGUUAGCC– 3’.
Теперь найдем старт-кодон AUG:
5’– AU AUG CUAGCUGCACGUUAGCC– 3’.
Разделим последовательность на триплеты:
Найдем стоп-кодон и согласно таблице генетического кода запишем последовательность аминокислот:
Центральная догма молекулярной биологии звучит следующим образом: информация с ДНК передается на РНК (транскрипция), с РНК – на белок (трансляция). ДНК также может удваиваться путем репликации, и также возможен процесс обратной транскрипции, когда по матрице РНК синтезируется ДНК, но такой процесс в основном характерен для вирусов.
Рис. 13. Центральная догма молекулярной биологии
ГЕНОМ: ГЕНЫ и ХРОМОСОМЫ
Термин «геном» был предложен Г. Винклером в 1920 г. для описания совокупности генов, заключенных в гаплоидном наборе хромосом организмов одного биологического вида. Первоначальный смысл этого термина указывал на то, что понятие генома в отличие от генотипа является генетической характеристикой вида в целом, а не отдельной особи. С развитием молекулярной генетики значение данного термина изменилось. Известно, что ДНК, которая является носителем генетической информации у большинства организмов и, следовательно, составляет основу генома, включает в себя не только гены в современном смысле этого слова. Большая часть ДНК эукариотических клеток представлена некодирующими («избыточными») последовательностями нуклеотидов, которые не заключают в себе информации о белках и нуклеиновых кислотах. Таким образом, основную часть генома любого организма составляет вся ДНК его гаплоидного набора хромосом.
Гены — это участки молекул ДНК, кодирующие полипептиды и молекулы РНК
За последнее столетие наше представление о генах существенно изменилось. Ранее геном называли участок хромосомы, кодирующий или определяющий один признак или фенотипическое (видимое) свойство, например цвет глаз.
В 1940 г. Джордж Бидл и Эдвард Тейтем предложили молекулярное определение гена. Ученые обрабатывали споры гриба Neurospora crassa рентгеновским излучением и другими агентами, вызывающими изменения в последовательности ДНК (мутации), и обнаружили мутантные штаммы гриба, утратившие некоторые специфические ферменты, что в некоторых случаях приводило к нарушению целого метаболического пути. Бидл и Тейтем пришли к выводу, что ген — это участок генетического материала, который определяет или кодирует один фермент. Так появилась гипотеза «один ген — один фермент». Позднее эта концепция была расширена до определения «один ген — один полипептид», поскольку многие гены кодируют белки, не являющиеся ферментами, а полипептид может оказаться субъединицей сложного белкового комплекса.
Современное биохимическое определение гена еще более конкретно. Генами называются все участки ДНК, кодирующие первичную последовательность конечных продуктов, к которым относятся полипептиды или РНК, обладающие структурной или каталитической функцией.
Наряду с генами ДНК содержит и другие последовательности, выполняющие исключительно регуляторную функцию. Регуляторные последовательности могут обозначать начало или конец генов, влиять на транскрипцию или указывать место инициации репликации или рекомбинации. Некоторые гены могут экспрессироваться разными путями, при этом один и тот же участок ДНК служит матрицей для образования разных продуктов.
Мы можем приблизительно рассчитать минимальный размер гена, кодирующего средний белок. Каждая аминокислота в полипептидной цепи кодируется последовательностью из трех нуклеотидов; последовательности этих триплетов (кодонов) соответствуют цепочке аминокислот в полипептиде, который кодируется данным геном. Полипептидная цепь из 350 аминокислотных остатков (цепь средней длины) соответствует последовательности из 1050 п.н. (пар нуклеотидов). Однако многие гены эукариот и некоторые гены прокариот прерываются сегментами ДНК, не несущими информации о белке, и поэтому оказываются значительно длиннее, чем показывает простой расчет.
Сколько генов в одной хромосоме?
ДНК прокариот устроена более просто: их клетки не имеют ядра, поэтому ДНК находится непосредственно в цитоплазме в форме нуклеоида.
Как известно, бактериальные клетки имеют хромосому в виде нити ДНК, уложенной в компактную структуру – нуклеоид. Хромосома прокариота Escherichia coli, чей геном полностью расшифрован, представляет собой кольцевую молекулу ДНК (на самом деле, это не правильный круг, а скорее петля без начала и конца), состоящую из 4 639 675 п.н. В этой последовательности содержится примерно 4300 генов белков и еще 157 генов стабильных молекул РНК. В геноме человека примерно 3,1 млрд пар нуклеотидов, соответствующих почти 29 000 генам, расположенным на 24 разных хромосомах.
Прокариоты (Бактерии).
Бактерия E. coli имеет одну двухцепочечную кольцевую молекулу ДНК. Она состоит из 4 639 675 п.н. и достигает в длину примерно 1,7 мм, что превышает длину самой клетки E. coli приблизительно в 850 раз. Помимо крупной кольцевой хромосомы в составе нуклеоида многие бактерии содержат одну или несколько маленьких кольцевых молекул ДНК, свободно располагающихся в цитозоле. Такие внехромосомные элементы называют плазмидами (рис. 16).
Большинство плазмид состоит всего из нескольких тысяч пар нуклеотидов, некоторые содержат более 10000 п. н. Они несут генетическую информацию и реплицируются с образованием дочерних плазмид, которые попадают в дочерние клетки в процессе деления родительской клетки. Плазмиды обнаружены не только в бактериях, но также в дрожжах и других грибах. Во многих случаях плазмиды не дают никаких преимуществ клеткам-хозяевам, и их единственная задача — независимое воспроизведение. Однако некоторые плазмиды несут полезные для хозяина гены. Например, содержащиеся в плазмидах гены могут придавать клеткам бактерий устойчивость к антибактериальным агентам. Плазмиды, несущие ген β-лактамазы, обеспечивают устойчивость к β-лактамным антибиотикам, таким как пенициллин и амоксициллин. Плазмиды могут переходить от клеток, устойчивых к антибиотикам, к другим клеткам того же или другого вида бактерий, в результате чего эти клетки также становятся резистентными. Интенсивное применение антибиотиков является мощным селективным фактором, способствующим распространению плазмид, кодирующих устойчивость к антибиотикам (а также транспозонов, которые кодируют аналогичные гены) среди болезнетворных бактерий, и приводит к появлению бактериальных штаммов с устойчивостью к нескольким антибиотикам. Врачи начинают понимать опасность широкого использования антибиотиков и назначают их только в случае острой необходимости. По аналогичным причинам ограничивается широкое использование антибиотиков для лечения сельскохозяйственных животных.
Эукариоты.
Таблица 2. ДНК, гены и хромосомы некоторых организмов
Неканоническая ДНК
Неканоническая ДНК
Эта картинка иллюстрирует тот факт, что один автор носит бороду, а второй живёт в Сибири. Изучение механохимического расщепления ДНК ультразвуком символически передано через попытку расколоть нечто крепкое и двухцепочечное. Кроме того, это наглядное пособие по изучению образования воббл-пар (так, ничтоже сумняшеся, мы переводим термин wobble).
Авторы
Редакторы
Статья на конкурс «Био/Мол/Текст»: Мы предлагаем читателю узнать, чем же отличается тимин от урацила. Тривиальные ответы — например, «метильной группой» или «в РНК урацил, а в ДНК — тимин» не принимаются. В поисках ответа придётся забраться в область эпигенетики, чтобы сначала разобраться в отличиях цитозина от 5-метилцитозина. Придётся узнать про ультразвук, способный разорвать ДНК неслучайным образом. Повстречаться с фантастическим таутомером, способным приносить пользу, но продолжающим вредить. Увидеть в спектре ЯМР явные признаки таутомеров, до недавнего времени считавшихся чем-то неприличным. А также мы расскажем о планах вандалов по разрушению фундамента эпигенетики. Вам будет предложено бороться с вандалами или присоединиться к ним (оба варианта интереснее, чем стоять в стороне). В заключение авторы успокаивают читателей и извиняются за непреднамеренное введение в заблуждение.
Конкурс «Био/Мол/Текст»-2020/2021
Эта работа заняла первое место в номинации «Своя работа» конкурса «Био/Мол/Текст»-2020/2021.
Генеральный партнер конкурса — ежегодная биотехнологическая конференция BiotechClub, организованная международной инновационной биотехнологической компанией BIOCAD.
Спонсор конкурса — компания SkyGen: передовой дистрибьютор продукции для life science на российском рынке.
Спонсор конкурса — компания «Диаэм»: крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.
Химия — это наука о веществах; и поскольку молекулярная биология изучает вещества, а не торгует ими, как предметами потребления, постольку хорошее знание химии ей необходимо.
Эрвин Чаргафф. Белибердинское столпотворение
В чём отличие?
Так как этот текст мы написали специально для «Биомолекулы», то не будем удивлены, если вам, уважаемый читатель, приходилось слышать, читать или даже сдавать на экзамене вопрос о том, чем отличается ДНК от РНК. Не удивимся мы, если вы не только сдавали экзамен, но и сами уже должны принимать эти экзамены, готовиться к лекциям, перечитывать учебники. Вы наверняка знаете, что в ДНК находится тимин, а вот в РНК — урацил. А в чём отличие тимина от урацила? Вы, конечно, помните, что у тимина есть метильная группа. Точнее было бы сказать, что тимин — это 5-метилурацил. Но это неполный ответ на вопрос. Нас должно интересовать, что именно меняет эта метильная группа в урациле, чем она полезна для ДНК? Этот вопрос мог бы получить ответ на языке химии: если свойства ДНК поменялись бы от замены тимина урацилом, то именно эти отличия нужно было бы изучить. Нужно и можно — ещё не значит сделано. Ответ на вопрос «Чем отличается тимин от урацила?» так и не раскрыт полностью в наиболее популярных учебниках молекулярной биологии. Если вы дочитаете наш текст до конца, то мы обещаем дать ответ на этот вопрос. И вы сможете удивить экзаменатора. Или сможете удивить студентов на вашей лекции, что, пожалуй, даже полезнее.
Если мы знаем, как метильная группа в 5-метилурациле (то есть тимине) влияет на свойства ДНК, то меняет ли это наш взгляд? В чём отличие? Главное отличие — в возможности найти причину изменений и оценить пользу от них. Если смотреть на метильные группы в ДНК как на лепной декор на стене зала Большого театра, то возможны две принципиально различные точки зрения. Первая успокаивает наше любопытство утверждением, что лепной декор нужен просто «для красоты». А вторая точка зрения побеждает, если поставить эксперимент и убрать декор, заменив его на барельеф с портретами Ленина и Сталина. Оказывается, эхо в концертном зале будет отражаться от высоких лбов советских вождей и портить акустику зала. И неожиданно возникает понимание, что красота была не случайна и несла в себе большую практическую пользу. Но для понимания пользы и для полноценного восприятия красоты у организаторов ремонта Большого театра в 1930-е годы не хватило первоначального образования. Нехватка образования была вполне компенсирована способностью признавать свои ошибки и учиться на них. Лепной декор был восстановлен по фотографиям.
К сожалению, в молекулярной биологии до сих пор можно встретить такое созерцательное отношение к некоторым химическим модификациям. Пример с тимином и урацилом кажется вам не таким смешным, как пример с барельефами вождей в Большом театре? Тогда: Добро пожаловать в эпигенетику!
Окрылённые возможностью сразу узнать что-то интересное и важное, эпигенетики перепрыгивают через скучные детали влияния метильной группы на химию цитозина. Зачем знать, как работает двигатель, если вы сидите за рулем новой машины, которая несет вас по новой дороге прямо в воздушные замки новой и модной науки? Чтобы далеко не ходить, обратимся к статьям по эпигенетике на «Биомолекуле». Эпигенетика перебрасывает мосты от генетики к психологии [1], [2], изучает болезни [3], [4] и обещает победить старение [5–7]. В двух из семи статей даже есть химические формулы [3], [4]! Рекомендуем прочитать их, чтобы уловить всю прелесть созерцания метильного декора ДНК.
Чем отличается цитозин от 5-метилцитозина?
Ставить вопросы вместо заголовков в разделах — некрасиво. Мы осознаём это и раскаиваемся. В своё оправдание хотим сказать, что старались привлечь внимание к сходству проблемы сравнения цитозина и 5-метилцитозина с одной стороны и проблемы сравнения урацила и тимина (5-метилурацила). Для того, чтобы сходство было очевидно, мы отразили его на рисунке 1. Мы осознаём, что каждая формула, помещённая в текст научно-популярной статьи, уменьшает количество читателей вдвое. Четыре химические формулы на одном рисунке должны лишить нас читательской аудитории. Недаром же в статьях по эпигенетике на «Биомолекуле» формулы встречаются так редко. Тем не менее, мы просим сделать усилие и продолжить чтение после рассматривания этого рисунка.
Рисунок 1. Урацил и тимин (сверху), цитозин и 5-метилцитозин (внизу). Найдите отличия.
Помните, что вы получаете возможность удивить экзаменатора. Даже двух экзаменаторов: первого по молекулярной биологии, а второго — по эпигенетике. Если вы ещё не выбрали спецкурс по эпигенетике, то советуем выбрать. Если в вашем университете такого спецкурса ещё нет, то можно удивить своими знаниями преподавателей онлайн-курсов. Мы агитируем всех: приходите в эту область науки, ведь, по нашему мнению, она находится на пороге удивительных событий!
В эпигенетике на настоящий момент совмещено, казалось бы, невозможное: молекулярная природа изучаемого объекта сочетается с наивной описательностью и даже какой-то детской верой в целенаправленность всех наблюдаемых в ДНК изменений. Поменяли состав корма мышам с предрасположенностью к диабету — и увидели в ДНК метильные группы. Потренировали полгода лентяев — и тоже увидели изменение в метилировании почти тысячи генов. Размах и масштаб затрат почти обратно пропорционален предсказательным и объяснительным возможностям работ.
В отличие от метильной группы в тимине, метильная группа 5-метилцитозина ассоциируется с важными биологическими эффектами: появилась метильная группа в регуляторном участке ДНК — и останавливается считывание гена. Или вот ещё пример: если обнаруживается много 5-метилцитозинов в ДНК, то это признак рака. Казалось бы, это повод изучить, что же меняется в ДНК при появлении метильной группы. Если вы заглянете в хороший учебник молекулярной биологии (например, «Молекулярная биология клетки» Альбертса, издание 2013 года, раздел 7.1), то убедитесь, что принято считать, что ничего в ДНК не меняется [8]. Точнее, авторы учебника последовательно развивают мысль о том, что метильной группы достаточно, чтобы одни белки узнавали нужный участок, а другие не узнавали. В математической статистике это называется «нулевой гипотезой»: в первом приближении принимается, что никаких изменений и различий нет. Все, кто вынужден был подвергать статистической обработке результаты собственных экспериментов, проверяли нулевую гипотезу. Если помните, всё самое интересное начинается, если нулевую гипотезу удаётся отклонить.
Почему метилирование может ничего не поменять в ДНК? Ну, например, потому что метильная группа маленькая, незаряженная, водородных связей не образует. Если метилирование вдруг меняет свойства ДНК в том самом месте, то это открывает совсем другие перспективы: как минимум, перспективу переписать в упомянутом учебнике раздел 7.1.
Оказывается, меняет! После метилированных цитозинов ДНК в 1,5 раза чаще разрывается ультразвуком и прочими механохимическими методами [9–13] (рис. 2).
Локально меняются свойства ДНК. Нулевую гипотезу можно отклонить и заменить на более интересную картину! Это здорово, это должно что-то значить, только вот что? Для того, чтобы понять, что происходит в ДНК в результате метилирования цитозина, необходимо объяснить то, что мы знаем о разрушении ДНК ультразвуком. Оказывается, ДНК всегда лучше разрывается после цитозина (даже до метилирования), причем проще всего разрыву образоваться между двух соседних «букв» CG (рис. 2). Наиболее проницательные воскликнули сейчас: «Так ведь там и метилируется!», и будут правы! Именно там цитозин метилируется, и ДНК начинает рваться еще в 1,5 раза чаще.
Рисунок 2. Относительная частота одноцепочечных разрывов ДНК между двумя соседними нуклеотидами. CpG лидирует даже без метилирования!
Удивительно, но нам повезло именно потому, что при внедрении механохимического расщепления ДНК как способа готовить образец к NGS-секвенированию никто не пробовал проверять «нулевую гипотезу». Почему-то разработчики подумали, что ДНК должна рваться случайным образом. Это казалось очевидным, ведь ДНК рвётся по сахарофосфатному остову; при чём здесь может быть последовательность нуклеотидов? Такой подход называется «экономией мышления» и применим практически ко всему. Кто хотел бы заранее думать о возможных помехах и неприятностях? Возможно, такие люди есть, но не они создают новые методы секвенирования и не внедряют их.
Хотя в России уже тогда были работы о том, что ДНК рвется ультразвуком не случайно. Работы эти начал Сергей Львович Гроховский в Институте молекулярной биологии [10]. Это была очень оригинальная и самобытная работа. Постепенно, совсем без NGS-секвенирования, российские учёные убеждались, что ДНК разрывается ультразвуком избирательно [11]. К счастью, разработчики методов NGS не имели времени даже для прочтения статей российских коллег и широко внедрили свою технологию. И то, что было доступно только в одной российской лаборатории, вдруг появилось в десятках и сотнях лабораторий мира. Статистика неслучайного разрыва ДНК стала настолько массовой, что нулевая гипотеза просто исчезла [12]. А потом оказалось, что маленькая метильная группа в цитозине делает ДНК хрупкой именно рядом с цитозином [13]. Затрещала нулевая гипотеза, на которой были построены представления о взаимодействии ДНК с регуляторными белками.
Что-то не так с цитозином
Цитозин уже сам по себе делает ДНК более хрупкой, но в обычной картине В-ДНК этому нет объяснений. Рвётся сахаро-фосфатный остов ДНК, а его структура демонстрирует признаки такой регулярности, что можно говорить о почти строгой периодичности и независимости от последовательности нуклеотидов. Классическая двойная спираль не даёт подсказок о причинах разрыва ДНК после цитозина.
Наши представления о ДНК начали меняться совсем недавно, не более десяти лет назад. Были открыты короткоживущие переходные пары оснований (transient base pair), образующиеся в двойной спирали [14–16]. Их оказалось на удивление много как по разнообразию, так и по количеству. Некоторые из них при удачных условиях могли претендовать более чем на 1% от общего числа пар. Наблюдать такие пары стало возможным благодаря существенному развитию методов ЯМР-спектроскопии. Новые методы позволяют наблюдать за состояниями, существующими считанные миллисекунды, которые привычные методы ЯМР примут за обычный шум [17]. Да и слово «наблюдать» не совсем верное в данном случае; скорее, метод позволяет выделять из шума (дисперсии) сигнала некоторые признаки присутствия конкретной короткоживущей пары. Это требует большого количества образцов, много времени и денег, а также хорошей модели, которая могла бы всё это объяснить. Да, чуть не забыли: еще нужны светлые головы. Всё необходимое сосредоточилось в Дьюкском университете в лаборатории профессора Аль-Хашими. В рамках этого направления уже делалась попытка объяснить эффект метилирования цитозина — к сожалению, неуспешная, но очень важная для нас [18]. Дело в том, что метод Аль-Хашими требует с самого начала знать, какой вид имеет короткоживущая пара. Нам представилась возможность первыми понять, какой должна быть эта пара.
Мы использовали саму идею, что в ДНК могут быть неканонические пары оснований, то есть цитозин может образовать с гуанином не Уотсон-Криковскую пару. Мы искали пару, которая будет искажать сахаро-фосфатный остов вблизи цитозина и будет способствовать разрыву этого остова ультразвуком. Одна подсказка была у нас заранее: мы знали, что именно не так с цитозином. Цитозин мог позволить себе превращение в нечто, похожее на урацил. Мы знали это из анализа спектра ЯМР дезоксицитидина: на этом спектре были неустранимые сигналы, которые можно было объяснить только наличием таутомерной иминоформы цитозина [19] (рис. 3). И это было опасной ересью, подрывающей некоторые догмы.
Таутомеры — это обычное явление в органической химии, таутомерию даже в школе проходят. Чаще всего таутомерия — это всего лишь перепрыгивание атома водорода внутри молекулы с образованием новой связи и разрывом старой. Но вот таутомерия в ДНК — это табу. Если разрешить там таутомерию, то как объяснить точность хранения и копирования генетической информации? Поэтому отцы-основатели поступили мудро: если запретить таутомерию, то может быть, она и не появится? Таким образом, безответственное поведение атома водорода и лёгкость разрыва старых и образования новых связей были осуждены. Хотя мы не одобряем такие поступки как постоянный разрыв старых и образование новых связей у людей, но зачем же было переносить это осуждение на водород? Некоторые атомы одновременно по несколько связей образуют — и им можно? Впрочем, у водорода бывают ещё и водородные связи, так сказать, на стороне. Видимо, водород в ДНК как раз из-за них осудили — захотели, чтобы сохранялась хрупкая водородная связь.
Рисунок 3. Признаки таутомеров. Небольшие бугорки в ЯМР-спектре раствора дезоксицитидина (на вертикальной оси около 150 и 170) неустранимы при любом рН. Получается, что в молекуле цитозина как бы пять разных атомов азота. Это можно объяснить перепрыгиванием протона и изменением ближайшего окружения сразу двух азотов в имино таутомере.
Давным-давно, на заре эры молекулярной биологии, существовали учёные, чьи пророчества сбывались почти всегда. И так как уважение к отцам-основателям велико, то критика пророчеств может быть воспринята как критика тех самых полубогов, которые в молекулярной биологии «наше всё». Конкретная таутомерная форма, в которой следует записывать формулы оснований, стала краеугольным камнем в конструировании двойной спирали ДНК. Правильную запись подсказал Уотсону и Крику Джерри Донохью [20], впоследствии активно боровшийся с «догмами» молекулярной биологии (в том числе и тогда, когда был неправ). После триумфа двойной спирали ДНК дальнейшие события можно описать так: «И увидел Френсис Крик таутомеры разные и разделил их на хорошие, способные войти в двойную спираль, и плохие, способные лишь внести в нее мутации. И повелел Крик, что плохие таутомеры должны быть редкими и увидел он, что это хорошо».
Этот таутомерный «рай» и «ад» был, вероятно, даже полезным допущением в первое время. К сожалению, позже это начало мешать развитию понимания, как и любая догма. Например, чтобы не увидеть таутомеры в спектре ЯМР дезоксицитидина (рис. 3), можно стереть их сигналы из спектра, но это было бы жульничеством. Чтобы не спорить с догмой, можно поступить иначе: достаточно потратить на запись спектра меньше времени. Шума будет больше, лишние сигналы утонут в шуме, и рецензенты пропустят вашу работу. Зачем записывать спектр двое суток, если в результате ваша рукопись будет возвращена без рассмотрения? Поступать так, как поступил наш соавтор Илья Ельцов можно, только если рецензент в журнале напишет вам, что пропустит статью, когда вы докажите наличие таутомеров в вашем спектре. В этой работе Илье очень помог карантин, объявленный весной, и в результате появилось много свободного времени на его ЯМР-спектрометре. Илья смог снять спектры при различных значениях рН, и везде таутомеры были видны. Мы выражаем признательность всем, благодаря кому состоялся карантин и эта работа.
Говорить о распространённости, важности и тем более полезности неканонических пар с участием таутомеров считалось дурным тоном до последнего десятилетия. Так совпало, что экспериментальные доказательства распространённости таутомеров начали появляться почти одновременно с данными о распространённости неканонических пар в ДНК. Про неканонические пары и таутомеры стало не только можно, но и модно писать, поэтому неудивительно, что стали появляться статьи, где есть неканонические пары с участием таутомеров [7]. Кажется, нам тут просто повезло, но кто знает — может быть, это последствия какого-то общего тренда на борьбу с дискриминацией? Таутомеров и неканонических пар перестали стесняться в последние десять лет. И было только вопросом времени, что у этих объектов обнаружится какая-то польза. Толерантность!
Мы взяли таутомерный цитозин попробовали найти неканоническую пару, способную объяснить все экспериментальные факты, и. нашли [21].
Пара воббл-GC: гибрид кентавра и единорога
Единственная пара, которая объяснила всё наблюдаемое, оказалась сама настолько невероятной, что заставила вспомнить сразу два классических английских сюжета. Первый — это битва Единорога и Льва, свидетелем которой была Алиса Льюиса Кэрролла.
Для того, чтобы увидеть появление этой пары, посмотрите на рисунок 4. Правда, напоминает нашу заглавную картинку? И неслучайно: атомы сахаров C1′ находятся на одном и том же расстоянии — они как бы прибиты гвоздиками к палочке, как и фигурки на деревянной игрушке. В результате смещение гуанина и цитозина в воббл-пару требует напрячь сахаро-фосфатный остов рядом с цитозином, зато около гуанина он расслабляется (релаксирует). Цитозину и самому приходится «напрячься», так как у обычного цитозина нет для воббл-пары необходимого протона около азота, поэтому ему приходится превратиться в таутомер.
Заметим, что мы русифицировали здесь термин wobble, попросту записав его кириллицей. Дело в том, что в русском языке было несколько скромных попыток перевести wobble на «язык родных осин»: писали и про «качающиеся пары», и про «неточные», даже про «неоднозначные» — хорошо, что не предложили танцующие пары, свингующие и пары-выскочки (они ведь выскакивают из двойной спирали ДНК). Мы здесь следуем завету Пушкина: «Но панталоны, фрак, жилет, Всех этих слов на русском нет». Как нет? — скажете вы. Ведь есть эти слова в современном русском языке! Да, есть — они для Пушкина появились недавно, как калька с французского. Вот и мы делаем простую кальку с английского, предлагая новую «одёжку» для ДНК — такой, понимаете ли, эпигенетический жилет, который надевает ДНК, когда идёт на приём к эпигенетикам.
Рисунок 4. Анимация, изображающая образование воббл-GC пары
Предлагаемая нами пара сочетала в себе свойства таутомера с воббл-структурой (рис. 5). Цитозин становится аналогом урацила и формирует аналог пары GU. Химера, объединяющая мифические злобные редкие таутомеры или легендарную воббл-пару, воспетую Криком в его одноимённой гипотезе. Лет десять назад любой редактор указал бы нам на то, что мы подвергаем глумлению всё самое святое, ведь если такое возможно в ДНК, то возможна любая случайность?
Нам немного помогло, что уже несколько лет известна пара GU с участием таутомеров и точной копией Уотсон-Криковской структуры [17]. Мы могли сказать, что пара короткоживущая, а это безобразие ненадолго. Но вот утаить, что это безобразие полезно, мы не могли. Есть что-то противоречивое, парадоксальное и даже абсурдное в том, что придуманная Фрэнсисом Криком воббл-структура помогает отвергнутому Криком таутомеру стать важной частью ДНК. Конечно, эта парадоксальность связана с тем несомненным фактом, что Фрэнсис Крик был в самом эпицентре того Большого взрыва, который породил Вселенную молекулярной биологии. Всё же нельзя забывать, что Крик был гением, а значит, даже его заблуждения могут долго восприниматься как истины.
Рисунок 5. Таутомерная (а) и протонированная (б) форма пары воббл-GC. У нормального цитозина нет протона для образования той порочащей его водородной связи, которая находится выше на рисунке. Но протон может перепрыгнуть от аминогруппы (это таутомер) или же протон может появиться при подкислении среды (тогда на азоте появится заряд). Так и хочется сказать: «Ну здравствуй, чудище!»
Второй сюжет — это классическое высказывание Шерлока Холмса: «Если все версии, кроме одной, отброшены, то эта последняя, сколь бы невероятной она ни казалась, и будет истинной». Холмс допустил тут логическую ошибку: последняя версия тоже могла бы быть неверной и указывала бы на противоречивость всей цепочки рассуждений. Но у нас была возможность проверить последнюю версию на прочность.
Во-первых, нам было необходимо найти неканоническую пару GC, у которой нет аналогов на основе пары AT. Во-вторых, нам было нужно, чтобы пара значительно и при этом асимметрично искажала сахаро-фосфатный остов. В-третьих, нам нужна была возможность появления пары в результате протонирования цитозина. Третье условие было вызвано тем фактом, что расщепление ДНК значительно усиливается при умеренном понижении рН [9]. В этих условиях протонируется цитозин, а протонированный цитозин аналогично таутомерному способен сделать воббл-пару (рис. 4). Двум последним условиям удовлетворяла и хугстиновская пара GC, хотя второе условие воббл-пара выполняла лучше. Нам повезло: Аль-Хашими сделал ставку на хугстиновскую пару и не нашёл её связи с метилированием [18].
Метилирование для управления таутомерией
Вот мы и подошли к ответу на вопрос: чем цитозин отличается от 5-метилцитозина. 5-метилцитозин более склонен к формированию иминотаутомера. Метильная группа как донор электронной плотности смещает таутомерное равновесие в сторону образования «редкого таутомера». Это смещение провоцирует образование GC воббл-пары (рис. 4, слева), что и отражается на увеличении частоты расщепления ДНК ультразвуком. Приятным дополнением к этой идее является возможность объяснить таутомерией свойства всех четырёх модифицированных цитозинов, которые подозреваются или уличены в роли эпигенетических маркеров [21]. Кроме 5-метилцитозина, мы объяснили свойства 5-гидроксиметилцитозина, 5-формилцитозина и N4-аминометилцитозина (рис. 6).
Рисунок 6. Все производные цитозина, подозреваемые в пособничестве регуляции экспрессии генов, склонны к формированию иминотаутомерной формы. (А) 5-гидроксиметилцитозин, (Б) 5-формилцитозин и (В) N4-аминометилцитозин.
Точно с этих же позиций можно объяснить отличие тимина от урацила. Наличие метильной группы в тимине смещает равновесие в сторону того таутомера, где есть протон вблизи азота N3, то есть в сторону привычной нам кетоформы тимина. Зачем это нужно? Напомним, что уже доказана возможность формирования пар GU с участием редкого таутомера, а значит, метилирование повышает точность копирования ДНК. Но кроме этого, метилирование повышает температуру плавления двойной спирали, что может быть даже полезнее.
Ну вот и всё, мы проболтались, чем тимин отличается от урацила. Не сохранили интригу до конца истории. Интересно ли читать детектив после того, как стал известен убийца и мотив? Но мы запасли еще одну страницу действия, погонь и мелких драк. А также указание на то, чего ждать в следующем сезоне.
Доказательство с тёмной стороны
Хотя у таутомеров и у неканонических пар мы нашли нечто полезное, но это не значит, что мы магическим образом перетянули их на сторону добра. Повышенный риск мутаций для этих пар мы не только не отменили, но даже смогли обосновать заново. GC воббл-пара оставляет азот N4 без водородной связи, а значит, он совершенно беззащитен для посторонних атак (пожалуйста, ещё раз взгляните на рисунок 4). Такое положение азота увеличивает вероятность дезаминирования цитозина.
Можно считать это темной стороной таутомерии, но рациональнее считать мутации допустимой платой за возможность регулировать, переключать и управлять молекулой ДНК. С одной стороны, обидно, что ДНК склонна портиться как раз в таком важном месте. С другой стороны, мы не удивляемся, когда ломается именно та часть механизма, которая двигается больше остальных.
Метилирование действительно увеличивает риск мутации дезаминирования цитозина. В учебниках и научно-популярной литературе закрепилось мнение, что система репарации плохо справляется с парой GT, так как привыкла к паре GU. Тем не менее, есть прямые экспериментальные данные, которые указывают на увеличение именно скорости мутации. Да и система репарации, встретив GT, должна однозначно определять, что удалить надо T, то есть задача разрешима.
Что же это доказывает? У хугстиновской пары GC аминогруппа стабилизирована водородной связью с гуанином. Конкурент бы провоцировал совсем другую мутацию. Это ещё одно доказательство, что между воббл и хугстиновской парой мы должны выбрать воббл.
Польза зданию эпигенетики от смещения фундамента
Не повредили ли мы стройное здание эпигенетики? Может ли дальше существовать всё, что уже было создано непосильным трудом и непомерными затратами денег и реактивов на секвенирование? Можно ли после сдвига фундамента быстро заделать трещины в стенах? Честно сказать, нас не очень волнуют ответы на эти вопросы. Мы смотрим на складывающуюся ситуацию обывательски, прагматично: нам бы на сдвинутом фундаменте флигель построить или башенку. То есть нам бы хотелось обсудить возможные перспективы строительства эпигенетики на новом фундаменте. Например, о влиянии рН на метилирование цитозина до нас не говорили, а открытый нами механизм делает влияние рН не просто возможным, а неизбежным. До нашей работы не было идей о том, как возник сам механизм регуляции ДНК посредством метилирования, а теперь видно, что воббл пары были и до метилирования. Метилирование лишь усилило, несколько гипертрофировало имеющуюся тенденцию, а значит, механизм появился не на пустом месте. Взаимодействие регуляторных белков с ДНК рассматривалось как узнавание Уотсон-Криковских пар, а теперь придётся учитывать выскакивание нуклеотидов с возможностью образования новых водородных связей. Неожиданным предсказанием стало возможное сходство метилтрансфераз с ферментами репарации, так как в обоих случаях придется искать в ДНК воббл пару. Мы чувствуем себя, пусть ненадолго, как те, чьи пророчества могут сбываться.
Мы пока находимся в том удивительном состоянии, когда открытый нами механизм имеет статус гипотезы, а значит, долг настоящих учёных — пытаться опровергнуть нашу гипотезу. Если гипотеза достаточно крепка, то все брошенные в нас камни мы сможем встроить в здание, которое будем сооружать на этом новом фундаменте.
Самая главная польза предлагаемого механизма — это систематический отказ от телеологии в эпигенетике. ДНК теперь метилируется не «для того чтобы», а «потому что»: у этого процесса исчезла цель и появился механизм. Исчезла описательность и созерцательность, появилась причинность. Вспомните: лепной декор в театре перестает быть просто украшением и становится поверхностью, рассеивающей звук. За красотой проступает смысл. Появился новый взгляд на всю область знаний, и многие могут попытаться теперь взглянуть на эпигенетику с новой точки зрения.
Вместо заключения
В заключении мы вынуждены сделать важное успокоительное замечание: разрыв ДНК ультразвуком полностью прекращается при температуре 30 градусов Цельсия — и так как наша температура превышает эту величину, то объясненный в тексте процесс никак не связан со слухами о том, что УЗИ может вызвать мутации и нарушения внутриутробного развития. Простите, если мы нечаянно заинтересовали вас именно ассоциацией с этой темой, а теперь разочаровали.
Первоначальная версия этого эссе была опубликована в Bioessays [21] .