Что такое мусорная днк
Ученые объяснили задачу «мусорной» ДНК
Новое исследование, проведенное в лаборатории члена Института Уайтхеда Юкико Ямаситы подтверждает, что «мусорная» ДНК играет ключевую роль в видообразовании.
Читайте «Хайтек» в
Более 10% нашего генома состоит из повторяющихся, считавшихся бессмысленными участков генетического материала, которые не кодируют никаких белков.
В серии работ за несколько лет член института Уайтхеда Юкико Ямасита и его коллеги доказали, что так называемая мусорная ДНК не такая бесполезная, как кажется на первый взгляд. На самом деле она играет важную роль в клетке: эта ДНК работает с клеточными белками, чтобы сохранить все отдельные хромосомы клетки вместе в одном ядре.
Во время своей работы авторы изучили, как эта часть ДНК влияет на фертильность и выживание видов, тогда у ученых появился первый намек на то, что эти повторяющиеся последовательности могут играть определенную роль в видообразовании.
Чтобы это проверить, исследователи удалили белок под названием Prod, который связывается с определенной последовательностью «мусорной» ДНК у плодовой мухи Drosophila melanogaster, в результате их хромосомы рассеялись за пределами ядра в крошечные шарики клеточного материала и насекомые погибли.
Если бы этот фрагмент «мусорной» ДНК был необходим для выживания одного вида, но отсутствовал у другого, это могло бы означать, что два вида мух со временем развили разные последовательности для одной и той же роли. И поскольку «мусорная» ДНК сыграла определенную роль в сохранении всех хромосом вместе, исследователи задались вопросом, могут ли эти эволюционные различия быть одной из причин, по которой разные виды репродуктивно несовместимы.
Чтобы понять, как различия в спутниковой ДНК могут привести к репродуктивной несовместимости, исследователи решили сосредоточиться на двух ветвях генеалогического древа плодовой мухи: классической лабораторной модели Drosophila melanogaster и ее ближайшего родственника, Drosophila simulans. Эти два вида разошлись друг от друга около 2-3 млн лет назад.
Исследователи могут скрестить самку Drosophila melanogaster с самцом Drosophila simulans, но в результате потомство либо бесплодно, либо умирает.
Авторы разводили мух, а затем изучали ткани потомства, чтобы понять, почему так происходит. Когда авторы посмотрели на гибридные ткани, то выяснили, что их фенотип был точно таким же, как если кто-то нарушил «мусорную» ДНК чистого вида. Хромосомы были разбросаны, а не инкапсулированы в одно ядро.
В результате авторы сделали вывод, что «мусорная» ДНК регулярно мутирует и буквально задает стратегию скрещивания для разных видов.
«Мусорная» ДНК — пещера Аладдина с геномными сокровищами
Человеческий геном состоит из 3,42 миллиардов нуклеотидов, упакованных в 23 пары линейных хромосом. Большая часть геномов млекопитающих имеет сопоставимый размер: в мышином содержится 3,45 миллиарда нуклеотидов, в геноме крыс — 2,90 миллиарда, коров — 3,65 миллиарда. Нуклеотиды составляют количество генов равное примерно 35 000. Конечно, существуют и крайности: например, летучие мыши вида Обыкновенный длиннокрыл (Miniopterus schreibersi) имеют относительно небольшой геном в 1,69 миллиарда нуклеотидов, Красная крыса вискача (Tympanoctomys barrerae) имеет геном длиной 8,21 миллиарда нуклеотидов. Среди позвоночных животных наиболее вариабелен размер генома у рыб: геном Зеленого тетраодона (Chelonodon fluviatilis) содержит всего 0,34 миллиарда нуклеотидов, а у Мраморных легких рыб или Мраморных протоптеров (Protopterus aethiopicus) геном гигантский, состоящий из почти 130 миллиардов нуклеотидов. При этом у большинства видов наблюдается «избыток» ДНК, которая не кодирует белки. У людей, например, только около 2 % ДНК фактически кодирует белки [1].
На протяжении десятилетий ученые были озадачены этим явлением. Некодирующая часть генома была объявлена бесполезной или «эгоистичной ДНК», не способствующей адаптации организма. Идея «мусора» в генетическом материале предшествовала геномным исследованиям и основывалась на парадоксе С-значения (С-значение обозначает содержание гаплоидной ядерной ДНК) — наблюдении, что количество ДНК и сложность структуры плохо коррелируют со сложностью организма или уровнем эволюционного развития [2].
В 1972 году генетик Сусуму Оно ввел термин «мусорная ДНК», чтобы описать все некодирующие участки генома, большая часть которых состоит из повторяющихся сегментов, хаотично разбросанных по всему геному.
Как правило, эти участки ДНК возникают в результате транспозиции или перемещения участков ДНК в разные точки в геноме (из донорского в реципиентный). Эти дискретные нуклеотидные фрагменты ДНК с вариабельной локализацией в хромосоме представлены транспозонами и их более мелкими фрагментами — мобильными генетическими элементами, которые буквально копируют (произвольное число раз, вплоть до миллиона) или «вырезают» себя из одной части генома и повторно внедряются в другом месте [3].
Хотя термин «мусорная ДНК» очень броский, он отталкивал многих исследователей от изучения некодирующего генетического материала в течение многих лет. В конце концов, кто хотел бы копаться в геномном мусоре? К счастью, некоторые энтузиасты, рискуя быть высмеянными, исследовали данную тему. И именно из-за них в начале 1990-х взгляд на нежелательную ДНК, особенно на мигрирующие элементы, начал меняться (рис. 1) [4]. Фактически, все больше и больше биологов теперь считает повторяющиеся элементы «неограненным алмазом» с недостаточно изученным, но широким потенциалом. Они взаимодействуют с окружающей геномной средой и увеличивают способность организма адаптироваться, служат основой для генетической рекомбинации и продуцируют сигналы для регуляции экспрессии генов [5].
Рисунок 1 | Новые возможности «мусорной» ДНК.
Геномы — это динамические объекты: появляются новые функциональные элементы, а старые исчезают. Так, мусорная ДНК может эволюционировать в функциональную ДНК. Биолог-эволюционист Стивен Джей Гулд и палеонтолог Элизабет Врба использовали термин «экзаптация» — явление, заключающееся в приспособлении существующих свойств к новым потребностям в измененных условиях [6]. Разные геномные объекты могут играть новые роли, независимо от их первоначальной функции, и даже в том случае, если изначально они не имели никакой функции.
Новые геномные элементы обнаруживаются даже после полногеномного секвенирования. Джилл Беджерано и его коллеги обнаружили, что в ходе эволюции позвоночных новый ретропозон — фрагмент ДНК, обратно транскрибированный из РНК, действует как энхансер, который стимулирует транскрипцию гена. Он способен проявлять активность в вариабельных позициях по отношению к промотору [7].
С другой стороны, анонимные последовательности, которые не функционируют у одного вида, могут в другом организме стать экзоном — частью ДНК, которая в конечном итоге транскрибируется в РНК-мессенджер.
Эти и бесчисленные другие примеры демонстрируют, что транспозоны — это не «мусорные» фрагменты, они являются неотъемлемыми компонентами эукариотических геномов (рис. 2) [8]. Эволюция слишком разумна, чтобы информация, закодированная в транспозонах, была дейтсвительно бессмысленной.
Рисунок 2 | Идея геномного баланса. Для этих грузовых судов маленькие ящики с мусором являются балластом. Они должны быть распределены так, чтобы не допустить неисправность. В то время как большая нагрузка может снизить стабильность и уменьшить маневренность судна (вверху), небольшая нагрузка не нарушает хода судна (в середине массива ящиков). Если баланс нарушается, корабль заваливается на тяжелую сторону и мусор сбрасывается в море. И поскольку мы рассматриваем грузовой корабль, без ящиков с мусором его ценность низка, он неконкурентоспособен на рынке грузового транспорта [8].
Ученые выяснили, зачем нужна «мусорная» ДНК
Исследователи из Института наук о жизни при Университете Мичигана и Медицинского института Говарда Хьюза определили, как сателлитная ДНК, которая считалась «мусорной ДНК», играет важнейшую роль в сборке генома. Выводы ученых, опубликованные в журнале eLife, показывают, что генетический «мусор» играет жизненно важную функцию обеспечения правильного расположения хромосом внутри ядра клетки, что необходимо для выживания клеток. И эта функция, по всей видимости, сохранилась у многих видов.
Зачем нужна «мусорная» ДНК?
Перицентромерная сателлитная ДНК состоит из очень простой и часто повторяющейся последовательности генетического кода. И хотя на ее долю приходится значительная часть нашего генома, сателлитная ДНК не содержит каких-либо конкретных инструкций по созданию каких-либо конкретных белков. Более того, ее повторяющийся характер, как полагали, делает геном менее стабильным и более уязвимым для повреждений или болезней. До недавних пор ученые считали, что «мусорная», или «эгоистичная», ДНК не играет никакой роли и не служит никакой цели.
«Мы не могли просто так смириться с мыслью о том, что это просто геномный мусор», говорит Юкико Ямашита, профессор исследований в LSI и ведущий автор исследования. «Если она нам не нужна и мы не получаем от нее ничего, эволюция бы наверняка от нее избавилась. Но этого не произошло».
Ямашита и ее коллеги решили посмотреть, что произойдет, если эта клетки не будут использовать перицентромерную сателлитную ДНК. Поскольку она существует в виде длинных повторяющихся последовательностей, ученые не могут просто мутировать или вырезать всю ДНК из генома. Вместо этого они поручили дело белку D1, который связывается с сателлитной ДНК.
Ученые удалили D1 из клеток широко используемого для испытаний организма, Drosophila melanogaster (плодовая мушка). И тут же обнаружили, что зародышевые клетки — которые обычно превращаются в сперму или яйцеклетки — умирают.
Дальнейший анализ показал, что умирающие клетки формировали микроядра или крошечные почкования за пределами ядра, которые включали части генома. Без всего генома, инкапсулированного в ядро, клетки не могли выжить.
Ученые считают, что белок D1 связывается с сателлитной ДНК, собирая все хромосомы в ядре. Если белок D1 не может захватить сателлитную ДНК, клетка теряет способность образовывать полное ядро и умирает. Дальнейшие испытания показали, что сателлитная ДНК необходима для выживания клеток у разных видов, которые встраивают ДНК в ядро, включая и людей.
Сколько мусора в нашей ДНК?
Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК — одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.
Немного молекулярной генетики
Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) — и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три — от мамы.
Наиболее изученный тип функциональных последовательностей ДНК — гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.
Померимся генами?
Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено? Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас — 20−25 тысяч. Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бОльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus, в 40 раз больше человеческого), так и с бОльшим количеством генов (у риса — 32−50 тысяч генов).
Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов — последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов — белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК — копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов — например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.
Тем не менее бОльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы — последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены — нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».
Идея тотализатора по поводу числа человеческих генов пришла в голову доктору Эвану Бирни в баре при лаборатории в Колд-Спринг-Харбор незадолго до завершения проекта «Геном человека». По мере приближения к финалу, с 2000 по 2002 год, ставки выросли с 1 доллара до 20. В результате банк разделили «на троих»: Пол Дир из Британского совета по медицинским исследованиям, который еще в 2000 году поставил на дату своего рождения — 27.04.1962 — 27 462, Ли Роуэн из Института системной биологии в Сиэтле — в 2001 году она поставила на число 25 947, и Оливер Джейлон из французской компании Genoscope (26 500). Когда главного победителя — доктора Дира — спросили, как ему удалось еще три года назад, когда все думали, что генов у человека не меньше 50 000, угадать число с такой точностью, он ответил: «Дело было в баре, глубокой ночью. Наблюдая за поведением пьющих людей, я подумал, что оно мало отличается от поведения мух-дрозофил, у которых 13500 генов, а потому мне показалось, что удвоенного числа мушиных генов людям вполне достаточно».
Минимальная мышь
Существует точка зрения, что бОльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра? Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК — наличие достаточно близких организмов с очень разными размерами геномов. Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?
Сколько мусора в нашей ДНК?
Александр Панчин,
научный сотрудник сектора молекулярной эволюции ИППИ РАН
«Популярная механика» №1, 2015
Геном рыбы фугу примерно в восемь раз меньше, чем геном человека, и в 330 раз меньше, чем геном двоякодышащей рыбы протоптер. Какие «призраки» живут на «кладбищах геномов», и сколько мусора в нашей с вами ДНК?
Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК — одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.
Немного молекулярной генетики
Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) — и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три — от мамы.
Человек разумный Homo sapiens
Геном предположительно на 90% состоит из мусора. Геном: 3 млрд пар оснований. Генов: 20–25 тысяч
Наиболее изученный тип функциональных последовательностей ДНК — гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.
Померимся генами?
Плодовая муха дрозофила Drosophila melanogaster
Геном модельной мухи. Геном: 120 млн пар оснований. Генов: 13 500
Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено?
Вдвое умнее мух
Идея тотализатора по поводу числа человеческих генов пришла в голову доктору Эвану Бирни в баре при лаборатории в Колд-Спринг-Харбор незадолго до завершения проекта «Геном человека». По мере приближения к финалу, с 2000 по 2002 год, ставки выросли с 1 доллара до 20. В результате банк разделили «на троих»: Пол Дир из Британского совета по медицинским исследованиям, который еще в 2000 году поставил на дату своего рождения — 27.04.1962 — 27 462, Ли Роуэн из Института системной биологии в Сиэтле — в 2001 году она поставила на число 25 947, и Оливер Джейлон из французской компании Genoscope (26 500). Когда главного победителя — доктора Дира — спросили, как ему удалось еще три года назад, когда все думали, что генов у человека не меньше 50 000, угадать число с такой точностью, он ответил: «Дело было в баре, глубокой ночью. Наблюдая за поведением пьющих людей, я подумал, что оно мало отличается от поведения мух-дрозофил, у которых 13 500 генов, а потому мне показалось, что удвоенного числа мушиных генов людям вполне достаточно».
Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас — 20−25 тысяч.
Свободноживущая нематода Caenorhabditis elegans
Маленький модельный геном животного. Геном: 100 млн пар оснований. Генов:
Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бóльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus, в 40 раз больше человеческого), так и с бóльшим количеством генов (у риса — 32−50 тысяч генов).
Двоякодышащая рыба протоптер Protopterus aethiopicus
Самый большой известный геном. Геном: 133 млрд пар оснований. Генов: много
Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов — последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов — белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК — копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов — например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.
Мимивирус Acanthamoeba polyphaga mimivirus
Самый большой известный геном вируса. Геном: 1 181 404 пар оснований. Генов: 979
Тем не менее бóльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы — последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены — нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».
Минимальная мышь
Рыба фугу Fugu rubripes
Самый маленький известный геном позвоночного. Геном: 390 млн пар оснований. Генов: 20−28 тысяч
Существует точка зрения, что бóльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра? Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК — наличие достаточно близких организмов с очень разными размерами геномов.
Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?
На колоссальные различия в размерах геномов сходных организмов обратил внимание эволюционный биолог Сусуму Оно. Считается, что именно Оно ввел термин «мусорная ДНК» (junk DNA). Еще в 1972 году, задолго до того, как был прочитан геном человека, Оно высказал правдоподобные представления как о количестве генов в геноме человека, так и о количестве «мусора» в нем. В своей статье «Столько мусорной ДНК в нашем геноме» он отмечает, что в геноме человека должно быть около 30 000 генов. Это число, на тот момент совсем не очевидное, оказалось удивительно близко к реальному, которое узнали десятки лет спустя. Кроме того, Оно приводит оценку функциональной доли генома (6%), объявляя более 90% генома человека мусором.
Райан Грегори,
специалист по эволюционной биологии и интегративной геномике, адъюнкт-профессор канадского Университета Гэльфа в провинции Онтарио:
«Луковый тест — хорошая проверка для любого, кто думает, что каждый нуклеотид в человеческом геноме имеет определенную функцию. Независимо от того, каковы эти предполагаемые функции, спросите себя: зачем обычному репчатому луку нужен геном примерно в пять раз больше вашего?»
Находка или мусор?
Вызов представлению о существовании мусорной ДНК бросил проект ENCODE — The Encyclopedia of DNA Elements, «Энциклопедия элементов ДНК» (первые его результаты опубликованы в журнале Nature в 2012 году). Получив многочисленные экспериментальные данные о том, какие части генома человека взаимодействуют с различными белками, участвуют в транскрипции — синтезе РНК-копий генов для последующей трансляции (синтеза белка из аминокислот на матрице информационной РНК) — или других биохимических процессах, авторы пришли к выводу, что более 80% генома человека так или иначе функциональны. Разумеется, данный тезис вызвал бурное обсуждение в научном сообществе.
25 000″ border=0 >
Одна из наиболее ироничных статей, опубликованная Дэном Грауром, специалистом по молекулярной эволюционной биоинформатике, профессором Хьюстонского университета, и его коллегами в 2013 году в журнале Genome biology and evolution, называется так: «О бессмертии телевизоров: «функция» в геноме человека по лишенному эволюции Евангелию от ENCODE». Ее авторы отмечают, что отдельные члены консорциума ENCODE расходятся в том, какая часть генома функциональна. Так, один из них вскоре уточнил в журнале Genomicron, что речь идет не о 80% функциональных последовательностей в геноме, а о 40%, а другой (в статье в Scientific American) и вовсе снизил показатель до 20%, но при этом продолжал настаивать, что термин «мусорная ДНК» нужно устранить из лексикона.
По мнению авторов статьи «О бессмертии телевизоров», члены консорциума ENCODE слишком вольно интерпретируют термин «функция». Например, существуют белки, которые называют гистонами. Они могут связывать молекулу ДНК и помогают ей компактно укладываться. Гистоны могут подвергаться определенным химическим модификациям. Согласно ENCODE, предположительная функция одной из таких модификаций гистонов — «предпочтение находиться в 5′-конце генов» (5′-конец — это конец гена, от которого движутся ферменты ДНК- и РНК-полимеразы при копировании ДНК или при транскрипции). «Примерно так же можно сказать, что функция Белого дома — занимать площадь земли по адресу 1600, Пенсильвания-авеню, Вашингтон, округ Колумбия», — отмечают оппоненты.
14 000″ border=0 >
Возникает проблема и с приписыванием функции участкам ДНК. Предположим, что к определенному участку ДНК способен прикрепляться важный для функционирования клетки белок, и поэтому ENCODE приписывает этому участку «функцию». Например, некоторый транскрипционный фактор — белок, инициирующий синтез информационной (матричной) РНК — связывается со следующей последовательностью нуклеотидов: TATAAA. Рассмотрим две идентичные последовательности TATAAA в разных частях генома. После того как транскрипционный фактор связывается с первой последовательностью, начинается синтез молекулы РНК, служащей матрицей для синтеза другого важного белка. Мутации (замены любого из нуклеотидов) в этой последовательности приведут к тому, что РНК будет считываться плохо, белок не будет синтезирован, и это, скорее всего, негативно скажется на выживании организма. Поэтому правильная последовательность TATAAA будет поддерживаться в данном месте генома с помощью естественного отбора, и в этом случае уместно говорить о наличии у нее функции.
Каша ехала на котоцикле
Иногда в СМИ можно услышать некорректную фразу «генетический код мутировал». Но мутации происходят не в коде, а в молекуле ДНК (в геноме). В результате меняются нуклеотидные последовательности. Это можно сравнить с заменой буквы в слове. Например, фраза «Маша ехала на мотоцикле» превращается во фразу «Саша ехала на мотоцикле», если одна буква М «мутировала» в букву С. Изменение генетического кода намного серьезней — это как изменение алфавита. Представим, что во всем тексте буква М внезапно превратилась в букву К. Теперь у нас «Каша ехала на котоцикле». Понятно, что такие изменения приводят к значительным последствиям и поэтому в природе происходят крайне редко. Но происходят! Например, у некоторых инфузорий один из стоп-кодонов может кодировать аминокислоту глутамин. Но это скорее исключение, чем правило. У большинства организмов один и тот же генетический код: например, у человека, у червяка или огурца. А вот геномы у этих организмов различаются очень сильно. Тот же алфавит, но другой текст.
Другая последовательность TATAAA возникла в геноме по случайным причинам. Поскольку она идентична первой, с ней тоже связывается транскрипционный фактор. Но никакого гена рядом нет, поэтому связывание ни к чему не приводит. Если в этом участке возникнет мутация, ничего не изменится, организм не пострадает. В данном случае говорить о функции второго участка TATAAA нет смысла. Впрочем, может оказаться, что наличие в геноме большого количества последовательностей TATAAA вдали от генов нужно просто для того, чтобы связывать транскрипционный фактор и уменьшать его эффективную концентрацию. В таком случае отбор будет регулировать число таких последовательностей в геноме.
Чтобы доказать, что некоторый участок ДНК функционален, недостаточно показать, что в этом участке происходит некий биологический процесс (например, связывание ДНК). Члены консорциума ENCODE пишут, что функцией обладают участки ДНК, которые вовлечены в транскрипцию. «Но почему нужно акцентировать внимание на том, что 74,7% генома транскрибируется, в то время как можно сказать, что 100% генома принимает участие в воспроизводимом биохимическом процессе — репликации!», — снова шутит Граур.
Репликация
Репликация (от лат. replicatio — возобновление) — процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской. При следующем за этим делении каждая из дочерних клеток получает по одной копии молекулы ДНК, идентичной ДНК исходной материнской клетки. Репликацию ДНК осуществляет реплисома — сложный ферментный комплекс, состоящий из 15−20 различных белков.
Хорошим критерием функциональности участка ДНК является то, что мутации в нем достаточно вредны и значительные изменения этого участка не наблюдаются из поколения в поколение. Как определить такие участки? Здесь на помощь и приходит биоинформатика, современная наука на стыке биологии и математики об анализе последовательностей генов и белков. Мы можем взять геномы человека и мыши и найти в них все похожие участки ДНК. Окажется, что у этих двух видов какие-то участки последовательностей нуклеотидов очень похожи. Например, гены, необходимые для синтеза рибосомальных белков, довольно консервативны, то есть мутации в них достаточно вредны, чтобы носители новых мутаций вымирали, не оставляя потомства. Про такие гены говорят, что они находятся под отрицательным отбором, очищающим от вредных мутаций. Другие участки геномов будут иметь значительные расхождения между видами, что указывает на то, что мутации в этих участках, скорее всего, безвредны, а значит, их функциональная роль невелика или не определяется конкретной последовательностью нуклеотидов. В ряде работ оценили долю участков ДНК человека, находящихся под давлением отрицательного отбора. Оказалось, что к ним относятся только около 6,5−10% генома, причем некодирующие участки, в отличие от кодирующих, гораздо меньше подвержены отрицательному отбору. Получается, что с точки зрения эволюционных критериев функциональны менее 10% генома человека. Обратите внимание, как близок к этой оценке был Оно в 1972 году!
Мусорная крепость
Частично синтетическая бактерия Mycoplasma laboratorium
Синтетический геном, в котором закодированы имена синтезировавших его ученых. Геном: 580 000 пар оснований. Генов: 381
Бактерия Hodgkinia cicadicola
Самый маленький известный геном бактерии. Бактерия-симбионт с нестандартным генетическим кодом. Геном: 144 000 пар оснований. Генов: 189
Но неужели остальные 90% генома человека — мусор, от которого лучше избавиться? Не совсем так. Есть соображения, что большой размер генома может быть полезен сам по себе. У бактерий репликация генома служит серьезным ограничивающим фактором, требующим значительных затрат энергии. Поэтому их геномы, как правило, маленькие, а от всего лишнего они избавляются. У крупных организмов, как правило, репликация ДНК делящихся клеток вносит не столь большой вклад в общее количество энергозатрат организма на фоне расходов на работу мозга, мышц, органов выделения, поддержания температуры тела и т. д. В то же время большой геном может быть важным источником генетического разнообразия, увеличивая шансы на появление новых функциональных участков из нефункциональных за счет мутаций, потенциально полезных в процессе эволюции. Мобильные элементы могут переносить регуляторные элементы, создавая генетическое разнообразие в регуляции работы генов. То есть организмы с крупными геномами теоретически могут быстрее адаптироваться к условиям среды, расплачиваясь сравнительно небольшими дополнительными затратами на репликацию более крупного генома. Подобный эффект мы не обнаружим у отдельного организма, но он может играть важную роль на уровне популяции.
Наличие крупного генома может также уменьшать вероятность того, что какой-нибудь вирус встроится в функциональный ген (что может привести к поломке гена и в ряде случаев к раку). Иными словами, не исключено, что естественный отбор может действовать не только на поддержание конкретных последовательностей в геноме, но на сохранение определенных размеров генома, нуклеотидного состава в некоторых его участках и т. д.
Впрочем, хотя идея, что только 80% или даже 20% генома человека функциональны — спорна, это вовсе не значит, что критике подлежит весь проект ENCODE. В его рамках получено огромное количество данных о том, как разные белки связываются с ДНК, информации о регуляции генов и т. д. Эти данные представляют большой интерес для специалистов. Но едва ли в ближайшее время удастся избавиться от «мусора» в геноме — как от концепции, так и от самих ненужных последовательностей.
Автор благодарит Евгению Дуеву и Юрия Панчина за помощь в написании статьи.
Редакция выражает благодарность сайту «Биомолекула».