УДК 575.174.015.3:599.723
МОБИЛЬНЫЕ ГЕНЕТИЧЕСКИЕ ЭЛЕМЕНТЫ В ГОМОЛОГИЧЕСКИХ РЯДАХ ИЗМЕНЧИВОСТИ НИ. ВАВИЛОВА
Д. ЧЕРНИКОВА2, И.Б. РОГОЗИН23, Д. МАНАГАДЗЕ2, В .И. ГЛАЗКО1
(1 РГАУ-МСХА имени К.А.Тимирязева, Москва, Россия;
2 Национальный информационный центр по биотехнологиям NLM, Национальный институт здоровья, Бетседа, США;
3 Институт цитологии и генетики РАН, Новосибирск, Россия)
С позиций современной геномики анализируется сложность организации генома эукариот, включающего множество разных генетических элементов — структурные гены, гены транспортных и рибосомальных РНК, тандемные и диспергированные повторы. Приводятся литературные данные, свидетельствующие о высокой частоте встречаемости в секве-нированных последовательностях геномов сельскохозяйственных видов (крупный рогатый скот, домашняя лошадь) последовательностей разных классов эндогенных ретровирусов, а также высокая частота транспозиций мобильных генетических элементов по сравнению с мононуклеотидными заменами. Обсуждается парадоксальность отношений малого количества нуклеотидов в геномах, приходящихся на структурные гены, кодирующие белки (около 2% от гаплоидного генома) в геномах млекопитающих, с величиной транскриптома, в который входят транскрипты более 90% от всего генома. Рассматриваются понятие «темной материи», участия в ее формировании длинных некодирующих РНК, а также регуляторная роль в генной экспрессии длинных некодирующих РНК и их связь с мобильными генетическими элементами.
На модельных объектах (геномы мыши, человека) выполнен сравнительный анализ частот локализаций транскрибируемых в длинные некодирующие РНК последовательностей длинных диспергированных ядерных элементов (LINE) в участках структурных генов, находящихся под разным давлением естественного отбора (экзоны, промоторы, интроны). Представлены данные, свидетельствующие о том, что частота локализации LINE статистически достоверно низкая в экзонах, более высокая в промоторах, и наибольшая — в ин-тронах, что соответствует отличиям в известной интенсивности контроля этих последовательностей факторами естественного отбора.
Учитывая высокую скорость транспозиций (10-2 транспозиций на один транспозон на одно поколение) рассматриваются сложности оценок вклада генетической и адаптивной компонент в гомологические ряды наследственной изменчивости Н.И. Вавилова в связи с накоплением данных о доминирующей роли мобильных генетических элементов в организации геномов высших растений и животных. Отмечается наличие «очищающей» селекции по отношению к «древним» мобильным генетическим элементам (LINE) в длинных некодирующих РНК.
Ключевые слова: мобильные элементы, длинная некодирующая РНК, «очищающая» селекция, гомологические ряды изменчивости.
Закон гомологических рядов занимает особое место в научном наследии Н.И. Вавилова. Он получил мировое признание и, кроме того, внес значимый вклад в селекционную работу, поскольку позволил прогнозировать наличие опре-
деленных фенотипических признаков у одного вида, если они были обнаружены у близкородственного. Благодаря ему появилась возможность вести целенаправленный поиск родительских пар для получения новых форм с желательным сочетанием проявления ряда фенотипических признаков.
С эволюционных позиций параллелизм в изменчивости признаков у родственных форм отмечался еще Ч. Дарвином. Согласно сформулированному им принципу аналогичных изменений, "члены одного и того же класса, хотя и связанные только отдаленным родством, унаследовали так много общего в их строении, что способны под влиянием сходных побуждающих причин и изменяться сходным образом; а это, очевидно, будет способствовать приобретению путем естественного отбора частей или органов, весьма похожих друг на друга, независимо от прямой унаследованности их от общего предка" [3]. Работая в институте у У. Бэтсона, Н.И. Вавилов получил возможность ознакомиться с рукописями Ч. Дарвина.
Говоря о факте появления отдельных мутаций, Н.И. Вавилов подчеркивал, что они возникают объективно случайно и идут в разных направлениях. Отрицая приспособительный характер гомологической изменчивости, он сохранял за отбором в вопросе формирования приспособительности органических форм все то значение, которое было обосновано Дарвином. Н.И. Вавилов писал, что в законе гомологических рядов проявляется лишь «общая тенденция, присущая организмам, обусловленная общностью свойств организмов... Закон гомологических рядов не есть прокрустово ложе, ограничивающее изменчивость; наоборот, он вскрывает и вскрыл практически огромные возможности изменчивости, констатируя лишь определенные правильности, вытекающие по существу из эволюционного развития» [1].
Благодаря развитию молекулярной биологии появились новые возможности выявления и оценок изменчивости материала наследственности. С 1950-х гг. ХХ в. начались работы по расшифровке аминокислотных последовательностей белков — продуктов структурных генов и проведению их сравнительного анализа. В наших исследованиях ранее было обнаружено, что возникновение редких параллельных аминокислотных замен встречается много чаще в ветвях филогенетического дерева, которые более близки по времени дивергенции к предковому виду по сравнению с более удаленными ветвями, что, очевидно, соответствует закону Н.И. Вавилова о гомологических рядах в наследственной изменчивости [4].
В то же время в связи с накоплением результатов секвенирования геномов различных организмов изменились представления об изменчивости самого аппарата наследственности. Оказалось, что большая часть генетического материала, в частности, у животных, представлена мобильными генетическими элементами (транспозонами — ТЕ). Суммарно TE составляют 45%, 38, 15-22, 12 и 9% геномов человека, мыши, плодовой мушки и домашней курицы соответственно, в секвени-рованных геномах крупного рогатого скота они занимают 46,5% [15], домашней лошади — 36% [18]. В некоторых геномах обнаружено, что накопление ТЕ в различных геномных участках тесно связано с сегментыми дупликациями, с изменчивостью ко-пийности коротких участков ДНК (Copy Number Variability — CNV) [15]. Получены данные о том, что частота встречаемости CNV, например, у крупного рогатого скота, существенно выше (~1/10000 пар нуклеотидов) по сравнению с мононуклеотидными заменами (Single Nucleotide Polymorphism — SNP) (~1/50000 пар оснований). Выраженный полиморфизм и видоспецифичность ТЕ, высокая скорость их дивергенции даже за короткое время расхождения групп организмов от общего предка, наглядно
описанная на примере геномов лабораторных линий мышей [12], свидетельствуют о том, что основным источником геномной изменчивости являются ТЕ.
К настоящему времени известно, что геном человека содержит примерно 20 000 белок-кодирующих генов (2% от полного генома), однако транскрибируется около 90% всего генома [8]. Суммарно некодирующие транскрипты получили название «темной материи». Ожидается, что часть транскриптома, в которую входит длинные некодирующие РНК (lncRNA), выполняет основные регуляторные функции. lncRNA представляют собой мРНК подобные транскрипты длиной от 200 п.о. до 100 килобаз без открытых рамок считывания [8]. К настоящему времени в геноме человека выявлено в разных работах от ~7000 до ~23,000 уникальных lncRNAs, что свидетельствует о том, что этот класс некодирующей РНК представляет множественный, недостаточно подробно описанный компонент жизнеобеспечения клетки. Показано, что отдельные lncRNA активно участвуют в процессах регуляции генной экспрессии, например, в хромосомном импринтинге. К наиболее хорошо известным примерам относятся ген H19, кодирующий 2,3 кб lncRNA, которая транскрибируется только с материнского аллеля и блокирует экспрессию соседнего белок-кодирующего гена инсулин-подобного фактора роста 2, и ген XIST, транскрипт которого lncRNA длиной в 17 кб у самок млекопитающих инактивирует одну из хромосом Х [14]. Обнаружено, что в формировании ряда lncRNA активное участие принимали ретро-транспозоны [14].
На основании особенностей геномной локализации lncRNA подразделяют на два класса: транскрипты, перекрывающиеся с белок-кодирующими генами и транскрибирующиеся с геномных участков между белок-кодирующими генами. Для того чтобы оценить возможный вклад ТЕ не только в структурную геномную изменчивость, но и в регуляторные процессы, контролируемые lncRNA, в настоящей работе выполнено сравнение локализации последовательностей, гомологичных ТЕ, в разных классах lncRNA в геномах мыши и человека.
Материалы и методы
LincRNA (long intergenic non-coding RNAs) гены и соответствующие геномные выравнивания в геномах мыши и человека представлены в работе [11], в которой подробно изложены все процедуры обработки и подготовки исходных данных для анализа. LincRNA не перекрываются с известными белок-кодирующими генами, которые могут существенно влиять на структуру, функцию и эволюцию lncRNA генов, с которыми они перекрываются [11]. Последовательности геномов мыши и человека были взяты из базы данных [7]. Для дальнейшего анализа использовались образцы последовательностей из Атласа GNF 2 (Мышь и Человек) с целевой классификацией “только некодирующие”, в связи с чем был сформирован набор последовательностей из 5444 участков из генома мыши и 917 фагментов генома человека. При этом анализировали только те последовательности, которые картировались в межгенные области геномов мыши и человека (т.е. между двумя смежными белок-кодирующими генами). Из полученного спектра lincRNAs удаляли те, которые были короче, чем 200 нуклеотидов. В результате был составлен набор последовательностей lincRNAs, представленных в ГенБанке NCBI, которые включают 2390 последовательностей мыши и 589 человека и соответствующие этим lincRNAs профили генной экспрессии. Геномные координаты и последовательности экзонов и интронов lincRNA генов взяты из базы данных UCSC, из таблиц “all_mrna” мыши mm8 и человека hg18. Многократные выравнивания этих областей выполняли в соответствии с [9]. Анализ генов LincRNA выполняли с использованием версии RepeatMasker 3.1.3 со следующи-
ми параметрами: -w -s -no_is — cutoff 255 -frag 20000 -gff — species mouse/human. Последовательность ТЕ считали древней, если при выравнивании ортологов между человеком/мышью TE последовательности были длиннее, чем 100 п. о. и содержали меньше, чем 5% инсерций/делеций.
Результаты и обсуждения
ТЕ элементы в генах lincRNA в геномах человека и мыши
Распределение TEs в 5' флангах (предполагаемые главные области промоторов), lincRNA областях, интронах и 3' флангах представлены на рисунке 1. Самая низкая частота встречаемости TE обнаружена в промоторных областях (100 п. о. выше сайта инициации транскрипции), самая высокая — в интронах (рис. 1), тогда как промежуточная частота встречаемости ТЕ обнаруживалась в экзонах, расширенных предполагаемых промоторных областях (500 п. о. выше «по течению») и в участках lincRNA генов ниже на 300 п. о. «по течению». Похожие данные были получены при исследовании распределения ТЕ в белок-кодирующих генах, где плотность TEs оказалась выше в расширенных последовательностях промоторов по сравнению с их основными участками [18]. Более низкая плотность TE в экзонах lincRNA генах «выше» и «ниже» начала транскрипции соответствует общей тенденции подавления накопления ТЕ в функционально важных геномных участках [10, 14].
Мышь lincRNA а и Человек lincRNA
500 п.о. 100 п.о. 100 п.о. Границы Границы Последние 300 п.о.
промотор промотор первого экзонов интронов 100 п.о. 3UTR
экзона последнего
экзона
Рис. 1. Доли длин промоторов, экзонов, интронов, участков «вверх» и «вниз» от начала транскрипции генов длинной некодирующей ДНК (НпсРЫА), занятых мобильными генетическими элементами. Отличия при попарных сравнениях “промоторы - интроны” и “экзоны - интроны” статистически достоверны
(Р < 10-5 по тесту Фишера)
Различные классы ТЕ элементов
Анализ распределения различных классов TE позволяет предполагать, что относительная частота локализации каждого класса в интронах lincRNA соответствует их встречаемости в целых геномах (рис. 2, 3). Доля представленности LINE (Long Interspersed Nuclear Element) оказалась самой высокой и существенно отличалась от
lincRNA
промоторы
lincRNA
экзоны
lincRNA
интроны
Весь геном
Рис. 2. Доли длин промоторов, экзонов, интронов генов длинной некодирующей ДНК (lincRNA) человека и полной геномной последовательности, занятых различными типами мобильных генетических элементов. Отличия при попарных сравнениях “ SINE — LINE” и “ LTR — LINE” статистически достоверны
(P < 10-5 по тесту Фишера)
lincRNA
промоторы
lincRNA
экзоны
lincRNA
интроны
Весь геном
Рис. 3. Доли длин промоторов, экзонов, интронов генов длинной некодирующей ДНК (lincRNA) мыши и полной геномной последовательности, занятых различными типами мобильных генетических элементов. Отличия при попарных сравнениях “ SINE — LINE” и “ LTR — LINE” статистически достоверны (P < 10-5 по тесту Фишера)
SINE (Short Interspersed Nuclear Elements) и ретротранспозонов с длинными концевыми повторами (Long Terminal Repeats — LTR) (см. рис. 2, 3). Однако обнаруживается существенное подавление частоты встроек LINE в областях экзонов и промоторов, причем и в геномах человека, и мыши (см. рис. 2, 3). Наблюдаемое относительное понижение частоты локализации LINE в этих районах не может быть объяснено разнообразием нуклеотидного состава в различных генных участках, поскольку такие существенные отличия отсутствуют между экзонами, интронами и промоторными областями в генах lincRNA человека и мыши (результаты не представлены). Такое снижение частоты встречаемости LINE в этих участках является интересной особенностью lincRNA генов человека и мыши, у которой отсутствует очевидное объяснение.
Частота встречаемости древних мобильных элементов в промоторах/экзонах по сравнению с интронами
Присутствие древних TEs может отражать молекулярную адаптацию этих элементов [10, 14]. При анализе частот встречаемости древних мобильных элементов в различных областях lincRNA генов обнаружена относительно более высокая плотность ТЕ в промоторах/экзонах по сравнению с интронами (см. таблицу). Это согласуется с представлениями о том, что в отельных случаях имеющиеся вставки TEs высоко адаптированы или одомашнены в целях обеспечения эволюционных потребностей хозяев [18]. Повышенный уровень присутствия TEs менее выражен в lincRNA человека по сравнению с мышью, это могло бы отражать различия в эволюционных процессах у грызунов и приматов, хотя нельзя исключить некоторые технические трудности с выявлением 5'-концов lincRNA последовательностей в геноме человека. Более высокая частота встречаемости древних TE в промоторах/экзонах по сравнению с интронами позволяет предполагать, что многие lincRNA гены появились перед расхождением приматов и грызунов.
Полученные нами данные свидетельствуют о том, что в такой потенциально регуляторной системе, как lincRNA, наблюдаются эффекты «очищающего» отбора, поддерживающие древние ТЕ в промоторных/экзонных областях и не препятствующие накоплению более поздних инсерций в интронных последовательностях (см. рис. 2, 3).
У млекопитающих большинство автономных ретротранспозонов представлено LINE-1. Предполагается, что L1 обеспечивают неавтономные ретроэлементы, такие как SINE, представляющие почти 10% геномов млекопитающих, необходимыми ферментами для размножения и перемещения, L1 идентифицированы и описано сохранение их способности к автономной ретротранспозиции у всех исследованных млекопитающих, за исключением яйцекладущих, где преобладает LINE-2. Есть только
Древние мобильные элементы в промоторных районах, экзонах и интронах в генах длинных некодирующих РНК
Виды Генные участки % древних ТЕ*
Мышь Промоторы 20,3
Экзоны 11,1
Интроны 7,8
Человек Промоторы 10,4
Экзоны 9,7
Интроны 6,6
* ТЕ рассматривали как «древние», если гомология между ортологами мыши/человека была длиннее 100 пар оснований и содержала меньше 5% инсер-ций/делеций. Отличия при попарных сравнениях “промоторы — интроны” и “экзоны — интроны” статистически достоверны ^ < 10-5 по тесту Фишера).
два известных случая исчезновения копий L1, способных к автономному перемещению. Оба затрагивают большинство разновидностей хлопковых крыс и все виды летучих мышей. На основании выявленной более высокой плотности L1 в хромосоме X у млекопитающих по сравнению с аутосомами, предполагается, что этот элемент может быть “направлением передачи” сигнала инактивации вдоль хромосомы X [13].
В последние годы накапливается все больше данных, свидетельствующих о существенном участии ТЕ в эволюционных преобразованиях. Предложена гипотеза «TE-толчка» [13], в которой рассматривается способность ТЕ усиливать процессы геномных реорганизаций на структурном и регуляторном уровнях. И несмотря на то, что к настоящему времени уже известны 25 генетических заболеваний у людей, связанных с ТЕ инсерциями, предполагается, что геномный динамизм, вызванный TE, может быть эволюционно очень выгодным. В то же время реализация такого эволюционного толчка, связанного с геномным распространением ТЕ, зависит от многих факторов, в частности, экологических. Существенный вклад TE в формирование новых фенотипичеких признаков описан у высших приматов [13].
Одной из выраженных особенностей геномного размножения ТЕ является волнообразная динамика их возникновения, распространения и деградации. Для целого ряда ТЕ обнаружены эволюционные циклы, включающие вертикальную или горизонтальную передачу, вспышку транспозиций с последующим разрушением большинства первоначальных копий. Следами таких циклов является присутствие в хромосомах разных видов множественных остатков ТЕ, количество которых прямо пропорционально длине каждой отдельной хромосомы [2, 16]. ТЕ могут перемещаться по геному с высокой частотой (по сравнению с источниками других мутаций), со скоростью в пределах от 10-3 до 10-5 на один элемент на одно поколение (даже до 10-2 при некоторых специфических скрещиваниях). Оценки видимых последствий таких перемещений варьирует от вида к виду. Так, у дрозофилы 50-S0% спонтанных мутаций с фенотипическим проявлением связаны с ТЕ инсерциями, у человека — от 0,1 до 1% [17]. Накапливаются данные о широких возможностях горизонтального переноса ретротранспозонов между видами однодольных, родами насекомых; крупным рогатым скотом, домашней лошадью и мышами [16], а также такономически еще более удаленными видами. Суммарно данные о высокой скорости распространения и эволюции ТЕ привела к проведению параллелей между совокупностью разных, коэ-волюционирующих ТЕ в геноме, и экологическими видовыми сообществами [17].
Учитывая огромный источник структурно-функциональной, регуляторной изменчивости в геномах, создаваемых размножением, вертикальным и горизонтальным переносом ТЕ, а также их разрушением, обусловленным, по-видимому, «очищающей» селекцией, в т.ч. и в результате взаимодействия между разными ТЕ (геномная «экология» ТЕ), вопрос о соотношении генетических и адаптивных основ закона Н.И. Вавилова о гомологических рядах в изменчивости фенотипических признаков возвращается, уже на геномном уровне, к своему началу. Так, сразу после выхода первой публикации
Н.И. Вавилова, в которой он излагал закон гомологических рядов в наследственной изменчивости в 1921 г. [1], его работа была раскритикована Ю.А. Филипченко [5, 6], в основном по двум вопросам: феномен параллелизма в изменчивости был описан многими авторами, в частности, в работе немецкого генетика Э. Баура (1919), где говорится о существовании «гомологических рядов мутаций у животных и растений»; параллелизм сложен по своей природе и объединяет ряд феноменов, в основе которых лежат разные механизмы. В окончательной редакции своего труда Н.И. Вавилов полностью принимает замечание Ю.А. Филипченко о необходимости различения фенотипической и генотипической изменчивости, введя соответствующий раздел. В настоящее время
становится все более очевидным, что, по-видимому, соотношение между стохастическими процессами геномных преобразований, связанных с мобильными генетическими элементами, и их адаптацией к различным внутригеномным и средовым факторам представляет еще более сложную проблему, чем во времена дискуссий между Н.И. Вавиловым и Ю.А. Филипченко.
Работа выполнена при поддержке внутренней исследовательской программы национальной библиотеки медицины национального института здоровья (DHHS).
Авторы благодарят Джошуа Черри (Joshua Cherry), Джина Тьери-Мьег (Jean Thierri-Mieg), Киру Макарову (Kira Makarova) и Юрия Вульфа (Yuri Wolf) за продуктивное обсуждение нашей работы.
Библиографический список
1. Вавилов Н.И. Закон гомологических рядов в наследственной изменчивости. Л.: Наука, 1987. 256 с.
2. Глазко В.И., Феофилов А.В., Бардуков Н.В., Глазко Т. Т. Видоспецифичные ISSR-PCR маркеры и пути их формирования // Известия ТСХА, 2012. № 1. С. 118-125.
3. Дарвин Ч. Происхождение видов путем естественного отбора или сохранение благоприятных рас в борьбе за жизнь / Отв. ред. академик А.Л. Тахтаджян. СПб: Наука,
С.-Петербургское отделение, 1991. 450 с.
4. Рогозин И.Б., Глазко В.И., Кунин Е.В. Молекулярная основа закона рядов гомологической изменчивости Н.И. Вавилова // Вестник ВОГиС. 2008. Т. 12. № 3. С. 362-370.
5. Филипченко Ю.А. Изменчивость и методы ее изучения. М., Л., 1929. 202 с.
6. Филипченко Ю.А. О параллелизме в живой природе // Успехи экспериментальной биологии. 1924. Т. 3, вып. 3-4. С. 248.
7. DingerM.E., PangK.C., Mercer T.R. NRED: a database of long noncoding RNA expression // Nucleic Acids Res. 2009. Vol. 37. P. D122-D126.
8. Glazko G.V., Zybailov B.L., Rogozin I.B. Computational Prediction of Polycomb-Associated Long Non-Coding RNAs // PLoS ONE. 2012. Vol. 7. N. 9. e44878.
9. Goecks J., Nekrutenko A., Taylor J. Galaxy: a comprehensive approach for supporting accessible, reproducible, and transparent computational research in the life sciences// Genome Biol. 2010. Vol. 11:R86.
10. Jordan I.K., Marino-Ramirez L., Wolf Y.I., Koonin E.V Conservation and coevolution in the scale-free human gene coexpression network // Mol. Biol. Evol. 2004. Vol. 21. P. 2058-2070.
11. Managadze D., Rogozin I. B., Chernikova D., Shabalina S.A., Koonin E.V. Negative Correlation between Expression Level and Evolutionary Rate of Long Intergenic Noncoding RNAs // Genome Biology and Evolution. 2011. Vol. 3. P. 1390-1404.
12. Nelkker C., Keane T.M., Yalcin B. The genomic landscape shaped by selection on trans-posable elements across 18 mouse strains // Genome Biol., 2012. Vol. 13. R45. P. 1-21.
13. Oliver K.R., Greene W.K. Mobile DNA and the TE-Thrust hypothesis: supporting evidence from the primates // Mobile DNA. 2011. 2:8.
14. Rogozin I.B., Lyons-Weiler J., Koonin E.V. Intron sliding in conserved gene families // Trends Genet. 2000. Vol. 16. N.10. P. 430-432.
15. TellamR.L., WorleyK.C. The Genome Sequence of Taurine Cattle: A Window to Ruminant Biology and Evolution // Science. 2009. Vol. 324. P. 522-528.
16. Van der Kuyl A.C. Characterization of a Full-Length Endogenous Beta-Retrovirus, EqERV-Beta1, in the Genome of the Horse (Equus caballus) // Viruses. 2011. Vol. 3. P. 620-628.
17. Venner S., Cedric Feschotte C., Biemont C. Transposable elements dynamics: toward a community ecology of the genome // Trends Genet. 2009. Vol. 25. N. 7. P. 317-323.
18. Wade C.M., Giulotto E., Sigurdsson S. Genome sequence, comparative analysis, and population genetics of the domestic horse // Science. 2009. Vol. 326. N.5954. P. 865-867.
Рецензент — д. х. н. Н.М. Пржевальский
MOBILE GENETIC ELEMENTS IN HOMOLOGICAL RANKS OF VARIABILITY OF N.I.VAVILOV
D.A. CHERNIKOVA2, I.I. ROGOZIN23, D. MANAGADZE2, VI. GLAZKO1
0 Russian State Agrarian University - RTSAU named after K.A.Timiryazev (RSAU-MTAA), Moscow, Russia; National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, Maryland, USA;
3 Institute of Cytology and Genetics of Siberian Branch of Russian Academy of Science,
Novosibirsk, Russia)
From position of modern genomics the complexity of the eukaryote genome organization, including a set of different genetic elements - structural genes, genes of transport and ribosomal RNA, the tandem and intersperced repeats is discussed in details. The scientific data testifying high frequency of occurrence in genome sequences offarm animals (cattle, horse) the sequences of different classes of endogenous retroviruses, and also high frequency of transpositions of mobile genetic elements in comparison with mononucleotide replacements are provided. The paradox between rather small quantity of nucleotides in the genomes falling on structural genes, coding proteins (about 2 % from a haploid genome) in mammalian genomes, and the big size of transcriptome including transcripts more than 90 % genome is considered. The concept of «a dark matter» and participation in its formation of long non-coding RNA was considered. The regulatory role in a gene expression of long non-coding RNA and their communication with mobile genetic elements was analyzed.
On modeling objects (genomes of a mouse, human) the comparative analysis of the frequencies of Long Interspersed Nuclear Elements (LINE) localizations, which transcribed in long non-coding RNA, in gene regions being under different pressure of natural selection (exons, promotors, introns) has been carried out. Convincing data are obtained, testifying that the frequency of LINE localization is statistically authentic below in exons in comparison of promotors, and below in promotors in comparison of introns, that corresponds to known intensity differences in control of these sequences by factors of natural selection.
Considering the high speed of transpositions (10-2 transpositions on one transposon, on one generation) the complexity of evaluation of the genetic and adaptive contribution within N.I.Vavilov’s law on homological ranks of hereditary variability in relation with the mobile genetic element accumulations in genomes of highest plants and animals is analyzed. Existence of “clearing" selection in relation to “ancient" mobile genetic elements (LINE) in long non-coding RNA is discovered.
Keywords: mobile elements, the long non-coding RNA, “purifying" selection, homological ranks in variability.
Черникова Диана — докторант Национального информационного центра по биотехнологиям NLM, Национальный институт здоровья, Бетседа, США (4301 W MarkhamLittle Rосk, AR 72203).
Рогозин Игорь Борисович — д.б.н., ведущий исследователь Национального информационного центра по биотехнологиям NLM, Национальный институт здоровья, Бетседа, США.
Манагадзе Давид — пост-доктор (руководитель — И.Б. Рогозин).
Глазко Валерий Иванович — д. с.-х. н, заведующий Центром нанобиотехнологий РГАУ-МСХА имени К.А. Тимирязева (127550, г. Москва, ул. Тимирязевская, 49. Тел.: (499) 976-03-75; e-mail: e-mail: vglazko@yahoo.com).