https://doi.org/10.1 7116/molgen2018360411 82
Гипотеза происхождения вирусов от транспозонов
Р.Н. МУСТАФИН1' 2
Федеральное государственное бюджетное образовательное учреждение высшего образования «Башкирский государственный
медицинский университет», 450008, Уфа, ул. Ленина, 3; 2Федеральное государственное бюджетное образовательное учреждение
высшего образования «Башкирский государственный университет», 450076, Уфа, ул. Заки Валиди, 32
В обзорной статье рассматривается роль транспозонов в происхождении вирусов, утрачивающих признаки своих эволюционных предшественников из-за высокой мутабельности. Однако имеется ряд общих свойств вирусов и транспозонов, позволяющих предположить их филогенетическое родство — способность к интеграции в геном хозяина, специфическая активация в определенных тканях, высокая мутабельность, существование размножающихся только в присутствии другого вируса вирофагов (что сходно с неавтономными транспозонами, для которых требуются продукты экспрессии автономных). Обсуждаются представления о возникновении вирусов от транспозонов в эволюции. Обнаружены геномные элементы, проявляющие двойственный характер существования в виде мобильных генетических элементов и вирусов: полинтоны, Tlr-элементы и PLV-вирусы. Предполагается, что ключевым событием, необходимым для преобразования в вирусы, является горизонтальный перенос транспозонов, при естественном отборе которых сохраняются элементы, обладающие свойствами вирулентности, тогда как необходимые для интеграции гены могут мутировать. Горизонтальный перенос транспозонов, распространенный у всех представителей живого, сопровождается их изменчивостью, необходимой для приобретения новых адаптивных признаков. В ходе эволюции у эукариот механизмы защиты от вирусов и транспозонов, включающие РНК-интерференцию, метилирование ДНК и модификации гистонов, стали использоваться для управления работой геномов, обеспечивая межклеточные взаимодействия, что объясняет возникновение многоклеточных организмов. В эволюции эукариот транспозоны стали успешно использоваться для преобразований регуляторных генных сетей, а также служить возможными источниками новых генов, кодирующих как белки, так и некодирующие РНК, фрагментарная трансляция которых может продуцировать короткие функциональные пептиды. Таким образом, продукты транскрипции и трансляции транспозонов служат важнейшими источниками эволюционных преобразований — данные механизмы могли быть основой эволюции вирусов и возникновения фундаментальных свойств живого при его возникновении.
Ключевые слова: белок-колируюшие гены (БКГ), горизонтальный перенос (ГП), обзор, регуляция, транспозоны (ТЕ — trans-posable elements), эволюция.
The hypothesis of the origin of viruses from transposons
R.N. MUSTAFIN1- 2
Bashkir State Medical University, 3, Lenin str., Ufa, 450008; 2Bashkir State University, 32, Zaki Validi str., Ufa, 450076
In the review article, viruses are proposed as a component of the adaptive system of evolutionary transformations of living organisms. We hypothesize that transposons serve as the main sources of viruses in evolution — we present numerous confirmations of this assumption. Due to the accumulation of mutations, many viruses lose their evolutionary connection with the transposons from which they originated. However, evidence has been obtained that the viruses retain the common sequences and properties of their ancestral transposons. As an evolutionary link between transposons and viruses, horizontal transposon transfer is suggested — a common phenomenon for bacteria, archaea and eukaryotes. The key factor for the appearance of exogenous viruses from transposons is the acquisition of virulence properties in place of the integration ability of transposons capable of horizontal transport, due to the accumulation of mutations. The success of using horizontal transposon transfer in evolution as a necessary condition for acquiring new properties has caused the global spread of viruses in all living organisms. However, in addition to the transfer of «useful» information, viruses began to cause cell death, so the genomes have developed strategies to combat foreign sequences. These strategies for bacteria and archeas were used mainly for protective purposes. The evolution of eukaryotes is due to the fact that protective systems against foreign nucleotide sequences have been used to control the work of genomes, providing intercellular interactions in successive cell divisions, which explains the success of multicellular evolution in eukaryotes. Transposons are the most important sources of non-coding RNA in eukaryotes, used both for rearrangement of regulatory gene networks and for the formation of new proteins (due to exonization and domestication).
© Р.Н. Мустафин, 2018
Для корреспонденции: Мустафин Рустам Наилевич, канд. биол. наук, младший научный сотрудник лаборатории ПЦР-анализа, Федеральное государственное бюджетное образовательное учреждение высшего образования «Башкирский государственный университет»; 450076, Уфа, ул. Заки Валиди, 32; https://orcid.org/0000-0002-4091-382X; e-mail: ruji79@mail.ru, e-mail: rectorat@bashgmu.ru For correspondence: Mustafin Rustam Nailevich, 450076. Ufa, Zaki Validi street, 32; e-mail: rectorat@bashgmu.ru; e-mail: ruji79@mail.ru
It was found that long non-coding RNAs can be translated into functional peptides, and phylogenetic analysis showed that the genes of long non-coding RNAs generate protein-coding genes during evolution. Thus, the products of transcription and translation of transposons are the most important sources of evolutionary transformations — these mechanisms could be the basis for the evolution of viruses and the emergence of fundamental properties of living things when they arise.
Keywords: protein-coding genes, horizontal transfer, review, regulation, transposons, evolution.
Введение
Транспозоны (ТЕ — transposable elements) — это мобильные генетические элементы, обнаруживаемые у всех живых организмов. Они способствуют регуляции экспрессии генов при развитии и адаптации, а также служат основными источниками генетических вариаций в эволюции геномов. Например, большинство примат-специфических последовательностей, регулирующих генную экспрессию, произошли от ТЕ [1]. ТЕ составляют значительную долю большинства геномов многоклеточных эукариот: 15—47% у насекомых, 35—69% у млекопитающих и до 90% у растений [2]. У прокариот ТЕ обеспечивают возможность в ходе эволюции некоторым генам базового набора переходить в категорию вспомогательных, а вспомогательным — в базовые [3]. Кроме того, мобильные элементы бактерий при своих перемещениях инактивируют гены хозяев или изменяют их регуляцию, а также индуцируют все виды хромосомных перестроек и обеспечивают перенос генов между разными особями [4].
ТЕ образуют 2 класса: 1 — ретротранспозоны, 2 — ДНК-транспозоны. Ретро-ТЕ делятся на несущие длинные концевые повторы LTR (ретровирусы: Ty1/Copia, Ty3/Gyp-sy, Bel/Pao, Dirs) и не содержащие LTR (nonLTR) ретротранспозоны: LINE и SINE [5]. Ретро-ТЕ перемещается в новый локус, оставляя исходную копию на прежнем месте. Идентичность образуемых копий способствует гомологичной рекомбинации между ТЕ, которая индуцирует внутригеномные хромосомные перестройки (делеции, транслокации, инверсии, сегментарные дупликации) и вну-тригенные мутации (при внедрении в ген), что рассматривается в качестве двигателя эволюции [6]. ДНК-ТЕ перемещаются путем вырезания исходной копии. Хотя для некоторых ДНК-ТЕ прокариот, например Tn1, IS1, IS2 и IS4, показано, что их транспозиции могут быть не сопряжены с исключением из мест исходной локализации в плазми-дах или хромосоме («репликативные» транспозиции) [4].
Среди ДНК-ТЕ выделяют 2 подкласса: элементы вырезания/вставки и хелитроны (элементы катящегося кольца) [2]. Элементы вырезания/вставки перемещаются при помощи транспозазы (фермента класса рекомбиназ), новое место интеграции обычно находится вблизи старого [7]. Они содержат инвертированные концевые повторы (TIR — terminal inverted repeat), фланкированные дупликациями сайта-мишени (TSD — target site duplication) различной длины и состава. Последние чувствительны к транс-позазам, в зависимости от ферментативных свойств которых ДНК-ТЕ относят к разным суперсемействам. Так, для Tc1/Mariner характерны 5'-TA-3' TSD, для piggiBack — 5'-TTAA-3', для hobo-Ac-Tam3 — TSD длиной 8 п.н., для PIF/Harbinger — 3 п.н., для Mutator/MuDR — 9 — 12 п.н. Выявлена также новая группа ДНК-ТЕ Spy, представители которой не создают TSD при инсерции. Вместо этого Spy транспозируют точно между нуклеотидами хозяев 5'-AAA и TTT-3' без дупликации или модификации целевых сай-
тов AAATTT [2]. Кроме того, выделяют неавтономные ДНК-ТЕ. К ним относятся миниатюрные инвертированные повторы (MITE), некоторые из которых содержат ко-ровые повторы, имеющие тенденцию располагаться в тан-демных массивах — в ряде случаев эти массивы приводят к появлению сателлитных ДНК в пери- и центромерных областях хромосом [8]. Для определения сайтов интеграции ТЕ разработаны и внедрены системы алгоритмов RelocaTE, RetroSeq, TEMP, TIF, ITIS (Identification of Trans-poson Insertion Sites) [9].
В геномах прокариот ТЕ составляют значительно меньшую долю, так как наибольшее значение в их эволюции имеет горизонтальный перенос (ГП) генов при помощи плазмид, интегронов и бактериофагов. У прокариот обнаруживаются как ДНК-ТЕ, так и ретро-ТЕ. Последние у бактерий образуют 17 основных групп: интроны группы II, ре-троны, DGR (diversity-generating retroelements); Abi-подобные, ассоциированные с CRISPR-Cas и подобные группе II ретро-ТЕ, а также 11 других групп ретроэлемен-тов с неизвестными функциями. Из них свойствами защиты от чужеродных элементов обладают DGR, Abi (abortive bacteriophage infection) и CRISPR (clustered regularly interspaced, short palindromic repeats) [10]. Несмотря на эффективность данных защитных систем, ГП у прокариот является основным источником эволюционной изменчивости. Для эукариот большее значение в преобразовании геномов приобрели ТЕ, составляя значительную долю их геномов; вирусы же, наиболее вероятно, являются продуктами эволюции ТЕ при обретении ими способности к ГП. Разнообразие и распространенность вирусов у эукариот говорит о значении ТЕ в их происхождении. В дальнейшем из-за выраженной мутабельности вирусы утрачивают признаки эволюционной связи со своими предшественниками.
Взаимопревращения вирусов и транспозонов
в эволюции
Распределение и состав ТЕ и вирусов специфичны для разных доменов живого, что позволяет предположить их взаимопревращения в эволюции, при которых ТЕ служат источниками вирусов. Так, у прокариот большую долю составляют ДНК-содержащие вирусы, и наиболее распространенными ТЕ также являются ДНК-транспозоны. Для эукариот, в геномах которых преобладают ретро-ТЕ, характерно превалирование РНК-содержащих вирусов. ТЕ могут быть автономными и неавтономными — последние размножаются при помощи белковых продуктов первых. Те же свойства характерны и для вирусов — существуют са-теллитные вирусы (вирофаги), репродуцирующиеся при помощи факторов более крупных вирусов [11].
Предполагается, что экзогенные ретровирусы образовались из Ty3/Gypsy LTR-содержащих ретро-ТЕ — их последовательности выявляются в геномах большинства живых организмов [12]. В отношении происхождения других вирусов нет точных данных, доказывающих их происхождение. Логика возникновения вирусов в эволюции для пе-
редачи информации адаптирующих свойств приводит к выводу об их происхождении от ТЕ вследствие высокой му-табельности. РНК-вирусы могли возникнуть из ретро-ТЕ, а ДНК-вирусы — от ДНК-ТЕ. При этом ферменты, используемые для интеграции в геном хозяина, могли приобрести иные свойства, необходимые для автономной репродукции под влиянием ряда мутаций. Вследствие этого произошедшие от ТЕ экзогенные вирусы утратили свойства интеграции в геном хозяина одновременно с приобретением вирулентности и передачи другим клеткам и организмам. Благодаря мутациям многие вирусы окончательно утратили признаки ТЕ. В настоящее время обнаруживаются промежуточные эволюционные ниши, демонстрирующие механизмы возникновении вирусов от ТЕ: горизонтальный перенос ТЕ [13] и передача одомашненных ре-тро-ТЕ (произошедших от Ty3/gypsy) в капсидах из эндогенных белков Arc (сходных с ретровирусными Gag) между нейронами [14]. Дальнейшие мутации данных промежуточных форм могут вызвать образование экзогенных вирусов, не содержащих в своем составе последовательностей ТЕ, что является логическим завершением череды их изменений с образованием новых таксонов вирусов, характеризующихся высоким разнообразием.
Возникновение вирусов у эукариот является побочным продуктом эволюционных преобразований геномов при помощи ТЕ. В пользу данного предположения свидетельствует способность к интеграции в геном хозяина вирусов, не содержащих в своем составе генов, кодирующих необходимые для инсерции ферменты. Например, при гепатите В возможна интеграция всего вирусного генома [15], при аденовирусных и герпес-вирусных инфекциях обычно интегрирует часть генома, при инфекции онковирусами может интегрировать как полный геном, так и его часть [16]. Тропизм вирусов к определенным тканям и интеграции в геномы их клеток также является подтверждением их происхождения от ТЕ, так как последние характеризуются активацией в специфических тканях, аранжируя генные сети для выполнения клетками тканеспецифических функций [17—19]. Кроме того, гены и последовательности ТЕ обладают высоким потенциалом при их мутациях образовывать гены функциональных РНК и их белковых продуктов, что важно для эволюции вирусов. Подтверждением данного потенциала служит обнаружение того, что ТЕ являются важнейшими источниками генов некодирующих РНК (нкРНК) [20, 21], регуляторных последовательностей [22] и белок-кодирующих генов (БКГ) их хозяев [22—24].
Как вирусы, так и ТЕ обладают повышенной мутабель-ностью. Последовательности ERV (эндогенных ретровиру-сов) подвержены дезорганизации путем образования мутаций со сдвигом рамки считывания, стоп-кодонов и де-леций, которые поражают их способность к репликации и транспозиции [25]. В связи с повышенной мутабельностью многие ТЕ утрачивают первоначальные свойства, в том числе способность к транспозициям, и кооптируются хозяевами для образования новых адаптационных признаков. Например, при помощи ТЕ-специфичных доменов выявлено множество происходящих от ТЕ генов, некоторые из которых образуют тандемные кластеры генных семей [24]. БКГ ERV также предоставляют генетический материал, кооптируемый хозяевами. Например, гены Syncy-tin у млекопитающих — лучшее представление доказанного одомашнивания генного продукта ERV для клеточных функций. Гены Syncytin кооптированы от генов envelope ERV независимо у различных линий млекопитающих, вы-
полняя физиологическую функцию в плаценте [26]. Получены многочисленные данные о происхождении эукарио-тических генов путем одомашнивания ТЕ, которые описаны в крупных обзорах [22, 23]. Кроме одомашнивания, ТЕ, внедренные в интроны, могут быть использованы для появления новых доменов существующих БКГ путем экзо-низации. Например, в генах TMPO и ZNF451, характерных для всех позвоночных, домены LAP2a сплайсинговых изо-форм произошли от ORF1 ретротранспозона DIRSI-like. Данная сплайсинговая изоформа TMPO(LAP2a) используется для новой важной клеточной функции белка [27]. Эк-зонизация связана со способностью продуктов трансляции ТЕ образовывать ДНК-связывающие домены и другие пространственные структуры, позволяющие белку обретать новые функции. Помимо интронных ТЕ, широко распространенным явлением является использование инсерций для альтернативных 3'-UTR [22].
В литературе описаны случаи взаимопревращения вирусов и ТЕ. Доказано проникновение ERV летучей мыши Myotis lucifugus в геномы более 100 видов млекопитающих. При этом одни и те же виды ретровирусов множество раз переходят от инфекционного патогена к геномному паразиту (ретро-ТЕ), испытывая различную динамику инвазии у разных хозяев [28]. Из LTR-содержащих ретро-ТЕ эволюционировали вирусы растений семейства Caulimoviridae. Так как эти вирусы сходны с ретровирусами, их объединяют в группу параретровирусов, которые имеют кольцевую двухцепочечную ДНК и реплицируются в растениях посредством промежуточных РНК. Существуют виды данного семейства, которые могут интегрировать в геном хозяина и обозначаются как эндогенные параретровирусы (EPRV) [29]. Кроме того, непосредственно в геномах вирусов обнаружены ТЕ, которые, как предполагается, выполняют функцию, сходную с РНК-интерференцией. Так, в составе вирусов четырех семейств: Astroviridae, Caliciviridae, Picornaviridae, Coronaviridae обнаружен мобильный элемент s2m. Впервые данный консервативный ТЕ длиной 43 пары нуклеотидов был обнаружен в 1997 г. на З'-конце вирусов семейства Astroviridae [30]. Кроме того, подобно ТЕ, многие вирусы также кодируют гены микро-РНК, которые играют важную роль в вирусной инфекции и их репликации [31], что также говорит в пользу происхождения вирусов от ТЕ. Обнаружены также вирофаги, которые по генетической гомологии представляют эволюционное звено между двуцепочечными ДНК-содержащими вирусами и эукариотическими ДНК-ТЕ Maverick/Polinton [32]. Например, вирофаги RVP (rumen virophages) кодируют типичный крупный белок вирофагов, АТФазу и протеазу в сочетании с типичной для полинтонов ДНК-полимеразой. Геномы RVP представляют собой гибрид вирофагов и полинтонов, в виде линейной молекулы с терминальными инвертированными повторами, которая способна образовывать инфекционные вирионы [33].
Показательным примером взаимопревращений ТЕ и вирусов являются представители семейства Polinton. По-линтоны населяют геномы протистов, грибов и животных, включая амеб, Phakopsorapachyrhizi, гидр, морских анемон, нематод, плодовых мушек, жуков, морских ежей, асцидий, рыб, ящериц, лягушек и кур. Аналогично известным ТЕ полинтоны существуют в виде автономных и неавтономных элементов. Предполагается, что они эволюционировали от линейных плазмид, которые приобрели ретрови-русную интегразу около 1 млрд лет назад [34]. Согласно результатам филогенетических анализов было показано, что
полинтоны в эволюции распространялись в основном вертикально [35], хотя получены данные об их горизонтальном переносе [36]. Семейство Polinton особенно обильно распространено в геномах некоторых протистов. Данные самосинтезирующиеся ТЕ кодируют собственную ДНК-по-лимеразу (DNAP), ретровирусоподобную интегразу, белки капсидов, упаковывающую ДНК АТФазу и протеиназу созревания капсидов. Следовательно, полинтоны являются альтернативой между транспозонным и вирусным образом жизни. Сравнительный геномный анализ полинтонов, вирофагов, полинтон-подобных (PLV — Polinton-like viruses) и других вирусов с двухцепочечной ДНК показал, что полинтоны могли быть предками широкого спектра эука-риотических вирусов, в том числе аденовирусов и мегави-русов [37]. Кроме того, у эукариот были обнаружены вирусоподобные частицы, образованные из упакованных при помощи белков оболочки РНК-содержащего вируса FHV (flock house virus) молекул РНК хозяина (мРНК, рРНК, нкРНК и ТЕ). Упаковка этих РНК хозяина дает возможность горизонтального переноса между генов эукариоти-ческими геномами, в которых содержится вирусный патоген [38].
Полинтоны кодируют два белка капсида, что позволяет им вести двойной образ жизни в виде ТЕ и вирусов [39]. Показаны также эволюционные взаимосвязи полинтонов с бактериальными тективирусами и линейными митохон-дриальными плазмидами [40]. Кроме того, недавно были выявлены вирусы PLV, которые сходны с полинтонами и вирофагами по размеру генома и консервативным морфо-генетическим модулям, за исключением того, что PLV не содержат интегразу ретровирусного типа [33]. Это говорит о роли ТЕ в происхождении вирусов, которые в ходе эволюции меняют свои свойства благодаря отбору новых адаптивных признаков, возникших в результате мутаций. Например, некоторые PLV содержат общую для бактерий и бактериофагов тирозиновую рекомбиназу—интегразу, а определенные PLV интегрируют в геномы водорослей, проявляя двойственный характер существования в виде ТЕ и вирусов [33]. Подобным дуализмом обладают также некоторые ДНК-ТЕ, например, Tlr-элементы, обнаруженные в геноме зародышевой линии ресничных инфузорий Tetra-hymena thermophila [41].
Определенные ERV способны формировать вирусоподобные частицы с инфекционной активностью. Филогенетический анализ показал, что экзогенные ретровирусы возникли из LTR-содержащих ретро-ТЕ в результате приобретения гена env, белковый продукт которого позволил сформировать вирусную частицу, обладающую инфекционной способностью [42]. Структурное сходство вируса гепатита В с ретровирусами, а также его способность интегрировать в геном хозяина также позволяют предположить его происхождение от ТЕ [43]. О происхождении вирусов от ТЕ говорит характер распространения ТЕ подобно межвидовым пандемиям при ГП. Выявлено, что 15—46 млн лет назад произошли зародышевые инфильтрации семейства ДНК-ТЕ SPIN, породившие один из самых крупных всплесков активности ДНК-ТЕ (почти 100 000 копий SPIN на гаплоидный геном). Консенсусные последовательности SPIN идентичны на 96% по всей их длине (2,9 т.п.н.) в геномах мышиных грызунов (крысы/мыши), бушбеби, маленькой коричневой летучей мыши, тенрека, опоссума и не относящихся к млекопитающим четвероногих (ящерицы анолис и африканской когтистой лягушки) [44]. ТЕ также служат важнейшими источниками для изменения регу-
ляторной системы генных сетей. ERV депонируют обширный резервуар предфункциональных латентных ^ис-регуляторных элементов (промоторов, сайтов связывания с транскрипционными факторами), которые рекрутируются в эволюции в состав нормальной регуляторной сети соседних генов хозяев [26]. От видоспецифических ТЕ происходят многие промоторы и сигналы полиаденилиро-вания. Способность ТЕ к саморегуляции (образование белковых продуктов, взаимодействующих со специфическими последовательностями ДНК, источниками которых являются сами ТЕ) [22], также служит одним из доказательств происхождения вирусов от ТЕ как предпосылка к автономному существованию и обретению новых функций в ходе эволюции. В данном отношении можно провести аналогию с геномами эукариот, в ходе эволюции которых выработались стратегии возникновения новых функциональных РНК и продуктов их трансляции для возникновения БКГ хозяев.
Стратегия транспозоны — некодирующие РНК —
пептиды
ТЕ являются обильными источниками жестко регулируемых биохимически активных некодирующих элементов, таких как некодирующие РНК (нкРНК) и сайты связывания с транскрипционными факторами. Многочисленные недавние исследования подтвердили идею о том, что ТЕ у всех представителей живого кооптируются для регуляции генов их хозяев, а волны инвазий ТЕ в организмы катализировали эволюцию сетей регулирования генов [45]. ТЕ служат важнейшими источниками микро-РНК [20] и обнаруживаются более чем в 83% функциональных доменов длинных нкРНК (днРНК) [21]. ДнРНК проявляют множество функций либо самостоятельно в качестве рибозимов или рибопереключателей, либо в составе РНП (рибонуклеопротеинов). ДнРНК могут взаимодействовать с ДНК-связывающими белками, РНК-по-лимеразой и гистон-модифицирующими комплексами, оказывая влияние на регуляцию транскрипции генома [46]. Подобно функциям в составе продуктов трансляции БКГ, последовательности ТЕ в доменах днРНК используются для образования сайтов распознавания белков и нуклеиновых кислот. Большинство экзонов днРНК организованы из последовательностей ТЕ — вследствие этого зрелые молекулы днРНК содержат комбинации повторов, создающие структуры, подобные доменам белков. Филогенетический анализ показал, что в ходе эволюции отдельные семейства ТЕ закономерно обогащают (в основном ERV) или покидают (nonLTR ретроэлементы) гены днРНК. Помимо экзонов, ТЕ организуют структуры промоторов, сайтов сплайсинга и сайтов полиаденилиро-вания днРНК. Согласно исследованиям Johnson и соавт., ТЕ являются основой для формирования модульной организации молекул днРНК в виде дискретных доменов, комбинация которых определяет функцию днРНК. Это обусловлено способностью фрагментов ТЕ образовывать ДНК-, РНК- и белок-связывающие домены. Предполагается использование картирования ТЕ для прогнозирования функции днРНК, а также для объяснения эволюции регуляторных сетей днРНК [21]. Помимо выполнения специфических функций на уровне РНК молекул, нкРНК способны транслироваться в пептиды [47—50], которые проходят эволюционный отбор на функциональную пригодность для адаптации и могут стать источником возникновения новых БКГ [51 —53]. Ряд недавних ис-
следований показал, что lncPHK могут содержать открытые рамки считывания (ORF — open reading frames), связываться с рибосомами и транслироваться. Выявлено несколько сотен образуемых при этом функциональных коротких пептидов у рыбы данио и человека [54], у мыши [55] и у арабидопсиса [56]. Более того, многие днРНК обладают сходной структурой с мРНК: они транскрибируются РНК-полимеразой II, кэпируются и полиаденили-руются, накапливаясь в цитоплазме [57] — теми же свойствами обладают и при-микроРНК растений. Благодаря наличию коротких ORF, процессингу с получением 5'-кэ-пированных и З'-полиаденилированных хвостов [58], при-микроРНК растений также способны транслироваться с образованием функциональных пептидов [59]. Подобные стратегии могли быть выработаны у вирусов, что объясняет их грандиозное разнообразие и распространенность вследствие высокой мутабельности с возникновением новых кодирующих последовательностей из генов ТЕ-происхождения.
В 2006 г. М. Levine и соавт. [60] выявили образование новых БКГ у дрозофилы за счет отбора возможных вариантов экспрессии днРНК. Исследователи использовали геномы Drosophila melanogaster и родственных видов для проведения полногеномного поиска новых генов D. melanogaster, которые возникли из некодирующей ДНК. В результате были описаны 5 таких генов, преимущественно экспрессируемых в семенниках. В 2008 г. J. Cai и соавт. [61] обнаружили новый БКГ у Saccharomyces cerevisiae, который был сформирован из некодирующей последовательности ДНК. В 2012 г. C. Xie и соавт. описали 24 специфических для гоминоидов БКГ, образованных de novo из генов днРНК [62]. Дальнейшие исследования показали, что возникновение новых белков из днРНК распространено у эукариот и играет важную роль в эволюции. Например, в 2014 г. J. Ruiz-Orera и соавт. [51] при исследовании Mus musculus, Homo sapiens, Danio rerio, D. melanogaster, A. thaliana, S. cerevisiae обнаружили, что большая часть днРНК, экспрессируемых в клетках шести разных видов, связана с рибосомами. Исследователи протестировали гипотезу, что днРНК могут выступать в качестве источника для синтеза новых пептидов. Более того, оказалось, что днРНК проявляли сходный потенциал кодирования с эволюционно молодыми белок-кодирующими последовательностями, свидетельствуя о том, что они играют важную роль в de novo-эволюции белков [51]. Недавние полногеномные исследования позволили выявить сотни функциональных микропептидов, которые могут быть образованы при трансляции днРНК [54, 63]. Так, идентифицирован микропептид миорегулин (MLN), который формируется при трансляции специфической для скелетной мускулатуры РНК, аннотированной как днРНК. Данная днРНК у человека содержит ORF длиной 138 нуклеотидов и состоит из 3 экзонов общей длиной 16,5 кб. Микропептид MLN состоит из 46 аминокислотных остатков и формирует одну трансмембранную альфа-спираль, которая взаимодействует с кальциевой АТФазой сар-коплазматического ретикулума (SERCA — sarcoplasmic reticulum Ca2+ ATPase) на мембране саркоплазматической сети и регулирует перемещение ионов кальция [48]. Кроме того, выявлен микропептид, состоящий из 34 аминокислотных остатков, названный DWORF (dwarf open reading frame), который локализуется на мембране саркоплазматической сети, где усиливает активность SERCA. Транскрипт гена Dworf, микропептид DWORF, аннотиро-
ван как днРНК NONMMUG026737 у мыши и как днРНК LOC10050737 у человека. В геноме мыши ген Dworf транскрибируется из локуса длиной 2,8 кб на хромосоме 3 с образованием двух транскрипционных изоформ длиной 300 нуклеотидов. У человека днРНК LOC100507537 образует только одну изоформу и транскрибируется из участка длиной 4,5 кб на хромосоме 3 [50]. У млекопитающих пептиды, образуемые путем трансляции днРНК, оказывают регуляторное воздействие на экспрессию генов-мишеней [49]. У растений также выявлен ряд пептидов, формируемых при трансляции днРНК: ENOD40, IPS 1, LDMAR, COOLAIR, OLDAIR [47]. Помимо днРНК, при-микроРНК также способны транслироваться в функциональные пептиды [49], в то время как ТЕ являются важными источниками возникновения генов микроРНК [20]. Таким образом, система «ТЕ—нкРНК—белки» служит универсальной стратегией для эволюционных преобразований геномов эукариот и может быть использована также вирусами, произошедшими от ТЕ. Данный принцип отбора функциональных РНК в качестве источника белка может объяснить не только происхождение вирусов и их эволюцию, но и само возникновение жизни, когда в течение миллионов лет из мобильных элементов отбирались молекулы функциональных РНК, продукты трансляции которых способствовали саморегуляции и возникновению новых функций. Наиболее оптимальные комбинации взаимодействий РНК и белков, способствующие оптимальной адаптации, сохранялись в эволюции.
Горизонтальный перенос транспозонов
Еще в 1984 г. Р.Б. Хесин [4] в книге «Непостоянство генома» писал, что значительная доля наследственной изменчивости вызывается перемещающимися элементами (trans-posable elements). Согласно Р.Б. Хесину, открытие и изучение разнообразных ТЕ заставит по-новому взглянуть на ряд положений эволюционной теории. Он предположил, что параллельная изменчивость может объясняться влиянием элементов со сходной сайт-специфической интеграцией, а некоторые случаи конвергенции основаны на переносе одинаковых генов между разными организмами. Более того, передачей генов между далекими видами автор объяснял некоторые качественные скачки в историческом развитии, особенно перестройки метаболизма [4]. Горизонтальный перенос, распространенный у прокариот (в ГП вовлечено 81% их генов [64]), служит также важным источником геномного разнообразия эукариот. ГП транспозонов логически должен присутствовать у эукариот в связи с обилием ТЕ в их геномах и присущей мобильностью ТЕ. По результатам филогенетических анализов был обнаружен ГП Д НК-ТЕ среди позвоночных и беспозвоночных в период 45—15 млн лет назад. События горизонтального переноса ТЕ описаны у различных представителей четвероногих, а также кровососущих насекомых (Rhodnius prolixus) в качестве вектора. В 2013 г. C. Gilbert и соавт. обнаружили у тасманийского дьявола ГП ТЕ семейства OposCharlie1 (OC1), который проник в общего предка семейства Dasyuridae около 17 млн лет назад [65]. Впервые ГП был продемонстрирован в 1990 г. S. Daniels и соавт. на дрозофиле [66]. В дальнейшем в ряде работ обнаружено, что практически все основные типы ТЕ способны к ГП у большого количества эукариот [67]. ГП ТЕ в новые геномы рассматривается как важная сила управления геномными вариациями и биологическими инновациями. Кроме того, ГП играет важную роль в персистенции ТЕ в геномах эукариот. В исследованиях H. Zhang и соавт. [67] были по-
казаны примеры повторных ГП трех семейств ТЕ Chapaev у большого количества видов животных, включая млекопитающих, рептилий, челюстных рыб, миног и насекомых. Множественные сопоставления ТЕ Chapaev этих видов выявили чрезвычайно высокие уровни идентичности последовательностей (79—99%), что несовместимо с вертикальной эволюцией с учетом разделяющей этих хозяев глубокой дивергенции во времени. Прерывистое распределение среди видов и отсутствие очищающего отбора, действующего на эти ТЕ, указывает на то, что они независимо и горизонтально переносятся между видами [67]. Распространенность ГП у эукариот позволяет предположить данное явление в качестве промежуточного эволюционного звена в возникновении вирусов. Вирусная межвидовая трансмиссия представляет собой серьезную угрозу для человека и животных. Большинство вирусных заболеваний человека являются зоонозными [28]. Межвидовая трансмиссия при горизонтальном переносе ТЕ и вирусов является их общим свойством и свидетельствует в пользу предположения происхождения вирусов от ТЕ.
Гены RA Gl и RA G2 образуют рекомбиназный комплекс, необходимый для V(D)J-рекомбинации, которая генерирует разнообразие иммуноглобулинов и рецепторов Т-клеток [68]. V(D)-рекомбинация является вариацией основного принципа транспозиции и опосредована потомками транспозазы. Структура инвертированных повторов и правосторонняя/левосторонняя асимметрия ре-комбинационных сигнальных последовательностей (RSS) напоминает концевые повторы инсерционных последовательностей (IS) прокариот [69], поэтому вначале ген RAG1 относили к семейству генов интеграз (INT) бактерий, а ген RAG2 считался гомологом гена IHF, регулирующего работу интегразы [70]. Но в дальнейших исследованиях у фиолетового морского ежа (Strongylocentrotus pur-puratus) были выявлены гены SpRaglL и SpRag2L, гомологичные по последовательностям и по геномной организации генам RAG1 и RAG2 позвоночных [71]. Сходная с RAG-транспозазой активность по разрезанию и сборке была выявлена in vitro у транспозазы Transib насекомого Helicoverpa zea, что говорит об их филогенетическом родстве и происхождении от общего предка [72]. Общепризнано, что наличие RAG в геномах челюстных позвоночных и других линий является результатом горизонтального переноса ТЕ. У всех челюстных позвоночных гены RAG расположены в непосредственной близости от гена NWC, промотор которого проявляет двунаправленную активность, что способствовало сохранению RAG-ТЕ в геноме хозяина. Это обусловлено тем, что ген NWC эволюционно консервативен и располагается вверх по течению от гена RAG2, конвергентно транскрибируясь вместе с ним. Ген NWC играет важную роль в онтогенезе многоклеточных, на что указывает наличие его ортологов у ряда видов беспозвоночных, таких как морской еж (Strongylocentrotus purpuratus), морской анемон (Nematostella vectensis), морская звезда (Asterina pectininera), морская мидия (Mytilus edulis), морская улитка (Lottia gigantean), каменистый коралл (Acropora millepora) и пластинчатый Trichoplax adhaerens. В связи с важной ролью гена NWC и его эволюционной консервативностью удачная инсерция генов RAG в непосредственной близости способствовала их сохранению в процессе отбора и использованию для нужд хозяев [68]. В геноме дикого арахиса выявлен ре-тро-ТЕ AdLINE3, который оказался членом кластера RTE, первоначально идентифицированный у нематод.
RTE-элементы обнаружены у 82 видов растений — от покрытосеменных до водорослей. У цветковых растений RTE получены от семейства An-RTE, проявляющих значительную идентичность последовательностей ДНК с ретро-ТЕ 42 видов животных из 4 фил. Филогенетический анализ животных и растений показал горизонтальный перенос An-RTE от древней тли или предковых членистоногих в покрытосеменные растения. Примечательно, что некоторые An-RTE были завербованы в качестве кодирующих последовательностей функциональных генов, участвующих в метаболических или других биохимических процессах у растений [73]. В связи с накоплением данных о большом количестве новых случаев ГП транспозонов у эука-риот создана первая база данных ГП, сфокусированная на горизонтальном переносе ТЕ между эукариотами — HTT-DB (Horizontal Transposon Transfer DataBase — http:// lpa.saogabriel.unipampa.edu.br:8080/httdatabase/) [13].
В экспериментальных условиях для анализа промо-торной активности 5'-концевых последовательностей, способных управлять транскрипцией репортерного гена даже у филогенетически отдаленно связанных организмов, были использованы ДНК-ТЕ суперсемейства Tcl-ma-riner — Baril и Bari3. При помощи этих транспозонов изучена мимикрия горизонтального переноса у широкого диапазона хозяев (мухи, человек, дрожжи и бактерии). На основании полученных данных было предложено, что семейство ТЕ Bari развили «размытые промоторы», которые способствовали их распространению среди всевозможных живых организмах за счет ГП [64]. Фактически ГП ТЕ может рассматриваться как решающий процесс в поддержании и распространении ТЕ в геномах всех эука-риот. Значительное количество ГП транспозонов было зарегистрировано у дрозофилы, так как она представляет собой выдающуюся модель эволюционной генетики, а большое количество геномных данных делает ее особенно подходящей для разработки и применения надежных статистических подходов к обнаружению ГП ТЕ. Были получены достоверные сведения о ГП ТЕ также в широком диапазоне других эукариотических видов у беспозвоночных, позвоночных, растений и их паразитов. Поскольку ТЕ составляют значительную часть ядерного генома многоклеточных эукариот и служат важным источником генетических вариаций в эволюции, ГП ТЕ следует рассматривать как ключевой источник изменчивости эука-риотического генома [74].
Взаимодействие транспозонов и вирусов
Вирусы могут выступать в качестве переносчиков ТЕ. Обнаружение ТЕ Chapaev у представителей Bracovirus показало, что эти вирусы могут выступать в качестве возможного вектора для горизонтального распространения ТЕ Chapaev [67]. ТЕ продолжают регистрировать в составе вирусов, но их вклад в эволюцию вирусного генома остается в значительной степени неисследованным. В составе гигантского вируса Pandoravirus salinus выявлено семейство MITE (miniature inverted-repeat transposable element), названное Submariner. Найдены ДНК-ТЕ, связанные с Submariner в геноме Acanthamoeba castellanii, являющейся хозяином пандоравируса и содержащей остатки кодирующей последовательности для транспозазы Tc1/mariner. Это говорит о широком распространении Submariner MITE, которые могут перемещаться в хозяине пандоравируса — амебе. Из 30 MITE в составе пандоравируса 10 локализованы внутри кодирующих областей предсказанных генов, а дру-
гие — вблизи генов, что указывает на роль данных ТЕ в обеспечении вирусов генетической новизной [75].
Ц^-содержащие ретро-ТЕ участвуют в противовирусной защите геномов хозяев, вызывая рестрикцию экзогенных ретровирусов. Данное свойство можно использовать для лечения вирусных инфекций, в частности приобретенного иммунодефицита. Значительная часть геномов позвоночных состоит из Е^У. Некоторые из генных продуктов, кодируемых ERV и другими ретроТЕ, могут выполнять защитные функции для хозяина против вирусных инфекций. В частности, было показано, что продукты генов ет действуют как факторы рестрикции против родственных экзогенных ретровирусов у кур, овец, мышей и кошек. Предполагается наличие подобных механизмов и в геномах других организмов, в том числе человека [26].
Помимо защиты от экзогенных вирусов, ТЕ могут способствовать интеграции вирусных последовательностей в геномы хозяев, что часто приводит к хронизации болезни [15, 16]. Данное свойство говорит об эволюционном родстве и возможном происхождении вирусов от ТЕ. Например, в отношении вируса гепатита В филогенетическая взаимосвязь с ретровирусами доказана [43]. Кроме того, вирусы могут способствовать активации ТЕ, что еще раз говорит об их филогенетическом родстве и наличии общих свойств и последовательностей. Показано, что инфекция цитомегаловирусом человека (НСМУ) индуцирует транскрипционную активность HERV в определенных типах клеток [76].
Промоторы ТЕ часто проявляют активность, регулируемую в пространстве и времени, которая зависит от типа клеток или от влияния информации внешней среды, такой как стресс или инфекция. В то же время экспрессия многих ТЕ ограничена различными стадиями гаметогенеза и раннего эмбриогенеза у растений и животных. Некоторые ТЕ проявляют также жестко регулируемую активность в соматических тканях самых разных организмов. При этом ТЕ обладают способностями к неслучайной интеграции в геномах — многие ТЕ разработали механизмы интеграции в геномные области, которые максимизируют вероятность их распространения [45]. Использование ТЕ для интеграции вирусов в геном говорит как о возможном происхождении вирусов от ТЕ, так и о перспективах использования данного процесса в генетике. В данном отношении важен поиск ТЕ, способных интегрировать в строго определенные локусы генома, что перспективно для их использования в генной терапии с применением вирусных векторов. Например, белки, кодируемые у человека эволюционно консервативным, произошедшим от ДНК-ТЕ геном PGBD5, могут индуцировать однотипные локус-специфические транспозиции ДНК в клетках человека путем вырезания и вставки. Транспозиции ДНК, катализируемые белком PGBD5 в клетках человека происходят в полногеномном масштабе с точным удалением и предпочтительной ин-серцией в области ТТАА. Очевидное сохранение транспозиционной активности PGBD5 предполагает, что геномное ремоделирование способствует его биологической функции [1]. Хотя большинство non-L.TR ТЕ внедряются в геном хозяина почти случайно, некоторые из них инсертируют в специфические последовательности внутри целевых сайтов. На основании структурных и филогенетических черт non-LTR ТЕ классифицируют на две большие группы: 1) элементы, кодирующие сход-
ные с ферментами рестрикции эндонуклеазы (RLE), и 2) элементы, кодирующие апурин/апиримидиновые эндонуклеазы (АРЕ). Все представители 1-й группы включают сайт-специфические элементы. Из 20 представителей 2-й группы только Tx1 и R1 содержат сайт-специфические элементы. Мишени сайт-специфических non-LTR TE обычно расположены внутри кластеров генов с множеством копий, таких как гены кластеров рРНК или повторяющиеся геномные последовательности, такие как теломерные повторы. Предполагается, что сайт-специфические инсерции ТЕ связаны с отбором вариантов транспозиций, которые в наименьшей степени повреждают геном хозяина. Специфичность по сайтам и последовательностям варьирует даже у близко родственных non-LTR TE и изменяется в ходе эволюции. Так, для RLE-элементов на специфичность встраивания в определенные области генома данных транспозонов влияют мотивы ДНК-связывания. Высокоспециализированные интеграционные свойства этих сайт-специфичных non-LTR TE делают их идеальными альтернативными инструментами для доставки генов, специфичных для последовательностей, особенно в терапевтических целях при болезнях человека [77].
Заключение
В обзорной статье описаны пути возникновения экзогенных вирусов от транспозонов, а также возможности их взаимопревращений в эволюции. Представлены данные об особенностях элементов, способных существовать как в виде вирусов, так и в виде транспозонов. Предполагается, что они представляют собой промежуточное звено в эволюции между ТЕ и вирусами. Возникновение из транспозонов вирусных частиц и их дальнейшая эволюция обусловлены высокой мутабельностью их последовательностей, изменение которых способствует приобретению новых свойств, в том числе адаптивных. Данное свойство ТЕ способствовало также их использованию геномами хозяев для образования генов нкРНК и белков, что объясняет широкое распространение ТЕ у всех живых организмов, в особенности у многоклеточных эукариот. Имеется ряд общих свойств ТЕ и вирусов, подтверждающий их филогенетическое родство. Кроме того, некоторые гигантские вирусы могут содержать в своем составе ретроэлементы. Автономные транспозо-ны, не содержащие LTR, способствуют перемещениям неавтономных, а также предположительно интеграции определенных экзогенных вирусов в геном. LTR-содержащие ретроэлементы могут участвовать в противовирусной защите хозяина, вызывая рестрикцию экзогенных ретровирусов. Данное свойство можно использовать для лечения вирусных инфекций, в частности приобретенного иммунодефицита. Необходимость изучения взаимодействий вирусов и транспозонов связана с использованием экзогенных вирусов для генной терапии, так как применение вирусных векторных систем может вызвать нежелательные эффекты со стороны транспозонов (дисбаланс которых, как известно, может индуцировать канцерогенез). Кроме того, возможно использование положительных эффектов взаимодействия вирусных векторных систем для модулирования функционирования организма, в частности в борьбе со старением.
Авторы заявляют об отсутствии конфликта интересов.
ЛИТЕРАТУРА/REFERENCES
1. Henssen AG, Henaff E, Jiang E, et al. Genomic DNA transposition induced by human PGBD5. Elife. 2015;4:pii: e10565. https://doi.org/10.7554/eLife.10565
2. Han MJ, Xu HE, Zhang HH, Feschotte C, Zhang Z. Spy: a new group of eukaryotic DNA transposons without target site duplications. Genome Biol Evol. 2014;6(7):1748-1757. https://doi.org/10.1093/gbe/evu140
3. Равин Н.В., Шестаков С.В. Геном прокариот. Вавиловский журнал генетики и селекции. 2013;17:972-984.
4. Хесин Р.Б. Непостоянство генома. М. 1984.
5. Wicker T, Sabot F, Hua-Van A, Bennetzen JL, Capy P, Chalhoub B, Flavell A, Leroy P, Morgante M, Panaud O, Paux E, SanMiguel P, Schulman AH. A unified classification system for eukaryotic transposable elements. Nat Rev Genet. 2007;8(12):973-982.
6. Ayarpadikannan S, Lee HE, Han K, Kim HS. Transposable element-driven transcript diversification and its relevance to genetic disorders. Gene. 2015;558(2): 187-194.
7. Ma B, Li T, Xiang Z, He N. MnTEdb, a collective resource for mulberry transposable elements. Database. 2015;27:pii: bav004. https://doi.org/10.1093/database/bav004
8. Luchetti A. TerMITEs: miniature inverted-repeat transposable elements (MITEs) in the termite genome (Blattodea: Termitoidae). Mol Genet Genomics. 2015;290(4):1499-1509. https://doi.org/10.1007/s00438-015-1010-1
9. Jiang C, Chen C, Huang Z, Liu R, Verdier J. ITIS, a bioinformatics tool for accurate identification of transposon insertion sites using next-generation sequencing data. BMC Bioinformatics. 2015; 16:72. https://doi.org/10.1186/s12859-015-0507-2
10. Toro N, Nisa-Martinez R. Comprehensive phylogenetic analysis of bacterial reverse transcriptases. PLoS One. 2014;9:e114083. https://doi.org/10.1371/journal.pone.0114083
11. Koonin EV, Dolja VV, Krupovic M. Origins and evolution off viruses of eukaryotes: The ultimate modularity. Virology. 2015;479-480:2-25. https://doi.org/10.1016/j.virol.2015.02.039
12. Skalka AM. Retroviral DNA Transposition: Themes and Variations. Microbiol Spectr. 2014;2(5):MDNA300052014.
13. Dotto BR, Carvalho EL, da Silva AF, Dezordi FZ, Pinto PM, Campos TL, Rezende AM, Wallau GDL. HTT-DB: new features and updates. Database (Oxford). 2018; 1.
https://doi.org/10.1093/database/bax102
14. Pastuzyn ED, Day CE, Kearns RB, Kyrke-Smith M, Taibi AV, McCormick J, Yoder N, Belnap DM, Erlendsson S, Morado DR, Briggs JAG, Feschotte C, Shepherd JD. The neuronal gene Arc encodes a repurposed retrotrans-poson gag protein that Mediates intercellular RNA Transfer. Cell. 2018; 172(1 -2):275-288.
https://doi.org/10.1016/jxell.2017.12.024
15. Tarocchi M, Polvani S, Marroncini G, Galli A. Molecular mechanism of hepatitis B virus-induced hepatocarcinogenesis. World J Gastroenterol. 2014;20(33):11630-11640.
16. Speiseder T, Nevels M, Dobner T. Determination of the transforming activities of adenovirus oncogenes. Methods Mol Biol. 2014;1089:105-115.
17. Notwell JH, Chung T, Heavner W, Bejerano G. A family of transposable elements co-opted into developmental enhancers in the mouse neocortex. Nat Commun. 2015;6:6644.
18. Pavlicev M, Hiratsuka K, Swaggart KA, Dunn C, Muglia L. Detecting endogenous retrovirus-driven tissue-specific gene transcription. Genome Biol Evol. 2015;7(4):1082-1097. https://doi.org/10.1093/gbe/evv049
19. Ito J, Suqimoto R, Nakaoka H, Yamada S, Kimura T, Hayano T, Inoue I. Systematic identification and characterization of regulatory elements derived from human endogenous retroviruses. PLoS Genet. 2017;13(7):e1006883.
20. Gim J, Ha H, Ahn K, Kim DS, Kim HS. Genome-Wide Identification and Classification of microRNAs derived from repetitive elements. Genomic Inform. 2014;12:261-267.
21. Johnson R, Guigo RJ. The RIDL hypothesis: transposable elements as functional domains of long noncoding RNAs. RNA. 2014;20:959-976.
22. Feschotte C. Transposable elements and the evolution of regulatory networks. Nat Rev Genet. 2008;9:397-405.
23. Zdobnov EM, Campillos M, Harrington ED, Torrents D, Bork P. Protein coding potential of retroviruses and other transposable elements in vertebrate genomes. Nucleic Acids Res. 2005;33:946-954.
24. Hoen DR, Buraeu TE. Discovery of Novel Genes Derived from Transposable Elements Using Integrative Genomic Analysis. Mol Biol Evol. 2015;32(6):1487-1506. https://doi.org/10.1093/molbev/msv042
25. Le Dantec C, Vallet S, Brooks WH, Renaudineau Y. Human Endogenous Retrovirus Group E and Its Involvement in Diseases. Viruses. 2015;7(3):1238-1257.
26. Malfavon-Borja R, Feschotte C. Fighting fire with fire: endogenous retrovirus envelopes as restriction factors. J Virol. 2015;89(8):4047-4050. https://doi.org/10.1128/JVl.03653-14
27. Abascal F, Tress ML, Valencia A. Alternative splicing and co-option of transposable elements: the case of TMPO/LAP2a and ZNF451 in mammals. Bioinformatics. 2015;31(14):2257-2261. https://doi.org/10.1093/bioinformatics/btv132
28. Zhuo X, Feschotte C. Cross-Species Transmission and Differential Fate of an Endogenous Retrovirus in Three Mammal Lineages. PLoS Pathg. 2015;11(11):e1005279.
https://doi.org/10.1371/journal.ppat.1005279
29. Llorens C, Munoz-Pomer A, Bernad L, Botella H, Moya A. Network dynamics of eukaryotic LTR retroelements beyond phylogenetic trees. Biology Direct. 2009;4:41-72.
30. Tengs T, Kristoffersen AB, Bachvaroff TR, Jonassen CM. A mobile genetic element with unknown function found in distantly related viruses. Virol J. 2013;10:132.
31. Kanai A. Virus, phage, transposon and their regulatory small non-coding RNAs. Uirusu. 2011 ;61(1 ):25-34.
32. Fischer MG, Suttle CA. A virophage at the origin of large DNA transposons. Science. 2011;332(6026):231 -234.
33. Yutin N, Shevchenko S, Kapitonov V, Krupovic M, Koonin EV. A novel group of diverse Polinton-like viruses discovered by metagenome analysis. BMC Biol. 2015;13:95.
34. Kapitonov VV, Jurka J. Self-synthesizing DNA transposons in eukaryotes. Proc Natl Acad Sci USA. 2006;103(12):4540-4545.
35. Haapa-Paananen S, Wahlberg N, Savilahti H. Phylogenetic analysis of Ma-verick/Polinton giant transposons across organisms. Mol Phylogenet Evol. 2014;78:271-274.
36. Dupuy C, Periquet G, Serbielle C, Bezier A, Louis F, Drezen J-M. Transfer of a chromosomal Maverick to endogenous bracovirus in a parasitoid wasp. Genetiva. 2011; 139(4):489-496.
37. Krupovic M, Koonin EV. Self-synthesizing transposons: unexpected key players in the evolution of viruses and defense systems. Curr Opin Microbiol. 2016;31:25-33.
38. Routh A, Domitrovic T, Johnson JE. Host RNAs, including transposons, are encapsidated by a eukaryotic single-stranded RNA virus. Proc Natl Acad Sci USA. 2012;109(6):1907-1912.
39. Koonin EV, Krupovic M, Yutin N. Evolution of double-stranded DNA viruses of eukaryotes: from bacteriophages to transposons to giant viruses. Ann NY Acad Sci. 2015;1341:10-24. https://doi.org/10.1111/nyas.12728
40. Krupovic M, Koonin EV. Polintons: a hotbed of eukaryotic virus, transposon and plasmid evolution. Nat Rev Microbiol. 2015;13(2):105-115.
41. Krupovic M, Bamford DH, Koonin EV. Conservation of major and minor jelly-roll capsid proteins in Polinton (Maverick) transposons suggests that they are bona fide viruses. Biol Direct. 2014;9:6-13. https://doi.org/10.1186/1745-6150-9-6
42. Xiong Y, Eickbush TH. Origin and evolution of retroelements based upon their reverse transcriptase sequence. EMBO J. 1990;9:3353-3362.
43. Miller RH, Robinson WS. Common evolutionary origin of hepatitis B virus and retroviruses. Proc Natl Acad Sci USA. 1986;83(8):2531-2535.
44. Pace JK, Gilbert C, Clark MS, Feschotte C. Repeated horizontal transfer of a DNA transposon in mammals and other tetrapods. Proc Natl Acad Sci USA. 2008;105(44):17023-17028. https://doi.org/10.1073/pnas.0806548105
45. Chuong EB, Elde NC, Feschotte C. Regulatory activities of transposable elements: from conflicts to benefits. Nat Rev Genet. 2017;18(2):71-86.
46. Long Y, Wang X, Youmans DT, Cech TR. How do lncRNAs regulate transcription. Sci Adv. 2017;3:eaao2110.
https://doi.org/10. 1126/sciadv.aao2110
47. Zhang J, Mujahid H, Hou Y, Nallamilli BR, Peng Z. Plant Long ncRNAs: A new frontier for gene regulatory control. American Journal of Plant Sciences. 2013;4:lD:32139.
48. Anderson DM, Anderson KM, Cang CL, Makarewich CA, Nelson BR, McAnally JR, Kasaragod P, Shelton JM, Liou J, Bassel-Duby R, Olson EN. A micropeptide encoded by a putative long noncoding RNA regulates muscle performance. Cell. 2015;160:595-606.
49. Lv S, Pan L, Wang G. Commentary: Primary Transcripts of microRNAs Encode Regulatory Peptides. Front Plant Sci. 2016;7:1436.
50. Nelson BR, Makarewich CA, Anderson DM, Winders BR, Troupes CD, Wu F, Reese AL, McAnally JR, Chen X, Kavalali ET, Cannon SC, Hou-ser SR, Bassel-Duby R, Olson EN. A peptide encoded by a transcript annotated as long noncoding RNA enhances SERCA activity in muscle. Science. 2016;351:271-275.
51. Ruiz-Orera J, Messeguer X, Subirana JA, Alba MM. Long non-coding RNAs as a source of new peptides. Elife. 2014;3:e03523. https://doi.org/10.7554/eLife.03523
52. Pang Y, Mao C, Liu S. Encoding activities of non-coding RNAs. Theronostics. 2018;8(9):2496-2507.
53. Ransohoff JD, Wei Y, Khavari PA. The functions and unique features of long intergenic non-coding RNA. Nat Rev Mol Cell Biol. 2018;19(3):143-157.
54. Bazzini AA, Johnstone TG, Christino R, Mackowiak SD, Obermayer B, Fleming ES, Vejnar CE, Lee MT, Rajewsky N, Walther TC, Giraldez AJ. Identification of small ORFs in vertebrates using ribosome footprinting and evolutionary conservation. EMBO J. 2014;33(9):981-993.
55. Ingolia NT, Lareau LF, Weissman JS. Ribosome profiling of mouse embryonic stem cells reveals the complexity and dynamics of mammalian proteomes. Cell. 2011;147(4):789-802.
56. Juntawong P, Girke T, Bazin J, Bailey-Serres J. Translational dynamics revealed by genome-wide profiling of ribosome footprints in Arabidopsis. Proc Natl Acad Sci USA. 2014;111 (1):203-212.
57. Van Heesch S, van Iterson M, Jacobi J, Boymans S, Essers PB, de Bruijn E, Hao W, Maclnnes AW, Cuppen E, Simonis M. Extensive localization of long noncoding RNAs to the cytosol and mono- and polyribosomal complexes. Genome Biol. 2014;15(1):6.
58. Fang X, Qi Y. RNAi in Plants: An Argonaute-Centered View. Plant Cell. 2016;28:272-285.
59. Couzigou JM, Lauressergues D, Becard G, Comier JP. miRNA-encoded peptides (miPEPs): A new tool to analyze the role of miRNAs in plant biology. RNA Biol. 2015;12:1178-1180.
60. Levine MT, Jones CD, Kern AD, Lindfors HA, Begun DJ. Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression. Proc Natl Acad Sci USA. 2006;103:9935-9939.
61. Cai J, Zhao R, Jiang H, Wang W. De novo origination of a new protein-coding gene in Saccharomyces cerevisiae. Genetics. 2008; 179:487-496.
62. Xie C, Zhang YE, Chen JY, Liu CJ, Zhou WZ, Li Y, Zhang M, Zhang R, Wei L, Li CY. Hominoid-specific de novo protein-coding genes originating from long non-coding RNAs. PLoS Genet. 2012;8:e1002942.
63. Andrews SJ, Rothnagel JA. Emerging evidence for functional peptides encoded by short open reading frames. Nat Rev Genet. 2014; 15(3):193-204. https://doi.org/10.1038/nrg3520
64. Palazzo A, Caizzi R, Viggiano L, Marsano RM. Does the Promoter Constitute a Barrier in the Horizontal Transposon Transfer Process? Insight from Bari Transposons Genome Biol Evol. 2017;9(6):1637-1645.
65. Gilbert C, Waters P, Feschotte C, Schaack S. Horizontal transfer of OC1 transposons in the Tasmanian devil. BMC Genomics. 2013;14:134. https://doi.org/10.1186/1471-2164-14-134
66. Daniels SB, Peterson KR, Strausbaugh LD, Kidwell MG, Chovnick A. Evidence for horizontal transmission of the P transposable element between Drosophila species. Genetics. 1990;124(2):339-355.
67. Zhang H, Feschotte C, Han M, Zhang Z. Recurrent Horizontal Transfers of Chapaev Transposons in Diverse Invertebrate and Vertebrate Animals. Genome Biol Evol. 2014;6(6):1375-1386.
https://doi.org/10.1093/gbe/evu112
68. Sniezewski L, Janik S, Laszkiewicz A, Majkowski M, Kisielow P, Cebrat M. The evolutionary conservation of the bidirectional activity of the NWC gene promoter in jawed vertebrates and the domestication of the RAG transposon. Dev Comp Immunol. 2018;81:105-115.
https://doi.org/10.1016/j.dci.2017.11.013
69. Fugmann SD. The origins of the Ras genes — from transposition to V(D)J recombination. Semin Immunol. 2010;22(1): 10-16.
https://doi.org/10.1016/j.smim.2009.11.004
70. Bernstein RM, Schluter SF, Bernstein H, Marchalonis JJ. Primordial emergence of the recombination activating gene 1 (RAG1): sequence of the complete shark gene indicates homology to microbial integrases. Proc Natl Acad Sci USA. 1996;93(18):9454-9459.
71. Fugmann SD, Messier C, Novack LA, Cameron RA, Rast JP An ancient evolutionary origin of the Rag 1/2 gene locus. Proc Natl Acad Sci USA. 2006;103(10):3728-3733.
72. Hencken CG, Li X, Craig NL. Functional characterization of an active Raglike transposase. Nat Struct Mol Biol. 2012;19(8):834-836. https://doi.org/10.1038/nsmb.2338
73. Gao D, Chu Y, Xia H, Xu C, Heyduk K, Abernathy B, Ozias-Akins P, Lee-bens-Mack JH, Jackson SA. Horizontal Transfer of Non-LTR Retrotrans-posons from Arthropods to Flowering Plants. Mol Biol Evol. 2018;35(2):354-364.
https://doi.org/10.1093/molbev/msx275
74. Venner S, Miele V, Terzian C, Biemont C, Daubin V, Feschotte C, Pontier D. Ecological networks to unravel the routes to horizontal transposon transfer. PLoS Biol. 2017;15(2):e2001536.
https://doi.org/10.1371 /journal.pbio.2001536
75. Sun C, Feschotte C, Wu Z, Mueller RL. DNA transposons have colonized the genome of the giant virus Pandoravirus salinus. BMC Biol. 2015; 13:38. https://doi.org/10.1186/s12915-015-0145-1
76. Assinger A, Yaiw KC, Gottesdorfer I, Leib-Mosch C, Soderberg-Naucler C. Human cytomegalovirus (HCMV) induces human endogenous retrovirus (HERV) transcription. Retrovirology. 2013; 10:132. https://doi.org/10.1186/1742-4690-10-132
77. Fujiwara H. Site-specific non-LTR retrotransposons. Microbiol Spectr. 2015;3(2):MDNA3-0001-2014.
https://doi.org/10.1128/microbiolspec.MDNA3-0001-2014
Поступила в редакцию18.02.18 После доработки 18.02.18 Принята к публикации 07.04.18
Сведения об авторе:
Мустафин Рустам Наилевич — доцент кафедры медицинской генетики и фундаментальной медицины ФГБОУ ВО БГМУ; 450008, Уфа, ул. Ленина, 3; научный сотрудник лаборатории ПЦР-анализа кафедры генетики и фундаментальной медицины ФГБОУ ВО БГУ; e-mail: ruji79@mail.ru