Научная статья на тему 'Множественная интеграция фрагментов генома вируса клещевого энцефалита в геномные структуры животных и человека'

Множественная интеграция фрагментов генома вируса клещевого энцефалита в геномные структуры животных и человека Текст научной статьи по специальности «Биологические науки»

CC BY
194
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Acta Biomedica Scientifica
ВАК
Область наук
Ключевые слова
ВИРУС КЛЕЩЕВОГО ЭНЦЕФАЛИТА / МНОЖЕСТВЕННАЯ ИНТЕГРАЦИЯ / ГЕНОМЫ ЧЕЛОВЕКА / ШИМПАНЗЕ / МЫШЕЙ / TICK-BORNE ENCEPHALITIS VIRUS / MULTIPLE INTEGRATIONS / GENOMES OF HUMAN / CHIMPANZEE / MICE

Аннотация научной статьи по биологическим наукам, автор научной работы — Парамонов Алексей Игоревич, Джиоев Юрий Павлович, Козлова Ирина Валерьевна, Букин Юрий Сергеевич, Злобин Владимир Игоревич

Впервые проведен биоинформационный анализ множественной интеграции фрагментов генома вируса клещевого энцефалита (КЭ) в геномные структуры животных и человека. Показано, что в геномах человека, обезьяны мышей выявлены, участки фрагментов генома вируса КЭ, которые присутствуют небольшими фрагментами (до 68 нуклеотидных оснований) в разных хромосомных структурах. Получено 34 фрагмента вируса КЭ, из которых 27 выявлены в геноме шимпанзе, 3 у человека и. 4 у мышей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Парамонов Алексей Игоревич, Джиоев Юрий Павлович, Козлова Ирина Валерьевна, Букин Юрий Сергеевич, Злобин Владимир Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTIPLE INTEGRATION OF GENOME FRAGMENTS OF TICK-BORNE ENCEPHALITIS VIRUS IN GENOMIC STRUCTURE OF ANIMALS AND HUMAN

First bioinformation analysis of multiple integrations of genome fragments of tick-borne encephalitis virus (TBE) in the genomic structure of animals and humans was carried out. It is showed that the genomes of human, monkeys, mice contain genome fragments of the TBE virus, which are small fragments (up to 68 nucleotide bases) in different chromosomal structures. 34 fragments of TBE virus was produced, 27 of them were identified in the genome of the chimpanzee, 3 in humans and 4 in mice.

Текст научной работы на тему «Множественная интеграция фрагментов генома вируса клещевого энцефалита в геномные структуры животных и человека»

УДК 616.988.25:614.4-616.036

А.И. Парамонов Ю.П. Джиоев И.В. Козлова Ю.С. Букин 2, В.И. Злобин 3

множественная интеграция фрагментов генома вируса клещевого энцефалита в геномные структуры животных и человека

1 Учреждение Российской академии медицинских наук Научный центр проблем здоровья семьи

и репродукции человека Сибирского отделения РАМН (Иркутск) 2Лимнологический институт СО РАН (Иркутск) 3 Иркутский государственный медицинский университет (Иркутск)

Впервые проведен биоинформационный анализ множественной интеграции фрагментов генома вируса клещевого энцефалита (КЭ) в геномные структуры, животных и человека. Показано, что в геномах человека, обезьяны, мышей выявлены, участки, фрагментов генома вируса КЭ, которые присутствуют небольшими, фрагментами, (до 68 нуклеотидных оснований) в разных хромосомных структурах. Получено 34 фрагмента вируса КЭ, из которых 27 выявлены, в геноме шимпанзе, 3 — у человека и. 4 — у мышей. Ключевые слова: вирус клещевого энцефалита, множественная интеграция, геномы человека, шимпанзе, мышей

MULTIPLE INTEGRATION OF GENOME FRAGMENTS OF TICK-BORNE ENCEPHALITIS virus in genomic structure of ANIMALS AND HUMAN

A.I. Paramonov Yu.P. Dzhioev I.V. Kozlova Yu.S. Bukin 2, V.I. Zlobin 3

1 Scientific Center of Family Health Problems and Human Reproduction SB RAMS, Irkutsk

2 Limnological Institute SB RAS, Irkutsk 3 Irkutsk State Medical University, Irkutsk

First bioinformation analysis of multiple integrations of genome fragments of tick-borne encephalitis virus (TBE) in the genomic structure of animals and humans was carried out. It is showed that the genomes of human, monkeys, mice contain genome fragments of the TBE virus, which are small fragments (up to 68 nucleotide bases) in different chromosomal structures. 34 fragments of TBE virus was produced, 27 of them, were identified, in the genome of the chimpanzee, 3 — in humans and. 4 — in mice.

Key words: tick-borne encephalitis virus, multiple integrations, genomes of human, chimpanzee, mice

ночных большого количества копий неретровирусных последовательностей [1, 5, 7]. Сохранение и экспрессия некоторых из этих эндогенных последовательностей и потенциальные взаимосвязи между их присутствием и сопротивляемостью вида заболеваниям, вызванным вирусами, предполагают, что они дают важное селективное преимущество популяциям хозяев [6]. Это показывает, что источники генетического наследования в геномах позвоночных значительно более разнообразны, чем ранее предполагалось [2, 3].

В литературе есть данные о том, что интеграция участков генома РНК-вирусов в большинстве случаев производится путем обратной транскрипции с участием LINE-подобных элементов [4].

Целью данной работы было выявление в геномных структурах человека, шимпанзе, мышей фрагментов генома вируса клещевого энцефалита (КЭ).

материалы и методы

Анализ интеграций генома был произведен с использованием полногеномных нуклеотидных последовательностей прототипных штаммов трех генотипов ВКЭ (Найдорф, Васильченко, Софьин), а также последовательностей штаммов 886-84 и 178-79, доступных в базе данных GenBank. Затем был произведен скрининг против находящихся в публичном доступе геномов человека (Human G + T) и домовой мыши (Mouse G + T), а также против базы референсных геномных последовательностей (refseq_genomic) с исключением последователь-

введение

Последнее десятилетие ознаменовалось революционными открытиями в области молекулярной биологии — были расшифрованы полногеномные структуры нуклеотидов у человека, десятков животных и многих сотен микроорганизмов (вирусов, бактерий). Это уже позволяет с данными генетическими структурами проводить объемные биоинформационные исследования, которые дают возможность анализировать их эволюционные истории, механизмы взаимоотношений, возможности их адаптационных стратегии. Одним из важнейших фактов изучения эволюции вирусов являются их интеграционные возможности адаптироваться в геномах своих хозяев. Эта способность дает вирусам преимущества, что позволяет им сохранять свои патогенетические потенциалы. Интерес к этой теме возник в последние несколько лет в исследованиях ряда зарубежных ученых, в которых показано, что способность интеграции в геномы хозяев не только ретровирусов, но и других вирусов, не обладающих механизмом включения в геномы хозяев, является одним из важных элементов их существования и влияния на клеточные структуры организма хозяев.

Геномы позвоночных содержат многочисленные копии ретровирусных последовательностей, приобретенные в течение эволюции. До недавнего времени они считались единственным типом РНК-содержащих вирусов, представленных таким образом. Однако недавние исследования показали наличие в геномах растений, насекомых и позво-

166 Экспериментальные исследования в биологии и медицине

Таблица 1

Результаты поиска фрагментов генома вируса клещевого энцефалита в геномных структурах человека и животных

Идентификатор целевой последовательности в Genbank Описание целевой последовательности Счет выравнивания Е- значение Длина выравнивания Доля идентичных остатков Доля пробелов Штамм вируса в запросе Позиция в запросе Позиция в цели Особенности в этой части последовательности

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 54 83 % 0 % Sofjin 1135-1188 709230- 709177 16169 bp at 5' side: myosin-lg isoform 6; 5887 bp at 3' side: malcavernin isoform 3

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 54 83 % 0 % Sofjin 1135-1188 719913- 719860 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 54 83 % 0 % Sofjin 1135-1188 730597- 730544 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 54 83 % 0 % Sofjin 1135-1188 741277- 741224 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 747319-747279 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 757862- 757822 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 768404- 768364 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 778939- 778899 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 789480- 789440 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 800019-799979 NAC-alpha domain-containing protein 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 810559-810519 4275 bp at 5' side: NAC-alpha domain-containing protein 1; 7110 bp at 3' side: protein TBRG4 isoform 7

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % Sofjin 5691-5731 821099- 821059 11682 bp at 5' side: myosin-lg isoform 6-10383 bp at 3' side: malcavernin isoform 3

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 55.4 0.033 45 87 % 0 % Sofjin 5691-5735 715417- 715373 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 55.4 0.033 45 87 % 0 % Sofjin 5691-5735 736781- 736737 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % 178-79 5691-5731 747319-747279 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % 178-80 5691-5731 757862- 757822 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % 178-81 5691-5731 768404- 768364 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % 178-82 5691-5731 778939- 778899 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % 178-83 5691-5731 789480- 789440 malcavernin isoform 3; malcavernin isoform 1

ref|NW_003457177.11 Pan troglodytes геномный скаффолд хромосомы 7 57.2 0.009 41 90 % 0 % 178-84 5691-5731 800019-799979 NAC-alpha domain-containing protein 1

БЮЛЛЕТЕНЬ ВСНЦ СО РАМН, 2011, №5(81)

4275 bp at 5' side: NAC-alpha domain-containing protein 1; 7110 bp at 3' side: protein TBRG4 isoform 7 116B2 bp at 5' side: myosin-Ig isoform 6-103B3 bp at 3' side: malcavernin isoform 3 54BB bp at 5' side: myosin-Ig isoform 6; 16566 bp at 3' side: malcavernin isoform 3 16171 bp at 5' side: myosin-Ig isoform 6; 5BB3 bp at 3' side: malcavernin isoform 3 malcavernin isoform 3; malcavernin isoform 1 malcavernin isoform 3; malcavernin isoform 1 malcavernin isoform 3; malcavernin isoform 1 protein shisa-6 homolog precursor DNA-binding protein RFX2 isoform 2; DNA-binding protein RFX2 isoform 1 DNA-binding protein RFX2 isoform 2; DNA-binding protein RFX2 isoform 1

B10559- B10519 B21099- B21059 15612254- 15612295 B29722- B29673 709234- 709179 719917- 719B62 730601- 730546 7412B1- 741226 33172931- 33172996 241B9345- 241B92B7 31566006- 31566041 4262664- 4262699 566075B9- 56607632 13707753- 13707796

5691-5731 31 7 5 1 19 6 5 6 6 3 5 1 7 2 3 5 2 0 B 7 1 3 5 7 7 6 B 7 13 6 B 7 13 6 B 7 13 6 B 7 13 B 0 2 4 1 2 4 14 B 0 2 4 1 2 4 14 2 B 0 B 1 7 4 0 B 2 B 0 B 1 7 4 0 B 0 6 B 2 1 5 1B 2 16 B 2 1 5 1B 2

17B-B5 6 -B 00 7 4 -B СО B B n e h О о si 2 n e h О о si 2 n e h О о si 2 n e h О о si 2 Vasilchenk o re o -О u e N re o -О u e N re o -O u e N re o -O u e N re o -O u e N re o -O u e N

0 % o4 О о4 ю Vp о4 О sp о4 О sp o' О sp o' О sp O' О sP O' sP O' sP O' О vP o4 О vP o4 sP o'

90 % % о 9 % о 9 Vp % 00 B sp % CN B sp % CN B sp % CN B sP % CN B sP % СЛ 7 sP % СЛ 7 sP % CN 9 vP % CN 9 vP % LO B sP % LO B

CN о ю CD Ю CD Ю CD Ю CD Ю 00 CD 00 CD CD CO CD CO CD CD

6000 9 0 о 0. 6 о 0. 5 0- UJ о ,0 6, 9 0 О 0. 9 0 CD 0. 9 0 CD 0. 9 0 О 0. 5 О .0 5 О .0 4 О .0 4 О .0 9 4 CD .0 9 4 CD .0

57.2 2. 5 B. LO 4. 6 2. 5 2. 5 2. 5 2. 5 0. О 5 0. О 5 B. LO B. LO 0. CD 5 0. CD 5

Pan troglodytes геномный скаффолд хромосомы 7 Pan troglodytes геномный скаффолд хромосомы 7 Homo sapiens геномный скаффолд хромосомы 7 Pan troglodytes геномный скаффолд хромосомы 7 Pan troglodytes геномный скаффолд хромосомы 7 Pan troglodytes геномный скаффолд хромосомы 7 Pan troglodytes геномный скаффолд хромосомы 7 Pan troglodytes геномный скаффолд хромосомы 7 Homo sapiens геномный контиг хромосомы 1 Homo sapiens геномный контиг хромосомы 1, альтернативная сборка Mus musculus штамм C57BL/6J геномный контиг хромосомы 11 Mus musculus штамм C57BL/6J геномный контиг хромосомы 11 Mus musculus штамм C57BL/6J геномный контиг хромосомы 17 Mus musculus штамм C57BL/6J геномный контиг хромосомы 17

refjNW_003457177.1j refjNW_003457177.1j refjNT 010274.17j refjNW_003457177.1j refjNW_003457177.1j refjNW_003457177.1j refjNW_003457177.1j refjNW_003457177.1j j9 .7 00 4 4 0 0 _T Nj ref refjNW_001B3B533.2j refjNT_096135.5j refjNT_096135.5j refjNT_039649.7j refjNW_001030622.1j

ностей вирусов. Все базы данных доступны для выбора в онлайн-версии BLAST (http://blast.ncbi. nlm.nih.gov/Blast.cgi).

РЕЗУЛЬТАТЫ

Проведенный поиск произвел 34 результата с величиной p меньше 0,05 (табл. 1). Длина этих фрагментов выравнивания не превышает 68 нуклеотидов, но доля совпадающих остатков очень велика, не менее 79 %. Доля пробелов в выравниваниях не превышала 5 %. 27 из обнаруженных фрагментов находятся в геноме шимпанзе. Большая часть из этих фрагментов имеет идентичную нуклеотидную структуру и рассеяна в 7-геномном скаффолде (скаффолдинг — метод метапрограммирования для создания веб-приложений, взаимодействующих с базой данных) генома шимпанзе. В геноме человека было найдено 3 и в геноме мыши — 4 фрагмента. Все найденные фрагменты лежат вне известных генов, но иногда поблизости с их границами.

В геномах всех трех организмов было найдено большое количество участков малой протяженности, показывающих высокую гомологию, но имеющих низкую достоверность, р > 0,05. Несмотря на то, что они также могут быть результатом интеграции участков вирусного генома в геном хозяина, они не были включены в результаты. Также в ходе предварительного описка в геноме шимпанзе были также обнаружены гомологичные вирусу КЭ фрагменты большой протяженности, до 1500 нуклеотидов, и с высоким значением достоверности, р << 0,001. Однако в ходе проверки обнаружилось, что эти фрагменты выявляются только при анализе базы refseq_genomic, но отсутствуют в других базах, содержащих полные геномы шимпанзе. Они также не были включены в таблицу с результатами.

выводы

1. Проведенный анализ позволяет с большой долей надежности утверждать, что геномы исследованных организмов содержат участки, гомологичные участкам генома ВКЭ или другого флавивируса, и, по всей вероятности, являющиеся результатом интеграции предковых вариантов вирусного генетического материала. Количество участков вирусных последовательностей в геноме невелико, и в их расположении не наблюдается каких-либо закономерностей. Подтвержденные участки обладают рядом общих свойств, такими, как небольшая длина, высокая гомология и малое число пробелов в выравниваниях. Также обнаружено частое повторение одной

и той же вирусной последовательности в разных частях генома хозяина. Длина обнаруженных нами участков в основном слишком мала для интеграции с участием LINE-подобных элементов [4].

2. Участки, найденные у разных организмов, не совпадают между собой, что позволяет предположить их независимую и сравнительно недавнюю интеграцию. Это предположение подтверждается сравнительно большими фрагментами вирусного генома, найденными в одной из баз данных у шимпанзе. Можно предположить, что вирус интегрировался в геном конкретного животного относительно недавно (возможно, несколько миллионов лет назад), много позже становления шимпанзе как вида.

3. Участки генома вируса, гомологичные фрагментам генома позвоночных, лежат как в генах, кодирующих структурные белки, так и в неструктурных генах. В их расположении каких-либо закономерностей нами не обнаружено.

ЛИТЕРАТУРА

1. Anne E., Sela I. Occurrence of a DNA sequence of a non-retro RNA virus in a host plant genome and its expression: evidence for recombination between viral and host RNAs // Virology. - 2005. - Vol. 332. - Р. 614-622.

2. Belyi V.A., Levine J.A., Skalka A.M. Unexpected inheritance: multiple integrations of ancient bornavi-rus and ebolavirus/marburgvirus sequences in vertebrate genomes // PLoS Pathog. - 2010. - Vol. 29, N 6 (7). - Р. 1001 -1030.

3. Belyi V.A., Levine J.A., Skalka A.M. Sequences from ancestral single-stranded DNA viruses in vertebrate genomes: the Parvoviridae and Circoviridae are more than 40 to 50 million years old // J. Virol. -2010. - Vol. 84, N 23. - Р. 12458-12462.

4. Endogenous non-retroviral RNA virus elements in mammalian genomes / M. Horie [et al.] // Nature. - 2010. - Vol. 463. - Р. 84-87.

5. Isolation and characterization of Israeli acute paralysis virus, a dicistrovirus affecting honeybees in Israel: evidence for diversity due to intra- and interspecies recombination / E. Maori [et al.] // J. Gen. Virol. - 2007. - Vol. 88. - Р. 3428-3438.

6. Recombination of retrotransposon and exogenous RNA virus results in nonretroviral cDNA integration / M.B. Geuking [et al.] // Science. - 2009. -Vol. 323. - Р. 393-396.

7. Sequences of flavivirus-related RNA viruses persist in DNA form integrated in the genome of Aedes spp. mosquitoes / S. Crochu [et al.] // J. Gen. Virol. -2004. - Vol. 85. - P. 1971 -1980.

Сведения об авторах

Парамонов Алексей Игоревич - младший научный сотрудник лаборатории молекулярной эпидемиологии и генетической диагностики Научного центра проблем здоровья семьи и репродукции человека СО РАМН (664003, г Иркутск, ул. Карла Маркса, 3; тел.: 8 (3952) 33-39-51)

Джиоев Юрий Павлович - кандидат биологических наук, старший научный сотрудник лаборатории молекулярной эпидемиологии и генетической диагностики НЦ ПЗСиРЧ СО РАМН (664003, г. Иркутск, ул. Карла Маркса, 3)

Козлова Ирина Валерьевна - доктор медицинских наук, заведующая лабораторией молекулярной эпидемиологии и генетической диагностики НЦ ПЗСиРЧ СО РАМН (664003, г. Иркутск, ул. Карла Маркса, 3)

Букин Юрий Сергеевич - кандидат биологических наук, старший научный сотрудник Лимнологического института СО РАН (664033, г. Иркутск, ул. Улан-Баторская, 3)

Злобин Владимир Игоревич - доктор медицинских наук, профессор, академик РАМН, заведующий кафедрой медицинской микробиологии, вирусологии и иммунологии ИГМУ (664003, г. Иркутск, ул. Красного Восстания, 1; тел.: 8 (3952) 24-30-16)

i Надоели баннеры? Вы всегда можете отключить рекламу.