КОМПЬЮТЕРНЫЙ АНАЛИЗ САЙТА ИНТЕГРАЦИИ РЕТРОВИРУС А ТИПА - D МЕЙЗОНА - ПФАЙЗЕРА В ХРОМОСОМЫ ЧЕЛОВЕКА
Г.И.МЯНДИНА, О.И.ГУРЬЯНОВА П.Э.ПЯГАЙ, А.В.ИТКЕС
Кафедра биологии и общей генетики РУДН. Москва. 117198, ул. Миклухо-Маклая, д.8.
Медицинский факультет Ю.Б. ЛЕБЕДЕВ
Институт биоорганической химии им. М.И.Шемякина и Ю.А.Овчинникова Российской академии наук. Москва. 117997, ул. Миклухо-Маклая, д. 16.10
В данной работе представлены результаты компьютерного анализа функциональных участков генома человека, в которые произошла интеграция ретровируса типа D Мейзона-Пфайзера (MPMV) В результате проведенного анализа были охарактеризованы участки 2, 7, 10 и 17 хромосом, прилегающих к точке интеграции вируса Мейзона-Пфайзера в геном человека. Представлена функциональная характеристика участка 17-й хромосомы человека, куда произошла интеграция вируса, а также схема возможного механизма онкогенной активности вирусной вставки. Обсуждается возможная роль вируса MPMV в этиологии лимфопролиферативного заболевания.
Ключевые слова: ретровирус типа D Мейзона-Пфайзера, интеграция вирусного генома, вирусный онкогенез, хромосомы человека.
На сегодняшний день вирусы являются признанным этиологическим фактором злокачественных новообразований. По некоторым оценкам, около 15% всех опухолей у людей вызвано вирусами.
Роль вирусов в трансформации клеток различна. ДНК-содержащие вирусы кодируют вирусные онкобелки, необходимые для трансформации клеток, а ретровирусы несут онкогены, подобные онкогенам клеточного происхождения, или изменяют экспрессию клеточных белков, участвующих в регуляции клеточного деления.
Вирус Мейзона-Пфайзера (MPMV) является лимфотропным ретровирусом типа D, не содержащим онкогенов. Впервые он был выделен в 1970 г. из клеток карциномы молочной железы самки макаки - резус [1]. Затем были обнаружены фрагменты ДНК этого вируса в лимфоцитах детей, страдающих В-клеточной Беркитт-подобной лимфомой [2]. Позже было установлено, что анализируемые ДНК человека содержат длинные концевые повторы вируса (LTR), т.е. включают полную интегрированную копию генома МРМУ[3].
Известно, что полный геном провируса MPMV состоит из 8557 п.о. и содержит 3 LTR - два полных по 348 п.о. и один неполный длиной 328 п.о., расположенный после 5’LTR [4]. LTR являются важнейшими компонентами генома всех ретровирусов, т.к. они регулируют транскрипцию и интеграцию вирусного генома, а также содержат некоторые регуляторные последовательности. Кроме того, провирус имеет четыре открытые рамки считывания (open reading frames, ORF): gag (структурные белки), pro (вирусная протеа-за), pol (обратная транскриптаза и интеграза) и env (белки вирусной оболочки).
В связи с идентификацией компонентов генома ретровируса MPMV в лимфоцитах детей, страдающих Беркитт-подобными лимфомами , особый интерес представляет функциональная характеристика участков ДНК, выделенной из клеток крови этих больных, фланкирующих интегрированный геном ретровируса с целью выяснения возможного механизма онкогенной активноси вирусной вставки.
Материалы и методы исследования
Материалом для данной работы явилась нуклеотидная последовательность участка ДНК, фланкирующего LTR интегрированного генома ретровируса типа D Мейзона-Пфайзера, выделенная ранее из клеток периферической крови больного Беркитт-подобной В-клеточной лимфомой.
Поиск с применением NCBI BLAST.
Для поиска был использован BLAST® (Basic Local Alignment Search Tool — метод поиска локальных совпадений) - пакет программ, созданных для скрининга всех доступных библиотек нуклеотидных и аминокислотных последовательностей, при этом в качестве запроса могут выступать как белок, так и ДНК[5].
В первой части данной работы использовался нуклеотид - нуклеотидный BLAST для определения хромосомы, куда произошла вставка генома MPMV, по нуклеотидной последовательности участка ДНК, фланкирующего LTR интегрированного вируса. Формировался нуклеотидный запрос в FASTA-формате (описание на http://www.ncbi.nlm.nih.gov/BLAST/fasta.html), использовались стандартные настройки программы, поиск проводился по базам данных GenBank+EMBL+DDBJ t PDB, оценивались «хиты» с наиболее высокими баллами, свидетельствующими о статистической достоверности совпадения.
Также был использован транслированный BLAST, где аминокислотная последовательность сравнивается с данными баз нуклеотидных последовательностей, транслированных по всем 6 рамкам считывания. В нашем случае в качестве запроса были использованы пептиды, предсказанные GenScan. Этот вариант метода был применен для поиска известных мРНК, либо уже картированных генов. Был применен pairwise BLAST («попарный»), сравнивающий только две нуклеотидные или аминокислотные последовательности, заданные в FASTA-формате или посредством GI-номера.
Поиск с помощью GenScan.
Gen Scan представляет собой программу эвристического анализа геномной ДНК на наличие генных структур. Программа предсказывает сигналы сплайсинга пре-мРНК и сигналы полиаденилирования [6], на выходе получается карта проанализированного участка ДНК и аминокислотная последовательность спрогнозированных белков. Мы использовали GenScan для выявления экзонов каких-либо генов на участке хромосомы, прилегающем к точке интеграции провируса. Для запроса использовался полный сик-венс участка хромосомы из GenBank, найденный с помощью NCBI BLAS T.
Human Working Genome Draft
Эта программа состоит из двух частей: поисковой системы и геномного браузера. Первая - LJCSC BLAT — дает возможность определить точные координаты искомого участка на целой хромосоме. Полная нуклеотидная последовательность каждой хромосомы была получена путем анализа перекрываний более коротких просеквенированных участков генома человека из компьютерной базы GenBank.
Вторая часть - геномный браузер - предоставляет каргу любого участка требуемой хромосомы человека в нужном масштабе, где будут отмечены уже картированные гены, предсказания генов, contigs, мРНК, ESTs и др. [7]. Адрес в Интернете: http://genome.ucsc.edu/'.
Результаты и обсуждение
Были проанализированы 4 последовательности ДНК, обозначенные как Seq_19, Seq_23, Seq 16-20 и Seq 51, содержащие отрезок LTR интегрированного генома ретро-вируса Мейзона - Пфайзера и фланкирующий его участок геномной ДНК человека. Для определения хромосомы, в которую произошла интеграция генома MPMV, проводился анализ последовательностей посредством поиска по GenBank с помощью нуклеотид -нуклеотидного BLAST.
Для двух последовательностей (Seq 16-20 и Seq 51) сайты интеграции провируса в геном человека были определены однозначно и локализовались в 10-й и 17-й хромосомах человека соответственно.
Анализ Seq 19 и Seq_23 показал, что вставки, вероятнее всего, произошли в 7-ю и 2ю хромосомы, соответствен©, однако статистически значимые, но значительно более короткие и менее точные совпадения последовательностей имелись и на других хромосо-
мах. Интересно отметить, что по сравнению с нуклеотидной последовательностью участка 7-й хромосомы, имеющейся в базе GenBank, в нашей последовательности имеются два коротких участка замены (длиной 7 и 18 п.о.).
Длина каждой проанализированной последовательности, номера хромосом, в которые произошла интеграция, их описание по GenBank, длины совпадений и их координаты по Human Working Genome Draft представлены в табл. 1.
Для определения точки разрыва LTR вируса Мейзона-Пфайзера, произошедшего при его интеграции в геном человека, потребовалось применить попарный нуклеотидный BLAST. Сравнивались анализируемые последовательности с полным геномом ретровируса Мейзона-Пфайзера из GenBank (accession Ml2349, gi:334702).
Для последовательное гей Seq_19 и Seq_23 точка разрыва LTR MPMV локализовалась внутри участка U3 на уровне 27 нуклеотида от начала U3. Оба найденных участка LTR идентичны. Это последовательность использовавшегося для детекции вируса праймера AU3-234, комплементарного участку U3 MPMV. Разрыв LTR вируса для последовательности Seq 16-20 был также картирован внутри U3 на уровне 29-го нуклеотида от его начала. Этот участок LTR оказался на 2 п.о. короче, чем два предыдущих, в остальном же все три участка совпадали.
Таблица 1
Характеристика анализируемых последовательностей.
Последовательность Хромосома Данные GenBank Координаты no BLAT Примечания
номер длина Клон /gi Начало / конец
Seq 19 709 п.о. 7ql 1.22 RP11-421N 1015778772 65977828 65978262 2 замены длиной 7 и 18 п.о.; совпадения и на других хромосомах
Seq_23 710 п.о. 2ql2.3 RP11- 368F12 15145583 106429108 106429302 Присутствуют векторные последовательности; совпадения и на других хромосомах
Seq 16-20 291 п.о. 10q26.13 RP11-99L6 14970798 124823422 124823521
Seq 51 89 п.о. 17ql 1.2 HCIT542B2 2 3169206 30233706 30233756
Так как участков вирусного генома, кроме комплементарных использованному праймеру Аи3-234, в анализируемых последовательностях Seq 16-20, Seq 19 и Seq 23 найдено не было, можно сделать вывод о возможном миспрайминге при амплификации ДНК генома человека.
Для Бес]_5 1 точка разрыва последовательности провируса, возникшая при интеграции
в геном человека, локализовалась примерно на 18 п.о. ранее начала неполного Ш, т.е. совпадала с началом Ш, если бы он был полным. Таким образом, несмотря на замену части сиквенса Ш, произошедшую в результате некоего рекомбинационного события, этот LTR остается полностью функционально активным.
С’иквенс участков разрыва ЦТИ вируса каждой анализируемой последовательности предтавлен на рис. 1.
A. Seq 19 Chr. 7 U3 MPMV
485 gagcatcttttcatgtg tgtcttggc ctctgtttgctc 522
B. Seq 23 Chr, 2 U3 MPMV
101 acctcacgtgatcctcc tgtcttggcctctgtttgctc 64
C. Seq 16-20 U3 MPMV Chr. 10
39 tcttggcctctgtttgctc cctaca gtgagtcgtatt 75
D. Seq_ 51 Chr. 17 U3 MPMV
43 tactagtccctctac cccatgctc taccgact ggat 79
Рис. 1. Участки интеграции генома вируса Мейзона-Пфайзера в хромосомы человека: заглавными буквами показаны последовательности генома человека, курсивом - генома вируса, жирным - перекрывающиеся последовательности. Номера нуклеотидов указаны по длине вставки.
Поскольку анализируемые участки 2-й, 7-й, 10-й и 17-й хромосом с функциональной точки зрения не были охарактеризованы, проводился поиск вероятных кодирующих последовательностей ДНК человека в областях, прилегающих к сайту интеграции провируса MPMV. С этой целью были проанализированы нуклеотидные последовательности указанных участков программой GenScan. Предсказанные программой полипептиды использовались для поиска в GenBank соответствующих им описанных ранее мРНК (применялся транслированный BLAST). Полученные таким образом результаты сравнивались с данными Human Working Genome Draft.
Для Seq_ 16-20 результат подобного поиска оказался малоинформативным : известных мРНК, содержащих предсказанные программой экзоны, не найдено. Точка интеграции вируса Мейзона-Пфайзера картируется внутри интрона, предсказанного компьютерной программой гена NT 008902-28. Этот результат согласуется с данными Human Working Gemone Draft. Результаты анализа участков 7-й (для Seq_19) и 2-й (для Seq 23) хромосом, прилегающих к точке встраивания MPMV, также оказались малоинформативными. В соответствии с Human Working Genome Draft, интеграция провируса в 7-ю хромосому произошла в районе предполагаемого гена NT 007758.148, а во 2-ю хромосому - в области предполагаемого гена NT 005224.5.
Наиболее интересные результаты были получены при анализе сайта интеграции генома ретровируса Мейзона-Пфайзера в 17-ю хромосому (Seq_51). Программой GenScan на расстоянии около 1,5 тыс. нуклеотидов выше точки интеграции был предсказан ини-циаторный экзон, а в непосредственной близости от точки интеграции - внутренний эк-зон (рис. 2).
Далее, при сравнении полученного пептида с данными GenBank (транслированный BLAST), была найдена мРНК (GenBank accession AF244135, gi:7670835), соответствующая белку НСА-66 - hepatocellular carcinoma-associated antigen, т.е. антиген, ассоциированный с гепатоцеллюлярной карциномой (GenBank accession NP 060898, gi:8923722). По найденной мРНК стало возможным найти остальные экзоны гена НСА-66 на 17-й хромосоме. При этом оказалось, что между предсказанными GenScan имеется еще один экзон, а экзон, расположенный в области 1 14,3-114,4 килобаз, является не инициатор-ным, а тоже внутренним.
Рис. 2. Интр-экзонная структура гена ПСА-66 с вставкой MPMV.
По результатам поиска по Human Working Genome Draft на данном участке, кроме расположенного на (+ ) цепи ДНК гена, ассоциированного с гепатоцеллюлярной карциномой антигена, на (-) цепи локализован ген FLJ11040, а сайт интеграции попадает в область его обширного интрона. Карта гена НСА-66 на 17-й хромосоме со вставкой генома ретровируса Мейзона-Пфайзера показана на рис. 2, координаты даны по GenBank (Chr. 17 clone HCIT542B22, accession АС004253).
На момент написания данной работы функция белка НСА-66 (GenBank accession NM 060898, SwissProt accession Q9NYH9) еще не была охарактеризована. По данным SwissProt (http://www.expasy.ch/sprot/) белок НСА-66 (597 аминокислот) содержит 5 НАТ-повгоров по 32-34 остатка и состоит из двух доменов длинами 418 и 175 аминокислотных оснований, соединенных коротким линкером.
Был проведен поиск гомологичных белков, при этом оказалось, что значительной гомологией с НСА-66 обладают белок cmdrome Drosophila melanogaster, crn-белки других видов, в т.ч. cm-подобный белок человека, и swf4 Schizosaccharomyces pombe.
В аминокислотной последовательности белка crn drome - crooked neck protein плодовой мушки дрозофилы - также описаны 34-аминокислотные НАТ-повторы. Более того, потеря экспрессии сгп в зиготе приводила к дефекту пролиферации нейробластов и отсутствию, в дальнейшем, некоторых линий нейронов в центральной и периферической нервной системах. Эти и другие данные дают основание предполагать, что ст-белки участвуют в регуляции клеточного цикла [8]. Интересно, что участок белка НСА-66 (остатки 392-597, т.е. часть длинного и весь короткий домен) фигурирует в описании делении у больных нейрофиброматозом [9].
Белок swf4 дрожжей S. pombe., участвующий в регуляции клеточного цикла, также содержит НАТ-повторы и необходим для перехода клетки из G2 -фазы в фазу М. Также установлено, что swf4 участвует в сплайсинге пре-мРНК. В составе 40S-мультипротеинового комплекса наряду с другими swf-белками swf4 взаимодействует с белком cdc5, формируя часть сплайсосомы [10]. Учитывая функции гомологичных белков, есть основания предполагать, что белок НСА-66 может участвовать в регуляции клеточного цикла, i.e. являться клеточным онкогеном.
Поскольку интеграция генома MPMV произошла в области интрона перед экзоном гена НСА-66, вероятно, кодирующие последовательности гена НСА-66 не повреждены. Этот экзон кодирует часть второго (короткого) домена. Возможно, мощные энхансерные элементы в составе LTR вируса приводят к гиперэкспрессии НСА-66 и, как следствие,
нарушению регуляции клеточного цикла. Также вероятно, что промоторные элементы интегрированного провируса привели к образованию новой мРНК, у продукта трансляции которой отсутствовала большая часть второго домена. Изменение функции полученного белка могло иметь влияние на регуляцию клеточного цикла, однако для обоснования подобных предположений необходимы дальнейшие исследования функций белка НСА-66.
Таким образом, полученные нами результаты согласуются со схемой ретровирусного онкогенеза и являются существенным доводом в пользу возможного участия ретровируса типа Б Мейзона-Пфайзера в этиологии Беркитт-подобной лимфомы.
Литература.
1. Fine D., Schochetman G Type D primate retroviruses: a review. // Canccr Res. - 1978. - V, 38, № 10. - P. 3123-3139.
2. Ilyin К. V.. Kzhyshkowska J. G.. Imamova L.R. et.al. Type D retrovirus specific sequences in lymphocytes of the children witli Burkitt-type lymphoma and their parents. // Immunol Lett. - 2001. - V. 78, № 1. - P. 51-54.
3. Лебедев Ю.Б., Болорма В., Кжишковска ЮГ. и др. Интеграция генома ретровируса типа D Мейзона - Пфайзера в хромосому человека// Молекул биол. - 2002. -Т..36, №6. - С. 1012 - 1014 .
4. Sonigo, P., Barker, С., Hunter, Е.,et.al Nucleotide sequence of Mason-Pfizer monkey virus: an immunosuppressive D-type retrovirus. // Cell. - 1986. - V. 45, № 3. - P. 375-385.
5. Altschul S.F., Madden T.L., Schaffer A.A., et.al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. // Nucleic Acids Res. - 1997. - V. 25, № 17. - P. 3389-3402.
6. Burge С., Karlin S. Prediction of complete gene structures in human genomic DNA. // J. Mol. Biol. - 1997 V. 268. - P. 78-94.
7. Kent W. J.. Sugnet C. W.. Furey T. S. et.al. The Human Genome Browser at UCSC. // Genome Research. - 2002. -V. 12, №5. P. 996-1006.
8. Zhang K., Smouse D., Perrimon N. The crooked neck gene of Drosophila contains a motif found in a family of yeast cell cycle genes. // Genes Dev. - 1991. - V. 5, № 6. - P. 1080-1091.
9. Jenne D. E., Tinschert S., Stegmann E., et.al. A common set of at least 11 functional genes are lost in the majority of NF1 patients with gross deletions. // Genomics. - 2000. - V. 66. - P. 93-97.
10 McDonald W. II. Ohi It. Smelkova N.. et.al. Myb-related fission yeast cdc5p is a component of a 40S snRNP-containing complex and is essential for pre-mRNA splicing. // Mol. Cell. Biol. - 1999. - V. 19, № 8. - P. 5352-5362.
THE COMPUTER ANALYSIS OF THE TYPE D RETROVIRUS MASON-PFIZER INTEGRATION SITE
IN THE HUMAN CHROMOSOMS
G.I. MYANDTNA, 0.1. GURIANOVA, P.E. PYAGAI, A.V. ITKES
Department of Biology and General Genetics, Faculty of Medicine,
Peoples Friendship University of Russia, Moscow, 117198, Miklukho-Maklay str., 8.
Yu. B. LEBEDEV
Shemyakin and Ovchinnikov Institute of Bioorganic Chemistry, Russian Academy of Sciences, Moscow, 117997, Miklukho-Maklay str., 16/10.
The results of the computer analysis of the functional sites of human genome, where the integration of Meison-Pfizer virus (MPMV) was occurred, are presented. The regions of 2, 7, 10 and 17 chromosomes which, are nearby the points ol the MPMV integration site, have been characterized. The functional characteristic of the 17 chromosome’s region of retrovirus integration is presented and possible mechanism of oncogenic activity of virus insertion is suggested.
The possible association of Maison-Pfizer virus with B-cell Burkitt-like lymphoma development is discussed.
Key words: type D retrovirus Maison-Pfizer, retrovirus integration, viral oncogenesis, human chromosome.