Научная статья на тему 'Оценка внутривидовой изменчивости при анализе использования кодонов у различных подтипов ВКЭ'

Оценка внутривидовой изменчивости при анализе использования кодонов у различных подтипов ВКЭ Текст научной статьи по специальности «Биологические науки»

CC BY
65
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВИРУС КЛЕЩЕВОГО ЭНЦЕФАЛИТА / TICK-BORNE ENCEPHALITIS VIRUS / ПОКАЗАТЕЛЬ ОТНОСИТЕЛЬНОГО ИСПОЛЬЗОВАНИЯ СИНОНИМИЧНЫХ КОДОНОВ / RELATIVE SYNONYMOUS CODON USAGE VALUES / ДИСКРИМИНАНТНЫЙ АНАЛИЗ / DISCRIMINANT ANALYSIS / СТРАТЕГИЯ КОДИРОВАНИЯ БЕЛКОВ / STRATEGY OF PROTEIN CODING / МИКРОЭВОЛЮЦИЯ

Аннотация научной статьи по биологическим наукам, автор научной работы — Тюлько Жанна Сергеевна, Якименко Валерий Викторович

Вирус клещевого энцефалита, представлен тремя основными подтипами, имеющими широкое географическое распространение (дальневосточный, европейский, сибирский), и подтипами с ограниченным распространением (178-79 и 886-84). В этой работе была исследована стратегия использования синонимичных кодонов, как у основных подтипов, так и у отдельных геновариантов принадлежащих к дальневосточному и сибирскому подтипам. Для чего рассчитывались показатели относительного использования синонимичных кодонов, которые в дальнейшем изучались методами дискриминантного анализа. В итоге было показано различие в стратегиях кодирования не только между подтипами ВКЭ, но и между отдельными геновариантами, относящимися к одному и тому, же подтипу. Предполагается, что изменение стратегии кодирования аминокислот может быть начальным этапом микроэволюционного процесса у ВКЭ.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Тюлько Жанна Сергеевна, Якименко Валерий Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF THE CODON USAGE FOR THE EVALUATION OF INTRASPECIFIC VARIATION DIFFERENT TBEV-SUBTYPES

Three basic subtypes of a tick-borne encephalitis virus, have wide geographical spread (Far East, European and Siberian), and several have local spread (178-79 and 886-84). In this paper, we studied the strategy of synonymous codon usage in basic subtypes and in groups of strains of Siberian and Far East subtypes, by means calculation of relative synonymous codons usage values for each complete coding sequences of viruses and short E-coding sequences. Then, these values were analyzed by methods of the discriminant analysis. In result, were the conclusion about available distinctions in strategy of synonymous codons usage of various subtypes and various groups of strains tick-borne encephalitis viruses is made. It is assumed that a change in the amino acid coding strategy may be the initial stage in the TBEV microevolution process.

Текст научной работы на тему «Оценка внутривидовой изменчивости при анализе использования кодонов у различных подтипов ВКЭ»

Молекулярно-генетические исследования

т

рар Вера Александровна - кандидат биологических наук, научный сотрудник лаборатории молекулярной микробиологии Института химической биологии и фундаментальной медицины СО РАН, г. Новосибирск

Епихина тамара ивановна - младший научный сотрудник лаборатории молекулярной микробиологии Института химической биологии и фундаментальной медицины СО РАН, г. Новосибирск

Якименко Валерий Викторович - доктор биологических наук, заведующий лабораторией арбовирусных инфекций ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора

Малькова Марина Георгиевна - доктор биологических наук, доцент, главный научный сотрудник лаборатории арбовирусных инфекций ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора

танцев алексей Константинович - научный сотрудник лаборатории зоонозных инфекций ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора

Макенов Марат темирханович - кандидат биологических наук, старший научный сотрудник лаборатории арбовирусных инфекций ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора

Бондаренко Евгсний иванович - кандидат медицинских наук, научный сотрудник лаборатории ПЦР ЗАО «Вектор-Бест», г. Новосибирск

иванов Михаил Константинович - кандидат биологических наук, заведующий лабораторией ПЦР ЗАО «Вектор-Бест», г. Новосибирск

тикунова нина Викторовна - доктор биологических наук, доцент, заведующая лабораторией молекулярной микробиологии Института химической биологии и фундаментальной медицины СО РАН, г. Новосибирск

© Коллектив авторов, 2014 Статья поступила в редакцию 3 октября 2014 г.

УДК 577.21:578.833.26

ОЦЕНКА ВНУТРИВИДОВОЕ ИЗМЕНЧИВОСТИ ПРИ АНАЛИЗЕ ИСПОЛЬЗОВАНИЯ КОДОНОВ У РАЗЛИЧНЫХ ПОДТИПОВ ВКЭ

Тюлько Ж.С.1, Якименко В.В.2 Юмская государственная медицинская академия Министерства здравоохранения и социального развития Российской Федерации Россия, 644043, Омск, ул. Ленина, 12 2ФБУН "Омский НИИ природно-очаговых инфекций" Роспотребнадзора; лаборатория арбовирусных инфекций ОПОВИ Россия, 644080, г. Омск, просп. Мира, 7; mail@oniipi.org

Вирус клещевого энцефалита, представлен тремя основными подтипами, имеющими широкое географическое распространение (дальневосточный, европейский, сибирский), и подтипами с ограниченным распространением (178-79 и 886-84). В этой работе была исследована стратегия использования синонимичных кодонов, как у основных подтипов, так и у отдельных геновариантов принадлежащих к дальневосточному и сибирскому подтипам. Для чего рассчитывались показатели относительного использования синонимичных кодонов, которые в дальнейшем изучались методами дискриминантного анализа. В итоге было показано различие в стратегиях кодирования не только между подтипами ВКЭ, но и между отдельными геновариантами, относящимися к одному и тому, же подтипу. Предполагается, что изменение стратегии кодирования аминокислот может быть начальным этапом микроэволюционного процесса у ВКЭ.

Ключевые слова: вирус клещевого энцефалита; показатель относительного использования синонимичных кодонов; дискриминантный анализ; стратегия кодирования белков, микроэволюция.

ISSN 2221-7711 HaqwoHajibHbie npnopmeTbi Poccmm. 2014. № 3 (13)

ANALYSIS OF THE CODON USAGE FOR THE EVALUATION OF INTRASPECIFIC VARIATION

DIFFERENT TBEV-SUBTYPES.

Joanna S. Tyulko, Valeriy.V. Yakimenko *SBEI HE "Omsk State Medical Academy" 2Omsk Research Institute of natural focal infections

Three basic subtypes of a tick-borne encephalitis virus, have wide geographical spread (F ar East, European and Siberian), and several have local spread (178-79 and 886-84). In this paper, we studied the strategy of synonymous codon usage in basic subtypes and in groups of strains of Siberian and Far East subtypes, by means calculation of relative synonymous codons usage values for each complete coding sequences of viruses and short E-coding sequences. Then, these values were analyzed by methods of the discriminant analysis. In result, were the conclusion about available distinctions in strategy of synonymous codons usage of various subtypes and various groups of strains tick-borne encephalitis viruses is made. It is assumed that a change in the amino acid coding strategy may be the initial stage in the TBEV microevolution process.

Keywords: tick-borne encephalitis virus; relative synonymous codon usage values; discriminant analysis; strategy of protein coding

Введение. Вирус клещевого энцефалита, представитель семейства РНК-вирусов Flaviviridae, эндемичен для многих стран Евразии, где периодически наблюдается заметный рост заболеваемости. Результаты исследований подтвердили политипичность возбудителя клещевого энцефалита (ВКЭ), который подразделяют на три основных (1 - дальневосточный, 2 - европейский и 3 - сибирский) подтипа, каждый из которых характеризуется широким ареалом, и как минимум двух подтипов (4-й тип 178_79 и 5-й тип 886_84), локально распространенных в Прибайкалье [2; 6]. В рамках каждого подтипа, за последние годы, выделено несколько геновари-антов вируса, и вероятно, дальнейшие исследования увеличат их число, так как, максимальное различие между кодирующими нуклеотидными последовательностями разных подтипов первоначально оцениваемое в 5-6 % [6], по мере выявления новых геновариантов ВКЭ увеличилось до 20 %. В связи с чем, был даже поставлен вопрос о квалификации основных подтипов в качестве самостоятельных видов вирусов [2].

Механизмы меж- и внутривидовой дивергенции вирусов не всегда очевидны и достаточно сложны для понимания и обнаружения. В случае РНК-геномных вирусов, их изменчивость определяется не только естественным отбором, действующим на формирование аминокислотных последовательностей вирусных белков (возникновение несинонимичных нуклеотидных замен), но и существованием структурных требований, задаваемых вторичной и третичной структурами вирусной РНК (возникновение как синонимичных, так и несинонимичных нуклеотидных замен). Поэтому важное значение имеет изучение закономерностей возникновения в геноме вируса синонимичных нуклеотидных замен. Подобные

закономерности невозможно правильно оценить без привлечения многомерных статистических методов и автоматизации анализа, проводимого для большого числа геномных последовательностей вируса. Сейчас, эти исследования стали возможными и необходимыми вследствие значительного увеличения количества секвенирован-ных нуклеотидных последовательностей ВКЭ. Наиболее подходящими для этого являются полногеномные последовательности.

Дискриминантный анализ позволяет изучать различия между двумя и более группами объектов (нуклеотидных последовательностей) по нескольким переменным (показателям относительного использования синонимичных кодонов) одновременно [3; 4], а также интерпретировать межгрупповые различия и определять вклад каждой переменной при классификации объектов. Используя его, мы ранее выявили по полноразмерным последовательностям каждого подтипа ВКЭ, различия в их стратегии кодирования, т. е. не одинаковое использование синонимичных кодонов (в печати). Этот результат позволяет предположить, что отбор конкретных синонимичных кодонов может быть важной частью процесса микроэволюции ВКЭ, который отражается в структуре филогении вируса и поэтому требует дальнейших исследований. Кроме того, сравнительно небольшой объем подборки имевшихся полноразмерных нуклеотидных последовательностей не позволял протестировать ограничения и применимость данного метода для классификации вирусных геномов и их фрагментов, что предполагалось выполнить в дальнейшем.

Цель исследования - сравнение стратегий кодирования у различных геновариантов в пределах каждого подтипа ВКЭ и оценка границ применимости дискриминантного анализа для

Молекулярно-генетические исследования

классификации нуклеотидных последовательностей, как полноразмерных, так и их фрагментов.

Материалы и методы. Кроме полноразмерных кодирующих последовательностей ВКЭ-114 последовательностей, доступных на май 2014 г., нами использовались гомологичные фрагменты генома - 407 последовательностей длиной не менее 1200 нуклеотидов, что определяется требованиями к получению достоверных данных анализа. В качестве таких фрагментов, были выбраны участки генома, кодирующие оболочечный гли-копротеин E, наиболее полно исследованный и представленный в генетических банках данных. Он отвечает за сборку вириона, слияние мембран и рецепторное связывание [5].

Для всех кодирующих последовательностей рассчитывались показатели относительного использования синонимичных кодонов, обозначаемые как RSCUk (Relative Synonymous Codon Usage), для каждого кодона k (стоп кодоны и ко-доны, кодирующиеся только одним триплетом, не рассматривались). Показатель RSCUk применяют для проведения корректных сравнений частот использования синонимичных кодонов в различных сериях [1; 7; 8; 9]. Он оценивает неслучайность появления кодона k при кодировании аминокислоты, а также позволяет сравнить схемы кодирования в разных генах. Большие значения RSCUk соответствуют более частому использованию кодона. Показатели RSCUk были получены с помощью программ, созданных на базе пакета статистического анализа R. Далее, значения показателей RSCUk для всех типов кодонов нук-леотидной последовательности каждого вируса сравнивалась с помощью модулей «Групповой анализ» (cluster analysis) и «Общее модели дис-криминантного анализа» (general discriminant analysis) программы STATISTICA 6.

Результаты и обсуждение. Кластерный анализ для рассчитанных значений RSCUk, проведенный как по полноразмерным последовательностям ВКЭ, так и по участкам генома, кодирующим белок Е показал, что в пределах одного подтипа наблюдается большее сходство в использовании синонимичных кодонов, чем между разными подтипами ВКЭ, независимо от способа изоляции штамма вируса, что подтверждает данные, полученные нами ранее. При этом метод оказался достаточно чувствительным, чтобы выявить некоторые специфические различия в использовании кодонов также при сравнении геновариантов, относящихся к одному и тому же подтипу (в случае 1-го и 3-го подтипов). Таким образом, он может эффективно применяться для анализа внутривидовой изменчивости не только в случае использования полноразмерных

последовательностей, но и их фрагментов длиной >1000 нуклеотидов.

С помощью дискриминантного анализа значений RSCUk мы изучили значимость различий в использовании каждого кодона (Табл.1) и их вклад при классификации последовательностей.

Таблица 1

Значимость использования отдельных кодонов для классификации с помощью дискриминантного анализа

Полноразмерные Короткие фрагменты, кодирующие белок E

последовательности

Амино- Значимые не значи- Значимые не значи-

кислота для классификации мые для классификации для классификации мые для классификации

Lys aaa aag aaa aag

Asn aat aac aat aac

Ile ata, att atc ata, att atc

Thr aca, act, acc, - aca, act, acc, acg

acg acg

Arg aga, cga, cgt, - aga, cga, cgt, cgg

cgc, cgg, agg cgc

Tyr tat tac tat tac

Leu tta, ttg, cta, ctt, ctc, ctg - tta, ttg, cta, ctt, ctc ctg

Phe ttt, ttc ttt, ttc

Ser agt, agc, tca, tct, tcc, tcg - agt, agc, tca, tct, tcc tcg

Cys tgt tgc tgt tgc

Gln caa cag caa cag

His cat cac cac cac

Pro cca, cct, ccc ccg cca, cct, ccc ccg

Glu gaa gag gaa gag

Asp gat gac gat gac

Val gta, gtt, gtc gtg gta, gtt, gtc gtg

Ala gca, gct, gcc, - gca, gct, gcc gcg

gcg

Gly gga, ggt, ggc, ggg - gga, ggt, ggc ggg

Эта таблица построена по рассчитанным значениям стандартизованных коэффициентов канонических дискриминантных функций, которые позволяют оценить, как вклады, так и направления вкладов от присутствия конкретных кодонов в каждую каноническую функцию [4]. Жирным шрифтом выделены те аминокислоты у которых все кодоны имеют очень близкие значения стандартизованных коэффициентов, т.е. их значимость для классификации в основном есть следствие того, что они являются специфичными для определенных генотипов. Поэтому, полученный результат отражает, как действие отбора, проявляющееся на аминокислотном уровне, так и наличие определенных стратегий кодирования, приводящих к различному частотному использованию синонимичных кодонов разными группами вирусов без анализа причин их возникновения. Различия в данных, представленных в таблице, для полноразмерных и коротких последовательностей вероятнее всего объясняются

ISSN 2221-7711 Национальные приоритеты России. 2014. № 3 (13)

недостаточной длиной выбранных фрагментов, так как при анализе выборки из более протяженных последовательностей захватывающих участок, кодирующий Е (близкий к размеру структурной части генома), эти различия минимизировались.

Примечательно, что использование тех же самых кодонов оставалось значимым для классификации последовательностей, как при сравнительном анализе различных подтипов ВКЭ, так и при анализе отдельных геновариантов в рамках одного и того же подтипа (были проанализированы дальневосточный и сибирский подтипы), менялись только значения стандартизованных коэффициентов, которыми в нашем исследовании описывалась изучаемая стратегия кодирования.

Наличие внутри подтипа отличной от других геновариантов стратегии кодирования аминокислот может быть началом микроэволюционного процесса, приводящего к выделению новых подтипов ВКЭ. С этой точки зрения становится более интересной характеристика, которая была

дана подтипам 4 и 5 «...штамм 178-79, имеющий собственный, отличный от других генотипов вируса КЭ набор нуклеотидов в составе изученного фрагмента РНК, по аминокислотной последовательности идентичен генотипу 1.», штамм 886-84 тоже обладает свойством самостоятельного генотипа при анализе нуклеотидных последовательностей и при рассмотрении его аминокислотной последовательности в отдельных позициях проявляет сходство с другими подтипами [2].

Существующая сложная система РНК-РНК и РНК-белковых взаимодействий, а также взаимодействия с организмом хозяина ограничивают и направляют микроэволюцию вирусных популяций. Это может приводить к формированию вариантов вируса, отличающихся устойчивостью в процессах отбора при различных условиях существования. Менее устойчивые в действующих условиях вымываются из вирусной популяции, в то время как самые устойчивые встречаются в данных условиях наиболее часто и классифицируются как наиболее распространенные.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Бутвиловский А.В. Изучение стратегии кодирования белков / А.В.Бутвиловский, В.Э. Бутвиловский, Е.А.Черноус // Медицинский журнал. - 2009. - (2). -С. 24-27.

2. Вотяков В.И. Клещевые энцефалиты Евразии (вопросы экологии, молекулярной эпидемиологии, нозоологии, эволюции) / В.И. Вотяков, В.И. Злобин, Н.П. Мишаева. - Новосибирск: Наука, 2002. - 438 с.

3. Орлов А.И. Прикладная статистика: учебник. - М.: Экзамен; 2006.

4. Халяфян А.А. Учебник STATISTIKA 6. Статистический анализ данных. - М.: Бином, 2007.

5.Chambers T.J. Flavivirus genome organization, expression and replication/ T. J.Chambers, C.S.Hahn, R.Galler, C.M.Rice // Ann. Rev. Microbiol. - 1990. -Vol. 44. - P. 649-688.

6. EckerM. Sequence analysis and genetic classification of tick-borne encephalitis viruses from Europe and Asia / M. Ecker, S.L. Allison, T. Meixner, F.X. Heinz // Journal of General Virology. - 1999. - Vol.80. -P. 179-185.

7. Perriere, G. Use and misuse of correspondence analysis in codon usage studies/ G.Perriere, J.Thioulouse // Nucleic Acids Research. - 2002. - Vol. 30 (20). - P. 4548-55.

8. Sharp P.M. Codon usage in yeast cluster-analysis clearly differentiates highly and lowly expressed genes / P.M. Sharp, T.M. F.Tuohy, K.R. Mosurski // Nucleic Acids Research. - 1986. - Vol.14. - P. 5125-5143.

9. Qian W. Balanced Codon Usage Optimizes Eukaryotic Translational Efficiency / W. Qian, J-R. Yang, N.M. Pearson, C. Maclean, J. Zhang // PLoS Genet. - 2012. - Vol. 8 (3). URL: http://www.plosgenetics.org/article/info %3Adoi%2F10.1371%2Fjournal.pgen.1002603.

тюлько жанна Сергеевна - канд. биол. наук, доцент кафедры физики, математики, медицинской информатики ОмГМА. Якименко Валерий Викторович - доктор биологических наук; зав. лабораторией арбовирусных инфекций отдела природ-но-очаговых вирусных инфекций ФБУН «Омский НИИ природно-очаговых инфекций» Роспотребнадзора; старший научный сотрудник.

© Ж.С. Тюлько, В.В. Якименко, 2014 Статья поступила в редакцию 7 октября 2014 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.