Научная статья на тему 'ИЗУЧЕНИЕ ВИРУСОПОДОБНЫХ ЭЛЕМЕНТОВ В ГЕНОМЕ ХВОЙНЫХ НА ОСНОВАНИИ ДАННЫХ ВЫСОКОПРОИЗВОДИТЕЛЬНОГО СЕКВЕНИРОВАНИЯ'

ИЗУЧЕНИЕ ВИРУСОПОДОБНЫХ ЭЛЕМЕНТОВ В ГЕНОМЕ ХВОЙНЫХ НА ОСНОВАНИИ ДАННЫХ ВЫСОКОПРОИЗВОДИТЕЛЬНОГО СЕКВЕНИРОВАНИЯ Текст научной статьи по специальности «Биологические науки»

CC BY
13
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВИРУСОПОДОБНЫЕ ГЕНЕТИЧЕСКИЕ ЭЛЕМЕНТЫ / РЕТРОТРАНСПОЗОНЫ / ВЫСОКОПРОИЗВОДИТЕЛЬНОЕ СЕКВЕНИРОВАНИЕ / ХВОЙНЫЕ

Аннотация научной статьи по биологическим наукам, автор научной работы — Рубель И.Э., Баранов О.Ю., Пантелеев С.В., Разумова О.А., Гущин В.А.

В статье описывается разнообразие вирусоподобных генетических элементов хвойных. Данные для последующего анализа и поиска вирусоподобных последовательностей в растительном геноме были получены в результате высокопроизводительного секвенирования на основе полупроводниковой детекции протонов (технология Ion Torrent). Был аннотирован ряд последовательностей, имеющих сходство с ранее описанными вирусоподобными генетическими элементами. Среди них - ретротранспозоны групп Ty3/gypsy и Ty1/copia, содержащие длинные концевые повторы (LTR) и широко встречающиеся в геноме ели, а также ретротранспозоны, не содержащие LTR и относящиеся к семейству LINE.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Рубель И.Э., Баранов О.Ю., Пантелеев С.В., Разумова О.А., Гущин В.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH OF THE VIRUS-LIKE ELEMENTS IN THE GENOME OF CONIFERS BASED ON THE NEXT-GENERATION SEQUENCING DATA

This article describes a variety of virus-like genetic elements of conifers. Data for later analysis and search of the virus-like sequences in the plant genome were obtained by next-generation sequencing based on the semiconductor detection of protons (Ion Torrent technology). A series of sequences with similarity to the previously described viruslike genetic elements was annotated. We have identified the long terminal repeat (LTR)-containing retrotransposons belonging to the Ty3/gypsy and Ty1/copia families, that are ubiquitous throughout the spruce genome, and non-LTR retrotransposons belonging to the LINE family.

Текст научной работы на тему «ИЗУЧЕНИЕ ВИРУСОПОДОБНЫХ ЭЛЕМЕНТОВ В ГЕНОМЕ ХВОЙНЫХ НА ОСНОВАНИИ ДАННЫХ ВЫСОКОПРОИЗВОДИТЕЛЬНОГО СЕКВЕНИРОВАНИЯ»

УДК 578.5:578.89

И.э. Рубель1, О.ю. Баранов1, С.В. Пантелеев1, О.А. Разумова1, В.А. Гущин2, В.В. Макаров2

ИЗУЧЕНИЕ ВИРУСОПОДОБНЫХ ЭЛЕМЕНТОВ В ГЕНОМЕ ХВОЙНЫХ НА ОСНОВАНИИ ДАННЫХ ВЫСОКОПРОИЗВОДИТЕЛЬНОГО

СЕКВЕНИРОВАНИЯ (Краткое сообщение)

1Институт леса HAH Беларуси Республика Беларусь, 246001, г. Гомель, ул. Пролетарская, 71; e-mail: illiarubel@yahoo.com

2HИИ физико-химической биологии имени A.H. Белозерского МГУ имени М.В. Ломоносова Россия, 119234, г. Москва, ул. Ленинские горы, 1, стр. 12

В статье описывается разнообразие вирусоподобных генетических элементов хвойных. Данные для последующего анализа и поиска вирусоподобных последовательностей в растительном геноме были получены в результате высокопроизводительного секвенирования на основе полупроводниковой детекции протонов (технология Ion Torrent). Был аннотирован ряд последовательностей, имеющих сходство с ранее описанными вирусоподобными генетическими элементами. Среди них - ретротранспозоны групп Ty3/gypsy и Ty1/copia, содержащие длинные концевые повторы (LTR) и широко встречающиеся в геноме ели, а также ретротранспо-зоны, не содержащие LTR и относящиеся к семейству LINE.

Ключевые слова: вирусоподобные генетические элементы, ретротранспозоны, высокопроизводительное секвенирование, хвойные.

Введение

Трудно переоценить значение хвойных древесных растений как для хозяйственной деятельности человека, так и для биосферы в целом. Древесные растения, как важнейшая часть леса, выполняют ряд функций: сырьевую, санитарно-гигиеническую, климато-, почво-, гидросферо- и биотопреобразующую и т.д. В целом, все многообразие значений можно свести к трем основным группам: 1) древесина (различного качества для разных целей) и ее производные; 2) прочие продукты древесных растений (кора, листья и хвоя, цветки и их части, плоды, семена); 3) естественный защитный фактор и природная среда, благоприятная для жизни, место обитания для многих видов фауны [1].

В связи с этим, всегда остается актуальной проблема сохранения, рационального многоцелевого использования и восстановления древесных насаждений. Особую значимость решению этих вопросов придает также возрастающая антропогенная нагрузка, вследствие чего снижается способность растений противостоять инфицированию фитопатогенами, в том числе и вирусами [2].

Вирусы растений играют значительную негативную роль в лесном хозяйстве. Они, наряду с грибами и бактериями, являются возбудителями инфекционных заболеваний, способны значительно ослабить растение, ухудшить его хозяйственно-ценные признаки [3]. Однако, по сравнению с другими возбудителями инфекционных заболеваний, вирусы растений (особенно древесных видов) изучены слабо.

Вирусоподобные генетические элементы (ВГЭ) представляют собой нуклеотидные последовательности, интегрированные в геномную ДНК растительных клеток и имеющие участки (локусы), гомологичные определенным вирусным генам.

Наиболее распространенным типом ВГЭ в геноме как хвойных, так и растений в целом, являются ретротранспозоны [4, 5], которые, согласно современным представлениям, имеют общего предшественника с ретрови-русами [6, 7]. Ретротранспозоны относятся к мобильным генетическим элементам I типа. С эволюционной точки зрения, они появились в результате встраивания вирусной кДНК в геном клетки-хозяина и последующей утраты инфекционных свойств, например, вследствие

мутаций или делеции гена env у ретровирусов, кодирующего гликопротеин оболочки, необходимый для инфицирования и проникновения через цитоплазматическую мембрану [8]. Впоследствии могло происходить дальнейшее накопление изменений в нуклеотидной структуре различных локусов. Вместе с тем, вирусоподобные генетические элементы способны автономно реплицироваться, транскрибироваться и встраиваться в геном растения в новых участках по механизму транспозиции [8]. Таким образом, основное отличие ВГЭ от вирусов - неспособность инфицировать другие растения.

Однако, несмотря на утрату инфекционных свойств, вирусоподобные генетические элементы имеют существенное негативное значение для лесного хозяйства, поскольку результатом их транспозиции могут стать различные нарушения структурно-функциональной организации генома: инсерции, приводящие к образованию транскрипционных разрывов в экзонных участках генов растения или увеличению размеров интронов, а также делеции и транслокации. Это является причиной возникновения нежелательных фенотипических эффектов [9]. ВГЭ являются также одной из причин возникновения выраженной инбред-ной депрессии у хвойных.

В связи с этим, изучение разнообразия вирусоподобных генетических элементов в геноме хвойных представляет определенный интерес.

Материалы и методы

Исходным материалом являлись образцы растительных тканей 40-летних деревьев сосны обыкновенной (Pinus sylvestris L.) и ели европейской (Picea abies (L.) H.Karst.), произрастающих на территории ГЛХУ «Гомельский лесхоз». На начальном этапе исследований проводилось выделение суммарной ДНК модифицированным СТАВ-методом и суммарной РНК при помощи набора реагентов GeneJET Plant RNA Purification Mini Kit (Thermo Scientific). Для последующего создания ДНК-библиотек все образцы РНК были переведены в стабилизированную форму в виде кДНК.

Библиотеки ДНК-фрагментов для последующего секвенирования готовили согласно протоколу фирмы-производителя с использованием набора реактивов Ion Plus Fragment Library

Kit (Ion Torrent - Life Technologies). Шесть библиотек были получены с использованием суммарной ДНК сосны обыкновенной и три -с использованием кДНК, синтезированной на матрице суммарной РНК ели европейской. При подготовке библиотек также использовался набор реагентов Ion Library Equalizer Kit, благодаря чему их ожидаемая концентрация должна составлять -100 pM.

Качество библиотек фрагментов проверяли с применением методов электрофоретического фракционирования, спектрофотометрии и ПЦР в режиме реального времени (Real-time PCR).

ПЦР проводили на амплификаторе Strata-gene Mx3000P (Agilent Technologies) c использованием готовой смеси Maxima SYBR Green/ ROX qPCR Master Mix (Thermo Scientific) и праймеров для амплификации библиотек Library Amplification Primer Mix из набора Ion AmpliSeq Library Kit 2.0 (Ion Torrent - Life Technologies). Данные эксперимента были представлены в виде графика зависимости интенсивности флуоресценции от количества прошедших циклов ПЦР, при этом резкое возрастание интенсивности флуоресценции началось с 6-10 цикла, что свидетельствует о достаточной концентрации исходных библиотек.

С целью установления соответствия реального размера полученных библиотек рекомендованному (согласно протоколу E-Gel Size Select Agarose Gels Quick Reference) был проведен электрофоретический анализ. Для него использовался 2%-ный агарозный гель на основе ТВЕ-буфера, а напряженность электрического поля составляла 6 В/см. Гель окрашивался бромистым этидием, оценку данных проводили визуально при помощи УФ-трансиллюминатора. Проведенное электрофоретическое фракционирование выявило отсутствие деградации ДНК в препаратах. Было установлено, что амплифици-рованные фрагменты библиотек имеют размер более 300, но менее 400 п.н., что соответствует ожидаемому значению, приведенному в протоколе фирмы-производителя (-330 п.н.). Фрагменты размером около 600 п.н., которые также были обнаружены в ходе визуального анализа, являлись конкатемерами, образовавшимися в ходе ПЦР.

Был проведен спектрофотометрический анализ библиотек для секвенирования, который показал, что средняя концентрация получен-

ных препаратов нуклеиновых кислот библиотек находилась в пределах 4,5-7,5 нг/мкл образца. Соотношение экстинкций А260/А280 находилось в диапазоне 1,83-2,10, что указывает на высокую степень очистки препаратов ДНК.

Далее готовили матрицу для секвенирова-ния с использованием полученных библиотек. Секвенирование выполнялось на полногеномном анализаторе Ion PGM System (Life Technologies). Все этапы подготовки проводили в соответствии с инструкцией фирмы-производителя, с использованием наборов реагентов, поставляемых вместе с оборудованием.

Подготовленные библиотеки использовались в качестве матрицы для эмульсионной ПЦР, которая осуществлялась при помощи специального амплификатора Ion OneTouch 2 System и комплекта реактивов Ion PGM Template OT2 200 Kit (Life Technologies). При эмульсионной ПЦР амплификация происходит внутри капелек водной фазы, эмульгированной в инертном жидком масле. Внутри капельки находится твердофазный носитель сферической формы, имеющий поверхностный заряд и обладающий гидрофильными свойствами (Ion Sphere Particles). На его поверхности также иммобилизованы короткие последовательности ДНК, комплементарные концевым адаптерным участкам библиотек. В идеальном случае количество ДНК-фрагментов библиотек приблизительно равно количеству этих сферических частиц, и на поверхности каждой частицы, окруженной водной фазой, амплифи-цируется только один фрагмент. Таким образом, получаются моноклональные микросферы. Этот этап необходим для иммобилизации фрагментов библиотек и усиления сигнала в ходе последующего секвенирования.

На следующем этапе проводили отмывку микрочастиц, не несущих амплифицирован-ной ДНК (стадия обогащения). Данная операция осуществлялась с использованием системы автоматической пробоподготовки Ion OneTouch ES и наборов реагентов Ion PGM Template OT2 Solutions 200 Kit, Ion PGM Enrichment Beads (Life Technologies).

Секвенирующая реакция протекала на чипе Ion 314 Chip v2. Финальную пробоподготовку и загрузку чипа проводили в соответствии с протоколом фирмы-производителя.

Первичная обработка данных, поступающих от геномного анализатора Ion PGM System, осуществлялась в автоматическом режиме при помощи программного обеспечения Ion Torrent Suite, поставляемого вместе с оборудованием.

Результаты и обсуждение

В результате первичного анализа были получены следующие показатели для различных образцов: плотность загрузки чипа - от 60 до 92%, доля моноклональных микросфер -70-87%, доля пустых микросфер - 1-5%, а большая часть полученных прочтений (reads) имела длину от 206 до 269 п.н.

Количество полученных в результате сек-венирования парноконцевых чтений варьировалось от 695 467 до 923 775. Оценка качества полученных последовательностей, а также удаление из сиквенсов последовательностей праймеров и адаптеров осуществлялись автоматически в ходе постобработки первичных данных программным комплексом Ion Torrent Suite. Из массива данных удалялись последовательности короче 20 п.н., а также с показателем качества Q < 20 (т.е. с вероятностью ошибки секвенирования более 1%). Таким образом, для каждого образца было получено 273 181-394 954 высококачественных парноконцевых чтений или 45,3-65,1 млн п.н.

Сборка парноконцевых чтений в протяженные последовательности (контиги) осуществлялась при помощи программы DNASTAR SeqMan NGen 12. Для различных библиотек число полученных контигов составляло от 13 711 до 27 712.

Поиск перспективных последовательностей для дальнейшего анализа проводился путем сопоставления всех контигов с последовательностями базы данных GenBank [10] с использованием программного комплекса BLAST, размещенного на этом сервере [11], при этом поиск осуществлялся по базе данных нуклео-тидных последовательностей (nucleotide blast), а в качестве определяющего параметра поиска с целью расширить выборку была выбрана опция «поиск по частичному сходству» (somewhat similar sequences (blastn)).

В результате был выявлен 81 контиг - потенциальные кандидаты в вирусы и вирусоподобные генетические элементы.

Предварительно стоит отметить, что ретро-транспозоны подразделяются на две группы: элементы, содержащие длинные концевые повторы (long terminal repeat - LTR), и элементы, не содержащие их [12, 13]. Среди последних различают длинные диспергированные повторы (LINE - long interspersed elements) и короткие диспергированные повторы (SINE - short interspersed elements) [14]. В свою очередь, среди всех ретротранспозонов в геномах эука-риот наибольшее распространение получили мигрирующие генетические элементы, содержащие длинные концевые повторы.

Проведенный анализ выявил большое количество контигов, имеющих сходство с различными типами мигрирующих генетических элементов. При этом 74 из идентифицированных последовательностей относились к LTR-содержащим ретротранспозонам группы Ty3/ gypsy (семейство Metaviridae), а 2 контига - к группе Ty1/copia (Pseudoviridae).

Генетические элементы этих двух групп имеют общий план строения [8]. Они фланкированы прямыми повторами ДНК клетки-хозяина, имеющими размер пять нуклеотидов и образовавшимися в результате интеграции элемента. Эти ретротранспозоны содержат два длинных концевых повтора (LTR), которые, в свою очередь, имеют по краям короткие инвертированные повторы. Между LTR находится внутренний домен генетического элемента, который кодирует вирусный полипротеин и содержит следующие гены: 1) Gag - белок субъединицы капсида; 2) Ap - аспартатпротеи-наза, осуществляющая гидролиз полипротеина на отдельные функциональные белки; 3) In -интеграза (фермент, обеспечивающий вставку кДНК-копии в геном хозяина); 4) Rt - обратная транскриптаза, синтезирующая кДНК на матрице вирусной РНК; 5) Rh - РНКаза Н, ги-дролизует РНК в составе гибридной молекулы РНК-ДНК, что позволяет достроить вторую цепь кДНК.

Помимо этого, в составе ретротранспозонов имеются сайт связывания праймера (PBS) и полипуриновый тракт (PPT), которые отвечают, соответственно, за инициализацию синтеза (-)-цепи и (+)-цепи кДНК.

Различия между LTR-содержащими ретро-транспозонами групп Gypsy и Copia заключаются лишь в положении домена In по отно-

шению к другим генам. Последовательности доменов у генетических элементов группы Gypsy (в направлении от 5' - к З'-концу): Gag, Ap, Rt, Rh, In. Для группы Copia: Gag, Ap, In, Rt, Rh.

Также было выявлено 5 контигов, относящихся к ретротранспозонам семейства LINE, представляющих собой альтернативную группу мигрирующих генетических элементов, не содержащих в своей нуклеотидной структуре длинные концевые повторы.

Стоит обратить внимание, что наибольшая часть контигов (91%), идентифицированных как участки LTR-ретротранспозонов, относилась к семейству Ty3/Gypsy. Сравнивая результаты данного исследования с уже описанными в литературе, можно заметить, что большая распространенность ретроэлементов группы Ty3/Gypsy по сравнению с группой Ty1/Copia является характерной для хвойных. Таким образом, полученные данные коррелируют с результатами, опубликованными международным научным коллективом по полногеномному секвенированию ели европейской. Согласно этим сведениям, доля в геноме LTR-содержащих ретротранспозонов групп Gypsy и Copia составляет 35% и 16% соответственно, а элементов LINE - 1% [15].

Также следует отметить, что все выявленные последовательности являлись уникальными, что указывает на их самостоятельность. При этом большая часть ретротранспозонов ели европейской содержала последовательности различных генов первичного и вторичного метаболизма: 3-каренсинтетазы, (-)энт-каурен-синтетазы, цитохрома P450 подсемейства CYP720B и др., что может указывать на их определенную роль в формировании адаптивной изменчивости хвойных. К сожалению, в настоящее время нет опубликованных данных других авторов, которые бы подтверждали эту гипотезу. Тем не менее, согласно имеющимся литературным источникам по данной теме, для хвойных характерны очень протяженные интроны и большое число псевдогенов, образовавшиеся в результате инсерций мобильных генетических элементов в гены хвойных в ходе эволюции их генома. Отдельные гены у них также разделены длинными некодирую-щими последовательностями ДНК, богатыми транспозонами и имеющими низкую частоту

рекомбинации. По мнению авторов, причина вышеописанного явления заключается в том, что молекулярные механизмы элиминации мигрирующих элементов (например, посредством неравной рекомбинации) у хвойных менее активны, чем у большинства других организмов [15]. Таким образом, ретротран-спозоны играют существенную роль в организации генома хвойных.

Заключение

Используя метод высокопроизводительного секвенирования на основе полупроводниковой детекции протонов (технология Ion Torrent), было проведено секвенирование ДНК-и кДНК-библиотек ели европейской и сосны обыкновенной. С целью изучения разнообразия вирусоподобных генетических элементов хвойных осуществили поиск и аннотацию последовательностей, имеющих сходство с уже описанными ВГЭ.

В результате была аннотирована 81 последовательность, среди них было выявлено сходство с LTR-содержащими ретротранспозонами групп Ty3/gypsy и Ty1/copia, описанных ранее для ели, а также ретротранспозонами, не содержащими LTR и относящимися к семейству LINE. При этом все выявленные последовательности оказались уникальными, а большая их часть содержала участки различных генов первичного и вторичного метаболизма хвойных, что может косвенно свидетельствовать об их роли в формировании адаптивной изменчивости растений.

Полученные результаты могут представлять интерес для генетики и селекции лесных древесных видов, расширить знания о вирусоподобных генетических элементах хвойных и их значении.

Исследования были выполнены при финансовой поддержке Белорусского республиканского фонда фундаментальных исследований (грант № Б15РМ-007).

Список использованных источников

1. Мелехов, И.С. Лесоводство / И.С. Мелехов. - 2-е изд., доп., испр. - М.: МГУЛ, 2003. - 320 с.

2. Федоров, Н.И. Лесная фитопатология: учебник для студентов специальностей «Лес-

ное хозяйство» / Н.И. Федоров. - Минск: БГТУ, 2004. - 462 с.

3. Forest disease caused by viruses / C. Büttner [et al.] // Infectious Forest Disease. - Croydon: CPI Group, 2013. - P. 60-74.

4. Copia-like retrotransposons are ubiquitous among plants / D.F. Voytas [et al.] // PNAS USA. - 1992. - Vol. 89. - P. 7124-7128.

5. Suoniemi, A. Gypsy-like retrotransposons are widespread in the plant kingdom / A. Suoniemi, J. Tanskanen, A.H. Schulman // Plant Journal. - 1998. - Vol. 13. - P. 699-705.

6. Xiong, Y. Origin and evolution of retro-elements based upon their reverse transcriptase sequences / Y. Xiong, T.H. Eickbush // EMBO Journal. - 1990. - Vol. 9. - P. 3353-3362.

7. Retrovirus phylogeny and evolution / R.F. Doolittle [et al.] // Curr. Top. Microbiol. Immunol. - 1990. - Vol. 157. - P. 1-18.

8. Schulman, A.H. The application of LTR retrotransposons as molecular markers in plants / A.H. Schulman, A.J. Flavell, T.H. Noel Ellis // Methods in Molecular Biology. - 2004. -Vol. 260. - P. 145-173.

9. Vandenbussche, M. TE-based Mutagenesis Systems in Plants / M. Vandenbussche, T. Gerats // Methods in Molecular Biology. - 2004. -Vol. 260. - P. 115-127.

10. The National Center for Biotechnology Information (NCBI) [Electronic resource]. -Mode of access: http://www.ncbi.nlm.nih.gov/ genbank/. - Date of access: 10.09.2016.

11. Basic Local Alignment Search Tool (BLAST) [Electronic resource]. - Mode of access: http://blast.st-va.ncbi.nlm.nih.gov/Blast. cgi - Date of access: 11.09.2016.

12. Grandbastien, M.-A. Retroelements in higher plants / M.-A. Grandbastien // Trends Genet. - 1992. - Vol. 8. - P. 103-108.

13. Bennetzen, J.L. The contributions of ret-roelements to plant genome organization, function and evolution / J.L. Bennetzen // Trends Microbiol. - 1996. - Vol. 4. - P. 347-353.

14. Schmidt, T. LINEs, SINEs and repetitive DNA: non-LTR retrotransposons in plant genomes / T. Schmidt // Plant Mol. Biol. - 1999. -Vol. 40. - P. 903-910.

15. The Norway spruce genome sequence and conifer genome evolution / B. Nystedt [et al.] // Nature. - 2013. - Vol. 497. - P. 579-584.

I.E. Rubel'1, o.Yu. Baranov1, S.V. panteleev1, o.A. Razumova1, V.A. Gushchin2, V.V. Makarov2

research of the virus-like elements in the genome of conifers based on the next-generation sequencing data

(Short report)

1The Institute of Forest of the National Academy of Sciences of Belarus Gomel BY-246001, Republic of Belarus 2A.N. Belozersky Institute Of Physico-Chemical Biology MSU Moscow, 119234, Russia

This article describes a variety of virus-like genetic elements of conifers. Data for later analysis and search of the virus-like sequences in the plant genome were obtained by next-generation sequencing based on the semiconductor detection of protons (Ion Torrent technology). A series of sequences with similarity to the previously described viruslike genetic elements was annotated. We have identified the long terminal repeat (LTR)-containing retrotransposons belonging to the Ty3/gypsy and Tyl/copia families, that are ubiquitous throughout the spruce genome, and non-LTR retrotransposons belonging to the LINE family.

Key words: virus-like genetic elements, retrotransposons, next-generation sequencing, conifers.

Дата поступления статьи 29 сентября 2016 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.