Научная статья на тему 'Полногеномное секвенирование - новый этап генетических исследований'

Полногеномное секвенирование - новый этап генетических исследований Текст научной статьи по специальности «Биологические науки»

CC BY
1448
182
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по биологическим наукам, автор научной работы — Ковалевич Александр, Падутов Владимир, Баранов Олег

Авторы на основании анализа повторяющихся последовательностей ДНК провели работу по выявлению и оценке соматических мутаций, возникающих в ходе генетической трансформации микроклональных линий берез и осин. В статье изложены результаты исследования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по биологическим наукам , автор научной работы — Ковалевич Александр, Падутов Владимир, Баранов Олег

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The full-genome sequencing as a new stage of genetic research

The authors give the results of the work on the somatic mutations found and analyzed in birch and aspen which enabled to get the experimental-industrial batches of the planting stock.

Текст научной работы на тему «Полногеномное секвенирование - новый этап генетических исследований»

Полногеномное секвенирование -новый этап генетических исследований

Интенсивное развитие молекулярно-генетических технологий за последние десятилетия обеспечило широкомасштабное внедрение методов ДНК-анализа в различные отрасли биологии и медицины. Среди основных областей приложения генетических методов при работе в лесной экосистеме можно выделить селекцию и семеноводство, популяционную биологию, тканевую и клеточную биотехнологию, таксономию, филогенетическую систематику, фитопатологию, генетическую экспертизу (в промышленных, юридических, археологических и других целях).

Александр Ковалевич,

директор Института леса НАН Беларуси, кандидат

сельскохозяйственных наук

Владимир Падутов,

заведующий лабораторией генетики и биотехнологии Института леса НАН Беларуси, член-корреспондент

Олег Баранов,

ведущий научный сотрудник Института леса НАН Беларуси, кандидат

биологических наук

Спектр задач, решаемых с помощью молекуляр-но-генетических маркеров в биологии леса, также является весьма существенным. Это типировка и паспортизация хозяйственно ценных генов, генотипов, индивидов, включая трансгенные растения; коммерческая сертификация; анализ генетического родства и происхождения особей, сортов, форм, насаждений; исследование генетической структуры популяций и ее динамики; изучение уровня генетического разнообразия видов. Благодаря таким маркерам можно установить филогенетические взаимоотношения видов, решать спорные вопросы таксономии, осуществлять диагностику вирусных, бактериальных и грибных инфекций, построить генетические карты и др.

Исходя из методологических принципов и подходов, ДНК-маркеры определяются как сборная группа методов,

основанная на качественной или количественной оценке генетического материала в анализируемых биологических образцах. При этом каждый вид маркера может быть охарактеризован по основным генетическим признакам: характеру наследования, механизму передачи, локализации в геноме и уровню изменчивости. Кроме того, выделяют и дополнительные лаборатор-но-диагностические критерии, такие как разрешающая способность анализа (минимальное число маркеров, необходимых для получения дискретных данных); ценовые и технологические аспекты (специальное оборудование, сложность выполнения работ, требования к квалификации персонала, время выполнения анализов, автоматизация работ). Сюда же относятся воспроизводимость результатов - степень сложности их интерпретации, зависимость анализа от типа анализируемой ткани, ее возраста, степени повреждения, вероятность получения ошибочных результатов и артефактов и др.

При этом следует отметить, что среди всего разнообразия технологий и методов ДНК-анализа пока не существует единого универсального маркера, который позволял бы решать вопросы, связанные с анализируемым объектом. Поэтому в каждом конкретном случае необходим выбор метода, наиболее подходящего для решения стоящих задач.

Существует большое число прямых и косвенных подходов к анализу представленной в ДНК информации, различающихся по вышеуказанным критериям и перечню проблем. Среди них наибольшую популярность приобрели маркеры, основанные на использовании технологии ПЦР-амплификации - интенсивного клонирования генетического материала в условиях in vitro с использованием набора

Генетика

реагентов, обеспечивающих процесс репликации фрагментов ДНК. Для определения границ клонируемого фрагмента в длинной единой цепи ДНК применяются искусственно синтезированные специфические олигонуклеотидные молекулы (праймеры), прикрепляющиеся в определенных местах длинной цепи ДНК, тем самым обозначая область репликации для фермента ДНК-полимеразы. Это позволяет клонировать фрагменты, расположенные в любой части длинной единой цепи ДНК. В целом, исходя из методологических особенностей ПЦР-амплифи-кации, информация о строении праймеров, размере и расположении клонируемых фрагментов является основной для большинства косвенных методов анализа нуклеотидной структуры ДНК. Ограниченность всех косвенных подходов связана с возможностью работы только с объектами, для которых предварительно расшифрованы изучаемые участки генома.

Прямой подход к анализу ну-клеотидной последовательности ДНК-секвенирования наиболее информативен. В то же время это не единый унифицированный способ анализа, а группа методологических приемов расшифровки нуклеотидной последовательности, различающихся скоростью и точностью получения информации, ее объемом и размером, стоимостью выполнения работ. По мнению ряда авторов, по технологическим критериям выделяют три поколения секвенирования.

К первому относят два основных подхода: метод химической деградации, предложенный А. Максамом и В. Гилбертом, метод терминации цепи, разработанный Ф. Сэнгером. При этом следует отметить, что с применением автоматизации и роботизации процессов последний метод приобрел наибольшую попу-

лярность среди молекулярных биологов, что, в свою очередь, выразилось в создании большого количества разновидностей генетических анализаторов и широкого спектра реагентной базы. Основными недостатками метода терминации цепи являются ограничения по размеру (< 900 нуклеотидов) и количеству одновременно секвенируемых фрагментов (<96), высокая стоимость анализов в пересчете на единицу информации, большое количество ДНК-матрицы или необходимость в ее предварительном in vitro или in vivo клонировании. Недостаток, вызванный фрагментарным изучением генома, был компенсирован последующим использованием соответствующего программного обеспечения, позволяющего сшивать на информационном уровне короткие анализируемые последовательности в единую длинную цепь ДНК.

Отправной точкой создания секвенаторов второго поколения стали инновационные достижения в области микроэлектроники, лазерной оптики и материаловедения, что позволило сформировать платформы для одновременного параллельного анализа десятков и сотен миллионов единичных фрагментов ДНК. К таким технологиям можно отнести пиросеквенирование, ионное полупроводниковое и лигазное секвенирование, SBS, Heliscope. Сейчас производительность ряда секвенаторов превышает сотни миллиардов пар оснований за один полный цикл работы, что позволяет отдельным приборам анализировать индивидуальный геном, предварительно разделенный на короткие фрагменты по 100-400 пар нуклеотидов, всего за сутки. Кроме того, в десятки тысяч раз снизилась и цена анализа в пересчете на единицу информации. Одновременно существенным лимитирующим фактором для данных методов на этапе обработки информации,

получаемой при анализе фраг-ментированной ДНК (в частности в ходе процесса сборки генома) является наличие в полинукле-отидной цепи значительного количества повторяющихся последовательностей, превышающих по размеру анализируемые фрагменты, что зачастую не позволяет объединить все последовательности в одну цепь. Кроме того, быстрая сборка больших геномов ограничивается возможностями доступной вычислительной техники.

Устранение указанных недостатков может быть реализовано только при условии увеличения размера фрагментов до нескольких десятков тысяч нуклеотидов, что предусмотрено в концепции развития технологий секвени-рования третьего поколения. Типичными примерами таких направлений являются нано-поровое и одномолекулярное секвенирование.

На протяжении пяти последних лет в Институте леса на основании использования технологии секвенирования первого поколения был проведен широкий круг исследований различных лесных видов деревьев, кустарников, грибов, бактерий, насекомых и птиц. Так, например, на основании сравнительного анализа нуклеотидной структуры локуса А^ были изучены генетико-так-сономические и филогенетические взаимоотношения различных видов берез и их вариатетов, произрастающих на территории Беларуси. Секвенирование генов, детерминирующих ключевые этапы метаболизма терпеновых масел (смолопродуктивность) и монолигнолов (биосинтез лигнина) позволило идентифицировать наиболее перспективные для создания плантаций целевого назначения генотипы сосны обыкновенной и ели европейской. С их использованием получены опытно-промышленные партии клонового посадочного мате-

риала. Кроме реализации различных селекционных аспектов генетические маркеры на основе нуклеотидной структуры фрагментов метаболических локусов были использованы при проведении видовой идентификации растительных образцов в ходе археологической и криминалистической экспертиз. Совместно с российскими учеными на основании анализа повторяющихся последовательностей ДНК была проведена работа по выявлению и оценке соматических мутаций, возникающих в ходе генетической трансформации микроклональ-ных линий берез и осин. Секвени-рование гена хромо-хеликазы различных видов лесных птиц дало возможность выявить особенности филогенетических изменений для паралогических и ортологи-ческих участков генома.

Широкий перечень вопросов, связанных с использованием метода ДНК-штрихкодирования для видовой идентификации, был решен в области лесной микробиологии и фитопатологии. Установлен видовой состав, проведена генетическая паспортизация географических изолятов и создана коллекция диагностических локусов наиболее распространенных возбудителей заболеваний в лесных питомниках Беларуси, разработан электронный молекулярно-генетический атлас-определитель фитопа-тогенных грибов. Идентифицированы фитозаболевания, распространяющиеся с помощью насекомых. Изучена структура и видоспецифические особенности ряда генов вирулентности и патогенности. Впервые диагностированы и генотипиро-ваны новые патогенные микро-мицеты, выявлены и изучены чужеродные инвазивные виды. Совместно со специалистами из других научных и высших учебных учреждений проведена генетическая инвентаризация и паспортизация хозяйственно

ценных штаммов и изолятов грибов, бактерий из коллекций национального статуса.

Новый этап отечественного геномного изучения лесных видов начался в рамках совместных белорусско-латвийских исследований в области генетико-селек-ционной оценки адаптационного потенциала насаждений сосны и ели в условиях изменяющегося климата. В ходе проекта латвийской стороной было профинансировано секвенирование в Шведском геномном центре экзома (совокупности всех структурных генов) пяти плюсовых деревьев ели европейской белорусского происхождения с целью дальнейшего использования полученной информации в селекционных целях.

Последующее приобретение институтом и ввод в эксплуатацию собственной системы полногеномного секвенирования на базе Ion PGM Torrent открыло широкие возможности для проведения собственных генетических исследований в нашей стране.

В качестве тестового объекта был выбран модельный штамм бактерии Escherichia coli DH10B с размером генома 4,7 млн пар нуклеотидов (для сравнения: четыре тома романа А. Н. Толстого «Война и мир» вмещают вместе с пробелами около 2,7 млн символов). Проведенное секвени-рование обеспечило 20-кратное покрытие генома, что обусловило последующую успешную сборку полинуклеотидной цепи. Достоверность полученных сведений была подтверждена сравнительным анализом с имеющейся информацией в международной генетической базе данных GeneBank NCBI. Первым полноценным объектом геномных исследований стал белорусский изолят нового фитопатогенного гриба Phoma sp., широко распространенный в лесных питомниках республики и генетически

отличныи от известных к настоящему времени видов данного рода. По предварительной оценке размер его генома составил примерно 40 млн пар нуклеотидов. С целью более полного насыщения молекулярно-генетической информацией и увеличения эффективности сборки генома проведен четырехкратный цикл анализа. В настоящее время проводится компиляция и аннотация полученных молекулярных данных. Предварительное изучение нуклеотидной структуры выявило значительное количество мультикопийных последовательностей в геноме Phoma sp., среди которых идентифицированы рибосомальный оперон (7524 пар нуклеотидов), включающий последовательность локусов IGS, 18S RNA, ITS1, 5,8S RNA, ITS2, 26S RNA; митохондриальная ДНК (31 916 пар нуклеотидов). Наряду с ними в повторяющихся участках генома в широком спектре представлены мигрирующие генетические элементы, гены вирулентности (в частности, различные семейства поликетид-синтаз) и авирулентности, вирусоподобные последовательности. Результаты первичной сборки генома и аннотированные последовательности проходят процедуру регистрации и депонирования в БД GeneBank NCBI. К настоящему времени в институте секве-нирован хлоропластный геном карельской березы, транскриптом опухолевых тканей ели европейской, транскриптом клеточных элементов крови людей, больных гепатитом С, включая сам вирус.

Последующие геномные исследования будут направлены как на изучение вопросов фундаментального характера, так и на решение ряда прикладных задач в области генетики, селекции и фитопатологии. Ведется работа по созданию ДНК-библиотек различных видов микроорганизмов (включая вирусы), органелл и экзомов. И

i Надоели баннеры? Вы всегда можете отключить рекламу.