Научная статья на тему 'ПОКОЛЕНИЯ МЕТОДОВ СЕКВЕНИРОВАНИЯ ДНК (ОБЗОР)'

ПОКОЛЕНИЯ МЕТОДОВ СЕКВЕНИРОВАНИЯ ДНК (ОБЗОР) Текст научной статьи по специальности «Промышленные биотехнологии»

CC BY
6637
1353
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕКВЕНИРОВАНИЕ НУКЛЕИНОВЫХ КИСЛОТ / ИССЛЕДОВАНИЯ ГЕНОМА / ПОКОЛЕНИЯ ТЕХНОЛОГИЙ СЕКВЕНИРОВАНИЯ ДНК / НАПРАВЛЕНИЯ ИССЛЕДОВАНИЙ ТЕХНОЛОГИЙ СЕКВЕНИРОВАНИЯ / NUCLEIC ACID SEQUENCING / GENOME RESEARCH / GENERATIONS OF DNA SEQUENCING TECHNOLOGIES / DIRECTIONS OF SEQUENCING TECHNOLOGIES RESEARCH

Аннотация научной статьи по промышленным биотехнологиям, автор научной работы — Бородинов А. Г., Манойлов В. В., Заруцкий И. В., Петров А. И., Курочкин В. Е.

C момента разработки Фредериком Сэнгером и его коллегами революционного метода секвенирования ДНК прошло несколько десятилетий. Это исследование дало толчок усовершенствованию новых методов, которые открыли большие возможности для недорогого и быстрого секвенирования ДНК. После проекта "Геном человека" временной интервал между технологиями секвенирования начал сокращаться, в то время как объем научных знаний продолжал расти в геометрической прогрессии. Вслед за секвенированием Сэнгера, рассматриваемом как первое поколение, последовательно в практику были введены новые поколения секвенирования ДНК. Развитие технологий секвенирования следующего поколения (NGS) внесло существенный вклад в эту тенденцию за счет снижения затрат и получения массивных данных секвенирования. К настоящему времени выделяют три поколения технологий секвенирования. Секвенирование второго поколения, которое в настоящее время является наиболее часто используемой технологией NGS, состоит из этапов подготовки библиотеки, амплификации и секвенирования, в то время как при секвенировании третьего поколения отдельные нуклеиновые кислоты секвенируются напрямую, чтобы избежать систематических ошибок и иметь более высокую пропускную способность. Развитие новых поколений секвенирования позволило преодолеть ограничения традиционных методов секвенирования ДНК и нашло применение в широком спектре приложений молекулярной биологии. С другой стороны, с развитием технологий следующих поколений возникает множество технических проблем, которые необходимо глубоко анализировать и решать. Каждое поколение и платформа секвенирования в силу своего методологического подхода имеет характерные преимущества и недостатки, которые определяют пригодность для тех или иных приложений. Таким образом, оценка этих характеристик, ограничений и потенциальных приложений помогает сформировать направления дальнейших исследований технологий секвенирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по промышленным биотехнологиям , автор научной работы — Бородинов А. Г., Манойлов В. В., Заруцкий И. В., Петров А. И., Курочкин В. Е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GENERATIONS OF DNA SEQUENCING METHODS (REVIEW)

Several decades have passed since the development of the revolutionary DNA sequencing method by Frederick Sanger and his colleagues. After the Human Genome Project, the time interval between sequencing technologies began to shrink, while the volume of scientific knowledge continued to grow exponentially. Following Sanger sequencing, considered as the first generation, new generations of DNA sequencing were consistently introduced into practice. Advances in next generation sequencing (NGS) technologies have contributed significantly to this trend by reducing costs and generating massive sequencing data. To date, there are three generations of sequencing technologies. Second generation sequencing, which is currently the most commonly used NGS technology, consists of library preparation, amplification and sequencing steps, while in third generation sequencing, individual nucleic acids are sequenced directly to avoid bias and have higher throughput. The development of new generations of sequencing has made it possible to overcome the limitations of traditional DNA sequencing methods and has found application in a wide range of projects in molecular biology. On the other hand, with the development of next generation technologies, many technical problems arise that need to be deeply analyzed and solved. Each generation and sequencing platform, due to its methodological approach, has specific advantages and disadvantages that determine suitability for certain applications. Thus, the assessment of these characteristics, limitations and potential applications helps to shape the directions for further research on sequencing technologies.

Текст научной работы на тему «ПОКОЛЕНИЯ МЕТОДОВ СЕКВЕНИРОВАНИЯ ДНК (ОБЗОР)»

ISSN 0868-5886

НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2020, том 30, № 4, c. 3-20

ПРИБОРОСТРОЕНИЕ ФИЗИКО-ХИМИЧЕСКОЙ - -

БИОЛОГИИ

УДК 543.07, 543.08

© А. Г. Бородинов, В. В. Манойлов, И. В. Заруцкий, А. И. Петров, В. Е. Курочкин, 2020

ПОКОЛЕНИЯ МЕТОДОВ СЕКВЕНИРОВАНИЯ ДНК

(ОБЗОР)

С момента разработки Фредериком Сэнгером и его коллегами революционного метода секвенирования ДНК прошло несколько десятилетий. Это исследование дало толчок усовершенствованию новых методов, которые открыли большие возможности для недорогого и быстрого секвенирования ДНК. После проекта "Геном человека" временной интервал между технологиями секвенирования начал сокращаться, в то время как объем научных знаний продолжал расти в геометрической прогрессии. Вслед за секвенированием Сэнгера, рассматриваемым как первое поколение, последовательно в практику были введены новые поколения секвени-рования ДНК. Развитие технологий секвенирования следующего поколения (NGS) внесло существенный вклад в эту тенденцию за счет снижения затрат и получения массивных данных секвенирования. К настоящему времени выделяют три поколения технологий секвенирования.

Секвенирование второго поколения, которое в настоящее время является наиболее часто используемой технологией NGS, состоит из этапов подготовки библиотеки, амплификации и секвенирования, в то время как при секвенировании третьего поколения отдельные нуклеиновые кислоты секвенируются напрямую, чтобы избежать систематических ошибок и иметь более высокую пропускную способность. Развитие новых поколений секвенирования позволило преодолеть ограничения традиционных методов секвенирования ДНК и нашло применение в широком спектре приложений молекулярной биологии.

С другой стороны, с развитием технологий следующих поколений возникает множество технических проблем, которые необходимо глубоко анализировать и решать. Каждое поколение и платформа секвенирова-ния в силу своего методологического подхода имеет характерные преимущества и недостатки, которые определяют пригодность для тех или иных приложений. Таким образом, оценка этих характеристик, ограничений и потенциальных приложений помогает сформировать направления дальнейших исследований технологий секвенирования.

Кл. сл.: секвенирование нуклеиновых кислот, исследования генома, поколения технологий секвенирования ДНК, направления исследований технологий секвенирования

ВВЕДЕНИЕ

Секвенированием называют процесс определения точного порядка расположения нуклеотидов в молекуле ДНК. Открытия, сделанные в 70-х гг. прошлого века Сэнгером и Максамом - Гилбертом, позволили совершить революцию в мире биологических наук, сделав секвенирование рабочим инструментом для большого количества исследователей в биологии, медицине, криминалистике и т.д. За последние 40 лет секвенирование ДНК значительно продвинулось с точки зрения приборного оснащения, инструментов и методик секвенирования. Современные методы дают возможность расширить диапазон применений, повысить точность, производительность и надежность секвенирования. Доступность секвенирования привела к значительному увеличению объема знаний о различных биологических объектах. Полученная информация наполняет базы данных, дос-

тупные для широкого круга исследователей по всему миру. Сегодня исследователи и специалисты из различных областей используют эти данные для многих целей, включая обеспечение продовольственной безопасности путем улучшения качества и урожайности сельскохозяйственных культур, животноводства, улучшения диагностики, прогнозирования и лечения многих сложных заболеваний, прогресса в криминалистке и т.д.

В серии статей предполагается рассмотреть методы секвенирования ДНК в трех аспектах: технологическая история разных поколений секвени-рования, протоколы данных и инструменты биоинформатики. В данной статье рассмотрена технологическая история от секвенирования первого поколения (first generation sequencing (FGS)) до секвенирования третьего поколения (third generation sequencing (TGS)).

1. ПОКОЛЕНИЯ СЕКВЕНАТОРОВ ДНК

Секвенирование ДНК — экспериментальный метод определения последовательного расположения оснований нуклеиновых кислот (A, T, G и C) в полинуклеотиде, кодирующем различные белки, которые функционируют в живой клетке. Полный набор кодирующих и некодирующих последовательностей в ДНК человека называется геномом. Геном несет информацию обо всех белках, необходимых для нормальной жизни организма. Биологические последовательности показывают сложные образцы сходства друг с другом. Это можно определить путем поиска сходства между последовательностями. Для этого нам нужно знать всю геномную последовательность организма.

Технологии метода химической деградации, предложенные Максамом и Гилбертом, метод ди-дезокси-терминации цепи, разработанный командой Sanger в 1977 г., и автоматическое секвенирование с помеченной флуоресценцией в 1990-х гг. вместе сформировали первое поколение секвени-рования (FGS). Благодаря своей сравнительной простоте метод Сэнгера стал доминирующим методом в FGS. Секвенирование Сэнгера позволило секвенировать бактериофаг PhiX 174, который содержит приблизительно 5375 нуклеотидов. Это исследование стало первым полностью секвениро-ванным геномом в 1977 г. В 2003 г. международный проект консорциума "Геном человека" (HGP) успешно секвенировал и картировал весь геном человека, который завершился после 13 лет исследований во многих лабораториях мира.

Секвенирование второго поколения (SGS) или секвенирование следующего поколения (NGS) относится к высокопроизводительным технологиям секвенирования ДНК, которые могут секвениро-вать миллионы или миллиарды нитей ДНК. При этом процесс определения последовательности происходит с использованием ферментативной репликации или амплификации, обеспечивающей значительную пропускную способность и многократное секвенирование целевых областей.

Секвенирование третьего поколения (TGS) характеризуется путем добавления нуклеотидов по одному для получения длинных и точных результатов секвенирования, в то время как технология амплификации не используется. Одноклеточное секвенирование также характерно для технологии TGS.

2. СЕКВЕНИРОВАНИЕ ПЕРВОГО ПОКОЛЕНИЯ

Конец 1970-х и 1980-е гг. были значительным периодом для генетики и геномики. Изобретение полимеразной цепной реакции (ПЦР) сделало воз-

можной амплификацию ДНК и разработку первых технологий секвенирования ДНК, секвенирующих весь геном. Секвенирование Сэнгера и секвениро-вание Максама - Гилберта, рассматриваемые как методы секвенирования первого поколения, доминировали в геномике в течение почти 40 лет. Они проложили путь для последующих технологий секвенирования.

2.1 Максам - Гилберт секвенирование

2.1.1. История

Максам - Гилберт (Maxam - Gilbert) [1, 2] сек-венирование — одна из самых ранних платформ секвенирования ДНК. Этот метод секвенирования широко известен как метод химического расщепления. Он был разработан в 1977 г. Алланом Мак-самом, студентом в Гарвардском университете, вместе с Уолтером Гилбертом и основан на нук-леотид-специфичной химической деградации при обработке ДНК различными химическими агентами. Метод утратил актуальность из-за своей технической сложности.

2.1.2. Принцип

В 1976 г. А. Максам и В. Гилберт разработали метод секвенирования, основанный на специфической химической деградации фрагмента ДНК, меченного с одного конца (рис. 1). Метод секвениро-вания ДНК путем химической деградации основан на ограниченном расщеплении меченного фрагмента ДНК под действием специфических реагентов. Обязательным условием секвенирования этим методом является наличие фрагмента ДНК, меченного только на одном конце. Разделение продуктов деградации по размеру с помощью высоковольтного электрофореза в полиакриламидном геле высокого разрешения, способного разделять фрагменты ДНК, длина которых различается только на один нуклеотид, и последующая радиоавтография геля позволяет определить нуклеотидную последовательность ДНК.

Первым шагом в проведении реакции химической деградации является ограниченная модификация определенных нуклеотидов различными химическими агентами. Концентрация агента и продолжительность его действия на молекулы ДНК подбираются таким образом, чтобы в каждой молекуле модифицировался только один нуклео-тид. Для каждого типа нуклеотидов или их комбинации проводят отдельные реакции ограниченной модификации и количественного расщепления. Таким образом, в результате последовательности реакций образуется смесь молекул олигонуклео-тидов, различающихся по размеру на один нуклео-тид и несущих на одном из концов метку (обычно радиоактивную).

| Рестрнктма В

i Химическая деградация по Максаму-Гнлберту

c[t

с[:— -

| Секвенируюшнй гил ь-эл efirt р о ф op« 1,

I радяпавтогрвфия

G Т

+ +

—£л£п£п9—

СГСАСАСТ

Рис. 1. Максам - Гилберт секвенирование основано на специфическом расщеплении цепочки ДНК с получением различных меченых фрагментов ДНК по размеру [3]

Помимо меченых молекул в реакционной смеси будут присутствовать и олигонуклеотидные фрагменты, не несущие меток, но на этапе радиоавтографии они окажутся невидимыми. После разделения продуктов реакции в соседних дорожках секвенирования денатурирующего полиакрила-мидного геля и этапа радиоавтографии на рентгеновской пленке будет видна лестница из полос ДНК, считывание которой позволяет восстановить нуклеотидную последовательность ДНК.

2.1.3. Преимущества и недостатки

Основная привлекательность процедуры секве-нирования Максама - Гилберта заключается в том, что матрица ДНК, используемая в этом методе, может быть одноцепочечной или двухцепочечной. Метод Максама - Гилберта был предпочтительнее метода Сэнгера в определенный момент времени, потому что метод Сэнгера требовал клонирования одноцепочечной ДНК для каждого начала считы-

вания. Метод Максама - Гилберта также можно использовать для анализа взаимодействия ДНК-белка и эпигенетических модификаций ДНК.

Основным ограничением в секвенировании Максама - Гилберта стало использование вредных химических веществ и таких методов, как рентгеновское излучение и радиоактивные метки. Трудность в расширении и использовании этих методов, а также необходимость использования гидразина, известного нейротоксина, сделали метод невыгодным и практически мало применимым в процессе дальнейшего развития технологий.

2.2. Метод секвенирования по Сэнгеру

2.2.1. История

Секвенирование по Сэнгеру [4-6] является одним из первых методов секвенирования ДНК. Фредерик Сэнгер вместе со своими коллегами начал свои исследования по разработке технологии секвенирования с инсулина, затем РНК, а затем и ДНК. Его исследования проложили путь к методу секвенирования, или прерывания цепи Сэнгера, в 1977 г. В 1980 г. Сэнгер получил свою вторую Нобелевскую премию по химии, что сделало его одним из двух Нобелевских лауреатов, дважды получивших ее в одной и той же категории. Технология была коммерциализирована компанией Applied Biosystems. Это был метод, используемый для секвенирования всей человеческой ДНК в проекте "Геном человека" на базе сотен секвена-торов Sanger во многих лабораториях мира.

2.2.2. Принцип

Химическая реакция проводится в четырех отдельных реакционных пробирках, каждая из которых содержит матричную ДНК, праймеры, ДНК-полимеразу и четыре dNTP, один из которых радиоактивно помечен. Образец ДНК делится на четыре отдельные реакции секвенирования, содержащие все четыре стандартных дезоксинуклеотида (dATP, dGTP, dCTP и dTTP) и ДНК-полимеразу. К каждой реакции добавляется только один из четырех дидезоксинуклеотидов (ddATP, ddGTP, ddCTP или ddTTP), в то время как другие добавленные нуклеотиды являются обычными. После денатурации и отжига праймера фермент ДНК-полимераза начинает добавлять dNTP во вновь синтезированную цепь ДНК, и, если ddNTP включается, реакция прекращается. Это приводит к раздельному сбору нитей ДНК разных размеров во всех четырех реакционных пробирках. Результат отдельной реакции затем помещают в отдельные лунки поли-акриламидного геля. Радиоактивное пятно указывает на фрагменты ДНК с ddNTP, включенным в определенном положении. Нуклеотидная после-

Рис. 2. Принципиальная схема секвенирования Sanger [7]

довательность в разделяющем геле определяется снизу вверх, а нуклеотидная последовательность в разных полосах терминатора дает шаблон нук-леотидной последовательности (рис. 2).

2.2.3. Преимущества и недостатки

Секвенирование Сэнгера помогло исследователям определить мутации и первопричину генетических заболеваний. Это лучший метод для идентификации коротких тандемных повторов и секвенирования отдельных генов. Однако самым большим недостатком этого метода является количество времени, которое он потребляет, что связано с низкой пропускной способностью. Метод может обрабатывать только относительно короткие последовательности ДНК (до 300-1000 пар оснований) одновременно.

2.3. Automated DNA Sequencing 2.3.1. История

Оба метода: Сэнгера и Максама - Гилберта — были трудоемкими и сложными. В 1986 г. Leroy Hood и его коллеги усовершенствовали метод секвенирования Сэнгера, используя флуоресцентные метки вместо радиоактивных меток. Один из четырех флуоресцентных красителей используется для маркировки нуклеотидных праймеров. Каждый краситель используется в отдельной реакции секвенирования с одним из четырех ddNTP. По завершении реакций секвенирования все четыре реакции смешивают и анализируют вместе в одной полосе (lane) полиакриламидного геля. Использование четырех различных ddNTP, меченных

1

PCR with fluorescent, chain-terminating ddNTPs

3'

—e

—T

с

—T

D

kM

17 tt '

г

□I

□I

Mixture of dNIPi S>

flunr ниНу ■ .1 ' :-"l

-T ddNTTs

T

5'

Original ONA sequence, PCR amplIReii к denatured

Q5S

l luorosccntly-lab^Iled oligonucleotides

б

Size separation by capillary gel electrophoresis

Larga Fragment* <, A

С Г G A A G С

Small fragment! ^ G T

Lmr baa m

в

Laser excitation & detection by sequencing machine

Photo multiplier

Output rtirrtmfltmjriHn

а

Рис. 3. Автоматическое секвенирование ДНК.

а — система капиллярного электрофореза; б — лазерное обнаружение флуоресцентных меток; в — электрофо-реграмма последовательности ДНК [9]

флуоресцентной меткой с четырьмя различными длинами волн, позволяет проводить реакцию сек-венирования в одной пробирке вместо четырех отдельных реакций. Этот метод был усовершенствован в начале 1990-х гг., когда Harold Swerdlow и его коллеги использовали капилляры в методе секвенирования ДНК. Эти капилляры достаточно маленькие (с внутренним диаметром 50 мкм) и работают с более высокими напряжениями, чтобы уменьшить время работы. В 1993 г. B. L. Karger заменил полиакриламид разделительной матрицей с низкой вязкостью; позже, в 1995 г. Zhang разработал non-cross-linked полимер, который стабилен даже при 60 °C для получения высококачественной последовательности нуклеотидов.

2.3.2. Принцип

Основные принципы этого метода секвенирования похожи на секвенирование Сэнгера [8], но процедура автоматизирована, и реакции проводят в одной пробирке, содержащей все четыре диде-зоксинуклеотидтрифосфата, каждый из которых использует четыре различных флуоресцентных красителя, излучающих свет на определенной длине волны. Генерируемые данные последовательности собираются и анализируются с использованием компьютера (рис. 3).

2.3.3. Преимущества и недостатки

Автоматизированные секвенаторы ДНК дороги, а также ими сложно секвенировать повторяющиеся участки последовательности. Несмотря

на новые открытия секвенаторов следующего поколения, автоматическое секвенирование по Сэн-геру по-прежнему считается "золотым стандартом" из-за его точности и длины чтения. При этом для массового использования данный метод сек-венирования медлен и дорог.

2.4. Пиросеквенирование

2.4.1. История

Пиросеквенирование начало применяться в 1987 г. как метод, используемый для непрерывного мониторинга активности ДНК-полимеразы (Nyren, Lundin). В 1988 г. Edward Hyman продолжил работу по созданию метода секвенирования ДНК. В 1996 г. платформа пиросеквенирования была разработана Ronaghi et al. Спустя почти 10 лет, в 2005 г., Rothberg и его коллеги представили первый коммерческий секвенатор следующего поколения, доступный на основе подхода пиросеквенирования, сделанного в 1996 г. Позже 454 Life Sciences разработали параллельную версию пиросеквенирования, которая с тех пор была приобретена Roche Diagnostics.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2.4.2. Принцип

Согласно этой технологии [10, 11], растворы четырех типов нуклеотидов добавляются последовательно в процессе секвенирования фрагментов ДНК и отмываются после каждой реакции. При включении очередного нуклеотида в синтезируемую комплементарную цепь на подготовленной

Рис. 4. Схема представляет рабочий принцип пиросеквенирования

одноцепочечной ДНК-матрице происходит детекция высвобождающегося пирофосфата путем связывания его с белком люциферазой и получением светового сигнала в итоге. В течение реакции комплементарная цепь ДНК достраивается, а последовательность нуклеотидов определяется по световым сигналам в виде пиков на пирограмме, интенсивность которых пропорциональна количеству встроенных в цепь ДНК нуклеотидов одного вида из очередной реакционной смеси (рис. 4).

Основой модификации 454 Life Sciences явилось использование эмульсионной ПЦР с одновременной параллельной подготовкой многих сотен тысяч фрагментов ДНК для их секвенирования (рис. 5). После проведения всех предварительных этапов пробоподготовки каждый из четырех видов нуклеотидов, смешанный с другими реактивами для пиросеквенирования, подается последовательно в проточную камеру, куда помещается подложка, имеющая несколько миллиардов лунок, заполненных микросферами (одна лунка — одна микросфера). Каждая микросфера содержит на своей поверхности после ПЦР многие сотни тысяч копий одного из исходных ДНК-фрагментов. Если в лунку попадает тип нуклеотидов, который комплементарен очередному нуклеотиду в достраиваемой одноцепочечной цепи матрицы ДНК, то полимераза встраивает эти нуклеотиды, что приводит через каскад реакций к высвобождению пи-рофосфата и генерации общего светового сигнала из лунки.

2.4.3. Преимущества и недостатки

Основным преимуществом пиросеквенирования является существенная экономия времени, поэтому процедура может быть проделана в режиме реального времени. Метод экономически эффективен по сравнению с методами секвенирования терминации дидезоксинуклеотидных цепей и облегчает фазирование гаплотипов и идентификацию структурных генетических вариаций путем парного считывания, которые охватывают десятки килобаз последовательности геномной матрицы. Однако основным недостатком метода является наличие существенных ошибок смещения кадров (frameshift errors), которые приводят к систематическим ошибкам при чтении [13]. Также с помощью этого метода невозможно безошибочно сек-венировать протяженные участки, состоящие из одного и того же нуклеотида. Метод позволяет получать лишь прочтения относительно небольшой длины.

3. СЕКВЕНИРОВАНИЕ ВТОРОГО ПОКОЛЕНИЯ

Секвенирование Сэнгера используется в течение уже почти 30 лет после его открытия. Стоимость и затраты времени в процессе данной процедуры стали осознаваться большой проблемой. Следующая волна технологий секвенирования, известная как секвенирование второго поколения,

Рис. 5. Массовое параллельное пиросеквенирование Roche 454 [12]

или секвенирование следующего поколения (N08), появилась в середине 2000-х гг. и была направлена на снижение затрат, увеличение скорости и устранение необходимости в электрофорезе.

3.1. Секвенирование путем синтеза Шитша/§о1еха

3.1.1. История

Платформа Шитта/8о1еха является детищем

ученых Shankar Balasubramanian и David Klenerman из Кембриджского университета, которые внесли неоценимый вклад в первый проект генома человека. Оба они использовали свой проект по флуоресцентно-меченым красителям и синтезам комплиментарной цепи полимеразой для нового подхода к секвенированию, известному как секвенирование путем синтеза. Позже они основали компанию Solexa Inc (в июне 1998 г.). В 2004 г. Solexa приобрела технологию молекулярной кла-

стеризации от Manteia. В 2006 г. Solexa выпустила свой первый секвенсор, Genome Analyzer, который революционизировал секвенирование ДНК, позволив секвенировать 1 гигабазу данных за один запуск прибора. Solexa была приобретена Illumina в 2007 г., и с тех пор платформа Illumina/Solexa остается одним из самых передовых и широко распространенных методов технологии секвени-рования в мире.

3.1.2. Принцип

Платформа секвенирования с помощью синтеза (SBS) Illumina/Solexa основана на методе реверсивной терминации (reversible termination) [14-18]. Секвенирование Illumina путем синтеза состоит из четырех основных этапов: подготовка образца, генерация кластеров, секвенирование и анализ данных.

Подготовка библиотеки. ДНК цепочка случайно фрагментируется (200-600 пар оснований) ферментом транспозазой. Затем следует лигирование адаптеров (P5 / P7) до 5' и 3' концов. В качестве альтернативы добавляются индексы из шести пар оснований, которые создают уникальный штрих-код для образца, позволяющий упорядочивать разные образцы одновременно. Фрагменты, лиги-рованные адаптером, амплифицируют с помощью реакции ПЦР и затем очищают.

Генерация кластеров. Образец загружают в проточную ячейку с газоном из двух типов олигози-дов, которые дополняют последовательность адаптера P5 / P7 фрагментов ДНК. Каждый гибри-дизированный фрагмент ДНК присоединен к комплементарному олигозиду, и фермент ДНК-полимераза создает комплементарную цепь. Двух-цепочечная ДНК денатурируется, и исходный шаблон вымывается, в то время как новый фрагмент, который ковалентно присоединен к проточной ячейке, остается.

SsDNA (одноцепочечная ДНК) образует мостик путем гибридизации с соседним комплементарным праймером и удлиняется с помощью полиме-разы, что приводит к образованию двух-цепочечного ДНК-мостика. Мост DsDNA денатурируется, и конечным результатом являются две нити SsDNA, ковалентно присоединенные к проточной ячейке. Цикл амплификации повторяется много раз. Аналогично, каждый фрагмент ампли-фицируется в отдельные клональные кластеры посредством мостиковой амплификации, оставляя кластер с однородной последовательностью ДНК (рис. 6)

Секвенирование. После клональной амплификации обратная ssDNA отщепляется и вымывается, оставляя только прямую ssDNA, присоединенную к проточной клетке. Праймер отжигает переднюю

нить и начинает добавлять флуоресцентно меченные ddNTP. Только одна базовая пара добавляется за один раз с помощью обратимого терминатора, который предотвращает множественные добавления за один раз. Когда основание включено и флуорофор возбуждается лазером, излучение регистрируется. Флуорофор отщепляется, а терминатор удаляется. Цикл повторяется до тех пор, пока прямая нить не будет полностью секвениро-вана, что и дает последовательное секвенирова-ние.

Анализ данных. Платформа секвенирования Illumina обеспечивают определение нуклеотидных последовательностей длиной в среднем 50-300 нук-леотидов, что намного короче, чем получаемые путем секвенирования по Сэнгеру, в результате секвенирования на платформах NGS создается огромный массив данных и возникает необходимость в автоматизации процесса обработки с помощью высокопроизводительной вычислительной техники. Процесс обработки данных включает следующие основные шаги: фильтрация последовательностей и коррекция ошибок, выравнивание и объединение, анализ результатов.

3.1.3. Преимущества и недостатки

Одним из главных преимуществ технологии SBS является то, что со стандартными реагентами она позволяет секвенировать до 96 образцов за цикл работы. Также SBS технология имеет явное преимущество при секвенировании гомополи-мерных последовательностей по сравнению с 454 или Ion Torrent, поскольку позволяет включать один нуклеотид на реакцию. Существенным преимуществом технологии является возможность пар-ноконцевого чтения последовательностей ДНК.

Одним из основных ограничений технологии SBS остается ограничение длины чтения, особенно когда речь идет о задачах расшифровки последовательности de novo. Ошибки замещения из-за увеличения фонового шума в каждом цикле, смещение GC в ходе мостиковой амплификации также вносят известные ограничения данной технологии. К недостаткам можно отнести и высокую стоимость приборов данной технологии.

3.2. Секвенирование лигированием: ABI/Solid

3.2.1. История

Секвенирование ABI путем лигирования и обнаружения олигонуклеотидов (Sequencing by Oligonucleotide Ligation and Detection, SOLiD) — метод секвенирования, основанный на принципе лигирования с использованием ДНК-лигазы вместо ДНК-полимеразы. В 2008 г. SOLiD System заявила эту технологию как единственную технологию NGS с точностью прочтения > 99.94 %. Длина

Рис. 6. Схема секвенирования SBS [14]

чтения в технологии ABI/SOLiD составляет от 25 до 35. Примерно 40 миллионов прочтений (ридов) может быть секвенировано, и соответствующие выходные данные секвенирования составляют от 2 до 4 гигабаз. Впервые прибор вышел на рынок в 2007 г., выпуск приборов закончен в мае 2016 г.

[19].

3.2.2. Принцип

Метод работает по принципу конструирования геномной библиотеки и лигирования с последующей реакцией секвенирования (рис. 7). Эта технология секвенирования применяет ДНК-лигазу вместо ДНК-полимеразы для секвенирования. Ге-

ном подвергается случайной фрагментации, а затем присоединяется к молекуле адаптера с последующим добавлением намагниченных гранул для клональной амплификации таким образом, чтобы только один фрагмент ДНК был доступен на поверхности магнитного шарика. Эмульсионная ПЦР используется для амплификации молекул ДНК, захваченных шариками.

В этом методе используется эмульсионная ПЦР, после которой каждая из микросфер содержит на своей поверхности около миллиона копий одного из исходных фрагментов ДНК. Затем фрагменты ДНК денатурируются и модифицируются на З'-конце, что позволяет миллиардам

Рис. 7. Принцип работы ABI/SOLID технологии [20]

микросфер, покрытых фрагментами ДНК, кова-лентно связываться с подложкой. После этого следует процесс циклического лигазного секвениро-вания. К матрице одноцепочечной ДНК прикрепляют праймер и добавляют синтезированные

флуоресцентно меченные восьмичленные олиго-нуклеотидные зонды. После того, как один из зондов комплементарно свяжется с первыми пятью основаниями праймера на одноцепочечной матрице ДНК, лигаза связывает его с праймером. В этом

случае метка обнаруживается и удаляется вместе с последними тремя универсальными нуклеотида-ми зонда. Затем происходит перекрестное связывание (лигирование) другого зонда, комплементарно связанного со следующими пятью основаниями, от зонда, уже присоединенного ранее, и так далее до конца матрицы ДНК. После этого сконструированная комплементарная цепь удаляется, и к матрице добавляется праймер, который смещается в месте посадки на один нуклеотид относительно посадки предыдущего праймера, и весь процесс завершения второй цепи методов лигиро-вания повторяется. Чтобы определить полную последовательность секвенированного фрагмента, необходимо провести эту процедуру с пятью праймерами, каждый из которых смещен относительно предыдущего праймера в месте посадки на один нуклеотид.

3.2.3. Преимущества и недостатки

Преимущество технологии секвенирования ABI/SOLiD заключается в том, что она является единственным из методов NGS секвенирования, в котором каждый нуклеотид прочитывается дважды, что повышает точность секвенирования.

Основным ограничением технологии ABI/SOLiD Sequencing является сложность в сек-венировании палиндромных последовательностей,

идентифицируя их как разные случайные последовательности.

3.3. Ионное полупроводниковое Ion Torrent секвенирование

3.3.1. История

Технология ионного полупроводникового секвенирования (Ion semiconductor sequencing) была лицензирована компанией DNA Electronics Ltd. Эта технология отличается от других технологий секвенирования тем, что не использует модифицированные нуклеотиды и оптические датчики. Ion semiconductor sequencing может также упоминаться как Ion torrent sequencing, рН-опо-средованное секвенирование или полупроводниковое секвенирование. Ion Torrent позиционировали свои системы как быстрые, компактные и экономичные секвенаторы.

3.3.2. Принцип

Платформа Ion Torrent — это первая технология, которая не применяет оптические датчики [21, 22]. Свет в этой технологии работает как посредник. В этом методе используется полупроводниковая система обнаружения при секвенировании последовательности, основанная на обнаружении ионов водорода, которые являются побочными продуктами добавления нуклеотидов

Рис. 8. Принцип работы Ion Torrent секвенирования [21]

к шаблонной цепи во время полимеризации. Бусины, содержащие обогащенную ДНК, добавляются в микроячейку на чипе. Микролунки, содержащие предназначенную для секвенирования молекулу матричной ДНК, наполняют дезоксирибонуклео-тидтрифосфатом (dNTP) одного вида. Если введенный dNTP является комплементарным к ведущему нуклеотиду шаблона, он включается в растущую комплементарную цепь. Это вызывает высвобождение ионов водорода, которое инициирует срабатывание ионного датчика ISFET, что указывает — реакция произошла. Если в последовательности матричной цепи присутствует повтор одного нуклеотида, несколько молекул dNTP будут присоединены в одном цикле. Это приводит к увеличению количества образовавшихся ионов водорода и пропорционально более высокому электрическому сигналу (рис. 8).

Пробоподготовка ДНК в данном методе практически не отличается от уже описанной для ли-газного секвенирования. Проведение предварительной эмульсионной ПЦР здесь необходимо для усиления сигнала об изменении в значении рН. Это изменение рН в каждой отдельной лунке на чипе будет давать около миллиона копий одного из исходных ДНК фрагментов, прикрепленных к поверхности микросферы. Для этого подготовленную таким образом библиотеку ДНК денатурируют и распределяют на микроэлектронный чип, имеющий миллионы микролунок (одна лунка — одна микросфера) с ион-чувствительной поверхностью, связанной с датчиками. Затем последовательно добавляют реакционные ПЦР-смеси, отличающиеся по составу наличием в них только одного из 4 видов нуклеотидов, и детектируют изменение рН в лунках, где произошло встраивание этих нуклеотидов в комплементарные цепи ДНК.

3.3.3. Преимущества и недостатки

Основным преимуществом Ion Torrent секве-нирования является то, что оно использует относительно простую химию в процессе секвенирова-ния и требует очень небольшого размера образца для анализа. Отсюда — высокая скорость секве-нирования при низких вложениях и эксплуатационных расходах.

В качестве недостатков следует отметить наличие значительного количества ошибок секвениро-вания в виде однонуклеотидных вставок и деле-ций. Для решения этой проблемы Life Technologies выпустила обновление программного продукта Ion Reporter.

Другим недостатком этой системы является короткая длина читаемого фрагмента по сравнению с другими методами секвенирования, такими как

секвенирование по Сэнгеру или пиросеквенирова-ние. Большие длины читаемых фрагментов полезны особенно для сборки генома de novo.

4. МЕТОДЫ СЕКВЕНИРОВАНИЯ ТРЕТЬЕГО ПОКОЛЕНИЯ

Хотя технологии секвенирования второго поколения позволили секвенировать несколько геномов по сниженной цене, анализ больших структурных изменений и секвенирование de novo остаются сложными задачами для данных методов. Последующая стадия в секвенировании ДНК фокусируется на устранении необходимости амплификации ДНК и производства более длинных чтений в одном запуске. Однако данные технологии все еще находятся в стадии исследований и разработок.

4.1. Одномолекулярное секвенирование

4.1.1. История

Одномолекулярное секвенирование в реальном времени (Single-molecule real-time sequencing (SMRT)) — это секвенирование ДНК третьего поколения. Этот метод используется для прочтения относительно длинных участков последовательности ДНК и позволяет делать это в режиме реального времени. Технология была разработана и запатентована Pacific Biosciences of California, Inc. в 2011 г., и PacBio RS стал первым продуктом, продаваемым на коммерческой основе.

В апреле 2013 г. компания выпустила новую версию секвенатора под названием "PacBio RS II", который имеет более высокую пропускную способность и дает возможность получать более длинные чтения. В сентябре 2015 г. компания объявила о выпуске модифицированного и инновационного секвенатора под названием Sequel System с семикратным увеличением производительности по сравнению с PacBio RS II.

4.1.2. Принцип

Технология SMRT-секвенирования основана на наблюдении в реальном времени за синтезом ДНК-полимеразой новой цепи на ДНК-матрице [23-25]. Иллюстрация концепции SMRT-секвенирования представлена на рж. 9. Технология SMRT основывается на двух ключевых новшествах: волноводах с нулевой модой (zero-mode waveguides/ZMW) и флоурофорах, пришитых к терминальной фосфатной группе нуклеотидов. Волноводы ZMW подводят свет исключительно к нижней части ячейки, в которой иммобилизован комплекс (ДНК-полимераза — матрица для синтеза).

Рис. 9. Принцип работы Single Molecule Real Time Sequencing (SMRT) Technology [25]

Нуклеотиды с флуоресцентными метками позволяют наблюдать за иммобилизованным комплексом, т.к. ДНК-полимераза синтезирует цепь ДНК.

Принцип, лежащий в основе Pacific biosystems SMRT, весьма отличается от других методов секвенирования (рис. 9). Он использует одну молекулу для обнаружения, поэтому для подготовки библиотеки ампликонов не требуется никакого этапа амплификации.

Флуоресцентно меченные нуклеотиды добавляются в лунку, и флуоресцентная метка отсоединяется от нуклеотида, как только он включается в одноцепочечную ДНК, которая связана с иммобилизованной ДНК-полимеразой. Высвободившийся флуорофор детектируется. Секвенирование матрицы происходит путем мониторинга в режиме реального времени обработки дезоксинуклеотид-трифосфатов ДНК-полимеразой, меченной флуо-рофорами через концевую фосфатную группу, когда нуклеотиды включаются в растущую цепь ДНК.

4.1.3. Преимущества и недостатки

Метод одномолекулярного секвенирования в реальном времени (SMRT) позволяет получать очень длинные чтения (в среднем около 20 000 нуклеотидов, до 60 000 нуклеотидов), что облегчает дальнейший анализ данных и позволяет избежать ряда проблем, возникающих при работе с короткими чтениями. Работает без предварительной амплификации исследуемой ДНК с помощью ПЦР. Этот метод обеспечивает высокую скорость секвенирования (теоретически она ограничивается только скоростью ДНК-полимеразы). Метод отличается высокой чувствительностью и специфичностью: возможность выявления включений в смешанных выборках с частотой встречаемости менее 0.1 %.

Одним из существенных недостатков SMRT-секвенирования является высокая частота ошибки, которая достигает 15 %. Слабым местом технологии является зависимость иммобилизация комплексов ДНК-полимераза/SMRTbell-матрица от размера матрицы, что приводит к преобладанию коротких ДНК-фрагментов.

4.2. Нанопоровое секвенирование

4.2.1. История

Технология секвенирования нанопор была исследована еще до того, как были развиты технологии NGS секвенирования. В начале 1990-х гг. David Dreamer и George Church независимо открыли, что одноцепочная ДНК (ssDNA) может быть секвенирована путем прохождения через нанопо-ры [26]. В 1996 г. Dreamer, Branton

и Kasiannowicz опубликовали свои результаты по обнаружению прохождения ДНК через нанопоры альфа-гемолизина.

Прорыв в технологии секвенирования нанопор пришел в 2001 г. с открытием твердотельных нанопор. В 2005 г. компания Oxford Nanopore Technologies была создана Hagan Bayley вместе со Spike Willcocks, David Norwood и Gordon Sanghera. Это — первая компания, предлагающая коммерческие секвенаторы на основе технологии на-нопор.

4.2.2. Принцип

Принцип работы секвенсоров ONT основан на измерении электрического тока при прохождении молекулы нуклеиновой кислоты через нанопору [27] (рис. 10). Детектирование осуществляется в камере с разделенной мембраной, содержащей нанопору. К камере прикладывается напряжение, заставляющее ДНК или РНК двигаться через пору. По мере прохождения молекулы сечение поры уменьшается, в результате чего уменьшается сила тока. Таким образом, измеряя ток, можно определить тип нуклеотида, проходящего через пору в заданный интервал времени.

4.2.3. Преимущества и недостатки

По сравнению с существующими методами сек-венирования использование данного метода секве-нирования имеет такие преимущества, как низкая

стоимость и простота использования, высокая чувствительность, высокая длина считывания (до десятков тысяч оснований), высокая портативность, быстрый анализ и отображение результатов в реальном времени.

К недостаткам можно отнести такие свойства, как низкое качество считываний по сравнению с технологиями секвенирования с короткими считываниями, утрата функциональных свойств для биологических пор со временем. Также замечено многообразное влияние факторов окружающей среды на скорость считывания последовательности и на ее качество.

ВЫВОДЫ. СРАВНЕНИЕ МЕТОДОВ СЕКВЕНИРОВАНИЯ

Внедрение Максамом и Гилбертом метода тер-минации химических цепей для секвенирования ДНК в 1977 г., за которым в том же году последовал метод Сэнгера, вызвало революцию в биологии. Эти методы привели к секвенированию более крупных геномов, кульминацией которого стал проект "Геном человека".

В качестве следующего шага были предприняты крупномасштабные проекты секвенирования для изучения вариации последовательности человека. Однако для проектов такого типа секвениро-вание по методу Sanger было слишком трудоемким, длительным и дорогостоящим. В 2004 г.

Рис. 10. Принцип работы Single Molecule Real Time Sequencing (SMRT) Technology [28]

Национальный исследовательский институт генома человека (NHGRI) инициировал программу снижения стоимости секвенирования всего генома до 1000 долларов США за 10 лет. Это ускорило разработку более дешевых и быстрых методов — технологии NGS, — генерирующих от тысячи до многих миллионов реакций секвенирования за цикл. Основные преимущества этих технологий NGS заключались в том, что они не требовали бактериального клонирования фрагментов ДНК и электрофоретического разделения продуктов секвенирования.

Различные технологии NGS сосуществовали в течение ряда лет; сегодня на рынке преобладает реализация NGS компании Illumina. Благодаря впечатляющему снижению цен, NGS быстро обеспечила секвенирование генома в пределах досягаемости возможностей для небольших лабораторий. Цель — геном человека менее чем за $1000 — была достигнута несколько лет назад. Сегодня NGS стал стандартным инструментом для многих приложений в базовой биологии, а также для клинических и агрономических исследований.

Хотя технологии NGS чрезвычайно производительные, у них также есть некоторые недостатки. Одним из основных ограничений является их относительно короткая длина прочтений. Геномы часто содержат многочисленные повторяющиеся последовательности, которые длиннее, чем считывает NGS, что может привести к неправильной сборке и разрывам. В результате многие доступные геномы сильно фрагментированы на сотни или тысячи контигов. Кроме того, в то время как небольшие варианты, такие как вариации одного нуклеотида (SNV) и короткие индексы, могут быть точно обнаружены с помощью короткого считывания, большие структурные вариации (SV) сложнее обнаружить и охарактеризовать. Это важный вопрос, учитывая, что SV характерны для ряда медицинских приложений. Кроме того, короткие чтения имеют ограниченную способность связывать (даже короткие) независимые вариации на одной и той же молекуле ДНК. Вызывают трудности и области с экстремальным значением GC%, поскольку они неэффективно амплифици-руются с помощью ПЦР. Поэтому, хотя методы NGS произвели революцию в биологии, возникла необходимость в разработке методов, способных лучше справляться с вышеупомянутыми проблемами.

Вскоре после появления NGS появились технологии TGS. Отличительными особенностями TGS являются одномолекулярное секвенирование одной молекулы (SMS) и секвенирование в реальном времени (в отличие от NGS, где секвенирование приостанавливается после каждого добавления

нуклеотидного основания). Первая технология SMS, коммерциализированная Helicos Biosciences, напоминала секвенирование Illumina, но без амплификации. Поскольку метод был относительно медленным, дорогим и давал короткие чтения, он оказался неэффективным. Первая "истинная" технология TGS была выпущена на рынок в 2011 г. компанией Pacific Biosciences (PacBio) и получила название "одномолекулярная последовательность в реальном времени" (SMRT). ^всем недавно (2014) Oxford Nanopore Technologies (ONT) ввела в действие технологию нанопорового секвениро-вания. Помимо отсутствия ПЦР-амплификации и процесса секвенирования в реальном времени, важной особенностью SMRT и нанопорового сек-венирования является производство длинных считываний

Более того, технология нанопор может напрямую секвенировать РНК и идентифицировать модификации оснований РНК. Благодаря мобильности MinION и очень простым процедурам подготовки библиотеки образцов технология нанопор позволяет впервые выполнить высокопроизводительное секвенирование в полевых условиях и в удаленных местах. Это имеет огромное значение для обследования вспышек заболеваний в развивающихся странах.

Тем не менее остается много места для улучшений технологий секвенирования третьего поколения. Недостатком секвенирования на основе на-нопор является высокая частота ошибок. C другой стороны, чтобы не отставать от технологии секве-нирования на основе нанопор, для технологии PacBio будет важно увеличить общую длину считывания и пропускную способность данного метода секвенирования. Огоит упомянуть, что различные другие компании также вкладывают средства в новые методы быстрого, экономически эффективного и портативного секвенирования, и будет интересно посмотреть, появится ли какая-либо из этих технологий в ближайшем будущем на рынке оборудования для проведения секвенирования.

СПИСОК ЛИТЕРАТУРЫ

1. Maxam A.M., Gilbert W. A new method for sequencing DNA // Proc Natl Acad Sci USA. 1977. Vol. 74, no. 2. P. 560-564. DOI: 10.1073/pnas.74.2.560

2. Gaastra W. Chemical cleavage (Maxam and Gilbert) method for DNA sequence determination // Methods Mol Biol. 1985. Vol. 2. P. 333-341. DOI: 10.1385/0-89603064-4:333

3. Принцип секвенирования ДНК по Максаму-Гилберту. URL: http://enc.sci-lib.com/article0001457.html

4. Sanger F., Air G.M., Barrell B.G., Brown N.L., Coul-son A.R., Fiddes J.C. et al. Nucleotide sequence of bacte-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

nophage ^X174 DNA // Nature. 1977. Vol. 265(5596). P. 687-695. DOI: 10.1038/265687a0

5. Slatko B.E., Albright L.M., Tabor S., Ju J. DNA sequencing by the dideoxy method // Curr Protoc Mol Biol. 1999. Vol. 47, is. 1. P. 7.4A.1-7.4A.39.

DOI: 10.1002/0471142727.mb0704as47

6. Men A.E., Wilson P., Siemering K., Forrest S. Sanger DNA sequencing // Next generation genome sequencing: towards personalized medicine / Janitz M. (ed). 1st edn. Wiley-VCH Verlag GmbH & Co, Weinheim, 2008. URL: https://application.wiley-vch.de/books/sample/3527320903_c01.pdf

7. Karki G. Sanger's method of gene sequencing. 2017. URL: https://www.onlinebiologynotes.com/sangers-method-gene-sequencing/

8. Wallis Y., Morrell N. Automated DNA sequencing // Methods Mol Biol. 2011. Vol. 688. P. 173-185. DOI: 10.1007/978-1-60761-947-5_12

9. Sanger DNA Sequencing Steps and Method. URL: https://www.sigmaaldrich.com/technical-documents/articles/biology/sanger-sequencing.html

10. Ravi I., Baunthiyal M., Saxena J. Advances in biotechnology. Springer, New York, 2014. URL: https://www.springer.com/gp/book/9788132215530

11. Harrington C.T., Lin E.I. et al. Fundamentals of pyrose-quencing // Arch Pathol Lab Med. 2013. Vol. 137, no. 9. P. 1296-1303. DOI: 10.5858/arpa.2012-0463-RA

12. Mardis E.R. Next-generation DNA sequencing methods // Annual Review of Genomics and Human Genetics. 2008. Vol. 9. P. 387-402.

DOI: 10.1146/annurev.genom.9.081307.164359

13. Dewey F.E., Pan S. et al. DNA sequencing: clinical applications of new DNA sequencing technologies // Circulation. 2012. Vol. 125, no. 7. P. 931-944. DOI: 10.1161/CIRCULATIONAHA. 110.972828

14. Voelkerding K.V., Dames S.A., Durtschi J.D. Next-generation sequencing: from basic research to diagnostics // Clin Chem. 2009. Vol. 55, no. 4. P. 641-658. DOI: 10.1373/clinchem.2008.112789

15. Ansorge W.J. Next-generation DNA sequencing techniques // New Biotechnol. 2009. Vol. 25, no. 4. P. 195203. DOI: 10.1016/j.nbt.2008.12.009

16. Guzvic M. The history of DNA sequencing // J Med Bio-chem. 2013. Vol. 32, no. 4. P. 301-312. DOI: 10.2478/jomb-2014-0004

17. Buermans H.P.J., den Dunnen J.T. Next generation sequencing technology: advances and applications // Bio-chim Biophys Acta (BBA). 2014. Vol. 1842, no. 10. P. 1932-1941. DOI: 10.1016/j.bbadis.2014.06.015

18. Heather J.M., Chain B. The sequence of sequencers: the history of sequencing DNA // Genomics. 2016. Vol. 107, no. 1. P. 1-8. DOI: 10.1016/j.ygeno.2015.11.003

19. Huang Y., Chen S., Chiang Y., Chen T., Chiu K. Palin-dromic sequence impedes sequencing-by-ligation me-

chanism // BMC Systems Biology. 2012. Vol. 6. S10. DOI: 10.1186/1752-0509-6-S2-S10

20. Kchouk M., Gibrat J.-F., Elloumi M. Generations of sequencing technologies: from first to next generation // Biol Med. 2017. Vol. 9, no. 3. URL:

https://www.researchgate.net/publication/317594687_Genera tions_of_Sequencing_Technologies_From_First_to_Next_ Generation

21. Golan D., Medvedev P. Using state machines to model the Ion Torrent sequencing process and to improve read error rates // Bioinformatics. 2013. Vol. 29, no. 13. P. i344-i351. DOI: 10.1093/bioinformatics/btt212

22. Ambardar S., Gupta R. et al. High throughput sequencing: an overview of sequencing chemistry // Indian J Microbiol. 2016. Vol. 56, no. 4. P. 394-404. DOI: 10.1007/s12088-016-0606-4

23. Радько С.П., Курбатов Л.К., Птицын К.Г., Киселёва Я.Ю., Пономаренко Е.А., Лисица А.В., Арчак А.И. Перспективы использования секвенаторов третьего поколения для количественного профилирования транскриптома // Biomedical Chemistry: Research and Methods. 2018. Vol. 1, no. 4. e00086.

DOI: 10.18097/BMCRM00086

24. Ari §., Arikan M. Next-generation sequencing: advantages, disadvantages, and future // Plant omics: trends and applications. Springer, Berlin, 2016. P. 109-135. URL: https://www.springer.com/gp/book/9783319317014

25. Ardui S., Ameur A., Vermeeschl J.R., HestandM.S. Single molecule real-time (SMRT) sequencing comes of age: applications and utilities for medical diagnostics // Nucleic Acids Research. 2018. Vol. 46, no. 5. P. 21592168. DOI: 10.1093/nar/gky066

26. Branton D., Deamer D., Marziali A., Bayley H., Benner S., et al. The potential and challenges of nanopore sequencing // Nat Biotechnol. 2008. Vol. 26, no. 10. P. 1146-1153. DOI: 10.1038/nbt.1495

27. Lu H., Giordano F., Ning Z. Oxford Nanopore MinION sequencing and genome assembly // Genomics Proteomics Bioinformatics. 2016. Vol. 14, no. 5. P. 265-279. DOI: 10.1016/j.gpb.2016.05.004

28. Deamer D., Akeson M., Branton D. Three decades of nanopore sequencing // Nat Biotechnol. 2016. Vol. 34, no. 5. P. 518-524. DOI: 10.1038/nbt.3423

Институт аналитического приборостроения РАН, Санкт-Петербург

Контакты: Бородинов Андрей Геннадьевич, borodinov@gmail.com

Материал поступил в редакцию 27.10.2020

ISSN 0868-5886

NAUCHNOE PRIBOROSTROENIE, 2020, Vol. 30, No. 4, pp. 3-20

GENERATIONS OF DNA SEQUENCING METHODS

(REVIEW)

A. G. Borodinov, V. V. Manoilov, I. V. Zarutsky, A. I. Petrov, V. E. Kurochkin

Institute for Analytical Instrumentation of RAS, Saint Petersburg, Russia

Several decades have passed since the development of the revolutionary DNA sequencing method by Frederick Sanger and his colleagues. After the Human Genome Project, the time interval between sequencing technologies began to shrink, while the volume of scientific knowledge continued to grow exponentially. Following Sanger sequencing, considered as the first generation, new generations of DNA sequencing were consistently introduced into practice. Advances in next generation sequencing (NGS) technologies have contributed significantly to this trend by reducing costs and generating massive sequencing data. To date, there are three generations of sequencing technologies. Second generation sequencing, which is currently the most commonly used NGS technology, consists of library preparation, amplification and sequencing steps, while in third generation sequencing, individual nucleic acids are sequenced directly to avoid bias and have higher throughput. The development of new generations of sequencing has made it possible to overcome the limitations of traditional DNA sequencing methods and has found application in a wide range of projects in molecular biology. On the other hand, with the development of next generation technologies, many technical problems arise that need to be deeply analyzed and solved. Each generation and sequencing platform, due to its methodological approach, has specific advantages and disadvantages that determine suitability for certain applications. Thus, the assessment of these characteristics, limitations and potential applications helps to shape the directions for further research on sequencing technologies.

Keywords: nucleic acid sequencing, genome research, generations of DNA sequencing technologies, directions of sequencing technologies research

REFERENCES

1. Maxam A.M., Gilbert W. A new method for sequencing DNA. Proc Natl Acad Sci USA, 1977, vol. 74, no. 2, pp. 560-564. DOI: 10.1073/pnas.74.2.560

2. Gaastra W. Chemical cleavage (Maxam and Gilbert) method for DNA sequence determination. Methods Mol Biol., 1985, vol. 2, pp. 333-341. DOI: 10.1385/0-89603064-4:333

3. Prinzip sekvenirovaniya DNK po Maksamu-Gilbertu [Maxam-Gilbert DNA sequencing principle]. URL: http://enc.sci-lib.com/article0001457.html

4. Sanger F., Air G.M., Barrell B.G., Brown N.L., Coul-son A.R., Fiddes J.C. et al. Nucleotide sequence of bacteriophage 9X174 DNA. Nature, 1977, vol. 265(5596). pp. 687-695. DOI: 10.1038/265687a0

5. Slatko B.E., Albright L.M., Tabor S., Ju J. DNA sequencing by the dideoxy method. Curr Protoc Mol Biol., 1999, vol. 47, is. 1, pp. 7.4A.1-7.4A.39.

DOI: 10.1002/0471142727.mb0704as47

6. Men A.E., Wilson P., Siemering K., Forrest S. Sanger DNA sequencing. Next generation genome sequencing: towards personalized medicine. Janitz M. (ed), 1st edn, Wiley-VCH Verlag GmbH & Co, Weinheim, 2008. URL: https://application.wiley-vch.de/books/sample/3527320903_c01.pdf

7. Karki G. Sanger's method of gene sequencing. 2017. URL: https://www.onlinebiologynotes.com/sangers-method-gene-sequencing/

8. Wallis Y., Morrell N. Automated DNA sequencing. Methods Mol Biol, 2011, vol. 688, pp. 173-185. DOI: 10.1007/978-1-60761-947-5_1 2

9. Sanger DNA Sequencing Steps and Method. URL: https://www.sigmaaldrich.com/technical-documents/articles/biology/sanger-sequencing.html

10. Ravi I., Baunthiyal M., Saxena J. Advances in biotechnology. Springer, New York, 2014. URL: https://www.springer.com/gp/book/9788132215530

11. Harrington C.T., Lin E.I. et al. Fundamentals of pyrose-quencing. Arch Pathol Lab Med., 2013, vol. 137, no. 9, pp. 1296-1303. DOI: 10.5858/arpa.2012-0463-RA

12. Mardis E.R. Next-generation DNA sequencing methods. Annual Review of Genomics and Human Genetics, 2008, vol. 9, pp. 387-402.

DOI: 10.1146/annurev.genom.9.081307.164359

13. Dewey F.E., Pan S. et al. DNA sequencing: clinical applications of new DNA sequencing technologies. Circulation, 2012, vol. 125, no. 7, pp. 931-944. DOI: 10.1161/CIRCULATI0NAHA. 110.972828

14. Voelkerding K.V., Dames S.A., Durtschi J.D. Next-generation sequencing: from basic research to diagnostics. Clin Chem, 2009, vol. 55, no. 4, pp. 641-658. DOI: 10.1373/clinchem.2008.112789

15. Ansorge W.J. Next-generation DNA sequencing techniques. New Biotechnol., 2009, vol. 25, no. 4, pp. 195203. DOI: 10.1016/j.nbt.2008.12.009

16. Guzvic M. The history of DNA sequencing. J Med Bio-chem, 2013, vol. 32, no. 4, pp. 301-312. DOI:

10.2478/jomb-2014-0004

17. Buermans H.P.J., den Dunnen J.T. Next generation sequencing technology: advances and applications. Biochim Biophys Acta (BBA), 2014, vol. 1842, no. 10, pp. 19321941. DOI: 10.1016/j.bbadis.2014.06.015

18. Heather J.M., Chain B. The sequence of sequencers: the history of sequencing DNA. Genomics, 2016, vol. 107, no. 1, pp. 1-8. DOI: 10.1016/j.ygeno.2015.11.003

19. Huang Y., Chen S., Chiang Y., Chen T., Chiu K. Palin-dromic sequence impedes sequencing-by-ligation mechanism. BMC Systems Biology, 2012, vol. 6. S10. DOI: 10.1186/1752-0509-6-S2-S10

20. Kchouk M., Gibrat J.-F., Elloumi M. Generations of sequencing technologies: from first to next generation. Biol Med, 2017, vol. 9, no. 3. URL:

https://www.researchgate.net/publication/317594687_Generati

ons_of_Sequencing_Technologies_From_First_to_Next_

Generation

21. Golan D., Medvedev P. Using state machines to model the Ion Torrent sequencing process and to improve read error rates. Bioinformatics, 2013, vol. 29, no. 13, pp. i344-i351. DOI: 10.1093/bioinformatics/btt212

22. Ambardar S., Gupta R. et al. High throughput sequencing: an overview of sequencing chemistry. Indian J Microbiol, 2016, vol. 56, no. 4, pp. 394-404. DOI: 10.1007/s12088-016-0606-4

Contacts: Borodinov Andrey Gennadyevich, borodinov@gmail.com

23. Rad'ko S.P., Kurbatov L.K., Ptizyn K.G., Kiselyeva Ya.Yu., Ponomarenko E.A., Lisiza A.V., Archak A.I. [Prospects for using third-generation sequencers for quantitative transcriptome profiling]. Biomedical Chemistry: Research and Methods, 2018, vol. 1, no. 4. e00086. DOI: 10.18097/BMCRM00086

24. Ari §., Arikan M. Next-generation sequencing: advantages, disadvantages, and future. Plant omics: trends and applications, Springer, Berlin, 2016, pp. 109-135. URL: https://www.springer.com/gp/book/9783319317014

25. Ardui S., Ameur A., Vermeesch1 J.R., Hestand M.S. Single molecule real-time (SMRT) sequencing comes of age: applications and utilities for medical diagnostics. Nucleic Acids Research, 2018, vol. 46, no. 5, pp. 2159-2168. DOI: 10.1093/nar/gky066

26. Branton D., Deamer D., Marziali A., Bayley H., Benner S., et al. The potential and challenges of nanopore sequencing. Nat Biotechnol., 2008, vol. 26, no. 10, pp. 1146-1153. DOI: 10.1038/nbt.1495

27. Lu H., Giordano F., Ning Z. Oxford Nanopore MinION sequencing and genome assembly. Genomics Proteomics Bioinformatics, 2016, vol. 14, no. 5, pp. 265-279. DOI: 10.1016/j.gpb.2016.05.004

28. Deamer D., Akeson M., Branton D. Three decades of nanopore sequencing. Nat Biotechnol., 2016. vol. 34, no. 5, pp. 518-524. DOI: 10.1038/nbt.3423

Article received by the editorial office on 27.10.2020

i Надоели баннеры? Вы всегда можете отключить рекламу.