Научная статья на тему 'Секвенирование - методы расшифровки нуклеотидной последовательности ДНК. Сообщение 2'

Секвенирование - методы расшифровки нуклеотидной последовательности ДНК. Сообщение 2 Текст научной статьи по специальности «Математика»

CC BY
893
165
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
СЕКВЕНИРОВАНИЕ / SEQUENCING / ФЕРМЕНТАТИВНЫЙ МЕТОД / ENZYMATIC METHOD / МЕТОД ХИМИЧЕСКОЙ ДЕГРАДАЦИИ / METHOD OF CHEMICAL DEGRADATION / ФЛУОРОФОР / СЕКВЕНАТОР / FLUOROPHOR / SEQUENATOR

Аннотация научной статьи по математике, автор научной работы — Костюк С. А.

Описаны существующие типы секвенаторов, принципы высокоэффективного пиросеквенирования, секвенаторы нового поколения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Sequencing - methods of DNA nucleotide sequence decryption. Report 2

Existing sequenator variants, highly efficient pyrosequencing principles, next generation sequencing equipment are described.

Текст научной работы на тему «Секвенирование - методы расшифровки нуклеотидной последовательности ДНК. Сообщение 2»

Секвенирование - методы расшифровки нуклеотидной последовательности ДНК. Сообщение 2

Костюк С.А.

Белорусская медицинская академия последипломного образования, Минск_

Kostiuk S.A.

Belarusian Medical Academy of Post-Graduate Education, Minsk

Sequencing - methods of DNA nucleotide sequence decryption. Report 2

Резюме. Описаны существующие типы секвенаторов, принципы высокоэффективного пиросеквенирования, секвенаторы нового поколения. Ключевые слова.: секвенирование, ферментативный метод, метод химической деградации, флуорофор, секвенатор.

Медицинские новости. — 2017. — №7. — С. 11—14. Summary. Existing sequenator variants, highly efficient pyrosequencing principles, next generation sequencing equipment are described. Keywords: sequencing, enzymatic method, method of chemical degradation, fluoropho, sequenator. Meditsinskie novosti. - 2017. - N7. - P. 11-14.

Секвенаторы

Современные секвенаторы можно разделить по типу проводимого электрофореза на капиллярные и те, в которых разделение происходит в гелевых пластинах. Последние могут также различаться по количеству детектируемых красителей: один, два или четыре. Капиллярные секвенаторы выпускаются только в варианте, использующем детекцию четырех флуоресцентных красок [1, 8, 11, 17].

Наиболее успешным секвенатором начала 1990-х годов стал ABI 373 (Applied Biosystems). В этой модели использовалась одновременная детекция четырех красителей (TAMRA, FAM, ROX, JOE), возбуждаемых излучением аргонового лазера. Лазер генерирует непрерывное излучение в сине-зеленой области спектра в диапазоне 488-514 нм. Разделение фрагментов проводится в геле толщиной 0,4 мм. Возбуждение флуорофора и следующая за этим эмиссия флуоресценции происходят при прохождении меченым фрагментом ДНК зоны сканирования. Для уменьшения эффекта перекрывания спектров эмиссии получаемый сигнал пропускается через колесо с четырьмя последовательно заменяемыми фильтрами. В результате первичные данные представляют собой наборы из четырех чисел (в соответствии с сигналом, прошедшим через каждый из фильтров) для каждой точки сканирования (по ширине геля), собранные через равные интервалы времени в течение всего электрофореза [11].

Среди секвенаторов, детектирующих флуоресценцию одного красителя, можно выделить секвенатор Micro Gene Blaster (Visible Genetics), который позволяет одновременно проводить анализ четырех образцов, меченых Cy5.5, на 16 дорожках. Разделение происходит в одноразовых кассетах MicroCel, заполняемых фотопо-лимеризуемым акриламидом. Высота кас-

сет варьирует от 140 до 280 мм, что позволяет секвенировать от 300 (MicroCel 300 Cassette) до 700 (MicroCel 700 Cassette) ну-клеотидов. В качестве источника излучения используется He-Ne лазер с длинной волны 632,8 нм. Луч лазера направляется не через, а между стеклами, то есть поперек геля, что позволяет отказаться от любых движущихся частей, следовательно, значительно повысить надежность прибора и уменьшить его размеры [1, 12, 15].

Секвенаторы, работающие на двух красителях в инфракрасной области спектра, выпускает фирма LI-COR. Ее основная машина - IR2 DNA Sequencer. Как известно, естественное инфракрасное излучение не свойственно биологическим макромолекулам и компонентам акриламидных гелей и это положительно отражается на качестве секвенирования. IR2 несет два твердофазных полупроводниковых лазера, один из которых генерирует излучение с длиной волны 680 нм, а другой - 780 нм. В качестве красителей используются IRDye700 и IRDye800 или их производные. Детекция каждого из флуо-рофоров осуществляется своим фотодиодом. Причем возбуждение/детекция красителей происходит не одновременно, а последовательно. Подобная двухка-нальная система позволяет: во-первых, избежать перекрывания спектров эмиссии (они разнесены на 100 нм), во-вторых, проводить одновременное двунаправленное секвенирование (сразу с двух праймеров, каждый из которых мечен своим красителем). Разделение фрагментов в IR2 проводится в гелях с высотой от 18 до 48 см и шириной 25 см, способных вмещать от 32 до 96 дорожек. Толщина гелей может варьировать от 0,2 до 0,4 мм. За один прогон IR2 DNA Sequencer способен определять более 1000 нуклеотидов, благодаря чему является по этому показателю рекордсменом [10].

Конкурентом IR2 DNA Sequencer стал секвенатор ABI Prism 377, который пришел на смену ABI 373. Основное новшество этой машины заключается в замене оптической фильтрации флуоресценции, которая использовалась в ABI 373 для разделения спектров испускания красителей, на «виртуальную» фильтрацию. В процессе сканирования эмиссия флуоресценции отделяется от отраженного света лазера, рассеивается посредством дифракционной решетки (это позволяет разложить исходный световой пучок на спектральные составляющие) и, наконец, фиксируется CCD-камерой. В итоге кванты света преобразуются в пиксели во всем промежутке спектра от 514 до 680 нм. Какой именно набор пикселей преобразовать в пик на хроматограмме, задается заранее через интерфейс программы DataCollection в зависимости от используемых флуорофоров и способа введения метки. Выпускается несколько модификаций ABI 377. Самый простой вариант обеспечивает автоматический обсчет 18 образцов, самый продвинутый - 96. Расстояние до точки сканирования (дистанция разгонки) может варьировать в зависимости от размеров используемых стекол и составлять 12, 36 или 48 см (при толщине геля 0,2 или 0,4 мм). Максимально возможный размер определяемых фрагментов - 800-900 нуклеотидов [7, 15, 16].

Схожая технология записи и обработки данных используется в другом секве-наторе фирмы Applied Biosystems - ABI Prism 310. Это однокапиллярный секвена-тор, способный в автоматическом режиме последовательно просканировать 96 образцов. Полный цикл для каждого из них составляет приблизительно полтора часа и включает электрокинетическую инжекцию образца в капилляр, электрофорез, возбуждение/детекцию эмиссии флуоресценции и смену полимерного материала в капилляре

перед инжекцией следующего образца. За указанное время ABI 310 способен прочитать приблизительно 450 нуклеотидов.

ABI Prism 310 стал пионером капиллярной технологии в секвенировании. Нынешнее поколение капиллярных секвенаторов представляет собой уже мультикапиллярные машины, некоторые из которых демонстрируют гораздо более высокую производительность даже в сравнении с ABI 377. В зависимости от поставленных задач можно остановить свой выбор на 8-капиллярном Beckman CEQ 2000 (Beckman Coulter), 16-капиллярном секвенаторе ABI Prism 3l00 или 96-капил-лярных ABI Prism 3700 и MegaBACE 1000 (Amersham-Pharmacia-Biotech-Molecular Dynamics) [3, 10, 11].

Большинство новых технологических разработок направлено на миниатюризацию, мультиплексирование (в данном случае, параллельное соединение низкопроизводительных блоков системы для повышения общей производительности) и автоматизацию процесса секвенирования.

Все они могут быть разделены на два класса. Первый объединяет методы «секвенирования синтезом», в которых нуклеотиды определяются по мере того, как они встраиваются в растущую цепь ДНК. Ко второму классу относятся технологии расшифровки последовательности, нуклеотиды единичной молекулы ДНК. Некоторые из них достаточно экзотичны (например, чтение нуклеотидных остатков ДНК электронным или оптическим способом по мере того, как молекула «протискивается» через нанопору). Длинный перечень улучшений системы капиллярного электрофореза в сочетании с возрастающей автоматизацией и совершенствованием программного обеспечения позволили снизить стоимость секвенирования в 13 раз по сравнению с затратами, когда первые автоматические секвенаторы появились в прошлом десятилетии.

Но все это выглядит несколько бледно на фоне возможностей нового метода секвенирования синтезом - пиросеквениро-вания, разрабатываемого и внедряемого компанией 454 Life Sciences.

Принцип высокопроизводительного пиросеквенирования ДНК

Технология, разработанная компанией 454 Life Sciences, называется пирофосфатным секвенированием (пиросеквенированием).

Сама идея пиросеквенирования, надо сказать, не нова: она возникла еще в начале 90-х годов прошлого века, но опубликованный тогда метод не сумел вытеснить традиционный дидезокси метод Сэнгера. Однако разработчики из 454 Life Sciences дополнили его возможностями современных нанотехнологий, и, как сказали бы любители диамата, количество перешло в качество. Поэтому точнее будет назвать

метод «пиросеквенированием ДНК в плотно сфабрикованных пиколитровых реакторах».

Весь геном, все его молекулы ДНК, случайным образом фрагментируются на кусочки по 300-500 пар оснований. Затем комплементарные цепи фрагмента разделяются, к каждой цепи фрагментов пришивается одинаковый для всех олигонуклеотид-«адаптер», который позволяет отдельным цепям налипать на пластиковые бусинки. Последовательность этого олигонуклеотида позволяет в процессе секвенирования распознавать ДНК-матрицу. При этом смесь разъединенных на комплементарные цепи фрагментов разбавляют таким образом, что каждая бусинка получает лишь по одной индивидуальной цепи, она оказывается заключенной в капельку, окруженную маслом и содержащую смесь для осуществления полимеразной цепной реакции (ПЦР), которая и проходит отдельно в каждой капельке эмульсии (так называемая эмульсионная ПЦР - эПЦР). Это приводит к «клональной амплификации» цепей ДНК, говоря по-русски, к тому, что на поверхности бусинки удерживается уже не одна, а около 10 млн копий уникальной ДНК-матрицы. Далее эмульсия разрушается, вновь двуцепочечные фрагменты ДНК разделяются, бусинки, несущие одноцепо-чечные копии ДНК-матрицы, помещаются в лунки «предметного стекла» - слайда особой конструкции. Каждая лунка такого слайда образует отдельный пиколитровый «реактор», в котором и будет происходить реакция секвенирования. Слайд представляет собой срез блока, полученного путем нескольких раундов вытягивания и сплавления оптических волокон.

В результате каждой итерации диаметр индивидуальных волокон уменьшается по мере того, как волокна формируют пучки шестигранной упаковки увеличивающегося поперечного диаметра. Каждое волокно имеет сердечник диаметром 44 мкм, окруженный 2-3 мкм слоем плакировки (оболочки). Затем сердечники вытравливаются, в результате получаются лунки «55 мкм глубиной, с расстоянием «50 мкм между центрами соседних лунок. Объем таких «реакторов» - 75 пиколитров; плотность размещения на поверхности слайда - 480 лунок на квадратный миллиметр. Каждый слайд несет около 1,6 млн лунок, в каждую из которых попадает одна бусинка с ДНК-матрицей.

Слайд помещается в проточную камеру таким образом, что над отверстиями лунок создается канал высотой 300 мкм, по которому в лунки поступают необходимые реактивы. Доставляемые в проточную камеру реактивы текут в слое, перпендикулярном оси лунок. Такая конфигурация позволяет

одновременно осуществлять реакции на бусинках, несущих ДНК-матрицы, внутри отдельных лунок. Добавление и удаление реагентов и продуктов реакции происходит за счет конвекционного и диффузионного переноса. Временные рамки диффузии между потоком и лунками составляют порядка 10 секунд и зависят от высоты проточной камеры и глубины лунок.

Глубина лунок тщательным образом рассчитана, исходя из следующих соображений:

- лунки должны быть достаточно глубокими, чтобы бусинки, несущие ДНК-матрицу, не выскакивали из них под действием конвекции;

- они должны быть достаточно глубокими, чтобы исключить диффузию продуктов реакции из лунок, где имело место включение нуклеоти-да, в лунки, где включения не произошло;

- лунки должны быть мелкими настолько, сколько требуется для осуществления быстрой диффузии нуклеотидов в лунку и быстрого вымывания оставшихся нуклеоти-дов и продуктов реакции в конце каждого цикла, что, в свою очередь, необходимо для обеспечения высокой продуктивности секве-нирования и снижения расходов реактивов.

Нуклеотиды (одного вида за раз) и другие реактивы, необходимые для реакции секвенирования, подаются последовательно в проточную камеру, куда помещается слайд. Каждый раз, когда определенный нуклеотид встраивается в растущую цепь ДНК в какой-нибудь из лунок, в ней высвобождается молекула пирофосфата, которая, в свою очередь, является необходимым предшественником компонента другой ферментативной реакции. Ее катализирует особый фермент, люцифераза светлячка Photinus pyralis. Но для ее осуществления необходим адено-зинтрифосфат (АТФ). Новообразованный пирофосфат превращается в лунке в АТФ под действием еще одного фермента -АТФ-сульфурилазы, далее люцифераза окисляет люциферин до оксилюциферина, реакция сопровождается хемилюминес-ценцией. Дно слайда находится в оптическом контакте с оптико-волоконным световодом, подключенным к прибору с зарядовой связью (Charge Coupled Device - CCD-сенсор), что позволяет регистрировать излучаемые фотоны со дна каждой индивидуальной лунки, в которой произошло встраивание известного нуклеотида. Общая схема пиросеквени-рования представлена на рисунке.

Связывая зарегистрированные от каждой лунки вспышки с типом нуклеотида, присутствующего в проточной камере в данный момент времени, компьютер последовательно отслеживает рост цепочек ДНК в сотнях тысяч лунок одновременно. Время, необходимое для протекания

ЩрИУУНОН Схема пиросеквенирования. А - ДНК фрагментируется, к фрагментам пришиваются олигонуклеотиды-«адаптеры»; полученные двуцепочечные молекулы ДНК разделяются на две комплементарные цепи. Б - одноцепочечные молекулы ДНК прикрепляются к бусинкам в условиях, стимулирующих попадание лишь одной молекулы на бусинку. В - эмульсия разбивается, цепи ДНК-фрагментов, образовавшиеся в результате эПЦР, разделяются. Бусинки, несущие на своей поверхности миллионы одноцепочечных копий первоначального фрагмента ДНК, помещаются в лунки оптико-волоконного слайда, по одной в каждую лунку. Г -в каждую лунку добавляются бусинки поменьше, несущие на своей поверхности ферменты, необходимые для пиросеквенирования. Д - микрофотография эмульсии, изображающая «пустые» капли и капли, содержащие бусинки с ДНК-матрицей. Толстая стрелка указывает на каплю 100 мкм, тонкая - на бусинку 28 мкм. Е - микрофотография фрагмента оптико-волоконного слайда, полученная при помощи сканирующего электронного микроскопа. Видны плакировка оптических волокон и пустые лунки

ферментативной реакции, составляет порядка 0,02-1,5 секунды. После поступления в проточную камеру каждого нуклеотида она промывается раствором, содержащим апиразу. Включение того или иного нуклеотида детектируется в результате высвобождения неорганического пирофосфата и последующего излучения света. Определить лунки, содержащие бусинки с ДНК-матрицей, можно, прочитав «последовательность-ключ» адаптерного олигонуклеотида, пришитого к началу каждой ДНК-матрицы. Из регистрируемого сигнала вычитается уровень фона, затем сигнал нормализуется и корректируется. Интенсивность нормализованного сигнала для каждой конкретной лунки во время поступления в проточную камеру определенного нуклеотида пропорциональна числу встроенных нуклеотидов, если таковые имеются. Линейность зависимости сохраняется для гомополимеров длиной как минимум в восемь нуклеотидов.

При таком секвенировании синтезом очень небольшое число ДНК-матриц на каждой бусинке теряет синхронизм, то есть вырываются вперед или начинают отставать от других матриц. Причиной этому, прежде всего, служат остающиеся в лунке нуклео-тиды или неполное удлинение цепи. Исправление таких сдвигов необходимо, поскольку потеря синхронизма создает кумулятивный эффект, сильно снижающий качество прочтения при увеличении его длины.

Исходя из подробной модели, лежащих в основе этого эффекта физических процессов, сотрудники компании 454 Life Sciences разработали особый алгоритм, позволяющий оценивать и вносить поправки на «перелет» и неполную достройку цепи, происходящие в отдельных лунках. Перед тем как составить и «записать» окончательную последовательность прочитанной ДНК, из всего массива данных для дальнейшей работы необходимо отобрать высококачественные прочтения и отбросить некачественные. Отбор основывается на наблюдении, что в прочтениях низкого качества велика доля сигналов, не позволяющих отличить циклы, в течение которых произошло включение нуклеотида, от циклов без включения. Такие двусмысленные сигналы - причина ошибок в записи последовательности отдельных прочтений. Чтобы увеличить число пригодных для использования прочтений, компанией 454 Life Sciences была разработана особая мера, позволяющая оценивать вероятность правильного определения нуклеотида в каждой конкретной позиции отдельных прочтений.

Высокая точность расшифровки последовательности достигается тем, что система осуществляет многочисленное

прочтение одного и того же фрагмента, что позволяет построить единую обобщенную (так называемую консенсусную) последовательность. Отдельные прочтения одного и того же участка ДНК выравниваются относительно друг друга, исходя из интенсивности сигналов в момент протекания через камеру того или иного нуклеотида, а не на основе последовательности этих прочтений. Затем соответствующие сигналы усредняют, только тогда записывают полученную последовательность. Такой подход значительно улучшает качество расшифровки последовательности и предоставляет возможность оценки ее качества [2, 3, 7, 16, 17].

Секвенаторы второго поколения: Illumina

Современные секвенаторы - это так называемые секвенаторы второго поколения (Second Generation Sequencing - SGS). В них участки ДНК по-прежнему многократно клонируются, но процесс чтения устроен не так, как у Сэнгера. Существует много разных методов, отличающихся довольно существенно, поэтому мы рассмотрим только один из них, самый популярный сегодня - секвенирование по методу Solexa (Illumina; смена названия произошла, когда компания купила другую).

Процесс секвенирования Illumina происходит следующим образом.

1. Копии ДНК разрезаются в случайных местах на большое число небольших участков.

2. К каждому участку с двух сторон добавляют специальные адаптеры - заранее

известные небольшие последовательности нуклеотидов.

3. Полученная смесь помещается на специально подготовленную подложку, из которой в виде решетки «растут» участки ДНК, комплементарные адаптерам. Таким образом, они способны «привязать» снабженные адаптерами участки ДНК к этим местам. Кроме того, адаптеры также содержат праймеры, участки, к которым может присоединиться ДНК-полимераза, которая осуществляет репликацию ДНК.

4. На шаге 3 разные участки ДНК случайным образом «присасываются» к разным местам в решетке. Многократное клонирование каждого участка вокруг своего места позволяет получать целые «кластеры». Этот процесс известен как bridge amplification, потому что ДНК привязывается к подложке сразу двумя концами.

5. Участки ДНК денатурируют (разрушают водородные связи), в результате из узлов решетки на подложке «растут» разные участки ДНК, состоящие из одной нити.

6. Подложка помещается в раствор, содержащий ДНК-полимеразу и специально помеченные нуклеотиды, которые сразу же заканчивают процесс репликации (в сэнгеровском секвенировании такие тоже применялись). Они присоединяются к ДНК, по одному - к каждому участку. Соответственно, к каждому участку присоединяется та «буква», с комплементарной к которой он начинается.

7. Затем «лишние» нуклеотиды смывают, а метки оставшихся считывают; в технологии Illumina это флуоресцентные метки, которые можно заставить светиться разным цветом и сфотографировать. Именно на этом шаге можно узнать, с какой буквы начинается каждый «кластер участков» ДНК.

8. После этого с уже связанных нуклео-тидов химически «срезается» радикал, который мешал дальнейшей надстройке молекулы ДНК. Теперь можно вернуться на шаг 6 и повторить процесс, читая на втором цикле вторые буквы в каждой последовательности, и так далее.

В результате на каждом цикле мы прочитываем одновременно очень большое число нуклеотидов из разных последовательностей. Но за это приходится платить тем, что участки ДНК, которые мы можем прочесть, оказываются гораздо короче, чем в случае секвени-рования по Сэнгеру - риды Illumina обычно получаются длиной около 100 нуклеотидов.

Парные риды и постановка задачи -еще одна важная деталь. Участки ДНК «присасываются» к подложке обоими концами, причем мы можем узнать, какие последовательности соответствуют одному и тому же участку. Это значит, что в реальности мы читаем один и тот же участок, длина которого нам приблизительно известна, сразу с двух сторон. В результате данные получаются примерно такого вида: ATGCAGA???????????????CACTTTA, причем расстояние между известными строчками (число вопросительных знаков) известно не совсем точно. В зависимости от технологии можно получить как очень длинные неизвестные фрагменты (около 1000 нуклеотидов), «обрамленные» двумя ридами длины 100, так и короткие фрагменты, в которых неизвестны буквально два-три десятка нуклеотидов между ридами. И те, и другие могут очень помочь в сборке.

Итак, теперь мы можем формально поставить задачу сборки геномов. Она звучит так: по большому числу подстрок небольшой длины восстановить исходную длинную строку в алфавите из букв A, C, G, T. В случае секвенирования по методу Illumina - по большому числу пар коротких подстрок, разделенных в исходной строке приблизительно известным расстоянием. Поставив эту задачу, мы можем забыть про биологию, химию и медицину: перед нами чисто алгоритмическая задача. Однако прежде чем перейти к математике, сделаем еще несколько замечаний [8, 10, 15].

Ошибки и показатели качества в сек-венаторах второго поколения

Как мы уже знаем, секвенирование всегда содержит ошибки. В секвенаторах Illumina и аналогичных ошибки, как правило, происходят на фазе, когда нужно распознать помеченные нуклеотиды,

то есть понять, каким цветом и с какой силой светятся кластеры из многократно клонированных участков ДНК. Проблема заключается в том, что из-за неидеальности остальных этапов процесса кластеры никогда не светятся только одним цветом; это всегда смесь всех четырех цветов с той или иной интенсивностью. Нужно выделить наиболее интенсивную компоненту и оценить, насколько вероятна ошибка в этой букве; эта задача называется base calling (распознавание нуклеотидов).

Другие методы секвенирования

В секвенировании лигированием (sequencing by ligation) на фазе, когда уже нужно распознавать нуклеотиды, используют не ДНК-полимеразу и процесс репликации, а специальные короткие «зонды», которые присоединяются к комплементарным нуклеотидам, фиксируются, вымываются, затем процесс повторяется снова. Так устроен секвенатор SOLiD от Applied Biosystems [8].

Принцип работы секвенатора PacBio (Pacific Biosciences) очень похож на принцип работы Illumina, но у него по-другому устроен метод детектирования - специальные «решетки» позволяют уловить сигналы от отдельных молекул (метод получил название SMRT - Single Molecule Real Time Sequencing). Это позволяет ускорить процесс, уместить больше ридов на одной подложке (нужно меньше клонировать ДНК, нет необходимости выращивать большие кластеры) и существенно увеличить длину надежно прочитываемых ридов [16].

Недавно появившийся метод ионного полупроводникового секвенирования (на нем основан секвенатор Ion Torrent) детектирует соединения (ионы), которые выделяются при присоединении нового нуклеотида к нити ДНК. Это позволяет радикально сократить время и стоимость получаемых ридов, хотя процент ошибок становится больше и их доля значительно увеличивается во фрагментах из повторяющейся одной буквы [10].

Человеческая мысль не стоит на месте: методы секвенирования постоянно совершенствуются, однако практически все современные методы выдают относительно короткие риды (от 100 до 400 нуклеотидов).

Sanger или Illumina?

Человеческий геном был впервые собран на сэнгеровских секвенаторах, причем алгоритмическая сторона того проекта была проработана гораздо меньше, чем сейчас, десять лет спустя. Алгоритмы, с помощью которых собирали первый человеческий геном, значительно проще тех, о которых будет сказано в дальнейшем. Однако первый геном все-таки собрали; может быть, весь алгоритмический прогресс - это никому

не нужный миф, и вполне хватило бы старых программ?

Невероятно, но факт: «старые» секве-наторы (первого поколения, сэнгеровские) выдают значительно более подходящие для сборки данные, чем «новые» (второго поколения). Это в основном выражается в длине ридов - тех участков ДНК, которые удается последовательно прочесть и которые, собственно, и нужно собрать в одну большую строчку. Секвенаторы первого поколения выдавали риды длиной более 500 нуклеотидов, обычно около тысячи. Современные секвенаторы выдают пары ридов, каждый из которых имеет длину около 100 нуклеотидов [7, 12, 15].

Зачем вообще использовать секвена-торы второго поколения, чем они лучше? Причина, как это нередко бывает и в науке, и даже в медицине, - чисто экономическая: современные секвенаторы гораздо дешевле. Проект по сборке первого человеческого генома, завершенный в 2003 году, занял 13 лет и стоил 3,8 мрд долларов [9]. С тех пор стоимость секве-нирования уменьшалась экспоненциально; «закон Мура в генетике» работает даже быстрее, чем обычный, и снижает цену каждые два года почти на порядок, так что, когда в 2010 году секвенировали геном самого Гордона Мура, это стоило уже всего лишь около 10 тысяч долларов. Новые технологии секвенирования обещают научиться обрабатывать геном человека за 1000 долларов и даже меньше, что открывает возможности для массового секвенирования в медицинских целях.

Л И Т Е Р А Т У Р А

1. Костюк С.А. Молекулярно-биологические методы в медицине: Монография. - Минск, 2013. - 327 с.

2. Bergot B.J., Chakerian /, Connell C.R., et al. - Bio-conjug Chem. - 1999. - Vol.58. - P.313-327.

3. Fiers W, Contreras R., Haegemann G, et al. - Nature. - 1978. - Vol.273. - P.113-120.

4. Ju J., Ruan C., Fuller CM, et al. // Anal. Chem. USA. - 1995. - Vol.92, N10. - P.4347-4351.

5. Lee L.G., Spurgeon S.L., HeinerC.R., et al. // Nucleic Acids Res. - 1997. - Vol.25. - P.2816-2822.

6. Maxam A.M., Gilbert W // Proc. Natl. Acad. Sci. USA. - 1977. - Vol.74. - P.560-564.

7. Menchen S.M., LeeL.G, ConnellC.R., et al. // Nucleic Acids Res. - 1993. - Vol.51. - P.216-242.

8. Mujumdar R.B., Ernst L.A., Mujumdar S.R., et al. // Bioconjug Chem. - 1993. - Vol.4. - P.105-121.

9. NarayananN., Little G., Lugade A., et al. - Nature. -1998. - Vol.128. - P.141-168.

10. Nunnally B.K., He H, LiL.C., et al. // Anal. Chem. USA. - 1997. - Vol.69, N13. - P.2392-2407.

11. Reddy //.В., Thimmappaya B, DharR., et al. // Science. - 1998. - Vol.200, N4341. - P.494-522.

12. Rosenblum B.B., Lee L.G, Spurgeon S.L., et al. // Nucleic Acids Res. - 1997. - Vol.25, N22. - P.4500-4504.

13. Sanger F, Coulson A.R. // J. Mol. Biol. - 1975. -Vol.94. - P.444-448.

14. Sanger F, Niclein S., Coulson A.R. // Proc. Natl. Acad. Sci. USA. - 1977. - Vol.74. - P.5463-5467.

15. Shealy D.B., Lipowska M., Lipowski J, et al. // Anal. Chem. - 1995. - Vol.67. - P.247-251.

16. Tabor S., Richardson C.C. // PNAS USA. - 1995. -Vol.92, N14. - P.6339-6343.

17. Tu O., Knott T, Marsh M., et al. // Nucleic Acids Res. - 1998. - Vol.26, N11. - P.2797-2802.

Поступила 10.03.2017 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.