УДК 575.174.5
Достижения и особенности в работе с древней ДНК и ДНК из сложных криминалистических образцов
А.П. Григоренко1' 2, С.А. Боринская1, Н.К. Янковский1, Е.И. Рогаев1,2,3'*
1 Институт общей генетики им. Н.И. Вавилова Российской академии наук, 119991, Москва, ул. Губкина,3
2 Научный центр психического здоровья Российской академии медицинских наук, 115522, Москва, Каширское шоссе, 34
3 University of Massachusetts Medical School, Worcester, U.S.A. *E-mail: [email protected]
РЕФЕРАТ Исследования древней ДНК, извлеченной из музейных образцов, археологических и палеонтологических находок, начали развиваться 25 лет назад с определения последовательности нуклеотидов (секвенирования) коротких фрагментов митохондриальной ДНК (мтДНК). Развитие методов экстракции и анализа нуклеиновых кислот позволило перейти к реконструкции полных митохондриальных геномов в древних останках. Это позволило делать заключения не только о самих организмах, вымерших десятки тысяч лет назад, но и об их популяциях и эволюции. Сейчас удается секвенировать участки ядерного генома вымерших организмов (мамонт, неандерталец) и делать заключения об их фенотипических признаках. Исследования древней ДНК стали уникальным инструментом проверки эволюционных гипотез и комплексной реконструкции истории изменений биоты. Особое внимание привлекают исследования ДНК из человеческих останков, позволяющие восстановить историю взаимоотношений различных популяций древних людей. Выявились методические особенности и проблемы, специфичные для работы с древней ДНК. Это сверхмалые количества и фрагментированность ДНК в древних образцах, а также наличие химических модификаций, блокирующих репликацию древней ДНК in vitro, либо приводящих к появлению в ней постмортальных мутаций. Те же особенности и проблемы выявились и при анализе ДНК в ряде особо сложных случаев молекулярно-генетической экспертизы криминалистических образцов (необходимость анализа сверхмалых количеств ДНК, загрязненной ДНК или ДНК, разрушенной химическими или термическими воздействиями), что осложняет или делает невозможным получение экспериментальных данных и/или их интерпретацию. Анализ этих проблем и подходы к их разрешению представлены в данном обзоре.
Ключевые слова: древняя ДНК, методы, эволюция, ДНК идентификация, криминалистическая экспертиза.
Список сокращений: мтДНК — митохондриальная ДНК, пмтДНК — полная последовательность мтДНК, STR — короткие тандемные повторы.
ВВЕДЕНИЕ
Исследования древней ДНК позволяют проводить эмпирическую проверку эволюционных гипотез и вносят значительный вклад в комплексную реконструкцию истории изменений биоты. Анализ ДНК из археологических образцов останков человека дает возможность получить сведения о генетических особенностях древнего населения различных регионов.
Первые сообщения об исследованиях древней ДНК появились 25 лет назад. Удалось выделить фрагмент ДНК из музейного образца высушенной мускульной ткани кваг-ги - южноафриканского непарнокопытного животного, вымершего в XIX в. Выделенный фрагмент ДНК был клонирован в фаговом векторе и секвенирован. Филогенетический анализ показал, что установленная последовательность фрагмента митохондриальной ДНК (мтДНК) близка к таковому одного из видов зебр [1, 2]. Следующим появилось сообщение о выделении, клонировании и секвенировании фрагмента ДНК из египетской мумии возрастом около 2400 лет [3]. За этими работами последовали попытки выделения ДНК из останков животных, растений и микроорганизмов возрастом от сотен до более миллиона лет (см. обзор в [4]). По мере накопления данных стало ясно, что возраст останков, в которых, согласно расчетам на основе кинетики
разрушения ДНК, могут сохраняться доступные для анализа матрицы, не превышает 0.1-1.0 млн лет, что степень сохранности ДНК зависит от возраста и характера биологического образца, а также в значительной мере от условий, в которых он находился [5, 6]. Сообщения о выделении ДНК из образцов возрастом более миллиона лет являются, по всей видимости, ошибочными. Фрагменты наиболее древних аутентичных ДНК были выделены из останков, найденных в вечной мерзлоте, - мамонт, бизон и другие животные, хлоропластная ДНК растений, бактериальная ДНК [7-12]. При этом удалось выделить фрагменты размером до 900-1000 пар нуклеотидов (п.н.). Низкая температура и низкая влажность способствуют лучшему сохранению ДНК, что позволяет получать пригодные для молекулярно-генетического анализа препараты ДНК из образцов возрастом в десятки тысяч лет (рис. 1) [13].
При работе с ДНК, изолированной из древних или исторических образцов, необходимо учитывать ряд методических проблем. К ним относятся сверхмалые количества и небольшие размеры фрагментов ДНК, которые удается выделить из древних образцов, а также наличие в ДНК химических модификаций, блокирующих ее репликацию либо приводящих к появлению постмортальных мутаций в последовательности нуклеотидов.
Спонтанные повреждения молекулы ДНК в живой клетке репарируются в процессе репликации или приводят к гибели и элиминации клетки. После гибели целого организма репарация, как и элиминация клеток с поврежденной ДНК, прекращается, что ведет к накоплению химических модификаций в молекуле ДНК и фрагментации молекул ДНК в клетках погибшего организма. Помимо этого ДНК в захороненных останках разрушается организмами почвенной биоты. Из-за деградации древней ДНК контаминация анализируемых образцов даже единичными молекулами современной ДНК ведет к получению ложных результатов.
Появление полимеразной цепной реакции (ПЦР) [1416] значительно расширило возможности анализа древней ДНК, т.к. позволяет in vitro быстро получать множество копий из одной исходной молекулы ДНК. Применение ПЦР позволяет избирательно амплифицировать целевые фрагменты, что особенно важно при исследовании древних образцов, в которых до 99 % ДНК может составлять примесная ДНК из почвенных бактерий и грибов.
Развитие технологий экстракции и секвенирования ДНК в последние несколько лет привело к тому, что от извлечения отдельных коротких фрагментов ДНК удалось перейти к определению полной последовательности митохондри-ального генома, определению участков ядерного генома, к анализу популяционно-генетического разнообразия вымерших видов и популяций (моа, мамонта, шерстистого носорога, пещерного медведя, бизонов Берингии, гигантского орла, неандертальца и др.) и исследованию изменений экосистем в плейстоцене и голоцене (см. обзоры [4, 17-20]).
За годы исследований был сформулирован ряд требований к условиям работы с древней ДНК и критериев аутентичности получаемых результатов. Контаминация исследуемых образцов современными ДНК остается одной из наиболее важных проблем при анализе древней ДНК. Среди наиболее известных примеров - сообщение о последовательности ДНК, выделенной из кости динозавра [21], которая, как выяснилось при последующем анализе, являлась фрагментом ядерной ДНК человека [22], а также упомянутая выше попытка секвенирования ДНК из египетской мумии [3] - в настоящее время полученная нуклеотидная последовательность рассматривается как результат загрязнения современной человеческой ДНК [17, 23].
При работе с ДНК, изолированной из древних или исторических образцов, необходимо учитывать также возможность появления ошибок в реконструируемых нуклеотид-ных последовательностях вследствие гидролитической или окислительной модификации древней ДНК. Например, определение нуклеотидных последовательностей протяженных участков ядерного генома одного и того же образца неандертальца было проведено двумя группами. Группа Эдварда Рубина из Объединенного института геномных исследований при Департаменте энергетики США опубликовала последовательность 65 000 пар нуклеотидов, а группа Свантэ Пэбо из Института эволюционной антропологии Макса Планка в Германии сообщила о секвениро-вании 1 млн пар нуклеотидов [24, 25]. Однако последующий анализ выявил значительное количество ошибок в результатах второй группы - большая доля последовательностей представляла результат контаминации современными
2 3
M
Рис. 1. Необычно высокая сохранность ДНК мамонта М. рг^т^детт, найденного в 1986 г. в вечной мерзлоте в долине реки Энмынвеем (Западная Чукотка): а — свечение ядер мышечных клеток мамонта М. ргт/депшв (возраст около 33 000 лет) при окрашивании флуоресцентным красителем DAPI, свидетельствующее о хорошей сохранности ДНК; б — электрофореграмма тотальной геномной ДНК, выделенной из мышечных клеток мамонта (на дорожку 1 нанесено в 10 раз меньшее количество ДНК, чем на дорожку 2), и контрольной тотальной ДНК из свежеполученных образцов крови человека (дорожки 3 и 4). Правая дорожка — маркер (размер фрагментов указан в т.п.н.) [13]
ДНК. Кроме того, проведенное этой группой «однопроходное» секвенирование не позволяет исключить множество ошибок, возникающих вследствие имеющихся в древней ДНК модификаций нуклеотидов, которые можно будет выявить только при условии многократного секвенирова-ния последовательностей [26-28]. Были выявлены ошибки в первой опубликованной последовательности фрагмента мтДНК неандертальца из пещеры Фельдхофер [29]. Из 27 выявленных различий с мтДНК человека 4 оказались артефактами [30]. Не свободны от ошибок и опубликованные ну-клеотидные последовательности других видов - плейстоценового пещерного медведя [31] и мамонта [32, 33] и др.
Аналогичные проблемы (например, необходимость анализа сверхмалых количеств ДНК или ДНК, разрушенной химическими или термическими воздействиями) возникают в ряде случаев и в генетической экспертизе криминалистических образцов. Анализ этих проблем и подходы к их разрешению представлены в данном обзоре.
ЭКСТРАКЦИЯ ДНК И ПРОБЛЕМА КОНТАМИНАЦИИ
Палеонтологические и археологические материалы и биологические образцы, получаемые при раскопках или хранящиеся в музеях, содержат очень малые количества ДНК, которая обычно сильно фрагментирована. Помимо этого, в древней ДНК присутствуют разного рода модификации, препятствующие амплификации или ведущие к ошибкам чтения нуклеотидной последовательности. Из-за низкой эффективности амплификации аутентичной ДНК, выделенной из древних и исторических образцов, загрязнение
4
б
а
Таблица 1. Критерии аутентичности древней ДНК
Критерии Значение для аутентичности
Для работы с древней ДНК используют только те реагенты и пластик, которые проверены на возможное присутствие амплифицируемых матриц. Так как матрицы могут содержаться в них в следовых количествах и давать амплификацию лишь в одной из нескольких проб, необходимо проводить множественные проверки. Предотвращение контаминации через реагенты и расходные материалы.
Параллельно с экстракцией ДНК из образца все манипуляции проводятся с теми же растворами, в которые не внесены матрицы. При ПЦР используется двойной негативный контроль - обычный (реакционная смесь без матрицы) и с добавлением «пустого» экстракта. Выявление контаминации, которая могла произойти во время экстракции или во время приготовления смеси для ПЦР.
Позитивный контроль обычно не применяется, т.к. он может представлять опасность контаминации. Предотвращение контаминации.
По возможности осуществляется несколько независимых экстракций ДНК из разных частей образца. Выявление внутренней контаминации образца.
Повторные амплификации материала, полученного в одной и той же или в разных экстракциях. Выявление спорадической контаминации и выявление ошибочно включенных нуклеотидов при амплификации деградированной ДНК в экстрактах, содержащих малое число матричных молекул.
Клонирование продуктов амплификации и/или секвенирование множественных клонов. Выявление гетерогенности в амплифицированных продуктах, возникшей в результате контаминации или при амплификации деградированной ДНК с модифицированными нуклеотидами.
Определение числа амплифицируемых матричных молекул ДНК (должно проводиться для каждой используемой пары праймеров, т.к. число амплифицируемых молекул сильно варьирует в зависимости от длины и нуклеотидного состава амплифицируемого фрагмента и чувствительности специфичных пар праймеров). Оценка возможности включения нуклеотидов, не соответствующих исходной последовательности. Для экстрактов, содержащих единичные молекулы, вероятность ошибочного включения велика и необходимо проведение нескольких амплификаций. Для экстрактов, содержащих более 1000 молекул, достаточно одной амплификации.
Особое «молекулярное поведение» - обратная корреляция между эффективностью амплификации и длиной амплифицируемого фрагмента. Если в образце не наблюдается более интенсивная амплификация коротких фрагментов, чем длинных по сравнению с амплификацией современной ДНК, то это является указанием, что источником ампли-фицированной ДНК явилась контаминация современными матрицами.
Биохимический анализ сохранности макромолекул. Хорошая биохимическая сохранность макромолекул указывает на высокую вероятность присутствия доступной для анализа ДНК и может поддержать аутентичность результатов секвенирования.
Исключение ядерных вставок мтДНК. В ядерной ДНК присутствуют гомологи мтДНК, что необходимо учитывать при амплификации мтДНК.
Независимое воспроизведение результатов в другой лаборатории. Позволяет определить лабораторную контаминацию образцов или реагентов, но не исключает контаминации, присущей самим образцам (загрязнений, присутствовавших в образце до его поступления в лабораторию, например внесенных во время археологических раскопок). Ранее такое требование считалось обязательным, сейчас это ограничение снято.
образца даже единичными молекулами современной ДНК приводит к получению ложных результатов. Вследствие этого, для того чтобы предотвратить амплификацию матриц, не имеющих отношения к исследуемому образцу, необходимо принимать ряд специальных мер, направленных на предотвращение контаминации и выявление результатов возможной контаминации. Ложнопозитивные результаты, обусловленные внутрилабораторной контаминацией, составляют одну из основных проблем исследования древней ДНК. Поэтому ключевым этапом молекулярно-генетического анализа древних и исторических образцов является экстракция ДНК.
Экстракция ДНК из древних образцов должна проводиться с учетом возраста и состояния образца. В частности, от этого зависит выбор детергента, используемого для лизиса клеток. Додецилсульфат натрия (SDS), применяемый в стандартных процедурах выделения ДНК для разрушения липидов, предпочтительно заменять неионными детергентами для мягкого лизиса (Triton или Twin), либо проводить выделение без детергентов, т.к. в палеообраз-цах липиды уже разрушены, и SDS снижает выход ДНК. Однако при работе с образцами относительно небольшого
возраста применение детергентов оправдано. При обработке костного материала реагентами, содержащими ЭДТА, происходит вымывание кальция из образца и изменение рН раствора, что может повлиять на эффективность связывания ДНК на колонках, применяемых на следующих этапах очистки.
Работа с древней ДНК должна проводиться в специально оборудованных помещениях, в которых принимаются все возможные меры для защиты от контаминации современными ДНК. К ним относятся помещения с измененным давлением воздуха: высоким - там, где идет работа с древними ДНК, и низким - там, где идет работа с современными ДНК или амплифицированными продуктами. Эти помещения должны регулярно дезинфицироваться химическими реагентами и ультрафиолетовым излучением, чтобы избавиться от возможного присутствия в них ДНК (исследуемой, амплифицированной или посторонней) и клеток, ее содержащих (аэрозоли и пыль с микроорганизмами и клетками человека и других организмов). Работа с древней ДНК должна проводиться в защитных костюмах, перчатках и масках. Как минимум, обработка древних образцов и процессы экстракции ДНК, при которых исследователь име-
ет дело с единичными фрагментированными молекулами, должны осуществляться в помещениях, изолированных от тех, в которых проводится ПЦР-амплификация и последующая работа с амплифицированной ДНК, представленной миллионами молекул. В помещениях для работы с древней ДНК не должны проводиться другие работы с ам-плифицированными фрагментами, т.к. предотвратить их распространение по лаборатории крайне сложно. Работать с ДНК ныне живущих организмов необходимо в отдельном здании или хотя бы в помещении с отдельной вентиляцией. Все эти меры способствуют предотвращению лабораторной контаминации, однако не сказываются на загрязнении образца, возникшем до его поступления в лабораторию. Для снижения вероятности загрязнения поверхностный слой образца обычно удаляется.
Контаминация представляет особенно значимую проблему при исследовании древних образцов человека или микроорганизмов, т.к. и человеческая ДНК, и бактериальная всегда присутствуют в лаборатории, и последовательности примесной ДНК в этих случаях труднее отличить от аутентичных последовательностей, чем при исследовании экзотических или редких видов. Правила работы с древней ДНК и критерии соответствия амплифицированных фрагментов исследуемому образцу древней ДНК (аутентичность) обобщены в ряде обзоров [4, 17, 34-36] и представлены в табл. 1.
выявление контаминации
Возможная контаминация в исследованиях древней ДНК может быть выявлена с большей надежностью, когда при анализе априорно предполагается, что экстракт будет контаминирован, и результаты каждого этапа рассматриваются с точки зрения такой возможной. Для выявления лабораторной контаминации используются т.н. «пустые» экстракции - образцы, которые подвергают таким же процедурам, что и обрабатываемый образец, однако не добавляют материал образца или ДНК. Так как посторонние матрицы могут быть представлены в очень низких концентрациях, проявляясь не в каждой реакции, ставят множественные контроли в отношении 1:5, но не менее чем 1:1 с экстрагируемым образцом. Такие «пустые» экстракты используют далее на всех этапах анализа в дополнение к обычным негативным контролям.
Независимое воспроизведение результатов другой лабораторией считается одним из наиболее сильных аргументов, подтверждающим аутентичность результатов. Однако и оно не является абсолютной гарантией [36].
Особое внимание следует уделять биоинформационному анализу полученных нуклеотидных последовательностей. Так как наиболее часто при исследовании древних образцов проводится анализ митохондриальной ДНК (мтДНК), необходимо проводить сравнение полученных последовательностей не только с мтДНК видов, близких к исследуемому, или с мтДНК человека (как возможного источника контаминации), но также и с ядерными гомологами мтДНК (nuclear mtDNAs, numts), уровень сходства которых с мтДНК у человека достигает 98 % (например, для последовательности NT_004350.18, расположенной на хромосоме 1).
химические модификации древней днк и постмортальные мутации
Постмортальные изменения ДНК и мутации, происходящие при ее амплификации in vitro, являются одной из центральных методологических проблем, присущих исследованиям древней ДНК, как и ДНК из образцов, сложных для криминалистической экспертизы. В отличие от метаболически активных тканей, в которых функционируют системы репарации ДНК, в мертвых или спящих клетках накапливаются химические (гидролитические или оксидативные) модификации и разрушения нитей ДНК. Как показывают исследования, постмортальные разрушения ДНК характеризуются разрывами нитей, утратой оснований, а также сшивками между нитями, препятствующими ПЦР. Особенно важными постмортальными изменениями являются химические модификации оснований, не препятствующие амплификации, но приводящие к включению во вновь синтезированную нить нуклеотидов, не соответствующих исходно присутствовавшим в немодифицированной нити ДНК (замены типа I A ^ G / T ^ C и замены типа II C ^ T / G ^ A) (табл. 2). Характер разрушения деградированных матриц ДНК зависит от возраста образцов, их географической локализации и тафономических условий (условий захоронения останков) той среды, из которых останки были извлечены. Постмор-тальные изменения могут возникать в «горячих точках» мутирования, имитируя тем самым эволюционный процесс [37]. Характер и динамика накопления постмортальных разрушений в ДНК продолжают исследоваться [38, 39]. Вследствие разрушения ДНК размер большинства фрагментов в древних образцах не превышает 100-500 п.н. Поэтому при проведении ПЦР на древней ДНК подбираются прай-меры для амплификации фрагментов не более 200-300 п.н., хотя в отдельных случаях могут быть получены фрагменты и большей длины (рис. 2).
о5
ол I Т КК
9 $
М ^ ^ ^ ^
Рис. 2. Пример продуктов ЦПР-амплификации фрагментов мито-хондриального генома мамонта: а — продукты ЦПР-амплификации коротких фрагментов (300—600 п.н.); б — ПЦР-амплификация длинных фрагментов, содержащих полные митохондриальные гены (1317 п.н. для гена CytB и 1613 п.н. для гена АТР6), ПЦР-фрагменты большего размера (3054 п.н. для гена ND5) получить не удалось; М — маркер, размер указан в т.п.н; К — негативные контроли [13]
б
а
Таблица 2. Различные типы разрушений в древней ДНК (по [4, 17] с изменениями)
Тип разрушения Причина разрушения Влияние на ДНК Возможное решение
Разрушение азотистых оснований и дезоксирибозы Постмортальное разрушение внутриклеточными нуклеазами, деградация микроорганизмами и др. химические процессы Апуринизация ДНК, разрыв нитей, уменьшение размера фрагментов ДНК, снижение общего количества ДНК Амплификация коротких (100-200 п.н.) перекрывающихся фрагментов
Сшивки, блокирующие ПЦР Алкилирование, реакция Майяра (реакция конденсации между сахаром и аминогруппой азотистого основания или аминокислоты) Перекрестные сшивки между нитями ДНК в одной молекуле; перекрестные сшивки между нитями ДНК в разных молекулах или сшивки ДНК с белками Обработка реагентами, разрушающими сшивки
Дезаминирование и другие формы окислительной или гидролитической модификации оснований Аденин —> гипоксантин Гуанин —> ксантин Цитозин —> урацил 5-метилцитозин —> тимин Включение при амплификации нуклеотидов, не соответствующих тем, которые присутствовали в данной позиции в исходной немодифицирован-ной матрице Обработка ДНК урацил-Ы-гликозилазой, удаляющей продукты дезаминирования цитозина. Определение консенсусной последовательности нуклеотидов на основе многократного секвенирования анализируемых участков: проведение множественных независимых ПЦР, клонирование исходной матрицы или продуктов ПЦР и секвенирование нескольких клонов
Большинство исследований древней ДНК проведено на мтДНК, которая содержится в клетке в количестве сотен и тысяч копий, и с вероятностью большей, чем ядерная ДНК, может быть успешно амплифицирована. Исследований ядерной ДНК намного меньше. Для оценки сохранности ядерной ДНК из образца мамонта М. Primigenius, найденного в вечной мерзлоте на Чукотке, были проведены амплификация, клонирование и секвенирование ядерной ДНК (Е.И. Рогаев, Э. Рубин, неопубликованные данные). Большая часть последовательностей генома была представлена фрагментами по 50-100 нуклеотидов (рис. 3). Это свидетельствует об относительно хорошей сохранности ядерной ДНК.
Постмортальные модификации случайным образом распределены в сохранившихся фрагментах ДНК. Так, в исследовании [13] при клонировании ПЦР-амплификатов мтДНК мамонта и последующем секвенировании были обнаружены однонуклеотидные замены в отдельных фрагментах со средней частотой 6 на 1000 нуклеотидов. Это
Рис. 3. Распределение размера секвенированных фрагментов при секвенировании на платформе 454. Неопубликованные данные, получены в сотрудничестве Е.И. Рогаева с M. Blow и E. Rubin
обстоятельство было учтено для точной реконструкции полной последовательности митохондриального генома чукотского мамонта М. primigenius (рис. 4) как консенсуса многократно перекрывающихся фрагментов [13]. Для дополнительного контроля постмортальных мутаций во всех генах мтДНК мамонта были определены общее число замен по сравнению с мтДНК слона Е. тахт^ и отношение несинонимичных (ведущих к замене аминокислоты) к синонимичным заменам. При этом число замен в генах мтДНК чукотского мамонта [13] оказалось меньше, чем в генах одновременно опубликованной немецкими коллегами последовательности мтДНК мамонта, найденного в Якутии [40]. Сравнительный анализ показал, что это различие обусловлено необычайно большим количеством замен на участке в 200-300 нуклеотидов в мтДНК якутского мамонта, в области генов ND1 и ND2, при этом число несинонимических замен превышало число синонимических -2:1 для гена ND1 и 7:2 для гена ND2. В гене ND2 чукотского мамонта была выявлена лишь одна синонимическая замена, а в гене ND1 отличий от гена слона найдено не было [13]. Недетектированные постмортальные мутации сказываются на результатах филогенетической реконструкции.
НОВЫЕ ТЕХНОЛОГИИ СЕКВЕНИРОВАНИЯ ДНК
При исследованиях древней ДНК приходится секвениро-вать большое количество коротких фрагментов, многократно перекрывающих одни и те же участки генома. Низкая скорость и высокая стоимость секвенирования ограничивала возможности таких исследований. В последние 3-4 года стали доступны новые технологии массивного параллельного секвенирования ДНК, что снизило стоимость секвени-рования ДНК на два порядка. Новые технологии позволяют исследователю иметь в своем распоряжении секвенирую-щие мощности, доступные ранее лишь крупным геномным центрам. Среди новых стратегий секвенирования применение в области исследований древней ДНК нашли технологии клональной амплификации с последующим параллельным секвенированием плотных микропанелей клонированных фрагментов ДНК в повторяющихся циклах
HVR D-Loop tRNA-Pro tRNA-Thr CYTB
tRNA-Phe
tRNA-Glu ND6 ND5 tRNA-Leu tRNA-Ser tRNA-His_ ND4 ND4L tRNA-Arg
tRNA-Gly COX3
ATP6 ATP8 tRNA-Lys
COX2
12SrRNA
tRNA-Val 16SrRNA tRNA-Leu ND1
tRNA-lle tRNA-Gln
tRNA-Met ND2
tRNA-Trp tRNA-Ala tRNA-Asn Replication Origin tRNA-Cys tRNA-Tyr COX1 tRNA-Ser tRNA-Asp
Рис. 4. Митохондриальный геном шерстистого мамонта М. рпт'1-genius. Определение нуклеотидной последовательности полного митохондриального генома было проведено в двух лабораториях. Перекрывающиеся продукты ПЦР-амплификации, использованные для секвенирования, показаны во внутреннем круге[13]
энзиматических реакции с компьютерной регистрацией результирующих сигналов для каждого отдельного фрагмента в каждом цикле.
Упорядоченное расположение в пространстве ПЦР-ампликонов на плоской подложке или их иммобилизация на бусинах микронного размера, которые помещаются в упорядоченные ячейки, позволяет минимизировать объем реакционной смеси, что значительно удешевляет процесс.
Реализация этих стратегий включает несколько этапов, на каждом из которых найдены свои технические решения. Так, при подготовке библиотек фрагментов ДНК с помощью ПЦР количественное соотношение продуктов амплификации не пропорционально количественному соотношению исходных матриц - некоторые фрагменты ДНК амплифицируются более эффективно, тогда как другие малоактивны при амплификации и в результате теряются. Преодолеть эту проблему позволяет эмульсионная ПЦР. Раствор ДНК вводят в смесь минеральных масел с таким расчетом, чтобы каждая молекула оказалась в собственном пузырьке, в котором, как в микрореакторе, проходит ее амплификация. Этот подход позволяет минимизировать потери отдельных исходных матриц. Существуют различные технические решения как для подготовки библиотек фрагментов, так и для других этапов процесса - энзиматических реакций, визуализации и компьютерной регистрации сигнала, хранения и обработки данных [41].
Новые возможности технологий секвенирования сочетаются с определенными ограничениями. Так, массивное параллельное пиросеквенирование, реализуемое платформой 454 Life Science system (Genome Sequence 20tm DNA sequencing System: GS20, Roche/454 Life Science), позволяет в 100 раз быстрее проводить секвенирование, чем стандартный метод с использованием капиллярного электрофореза - за один раз анализируется до 25 млн ну-клеотидов. Однако при этом читается последовательность небольшой длины (обычно менее 250-400 п.н.). Собственно, в применении к древней ДНК это не является ограничением, т.к. анализировать приходится множество фрагментов как раз такого размера.
Технология Illumina, ранее называвшаяся Solexa (по названию разработавшей ее компании), и SOLid (компания ABI) позволяют анализировать до 1 млрд нуклеоти-дов за один проход, но читаются лишь последовательности длиной 30-40 нуклеотидов (год назад было всего 25). Наличие полных последовательностей геномов человека и основных модельных организмов, используемых как референтные последовательности, позволяет картировать короткие прочтенные фрагменты и собирать их в единую последовательность.
Еще одним ограничением применения новых платформ является 10-кратное снижение точности секвенирования по сравнению с методами, основанными на принципе Сэн-гера. Однако эти технологии весьма перспективны, и можно ожидать, что они будут усовершенствованы в ближайшем будущем.
анализ деградированной днк в генетической экспертизе исторических образцов
Технологические решения, разработанные при анализе древней ДНК, могут применяться при генетической экспертизе криминалистических образцов в сложных случаях, когда для анализа доступны микроколичества ДНК или она сильно разрушена. Такие подходы были использованы при генетической экспертизе предполагаемых останков семьи императора Николая II Романова. В начале 1990-х годов неподалеку от Екатеринбурга было обнаружено захоронение, содержавшее человеческие останки. В ходе расследования было выдвинуто предположение, что останки принадлежат семье российского императора Николая II Романова, его жене императрице Александре Федоровне, их трем дочерям, придворному врачу и трем слугам, которые были расстреляны в 1918 г. [42-44]. Однако останки двух детей семьи Романовых не были идентифицированы, и обстоятельства их судьбы остались неизвестны. Среди прочих версий высказывалось предположение, что Алексей и Анастасия, младшие дети семьи Романовых, выжили в те смутные времена. В июле 2007 г. неподалеку от первого захоронения было найдено второе, с обгоревшими костными фрагментами двух скелетов. Сорок четыре костных фрагмента, извлеченных из второго захоронения, были сильно разрушены огнем и предположительно серной кислотой. Предварительная антропологическая экспертиза полусожженных костных фрагментов из второго захоронения позволила предположить, что они принадлежали мальчику в возрасте 10-14 лет и молодой женщине 18-23 лет. Для проведения генетической экспертизы были
Таблица 3. Подходы, использованные при анализе деградированной ДНК по идентификационным маркерам
Этап анализа Особые условия Реагенты и методы
Подготовка исторических образцов Независимый анализ в специально оборудованных лабораториях ИОГен (Москва) и Медицинской школы университета Масачуссетса (Ворчестер, США). Физическая и химическая очистка поверхности мелких костных фрагментов; измельчение или высверливание для получения костного порошка.
Экстракция ДНК из костных останков Все экспериментальные процедуры выполнялись в стерильных ПЦР-боксах согласно стандартам, принятым для работы с древней ДНК, с соблюдением всех мер предосторожности во избежание риска загрязнения молекулами современной ДНК. ДНК экстрагировалась из ~170—700 мг очищенного костного образца с обработкой 0.5 М ЭДТА и протеиназой К и последующей очисткой на колонках QIAquick PCR purification kit, Qiagen в соответствии с протоколом производителя с небольшими модификациями.
Экстракция ДНК из архивных пятен крови Биологический материал был получен из 4 различных пятен крови. С одного пятна брали как минимум 3 соскоба. Для минимизации возможных загрязнений ДНК выделяли только из вторых и третьих смывов каждого пятна. Экстракцию ДНК проводили с использованием набора QIAamp DNA Mini Kit (Qiagen) в соответствии с протоколом производителя (DNA Purification from Dried Blood Spots) с некоторыми модификациями.
Количественный анализ ДНК Количество тотальной ДНК определяли с помощью набора Quant-iT™ PicoGreen® Assay (Invitrogen), специфичной для человека, с использованием набора Plexor® HY assay (Promega) и системы 7500 Real-Time PCR System (Applied Biosystems).
Определение нуклео-тидной последовательности ГВР1 и ГВР2 мтДНК исторических образцов Для контроля возможной контаминацией посторонними ДНК в ходе всех анализов применялись отрицательные контроли (амплификация «пустых» экстрактов и ПЦР без добавления ДНК). Фрагменты мтДНК амплифицировали в виде коротких перекрывающихся фрагментов. Продукты ПЦР выделялись из агарозного геля с помощью наборов QIAquick Gel Extraction kit или MinElute Gel Extraction kit. Для дополнительной проверки продукты ПЦР образцов из второго погребения были клонированы.
Анализ последовательностей полного мито-хондриального генома из костных останков Из-за деградации ДНК амплифицировали короткие перекрывающиеся фрагменты размером 164-383 п.н, покрывающие весь митохондриальный геном. Из-за малого количества ДНК сначала проводили мультиплексную амплификацию с разработанными 88 парами праймеров, скомпонованных в три набора, затем продукты мультиплексной ПЦР амплифицировали с индивидуальными парами праймеров. Для секвенирования продуктов ПЦР использовали три различных стратегии.
Анализ мтДНК из пятен крови с рубашки Николая II Для некоторых SNP проводили до 5 или 7 повторяющихся ПЦР. Поскольку степень сохранности ДНК из пятен крови была неизвестна, был разработан набор ПЦР-праймеров для амплификации коротких (64—109 п.н.) фрагментов ДНК, включающих позиции для очень редких SNP, идентифицированных на предыдущем этапе для образца из скелета № 4 (предполагаемый Николая II).
Экстракция и анализ ДНК из современных образцов Все процедуры анализа современных ДНК проводились в других зданиях, физически удаленных от лабораторий древней ДНК. От всех ныне живущих родственников, участвующих в исследовании, было получено письменное информированное согласие. ДНК из щечных соскобов и капель крови экстрагировали по стандартным методикам. ПЦР проводили с использованием набора праймеров для более длинных ПЦР-продуктов.
Сборка фрагментов в непрерывную последовательность нуклеотидов (контиги) Последовательности собирали с помощью программного пакета Seqman software, DNASTAR, с использованием в качестве стандарта исправленной Кембриджской референтной последовательности (rCRS, идентификационный номер AC 000021).
Определение пола Пол определялся по стандартной методике — амплификация фрагмента гена амелогенина с помощью коммерческих наборов AmpFlSTR® MiniFiler™ (Applied Biosystems) и PowerPlex S5 (Promega). Кроме этого использовали специально разработанные праймеры для амплификации коротких фрагментов, специфичных для X- и Y-хромосом.
Анализ ядерных маркеров При первичном исследовании мтДНК или ядерной ДНК экстракты, содержащие смесь индивидуальных профилей, были исключены из дальнейшего анализа. Для каждого образца из различных экстрактов были выполнены серийные воспроизведения. Гомозиготные локусы считались аутентичными, если при множественных независимых амплификациях наблюдались воспроизведения аллеля для аутосомного STR-маркера. Для получения профилей аутосомных STR костных образцов из первого и второго погребения использовались наборы AmpFlSTR® MiniFiler™ PCR Amplification Kit (Applied Biosystems) и PowerPlex S5 System (Promega), разработанные для анализа деградированной ДНК.
SТR-профили У-хромосомы Использовали набор AmpFlSTR® Yfiler™ (Applied Biosystems) в соответствии с протоколом производителя с минимальными модификациями для деградированной ДНК.
Электрофоретический анализ Для усиления интенсивности сигнала и снижения «шумов» в STR-профилях в некоторых случаях продукты мультиплексной амплификации очищали по методике, предложенной для генотипирования низкокопийных матриц ДНК с использованием набора Qiagen's MiniElute PCR purification kit. Электрофоретический анализ проводился с использованием 96-капиллярного секвенатора 3730xl DNA Analyzer (Applied Biosystems). Результаты анализировались в пакете программ GeneMapper ® ID software v3.2 (Applied Biosystems).
Таблица 4. Базы данных, использованные при оценке популяционных частот установленных в исследовании генетических профилей
Объект сравнения Количество образцов в базе Использованные базы данных
Полный митохондриаль-ный геном 71664 2704 14486 Mitosearch (www.mitosearch.org) — содержит сиквенсы гипервариабельного района; mtDB, Human Mitochondrial Genome Database (www.genpat.uu.se/mtDB); EUROS — собственная база данных, составленная по опубликованным и собственным данным для популяций СССР/России и европейских стран (немцев, англичан и др.)
STR-гаплотип Y-хромосомы 4163 1261 U.S.Consolidated Y-STR Database, где представлены генотипы для 15-17 STR локусов (http://www.usystrdatabase.org/) Данные для русских из Y Chromosome Haplotype Reference Database (YHRD, www.yhrd.org/index.html)
Аутосомные STR > 50 000 Для целей данного исследования объединили неперекрывающиеся данные для европейских популяций из двух больших баз данных: ALFRED (http://alfred.med.yale.edu/alfred/) и The Distribution of the Human DNA-PCR Polymorphisms database (http://www.uniduesseldorf.de/WWW/MedFak/Serology/database.html) и добавили недавно опубликованные данные по русским популяциям
SNP в позиции IVS3-3 гена F9 Популяционные базы данных SNP (NCBI, HapMap Project); ~ 928 X-хромосом здоровых индивидов европейского происхождения, генотипы которых по анализируемому SNP были установлены с помощью ПЦР-ПДРФ для данного исследования База данных мутаций гемофилии B (Hemobase: Hemophilia B mutation registry; Haemophilia B mutation database)
отобраны наименее разрушенные фрагменты бедренных костей мужского и женского скелетов, которым были присвоены номера 146 и 147. Для проведения повторного более детального исследования были получены фрагменты останков из первого захоронения и собраны биологические образцы от ныне живущих родственников Николая Романова и Александры Федоровны. Помимо этого для анализа были использованы смывы с пятен крови на рубашке Николая II, хранившейся в Эрмитаже. Исследование включало следующие этапы: подготовка образцов для выделения ДНК; экстракция ДНК; определение количества выделенной тотальной ДНК и человеческой ДНК; амплификация и секвенирование гипервариабельных участков, а затем полной последовательности мтДНК (пмтДНК); определение STR-профилей Y-хромосомы; определение аутосом-ных STR-профилей; дополнительная идентификация пола с использованием маркера, разработанного для анализа деградированной ДНК [45, 46]; выделение и анализ современных ДНК и сравнение их с историческими образцами. Более подробно этапы и методы исследования ДНК-идентификационных маркеров описаны в табл. 3 [45].
анализ митохондриального генома
Полные нуклеотидные последовательности митохондри-ального генома были определены для предполагаемых останков Николая II и Александры Федоровны из первого захоронения и предполагаемых останков Алексея и его сестры из второго захоронения. Установленные митоти-пы предполагаемых Николая II и Александры Федоровны относятся к распространенным в Европе гаплогруппам мтДНК Т2 и Н1.
Последовательности пмтДНК были определены также для потомков Королевы Виктории (1819-1901) по женской линии в двух ветвях - потомков принцессы Виктории, сестры Александры Федоровны, и ее родной тети принцессы Беатрис (рис. 5). Их пмтДНК полностью совпали с установленными для предполагаемых останков Александры Федо-
ровны и детей из второго захоронения. Поиск в доступных базах данных для пмтДНК (табл. 4) показал, что ни одна из представленных в них десятков тысяч последовательностей не совпадает с пмтДНК, названной "Queen Victoria mitotype". Таким образом, в первом и втором захоронении действительно обнаружены останки внучки, правнучки и правнука Королевы Виктории.
При определении пмтДНК из предполагаемых останков Николая II было подтверждено описанное ранее наличие гетероплазмии (присутствия разных вариантов мтДНК) по сайту 16169С/Т. Помимо этого были выявлены нуклеотидные замены в кодирующей части мтДНК, в т.ч. очень редкий вариант 2850С в гене 16S rRNA (популяци-онная частота около 0.004). Нуклеотидные замены в мтДНК из предполагаемых останков Николая II и из пятен крови на рубашке полностью совпали [45]. Соотношение гетеро-
Рис. 5. Материнские линии царицы Александры Федоровны. Затемненными символами отмечены члены семьи, чей генетический материал был исследован
плазмичных вариантов мтДНК было сходным в костных останках и крови. У брата Николая II Георгия, останки которого были исследованы ранее, была выявлена гетеро-плазмия по той же позиции [43]. У потомков сестры Николая II Ксении был гомоплазмичный вариант 16169 Т, а в проведенном ранее исследовании мтДНК сына сестры Николая II Ольги был выявлен гомоплазмичный вариант 16169С [44]. Ни один из этих вариантов мтДНК не совпадал с последовательностями в базах данных (табл. 4), что свидетельствует в пользу предположения, что исследованные останки принадлежат Николаю II.
Из приведенных данных следует, что Николай II и Георгий Романовы унаследовали гетероплазмию от своей матери Марии Федоровны (принцессы Дагмар) и что у ее потомков за два поколения произошла сегрегация разных вариантов мтДНК. Нуклеотидная замена в позиции16169, обусловливающая гетероплазмию в линии Дагмар, возникла в некодирующем (гипервариабельном) районе мтДНК, отличающемся более высоким уровнем полиморфизма, чем кодирующие участки. Популяционная частота гетероплаз-мии по точечным заменам в гипервариабельном районе, согласно данным недавнего мультипопуляционного исследования, составляет в среднем 6 % [47]. Предполагается, что быстрая сегрегация гетероплазмичных вариантов мтДНК у потомков происходит из-за прохождения «бутылочного горлышка» (значительного снижения числа копий мтДНК) в процессе созревания ооцита на стадии постна-тального фолликулогенеза у млекопитающих [48].
АНАЛИЗ ЯДЕРНЫХ STR-МAРКEРОВ
Для исследования родства по мужской линии предполагаемых останков Николая II и Алексея были определены
SТR-гаплотипы Y-хромосомы. Из-за малых количеств и фрагментированности доступной для анализа ДНК были разработаны процедуры, повышающие чувствительность метода (часть из них перечислена в табл. 3) [45]. SТR-аллели были определены во множественных независимых воспроизведениях ПЦР с использованием не менее трех различных экстракций ДНК. Аутентичными считались только аллели, проявившиеся минимум в двух повторных анализах. При этих условиях был получен полный профиль для костных образцов скелета № 4 и архивных образцов крови Николая II. Для низкокопийной высокодеградированной ДНК часты выпадающие аллели для SТR-маркеров. Маркер DYS385 выявляет два локуса на Y-хромосоме. Аллель с высоким молекулярным весом (DYS385/ 14) наблюдался только один раз в повторяющихся экспериментах с ДНК, экстрагированной из образца № 146, поэтому данный аллель для образца № 146 формально обозначен как неопределенный (ND). В качестве объектов сравнения использовали ДНК из архивных пятен крови на рубашке Николая II и ДНК его родственников по мужской линии (рис. 6). SТR-гаплотипы Y-хромосом исследуемых образцов и объектов сравнения полностью совпали (рис. 7 и табл. 5).
Этот 17-локусный гаплотип уникален. Он не встречается в обширных популяционных базах данных для мультило-кусных Y-SТR (табл. 4) и впервые обнаружен в описываемом исследовании [45].
Дальнейшее генотипирование половых хромосом и ау-тосом с использованием систем мультиплексного SТR-анализа, разработанных для деградированной ДНК, показало, что мужчина (образец № 146) и женщина (образец № 147) из второго захоронения имеют генотипы,
Й
Ольга
\
Т.К.- Р.
16169 С
ш
Мария Федоровна (Принцесса Дагмар)
йсесйй тс СЙСЙ !е
Ксения
ж
\
Кс.
16169Т
рщщ
\
Николай II
16169 С/Т
ЩФШШ
пятно крови ^на рубашке
ййшш
костный фрагмент № 4-46
Рис. 6. Гетероплазмия 16169С/Т в митохондри альных (материнских) линиях императора Николая II
Таблица 5. Анализ STR-гаплотипов Y-хромосомы
Николай I (1769-1855)
Маркеры № 4 № 146 Члены семьи Романовых Архивное пятно крови на рубашке Контрольная ДНК ABI, 007
DYS456 16 16 16 16 15
DYS389I 13 13 13 13 13
DYS390 24 24 24 24 24
DYS389II 29 29 29 29 29
DYS458 17 17 17 17 17
DYS19 14 14 14 14 15
DYS385 11, 14 11, ND 11, 14 11, 14 11, 14
DYS393 13 13 13 13 13
DYS391 10 10 10 10 11
DYS439 11 11 11 11 12
DYS635 24 24 24 24 24
DYS392 13 13 13 13 13
Y-GATA-H4 12 12 12 12 13
DYS437 15 15 15 15 15
DYS438 12 12 12 12 12
DYS448 19 19 19 19 19
не совпадающие ни с одним из генотипов, определенных для останков членов семьи Романовых из первого захоронения, но соответствующие их биологическим родственникам (рис. 8). Эти данные ясно указывают на то, что вновь найденные костные останки могут принадлежать царевичу Алексею и одной из дочерей императорской семьи. Представленные данные анализа ядерной ДНК, поддержанные антропологическими данными, доказывают, что останки из второго захоронения принадлежат молодой женщине (№ 147) и мальчику (№ 146); образцы из второго захоронения не принадлежат скелету № 7 (предполагаемая мать, императрица Александра Федоровна) или скелету № 4 (предполагаемый отец, император Николай II); однако они связаны с ними через материнскую и отцовскую линии.
Статистическая оценка (отношение правдоподобия) по трем использованным идентификационным системам того, что костные останки принадлежат Николаю II, а не какому-либо другому случайному индивиду, составляет порядка септильона (> 1026) [45]. Полученная совокупность результатов генотипирования доказывает без всяких сомнений, что исследованные останки принадлежат последнему российскому императору Николаю II Романову, его жене императрице Александре Федоровне, их четырем дочерям (великим княжнам Ольге, Татьяне, Марии и Анастасии) и сыну (царевичу Алексею).
ГЕМОФИлИЯ: ПОИОК МуТАЦИЙ В ГЕНАХ
факторов свертываемости крови
Известно, что царевич Алексей страдал кровотечениями, характерными для гемофилии. В настоящее время известно, что гемофилия возникает из-за недостаточной активности факторов свертываемости крови. Дефицит фактора VIII, возникающий из-за мутаций в гене F8, вызывает более распространенную гемофилию А (примерно один из 5000 мальчиков рождается с этой болезнью), а дефицит
А1 (р. 1923)
А2 А3
(р. 1957) (р. 1963)
Рис. 7. Отцовские линии в семье Романовых. Затемненными символами отмечены члены семьи, чей генетический материал был исследован
фактора IX - гемофилию В (ген F9), встречающуюся в 5 раз реже.
В настоящее время описано несколько сотен различных мутаций, вызывающих гемофилию. Оба гена локализованы на Х-хромосоме, поэтому при наличии мутантного гена у мужчин заболевание проявляется, тогда как женщины, имеющие одну копию мутантного гена и одну копию нормального, в большинстве случаев практически здоровы, хотя у небольшой части (10 %) может быть снижена свертываемость крови. О носительстве мутации у женщины можно судить по наличию у ее сыновей гемофилии.
Это наследственное заболевание встречалось в королевских семьях Европы - у сыновей, внуков и правнуков королевы Виктории (рис. 9, в). Сама королева заболеванием не страдала, но, видимо, являлась носителем мутантного гена. Среди ныне живущих ее потомков гемофилия не зафиксирована.
0-
Император Николай II Романов
TH01 CSF1PO D2S1338 D18S51 D13S317 FGA Амелогенин FEM4sh
7,9.3 10,12 17,25 12,17 11,12 20,22 XY XY
FT
—0
7
Императрица Александра Федоровна Романова
8,8 11,12 19,23 12,13 11,11 20,20 XX XX
3
Ольга
TH01 CSF1PO D2S1338 D18S51 D13S317 FGA Амелогенин FEM4sh
8,9.3 11,12 17,19 12,12 11,11 20,22 XX XX
5
Татьяна
7,8 11,12 23,25 12,12 11,11 20,20 XX XX
0 0
147 6 146
Мария Анастасия Алексей
7,8 8,9.3 8,9.3
10,12 10,11 10,12
17,23 17,19 23,25
12,17 13,17 12,17
11,11 11,11 11,12
20,22 20,22 20,22
XX XX XY
XX XX XY
Рис. 8. Анализ половых и аутосомных STR-маркеров в ДНК из костных останков[45]
4
Таблица 6. Подходы, использованные при скрининге мутаций в генах F8 и F9
Этап анализа Особые условия Реагенты и методы
Мультиплексная ПЦР-амплификация генов фактора VIII, Ев (26 экзонов) и фактора IX, Е9 (8 экзонов), локализованных на Х-хромосоме Для анализа ядерных генов были выбраны экстракты, показавшие отсутствие контаминации посторонними образцами по результатам анализа мтДНК и SТR-маркеров. Так же как и на предыдущих этапах, использовались негативные контроли: ПЦР-амплификация «пустых» экстрактов (полученных в результате проведения всех процедур экстракции, но без добавления костного образца) и ПЦР-амплификация без добавления ДНК. Для мультиплексной ПЦР было разработано ~ 210 пар праймеров для амплификации коротких перекрывающихся фрагментов (< 200 п.н.), покрывающих все экзоны и интрон-экзонные границы в генах F8 и F9. Праймеры были скомпонованы в 14 наборов для гена F8 и 3 набора для гена F9, каждый набор включал от 7 до 30 пар праймеров. Для первичной мультиплексной ПЦР использовали ~ 100 пикограмм человеческой ДНК (соответствует 16 — 17 диплоидных геномов).
Секвенирование Параллельно осуществлялось секвенирование генов факторов свертывания крови Ев и Е9 и митохон-дриального генома для контроля контаминации и однозначной идентификации образца. Индивидуальные ПЦР-фрагменты очищали из 2.5 % агарозного геля и секвенировали с использованием двух стратегий. При одном подходе продукты ПЦР смешивали примерно в эквимолярных количествах и использовали для секвенирования (Illumina GA). Другой подход представлял прямое секвенирование индивидуальных ПЦР-продуктов на 96-капиллярном секвенаторе 3730xl DNA analyzer (Applied Biosystems).
Генотипирование выявленной мутации в гене Е9 Всего было выполнено 8 независимых амплификаций ДНК из образца № 7 (императрица Александра). Для остальных костных образцов анализу подвергали от 2 до 7 независимых экстрактов из каждого образца. Мутация, исходно выявленная при анализе ДНК из скелета № 7, была верифицирована секвенированием ультракоротких ампли-конов (63 п.н. и 83 п.н.), полученных со специально разработанными праймерами. Те же праймеры были использованы для амплификации ДНК из костных фрагментов № 146 (царевич Алексей) и № 3, № 5, № 6, № 147 (дочери Николая II и Александры).
Анализ продуктов сплайсинга Амплифицированный фрагмент, содержавший участок с мутацией в гене F9, был клонирован в векторе pET01 Exontrap (MoBiTec). После подтверждения структуры рекомбинантной молекулы сек-венированием ее использовали для трансфекции культуры клеток. На сплайсированной РНК получали кДНК с помощью RT-PCR. кДНК амплифицировали, и библиотеку ПЦР-продуктов секвени-ровали (Illumina GA). Всего идентифицировали сплайсированные последовательности в 812,114 прочтениях. Из них 99.982 % транс-криптов были сгенерированы сплайсингом в мутантном сайте, и только 0.018 % сплайсировались по сайту дикого типа.
Для того чтобы определить, имелись ли мутации в генах F8 или F9 Александры Федоровны и царевича Алексея, была проведена мультиплексная ПЦР-амплификация всех экзонов и интрон-экзонных границ в этих генах с последующим массивным параллельным секвенированием полученных продуктов. Малые количества ДНК и высокая степень ее деградации потребовали применения специальных подходов для определения нуклеотидных последовательностей фрагментов, содержащих 26 экзонов гена F8 и 8 экзонов гена F9 (описание стратегии и методов исследования дано в табл. 6).
Исследование было начато с экстрактов ДНК Александры, которые по результатам анализа мтДНК и аутосом-ных SТR-маркеров на предшествующем этапе показали отсутствие контаминации. Одновременно с амплификацией генов F8 и 8 экзонов гена F9 проводилась амплификация мтДНК для контроля контаминации и однозначной идентификации образца. Несинонимические замены или инсерционно-делеционные мутации не были найдены ни в гене F8, ни в гене F9. Однако на интрон-экзонной границе, за 3 нуклеотида до начала экзона 4 в гене F9, была выявлена однонуклеотидная замена А =>G, названная, согласно номенклатуре, IVS3-3A>G. Как и следовало ожидать для гетерозиготного носителя, у Александры Федоровны присутствовали и мутантные последовательности, и аллели дикого типа. В образцах останков Алексея содержался только мутантный аллель, что указывает, что он был гемизиготой по мутации, тогда как одна из его сестер (пред-
положительно Анастасия) была гетерозиготным носителем мутации. У других сестер мутация выявлена не была, они были гомозиготными носителями аллелей дикого типа (рис. 9) [49].
Биоинформационный анализ показал, что мутация IVS3-3A>G активирует криптический акцепторный сайт сплайсинга, что ведет к сдвигу открытой рамки считывания в мРНК гена F9 и появлению преждевременного стоп-кодона (рис. 9, а).
Влияние выявленной мутации на сплайсинг РНК было оценено экспериментально при экспрессии содержащего мутантный нуклеотид фрагмента гена Е9 в культуре клеток в составе специального рекомбинантного вектора Ехоп^ар (МоВГГес). Оценка показала, что 99.98 % транс-криптов образовывались в результате сплайсинга по му-тантному сайту. При сохранении менее 1 % активности факторов VIII или IX гемофилия проявляется в тяжелой форме [50]. При поиске в популяционных базах данных и генотипировании большой выборки индивидов мутация IVS3-3A>G не была обнаружена, но при поиске в регистре мутаций гемофилии В были найдены три индивида с такой же мутацией (табл. 4 и 5). У всех троих была снижена активность фактора IX (не более 1 % нормальной активности) и наблюдалась тяжелая форма гемофилии В. Полученные данные показывают, что наследственное заболевание в роду королевы Виктории, в т.ч. у царевича Алексея, представляло тяжелую форму гемофилии В, вызванной редкой мутацией в гене F9 [49]. Так как у предков королевы Викто-
Ген
F9 WT
EXON 3
...AAG CAG TAT GTT G
WT
I
gtaagca.......ctatctcaAag
EXON 4
AT GGA GAT CAG TGT GAG TCC AAT CCA TGT TTA...
кДНК белок
„.AAG CAG TAT GTT GAT GGA GAT CAG TGT GAG TCC AAT CCA TGT TTA... ...K QYVDGDQCESNPC L ...
F9 MUTANT
EXON 3
Ген
MUT MUT
...AAG CAG TAT GTT G gtaagca.......ctatctcaG
EXON 4
AT ATG GAG ATC AGT GTG AGT CCA ATC CAT GTT TTA.
кДНК .AAG CAG TAT GTT GAG ATG GAG ATC AGT GTG AGT CCA ATC CAT GTT TAA...
белок ... KQYVfME I S V S P I HV STOP
Рис. 9. Гемофилия в королевских домах Европы: а — точечная мутация в гене фактора свертывания крови F9, создающая альтернативный сайт сплайсинга[49]; б — родословная, показывающая передачу гемофилии от королевы Виктории к ее потомкам; в — секвенационные хроматограммы фрагмента последовательности гена F9, полученные при анализе ДНК из костных останков
ALBERT OF SAXE-COBURG-GOTHA
0т0
QEEN VICTORIA
ЗГ jzfjik ir h h ¿r 0-Jk
TSAR NICHOLAS II
0 0 0т0 JZf m 0T& 0 JZf 0
TSARINA ALEXANDRA
ir ¿ir h h h ic jlr ^mh 4r ¿ i 0
ALFONSO XIII
VICTORIA EUGENIE
1
LEOPOLD MAURICE
WALDEMAR HEINRICH TATIANA ANASTASIA
OLGA MARIA ALEXEI
RUPERT ALFONSO
1Ш1Д1 ЛА 'il д /
J L
С ? С A V5A 3 А TS G
Im
Vvl 1 Vf
N7 het A/G Александра
ш
I 'Ii КМ
1 w11Л
ü
I к
fu J U
CT CtlltlltC СТСАААбАТвб С t С AAA в A t ОС С Ï С АА/вА OA (в в СТСАОАвАТвв
N3 wt A/A Ольга
N5 wt A/A Татьяна
N147 wt A/A Мария
N6 het A/G Анастасия
N146 mut G Алексей
а
б
EDWARD VII
ALICE
LEOPOLD
BEATRICE
IRENE
BEATRICE
GONZALO
в
рии случаи гемофилии не известны, можно предположить, что эта мутация могла возникнуть de novo при образовании гамет у одного из ее родителей.
заключение
Методы анализа ДНК, разработанные и ставшие доступными в последние годы, позволяют экспериментально определять, а затем реконструировать последовательности нуклеотидов ДНК из биологических образцов длительного хранения в природных условиях или относительно недолго хранившихся в условиях, нарушаю-
щих целостность молекулы ДНК и структуру молекул, ее составляющих. Возможность получения результатов на таких образцах определяется применением новых технологий секвенирования и новых модификаций методов выделения и очистки ДНК, проведением работ в особо подготовленных и оборудованных помещениях и условиях, значительно большим количеством и разнообразием контрольных экспериментов, дополнительными способами анализа данных, исключающими ошибки интерпретации полученных результатов. Все это позволило получать информацию об организмах, вымерших десятки тысяч лет
тому назад, реконструировать эволюционные события, ранее недоступные экспериментальному исследованию. Эти разработки открыли новые возможности предельно тонкого молекулярно-генетического анализа даже на сильно разрушенной и поврежденной ДНК, что вывело на новый уровень выполнение практически важных работ по судебно-медицинской экспертизе. Приведенные в обзоре результаты не могли быть получены без разработки новых методов и технологий анализа ДНК, которые теперь могут быть перенесены в практику каждодневных
фундаментальных и прикладных исследований, делая их более надежными, быстрыми, дешевыми и информативными. •
Работа поддержана ФЦП «Исследования и разработки
по приоритетным направлениям развития научно-технологического комплекса России на 2007—2012 годы» (ГК 02.512.11.2231) и Подпрограммой «Генофонды и генетическое разнообразие» Программы Президиума РАН «Биологическое разнообразие».
СПИСОК ЛИТЕРАТУРЫ
1. Higuchi R., Bowman B., Freiberger M., Ryder O.A., Wilson A.C. // Nature. 1984. 312 (5991). P. 282-284.
2. Higuchi R.G., Wrischnik L. A., Oakes E. et al. // J. Mol. Evol. 1987. 25 (4). P. 283-287.
3. Pääbo S. // Nature. 1985. 314. P. 644-645.
4. Willerslev E., Cooper A. Ancient DNA. // Proc. Biol. Sci. 2005. 272 (1558). P. 3-16.
5. Poinar H.N., Höss M., Bada J.L., Pääbo S. // Science. 1996. 272 (5263). P. 864-866.
6. Smith C.I., Chamberlain A.T., Riley M.S. et al. // Nature. 2001. 410 (6830). P. 771-772.
7. Gilbert M.T., Wilson A.S., Bunce M. et al. // Curr. Biol. 2004. 14. P. R463-R464.
8. Shapiro B., Drummond A.J., Rambaut A. et al. // Science. 2004. 306 (5701). P. 1561-1565.
9. Willerslev E., Hansen A. J., Brand T.B. et al. // Science. 2003. 300 (5620). P. 792-795.
10. Willerslev E., Hansen A. J., Brand T.B. et al. // Curr. Biol. 2004. 14 (1). P. R9-R10.
11. Barnes I., Matheus P., Shapiro B., Jensen D., Cooper A. // Science. 2002. 295. P. 2267-2270.
12. Lambert D.M., Ritchie P.A., Millar C.D. et al. // Science. 2001. 295 (5563). P. 2270-2273.
13. Rogaev E.I., Moliaka Y.K., Malyarchuk B.A. et al. // PLoS Biol. 2006. 4 (3). P. e73.
14. Saiki R.K., Scharf S., Faloona F. et al. // Science. 1985. 230 (4732). P. 1350-1354.
15. Mullis K., Faloona F., Scharf S. et al. // Cold Spring Harb Symp Quant Biol. 1986. 51 Pt 1. P.263-373.
16. Saiki R.K., Gelfand D.H., Stoffel S. et al. // Science. 1988. 239 (4839). P. 487-491.
17. Pääbo S., Poinar H., Serre D. et al. // Annu. Rev. Genet. 2004. 38. P. 645-679.
18. Ho S.Y., Gilbert M.T. Ancient mitogenomics. // Mitochondrion. 2010. 10 (1). P. 1-11.
19. Ramakrishnan U., Hadly E.A.. // Mol Ecol. 2009. 18 (7). P. 1310-1330.
20. Hofreiter M., Stewart J. // Curr Biol. 2009. 19 (14). P. R584-R594.
21. Woodward S.R., Weyand N.J., Bunell M. // Science. 1994. 266 (5188). P. 1229-1232.
22. Collura R.V., Stewart C.B. // Nature. 1995. 378 (6556). P. 485-489.
23. Cooper A., Wayne R. // Current Opinion in Biotechnology. 1998. 9. P. 49-53.
24. Noonan J.P., Coop G., Kudaravalli S. et al. // Science. 2006. 314 (5802). P. 1113-1118.
25. Green R.E., Krause J., Ptak S.E. et al. // Nature. 2006. 444 (7117). P. 330-336
26. Wall J.D., Kim S.K. // PLoS Genet. 2007. 3 (10). P. 1862-1866.
27. Green R.E., Malaspinas A.S., Krause J. et al. // Cell. 2008. 134 (3). P. 416-426.
28. Pennisi E. // Science. 2009. 323 (5916). P. 866-871.
29. Krings M., Stone A., Schmitz R.W. et al. // Cell. 1997. 90. P. 19-30.
30. Schmitz R.W., Serre D., Bonani G. Et al. // Proc. Natl. Acad. Sci. USA. 2002. 99 (20). P. 13342-13347
31. Noonan J.P., Hofreiter M., Smith D. et al. // Science. 2005. 309 (5734). P. 597-599.
32. Poinar H.N., Schwarz C., Qi J. et al. // Science. 2006. 311 (5759). P.392-394.
33. Schwarz C., Debruyne R., Kuch M. et al. // Nucleic Acids Res. 2009. 37 (10). P. 3215-3129.
34. Cooper A., Poinar H.N. // Science. 2000. 289 (5482). P. 1139
35. Binladen J., Wiuf C., Gilbert M.T. et al. Assessing the fidelity of ancient DNA sequences amplified from nuclear genes. // Genetics. 2006. 172 (2). P. 733-741.
36. Endicott P., Sanchez J. J., Pichler I. et al. // BMC Genet. 2009. 10. P. 29.
37. Pusch C.M., Broghammer M., Nicholson G.J. et al. //Mol. Biol. Evol. 2004. 21 (11). P. 2005-2011.
38. Gilbert M.T., Hansen A. J., Willerslev E. et al. // Am J. Hum. Genet. 2003. 72 (1). P. 48-61.
39. Lamers R., Hayter S., Matheson C.D. // J. Mol. Evol. 2009. 68 (1). P. 40-55.
40. Krause J., Dear P.H., Pollack J.L. // Nature. 2006.439 (7077). P. 724-727.
41. Shendure J., Ji H. // Nat. Biotechnol. 2008.;6 (10). P. 1135-1145.
42. Gill P., Ivanov P.L., Kimpton C. et al. // Nat. Genet. 1994. 6 (2). P. 130-135.
43. Ivanov P.L., Wadhams M.J., Roby R.K. et al. // Nat. Genet. 1996. 12 (4). P. 417-420.
44. Рогаев Е.И. Анализ митохондриальной ДНК предполагаемых останков Николая II и его племянника. // В кн.: Покаяние. Материалы правительственной комиссии: М., 1998. С. 171-182.
45. Rogaev E.I., Grigorenko A.P., Moliaka Y.K. et al // Proc. Natl. Acad. Sci U S A. 2009a. 106 (13). P. 5258-5263.
46. Григоренко А.П., Андреева Т.В., Рогаев Е.И. // Медицинская генетика. 2009. 8 (4). С. 45-46.
47. Irwin J.A., Saunier J.L., Niederstatter H. et al. // J. Mol. Evol. 2009.68. P. 516-527.
48. Wai T., Teoli D., Shoubridge E.A. // Nat. Genet. 2008. 40 (12). P. 1484-1488.
49. Rogaev E.I., Grigorenko A.P., Faskhutdinova G., Kittler E.L., Moliaka Y.K. // Science. 2009b. 326 (5954). P. 817.
50. White G.C., Rosendaal F., Aledort L.M. et al. // Thromb. Haemost. 2001. 85 (3). P. 560.