ДНК-ТЕХНОЛОГИИ
Иосиф Цыбовский,
главный специалист РУП «БелЮрОбеспечение», кандидат биологических наук
Светлана Котова,
завлабораторией молекулярно-биологических исследований Научно-практического центра Государственного комитета судебных экспертиз Республики Беларусь, кандидат химических наук
Елена Спивак,
завсектором криминалистической идентификации биологических объектов Научно-практического центра Государственного комитета судебных экспертиз Республики Беларусь
Татьяна Забавская,
научный сотрудник лаборатории молекулярно-биологических исследований Научно-практического центра Государственного комитета судебных экспертиз Республики Беларусь
Роман Сергеев,
старший научный сотрудник лаборатории математической кибернетики Объединенного института проблем информатики НАН Беларуси, кандидат физико-математических наук
Аннотация. Представлены основные направления исследований, выполняемых в рамках научно-технической программы Союзного государства «ДНК-идентификация», результаты которых позволят эффективно применять новые технологии в экспертной практике Республики Беларусь. Описан уникальный информационный ресурс, реализующийся в виде программно-информационного комплекса (ПИК), включающего референсные базы данных по каждому из исследуемых типов ДНК-маркеров для представителей основных групп народонаселения нашей страны.
Ключевые слова: ДНК-идентификация, криминалистика, высокопроизводительное секвенирование, ДНК-маркеры, популяции, мегаполис, референсные базы данных.
В судебно-экспертную практику все шире внедряются современные методы исследования, которые позволяют делать выводы об основных феноти-пических признаках человека, его этнической, региональной и популяционной принадлежности, предоставляя таким образом важную информацию при поиске преступников.
Метод, основанный на анализе ДНК человека, был впервые применен при расследовании преступления в Англии в 1987 г. С тех пор способы, позволяющие описать ДНК индивида, прочно вошли в практику криминалистики. Уже в 2008 г., в 25-ю годовщину открытия ДНК-дактилоскопии, во всем мире с ее помощью было раскрыто 17 614 правонарушений, в том числе 83 убийства и 184 изнасилования. ДНК-идентификацию используют для доказательства причастности или, наоборот, непричастности подозреваемых к преступлениям, в которых они обвинялись. Исследуют ДНК и для определения биологического родства. Криминалистический «классический» анализ позволяет устанавливать идентичность двух биологических образцов (с места преступления и от подозреваемого).
Сфера применения экспертного ДНК-анализа существенно расширяется, что связано с успехами, достигнутыми в позна-
ФОРМАТЫ ДНК-ИДЕНТИФИКАЦИИ
нии генома и человеческих сообществ на базе современных высокопроизводительных технологических платформ нового поколения (N08). Основное их преимущество - возможность одновременного получения информации о строении множества десятков, сотен и даже тысяч (в случае так называемых однонуклеотидных полиморфизмов) участков ДНК за относительно короткое время. Это, в свою очередь, открывает перед правоохранительной системой, частью которой являются экспертные организации, возможности изучения полиморфизма ДНК, позволяющего высказываться об основных фено-типических признаках человека, его этнической, региональной и популяционной принадлежности, о родственных связях отдаленного характера. А это имеет важное значение при розыске подозреваемых, в том числе причастных к террористическим актам и при расследовании тяжких преступлений.
Разработка научных и методических подходов к решению криминалистических задач нового типа на основе ДНК-технологий последнего поколения -одна из частных задач научно-технической программы «Разработка инновационных геногеогра-фических и геномных технологий идентификации личности и индивидуальных особенностей человека
Рис. 1. Распределение гаплогрупп Y-хромосомы в популяциях (историко-этнографических регионах) Республики Беларусь
на основе изучения генофондов регионов Союзного государства» («ДНК-идентификация»). Она включает два блока мероприятий - медицинский и криминалистический. Три составляющие последнего реализуются с 2018 г. в НПЦ Государственного комитета судебных экспертиз Республики Беларусь по следующим направлениям: разработка технологических подходов и информационно-справочного обеспечения к определению этногеографической и популяционной принадлежности и идентификации неизвестного индивида по характеристике его ДНК, методик формирования и использования криминалистических баз данных для полиэтнического населения мегаполиса с учетом динамики генофонда в поколениях. В 2020-2021 гг. будут апробированы отечественные инновационные наборы реагентов для определения вероятных фенотипических, этнических и популяционных характеристик индивида.
Для выполнения мероприятий научно-технической программы в 2018 г. была сформирована коллекция, включающая более 2,5 тыс. образцов ДНК резидентного населения нашей страны с учетом этнической, региональной, популяционной принадлежности доноров. Работа проведена совместно с РНПЦ Трансфузиологии и медицинских биотехнологий Министерства здравоохранения Республики Беларусь и Центром исследований белорусской культуры, языка и литературы НАН Беларуси с соблюдением правовых и этических норм по сбору, хранению и использованию генетических данных.
В ходе выполнения мероприятия 3, направленного на разработку технологии определения по характеристике ДНК наиболее вероятного этногеографического происхождения неизвестного индивида, изучается генетическое разнообразие населения Беларуси по сформированной тест-системе, включающей 1035 генетических маркеров разных типов - STR и SNP-маркеров аутосом, половых X- и Y-хромосом, мтДНК. Традиционные для технологии криминалистической ДНК-идентификации STR-маркеры исследуются в виде расширенных тест-систем, включающих как ДНК-маркеры коммерческих наборов реагентов (Y-filer Plus, Power Plex Fusion 6C,
Argus X-12), так и маркеры, для которых в попу-ляционно-генетических исследованиях показана информативность в отношении дифференциации населения Союзного государства и географически близких популяций северной Евразии.
Генетический анализ по имеющейся панели маркеров проводится с использованием технологии массового параллельного секвенирования на генетическом анализаторе MiSeq FGx (Illumina, США). Уже получено более 750 генотипов белорусов по маркерам ядерной ДНК и более 1 тыс. полных последовательностей мтДНК, сформированы информационные базы данных гаплотипов Y-хромосомы и мтДНК, а также частот аллелей аутосомных ДНК-маркеров.
С целью разработки технологии ДНК-идентификации и определения популяционной принадлежности неизвестного индивида изучены генетические характеристики населения 6 основных популяций Республики Беларусь (Западное и Восточное Полесье, Понеманье, Поднепровье, Поозерье и Центральный регион) по совокупности STR маркеров аутосом (28 маркеров) и Y-хромосомы (32 маркера). Оценка генетической подразделенности на основе частот распределения гаплотипов и гаплогрупп Y-хромосомы позволила выявить статистически достоверные различия на уровне 1,05% между популяциями основных историко-этнографических регионов, при этом доля общей внутрипопуляционной изменчивости составила 98,95% (P<0,05). Между парами популяций, расположенными на северо-западе и юго-вос-
Рис.2. Карты неравномерности расселения этносов по территории Минска
токе Беларуси - Поозерьем и Восточным Полесьем, зафиксирован наибольший уровень генетических различий. Они более выражены в случае анализа частот гаплогрупп, рассчитанных на основе распределения гаплотипов и гаплогрупп и составили 1,6% и 4,28% соответственно (рис. 1).
Отдельное мероприятие Программы «ДНК-идентификация» посвящено задаче формирования генетических баз данных для населения Минска. Как и все мегаполисы, столица представляет собой особый и очень непростой для изучения тип популяционной структуры не только из-за огромного ее размера и сложной инфраструктуры, но и вследствие интенсивной динамики ее генофонда под воздействием этнодемографических процессов. Поскольку миграция приводит к изменению спектра и частот встречаемости вариантов генов, в рамках мероприятия 10 Программы разрабатывается прогноз динамики состояния генофонда населения в отношении ДНК-маркеров, значимых для криминалистики. С этой целью исследованы генетико-демографи-ческие характеристики жителей Минска с учетом его полинационального состава и уровня миграции: выполнен анализ неравномерности расселения этнических групп, построены карты территориальной подразделенности города по этническому признаку, определен уровень генетической дифференциации населения административных районов по маркерам мужских (У-хромосома) и женских (мтДНК) линий генофонда.
ФОРМАТЫ ДНК-ИДЕНТИФИКАЦИИ
Рис.3. Результаты анализа загруженного генетического профиля с использованием национальной референсной базы данных
Полученные результаты показали, что наибольший уровень этнического разнообразия характерен для Первомайского, Советского и Центрального районов, где проживает максимальное количество русских, украинцев, поляков, евреев, татар, армян, а наименьший - для Заводского района, где проживают главным образом белорусы (рис. 2). Наиболее неравномерно расселены по территории мегаполиса цыгане: около 60% проживает в Заводском и Партизанском районах.
Для прогноза динамики генофонда Минска проведена оценка миграционных процессов. Показано, что число ежегодно прибывающих в город относительно постоянно и колеблется в пределах 40-50 тыс.
человек, при этом внутриреспу-бликанская миграция сохраняется на уровне 90%. Среди мигрантов из зарубежных стран превалируют выходцы из Российской Федерации (3-4% общего потока), Украины (1-2%), Туркменистана и Китая. Изучение динамики состава мигрантов свидетельствует о стабильном вкладе въезжающих из отдельных стран по годам. Исключением являются Иран и Туркменистан, пик миграции из которых приходился на 2012 г., а также Украина, поток из которой постепенно нарастал, достиг своего максимума в 2015 г. и к 2017 г. вновь снизился.
Для оценки генетической под-разделенности населения мегаполиса по мужским линиям проведено генотипирование 32 локусов У-хромосомы для 336 образцов из коллекции «ДНК-мегаполис-Бел». Все они были уникальными и встречались в исследованной выборке только один раз. Анализ уровня подразделенности мужчин Минска не позволил выявить таковую по данным о частотах распределения гаплогрупп и гаплотипов, что свидетельствует о генетической гомогенности данной части населения.
При проведении аналогичной оценки по женским генетическим линиям получены полные последовательности мтДНК для 273 образцов жительниц столицы из коллекции «ДНК-мегаполис-Бел». В результате статистического анализа данных было показано, что все гаплотипы, зарегистрированные в ходе секвенирования полных последовательностей мтДНК женских образцов относятся к 13 парагруп-пам: С, Э, Б, НУ, Н, V, I, I, К, N Т, и, ^ Наибольшее количество гаплотипов принадлежит к пара-группе Н - 36,5%, представленной в генофонде мегаполиса 17 группами и более чем 50 субгапло-группами. Вторая по распространенности в Минске среди женщин - парагруппа и (22,26% всех гаплотипов), третья - I (более 12%), четвертая - Т (свыше 10%). На долю остальных парагрупп приходится от 0,36 до 4,75% гаплотипов.
Следует также отметить, что для выборки, сформированной из женских образцов мегаполиса, не были выявлены «необычные» для населения Восточной Европы гаплогруппы. В плане административно-территориального расселения можно сделать вывод о высокой степени генетической однородности. Как и в случае с мужским населением, для женщин также не была зарегистрирована статистически достоверная разница в частотах распределения гаплотипов и гаплогрупп в районах мегаполиса.
Результатом выполнения мероприятия 10 станет генетическая база данных жителей города, необходимая для ДНК-идентификации в криминалистике, учитывающая изменения генофонда Минска под влиянием миграционных процессов.
Комплексная технология ДНК-идентификации и определения этнической и региональной принадлежности неизвестного индивида реализуется в виде программно-информационного комплекса (ПИК), включающего референсные базы данных по каждому из исследуемых типов ДНК-маркеров (рис. 3). Комплекс позволяет вести «эталонную» базу данных о разнообразии народонаселения Республики Беларусь и имеет необходимый набор инструментов для автоматизации выполняемых на ее основе расчетов. За основу были взяты принципы создания таких авторитетных в кругу экспертов-криминалистов ресурсов, как ешрор.опНпе и yhrd.org. ПИК включает информационную часть и модули анализа данных, выполняющие функции расчета частоты встречаемости выявленного в экспертном исследовании комплекса признаков и определения наиболее вероятного этногеографического и попу-ляционного происхождения неизвестного индивида. Преимущество разрабатываемого программного комплекса - использование сведений о широком спектре ДНК-маркеров разных типов, в то время как большинство существующих популяционных баз данных оперирует только одним типом маркеров (например, маркерами У-хромосомы). Технические требования к ПИК сформированы с учетом интересов профильных подразделений Государственного комитета судебных экспертиз, мирового опыта и современных тенденций в организации криминалистических и популяционных баз данных. Информационная часть будет включать более тысячи генотипов такому же количеству генетических маркеров и разрабатывается на основе технических требований при участии специалистов Объединенного института проблем информатики НАН Беларуси.
Программно-информационный комплекс представляет собой веб-приложение, отвечающее совре-
менным стандартам и требованиям, предъявляемым к подобного рода системам. Серверная часть реализована на основе платформы Node.js, позволяющей создавать эффективные масштабируемые клиент-серверные приложения, а клиентская часть (интерфейс пользователя) построена с использованием фреймворка Angular - одной из самых популярных JavaScript платформ.
Программное обеспечение позволяет решать следующий круг задач: осуществлять учет данных по ДНК-маркерам образцов биологических материалов, сопряженный с анкетными данными индивидов, являвшихся донорами образцов; вести справочники референсных ДНК-маркеров, этно-географических групп, популяций, гаплогрупп Y-хромосомы и мтДНК; создавать и редактировать виртуальные панели локусов ДНК; проводить оценку частоты встречаемости загруженного генетического профиля в референсных популяциях; идентифицировать неизвестные образцы; определять наиболее вероятное этногеографическое или популяционное происхождение неизвестного индивида на основе анализа высокоинформативных ДНК-маркеров; вести базу генетико-демогра-фических характеристик смешанного населения Минска и прогнозировать динамику генофонда его популяции.
Таким образом, в результате выполнения мероприятий программы Союзного государства «ДНК-идентификация» в распоряжении криминалистов появится уникальный ресурс, позволяющий оказать поддержку при выполнении следственных мероприятий, функции которого могут дополняться по мере наполнения массивов генотипов и расширения панелей ДНК-маркеров.
Создание национальных референсных баз данных на основе анализа не менее чем 1 тыс. генетических маркеров ДНК представителей основных групп народонаселения Беларуси также будет способствовать получению более полной картины генетического разнообразия страны, что внесет бесценный вклад в исследование генетики восточных славян. Наличие в рамках референсной базы данных реестров STR- и SNP-маркеров аутосомной ДНК, маркеров ДНК половых X- и Y-хромосом, митохондри-альной ДНК, реестра маркеров, высокоинформативных для определения этногеографического происхождения индивида, позволит повысить точность идентификации личности, достоверность экспертного вывода, снизит временные и материальные затраты, связанные с проведением экспертиз и экспертных исследований.