Научная статья на тему 'РАЗРАБОТКА МЕТОДОВ ДНК-ФЕНОТИПИРОВАНИЯ ДЛЯ РАССЛЕДОВАНИЯ И РАСКРЫТИЯ ПРЕСТУПЛЕНИЙ'

РАЗРАБОТКА МЕТОДОВ ДНК-ФЕНОТИПИРОВАНИЯ ДЛЯ РАССЛЕДОВАНИЯ И РАСКРЫТИЯ ПРЕСТУПЛЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
208
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА / БИОИНФОРМАТИКА / ЦИФРОВАЯ ТРАНСФОРМАЦИЯ / ДНК / ФЕНОТИПИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кубасов Игорь Анатольевич

Актуальность темы статьи обусловлена важностью и необходимостью разработки инновационных технологий в условиях цифровой трансформации МВД России. На основе анализа отечественного и зарубежного опыта применения технологий искусственного интеллекта и методов биоинформатики обоснована возможность разработки методов определения фенотипических признаков человека по ДНК, изъятой с мест совершения преступлений. Применение данных методов позволит существенно повысить эффективность расследования и раскрытия преступлений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF DNA PHENOTYPING METHODS TO INVESTIGATE AND SOLVE CRIMES

The relevance of the topic of the article is due to the importance and necessity of developing innovative technologies in the context of the digital transformation of the Ministry of Internal Affairs of Russia. Based on the analysis of domestic and foreign experience in the use of artificial intelligence technologies and bioinformatics methods, the possibility of developing methods for determining human phenotypic traits based on DNA seized from crime scenes is substantiated. The use of these methods will improve the efficiency of investigation and disclosure of crimes.

Текст научной работы на тему «РАЗРАБОТКА МЕТОДОВ ДНК-ФЕНОТИПИРОВАНИЯ ДЛЯ РАССЛЕДОВАНИЯ И РАСКРЫТИЯ ПРЕСТУПЛЕНИЙ»

И. А. Кубасов, доктор технических наук, доцент

РАЗРАБОТКА МЕТОДОВ ДНК-ФЕНОТИПИРОВАНИЯ ДЛЯ РАССЛЕДОВАНИЯ И РАСКРЫТИЯ ПРЕСТУПЛЕНИЙ

DEVELOPMENT OF DNA PHENOTYPING METHODS TO INVESTIGATE AND SOLVE CRIMES

Актуальность темы статьи обусловлена важностью и необходимостью разработки инновационных технологий в условиях цифровой трансформации МВД России. На основе анализа отечественного и зарубежного опыта применения технологий искусственного интеллекта и методов биоинформатики обоснована возможность разработки методов определения фенотипических признаков человека по ДНК, изъятой с мест совершения преступлений. Применение данных методов позволит существенно повысить эффективность расследования и раскрытия преступлений.

The relevance of the topic of the article is due to the importance and necessity of developing innovative technologies in the context of the digital transformation of the Ministry of Internal Affairs of Russia. Based on the analysis of domestic and foreign experience in the use of artificial intelligence technologies and bioinformatics methods, the possibility of developing methods for determining human phenotypic traits based on DNA seized from crime scenes is substantiated. The use of these methods will improve the efficiency of investigation and disclosure of crimes.

нотипических признаков1 человека на основе анализа биологического материала, изъятого с мест совершения преступлений [2].

В данной статье приведен анализ отечественного и зарубежного опыта применения технологий искусственного интеллекта и методов биоинформатики, на основе которого обоснована возможность разработки методов определения фенотипи-ческих признаков человека по анализу ДНК2, выделенной из биологического материала, изъятого с мест совершения преступлений. Это так называемые методы ДНК-фенотипирования, представляющие собой инновационное направление в развитии методов анализа ДНК.

1. Методы анализа ДНК. Современные достижения генетики и развитие методов анализа ДНК позволяют повысить эффективность расследования и раскрытия преступлений. В настоящее время в криминалистике применяются методы ДНК-идентификации, т.е. методы установления принадлежности конкретному лицу биологических следов на основе сличения соответствия генетических характеристик (профилей ДНК) биологического материала, полученного от подозреваемого лица или из имеющейся базы данных.

1 Фенотипический признак — внешний или внутренний признак, присущий индивиду, приобретённый в процессе онтогенеза, сформированный на основе генотипа.

2 ДНК - дезоксирибонуклеиновая кислота. 166

Введение. Стартовавшая цифровая трансформация современного российского общества представляет собой переосмысление и глубокую реорганизацию всех процессов с использованием цифровых инструментов. Ожидаемый результат цифровой трансформации — это более эффективное использование ресурсов. При этом ключевое изменение, которое сопровождает цифровая трансформация, — это переход на совершенно новый уровень принятия решений на основе больших данных.

Цифровая трансформация МВД России предполагает переход на проектное управление по разработке и внедрению сквозных технологий (в том числе искусственного интеллекта и больших данных), гарантирующих существенное повышение эффективности оперативно-служебной деятельности органов внутренних дел Российской Федерации. В этой связи актуальным является проведение фундаментальных исследований и прикладных разработок в области искусственного интеллекта и анализа больших данных [1]. Поэтому в настоящее время во исполнение Ведомственной программы цифровой трансформации МВД России на 2022—2024 годы, утвержденной распоряжением МВД России от 11.01.2022 № 1/37, выполняются (наряду с другими исследованиями) НИОКР по созданию ведомственной информационной системы определения индивидуальных фе-

При этом для выявления индивидуализирующих характеристик генома1 человека используются различные типы генетических маркеров.

Предельно полной характеристикой является по-

2

следовательность нуклеотидов всего генома человека, который может быть представлен как «генетический текст» протяженностью 3 млрд молекулярных «букв» (нуклеотидов). Однако анализ такой последовательности является дорогим и трудоемким методом, поэтому на практике применяется анализ отдельных участков генома, характеристика которых позволяет установить индивидуализирующие признаки.

Во всем мире, в том числе в России, основным методом криминалистической идентификации на основе анализа ДНК в настоящее время является исследование так называемых STR маркеров3, а также перспективные исследования SNP-маркеров4.

Такой подход успешно применен при раскрытии ряда преступлений, из которых наиболее известными являются установление преступника, совершившего теракт в аэропорту Домодедово в 2011 году, и установление личности новосибирского серийного педофила, который на протяжении десяти лет оставался неуловимым для следственных органов. Генетическая экспертиза ДНК, полученной из образца тканей террориста, проводилась с использованием баз данных с характеристиками спектра и частоты мужских генетических линий в различных этнорегиональ-ных группах, которые были разработаны учеными-генетиками при исследовании генетических характеристик российских популяций. В итоге личность исполнителя теракта была установлена менее чем за неделю. Также анализ ДНК новосибирского серийного педофила указал на вероятный этнорегион происхождения преступника, что дало возможность его установить и прервать цепочку его злодеяний менее чем за месяц [3].

Следует отметить, что дальнейшее развитие этого научно-практического направления повысит точность и достоверность определения ре-

1 Геном — совокупность наследственной информации, записанная в ДНК.

2 Нуклеотиды — базовый структурный элемент ДНК. Нуклеотиды подразделяются на 4 разновидности: аденин, тимин, гуанин и цитозин. И всего четыре этих нуклеотида осуществляют запись всей наследственной информации.

3 STR — короткие, от одного-двух до нескольких десятков, тандемные повторы в конкретном ло-кусе генома (Short Tandem Repeats).

4 SNP — однонуклеотидный полиморфизм, т.е. точечные замены одного нуклеотида на другой (Single-Nucleotide Polymorphism).

зультатов, позволит значительно сузить и уточнить списки подозреваемых с их привязкой к конкретной национальности, что важно для повышения эффективности расследования и раскрытия преступлений.

2. Методы ДНК-фенотипирования, как новое направление в развитии методов анализа ДНК. Российскими учеными в области попу-ляционной генетики человека и криминалистами доказано, что методы анализа ДНК могут применяться не только для сравнения генетических характеристик биологического материала с характеристиками ДНК подозреваемого лица (ДНК-идентификация), но и для прогнозирования фенотипи-ческих признаков неизвестного лица, биологические следы которого обнаружены на месте преступления (ДНК-фенотипирование).

В 2021 году ФКУ НПО «СТиС» МВД Росси выступило государственным заказчиком успешно выполненной по государственному контракту научно-исследовательской работы «Анатомия 1», в рамках которой:

- выявлены индивидуальные фенотипические признаки, для которых разработка методов определения по анализу ДНК может быть завершена в рамках дальнейших НИОКР, и признаки, определение которых представляется достижимым, но требует проведения значительных дополнительных исследований;

- сформированы требования к применению технологий машинного обучения, биоинформатики и анализа больших данных для определения фенотипических признаков человека на основе анализа биологического материала, изъятого с мест совершения преступлений;

- определены минимальное количество полных геномов и требования к формированию репрезентативной группы лиц для последующего определения индивидуальных фенотипических признаков человека;

- предложена разработка метода определения мужских генетических линий и формирования базы данных геномной информации, характеризующей российские этнорегиональные группы и источники трудовых миграций, и разработка автоматизированной информационной системы на их основе для определения этнорегиона происхождения неизвестного индивида по его ДНК;

- предложена разработка метода определения возраста, применимого для анализа минимальных количеств биологических материалов, изымаемых с места преступления;

- предложена разработка методов определения по ДНК биометрических характеристик, используемых при распознавании лица по изображениям с камер видеонаблюдения, что позволило бы применить инновационные геномные технологии в соче-

тании с имеющимися технологиями распознавания лиц и базами данных изображений лица в раскрытии и расследовании преступлений [4].

Далее представим анализ зарубежных работ по практическому применению методов ДНК-фено-типирования.

2.1. Методы прогнозирования возраста. Некоторые фенотипические характеристики, такие как возраст, можно предсказывать регрессионной математической моделью [5]. Данная модель предсказывает возраст людей в интервале от 18 до 73 лет на основе анализа экспериментально установленного уровня химической модификации (метилирования) цитозинов в избранных участках ДНК, содержащих последовательность CpG1. Кроме того, существуют подходы к определению возраста с использованием искусственных нейронных сетей [6, 7], что может приводить к улучшению точности прогноза. В данных работах прогнозирование возраста происходит на основе определения уровня метилирования ДНК, т.е. на основе анализа шаблонов возрастных изменений в структуре, не касающихся непосредственно нуклеотидной последовательности.

Авторы [6] провели исследование возможности предсказания возраста человека линейными моделями и искусственными нейронными сетями на выборке из 1156 образцов. Исследователи применением искусственной нейронной сети получили хорошие результаты: коэффициент детерминации — 0,96, средняя абсолютная ошибка — 4,4 года для обучающей выборки, а на «слепых» тестах точность составила 4,4 года.

Исследователи использовали нейронные сети с обобщённой регрессией, в основе которых лежит комбинация радиального базиса и линейной функции (см. формулу 1), где Y является предсказываемым значением относительно х, а Ус — обучаемый параметр, характеризующий силу активации нейрона, К(х, xi) — радиально-базисная функция (см. формулу 2):

оуkK(x'xk) .

Г (Х ) - ZLiK(*,*k) ;

(1)

К(х,хк) = е~аУ2 - к = (х- хк)т(х - хк). (2)

В основе этого алгоритма лежит идея того, что каждый обучающий образец представляет собой среднее значение для радиально базисного нейрона, вычисляемого по формуле (2).

Далее был проведён подбор соотношения между выборками для обучения, проверки, итогового тестирования и подбор архитектуры нейронной сети. В общей сложности было исследовано 108 архитектур. После обобщения полученных результатов

1 Последовательность CpG — участок ДНК,

где за нуклеотидом цитозина следует нуклеотид гуанина.

на основе ранжирования моделей по корреляции и ошибкам выводов отдельно для каждого набора данных для обучения, проверки и тестирования была выбрана оптимальная архитектура нейросети и зафиксированы соотношение подмножеств данных для процесса обучения.

Данный подход послужил основой для других исследований [7]. Авторы расширили диапазон возрастов от 11 до 93 лет. Для обучения использовалось 110 образцов. В результате исследования лучшей моделью оказалась нейронная сеть с обобщённой регрессией, показав отклонение в 0,8 года на обучающем наборе данных и 4,7 года для тестирования.

2.2. Методы прогнозирования цвета глаз, волос, кожи. В исследовании [8] авторы описывают результаты построения модели мультиномиальной логистической регрессии для предсказания цвета глаз у человека на основе 6 SNP (single-nucleotide polymorphism), входящих в систему генетических маркеров цвета глаз IrisPlex, добившись показателей AUC: 0,94; 0,95; 0,74 для голубого, карего и промежуточных цветов глаз соответственно, используя выборку из 9446 образцов.

В работе [9] была описана система для одновременного прогнозирования цвета глаз и волос на основе 24 SNP (система HIrisPlex). Выборка состояла из 1878 образцов. Итоговые значения AUC для определения цвета волос: 0,92 для рыжих волос; 0,83 для чёрных волос; 0,80 для светлых волос и 0,72 для коричневых волос.

В статье [10] была представлена модель HIrisPlex-S для прогнозирования цвета кожи. Выборка состояла из 1423 образцов, количество определяемых цветов кожи — 5, используется 41 SNP. Итоговые значения AUC: для очень светлого цвета кожи — 0,74; для светлого — 0,72; для среднего — 0,73; для тёмного — 0,88; для очень тёмного — 0,96.

Для прогнозирования фенотипических характеристик в вышеуказанных подходах используется мультиномиальная логистическая регрессия. Метод представляет собой модификацию линейной регрессии для предсказания сразу нескольких величин. Авторы используют функцию Softmax для преобразования выходного вектора модели:

So f tm ax(xt) —

xk -

(3)

где п — количество элементов в векторе;

1 — индекс элемента.

Данная функция применяется к каждому элементу вектора и нормализует его значения таким образом, что сумма элементов становится равной единице. Это позволяет интерпретировать выход модели как вероятность принадлежности образца к некоторому классу.

Кроме этого, есть подходы с использованием наивного байесовского классификатора. Авторы в [11] производят классификацию цвета глаз между голубыми, карими и зелёно-карими на основе 23 SNP с заявленным значением метрики АиС: для модели для голубого цвета — 0,999; для карего — 0,99 и для зелёно-карего — 0,82. Выборка включала 416 образцов европеоидной популяции, исследователи не выявили заметной географической стратификации.

Другие исследователи в [12] описывают модель предсказания цвета волос на основе 12 SNP. Они произвели разделение на следующие классы для прогнозирования: рыжий, светлый, чёрный и коричневый. Выборка содержит 605 образцов европейцев. Были получены значения АиС: 0,94 для рыжих волос; 0,86 для светлых; 0,94 для чёрных и 0,65 для коричневых.

В работе [13] описывается построение модели предсказания цвета кожи на основе 285 образцов, используя 29 В качестве возможных вариантов цвета кожи выбрано 3: белый, чёрный и промежуточный. Исследователи получили такие значения метрики АиС: для белого цвета — 0,99, для чёрного — 0,97, для промежуточного — 0,80.

2.3. Методы прогнозирования черт лица. В публикации [14] производят прогноз следующей совокупности характеристик: 3-Э структура лица; голос; биологический возраст; рост; индекс массы тела; цвет глаз; цвет кожи; пол. Для построения системы был использован генный материал 1061 человека. Группа была этнически разнообразной: 569, 273, 63, 63 и 18 человек, которые идентифицировали себя как представители африканского, европейского, латиноамериканского, восточноазиатского и южноазиатского этносов соответственно, и 75 — как другие. Возрастной диапазон составлял от 18 до 82 лет, средний возраст — 36 лет.

Для прогнозирования лица использовалась модель на основе ридж-регрессии, которая принимает на вход вектор, описывающий геном, полученный путём применения метода главных компонент. Также модель учитывает пол человека, индекс массы тела и биологический возраст. Учёт данных характеристик человека происходит при построении векторного описания генома. Выходом модели является вектор, который декодируется в трёхмерное описание человеческого лица. Для кодирования лица также используется метод главных компонент.

В следующей статье [15] проведен анализ фенотипических признаков в условиях наличия пропусков в результатах анализа ДНК. Для этого используется факторизация матрицы признаков, полученных при первой обработке и кодировании данных. После заполнения пропусков восстановленные данные поступают на вход рекуррентной нейронной сети.

Ещё одна система прогнозирования фенотипа человека была описана в [16]. Авторы пред-

ложили альтернативный подход, а именно прогнозирование на основе фенотипа генетических последовательностей, позволяющее производить проверку соотношения с ДНК неизвестного человека. В качестве описания фенотипа используется трёхмерное изображение лица человека.

3. Программное обеспечение для применения методов ДНК-фенотипирования. Исследователи, работающие с генетическими последовательностями, используют различные программные инструменты. В публикации [17] авторы представляют платформу для глубокого обучения в геномике GenNet. Мотивацией к разработке послужила высокая эффективность применения моделей глубокого обучения на больших объёмах данных, характерных для приложений с анализом геномных последовательностей, а также возможность моделирования сильных нелинейных зависимостей. Вместе с тем есть ряд ограничений, которые не позволяли широко использовать данный класс алгоритмов в генетических исследованиях. Одно из главных — трудность интерпретации самой модели, получившейся в результате обучения. Это одна из причин широкого распространения моделей линейной регрессии при анализе геномной информации. Поскольку модель линейной регрессии является суммой произведений значений факторов, характеризующих гены, и коэффициентов настраиваемых в процессе обучения, то при анализе итоговых коэффициентов, по их значениям можно судить о степени влияния на предсказываемую величину, например, рост человека или вероятность наличия у него шизофрении. В то же время при применении нейросетевых моделей из распространённых программных пакетов, используемых специалистами по машинному обучению, таких как PyTorch, TensorFlow, MATLAB, не учитывается информация о взаимосвязи между генами. Свёр-точные нейросети в качестве весовых коэффициентов имеют матрицы или векторы, которые последовательно применяются к последовательности входных данных, без привязки между коэффициентом и конкретным геном. Такие алгоритмы нацелены на нахождение некоторых шаблонов в данных инвариантно к конкретным элементам.

Другой вид нейросетевых алгоритмов, многослойные перцептроны или нейросети с плотными слоями, обладают большей интерпретируемостью, поскольку позволяют устанавливать явное соответствие между коэффициентом модели и геном, так как каждый нейрон является моделью линейной регрессии. Однако данный вид алгоритмов подразумевает соединение всех нейронов, узлов графа вычислений, в пределах одного слоя, со всеми нейронами в предыдущем слое. Следствием этого является большое количество параметров модели, что может привести к нецеле-

сообразности обучения по причине больших временных затрат на подгонку всех параметров или даже отсутствию возможности обучить модель, поскольку не хватит ресурсов графического ускорителя, памяти для стабильного процесса обучения.

Для преодоления вышеописанных ограничений авторы разработали платформу глубокого машинного обучения, которая осуществляет построение модели, то есть формирование архитектуры искусственной нейронной сети с учётом генов, информацию о которых будет принимать на вход модель. В результате получается модель, состоящая из нейронов, соединения которых являются биологически обоснованными, весовые коэффициенты позволяют оценивать влияние конкретных генов, а также влияние взаимодействия генов на предсказываемую величину. Это позволяет сократить затраты на вычислительные ресурсы при использовании модели, а также значительно повышает интерпретируемость. Для определения необходимых соединений происходит анализ взаимодействия генов между собой на основе баз данных, таких как NCBI RefSeq, KEGG.

Реализация частичного соединения происходит за счёт использования разреженных матриц: матрицы значений весовых коэффициентов и матрицы связи между коэффициентами и нейронами. В остальном в реализации сети ведут себя точно так же, как и обычные полносвязные искусственные сети, в которых выходной сигнал получается применением функции активации к взвешенной сумме входных:

Y = Ac tiva ti on(Zf= 0 xtWi + В), (4)

где w — разреженная матрица обучаемых весов, инициализированная с матрицей связи, x — входной сигнал, B — обучаемый вес смещения. Функция активации (Activation) — любое преобразование выходного значения с целью перевода модели в нелинейную или для повышения интерпретируемости выходных значений. Примерами функций активаций являются пороговая функция (см. формулу 5) для однозначного получения класса или Sigmoid (см. формулу 6), значение которого можно интерпретировать как вероятность принадлежности к классу:

сг ч (1,х > 0.5

f(x) = {0,х < 0.5 ; (5)

5 igтo id(x) = . (6)

Интерпретация сети проста из-за простоты концепции: чем сильнее вес, тем больше он вносит вклад в окончательный прогноз сети. Простейшая сеть в этой структуре — сеть, построенная на основе аннотаций генов, может рассматриваться как ~ 20 000 (количество генов) параллельных регрессий, за которыми следует единственная логистическая регрессия. Выученные веса в этих регрессиях аналогичны коэффициентам в логистической регрессии. Для последнего узла уравнение одиночного нейрона с функцией активации Sigmoid (см. формулу 7) очень похоже на уравнение логистической регрессии (см. формулу 8):

Y = 5 i g т o id&?= 0xiWi + B ); (7)

Y = 5 ig т o i d(%= 0 Xi pt + B ). (8)

Для обоих уравнений все входные данные (от xi до xn) умножаются на обучаемые параметры w (в нейросети) и в (в логистической регрессии) с последующим добавлением обучаемого смещения B для получения вывода Y применением Sigmoid функции (6).

Таким образом, исследователи применили свой подход для анализа фенотипических признаков. Для опытов взяты большие данные из нескольких исследований, результаты которых можно использовать для предсказания фенотипов.

Заключение. Полученные результаты анализа отечественного и зарубежного опыта применения технологий искусственного интеллекта, больших данных и методов биоинформатики создают основу для разработки методик, тест-систем и программно-аппаратных комплексов в рамках дальнейших НИОКР по определению индивидуальных феноти-пических признаков человека на основе анализа биологического материала, изъятого с мест совершения преступлений.

Можно с уверенностью заключить, что разработка ведомственных информационных систем для предикции фенотипических признаков по характеристикам генома человека в сочетании с базами данных геномной информации и их применение для раскрытия и расследования преступлений позволит существенно повысить эффективность борьбы с преступностью в части выявления и идентификации личности подозреваемых в совершении преступлений, а также установления личности неопознанных тел, лиц, пропавших без вести, и жертв террористических актов.

1. Кубасов И. А. Проблемные вопросы применения технологий искусственного интеллекта в деятельности органов внутренних дел Российской Федерации // Вестник Воронежского института МВД России. — 2021. — № 3. — С. 180—186.

2. Кубасов И. А. Теоретическое обеспечение реализации федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика Российской Федерации» в сфере внутренних дел // Искусственный интеллект на службе

полиции : сборник статей международной научно-практической конференции / Академия управления МВД России. — М., 2021. — С. 42—51.

3. По следам ДНК: как генетика народонаселения помогает криминалистике / С. А. Боринская, О. П. Балановский, О. Л. Курбатова, Н. К. Янковский // Природа. — 2020. — № 11. — С. 3—14.

4. Формирование требований к проведению работ по разработке методов определения индивидуальных фенотипических признаков человека на основе анализа биологического материала, изъятого с мест совершения преступлений : отчет о научно-исследовательской работе. Шифр «Анатомия 1» / ФКУ НПО «СТиС» МВД России.

— М., 2021. — 618 л. — № госрегистрации 07218956.

5. DNA methylation-based age prediction from saliva: high age predictability by combination of 7 CpG markers / S. R. Hong [et al.] // Forensic Science International: Genetics. — 2017. — Т. 29. — С. 118—125.

6. DNA methylation-based forensic age prediction using artificial neural networks and next generation sequencing / A. Vidaki [et al.] // Forensic Science International: Genetics. — 2017. — Т. 28. — С. 225—236.

7. DNA methylation-based age prediction using massively parallel sequencing data and multiple machine learning models / A. Aliferi [et al.] // Forensic Science International: Genetics. — 2018. — Т. 37.

— С. 215—226.

8. Dembinski G. M., Picard C. J. Evaluation of the IrisPlex DNA-based eye color prediction assay in a United States population // Forensic Science International: Genetics. — 2014. — Т. 9. — С. 111—117.

9. The HIrisPlex system for simultaneous prediction of hair and eye colour from DNA / S. Walsh [et al.] //

Forensic Science International: Genetics. — 2013. — T. 7. — № 1. — C. 98—115.

10. HIrisPlex-S system for eye, hair, and skin color prediction from DNA: Massively parallel sequencing solutions for two common forensically used platforms / K. Breslin [et al.] // Forensic Science International: Genetics. — 2019. — T. 43. — DOI: 10.1016/j.fsigen.2019.102152.

11. Further development of forensic eye color predictive tests / Y. Ruiz [et al.] // Forensic Science International: Genetics. — 2013. — T. 7. — № 1. — C. 28—40.

12. Exploration of SNP variants affecting hair colour prediction in Europeans / J. Sochtig [et al.] // International journal of legal medicine. — 2015. — T. 129. — № 5. — C. 963—975.

13. Development of a forensic skin colour predictive test / O. Maroñas [et al.] // Forensic Science International: Genetics. — 2014. — T. 13. — C. 34—44.

14. Identification of individuals by trait prediction using whole-genome sequencing data / C. Lippert [et al.] // Proceedings of the National Academy of Sciences. — 2017. — T. 114. — № 38. — C. 10166— 10171.

15. Pouladi F., Salehinejad H., Gilani A. M. Deep recurrent neural networks for sequential pheno-type prediction in genomics // arXiv preprint arXiv: 1511.02554. — 2015.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16. Facial recognition from DNA using face-to-DNA classifiers / D. Sero [et al.] // Nature communications. — 2019. — T. 10. — № 1. — C. 1—12.

17. GenNet framework: interpretable neural networks for phenotype prediction / A. van Hilten [et al.] // bioRxiv. — 2021. — DOI: 10.1101/2020.06.19.159152.

REFERENCES

1. Kubasov I. A. Problemnye voprosy primeneniya tekhnologij iskusstvennogo intellekta v deyatel'nosti organov vnutrennih del Rossijskoj Federacii // Vestnik Voronezhskogo instituta MVD Rossii. — 2021. — # 3. — S. 180—186.

2. Kubasov I. A. Teoreticheskoe obespechenie real-izacii federal'nogo proekta «Iskusstvennyj intellekt» nacional'noj programmy «Cifrovaya ekonomika Rossijskoj Federacii» v sfere vnutrennih del // Iskusstvennyj intellekt na sluzhbe policii : sbornik statej mezhdunarod-noj nauchno-prakticheskoj konferencii / Akademiya upravleniya MVD Rossii. — M., 2021. — S. 42—51.

3. Po sledam DNK: kak genetika narodonasele-niya pomogaet kriminalistike / S. A. Borinskaya, O. P. Balanovskij, O. L. Kurbatova, N. K. Yankovskij // Priroda. — 2020. — # 11. — S. 3—14.

4. Formirovanie trebovanij k provedeniyu rabot po razrabotke metodov opredeleniya individual'nyh fenotipicheskih priznakov cheloveka na osnove analiza biologicheskogo materiala, iz"yatogo s mest

soversheniya prestuplenij : otchet o nauchno-issledovatel'skoj rabote. Shifr «Anatomiya 1» / FKU NPO «STiS» MVD Rossii. — M., 2021. — 618 l. — # gosregistracii 07218956.

5. DNA methylation-based age prediction from saliva: high age predictability by combination of 7 CpG markers / S. R. Hong [et al.] // Forensic Science International: Genetics. — 2017. — T. 29. — S. 118—125.

6. DNA methylation-based forensic age prediction using artificial neural networks and next generation sequencing / A. Vidaki [et al.] // Forensic Science International: Genetics. — 2017. — T. 28. — S. 225—236.

7. DNA methylation-based age prediction using massively parallel sequencing data and multiple machine learning models / A. Aliferi [et al.] // Forensic Science International: Genetics. — 2018. — T. 37. — S. 215—226.

8. Dembinski G. M., Picard C. J. Evaluation of the IrisPlex DNA-based eye color prediction assay in a

United States population // Forensic Science International: Genetics. — 2014. — T. 9. — S. 111—117.

9. The HIrisPlex system for simultaneous prediction of hair and eye colour from DNA / S. Walsh [et al.] // Forensic Science International: Genetics. — 2013. — T. 7. — # 1. — S. 98—115.

10. HIrisPlex-S system for eye, hair, and skin color prediction from DNA: Massively parallel sequencing solutions for two common forensically used platforms / K. Breslin [et al.] // Forensic Science International: Genetics. — 2019. — T. 43. — DOI: 10.1016/j.fsigen.2019.102152.

11. Further development of forensic eye color predictive tests / Y. Ruiz [et al.] // Forensic Science International: Genetics. — 2013. — T. 7. — # 1. — S. 28—40.

12. Exploration of SNP variants affecting hair colour prediction in Europeans / J. Sochtig [et al.] // International journal of legal medicine. — 2015. — T. 129. — # 5. — S. 963—975.

13. Development of a forensic skin colour predictive test / O. Marañas [et al.] // Forensic Science International: Genetics. — 2014. — T. 13. — C. 34—44.

14. Identification of individuals by trait prediction using whole-genome sequencing data / C. Lip-pert [et al.] // Proceedings of the National Academy of Sciences. — 2017. — T. 114. — # 38. — S. 10166—10171.

15. Pouladi F., Salehinejad H., Gilani A. M. Deep recurrent neural networks for sequential phenotype prediction in genomics // arXiv preprint arXiv: 1511.02554. — 2015.

16. Facial recognition from DNA using face-to-DNA classifiers / D. Sero [et al.] // Nature communications. — 2019. — T. 10. — # 1. — S. 1—12.

17. GenNet framework: interpretable neural networks for phenotype prediction / A. van Hilten [et al.] // bioRxiv. — 2021. — DOI: 10.1101/2020.06.19. 159152.

СВЕДЕНИЯ ОБ АВТОРЕ

Кубасов Игорь Анатольевич. Главный научный сотрудник ФКУ НПО «СТиС» МВД России, профессор кафедры информационных технологий Академии управления МВД России. Доктор технических наук, доцент.

Академия управления МВД России.

E-mail: igorak@list.ru

Россия, 111024, Москва, ул. Пруд Ключики, 2. Тел. 8 (916) 157-34-95.

Kubasov Igor Anatolyevich. Chief researcher of the FKU NPO "STIS" of the Ministry of Internal Affairs of Russia, professor of the department of information technologies of the Academy of Management of the Ministry of Internal Affairs of the Russia. Doctor of Technical Sciences, Associate Professor.

Academy of Management of the Ministry of Internal Affairs of Russia.

E-mail: igorak@list.ru

Work address: Russia, 111024, Moscow, Prud Klyuchiki Str., 2. Tel. 8 (916) 157-34-95.

Ключевые слова: технологии искусственного интеллекта; биоинформатика; цифровая трансформация; ДНК; фенотипирование.

Key words: artificial intelligence technologies; bioinformatics; digital transformation; DNA; phenotyping.

УДК 343.1+004.838.2

i Надоели баннеры? Вы всегда можете отключить рекламу.