Научная статья на тему 'ОБОБЩЕННЫЙ АНАЛИЗ САЙТОВ СБЫТА НАРКОТИЧЕСКИХ СРЕДСТВ АНОНИМНОГО СЕГМЕНТА СЕТИ ИНТЕРНЕТ'

ОБОБЩЕННЫЙ АНАЛИЗ САЙТОВ СБЫТА НАРКОТИЧЕСКИХ СРЕДСТВ АНОНИМНОГО СЕГМЕНТА СЕТИ ИНТЕРНЕТ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
218
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАРКОТИЧЕСКИЕ СРЕДСТВА / АНАЛИЗ ДАННЫХ / ДАРКНЕТ / ТЕНЕВОЙ ИНТЕРНЕТ / ИНТЕРНЕТ / БИГРАММЫ / ПАРСИНГ / МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ВИЗУАЛИЗАЦИЯ ДАННЫХ / БОЛЬШИЕ ДАННЫЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Поликарпов Евгений Сергеевич, Цимбал Виталий Николаевич, Толстых Андрей Андреевич

Анализируется анонимный сегмент сети Интернет, содержащий информацию о распространении наркотических средств. В ходе исследования проведено математическое моделирование и продемонстрировано перспективное применение анализа данных в деятельности органов внутренних дел, на примере г. Москвы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Поликарпов Евгений Сергеевич, Цимбал Виталий Николаевич, Толстых Андрей Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GENERAL ANALYSIS OF SITES SALES OF DRUGS IN THE ANONYMOUS SEGMENT OF THE INTERNET

The authors analyzed the anonymous Internet segment containing information on the distribution of drugs. In the course of the study, mathematical modeling was carried out and the promising application of data analysis in the activities of police was demonstrated, using the example of Moscow.

Текст научной работы на тему «ОБОБЩЕННЫЙ АНАЛИЗ САЙТОВ СБЫТА НАРКОТИЧЕСКИХ СРЕДСТВ АНОНИМНОГО СЕГМЕНТА СЕТИ ИНТЕРНЕТ»

УДК 343.575 DOI 10.24412/2073-0454-2021-4-174-178

ББК 67.408.1 © Поликарпов Е.С., Цимбал В.Н., Толстых А.А., 2021

Научные специальности: 12.00.12 — криминалистика; судебно-экспертная деятельность; оперативно-розыскная деятельность; 05.13.17 — теоретические основы информатики

ОБОБЩЕННЫЙ АНАЛИЗ САЙТОВ СБЫТА НАРКОТИЧЕСКИХ СРЕДСТВ АНОНИМНОГО СЕГМЕНТА СЕТИ ИНТЕРНЕТ

Евгений Сергеевич Поликарпов, начальник кафедры специальных информационных технологий учебно-научного комплекса информационных технологий, кандидат технических наук

Московский университет МВД России имени В.Я. Кикотя (117997, г. Москва, ул. Академика Волгина, д.12) E-mail: [email protected]

Виталий Николаевич Цимбал, доцент кафедры специальных информационных технологий учебно-научного комплекса информационных технологий, кандидат юридических наук

Московский университет МВД России имени В.Я. Кикотя (117997, г. Москва, ул. Академика Волгина, д.12) E-mail: [email protected]

Андрей Андреевич Толстых, преподаватель кафедры специальных информационных технологий учебно-научного комплекса информационных технологий

Московский университет МВД России имени В.Я. Кикотя (117997, г. Москва, ул. Академика Волгина, д.12) E-mail: [email protected]

Аннотация. Анализируется анонимный сегмент сети Интернет, содержащий информацию о распространении наркотических средств. В ходе исследования проведено математическое моделирование и продемонстрировано перспективное применение анализа данных в деятельности органов внутренних дел, на примере г. Москвы.

Ключевые слова: наркотические средства, анализ данных, даркнет, теневой Интернет, Интернет, биграммы, пар-синг, математическое моделирование, визуализация данных, большие данные.

GENERAL ANALYSIS OF SITES SALES OF DRUGS IN THE ANONYMOUS SEGMENT OF THE INTERNET

Evgeniy S. Polikarpov, Head of the Department of Special Information Technologies of the Educational and Scientific Complex of Information Technologies, Candidate of Technical Sciences

Moscow University of the Ministry of Internal Affairs of Russia named after VYa. Kikot' (117997, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]

Vitaliy N. Tsimbal, Associate Professor at the Department of Special Information Technologies of the Educational and Scientific Complex of Information Technologies, Candidate of Legal Sciences

Moscow University of the Ministry of Internal Affairs of Russia named after VYa. Kikot' (117997, Moscow, ul. Akademika Volgina, d. 12) E-mail: [email protected]

Andrey A. Tolstykh, Lecturer of the Department of Special Information Technologies of the Educational and Scientific Complex of Information Technologies

Moscow University of the Ministry of Internal Affairs of Russia named after VYa. Kikot' (117997, Moscow, ul. Akademika Volgina, d. 12)

E-mail: [email protected]

Abstract. The authors analyzed the anonymous Internet segment containing information on the distribution of drugs. In the course of the study, mathematical modeling was carried out and the promising application of data analysis in the activities of police was demonstrated, using the example of Moscow.

Keywords: drugs, data analysis, darknet, deep Internet, Internet, bigrams, parsing, mathematical modeling, data visualization, big data.

Citation-индекс в электронной библиотеке НИИОН

Для цитирования: Поликарпов Е.С., Цимбал В.Н., Толстых А.А. Обобщенный анализ сайтов сбыта наркотических средств анонимного сегмента сети Интернет. Вестник Московского университета МВД России. 2021;(4):174-178.

Злоумышленники в своей деятельности ищут все более изощренные, современные и высокотехнологичные методы для сокрытия своей противоправной деятельности. Например, если говорить о преступлениях в информационной и компьютерной сферах, то преступниками применяются технологии обеспечения анонимности в сети Интернет (VPN, сети The Onion Router (сокр. TOR) и Invisible Internet Project (сокр. I2P), вредоносные программы, технические приспособления и устройства, не говоря уже об объемных количествах привлекаемых денежных средствах для приобретения современного оборудования, самодельных устройств и других средств. Но и обычные преступления также скрываются при помощи высоких технологий.

Простые ресурсы сети Интернет (сайты, форумы, социальные сети) конечно же используются преступниками, но в основном это мошеннические действия, распространение вредоносных программ, неправомерный доступ к компьютерной информации и т. п.

В настоящее время, область интересов правоохранительных органов должна фокусироваться на анонимном сегменте сети Интернет. Технологии сложной маршрутизации и алгоритмы шифрования образовали анонимный сегмент сети, часто называемый «DarkNet», «Скрытая сеть» или «Теневая сеть». В условиях всеобщей истерии по поводу «круглосуточной слежки» спецслужб, а также постоянно появляющейся информации об утечках личных данных, теневой Интернет становится одним из наиболее интересных и современных решений как для обычного пользователя, так и преступного элемента. Доступ к технологии достаточно прост, но всё же требует установленного на компьютер специализированного браузера или приложения. Помимо перечисленных ранее технологий, широкое распространение имеют и ряд анонимных мессенджеров, основанных на технологиях XMPP, Off-the-Record Messaging (сокр. OTR), GnuPG, FileCrypt и др.

Одной из главных проблем современного общества без сомнения является употребление наркотиков. Объемы денежных средств, выручаемых от незаконного оборота подобных средств, не перестают быть привлекательными для злоумышленников. Наркоторговцы сегодня используют наиболее безопасную схему сбыта: теневой Интернет^«Маркет»^«закладка». Если покупатель получил наркотики через «закладку», то максимум, что он может сообщить сотрудникам полиции, — это название площадки и магазина, иногда возможно номер телефона в каком-либо мес-сенджере, как правило построенном на технологиях анонимности.

Продажа наркотиков в даркнете уже набрала вну-

шительные обороты, так как, это безопасно, это дешевле, чем работать в офлайн, и, конечно же, очень прибыльно. Такой метод торговли упрощает логистику и позволяет охватывать всю территорию страны.

26 февраля 2020 года президент Российской Федерации В. В. Путин в ежегодном расширенном заседании коллегии Министерства внутренних дел Российской Федерации подчеркнул особую серьезность проблемы: «Далее, это противодействие незаконному обороту наркотиков. Важнейшее направление нашей работы! Нужно работать здесь более гибко и решительно, жёстко, но строго в рамках закона... Обращаю ваше внимание: совместно с Роскомнадзо-ром МВД необходимо перекрыть доступ к сайтам и страницам в соцсетях, пропагандирующим наркотики... Кроме того, прошу Государственную Думу РФ и Правительство РФ вернуться к детальной проработке законодательной инициативы по установлению уголовной ответственности за пропаганду наркотиков в интернете»1.

В стране действующим административным и уголовным законодательством предусмотрено большое количество статей, предусматривающих юридическую ответственность за незаконный оборот наркотических средств и их аналогов: глава 6 «Административные правонарушения, посягающие на здоровье, санитарно-эпидемиологическое благополучие населения и общественную нравственность» КоАП РФ, в частности, статьи 6.8, 6.13, 6.16 и 6.16.1; глава 25 «Преступления против здоровья, населения и общественной нравственности» УК РФ, в частности, статьи 228, 228.1, 228.2, 228.3, 228.4, 229, 229.1, 230, 231 и другими.

Согласно статистическим данным ГИАЦ МВД России за 2020 год выявлено 182,9 тыс. преступлений, связанных с незаконным оборотом наркотиков (производство, хранение, сбыт, изготовление, переработка и т.п.), что меньше АППГ на 0,7%. По сравнению с АППГ на -0,3% снизилось число выявленных преступлений, совершенных с целью сбыта наркотических средств и психотропных веществ, однако, на +42,5% и +123,3% выросли производство и пересылка таких веществ, соответственно. Также незначительно снизился их удельный вес в числе преступлений, связанных с незаконным оборотом наркотиков, с 59,2% в январе-декабре 2019 года до 59,1%2.

Структура современной сети Интернет многослойна, разнообразна и сложно разветвлена. Видимый сегмент сети активно используется поисковыми сервисами и крупными компаниями для маркетинга

1 Заседание коллегии МВД России. URL: http://www.kremlin.ru/events/ president/news/62860 (дата обращения: 02.02.2021).

2 Состояние преступности в России за январь-декабрь 2020 года. URL: https://мвд.рф/reports/item/20422560/ (дата обращения: 03.02.2021).

и рекламы. Поисковые системы оценивают качество и релевантность статьи по содержащимся в ней словам и словосочетаниям. Чем больше в тексте тематических ключевых фраз, тем больше шансов, что он получит высокую оценку и соответственно продвижение в Интернете. Соответственно, если в тексте будет мало ключевых слов, но много «воды» — стоп-слов, вставных слов, шаблонных фраз, качество статьи будет низким. Оценить эти показатели помогают сервисы семантического анализа, которые показывают процент ключевых слов и количество стоп-слов в тексте. В области маркетинга и рекламы устоялась аббревиатура SEO (от англ. Search Engine Optimization) — поисковая оптимизация. На основе простых алгоритмов такой анализ позволяет определить: плотность ключевых слов, процент ключевых фраз; частотность слов; количество стоп-слов; объем текста: количество символов с пробелами и без; количество слов (уникальных, значимых, общее число); количество грамматических ошибок и т. п.

Исследования в области криминалистического анализа данных не новое направление, однако отдельные подходы к такому анализу с ориентацией на анонимный сегмент сети Интернет, встречается не часто и, как представляется, позволит повысить качество работы многих подразделений полиции. В качестве примера, рассмотрим подходы к обобщенному анализу одного из ресурсов (https://safeklad.com/), доступ к которому возможет только через браузер TOR, где пользователи могут оставить отзывы о приобретении наркотических средств на карте России по определённой локации (рис. 1).

Рис. 1. Фрагмент карты с геометкой о результатах получения закладки с наркотическим средством

Указанный сайт содержит большое количество (более 5 тыс.) отзывов (рис. 2): сведения о качестве наркотических средств, виде наркотического средства, давность и частоту приобретения наркотических средств, косвенные сведения о оперативных работниках (марка, цвет, модель и номера автомобиля), плот-

176

ности патрулей полиции, коррупционные данные в отношении отдельных сотрудников правоохранительных органов (ФИО, размер взятки), различные предупреждения и многое другое. Использование указанных данных на подобных ресурсах при качественном их анализе, позволят повысить уровень работы сотрудников полиции, общий потенциал противодействия сбыту наркотических средств в сети Интернет, борьбе с коррупцией и многому другому.

Анализ имеющихся данных можно описать как процесс, состоящий из нескольких этапов, в которых «сырые» данные превращаются в удобный для восприятия материал, на основе математических моделей. Язык программирования Python сегодня один из самых лучших языков для статистики, машинного обучения, прогнозной аналитики, а также стандартных задач по обработке данных.

Рис. 2. Пример отзыва с интерактивной карты

Процесс анализа можно представить в виде следующих основных этапов:

• сбор и извлечение данных;

• очистка и преобразование данных;

• визуализация данных;

• моделирование (интерпретации) информации.

Очистка и преобразование играет важную роль в

обработке данных для чего используются специализированные библиотеки. Можно создать свои собственные алгоритмы и библиотеки, но гораздо удобнее и быстрее пользоваться уже готовыми.

Для исследования при обобщенном анализе мы использовали следующие библиотеки: nltk — для обработки естественного языка и извлечения статистической информации из текста; pymorphy — для морфологического анализа текста; osmnx, geopandas, shapely — для обработки картографической информации; seaborn — для визуализации результатов анализа.

В рамках исследования был применен веб-парсинг, с помощью которого получена база данных, содержащая 10161 запись с текстами сообщений и геометками.

Первое на что можно обратить внимание — это статистический анализ текста на естественном языке. Процедура достаточно проста и дает хорошие результаты в построении гипотез. Результат ее визуализации представлен на рис. 3.

№ 4/2021

Вестник Московского университета МВД России

ЮРИДИЧЕСКИЕ НАУКИ

Рис. 3. Наиболее частые слова в массиве

Рис. 4. Наиболее частые словосочетания без предлогов

Продолжением анализа текста на естественном языке является выделение словосочетаний — би-грамм [2] (рис. 4).

Координатные данные также позволяют получить значимую информацию. Исследуемый нами ресурс представляет ни что иное как геоинформационную систему. Практическая ценность таких систем заключается в возможности оперирования имеющимися массивами данных для создания пространственной модели. В результате визуализации имеющегося массива получим следующие пространственные модели.

Для удобства анализа будем использовать графическое представление данных, где индивидуальные значения в таблице отображаются при помощи интенсивности цвета. Среди специалистов такой анализ называется построение тепловой карты [1].

Тепловая карта плотности распределения отзывов о фактах получения наркотических средств в городе Москва (рис. 5). На первый взгляд, показывает, что в центре города наибольшее количество «закладок»

наркотических средств, а, следовательно, и сбыт. По анализу содержания слов с учетом специфики «жаргона» наркозависимых можно выявить конкретное средство. Также следует обратить внимание на Юго-Западный административный округ города. Широкое распространение сбыта наркотических средств здесь может быть обусловлено большим количеством высших учебных заведений. Как известно, молодежная среда наиболее привлекательная для наркоторговцев. Юго-Восточный административный округ продолжает список наиболее темных областей. Полученная информация может быть ориентиром для руководства правоохранительных органов.

Продолжая линию моделей пространственных данных1 можно поменять масштаб. В качестве примера был выбран район и одноимённый муниципальный округ в городе Москва — Коптево (рис. 6). Новый масштаб позволяет выявить зоны кластеризации местоположения «закладок». Путем сопоставления зоны кластеризации с адресами лиц судимых по преступлениям, связанным с наркотическими средствами можно выявить потенциальных сбытчиков.

Рис. 5. Тепловая карта плотности распределения отзывов о закладках наркотических средств в г. Москва

Обобщенный анализ сайтов в анонимном сегменте сети Интернет, связанных с распространением наркотических средств показывает, что можно выработать, тактические и стратегические направления работы для разных подразделений полиции.

Противодействие с тактической точки зрения позволяет отслеживать текущую ситуацию и принимать оперативные меры. Для примера можно вырабатывать

1 ГОСТ Р 52438-2005 Географические информационные системы. Термины и определения.

управленческие решения по действиям патрульных служб полиции и ориентировать оперативный состав при проведении оперативно-розыскных мероприятий.

5)-»-о

^ . • < • ..-л* •

{*

Рис. 6. Местоположение закладок и расположения отделов полиции (точки — местоположение «закладок», звезды — расположение подразделений ОМВД по району Коптево)

Стратегическое противодействие, всесторонний комплекс мер, основанный на долгосрочном исследовании проблемы. В частности, углубленный анализ, спрогнозирует всплески преступности, так как лица употребляющие наркотики более склонны к совершению преступлений. Информация, полученная путем сопоставления областей сбыта с картами преобладания социальных и этнических групп, косвенно, укажет на каналы поставки наркотических средств, а также укажет на потенциальных террористов-смертников. Анализ информации о сотрудниках упоминающийся в сообщениях может использоваться в мероприятиях антикоррупционной направленности. Лингвистическое исследование текстов позволит создать словари

используемого лицами из этой преступной среды жаргонами, выявить тенденции наркосреды и распространенность типа наркотического средства в определенных районах [2]. Таким образом рассмотренный нами анализ играет важную роль в эффективности работы оперативных служб и подразделений по охране общественного порядка.

Литература

1. Буре В.М. Теория вероятностей и математическая статистика: учебник / В.М. Буре, Е.М. Парилина. Санкт-Петербург: Лань, 2021. 416 с.

2. Прикладная и компьютерная лингвистика / Под ред. И.С. Николаева, О.В. Митрениной, Т.М. Ландо. М.: URSS, 2016. 320 с.

3. Crime Data Analysis Using Data Mining Techniques to Improve Crimes Prevention. Zakaria Suliman Zubi, Ayman Altaher Mahmmud. INTERNATIONAL JOURNAL OF COMPUTERS Volume 8, 2014.

References

1. Bure V.M. Teoriya veroyatnostej i matematicheskaya statistika : uchebnik / V.M. Bure, E.M. Parilina. Sankt-Peterburg: Lan', 2021. 416 s.

2. Prikladnaya i komp'yuternaya lingvistika / Pod red. I.S. Nikolaeva, O.V. Mitreninoj, T.M. Lando. M.: URSS, 2016. 320 s.

3. Crime Data Analysis Using Data Mining Techniques to Improve Crimes Prevention. Zakaria Suliman Zubi, Ayman Altaher Mahmmud. INTERNATIONAL JOURNAL OF COMPUTERS Volume 8, 2014.

i Надоели баннеры? Вы всегда можете отключить рекламу.