Научная статья на тему 'Выявление латентных связей в социальных сетях в целях противодействия незаконному обороту наркотиков'

Выявление латентных связей в социальных сетях в целях противодействия незаконному обороту наркотиков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
298
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЗАКОННЫЙ ОБОРОТ НАРКОТИКОВ / ILLICIT DRUG TRAFFICKING / РАСКРЫТИЕ И РАССЛЕДОВАНИЕ ПРЕСТУПЛЕНИЙ / DISCLOSURE AND INVESTIGATION OF CRIMES / ИНТЕРНЕТ / INTERNET / СОЦИАЛЬНЫЕ СЕТИ / SOCIAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Галушин Павел Викторович

В статье рассматриваются возможности и алгоритм выявления латентных связей в социальных сетях в целях получения информации, имеющей значение для раскрытия и расследования преступлений в сфере незаконного оборота наркотиков; показано, как предлагаемый алгоритм может быть применён для получения дополнительной характеризующей информации о лицах, представляющих оперативный интерес.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Галушин Павел Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IDENTIFICATION OF THE LATENT CONNECTIONS IN SOCIAL NETWORKS TO COUNTERACT DRUG TRAFFICKING

The article considers the opportunities and algorithm of detection of the latent connections in social networks in order to obtain information relevant to the disclosure and investigation of crimes in the sphere of drug trafficking. The author shows how the proposed algorithm can be applied to obtain further characterizing information on the persons of operational interest.

Текст научной работы на тему «Выявление латентных связей в социальных сетях в целях противодействия незаконному обороту наркотиков»

УДК 004.738.52:347.93

Павел Викторович ГАЛУШИН,

старший преподаватель кафедры информационно-правовых дисциплин и специальной техники Сибирского юридического института МВД России (г. Красноярск), кандидат технических наук

galushin@gmail. com

ВЫЯВЛЕНИЕ ЛАТЕНТНЫХ СВЯЗЕЙ В СОЦИАЛЬНЫХ СЕТЯХ В ЦЕЛЯХ ПРОТИВОДЕЙСТВИЯ НЕЗАКОННОМУ ОБОРОТУ НАРКОТИКОВ

IDENTIFICATION OF THE LATENT CONNECTIONS IN SOCIAL NETWORKS TO COUNTERACT DRUG TRAFFICKING

В статье рассматриваются возможности и алгоритм выявления латентных связей в социальных сетях в целях получения информации, имеющей значение для раскрытия и расследования преступлений в сфере незаконного оборота наркотиков; показано, как предлагаемый алгоритм может быть применён для получения дополнительной характеризующей информации о лицах, представляющих оперативный интерес.

The article considers the opportunities and algorithm of detection of the latent connections in social networks in order to obtain information relevant to the disclosure and investigation of crimes in the sphere of drug trafficking. The author shows how the proposed algorithm can be applied to obtain further characterizing information on the persons of operational interest.

Ключевые слова: незаконный оборот наркотиков, раскрытие и расследование преступлений, Интернет, социальные сети.

Keywords: illicit drug trafficking, disclosure and investigation of crimes, the Internet, social networks.

Пропаганда наркотиков и организация их незаконного оборота в информационно-телекоммуникационной сети Интернет остаётся одной из серьезных проблем, стоящих перед правоохранительными органами. Такие особенности сети Интернет, как высокая скорость коммуникации и высокая степень анонимности, делают ее привлекательной для правонарушителей торговой и информационной площадкой.

В настоящее время социальные сети развиваются стремительными темпами и охватывают всё большее число пользователей сети Интернет. Так, в одной из самых популярных социальных сетей "ТасеЬоок" зарегистрированы более 1,5 миллиардов активных пользователей, российские социальные сети "ВКонтакте" и

"Одноклассники" насчитывают более 200 миллионов пользователей каждая. Это расширение является не только количественным, но и качественным - участниками социальных сетей становятся люди разных социальных слоёв. Пользователи социальных сетей ежедневно выкладывают информацию о себе и своих связях с другими пользователями. Таким образом, социальные сети содержат огромные массивы данных о лицах, представляющих интерес для правоохранительных органов, и взаимоотношениях между ними.

Понимая, что информация, размещённая в социальных сетях, может быть использована правоохранительными органами, правонарушитель может попытаться скрыть свои связи. Он может вообще не добавлять в список друзей лиц, связь с

- 54 -

№ 1 (26) • 2017

Противодействие наркоугрозе: _ проблемы, пути решения

которыми хотел бы скрыть, либо не отображать их в общедоступном списке своих друзей (такую возможность предоставляет, в частности, социальная сеть "ВКонтакте").

Для преодоления указанных трудностей можно предложить метод выявления круга лиц, которые с большой вероятностью могут быть друзьями пользователя, представляющего интерес для раскрытия и расследования преступлений.

Одна из особенностей социальных сетей заключается в том, что информацию о конкретном пользователе может разместить не только он, но и другие пользователи (его друзья, родственники, знакомые). Таким образом, пользователь не в полной мере контролирует размещение в социальной сети сведений о себе самом. Во-первых, он может вообще не знать о фактах размещения информации о нём другими пользователями. Во-вторых, даже будучи осведомлённым о таких фактах, он не сможет добиться удаления информации из социальной сети, например потому, что разместивший пользователь не захочет это сделать или просто не будет доступен для общения на протяжении долгого времени.

Многие социальные сети предоставляют такую возможность, как поиск возможных друзей, аудиовизуальных произведений, групп и событий, которые могут заинтересовать пользователя. Информационные системы, прогнозирующие, какие объекты, информационные сообщения и люди будут интересны определенному пользователю на основе его действий, предпочтений и другой информации, называются рекомендательными системами. В основе большинства подобных систем лежит так называемая коллаборативная фильтрация. [4]

Основное допущение этого метода состоит в следующем: те люди, которые одинаково оценивали какие-либо объекты в прошлом, склонны давать похожие оценки в других обстоятельствах в будущем. Прогнозы оценок формируются индивидуально для каждого участника. Тем самым колла-боративная фильтрация отличается от более простого подхода, в котором исполь-

зуется усреднённая оценка объекта возможного интереса, не учитывающая схожести уже выявленных предпочтений.

Указанные встроенные возможности социальных сетей не могут быть использованы для решения поставленной задачи напрямую, так как они рекомендуют друзей только для самого пользователя, а не для произвольного лица. Таким образом, если не рассматривать возможность получения информации по запросу правоохранительных органов от администрации социальной сети, выявление возможных друзей пользователя должно быть выполнено находящейся вне социальной сети автоматизированной информационной системой (программно-аппаратным комплексом) или оператором.

Задача поиска личной страницы пользователя выходит за рамки данной работы, поэтому в дальнейшем будем считать, что пользователь социальной сети, представляющий оперативный интерес, уже определён и его личная страница уже найдена.

Рассмотрим один из возможных алгоритмов решения рассматриваемой задачи выявления латентных связей в социальных сетях, основанный на использовании метода коллаборативной фильтрации.

Во-первых, следует получить список открытых (видимых всем) друзей пользователя с использованием личной страницы или прикладного программного интерфейса (API, application programming interface) социальной сети.

Во-вторых, для каждого из открытых друзей пользователя необходимо получить список их открытых друзей аналогично тому, как это было сделано для исходного пользователя.

В-третьих, требуется объединить списки, полученные при выполнении предыдущих этапов. При этом для каждой учётной записи социальной сети подсчитывается, у какого количества друзей фигуранта данная учётная запись находится в списке друзей (назовём эту величину количеством рекомендаций).

В-четвёртых, необходимо произвести сортировку полученного списка по убыва-

нию количества рекомендаций, подсчитанных на предыдущем этапе. Учётные записи, оказавшиеся в начале данного списка, с большой вероятностью будут знакомыми фигуранта в реальной жизни или в сетевом общении.

Данный алгоритм, в принципе, может быть выполнен оператором без использования автоматизированных информационных систем средствами, предоставляемыми сайтом социальной сети. Однако количество друзей у обычного пользователя социальной сети измеряется, как правило, десятками, а может достигать и нескольких сотен. Таким образом, список "'друзей друзей"' будет включать от сотен до сотен тысяч записей. Поэтому получение, составление, объединение и сортировка списков друзей вручную может оказаться задачей, не выполнимой за разумное время.

Третий и четвёртый шаги алгоритма могут быть автоматизированы с использованием специализированного статистического программного обеспечения или даже стандартных офисных пакетов (Microsoft Office, LibreOffice).

Однако первый и второй шаг слабо поддаются автоматизации с использованием существующих широкодоступных информационных систем. Кроме того, было бы нецелесообразным передавать информацию между вторым и третьим шагом алгоритма вручную. Это существенно увеличило бы время работы, а также сопряжено с возможностью случайных ошибок оператора.

Таким образом, эффективное использование данного алгоритма невозможно без создания специальных программных систем анализа информации, содержащейся в социальных сетях. [3]

Возможная архитектура информационной системы анализа социальных сетей, в рамках которой может быть реализован предложенный алгоритм, уже рассматривалась нами. [1]

Следует учитывать, что эффективность и время выполнения описанного алгоритма существенно зависят от особенностей предоставления информации для автомати-

ческого анализа конкретными социальными сетями. Сравнение распространённых в Российской Федерации социальных сетей по этому признаку было выполнено автором в одной из предыдущих публикаций. [2]

Оценим предполагаемые затраты машинного времени на выполнение предложенного алгоритма. При скорости 1 запрос в секунду (что является существенно заниженной оценкой для большинства социальных сетей) время получения списков друзей пользователя с сотней друзей будет составлять менее двух минут. Время выполнения третьего и четвёртого шагов алгоритма (объединение списков друзей и их сортировка) будет пренебрежимо малым. Таким образом, применение описанного алгоритма на практике будет достаточно оперативным.

Высокая скорость выполнения позволит применять предложенный алгоритм даже в тех случаях, когда целесообразность такого применения оперативником будет казаться недостаточной, так как отношение возможного эффекта к затратам будет велико за счёт низких затрат времени.

Точность выявления латентных связей можно повысить, если учитывать информацию не только об отношениях дружбы, но и другие данные, хранящиеся в социальных сетях. К таким данным относятся: членство в одних и тех же группах, проживание и/или рождение в одном городе, учеба в одном учебном заведение, общее место работы и/или досуга, общие интересы, музыкальные и кинематографические предпочтения. Увеличение числа учитываемых факторов повышает точность прогноза, но замедляет время обработки информации, поэтому нужен некоторый компромиссный вариант, который может быть найден путем экспериментирования.

Кроме того, наработка практического опыта и экспериментирование нужны для определения относительного вклада различных факторов (количество общих друзей, групп, учёба в одном учебном заведении и т.д.) в вероятность того, что пользователи знакомы в реальной жизни.

56

№ 1 (26) • 2017

Противодействие наркоугрозе: _ проблемы, пути решения

Ещё один вопрос, который возникнет при практическом применении описанного алгоритма, заключается в том, какую часть списка возможных друзей стоит рассматривать. Очевидно, что глубокий анализ всех пользователей из построенного списка нецелесообразен в подавляющем большинстве случаев, следовательно, сотруднику оперативного подразделения нужно будет производить "отсечку". При принятии решения сотрудник должен принимать во внимание несколько факторов:

1) бюджет времени, выделенный на проведение проверки выявленных с помощью алгоритма лиц: по истечении выделенного времени проверка просто прекращается;

2) быстрота уменьшения количества рекомендаций в списке (например, если первый пользователь в списке является общим другом всех друзей, а остальные являются друзьями только одного друга, то вряд ли целесообразно рассматривать кого-либо кроме первого пользователя);

3) личный опыт отдельных сотрудников и опыт, который постепенно будет накоплен в оперативных подразделениях;

4) статистические данные, которые могут быть получены путём широкомасштабного исследования пользователей социальных сетей и связей между ними. В ходе подобных исследований может быть выяснено количество общих друзей двух пользователей социальной сети, достаточное для обоснованного предположения об их дружбе. Отметим, что требуемые статистические данные могут собираться как в ходе отдельных исследований, так и параллельно с практическим использованием предлагаемого алгоритма. Последний вариант позволит адаптироваться к изменениям количественных закономерностей структуры социальных сетей, происходящих с течением времени.

Описанный метод обладает тем преимуществом, что он основан исключительно на общедоступных источниках информации и не требует получения конфиденциальной информации по запросу от провайдеров

услуг сети Интернет и организаторов распространения информации.

Небольшая модификация предложенного алгоритма позволит использовать его для выявления скрытых интересов пользователей социальных сетей, представляющих оперативный интерес. Одной из форм получения информации в социальных сетях являются так называемые группы. Группы в социальных сетях формируются, как правило, по интересам и уведомляют всех своих членов о появлении новых статей, событий и другой информации по теме группы.

Если сам пользователь не состоит в некоторой группе, а многие его друзья состоят, то велика вероятность того, что информация, публикуемая в этой группе, может быть ему интересна в той или иной степени. Поводом для отказа от вступления в группу может быть, например, нежелание публично демонстрировать интерес к некоторой тематике (это особенно актуально для групп наркотической тематики).

Для выявления такого латентного членства в группе нужно вместо списков друзей запрашивать на втором шаге алгоритма списки групп. Результатом работы полученного алгоритма будет список групп, упорядоченных по убыванию количества друзей данного пользователя, состоящих в этих группах. Этот список может быть использован для дополнения характеризующей информации о лице, представляющем оперативный интерес.

Таким образом, использование данных, размещённых в социальных сетях, позволит получать информацию о пользователях, которую они не размещали самостоятельно или пытались скрыть, с незначительными затратами времени. Предложенный алгоритм и его реализация в виде автоматизированных информационных систем могут быть использованы сотрудниками правоохранительных органов при раскрытии и расследовании преступлений, связанных с незаконным оборотом наркотиков в сети Интернет.

Библиографический список

1. Галушин, П.В. Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях / П.В. Галушин, И.А. Смирнов // Вестник Сибирского юридического института ФСКН России. - Красноярск: СибЮИ ФСКН России, 2014. - № 3. - С. 117-121.

2. Галушин, П.В. Возможности автоматизированного доступа к информации, предоставляемые социальными сетями / П.В. Галушин // Национальный и международный уровни противодействия наркоугрозе и взаимодействие в сфере реабилитации и ресоциализации наркопотребителей : материалы XVIII международной научно-практической конференции / отв. ред. И.А. Медведев. - Красноярск: СибЮИ ФСКН России, 2015. - С. 60-63.

3. Молоков, В.В. Использование систем анализа ресурсов Интернет и социальных медиа в вопросах противодействия информационным террористическим угрозам / В.В. Молоков // Современные системы безопасности - Антитеррор : материалы конгрессной части XI специализированного форума. - Красноярск: СибЮИ ФСКН России, 2015. -

4. Using collaborative filtering to weave an information / D. Goldberg etc. // Communications of ACM, 1992. 35. - № 12. - P. 61-70.

С. 53-55.

- 58 -

№ 1 (26) • 2017

i Надоели баннеры? Вы всегда можете отключить рекламу.