Научная статья на тему 'Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях'

Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
127
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИТИЧЕСКАЯ РАБОТА / ANALYTICAL WORK / СОЦИАЛЬНЫЕ СЕТИ / SOCIAL NETWORKS / ТЕОРИЯ ГРАФОВ / GRAPH THEORY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Галушин Павел Викторович, Смирнов Игорь Аркадьевич

В статье рассматриваются возможности автоматизации аналитической работы органов наркоконтроля с информацией, размешенной в социальных сетях, с использованием алгоритмов теории графов. Обсуждается постановка и формализация задачи поиска кратчайшей цепочки пользователей, соединяющей двух заданных лиц, методы ее решения, а также предполагаемая структура аппаратно-программной системы, которая может быть использована для решения данной задачи, и проблемы, связанные с ее разработкой и созданием.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Галушин Павел Викторович, Смирнов Игорь Аркадьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AUTOMATION OF ANALYTICAL WORK OF DRUG CONTROL AGENCIES ON INFORMATION POSTED ON SOCIAL NETWORKING SITES

The article deals with the possibility of automation of analytical work of drug control agencies on information posted on social networking sites by using graph theory algorithms. The formulation and formalization of the problem of finding the shortest user''s chain connecting two specified persons, methods of resolving this problem, as well as the supposed structure of hardware and software system that can be used to solve this problem, and challenges associated with its development and creation are also considered in the article.

Текст научной работы на тему «Автоматизация аналитической работы органов наркоконтроля с информацией, размещенной в социальных сетях»

УДК 343.102

Л

Павел Викторович ГАЛУШИН,

преподаватель кафедры информационных технологий Сибирского юридического института ФСКН России (г. Красноярск), кандидат технических наук

galushin@gmail. com

I

Игорь Аркадьевич СМИРНОВ,

доцент кафедры оперативно-розыскной деятельности Сибирского юридического института ФСКН России (г. Красноярск), кандидат юридических наук, доцент

[email protected]

АВТОМАТИЗАЦИЯ АНАЛИТИЧЕСКОЙ РАБОТЫ ОРГАНОВ НАРКОКОНТРОЛЯ С ИНФОРМАЦИЕЙ, РАЗМЕЩЕННОЙ В СОЦИАЛЬНЫХ СЕТЯХ

AUTOMATION OF ANALYTICAL WORK OF DRUG CONTROL AGENCIES ON INFORMATION POSTED ON SOCIAL NETWORKING SITES

В статье рассматриваются возможности автоматизации аналитической работы органов наркоконтроля с информацией, размешенной в социальных сетях, с использованием алгоритмов теории графов. Обсуждается постановка и формализация задачи поиска кратчайшей цепочки пользователей, соединяющей двух заданных лиц, методы ее решения, а также предполагаемая структура аппаратно-программной системы, которая может быть использована для решения данной задачи, и проблемы, связанные с ее разработкой и созданием.

The article deals with the possibility of automation of analytical work of drug control agencies on information posted on social networking sites by using graph theory algorithms. The formulation and formalization of the problem of finding the shortest user's chain connecting two specified persons, methods of resolving this problem, as well as the supposed structure of hardware and software system that can be used to solve this problem, and challenges associated with its development and creation are also considered in the article.

Ключевые слова: аналитическая работа, социальные сети, теория графов.

Keywords: analytical work, social networks, graph theory.

Незаконный оборот наркотиков остается одной из острейших проблем, представляющих высокую общественную опасность для личности, общества и государства.

Ситуация осложнена все большим вовлечением в наркооборот несовершеннолетних и молодежи, а также неснижающимся уровнем смертности от отравления наркотиками, ВИЧ и иных сопутствующих нарко-

мании заболеваний и суицидов наркозависимых лиц.

Приходится констатировать, что действующие схемы наркотрафика, сбыта наркотиков не только на улицах, но и в школах, клубах, на предприятиях формируют крупномасштабный поток наркопотребления.

Незаконный оборот наркотиков построен на законе рынка: "спрос рождает пред-

Вестник Сибирского юридического института ФСКН России -

ложение". Чем больше изымается из незаконного оборота наркотиков при сохранении спроса на них, тем выше их стоимость и тем еще более привлекательным становится регион для очередных наркопоставок. Как правило, наркосиндикаты легко и быстро восстанавливают свои ряды через телекоммуникационную сеть Интернет, в первую очередь за счет наркозависимых, которые вовлекают в потребление новичков и становятся очередными наркодилерами. Одновременно на фоне увеличения стоимости "зелья" множится число преступлений, совершаемых в целях добычи средств на очередную дозу.

В этих условиях на первый план выходит задача: не ослабляя натиск на криминал и совершенствуя методы лечения наркозависимых, организовать реально работающую систему информационно-аналитического обеспечения оперативно-розыскной деятельности органов наркоконтроля с использованием автоматизированных информационных систем анализа социальных сетей телекоммуникационной сети Интернет, направленную, в первую очередь, на уменьшение спроса на наркотики через Интернет.[6]

Информационно-аналитическая работа представляет собой деятельность специально выделенных субъектов для исследования, познания закономерностей каких-либо явлений, процессов, какого-либо рода, вида, направления деятельности государственных, общественных, частных организаций, учреждений (или их совокупности), сообществ людей, общества в целом.[7]

В настоящее время социальные сети развиваются стремительными темпами и охватывают все большее число людей. Так, в одной из самых известных социальных сетей - Facebook - зарегистрированы более 1,2 миллиарда пользователей, российские социальные сети Вконтакте и Одноклассники насчитывают более 200 миллионов пользователей каждая [10]. Таким образом, социальные сети содержат огромные массивы данных о лицах, представляющих оперативный интерес, и взаимоотношениях между ними.

Из-за огромного количества информации и все более ускоряющихся темпов ее накопления современная аналитическая деятельность немыслима без использования автоматизированных информационных систем, то есть совокупности содержащейся в базах данных информации и обеспечивающих ее обработку информационных технологий и технических средств.[8]

Так, например, решение задачи поиска кратчайшей цепочки фигурантов, соединяющих двух лиц, представляющих оперативный интерес, обуславливается тем, что длина цепочки знакомств между двумя фигурантами позволяет оценить, насколько вероятна связь между ними (в том числе вне социальных сетей), что может быть полезным для решения задач оперативно-розыскной деятельности.[3]

Большинство социальных сетей позволяют получить доступ к списку пользователей, которых данный пользователь считает друзьями. Однако этой информации недостаточно для решения рассматриваемой задачи. Размер списка друзей, как правило, исчисляется десятками и может достигать сотен. Поэтому уже ручное составление списка "друзья друзей" (не говоря уже о более длинных цепочках преступных связей) и ручной поиск в нем, как правило, не могут быть выполнены за разумное время.

Рассмотрим, как данная задача может быть формализована и решена с помощью средств вычислительной техники. В рамках данной задачи социальная сеть может быть представлена следующим образом. Пользователей социальной сети обозначим точками, а связи между пользователями (например, отношения дружбы) - линиями, соединяющими соответствующие точки. В информатике такое представление называется графом.[1] В рамках этой терминологии точки-пользователи называются вершинами, а связи - ребрами. Изображение графа условной социальной сети приведено на рисунке 1. На рисунке 2 представлен полный граф социальной сети Facebook [2].

Отметим, что отношение дружбы не является единственным, представляющим интерес. Можно также рассмотреть такие

118

№ 3 (16) • 2014

сети - это хорошо известная задача теории графов, для которой существует эффективный алгоритм решения - поиск в ширину [1, с.456].

По сути, данный алгоритм выполняет ту же самую работу, что и человек, который захотел бы найти цепочку людей вручную. Идея этого алгоритма заключается в последовательном посещении вершин графа по уровням: сначала непосредственно связанные с начальной вершиной, затем связанные с начальной вершиной через одну промежуточную и т.д. Уже посещенные вершины запоминаются и повторно не посещаются. В итоге будут посещены все вершины, связанные с начальной вершиной, причем один раз.

Затраты времени на выполнение алгоритма поиска в ширину пропорциональны сумме количеству вершин и ребер графа.

Еще одним достоинством алгоритма поиска в ширину является его способность работать с потенциально бесконечными графами: если в бесконечном графе содержится цепочка знакомств между людьми, она будет найдена.

Программная система, реализующая возможности поиска цепочек пользователей в социальных сетях, должна состоять из двух основных модулей: модуля построения

^сеЬоок

Рис. 1. Пример графа социальной сети

отношения, как "отмечены на одной фотографии", "входят в одну группу", "вместе учились" и т.д. Однако для определенности мы в дальнейшем будем рассматривать только одно отношение: "являются друзьями".

Задача поиска цепочки пользователей, соединяющих двух заданных лиц, эквивалентна задаче поиска кратчайшего пути (длина пути равна количеству ребер в этом пути) между вершинами графа социальной

Рис. 2. Граф социальной сети Facebook.

- 119 -

Вестник Сибирского юридического института ФСКН России -

графа социальной сети и модуля поиска пути.

Модуль построения графа социальной сети собирает информацию о пользователях социальной сети и их списки друзей. Большинство социальных сетей предоставляет соответствующую информацию через специальный интерфейс (API социальной сети). Рассмотрим проблемы, которые возникнут при разработке этого модуля.

Во-первых, каждая социальная сеть имеет свой собственный интерфейс, поэтому для каждой социальной сети процедуру сбора информации необходимо разрабатывать фактически заново. Более того, интерфейс социальной сети может меняться со временем. Нельзя также исключать возможность противодействия владельцев и администрации социальных сетей (блокирование или ограничение доступа) как по техническим причинам, так и по идеологическим.

Во-вторых, чтобы ускорить поиск путей и исключить цепочки знакомств, которые с большой вероятностью не могут быть использованы, необходимо отсеивать неактивных пользователей, а также пользователей, не соответствующих реальным людям (это могут быть, например, поддельные учетные записи знаменитостей).

Кроме того, целесообразным представляется объединение графов разных социальных сетей в один общий граф. Однако для реализации этой возможности необходимо отождествлять учетные записи пользователя в разных социальных сетях, что является очень нетривиальной задачей и выходит за рамки данной статьи.

Так как в популярных социальных сетях зарегистрировано огромное количество пользователей, модуль построения графа социальной сети должен собирать информацию непрерывно и заблаговременно.

Модуль поиска пути работает с построенным графом социальной сети и ищет в нем по запросу пути между заданными пользователем учетными записями социальных сетей. Алгоритмы для работы с графами являются хорошо изученной областью информатики, существуют каче-

ственные свободные реализации этих алгоритмов, например Boost.Graph [9]. С точки зрения сложности разработки этот модуль представляется самой простой частью системы.

Программная система поиска цепочек пользователей социальных сетей будет достаточно требовательной к вычислительным ресурсам. Потребуется высокоскоростное подключение к сети Интернет (для построения графа социальной сети), высокое быстродействие процессора и большой объем оперативной памяти (иначе граф не будет полностью помещаться в оперативной памяти, а чтение данных с жесткого диска происходит гораздо медленнее, чем из оперативной памяти).[4, 5]

Задача поиска пути между двумя пользователями может быть обобщена на случай поиска пути между одним пользователем и заданной группой пользователей.

В заключение кратко рассмотрим другие задачи исследования социальных сетей, которые могут быть решены с помощью теории графов.

1. Поиск сообществ, то есть групп пользователей, все члены которых связаны друг с другом (непосредственно или через других членов группы).

2. Выявление связей в группе, пресечение которых сильнее всего помешает распространению информации в данной группе. К данной задаче существует и обратная - выявление члена группы, через которого наиболее эффективно распространение информации в данной группе.

Отметим, что эти задачи целесообразно решать не только на полном графе социальной сети, но и на его фрагментах, а также любых схемах взаимодействия лиц, представляющих интерес для правоохранительных органов.

Таким образом, современная вычислительная техника в сочетании с алгоритмическим и программным обеспечением, позволяют автоматизировать решение задач, актуальных для оперативно-розыскных подразделений правоохранительных органов, которые являются слишком трудными для решения вручную.

- 120 -

№ 3 (16) • 2014

^^^^^^^^^^^^^^^^^^^ Взгляд. Размышления. Точка зрения

Библиографический список

1. Алгоритмы: построение и анализ = Introduction to Algorithms / Томас Х. Кормен и др. - 2-е изд. - М.: "Вильямс", 2006.

2. Все связи социальной сети Facebook на одной карте. URL: http://www.computerra.ru/ 4340/ (дата обращения: 03.07.14).

3. Галушин, П.В. Возможности автоматизации аналитической работы с информацией, размещённой в социальных сетях / П.В. Галушин, С.Н. Ефимов // Современные системы безопасности - Антитеррор : материалы конгрессной части X специализированного форума (28-29 мая 2014 г.) / отв. ред. А.В. Букарин. - Красноярск: СибЮИ ФСКН России, 2014. - ISBN 978-5-7889-0218-0. - С. 169-171.

4. Ефимов, С.Н. Проектирование вычислительной сети эффективной архитектуры для распределенного решения сложных задач / С.Н. Ефимов, В.В. Тынченко, В.С. Тынчен-ко // Вестник СибГАУ : сборник научных трудов / под ред. проф. Г.П. Белякова ; Сиб-ГАУ. - Вып. 3 (16). - Красноярск, 2007. - С. 15-19.

5. Ефимов, С.Н. Реконфигурируемые вычислительные системы обработки информации и управления / С.Н. Ефимов, В.А Терсков. - Красноярск: КрИЖТ ИрГУПС, 2013. - ISBN 978-5-903293-29-2.

6. Молоков, В.В. Интернет и наркотики / В.В. Молоков // Актуальные проблемы профилактики наркомании и противодействия правонарушениям в сфере легального и нелегального оборота наркотиков : материалы XV международной научно-практической конференции : в 3 ч. - Красноярск : СибЮИ ФСКН России, 2012. - Ч.1. - С. 72-75.

7. Молоков, В.В. Направления применения методов непараметрической статистики в решении задач профилактики и борьбы с преступностью / В.В. Молоков //Актуальные проблемы борьбы с преступностью в Сибирском регионе : сборник материалов 1 2 международной научно-практической конференции : в 3 ч. - Красноярск: СибЮИ МВД России, 2009. - Ч.2. - С. 115-118.

8. Об информации, информационных технологиях и о защите информации : Федеральный закон Российской Федерации от 27.07.2006 №149-ФЗ. Доступ из справочно-пра-вой системы КонсультатПлюс.

9. The Boost Graph Library (BGL), URL: http://www.boost.org/doc/libs/1_55_0/libs/ graph/doc/index.html (дата обращения: 03.07.14).

10. Twitter и Facebook одержали победу над "ВКонтакте", URL: http://top.rbc.ru/ spb_sz/13/01/2014/898903.shtml (дата обращения 03.07.14).

i Надоели баннеры? Вы всегда можете отключить рекламу.