УДК 519.2+311
Вячеслав Витальевич МОЛОКОВ,
доцент кафедры информационных технологий
Сибирского юридического института ФСКН России (г. Красноярск), кандидат технических наук, доцент
vvmolokov@mail. ги
МНОГОФАКТОРНАЯ ОЦЕНКА И ПРОГНОЗИРОВАНИЕ УРОВНЯ
НАРКОСИТУАЦИИ
MULTIFACTORIAL ESTIMATION AND FORECASTING OF DRUG-
SITUATION LEVEL
В данной статье рассматривается методика оценки уровня наркоситуации на основе агломеративного подхода и прогнозирование ее состояния с использованием Марковской цепи. Приводятся примеры комплексного многофакторного анализа показателей, характеризующих наркоситуацию в Сибирском федеральном округе.
The article considers the technique of assessing the level of the drug- situation on the basis of agglomerate approach and forecasting its condition using the Markovsky chain. Examples of complex multifactor analysis of the indexes characterising a narco-situation in the Siberian federal district are resulted.
Ключевые слова: кластерный анализ, моделирование, Марковские цепи.
Keywords: cluster analysis, modelling, Markovsky chains.
Мониторинг и анализ наркоситуации - одна из актуальных задач государственной антинаркотической политики и противодействия незаконному обороту наркотиков и распространению наркомании в Российской Федерации, причем важной задачей достижения целей мониторинга является прогнозирование развития наркоситуации и выработка предложений по ее улучшению. Для принятия управленческих решений в области профилактики и борьбы с наркоманией необходимо оценивать в динамике уровень наркотизации населения, состояния правоохранительной практики и социально-экономического развития наблюдаемых территорий. Это позволяет выявлять факторы развития наркомании и строить модели прогноза, тем самым целенаправленно принимать политические, экономические и организационные решения по
противодействию наркомании и ликвидации ее последствий. С учетом сложности этой задачи ее удовлетворительное решение может быть осуществлено только с помощью привлечения комплексных методов математической статистики, моделирования и теории вероятностей.[2]
Для такой географически обширной и разнообразной страны, какой является Россия, объективной особенностью является неравномерность экономического и социального развития ее регионов. Эти различия отражаются на миграционных, криминогенных, общественных и других явлениях. Также разными характеристиками обладают и показатели, характеризующие наркоситуацию. В связи с этим необходимы подходы, позволяющие комплексно решать задачу оценки уровня наркоситуации регионов в порядковой шкале с уче-
Взгляд. Размышления. Точка зрения
том факторов, прямо или косвенно влияющих на ее развитие. При этом выделение групп схожих по уровню развития наркоситуации территорий может являться основой их ранговой оценки.
Одним из вариантов выделения схожих по характеристикам объектов является процедура автоматической классификации. Для классификации по группе показателей удобно использовать аппарат кластерного анализа. Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве Х признаков, разбить множество объектов Ь на т (т - целое) кластеров (подмножеств) Q1, Q2, ..., Qm, так, чтобы каждый объект Ь) принадлежал одному и только одному подмножеству разбиения, а также объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными. Объединение объектов в один класс осуществляется, как правило, по некоторому критерию подобия (близости) значений признаков.
Предлагается методика классификации регионов по уровню наркотизации населения, позволяющая оценить ее состояние в ранговой шкале и проводить вероятностное прогнозирование переходов в классах. Подобный подход к моделированию распространения наркомании в регионах России на основе кластерного анализа и последующего применения регрессионных моделей рассматривался в работе В.П. Сиротина и М.В. Плотниковой [6, с. 186-192].
Разработанная методика апробирована на регионах Сибирского федерального округа (СФО) [3, с. 231-234]. Кластеризация субъектов СФО осуществлялась в каждый момент времени контроля состояния системы (период 2008-2013 гг.) на основании статистической выборки, содержащей основные социально-экономические, демографические и иные показатели территорий [5]. При этом признаки были сгруппированы по четырем блокам:
- правоохранительный (общее количество зарегистрированных правоохрани-
тельными органами преступлений; общее количество зарегистрированных преступлений по линии незаконного оборота наркотиков (НОН); количество преступлений, совершенных лицами, находящимися в состоянии наркотического опьянения; количество зарегистрированных правоохранительными органами тяжких и особо тяжких преступлений, связанных с НОН; число осужденных лиц за совершение преступлений связанных с НОН);
- социально-экономический (число родившихся; число зарегистрированных умерших; прожиточный минимум; среднедушевой денежный доход населения; уровень безработицы по методологии МОТ);
- миграция (количество въехавших на территорию субъекта; количество выбывших с территории субъекта; количество поставленных на миграционный учет);
- медико-биологический (количество взятых под наблюдение лиц с синдромом зависимости от наркотических средств; количество состоящих под наблюдением лиц с синдромом зависимости от наркотических средств; количество смертельных случаев от отравления наркотическими средствами; количество выездов бригад "скорой помощи" на случаи острых отравлений наркотиками; количество лиц с диагнозом наркомания, снятых с наблюдения в связи со смертью).
Рассмотрим более подробно алгоритм моделирования на каждом из этапов.
Первым этапом формируется выборка наблюдений статистических показателей регионов за период 3-5 лет, определяются индикаторы тематических блоков. Все значения выборки представляются в относительных единицах на 100 тысяч населения субъекта и для обеспечения равноценности стандартизируются с помощью г-зна-чения, что позволяет привести их к одинаковой размерности.
На втором этапе для каждой статистики годового периода в каждом блоке пространства признаков запускается алгоритм автоматической классификации. В нашем случае использовалась процедура агломе-ративной иерархической кластеризации,
при этом в качестве алгоритма оценки компактности объектов в классе использовался метод Варда, а метрики близости - евклидово расстояние. Результат процедуры кластерного анализа - выделение классов субъектов фиксированной размерности, например, равной 3 (рис. 1, 2).
Рис. 1. Классификация регионов СФО по группе признаков правоохранительного блока в 2012 году
Рис. 2. Классификация регионов СФО по группе признаков медико-биологического блока в 2013 году
Делаются выводы о различии составов классов субъектов и характере агломерации признаков, вычисляются средние значения показателей в группах, оценивается их взаимосвязь (рис. 3, 4) [4, с. 26-28]. Обосновывается гипотеза различия классов в порядковой шкале, например, "высокий уровень", "средний уровень", "низкий уровень".
Представленные на рисунках 3 и 4 результаты отчетливо определяют центры классов и принцип объединения субъектов в кластеры. Средние значения наблюдаемых показателей различны в каждом классе. Можно характеризовать субъекты, вошедшие в 1 класс, как имеющие относительно "низкие" показатели преступности в сфере НОН и субъекты, объединенные в 3 класс, как "высокие". Однако такие отождествления необходимо применять только на основе комплексного изучения значений показателей поскольку, например, в 2013 году объединение субъектов в классы в правоохранительном блоке не так однозначны (рис. 5).
Для представления переходов субъектов из класса в класс строится диаграмма динамики классификации регионов в каждом блоке (рис. 6).
На третьем этапе результаты кластерного анализа систематизируются и на основе априорной информации рассчитываются условные вероятности переходов субъектов из 1-го в ;-й класс в каждом году (рис. 7).
Далее процесс представляется в виде неоднородной (динамической) Марковской цепи. В зависимости от исходного (начала периода контроля системы) состояния определенного субъекта в классе по формуле полной вероятности
п
Pj(k)=^PiCk-l)pf, где pff
значения
i=1
переходных вероятностей для к-го шага, вычисляется вероятность нахождения региона в классе после ^го шага, что является прогностической оценкой (рис. 8) [1].
Взгляд. Размышления. Точка зрения
Общее количество зарегистрированных правоохранительный и органами преступлений(на 100 тыс. населения) Количество зарегистрированных правоохранительными органами преступлений, связанных с НОН (на 100 тыс. населения) Количество зарегистрированных правоохранительными органами тяжких и особо тяжких преступлений, связанных с НОН [на 100 тыс. населения) Число преступлений совершенныхпицами, находящимися в состояние наркотического опьян&ния [на 100 тыс населения) Число осужденных пицзасовершение преступлений связанных с НОН (на 100 тыс. населения)
V1.1 V1.2 \Л.З V1.4 V1.5
1 кластер 2738,45 166,51 114,06 99,04 102,21
2 кластер 2304,73 206,33 154,45 117,16 120,56
3 кластер 2406,43 393,29 179,73 285,71 246,09
Среднее 2493,92 205,32 139,73 123,65 123,37
Рис. 3. Средние значения показателей правоохранительного блока в исследуемых кластерах в 2012 году
Рис. 4. Средние значения показателей правоохранительного блока в логарифмической шкале в 2012 году
Рис. 5. Средние значения показателей правоохранительного блока в логарифмической шкале в 2013 году
Рис. 6. Диаграмма динамики классификации регионов СФО в правоохранительном блоке за 2009-2013 гг.
2009 год 2010 год 2011 год
класс 1 2 3 класс 1 2 3 класс 1 2 3
1 0,20 0,80 0 1 0,14 0,86 0 1 0,60 0,40 0
2 1 0 0 2 1 0 0 2 0,83 0,17 0
3 □ 0 1 3 0 0 1 3 0 0 1
2012 год 2013 год
класс 1 2 3 класс 1 2 3
1 0,88 0,13 0 1 0,43 0,57 0
2 0 1 0 2 0,25 0,75 0
3 0 0 1 3 0 0 1
Рис. 7. Условные вероятности переходов в медико-биологическом блоке
Классы Исходная вероятность нахождения е классе. к=0 k=1 k=2 k=3 k=4 Прогноз
1 1 0,20 0,83 0,64 0,56 0,35
2 0 0,80 0,17 0,36 0,44 0,65
3 0 0 0 0 0 0
Рис. 8. Прогнозная оценка вероятности перехода субъекта СФО в классы для медико-биологического блока при условии, что на начальном этапе моделирования он находился в 1 классе
Таким образом, предлагаемая методика универсальна и позволяет проводить в условиях общности состава признаков в группе оценку уровня наркоситуации, социально-экономического развития, эффективности правоохранительной деятельнос-
ти в регионах, а также делать выводы о закономерностях происходящих процессов. Процедура прогнозирования осуществляет поддержку принятия обоснованных управленческих и организационных решений.
Библиографический список
1. Боев, В.Д. Компьютерное моделирование / В.Д. Боев, Р.П. Сыпченко. - НОУ "ИНТУИТ", 2010. URL: http://www.intuit.ru/studies/courses/643/499/lecture/11353 (дата обращения: 01.09.14).
2. Галушин, П. В. Асимптотический вероятностный генетический алгоритм решения сложных задач глобальной оптимизации : дис. ... канд. техн. наук : 05.13.01 / П.В. Галу-шин. - Красноярск, 2012.
3. Молоков, В.В. Агломеративный подход к оценке уровня наркоситуации и прогнозирования ее динамики / В.В. Молоков // Актуальные проблемы профилактики наркомании и противодействия правонарушениям в сфере легального и незаконного оборота наркотиков: национальный и международный уровни: материалы XVII научно-практической конференции (17-18 апреля 2014 г.) : в 2 ч. / отв. ред. И.А. Медведев. - Красноярск: СибЮИ ФСКН России, 2014. - Ч. 1. - С. 231-234.
4. Молоков, В.В. Модульно-статистический анализ состояния преступности / В.В. Молоков, Р.Ж. Мурадимов // Сборник научных трудов SWorld : материалы международной научно-практической конференции "Современные направления теоретических и прикладных исследований х2012". - Выпуск 1. Т. 4. - Одесса: КУПРИЕНКО, 2012.
5. Паспорт наркоситуации Сибирского федерального округа и его субъектов в 20092013 гг. : рег. №11/5/2/1424 от 23.05.2014 // Управление аппарата ГАК по СФО. -Новосибирск, 2014.
6. Сиротин, В.П. Моделирование распространения наркомании и ее последствий в регионах России / В.П. Сиротин, М.В. Плотникова // Экономика региона. - 2009. - №4.