Научная статья на тему 'Построение модели прогнозирования числа преступлений'

Построение модели прогнозирования числа преступлений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
138
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
FORECASTING / REGRESSION EQUATION / DATA ANALYSIS / COEFFICIENT OF DETERMINATION / CRIMES COMMITTED BY MINORS / ПРОГНОЗИРОВАНИЕ / РЕГРЕССИОННОЕ УРАВНЕНИЕ / АНАЛИЗ ДАННЫХ / КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ / ПРЕСТУПЛЕНИЯ / СОВЕРШЕННЫЕ НЕСОВЕРШЕННОЛЕТНИМИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Поташникова Светлана Владимировна, Синегубов Сергей Владимирович

В работе анализируются и обрабатываются данные о преступлениях, совершенных несовершеннолетними. Рассматривается методика обработки данных и предлагается полиномиальная модель аппроксимации изучаемых данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Поташникова Светлана Владимировна, Синегубов Сергей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BUILDING A MODEL FOR PREDICTING THE NUMBER OF CRIMES

In the work, data on crimes committed by minors are analyzed and processed. The technique of data processing is considered and a polynomial model of approximation of the studied data is proposed.

Текст научной работы на тему «Построение модели прогнозирования числа преступлений»

С.В. Поташникова,

кандидат технических наук, доцент, Воронежский институт ФСИН России

С.В. Синегубов,

кандидат технических наук, доцент

ПОСТРОЕНИЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ ЧИСЛА ПРЕСТУПЛЕНИЙ

BUILDING A MODEL FOR PREDICTING THE NUMBER OF CRIMES

В работе анализируются и обрабатываются данные о преступлениях, совершенных несовершеннолетними. Рассматривается методика обработки данных и предлагается полиномиальная модель аппроксимации изучаемых данных.

In the work, data on crimes committed by minors are analyzed and processed. The technique of data processing is considered and a polynomial model of approximation of the studied data is proposed.

Преступления, совершаемые несовершеннолетними, вот уже на протяжении ряда десятилетий в нашей стране являются не только дестабилизирующим фактором, но и серьёзной проблемой для развития государства. Статистические данные свидетельствуют, что несовершеннолетние составляют наиболее криминально пораженную часть общества, занимают наивысшие показатели в структуре возрастных групп преступников не только в нашей стране, но и по всему миру [1].

Согласно официальным данным ГИАЦ МВД России, за январь - декабрь 2017 года на территории Российской Федерации зарегистрировано 2058,5 тыс. преступлений, из числа которых каждое двадцать пятое (4,1%) совершено несовершеннолетними или при их соучастии [1]. Если проанализировать все преступления, совершаемые с участием несовершеннолетних, то можно заметить, что число таких преступлений, зарегистрированных в 2017 году, снизилось, но при этом остается неопровержимым тот факт, что положение дел с преступностью несовершеннолетних, а именно процессы ее развития, в скором времени будет определять рост преступности в целом.

Криминальная активность, связанная с преступлениями в отношении несовершеннолетних и вовлечением их в совершение преступлений, имеет тенденцию к росту.

Введение.

По данным МВД России, латентность такого рода преступлений составляет 83—85 %, остается только догадываться об истинных масштабах этого негативного для общества явления [2].

В настоящей работе изучаются преступления с участием несовершеннолетних. Рост преступности лиц, не достигших совершеннолетия, зависит от негативного воздействия на них взрослых в целях удовлетворения своих преступных интересов, для осуществления которых подростки оказываются вовлеченными в совершение преступлений.

Учитывая вышеизложенное, необходимо прогнозирование числа преступлений, совершенных несовершеннолетними, в целях принятия необходимых профилактических мер.

Постановка задачи.

Данные о состоянии преступности в РФ за 2013—2017 гг. взяты с электронного ресурса http://www. mvdinform.ru (дата обращения: 11.04.2018). Из имеющихся процентных соотношений общего количества преступлений и преступлений, совершенных несовершеннолетними, получены изучаемые данные, представленные на рис. 1.

Здесь и далее на графиках по горизонтальной оси отложен временной диапазон изучаемых данных.

Рис. 1. Количество преступлений, совершенных несовершеннолетними,

за 2013—2017 г.

На основании имеющихся данных проведем их анализ, построим регрессионную модель числа преступлений, совершенных несовершеннолетними, и сделаем прогноз о числе данных преступлений на период, следующий за последним отчетным [8, 12, 13]. Методика обработки данных.

Пусть Y — дискретная случайная величина, принимающая в моменты времени {*!> *2> fn } значения {уг, Уг,Уп }.

По значениям вектора {у, у2,..., уп} определяем выборочное среднее случайной

Y п 1 п

величины Y у = — ^ у и несмещенную выборочную дисперсию s^ =-^ (у - у)2 .

п г=1 п - 1 г=—

1. Если некоторые значения совокупности {у, у2уп} принимают значения (Ушк или у^п ), явно выделяющиеся от остальных, то необходимо сделать проверку: является ли данный всплеск нормальным или это ошибка данных. Наличие ошибок в данных не дает правильно оценить параметры всей генеральной совокупности, что влечет за собой дальнейшие ошибки [3, 4].

Введем случайные величины

у _ Утах У V _ У Ут1п

57 V п 5 V П

где У и 5Г — средняя выборочная и несмещенная выборочная дисперсия.

Введенные случайны величины имеют специальное распределение со степенями свободы к _ п — 2.

Рассчитаем наблюдаемые значения статистического критерия Утбл или у'тбл и, сравним с критическими точками, значения которых в зависимости от к _ п — 2 и уровня значимости а (вероятности совершить ошибку первого рода) приведены в соответствующей таблице [3].

Если Утбл < у , то всплеск не влияет на характеристики совокупности, в противном случае — данные всплески являются ошибкой. Если Утбл > у , то ошибочное значение выбрасывается и заново находятся характеристики совокупности [5, 6]. 2. По значениям вектора {у, У2,..., Уп} проводим аппроксимацию.

Определяем вид аппроксимирующей функции (уравнения регрессии) 7 _ /('),

такой, что 7 _ 7 + Е _ /(') + Е, где Е — случайная компонента.

Для каждого г -го наблюдения последнее выражение примет вид

У, _ У + е г _ / О ) + е.

Введенная аппроксимирующая функция подбирается таким образом, чтобы

п п

X(y^ — У, )2 е2 ^ ™п.

г_1 г_1

В случае если аппроксимирующая функция представлена полиномом степени п п

Т_а ь ■ I1, 1_1

для нахождения коэффициентов а и Ь воспользуемся матричным уравнением

XI г_1 г _1 X',2 • г_1 •• X 'г" г_1

П XА г_1 П X'2 г _1 П X'? г_1 П X 'П+1 г_1

П г_1 П X3 г_1 П X.^t г_1 П Ж2 г_1

X 'П X 'П+1 X '

v г_1 г_1

п+2

,2п

г_1

X

г_1 у

(а^

Ь Ь

v ьп у

с п \

X у,

г_1

П

X уА

г_1

П

XУг'2

X УАП

v г_1 у

П

П

П

П

г_1

П

П

3. Для анализа эффективности полученной функциональной зависимости (уравнения регрессии) воспользуемся коэффициентом детерминации Я2:

г ■ у -г ■ у

2 _ соу(г, у)

Я2 =

Ь2 - (у)2 ^г2 - (г)2 '

Данный коэффициент обладает свойством Я2 < 1. Чем ближе значение данного коэффициента к единице, тем точнее подобранно уравнение регрессии [5, 6, 7].

4. Так как при построении модели будут оставлены исходные данные для проверки, а также для вновь полученных статистических данных при корректировке коэффициентов модели определим ошибку прогнозирования [9,10,11], воспользовавшись выражением

1 к

А=1Е (у - у, )2,

к ,=1

где к — количество проверок модели.

5. Для каждого прогнозируемого значения определим доверительный интервал, используя соотношение

ут - гш-1, а ■ < у п+1 < ут + гш-1, а' ^ , 5 = 1 2 •••, т ,

где ^ а — значение распределения Стьюдента при уровне значимости а ;

5, а сР

у,

""О 5

среднее по времени года прогнозируемого периода;

среднее квадратическое отклонение по времени года прогнозируемого периода.

Блок-схема алгоритма обработки данных.

Начало I

Ввод

Вычисляем

Корректируем данные

Рис. 2. Блок-схема алгоритма обработки данных

88

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ср

Анализ данных и построение модели.

На рис. 1 отчетливо видны выбросы, соответствующие 12, 24, 36 и 48 значениям исследуемого периода. Для проверки нормальности (случайности) данных выбросов определим

,, _ У max У

набл I ~

n -1

^ ■ V-

V n

и сравним его с критическим значением v . Так, для первого значения t = 12 имеем ушбл = 2,86 и v = 3,5 при а = 0,05 . Так как vm6n < v , то всплеск не влияет на характеристики совокупности. Аналогичные результаты получены для всплесков при t = 24, t = 36 и t = 48 .

Всплески объясняются тем, что данные периоды являются последними отчетными периодами года сдачи отчетных документов.

Экспериментальным путем подобрано лучшее уравнение регрессии, которое является полиномом 6 степени, но при этом значение коэффициента детерминации составило R2 = 0,4226. Данное значение не является удовлетворительным для описания данных и тем более прогнозирования.

Для сглаживания имеющихся данных объединим их по временам года (весна, лето и т.д.).

Построим уравнение регрессии без последних двух значений, которые оставим для проверки полученного уравнения регрессии. Результатом являются значения изучаемого явления, приведенные на рис. 3.

Имеющийся всплеск также является случайным, и уравнение регрессии имеет

вид

6

Y = а + £ Ь, ■ t, =

(1)

= 0,0324хб -1,4144х5 + 24,698.x4 - 216,91.x3 + w

+ 890,51.2 -1130,2. +14593 , R2 = 0,9652 .

График уравнения регрессии представлен на рис. 3.

В данном случае коэффициент детерминации близок к единице, что является достаточным.

Учитывая, что оставленные для проверки значения изучаемого явления равны y14 = 11270 и y15 = 11965, сделаем прогноз на 14 и 15 периоды и найдем ошибку сделанного прогноза.

^У14 - УгУ |У15 - yd I (11270 -10166 , 11965 -11266

к14 «М4| К15

У14 У15

(\\ iT7n_imAAI li

+ J

11270 11965

22

; 0,078.

Таким образом, прогнозирование с использованием полученного уравнения регрессии дает ошибку около 8%.

Доверительные интервалы для каждого значения при а = 0,05 :

У14 е (9192; 11139);

у15 е (10292; 12239).

Предположение об использовании для аппроксимации полинома 6 степени дает положительный результат и будет использоваться для построения дальнейших уравнений регрессии.

1.6* 104 1.4* 104 12>10Ч

Рис. 3. Количество преступлений, совершенных несовершеннолетними, посезонно без данных, оставленных для проверки

Добавим оставленные для проверки уравнения регрессии данные и построим новое уравнение. Данные и уравнение регрессии представлены на рис. 4. Уравнение регрессии в данном случае примет вид

¥ = 0,0054х6 - 0,185х5 + 3,3955х4 - 40,328х3 + 173,451л-2 + 164,72л +13832, (2) Я2 = 0,9696 .

14*104 1.:*104-

Рис. 4. Количество преступлений, совершенных несовершеннолетними,

за 2013—2017 г. посезонно

По новым данным получены скорректированные значения коэффициентов и незначительное улучшение значения коэффициента детерминации.

Используя полученное уравнение, сделаем прогноз о количестве преступлений, совершенных несовершеннолетними зимой 2017—2018 г. Прогнозируемое значение

составило У(16) = 14825 .

К моменту написания статьи на вышеуказанном ресурсе были опубликованы данные о количестве преступлений, совершенных несовершеннолетними зимой 2017—2018 г. Значение данного показателя равно 15805. Ошибка прогноза составляет 0,06 (6%). Доверительный интервал при а = 0,05 — y16 е (13868; 15781).

Выводы. Для прогнозирования количества преступлений, совершенных несовершеннолетними, получено уравнение регрессии, описываемое полиномом 6 степени. При получении нового реального значения статистики изучаемого явления строится новое уравнение регрессии и определяется коэффициент детерминации. В случае наличия в данных новых всплесков делается проверка об их неслучайности.

Уравнения регрессии (1) и (2) построены с использованием 13, а после добавления значений оставленных для проверки модели и 15 значений соответственно. Известно, что оптимальным является краткосрочный прогноз, составляющий 5% от имеющихся данных. Для имеющихся значений прогноз делается на 0,75 единиц вперед, что составляет менее единицы деления временного интервала. Даже в таких ограничениях полученный прогноз дает ошибку 6%. Дальнейшее накопление статистической информации значительно улучшит прогнозирование.

ЛИТЕРАТУРА

1. Состояние преступности в РФ за январь — декабрь 2017 г. — URL: http://www. mvdinform.ru (дата обращения: 27.02.2018).

2. Жук И. О. Расследование преступлений, связанных с вовлечением несовершеннолетних в преступную деятельность : учеб. пособие. — Н. Новгород : Нижегородская академия МВД России, 2009. — 70 с.

3. Синегубов С. В. Моделирование систем и сетей телекоммуникаций : учеб. пособие. — Воронеж : Воронежский институт МВД России, 2016. — 452 с.

4. Поташникова С. В., Синегубов С. В. Исследование времени отклика систем поллинга // Техника и безопасность объектов уголовно-исполнительной системы. — 2016. — С. 316—318.

5. Поташникова С. В., Синегубов С. В. Оценка вероятностей переходов при описании функционирования систем марковскими процессами // Вестник Воронежского института МВД России. — 2016. — № 3. — С. 73—78.

6. Поташникова С. В., Синегубов С. В. О распределении Эрланга // Некоторые вопросы анализа, алгебры, геометрии и математического образования. — 2016. — № 5-1. — С. 252—253.

7. Поташникова С. В., Синегубов С. В. Моделирование атак, связанных с физическим проникновением на объекты охраны // Актуальные проблемы деятельности подразделений УИС : сборник материалов Всероссийской научно-практической конференции. — Воронеж, 2017. — С. 44—47.

8. Меньших В. В., Синегубов С. В. Правовая статистика : учебное пособие. — Воронеж : Воронежский институт МВД России, 2015. — 152 с.

9. Menshikh V. V. Prediction of the Length of the Control Cycle in Control Systems with Fixed Operating Time References // Automatic Control and Computer Sciences. — 1998. —T. 32. — № 4. — С. 9—14.

10. Menshikh V. V. Estimator of the Planning Horizon in Control Systems // Automatic Control and Computer Sciences. — 1999. — T. 33. — № 5. — С. 34—37.

11. Menshikh V. V. Forecasting Control Cycles for a Vector Performance Function System // Automatic Control and Computer Sciences. — 2001. — T. 35. — № 5. — С. 24—32.

12. Меньших В. В., Думачев В. Н., Пешкова Н. В. Математическое моделирование и численный анализ задач естествознания : учебное пособие. — Воронеж : Воронежский институт МВД России, 2015. — 122 с.

13. Меньших В. В., Беспалов С. В. Практикум по эконометрике. — Воронеж : Научная книга, 2007. — 63 с.

14. Поташникова С. В., Синегубов С. В. Построение многофакторной математической модели прогнозирования экономических кризисов // Математические методы в технике и технологиях — ММТТ. — 2017. — Т. 9 — С. 136—140.

REFERENCES

1. Sostoyanie prestupnosti v RF za yanvar — dekabr 2017 g. — URL: http://www. mvdinform.ru (data obrascheniya: 27.02.2018).

2. Zhuk I. O. Rassledovanie prestupleniy, svyazannyih s vovlecheniem nesover-shennoletnih v prestupnuyu deyatelnost : ucheb. posobie. — N. Novgorod : Nizhegorodskaya akademiya MVD Rossii, 2009. — 70 s.

3. Sinegubov S. V. Modelirovanie sistem i setey telekommunikatsiy : ucheb. posobie. — Voronezh : Voronezhskiy institut MVD Rossii, 2016. — 452 s.

4. Potashnikova S. V., Sinegubov S. V. Issledovanie vremeni otklika sistem pollinga // Tehnika i bezopasnost ob'ektov ugolovno-ispolnitelnoy sistemyi. — 2016. — S. 316—318.

5. Potashnikova S. V., Sinegubov S. V. Otsenka veroyatnostey perehodov pri opisanii funktsionirovaniya sistem markovskimi protsessami // Vestnik Voronezhskogo instituta MVD Rossii. — 2016. — # 3. — S. 73—78.

6. Potashnikova S. V., Sinegubov S. V. O raspredelenii Erlanga // Nekotoryie voprosyi analiza, algebryi, geometrii i matematicheskogo obrazovaniya. — 2016. — # 5-1. — S. 252—253.

7. Potashnikova S. V., Sinegubov S. V. Modelirovanie atak, svyazannyih s fizi-cheskim proniknoveniem na ob'ektyi ohranyi // Aktualnyie problemyi deyatelnosti po-drazdeleniy UIS : sbornik materialov Vserossiyskoy nauchno-prakticheskoy konferentsii. — Voronezh, 2017. — S.44—47.

8. Menshih V. V., Sinegubov S. V. Pravovaya statistika : uchebnoe posobie. — Voronezh : Voronezhskiy institut MVD Rossii, 2015. — 152 s.

9. Menshikh V. V. Prediction of the Length of the Control Cycle in Control Systems with Fixed Operating Time References // Automatic Control and Computer Sciences. — 1998. —T. 32. — # 4. — S. 9—14.

10. Menshikh V. V. Estimator of the Planning Horizon in Control Systems // Automatic Control and Computer Sciences. — 1999. — T. 33. — # 5. — S. 34—37.

11. Menshikh V. V. Forecasting Control Cycles for a Vector Performance Function System // Automatic Control and Computer Sciences. — 2001. — T. 35. — # 5. — S. 24—32.

12. Menshih V. V., Dumachev V. N., Peshkova N. V. Matematicheskoe modelirovanie i chislennyiy analiz zadach estestvoznaniya : uchebnoe posobie. — Voronezh : Voronezhskiy institut MVD Rossii, 2015. — 122 s.

13. Menshih V. V., Bespalov S. V. Praktikum po ekonometrike. — Voronezh : Nauchnaya kniga, 2007. — 63 s.

14. Potashnikova S. V., Sinegubov S. V. Postroenie mnogofaktornoy matemati-cheskoy modeli prognozirovaniya ekonomicheskih krizisov // Matematicheskie metodyi v tehnike i tehnologiyah — MMTT. — 2017. — T. 9 — S. 136—140.

92

СВЕДЕНИЯ ОБ АВТОРАХ

Поташникова Светлана Владимировна. Преподаватель кафедры технических комплексов охраны и связи. Кандидат технических наук, доцент.

Воронежский институт ФСИН России.

E-mail: swp13@yandex.ru

Россия, 394072, г. Воронеж, ул. Иркутская, 1а. Тел. (473) 260-68-27.

Синегубов Сергей Владимирович. Доцент кафедры математики и моделирования систем. Кандидат технических наук, доцент.

Воронежский институт МВД России.

E-mail: sinusdvm@vimvd.ru

Россия, 394065, г. Воронеж, проспект Патриотов, 53. Тел. (473) 200-52-11.

Potashnikova Svetlana Vladimirovna. Lecturer of the chair of Technical Systems of Protection and Communication. Candidate of Sciences (Radio Engineering), Assistant Professor.

Voronezh Institute of the Russian Federal Penitentionary Service.

E-mail: swp13@yandex.ru

Work address: Russia, 394072, Voronezh, Irkutskaya Str., 1a. Tel. (473) 260-68-27.

Sinegubov Sergey Vladimirovich. Assistant Professor of the chair of Mathematics and Systems Modelling. Candidate of Sciences (Radio Engineering), Assistant Professor.

Voronezh Institute of the Ministry of the Interior of Russia.

E-mail: sinusdvm@vimvd.ru

Work address: Russia, 394065, Voronezh, Prospect Patriotov, 53. Tel. (473) 200-52-11.

Ключевые слова: прогнозирование; регрессионное уравнение; анализ данных; коэффициент детерминации; преступления, совершенные несовершеннолетними.

Key words: forecasting; regression equation; data analysis; coefficient of determination; crimes committed by minors.

УДК 519.25:343.851

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.