Научная статья на тему 'МОДЕЛИРОВАНИЕ КРИМИНОГЕННОЙ ОБСТАНОВКИ И ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА ПРЕСТУПЛЕНИЙ В РЕГИОНАХ РОССИЙСКОЙ ФЕДЕРАЦИИ'

МОДЕЛИРОВАНИЕ КРИМИНОГЕННОЙ ОБСТАНОВКИ И ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА ПРЕСТУПЛЕНИЙ В РЕГИОНАХ РОССИЙСКОЙ ФЕДЕРАЦИИ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
120
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКОНОМЕТРИЧЕСКОЕ ИССЛЕДОВАНИЕ / МУЛЬТИКОЛЛИНЕАРНОСТЬ ФАКТОРОВ / ГЕТЕРОСКЕДАСТИЧНОСТЬ ОСТАТКОВ / РЕГРЕССИОННАЯ МОДЕЛЬ / КОЭФФИЦИЕНТЫ ЭЛАСТИЧНОСТИ / ПРОГНОЗИРОВАНИЕ / ECONOMETRIC RESEARCH / MULTICOLLINEARITY OF FACTORS / HETEROSCEDASTICITY OF RESIDUALS / REGRESSION MODEL / ELASTICITY COEFFICIENTS / FORECASTING

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Аксенюшкина Елена Владимировна, Леонова Ольга Васильевна

В работе представлена разработка комплексного эконометрического исследования криминогенной обстановки на территории Российской Федерации, в основе которого заложен регрессионный анализ. В качестве объекта исследования использовались эмпирические данные Федеральной государственной службы статистики за 2018 г. с целью выявления факторов, оказывающих значимое влияние на количество совершенных тяжких и особо тяжких преступлений в России. В процессе установления взаимосвязей между переменными был построен «веер» из шести эконометрических моделей множественной регрессии. Для выбора наилучшей модели были проведены тесты Бокса - Кокса и Зарембки, которые дали возможность выделить линейную регрессионную модель. Полное эконометрическое исследование рассматриваемой проблемы также включало в себя анализ мультиколлинеарности факторов и исследование гетероскедастичности остатков линейной модели регрессии. Проверка неоднородности наблюдений для модели, которая в процессе исследования оказалась наилучшей из всех рассмотренных моделей, проводилась с использованием тестов Уайта, Бреуша - Пагана, Гольдфельда - Квандта, Парка и Глейзера. По всем проведенным тестам гипотеза о гомоскедастичности остатков была отклонена. Поскольку в результате исследования предпочтение было отдано линейной регрессионной модели, то именно на основе этой модели были построены точечный и интервальный прогнозы. Установлены количественные взаимосвязи исследуемых переменных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CRIME MODELING AND FORECASTING THE NUMBER OF CRIMES IN THE CONSTITUENT ENTITIES OF THE RUSSIAN FEDERATION

The article presents the work-out of a comprehensive econometric research of crime situation in the Russian Federation based on regression analysis. As an object of research we have used empirical data from the Federal State Statistics Service for 2018 to identify the factors that have a significant impact on the number of heavy and especially grave crimes committed in Russia. When establishing correlation between variables, we have built a "fan" of six econometric models of multiple regression. To select the best model, we have carried out Box-Cox and Zarembka tests, which made it possible to extract a linear regression model. A complete econometric study of the problem under consideration also included the analysis of multicollinearity of factors and the study of the heteroscedasticity of the residuals of the linear regression model. Verification of the heterogeneity of observations in the model, which in the course of the study turned out to be the best of all the models considered, was carried out using the White, Breusch-Pagan, Goldfeld-Quandt, Park, and Glazer tests. For all performed tests the hypothesis of homoscedasticity of the residues was rejected. Since, as a result of the study preference was given to a linear regression model, it was on the basis of this model that point and interval forecasts were built. Quantitative relationships of the studied variables have been established.

Текст научной работы на тему «МОДЕЛИРОВАНИЕ КРИМИНОГЕННОЙ ОБСТАНОВКИ И ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА ПРЕСТУПЛЕНИЙ В РЕГИОНАХ РОССИЙСКОЙ ФЕДЕРАЦИИ»

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И ОБРАБОТКА ДАННЫХ

УДК 519.24

Б01: 10.18101/2304-5728-2020-2-36-51

МОДЕЛИРОВАНИЕ КРИМИНОГЕННОЙ ОБСТАНОВКИ И ПРОГНОЗИРОВАНИЕ КОЛИЧЕСТВА ПРЕСТУПЛЕНИЙ В РЕГИОНАХ РОССИЙСКОЙ ФЕДЕРАЦИИ

© Аксенюшкина Елена Владимировна

кандидат физико-математических наук, доцент, Байкальский государственный университет Россия, 664003, г. Иркутск, ул. Ленина, 11 aks.ev@mail.ru

© Леонова Ольга Васильевна

кандидат физико-математических наук, доцент, Байкальский государственный университет Россия, 664003, г. Иркутск, ул. Ленина, 11 о^а. olgaleonova@yandex.ru

Аннотация. В работе представлена разработка комплексного эконометриче-ского исследования криминогенной обстановки на территории Российской Федерации, в основе которого заложен регрессионный анализ. В качестве объекта исследования использовались эмпирические данные Федеральной государственной службы статистики за 2018 г. с целью выявления факторов, оказывающих значимое влияние на количество совершенных тяжких и особо тяжких преступлений в России. В процессе установления взаимосвязей между переменными был построен «веер» из шести эконометрических моделей множественной регрессии. Для выбора наилучшей модели были проведены тесты Бокса — Кокса и Зарембки, которые дали возможность выделить линейную регрессионную модель.

Полное эконометрическое исследование рассматриваемой проблемы также включало в себя анализ мультиколлинеарности факторов и исследование ге-тероскедастичности остатков линейной модели регрессии. Проверка неоднородности наблюдений для модели, которая в процессе исследования оказалась наилучшей из всех рассмотренных моделей, проводилась с использованием тестов Уайта, Бреуша — Пагана, Гольдфельда — Квандта, Парка и Глейзера. По всем проведенным тестам гипотеза о гомоскедастичности остатков была отклонена.

Поскольку в результате исследования предпочтение было отдано линейной регрессионной модели, то именно на основе этой модели были построены точечный и интервальный прогнозы. Установлены количественные взаимосвязи исследуемых переменных.

Ключевые слова: эконометрическое исследование; мультиколлинеарность факторов; гетер оскедастичность остатков; регрессионная модель; коэффициенты эластичности; прогнозирование.

Для цитирования:

Аксенюшкина Е. В., Леонова О. В. Моделирование криминогенной обстановки и прогнозирование количества преступлений в регионах Российской Федера -ции // Вестник Бурятского государственного университета. Математика, информатика. 2020. № 2. С. 36-51.

Введение

Развитие любой страны в значительной мере продиктовано воздействием неявных закономерностей большого многообразия факторов. Нахождение и исследование таких взаимосвязей для общества имеют важное значение, поскольку открывают двери для возможного управления различными показателями [2; 4; 13; 14]. Поэтому на сегодняшний день становится актуальной разработка комплексной методологической базы такого исследования на примере анализа криминогенной обстановки Российской Федерации.

В любом обществе проблема уменьшения уровня преступности всегда являлась одной из первостепенных задач. Количество совершенных преступлений является той призмой, через которую можно судить о состоянии государства, о тенденции развития общества.

Выявление факторов, непосредственно оказывающих влияние на состояние криминогенной обстановки в стране, часто поднимается в российских и международных исследованиях [7; 8; 9; 10; 11]. Несмотря на это, определение факторов, построение типа зависимости, а также проведение анализа полученных результатов еще недостаточно изучены.

В данной статье исследуется зависимость количества преступлений, совершаемых на территории Российской Федерации, от различных факторов, которые, по мнению экспертов, могут оказывать влияние на изучаемый показатель. Это дает возможность найти новые рычаги, оказывающие влияние на уровень преступности в стране.

Для проведения исследования применяются эконометрические методы. В этом случае предполагается существование связей между объяс -няемой и объясняющими переменными. Рассмотренный подход требует грамотного подбора всех переменных исходя из логических соображений и, что немаловажно, дает возможность отследить изменения социально-экономической обстановки в регионах Российской Федерации. Для получения результатов в работе используется регрессионный анализ [12].

Было проведено исследование статистических данных общего количества зарегистрированных тяжких и особо тяжких преступлений в Российской Федерации в 2018 г. с целью определения влияния ряда факторов на этот показатель.

1 Постановка задачи

Обозначим через Y зависимую (результирующую) переменную — количество зарегистрированных тяжких и особо тяжких преступлений. Рассмотрим существование взаимосвязи количества преступлений со следующими независимыми факторами:

x1— число пациентов с психическими расстройствами, связанными с употреблением алкоголя, т. е. с синдромом алкогольной зависимости (количество зарегистрированных в год), чел;

x2— число пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических веществ (количество зарегистрированных в год), чел;

x3— средняя годовая численность постоянного населения, чел.; x4— численность рабочей силы, тыс. человек; x5— средний денежный доход населения, руб/чел.; x6 - x12 — соотношения денежных доходов и величины прожиточного минимума, %:

x6 — денежный доход меньше половины прожиточного минимума; x7— денежный доход составляет от 0,5 до 1 прожиточного минимума; x8 — денежный доход составляет от 1 до 1,5 прожиточных минимумов; x9— денежный доход составляет от 1,5 до 2 прожиточных минимумов; x10 — денежный доход составляет от 2 до 3 прожиточных минимумов; x11 — денежный доход составляет от 3 до 6 прожиточных минимумов; x12 — денежный доход составляет более шести прожиточных минимумов; x13 — общий прирост постоянного населения, чел.; x14 — доля городского населения в общей численности населения, %; x15 — число выбывших за 2018 г., чел.; x16 — число прибывших за 2018 г., чел.

В качестве эмпирической базы используются открытые данные Федеральной государственной службы статистики за 2018 г.1

Построим модели множественной регрессии — зависимости количества совершаемых преступлений от перечисленных выше факторов (при расчетах используем пакет «Анализ данных» MS Excel). Проведем анализ для выбора наилучшей модели, построим по ней точечные и интервальные прогнозы и установим количественные связи между переменными.

1 Федеральная служба государственной статистики [Электронный ресурс]. URL: http://www.gks.ru/ (дата обращения: 12.02.2020).

2 Построение моделей регрессии

Для построения моделей необходимо провести отбор факторов, которые будут включены в уравнение регрессии. Для отбора факторов будем использовать метод включения [3].

Для определения наиболее значимого фактора определим парные коэффициенты корреляции переменной У с факторами х1 - х12. Результаты расчетов приведем в таблице 1.

Таблица 1

Парные коэффициенты корреляции __

Фактор х1 х2 х3 х4 х5 х6 х7 х8

Коэффициент корреляции 0,712 0,854 0,960 0,967 0,391 -0,291 -0,399 -0,467

Фактор х9 х10 х11 х12 х13 х14 х15 х16

Коэффициент корреляции -0,474 -0,094 0,438 0,490 0,642 0,403 0,900 0,906

Сравнивая коэффициенты корреляции по модулю, делаем вывод, что наиболее влияющим фактором является х4 — численность рабочей силы. На основании этого получаем следующую линейную модель для переменных У и х4:

У = - 43,9+ 5,66х 4 +е, Я2 = 0,94, (1)

(-0,18) (34,15)

где е — случайная компонента, Я2 — показатель детерминации, в скобках указаны /-статистики параметров модели.

Далее в модель (1) последовательно вводим другие факторы согласно их ранжированию по коэффициенту корреляции (от большего к меньшему). Добавленные факторы тестируются на значимость с помощью критерия Стьюдента [12]. Незначимые факторы из модели исключаются и в дальнейшем исследовании не используются. В результате нескольких итераций остаются только значимые факторы: х2, х4 и х14, для которых множественная линейная регрессия имеет вид:

У = -1800,8 + 4,7 х2 + 4,75 х4 + 25,07 х14 +е, Я2 = 0,9495. (2)

(-2,5) (3,59) (17,9) (2,002)

Качество модели (2) можно оценить как хорошее, поскольку все пара -метры модели значимые и коэффициент детерминации близок к 1.

Не будем ограничиваться только линейной моделью, рассмотрим еще и самые популярные нелинейные модели [6]: полиномиальную, полулогарифмическую, обратную, степенную и показательную.

Выберем наилучшую из них опытным путем, для этого проведем оценку параметров рассматриваемых моделей с помощью метода наименьших квадратов [6], предварительно проделав соответствующие преобразования. В зависимости от типа нелинейности модели будем использовать замену переменных или логарифмические преобразования.

Результаты оценок параметров моделей, /-статистики, коэффициенты детерминации и ^-статистики приведены в табл. 2.

Таблица 2

Линейная и нелинейные модели в линеаризованном виде_

Оцененные модели регрессии Коэффициент детерминации, скорректированный коэффициент детерминации Общий Е-критерий

Линейная У = -1800,8 + 4,7 х2 + 4,75 х4 + 25,07 х14 + £ (- 2,5) (3,59) (17,9) (2,002) Я2 = 0,9495 Я2 = 0,9475 Е = 482,68

Полином второй степени У = - 765,713 + 7,9 х2 - 0,00318 х22 + 3,35 х4 + (-0,9) (2,25) (-0,61) (5,81) + 0,000237 х42 + 9,9 х14 + 0,109 х?4 + £ (2,18) 4 (0,12) 14 (0,18) 14 Я2 = 0,9557 Я2 = 0,9521 Е = 266,26

Обратная — = 0,00118 - 4,6 • 10-7 х2 - 6,7 • 10-8 х4 - У (5,7) (-1,4) (-1,04) -8,9•Ю-6 х14 + £ (-2,97) 14 Я2 = 0,33 Я2 = 0,3 Е = 12,77

Степенная 1п У = 0,81 + 0,191п х2 + 0,691п х4 + (1,15) (4,88) (12,37) + 0,471п х14 + 1п £ (2,75) Я2 = 0,89 Я2 = 0,88 Е = 216,47

Показательная 1п У = 6,75 + 0,001583 х2 + 0,000359 х4 + (21,46) (3,27) (3,67) + 0,0114 х14 + 1п £ (2,46) Я2 = 0,68 Я2 = 0,67 Е = 56,67

Полулогарифмическая У = - 35566,2 + 6671п х2 + 4428,91п х4 + (-3,92) (1,33) (6,15) + 2155,621п х14 + £ (0,98) 14 Я2 = 0,61 Я2 = 0,59 Е = 40,91

Если сравнить /-статистики параметров моделей с критической точкой ¡ф = 1,66, то можно сделать вывод, что полиномиальная, обратная и полулогарифмическая модели имеют незначимые параметры и в дальнейших исследованиях не участвуют.

Оставшиеся три модели являются статистически значимыми, так как их ^-статистики, приведенные в таблице 2, больше, чем критическая точка ^ = 2,72.

Таким образом, продолжим поиск модели, наиболее точно описывающей взаимосвязь между переменными среди линейной, степенной и показательной.

3 Выбор наилучшей модели

Поскольку разница между наибольшим и наименьшим значениями зависимой переменной больше 10, а также зависимые переменные в линеаризованных моделях различны, то это дает возможность использовать тест Бокса — Кокса для выбора наилучшей модели.

Тест основан на утверждении, что как исходные (наблюдаемые), так и преобразованные значения переменной являются частным случаем реализации специальной функции [5] при различных значениях Я. Суть теста заключается в поиске таких значений параметра 1, при которых остаточная сумма квадратов SSост будет минимальной.

Для непреобразованного значения зависимой переменной при 1 = 1 получим

У * =-1801,8 + 4,7 х2 + 4,75х4 + 25,07х14 +е; SS1=1 = 1,43-108.

' ' 2 ' 4 '14' ост '

Для логарифмированного значения зависимой переменной при 1® 0 получим

У * = 24133,64 + 5,65х, + 1,28х4 + 40,73х14 + е; SS1®1 = 2,5 • 108.

2 4 14 ост

Остаточная сумма квадратов при 1 = 0 меньше, чем при 1® 0, следовательно, связь между переменными лучше всего характеризует линей -ная функция в отличие от степенной и показательной.

Модификацией теста Бокса — Кокса является преобразование Зарем-бки [5], которое применяется только для двух форм зависимой переменной — непреобразованной и логарифмированной.

У

После преобразования зависимой переменной У = —— получены

Угеом

уравнения:

У0 =-0,5 + 0,0013х2 + 0,0013х4 + 0,007х14 +е; SS = 11,2;

2 4 14 ост

1п У0 =-1,42 + 0,0015х, + 0,00035х4 + 0,011х14 +е; SS = 19,57.

2 4 14 ост

Поскольку остаточная дисперсия у первой модели меньше, то следует отдать предпочтение линейной модели.

Проверим значимость остаточных сумм квадратов с помощью теста

С2. Статистика с2 =

81 11,2 —ln

= 22,5 больше, чем критическая точка

2 19,57

Со 05 (1) = 3,84, поэтому для всех исследуемых моделей статистически значимыми являются различия между остаточными суммами квадратов.

Таким образом, можно утверждать, что линейная модель лучше всего описывает взаимосвязь между показателями.

4 Анализ мультиколлинаерности факторов

Мультиколлинеарность факторов возникает при наличии высокой корреляционной связи между регрессорами и может привести к неустойчивости и ненадежности оценок параметров построенных моделей.

Существуют различные способы выявления и устранения мультикол-линеарности факторов [1]. Построим матрицу парных коэффициентов корреляции и проведем исследование существования корреляционной связи между факторами модели

œ 1 0,82 0,37^ 0,82 1 0,35

0,37 0,35 1 0

\ ^ ^ /

Подчеркнем, что между переменными х2 и х4 очень тесная связь, что подтверждает интеркорреляцию этих переменных. Между переменными х4 и х14, х2 и х14 получена достаточно слабая связь. Определитель матрицы rxx равен 0,27, что говорит о наличии мультиколлинеарности объясняющих переменных.

Парные коэффициенты корреляции между зависимой переменной и факторами равны = 0,85 ; = 0,96 ; rrх = 0,40 . Поскольку значения

межфакторной корреляции меньше этих коэффициентов, то сделаем вывод о том, что все переменные можно включить в модель.

Для измерения степени мультиколлинеарности регрессоров используем фактор вздутия дисперсии (VIF) [12]. Для этого рассчитаем коэффициенты детерминации для регрессий между переменной х. и другими фак-

торами:

Х2 =-81,86 + 0,16 х4 +1,54 х14; х4 =-32,3 + 3,93х2 + 3,84 х14; х14 = 65,9 + 0,016х2 + 0,0017 х4;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= 0,68 ;

х2 х4х14

2 = 0,68 ;

х4х2х14

R х х •*14 2 4 = 0,14

Следовательно, фактор вздутия дисперсии для каждой независимой переменной будет равен

VIF =-1-= 3,125, VIF =-1-= 3,125,

12 1 - 0,68 14 1 - 0,68

VIF =-1— = 1,16.

114 1 - 0,14

Рассчитанные величины свидетельствуют о наличии мультиколлине-арности переменных.

Для устранения мультиколлинеарности воспользуемся специальными методами корректировки моделей: ридж-регрессии [12] и главных компонент [1].

После применения ридж-регрессии получили уравнение: y = -1733,29 + 4,71х2 + 4,75х4 + 24,1х14 + s . После применения метода главных компонент получили уравнение:

y = -1612,41 + 4,73х2 + 4,75х4 + 22,38х14 + s . Отметим, что изменения в моделях были относительно невелики, что указывает на невысокую степень мультиколлинеарности, которой можно пренебречь.

5 Исследование гетероскедастичности случайных остатков модели

Проверку неоднородности наблюдений в модели, которая в процессе исследования оказалась наилучшей из всех рассмотренных моделей, проведем с использованием тестов Уайта, Бреуша — Пагана, Гольдфельда — Квандта, Парка и Глейзера.

Для теста Уайта необходимо построить квадратичную функцию зависимости квадратов остатков от всех факторов и их квадратов. Оцененная квадратичная модель имеет вид:

l2 = 4218833 + 7176,3 х2 -14,31 х22 + 2334,29х4 + 0,02 х42 -132492 х14 +

(0,56) (0,69) (-1,03) (1,37) (0,06) (-0,58)

+ 861 х24 + 5 , F = 2,9,

(0,5) 14

где l — случайные остатки модели (1), 5 — случайная компонента.

Табличное значение F-критерия равно FKp = F(0,05; 6; 74) = 2,22 . Так

как F > FKp , то по тесту Уайта гипотеза об отсутствии гетероскедастично-сти отклоняется.

Отметим, что все параметры этой модели незначимы, но наибольшее значение /-критерия (достаточно близкое к табличному t = 1,66 ) имеет

параметр при переменной х4. Таким образом, переменная х4 может быть рассмотрена как возможная причина гетероскедастичности остатков.

Для проведения теста Бреуша — Пагана [6] необходимо оценить зависимость вида:

l2

— = 0,83 - 0,00078х2 + 0,001х4 - 0,0098х14 + v, 43

где — оценка дисперсии случайных остатков, V — случайная компонента.

Наблюдаемое значение критерия сС = = 66,069 = 33,034 больше

табличного %гр = с2(0,05; 3) = 7,81, поэтому нулевая гипотеза о гомоске-

дастичности случайных остатков отвергается.

Исследуем влияние всех трех независимых переменных по отдельно -сти на дисперсию случайных остатков. В итоге получили зависимости:

12

— = 0,41 + 0,0032х, + V ; с2 = 18,09;

^ 2 7 7 2" /Ь ""

12

— = 0,16 + 0,00087х4 + V; с2 = 31,955; I'2_

Табличное значение критерия в данном случае %2 = с2(0,05; 1) = 3,84,

— = - 0,00076 - 0,014х14 + V; с2 = 1,4.

неравенство с > Скр справедливо только для переменных х2 и х4, то

есть остатки гетероскедастичны по этим переменным.

Опираясь на выявленное влияние на дисперсию остатков переменных х2 и х4, проверим эту связь с помощью других тестов.

Использование теста Гольдфельда — Квандта [6] предполагает упорядочивание данных, в нашем случае по переменным х2 и х4,

Общий объем наблюдений составляет 71 регион, то есть их можно разбить на три равные группы по 27 регионов. Для первой и третьей совокупности наблюдений найдем параметры множественной линейной регрессии и остаточные суммы квадратов.

Если производить упорядочивание по переменной х2, то получим результаты:

7 = -407,65 + 17,45х2 + 2,76х4 + 11,82х|4; = 14034165;

' ' 2 ' 4 '14' ост '

7 = - 5202,17 + 6,44х2 + 4,65х4 + 59,05х14; = 94056651.

2 4 14 ост

Наблюдаемое значение критерия Е = 94056651 = 6,7 . Табличное зна-

14034165

чение критерия Екр = 2,014, так как Е > Екр , то дисперсия остатков зависит от величины значений переменной х2 .

Если производить упорядочивание по переменной х4 , то получим результаты:

7 = - 203,62 + 8,82х2 + 4,9х4 +1,8х14; = 125720050;

2 4 14 ост

7 = -4159,43 + 4,45х2 + 4,79х4 + 55,74х14; = 1,5-108.

2 4 14 ост

Наблюдаемое значение критерия Е = 8,38 . Табличное значение критерия Екр = 2,014, так как Е > Екр , то дисперсия остатков зависит от величины значений переменной х4.

Исследование по тесту Парка [6] приводит к результатам: 1п 12 = 8,4 + 0,861п х2 + V ; г = 3,46,

1п 12 = 1,08 + 1,731п х4 + V; г = 5,07.

Табличное значение критерия Стьюдента гкр = 1,66; так как для обоих факторов г > гкр , то гипотеза о гомоскедастичности отвергается.

По тесту Глейзера [6] необходимо найти параметры целой серии уравнений, задаваемых функцией

I I к

I е 1= «0 + Vi,

где к — какое-либо число, например, к = ± 1; ± 0,5 и т. п. Для переменной х2 получили уравнения:

при к = 1, 111= 553,13 + 2,044х2 + V, г = 4,36; при к = -1, 111= 972,39 -1747,37 — + V, г = - 1,27;

при

к = 0,5, 111= 161,95 + 65,43^Х + V, г = 4,59;

при к = - 0,5, 111= 1208,9-2226,89-^ + V, г = - 2,43.

/х„

Для переменной х4 получили уравнения: при к = 1, 111= 477,72 + 0,46х4 + V, г = 5,04;

при к = -1, 111= 1175,08 -114486,345 — + V, г = - 2,53;

х„

при

к = 0,5, 111=- 183,86 + 39,47*4+V, г = 5,42;

при к = - 0,5, 111= 1723,93-18722,1-^ + V, г = -3,66.

хл

Табличное значение критерия Стьюдента гкр = 1,66, таким образом, по

тесту Глейзера практически при всех к гипотеза о гомоскедастичности остатков отвергается.

Подводя итоги исследования гетероскедастичности остатков изучаемых показателей, отметим, что по всем проведенным тестам гипотеза о гомоскедастичности остатков была отвергнута, то есть можно утверждать, что на дисперсию случайных остатков оказывают влияние переменные х2 и х4, то есть эти переменные являются причиной гетероскеда-стичности остатков.

Для устранения гетероскедастичности остатков была предпринята попытка использования обобщенного метода наименьших квадратов для нахождения оценок параметров модели, но она не увенчалась успехом, поскольку некоторые параметры в новой модели оказались незначимыми.

6 Прогнозирование по линейной множественной регрессии

Результаты исследования показали, что линейная модель регрессии (2) достаточно точно описывает связь изучаемых показателей, поэтому используем ее для прогнозирования.

В таблице 3 приведены прогнозные значения переменных х2, х4 и х14. Используя значения этих показателей, построены точечный и интервальный прогнозы.

Таблица 3

Среднее прогнозируемое значение количества зарегистрированных

тяжких и особо тяжких преступлений по федеральным округам

№ Субъект Российской Федерации Прогнозное значение Прогнозируемое количество преступлений (точечный прогноз) Прогнозируемое количество преступлений (интервальный прогноз)

х, х4 х14

1 Центральный федеральный округ 95 558 65 2926 (189;5664)

2 Московская область и г. Москва 858 5159 81 28774 (25758;31790)

3 СевероЗападный федеральный округ- 65 480 85 2916 (144;5688)

4 Ленинградская область и г. Санкт-Петербург 363 2219 90 12704 (9921; 15488)

5 Южный федеральный округ 150 1033 53 5141 (2371; 7910)

6 СевероКавказский федеральный округ 93 732 56 3518 (762; 6237)

7 Приволжский федеральный округ 147 972 63 5087 (2347; 7828)

8 Уральский федеральный окру 280 1133 73 6728 (3989; 9468)

9 Сибирский федеральный округ- 188 653 63 3764 (1020; 6509)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 Иркутская область 339 1070 71 6675 (3918; 9432)

11 Дальневосточный федеральный округ 188 456 85 3380 (607; 6153)

7 Интерпретация линейной модели множественной регрессии

Построенная модель (1) дает возможность утверждать, что между количеством зарегистрированных тяжких и особо тяжких преступлений наблюдается прямая связь с числом пациентов с психическими расстройствами, связанными с употреблением алкоголя, численностью рабочей силы и долей городского населения в общей численности населения.

Коэффициенты при переменных х2, х4 и х14 показывают абсолютную силу связи и характеризуют среднее изменение результирующего показателя при единичном изменении соответствующего фактора при условии неизменности остальных регрессоров, входящих в модель.

Таким образом, можно сделать вывод, что с изменением на одного человека числа пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических веществ, количество преступлений в среднем изменится в ту же сторону на 4,7 при неизменном уровне численности рабочей силы и доли городского населения в общей численности населения.

Изменение численности рабочей силы на 1 тыс. человек приведет к изменению количества преступлений в среднем на 4,75 при неизменных значениях числа пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических и доли городского населения в общей численности населения.

При изменении доли городского населения в общей численности населения на 1% количество преступлений в среднем изменится на 25,07 при том же уровне числа пациентов с психическими расстройствами и численности рабочей силы.

Коэффициенты регрессии нельзя сравнить между собой поскольку у них разный масштаб измерения. Для ранжирования факторов по силе их воздействия на результативный признак можно использовать относительные показатели связи — частные коэффициенты эластичности.

Для характеристики силы связи количества преступлений и числа пациентов с психическими расстройствами, уровнем численности рабочей силы и долей городского населения в общей численности населения получены коэффициенты эластичности:

Ех = 0,16; Е = 0,85; Е = 0,33.

х2 х4 х14

То есть с изменением числа пациентов с психическими расстройствами на 1% от среднего уровня количество зарегистрированных тяжких и особо тяжких преступлений изменится в ту же сторону на 0,16% своего среднего уровня при неизменном уровне численности рабочей силы и доли городского населения в общей численности населения.

С изменением численности рабочей силы на 1% от среднего уровня количество зарегистрированных тяжких и особо тяжких преступлений изменится в ту же сторону на 0,85% своего среднего уровня при неизменном уровне числа пациентов с психическими расстройствами и доли городского населения в общей численности населения.

С изменением доли городского населения в общей численности населения на 1% от среднего уровня количество зарегистрированных тяжких и особо тяжких преступлений изменится в ту же сторону на 0,33% своего среднего уровня при неизменном уровне числа пациентов с психическими расстройствами и численности рабочей силы.

Сопоставляя полученные коэффициенты эластичности, можно сделать вывод о том, что наиболее сильное влияние на количество зарегистрированных тяжких и особо тяжких преступлений оказывает численность рабочей силы. На втором месте по силе влияния оказалась доля городского населения в общей численности населения и самое слабое влияние оказывает число пациентов с психическими расстройствами, связанными с синдромом зависимости от наркотических веществ.

Заключение

В статье использовался регрессионный анализ для моделирования и прогнозирования количества зарегистрированных тяжких и особо тяжких преступлений на основе наиболее полных и актуальных данных по восьми округам Российской Федерации. После проведенного анализа среди построенных моделей наилучшей оказалась множественная линейная регрессия. Тем не менее анализ на гетероскедастичность она не прошла, но, несмотря на это точечный прогноз, построенный по линейной модели, не сильно отличается от средних показателей преступности по каждому округу. Это говорит о том, что непостоянство дисперсии случайных остат -ков в данном случае не оказало значимого влияния на свойства оценок параметров. Заметим, что на точность прогнозирования влияют не только различия в количестве преступлений в различных округах, но и неоднородность других данных, например, численность рабочей силы.

Авторы считают, что построенные и верифицированные модели можно использовать в других исследовательских областях. Предложенная методика исследований открывает достаточно широкие горизонты для прогно -

зирования поведения различных социально-экономических показателей. Полученные количественные взаимосвязи между анализируемыми показателями и построенные прогнозы могут быть использованы различными службами, администрациями, правительствами областей при построении стратегии развития регионов для достижения улучшения качества жизни населения.

Литература

1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы. М.: ЮНИТИ, 1998. 1000 с.

2. Балдынова Е. В., Малютина С. А. Сравнительный анализ среднемесячной реальной заработной платы работников организаций в разрезе видов экономической деятельности по Иркутской области // Известия Байкальского государственного университета. 2018. Т. 28, № 3. С. 409-418.

3. Валентинов В. А. Эконометрика. М.: Дашков и К°, 2009. 436 с.

4. Волченко Л. Ю., Мамонова Н. В., Завьялова Е. О. Моделирование влияния деятельности таможенных органов на социально-экономическое развитие и инвестиционную активность регионов // Инновационное развитие экономики. 2017. № 6(42). С. 16-26.

5. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: пер. с англ. 3-е изд. М.: Вильямс, 2007. 392 с.

6. Елисеева И. И. Эконометрика. М.: Юрайт, 2012. 449 с.

7. Кучерова С. В. Использование анализа временных рядов при исследовании уровня преступности // Фундаментальные исследования. Экономические науки. 2015. № 11. С. 1206-1209.

8. Латов Ю. В. Экономические детерминанты преступности в зарубежных странах (обзор криминометрических исследований) // Журнал институциональных исследований. 2011. Т. 3, № 1. С. 133-149.

9. Мамонова Н. В., Гаврилова Е. А. Анализ нарушения гарантий независимости адвокатов сотрудниками правоохранительных органов при защите личности в уголовном судопроизводстве // Адвокатская практика. 2019. № 2. С. 45-51.

10. Молоков В. В., Рудакова Е. Н. Исследование статистических взаимосвязей показателей преступности как фактора криминализации региона // Вестник Сибирского юридического института МВД России. 2018. № 1(30). С. 61-68.

11. Мустафина С. Ю. Влияние социально-экономических факторов на уровень преступности: статистическое исследование // Экономика инновационного развития: теория и практика. 2018. № 3 (19). С. 41-46.

12. Мхитарян В. С. Эконометрика. М.: Проспект, 2008. 380 с.

13. Рогачева О. А. Миграционные процессы в регионах Сибири и Дальнего Востока // GLOBAL AND REGIONAL RESEARCH. 2019. Т. 1, № 3. С. 256-263.

14. Трофимов С. Е. Эконометрическое моделирование динамического временного ряда цены на нефть // Известия Иркутской государственной экономической академии. 2015. Т. 25, № 6. С. 990-998.

CRIME MODELING AND FORECASTING THE NUMBER OF CRIMES IN THE CONSTITUENT ENTITIES OF THE RUSSIAN FEDERATION

Elena V. Aksenyushkina

Cand. Sci. (Phys. and Math.), A/Prof.,

Mathematical Methods and Information Technologies Department

Baikal State University

11 Lenina St., Irkutsk 664003, Russia

aks.ev@mail.ru

Olga V. Leonova

Cand. Sci. (Phys. and Math.), A/Prof.,

Mathematical Methods and Information Technologies Department Baikal State University 11 Lenina St., Irkutsk 664003, Russia olga. olgaleonova@yandex.ru

Abstract. The article presents the work-out of a comprehensive econometric research of crime situation in the Russian Federation based on regression analysis. As an object of research we have used empirical data from the Federal State Statistics Service for 2018 to identify the factors that have a significant impact on the number of heavy and especially grave crimes committed in Russia. When establishing correlation between variables, we have built a "fan" of six econometric models of multiple regression. To select the best model, we have carried out Box-Cox and Zarembka tests, which made it possible to extract a linear regression model.

A complete econometric study of the problem under consideration also included the analysis of multicollinearity of factors and the study of the heteroscedasticity of the residuals of the linear regression model. Verification of the heterogeneity of observations in the model, which in the course of the study turned out to be the best of all the models considered, was carried out using the White, Breusch-Pagan, Goldfeld-Quandt, Park, and Glazer tests. For all performed tests the hypothesis of homoscedasticity of the residues was rejected.

Since, as a result of the study preference was given to a linear regression model, it was on the basis of this model that point and interval forecasts were built. Quantitative relationships of the studied variables have been established.

Keywords: econometric research; multicollinearity of factors; heteroscedasticity of residuals; regression model; elasticity coefficients; forecasting.

References

1. Aivazyan S. A., Mkhitaryan V. S. Prikladnaya statistika i osnovy [Applied Statistics and Fundamentals]. Moscow: YuNITI Publ., 1998. 1000 p.

2. Baldynova E. V., Malyutina S. A. Sravnitelnyi analiz srednemesyachnoi realnoi zarabotnoi platy rabotnikov organizatsii v razreze vidov ekonomicheskoi deyatelnosti po Irkutskoi oblasti [Comparative Analysis of the Average Monthly Real Wages of Corporate Employees in Terms of Types of Economic Activity in Irkutsk Oblast]. Izvestiya Baikalskogo gosudarstvennogo universiteta. 2018. V. 28, no. 3. Pp. 409-418.

3. Valentinov V. A. Ekonometrika [Econometrics]. Moscow: Dashkov i K° Publ., 2009. 436 p.

4. Volchenko L. Yu., Mamonova N. V., Zavyalova E. O. Modelirovanie vliyaniya deyatelnosti tamozhennykh organov na sotsialno-ekonomicheskoe razvitie i investit-sionnuyu aktivnost regionov [Modeling the Impact of Customs Authorities' Work on Socio-Economic Development and Investment Activity in the Regions]. Innovatsion-noe razvitie ekonomiki. 2017. No. 6(42). Pp. 16-26.

5. Draper N. R., Smith H. Applied Regression Analysis. 3rd ed. USA: Wiley, 1998. 698 p.

6. Eliseeva I. I. Ekonometrika [Econometrics]. Moscow: Yurait Publ., 2012. 449 p.

7. Kucherova S. V. Ispolzovanie analiza vremennykh ryadov pri issledovanii urov-nya prestupnosti [Application of Time Series Analysis in the Study of Crime Rate]. Fundamentalnye issledovaniya. Ekonomicheskie nauki. 2015. No. 11. Pp. 1206-1209.

8. Latov Yu. V. Ekonomicheskie determinanty prestupnosti v zarubezhnykh stranakh (obzor kriminometricheskikh issledovanii) [Economic Determinants of Crime in Foreign Countries (review of criminometric studies)]. Journal of Institutional Studies. 2011. V. 3, No. 1. Pp. 133-149.

9. Mamonova N. V., Gavrilova E. A. Analiz narusheniya garantii nezavisimosti advokatov sotrudnikami pravookhranitelnykh organov pri zashchite lichnosti v ugolov-nom sudoproizvodstve [Analysis of Violations of the Guarantees of Independence of Lawyers by Law Enforcement Officials in the Protection of Personality in Criminal Proceedings]. Advokatskayapraktika. 2019. No. 2. Pp. 45-51.

10. Molokov V. V., Rudakova E. N. Issledovanie statisticheskikh vzaimosvyazei pokazatelei prestupnosti kak faktora kriminalizatsii regiona [Investigation of Statistical Evidence of Crime Indicators as a Factor in the Criminalization of the Region]. Vestnik Sibirskogo yuridicheskogo instituta MVD Rossii. 2018. No. 1(30). Pp. 61-68.

11. Mustafina S. Yu. Vliyanie sotsialno-ekonomicheskikh faktorov na uroven prestupnosti: statisticheskoe issledovanie [Impact of Socio-Economic Factors on the Crime Rate: A Statistical Study]. Ekonomika innovatsionnogo razvitiya: teoriya ipraktika. 2018. No. 3(19). Pp. 41-46.

12. Mkhitaryan V. S. Ekonometrika [Econometrics]. Moscow: Prospekt Publ., 2008. 380 p.

13. Rogacheva O. A. Migratsionnye protsessy v regionakh Sibiri i Dalnego Vostoka [Migration Processes in the Regions of Siberia and the Far East]. Global and Regional Research. 2019. V. 1, no. 3. Pp. 256-263.

14. Trofimov S. E. Ekonometricheskoe modelirovanie dinamicheskogo vremen-nogo ryada tseny na neft [Econometric Modeling of the Dynamic Time Series of Oil Prices]. Izvestiya Irkutskoi gosudarstvennoi ekonomicheskoi akademii. 2015. V. 25, no. 6. Pp. 990-998.

i Надоели баннеры? Вы всегда можете отключить рекламу.