УДК 519.86
У.А. Хохлова
КЛАСТЕРИЗАЦИЯ РЕГИОНОВ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ЧИСЛЕННОСТИ ПРИБЫВШИХ В 2015 ГОДУ
В статье рассматривается проведение кластерного анализа по регионам Российской Федерации по численности прибывших, чтобы выявить какие факторы оказывают наибольшее влияние на миграцию населения. Также были построены пессимистический, оптимистический и реалистический прогнозы, позволяющие определить в каких пределах будет находится численность прибывших.
Ключевые слова: миграция, прибывшие, выбывшие, кластер, факторы, регрессионный анализ.
Сегодня миграция- это процесс естественный. Ни для кого не составляет удивление граждане другой национальности, которые трудятся в сфере услуг или просто торгуют на рынке, выполняют ремонтные работы. Это объясняется тем, что даже несмотря на кризис во всем мире, наша страна входит в пятерку стран, которые наиболее привлекают мигрантов.
Проводимый статистический анализ миграционных процессов, оказывающих существенное влияние на экономическую, социальную, политическую сферы жизни, требует совершенствования методики комплексного статистического исследования миграции населения. В связи с этим изучение числа прибывших и выбывших в различных регионах страны имеет большой научный и практический интерес и приобретает особую актуальность.
Для оценки различий среди регионов Российской Федерации и выделения однородных групп по миграционному состоянию проведена многомерная классификация по показателям:
У - численность прибывших, чел.;
Х\ - уровень занятости, %;
Х2 - уровень безработицы, %;
Х3 - среднемесячная номинальная начисленная заработная плата работников в целом по экономике, р.;
Х4 - потребительские расходы в среднем на душу населения, р.;
Х5 - среднедушевые денежные доходы населения, р.;
Х6 - ИПЦ, %;
Х7 - инвестиции в основной капитал на душу населения, р.;
Хд - объем платных услуг на душу населения, р.;
Х9 - оборот розничной торговли на душу населения, р.;
Х^о - число предприятий и организаций, шт.;
Х11 - соотношение с величиной прожиточного минимума среднего размера назначенных пенсий, %.
По собранным данным был проведен дескриптивный анализ. Он выявил неоднородность исследуемой совокупности и необходимость проведения типологизации, то есть выделение однородных групп объектов.
© Хохлова У.А., 2017.
Научный руководитель: Еремеева Наталья Сергеевна - кандидат экономических наук, доцент, Оренбургский государственный университет, Россия.
Многомерная классификация регионов Российской Федерации проводилась с помощью метода «Варда» с использованием обычного Евклидова расстояния. На рисунке 1 представлена дендрограмма разбиения регионов Российской Федерации по исследуемым показателям.
Рис. 1. Дендрограмма разбиения регионов Российской Федерации по методу «Варда»
Как видно на рисунке 1 исходную совокупность можно разбить на 3 кластера. Уточнение состава
классов было проведено с помощью метода к -средних, так как этот метод дает лучшее разбиение по функционалу качества. Для наглядности представления полученных результатов, изобразим их графически (рисунок 2).
Рис.
хэ х7
Переменнные
2. График нормированных средних значений признаков в каждом кластере
По рисунку 1.2 видно, что первый кластер регионов Российской Федерации характеризуется низким значением результативного признака (число прибывших) и обладает наименьшим средним значением таких показателей, как уровень занятости, среднемесячная номинальная начисленная заработная плата работников в целом по экономике, потребительские расходы в среднем на душу населения, среднедушевые денежные доходы населения, инвестиции в основной капитал на душу населения, объем платных услуг на душу населения, оборот розничной торговли на душу населения, число предприятий и организаций, соотношение с величиной прожиточного минимума среднего размера назначенных пенсий, однако данный кластер характеризуется наибольшими средними значениями уровня безработицы и ИПЦ.
Второй кластер характеризуется средним значением результативного признака и обладает наибольшими средними значениями соотношение с величиной прожиточного минимума среднего размера назначенных пенсий и наименьшим значением ИПЦ среди выделенных кластеров.
Третий кластер характеризуется высоким значением численности прибывших, в то же время показатели уровень занятости, среднемесячная номинальная начисленная заработная плата работников в целом по экономике, потребительские расходы в среднем на душу населения, инвестиции в основной капитал на душу населения, объем платных услуг на душу населения, оборот розничной торговли на душу населения, число предприятий и организаций являются максимальными среди выделенных кластеров, а значение показателя уровня безработицы является минимальным.
Рассчитанные коэффициенты вариации рассматриваемых признаков для каждого кластера по численности прибывших позволили образовать сравнительно однородные группы, в которых наблюдается не значительная вариация рассматриваемых признаков.
Для выявления и оценки факторов, влияющих на численность прибывших был проведен корреляционно-регрессионный анализ. Для этого первоначально выделенные кластеры субъектов Российской Федерации были проверены на однородность с помощью критерия Чоу.
Построенные уравнения регрессии для всей совокупности и для каждого кластера, а также рассчитанные суммы квадратов отклонений представлены в таблице 1.
Таблица 1
Результаты регрессии по показателям, характеризующих миграцию населению
по численности прибывших
Уравнения регрессии F набл F крит 2 Sj =Х (yj - y>i)
Общее уравнение регрессии 24,76 2,72 6541,80
Уравнение для 1 кластера 4,20 4,26 639,70
Уравнение для 2 кластера 6,12 2,51 1688,50
Уравнение для 3 кластера 6,15 4,84 327,06
Таким образом, получили, что общее уравнение регрессии по всем регионам Российской Федерации и уравнение регрессии для 2 и 3 кластера с вероятностью а = 0,05 статистически значимы, а уравнения
регрессии для 1 кластера статистически незначимо. Рассчитанное ^набл = 1,85, а ^рит = 2,72, следовательно Рпабл < Ркрит, значит гипотеза отклоняется и разбиение совокупности на подвыборки нецелесообразно.
Методом пошаговой регрессии, реализованной в ППП «STATISTГСA», были отобраны наиболее значимые переменные (таблица 2).
Таблица 2
Результаты регрессионного анализа
Оценка коэффициентов корреляции Стандартная ошибка t-статистика tKp р-значение
Обозначение Значение
Св. член -22,5394 15,709 -1,435 1,99 0,155
0,6911 0,270 2,563 0,000
х3 0,0005 0,000 5,091 0,000
х10 -0,00003 0,000 -3,735 0,012
"2 R = °,48; А=22,° %; F^ =24,76; (°;°5;3;81)=2;72
По данным таблицы 1.3 видно, что для итогового уравнения регрессии следует выбрать факторы X , Х3 и Хцо .
Итоговое уравнение регрессии имеет вид:
у = -22,53940 + 0,6911х1 + 0,0005х3 - 0,00003х10.
По значениям коэффициентов в уравнении регрессии можно сделать вывод, что при увеличении уровня занятости населения на 1 единицу число прибывших увеличиться на 0,6911 промилле; при увеличении среднемесячной номинальной начисленной заработной платы работников на 1 единицу число прибывших увеличится на 0,0005 промилле, при увеличении числа предприятий и организаций на 1 единицу число прибывших снизиться на 0,00003 промилле.
Оценки коэффициентов регрессии статистически значимы, так как наблюденные значения /-критерия, взятые по модулю, больше /кр,. Значения ^-критерия и средней ошибки аппроксимации свидетельствуют об адекватности построенной модели.
Графический анализ остатков показал, что отклонения лежат внутри полуполосы постоянной ширины, это говорит, о независимости дисперсионных остатков и об их постоянстве, то есть о наличии го-москедастичности.
Для проверки автокорреляции первого порядка рассчитаем критерий Дарбина-Уотсона БЖ =1,73; d1 = 1,57; d2 = 1,72. Критерий Дарбина-Уотсона больше следовательно мы не можем отвергнуть гипотезу Н0 - в ряду остатков отсутствует автокорреляция первого порядка.
Проверим остатки на нормальность. На рисунке 4 представлен график остатков.
Рис. 4. График остатков
Как видно на рисунке 4 эмпирические (ступенчатая фигура) и теоретические (сплошная линия) частоты распределения примерно совпадают, следовательно, регрессионные остатки близки к нормальному закону распределения.
Осуществим оптимистический, пессимистический и реалистичный прогноз результативного признака. Результаты расчётов представлены в таблице 3.
Таблица 3
Результаты прогнозов результативного признака
Вид прогноза Нижняя граница Точечный прогноз Верхняя граница
Оптимистический прогноз 51,32 69,21 87,09
Пессимистичный прогноз 4,25 22,13 40,01
Реалистичный прогноз 16,82 34,70 52,59
Таким образом, с вероятностью у=0,95 мы можем гарантировать, что при заданном векторе начальных условий число прибывших по оптимистическому прогнозу будет находиться в интервале от 51,32 до 87,09 промилле; по пессимистическому прогнозу будет находиться в интервале от 4,25 до 40,01 промилле; по реалистичному прогнозу будет находиться в интервале 16,82 до 52,59 промилле.
Библиографический список
1.Абылкаликов С.И. Типологический анализ регионов России по миграционным характеристикам / С.И. Абылкаликов // Региональная экономика : теория и практика. - 2015. - № 22. - С. 21-30.
2.http://www.gks.ra^
3.Карачурина Л. Миграционные процессы в первом квартале 2015 г. / Л. Карачурина // Экономическое развитие России. - 2015. - №7. - С. 77-81
ХОХЛОВА УЛЬЯНА АНАТОЛЬЕВНА - магистрант, Оренбургский государственный университет, Россия.