УДК: 314.15(=511.152)
ББК: 05
Сысоева Е.А., Ефремова Л.И.
МОДЕЛИРОВАНИЕ ЧИСЛЕННОСТИ МОРДОВСКОЙ ДИАСПОРЫ В ПРИВОЛЖСКОМ ФЕДЕРАЛЬНОМ ОКРУГЕ
Sysoevа Е.А., Efremova L.I.
THE NUMBER OF MORDOVIAN DIASPORA MODELING IN THE VOLGA FEDERAL
DISTRICT
Ключевые слова: мордовская диаспора, численность, корреляционно-регрессионный анализ, факторы, модель, корреляционная матрица, теснота связи, коэффициент корреляции, мультикол-линеарность, коэффициенты регрессии.
Keywords: Mordovian diaspora, population, correlation and regression analysis, factors, model, correlation matrix, closeness of the relationship, correlation coefficient, multicollinearity, regression coefficients.
Аннотация: в статье рассмотрено состояние численности мордовской диаспоры в Приволжском федеральном округе, что является основой для разработки и реализации социально-демографических мероприятий, направленных на увеличение численности мордовского народа. Проведено эконометрическое моделирование, позволяющее выявить наиболее значимые экономические факторы, влияющие на численность мордовской диаспоры в Приволжском федеральном округе -индекс потребительских цен, общий коэффициент естественного прироста и численность студентов государственных и муниципальных образовательных учреждений высшего профессионального образования. Осуществлена оценка качества модели на основе гипотез о значимости модели в целом и каждого ее параметра, доверительных интервалах и анализе остатков. Получено уравнение регрессии, позволяющее спрогнозировать численность мордовской диаспоры в Приволжском федеральном округе на ближайшее будущее.
Abstract: the article reviewed the status of the number of Diaspora Mordovia in the Volga Federal District, which is the basis for the development and implementation of socio-demographic measures aimed at increasing the number of Mordvin people. A econometric modeling, which allows to identify the most important economic factors that influence the number of Diaspora Mordovia in the Volga Federal District -the consumer price index, the overall rate of natural increase and the number of students in state and municipal educational institutions of higher professional education. Implemented model quality assessment based on the significance of the model hypotheses as a whole and each of its parameter, confidence intervals and analyzing residues. The regression equation that allows to predict the number of Diaspora Mordovia in the Volga Federal District in the near future.
Россия является одним из самых многонациональных государств мира, объединяющим более 140 народов, каждый из которых имеет свои национально-культурные особенности, специфику в хозяйственной деятельности и социально-профессиональной структуре.
Мордовская диаспора - одна из многочисленных национальностей России. В границах Республики Мордовия проживает лишь треть всего мордовского населения - 333112 человек. Компактными группами мордва расселена в Самарской (65447 человек), Пензенской (54703 человек), Оренбургской (38682 человек), Ульяновской (38977 человек), Нижегородской (19136 человек), Саратовской (10917 человек) областях, а также в Республиках Башкортостан (20300 человек), Татарстан (19156 человек) и Чувашии (18686 человек). Значительное количество мордвы проживает
также на Урале (42548 человек), в Сибири (65850 человек), на Дальнем Востоке и Сахалине (29265 человек). Кроме России, заметные группы мордвы живут в Казахстане (30036 человек) и Узбекистане (11914 человек). Наиболее компактно мордовская диаспора сосредоточена в Приволжском федеральном округе.
Проведение корреляционно-регрессионного анализа имеет своей целью выявление основных факторов, оказывающих влияние на численность мордовской диаспоры в Приволжском федеральном округе и сформировавших этот уровень в 2015 году. Основу исследования составили:
У - численность мордовской диаспоры в Приволжском федеральном округе, тыс. чел.;
Х1 - реальные денежные доходы населения, % к предыдущему году;
Х2 - реальный размер назначенных пенсий, % к предыдущему году;
Х3 - общая площадь жилого помещения, приходящаяся в среднем на одного жителя, м2;
Х4 - уровень безработицы, %;
Х5 - объем платных услуг на душу населения, тыс. руб.;
Х6 - индекс промышленного производства, % к предыдущему году;
Х7 - индекс производства продукции сельского хозяйства, % к предыдущему году;
Х8 - индекс физического объема инвестиций в основной капитал, % к предыдущему году;
Х9 - индекс потребительских цен, % к предыдущему году;
Х10 - общий коэффициент рождаемости,
%о;
Хц - общий коэффициент брачности, %о;
Х12 - общий коэффициент разводимости,
%о;
Х13 - общий коэффициент смертности, %о;
Х14 - общий коэффициент естественного прироста, %о;
Х15 - оборот розничной торговли на душу населения, руб.;
Х16 - численность детей на 100 мест в дошкольных образовательных учреждениях, чел.;
Х17 - численность студентов государственных и муниципальных образовательных учреждений среднего профессионального образования, тыс. чел.;
Х18 - численность студентов государственных и муниципальных образовательных учреждений высшего профессионального образования, тыс. чел.
Исходные данные для проведения корреляционно-регрессионного анализа численности мордовской диаспоры в Приволжском федеральном округе были получены из материалов официальной статистики за период с 2003 по 2013 годы (таблица 1) [11].
Изучение взаимосвязи между явлениями начинается с установления ее тесноты, что производится методами корреляционного анализа. Основой измерения связей является матрица парных коэффициентов корреляции, которая была получена с помощью пакета прикладных программ «81ай8йса» (таблица 2). По этой матрице можно судить о тесноте связи факторов с результативным признаком и между собой, что показывает коэффициент корреляции.
Из матрицы парных коэффициентов корреляции на основе шкалы Чеддока следует, что с вероятностью 95% между зависимой переменной и:
- фактором Х2 связь фактически отсутствует, что подтверждается значением коэффи-
циента корреляции (-0,04);
- факторами Х6, Х7 и Х8 имеется слабая взаимосвязь, о чем свидетельствуют низкие значения парного коэффициента корреляции (соответственно -0,12, -0,11 и 0,11), причем факторы Х6 и Х7 связаны с результативным признаком отрицательно, а Х8 - положительно;
- фактором Х4 имеется умеренная взаимосвязь, о чем свидетельствует значение парного коэффициента корреляции, равное 0,45;
- факторами Х1 и Х12 имеется заметная взаимосвязь, о чем свидетельствуют значения парного коэффициента корреляции (соответственно 0,56 и 0,55);
- факторами Х9, Х11, Х13, Х17 и Х18 имеется высокая взаимосвязь, о чем свидетельствуют значения парного коэффициента корреляции (соответственно -0,81, -0,87, 0,73, 0,77, и -0,70);
- факторами Х3, Х5, Х10, Х14, Х15 и Х16 имеется весьма высокая взаимосвязь, о чем свидетельствуют значения парного коэффициента корреляции (соответственно -0,99, -0,97, -0,93, 0,90, -0,96 и 0,97) [1, 7].
Важным этапом проведения корреляционно-регрессионного анализа является отбор факторных признаков для последующего включения в уравнение множественной регрессии. Сложность формирования модели множественной регрессии заключается в том, что факторные признаки зачастую находятся в зависимости друг от друга, то есть являются мультикол-линеарными. Включение в модель мультикол-линеарных факторов нежелательно в силу следующих последствий:
- затрудняется интерпретация параметров модели как характеристик в "чистом" виде, так как факторы коррелированны; параметры линейной регрессии теряют смысл;
- оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования [5, 6].
На практике выявление случаев мультикол-линеарности осуществляется на основании матрицы парных коэффициентов корреляции. Индикатором ее наличия является превышение значением коэффициента корреляции величины 0,8.
Анализ матрицы парных коэффициентов корреляции указывает на наличие мультикол-линеарности между факторами, поэтому требуется преобразовать матрицу путем исключения мультиколлинеарных факторов. Порядок исключения зависимых переменных из исследования, определяют по совокупному коэффициенту корреляции по следующей схеме:
Год Y Xi X2 Xi X, Xs Xs X? Xs Xs Xio Xn Xn Xn Xl4 Xjj Xie Xl7 Xis
2005 691.9 109.6 116.7 19.1 8.5 3770 103.5 110.0 113,7 118,2 9.0 6.5 4.9 15.5 -6.5 15987 82 188 328
2006 655.9 112.6 110.9 19.4 7,7 5125 100,7 100.0 99,2 115,2 9.7 6.7 5.9 16.3 -6.6 19874 84 197 382
2007 650.9 112,5 106.4 19.9 7.6 6782 107,7 102.4 102,3 1122 10.0 7,1 5.7 16.5 -6.5 24366 89 200 413
2008 627,0 108.6 102.1 20.3 7.8 8877 106.0 99.3 113.8 112,4 10,2 6.3 4.1 16.3 -6.1 30562 92 201 437
2009 604.0 115.1 113.8 20,7 7,3 11881 103.8 99.8 114,7 110,2 9.8 7Д 3,9 16.5 -6,7 38959 95 200 495
2010 598.9 116.8 102.8 21.0 6.5 14839 108.0 104.5 114.7 108.7 10.1 7.4 4.3 15.6 -5.5 49959 98 195 514
2011 583.0 113.1 114.4 21.5 6.1 18753 103.0 103.5 126.1 113.1 11.1 8.6 4.5 15.2 -4.1 64534 103 186 489
2012 567,2 107.8 109.2 21.9 6.3 23444 102.9 107,0 107,9 113.3 11.8 7,9 4.6 15,2 -3,4 84932 104 174 495
2013 559.3 101.6 125.7 22.3 8.6 26572 92.6 99.8 83.5 107.9 12.1 8.0 4.6 14.7 -2.6 88819 105 165 490
2014 546.9 105.9 112.1 22.7 7.6 29330 113.3 74.0 108.8 109.3 12.4 8.3 4.2 15.0 -2.6 100297 106 162 465
2015 527.9 99.9 104.7 23.2 6.6 33134 108.7 140.1 107.5 106,2 12.4 9.1 4.4 14.3 -1.9 116237 105 160 434
Y XI X2 X3 X4 X5 X6 X7 XS X9 XIO XI1 XI2 XI3 XI4 XI5 XI6 XI7 XI8
Y 1
XI 0.56 1.00
X2 -0.04 -0.25 1.00
X3 -0.99 -0.64 0.08 1.00
X4 0.45 -0,25 0.49 -0.39 1.00
X5 -0.97 -0.70 0.13 0.99 -0.34 1.00
X6 -0.12 0.13 -0,70 0.14 -0.36 0.11 1.00
X7 -0.11 -0.30 -0.25 0.13 -0.30 0.15 -0.08 1.00
XS 0.11 0.51 -0.43 -0.13 -0.58 -0.19 0.53 0.05 1.00
X9 0.81 0.41 0.11 -0,79 0,24 -0,74 -0.16 -0.15 0.26 1.00
X10 -0.93 -0.74 0.14 0.96 -0.28 0.97 0.06 0.05 -0.28 -0.67 1.00
XI1 -0.87 -0.51 0.13 0.89 -0.53 0.90 0.13 0,27 0.01 -0.63 0.85 1.00
XI2 0.55 0.14 0.05 -0.53 0.25 -0.47 -0,22 0.05 -0.40 0.48 -0.34 -0,29 1.00
XI3 0.73 0.74 -0.28 -0.80 0.19 -0.85 0.05 -0.33 0.16 0.46 -0.80 -0.82 0.30 1.00
XI4 -0.90 -0,78 0,21 0.94 -0.26 0.97 0,02 0.16 -0.24 -0.62 0.97 0.88 -0.34 -0.92 1.00
XI5 -0.96 -0,71 0.12 0.99 -0.35 1.00 0.12 0.17 -0.18 -0,72 0.97 0.90 -0.44 -0.86 0.98 1.00
XI6 -0.97 -0.48 0.11 0.96 -0.47 0.94 0.07 0.01 -0.05 -0.74 0.91 0.86 -0.58 -0.72 0.88 0.93 1.00
XI7 0,77 0.84 -0.33 -0.85 0.05 -0.91 -0.01 -0.14 0.33 0.49 -0.89 -0.79 0.25 0.93 -0.95 -0.91 -0,74 1.00
XI8 -0,70 0.08 -0.01 0.62 -0.54 0.54 -0.03 -0.18 0.08 -0.65 0.50 0.48 -0.60 -0,22 0.41 0.51 0,78 -0,20 1.00
- во-первых, необходимо рассчитать все совокупные коэффициенты корреляции по всем зависимым факторам;
- во-вторых, определить коэффициент детерминации по этим совокупным коэффициентам корреляции;
- в-третьих, сравнить значения коэффициентов детерминации с 90%, и если есть коэффициенты, превышающие этот процент, соответствующие факторы необходимо исключить в первую очередь из исследования [5, 6].
В результате преобразования как наиболее мультиколлинеарные были исключены следующие факторы: Х1, Х2, Х3, Х4, Х5, Х6, Х7, Х8, Х10, Х11, Х12, Х13, Х15, Х16 и Х17. В силу этого в процедуру регрессионного анализа следует включить три оставшихся фактора: индекс потребительских цен, общий коэффициент есте-
ственного прироста и численность студентов государственных и муниципальных образовательных учреждений высшего профессионального образования. Метод последовательного исключения, реализуемый в пакете прикладных программ «81ай8йса», позволил построить уравнение регрессии на наиболее значимых из них.
Для описания влияния выделенных показателей на вариацию численности мордовской диаспоры за исследуемый период строится регрессионная модель. Параметры уравнения регрессии находятся методом наименьших квадратов, сущность которого заключается в отыскании таких параметров ап, для которых сумма квадратов отклонений расчетных значений результативного признака от эмпирических будет минимальной (таблица 3).
Коэффициент корреляции Я = 0,9809 Коэффициент детерминации RA2 = 0,9621
Значение критерия Б(3,7) = 59,234 р<0,00002
ББТЛ - коэффициенты Параметры уравнения Значение Стьюдента ^17) р - уровень значимости
Константа 261,474 1,297 0,236
Х9 -0,230 -3,363 -2,050 0,040
Х14 0,634 17,162 6,765 0,000
Х18 0,294 0,261 3,035 0,019
Таблица 3 - Результаты корреляционно-регрессионного анализа
В пакете прикладных программ «81ай8йса» для численности мордовской диаспоры по Приволжскому федеральному округу было получено уравнение регрессии, которое имеет следующий вид:
У = 261,474 - 3,363Х9 + 17,162Х14 + 0, 261Х18. (1,297) (-2,050) (6,765) (3,035) Я = 0,9809; ЯА2 = 0,9621; Б = 59,234.
Проверка значимости уравнения регрессии осуществляется с помощью Б-критерия Фишера. С вероятностью 95% полученное уравнение регрессии можно считать надежным, так как расчетное значение критерия Фишера больше табличного значения: F(3,7) = 59,234 при уровне значимости р<0,00002.
Для проверки значимости коэффициентов уравнения рассчитывается статистика Стьюден-та. Коэффициент регрессии признается значимым, если расчетное значение ^критерия больше табличного. Все факторные признаки, коэффициенты регрессии при которых оказались незначимыми, из регрессионной модели должны быть исключены. С этой целью возвращаются к первому шагу регрессионного анализа, где уравнение регрессии строится только на тех независимых переменных, коэффициенты при которых были признаны значимыми. Далее вновь
проверяются значимости уравнения регрессии и коэффициентов уравнения. Это делается до тех пор, пока в уравнении регрессии не останутся только факторы со значимыми коэффициентами.
Для нашего случая с вероятностью 0,95 полученные регрессионные коэффициенты многофакторной модели следует признать значимыми, так как вероятность принятия обратной гипотезы для них не превышает величину 0,05.
После установления надежности уравнения регрессии и всех его коэффициентов проводится расчет некоторых дополнительных характеристик точности и полноты полученных моделей. Для этих целей в пакете прикладных программ «81ай8йса» рассчитываются среднеквад-ратическое отклонение и коэффициент детерминации.
Для построенной модели значение сред-неквадратического отклонения составляет 11,8, следовательно, по данному критерию модель является достаточно точной. Недостатком данного показателя является то, что он не очень нагляден для оценки точности модели. Более универсальным в этом отношении является показатель относительной ошибки аппроксимации.
В нашем случае относительная ошибка в приближении для модели составляет 10,1%. Это относительно низкая величина, находящаяся в пределах нормы для данного показателя, которая составляет 10%-12%.
Значение коэффициента детерминации (96,21%) указывает на то, что полученная модель достаточно полно охватывает вариацию результативного признака. Уровень остаточной вариации, которая объясняется воздействием случайных и неучтенных в этой модели факторов, составляет 3,79%.
Знаки коэффициентов регрессии свидетельствуют о характере влияния независимого показателя на результативный признак. По знаку при коэффициенте в полученном уравнении можно сделать вывод о том, что численность мордовской диаспоры в Приволжском федеральном округе (У) будет снижаться при увеличении индекса потребительских цен (Х9), и возрастать при увеличении общего коэффициента естественного прироста (Х14), при увеличении численности студентов государственных и муниципальных образовательных учреждений высшего профессионального образования (Х18). Такая взаимосвязь логична и социально-экономически оправдана, так как изменение
численности мордовской диаспоры зависит от демографической ситуации и от социально-экономического состояния региона.
Согласно полученным данным, при повышении индекса потребительских цен на 1%, численность населения мордовской диаспоры снизится на 3,363 тыс. чел.; при увеличении общего коэффициента естественного прироста на 1%о, численность мордовской диаспоры возрастет на 17,162 тыс. чел, при увеличении численности студентов государственных и муниципальных образовательных учреждений высшего профессионального образования на 1 тыс. чел., численность мордовской диаспоры в Приволжском федеральном округе возрастет на 0,261 тыс. чел.
Таким образом, проведенные исследования позволяют констатировать, что проблема роста численности мордовской диаспоры в Приволжском федеральном округе является частью более глобальной проблемы роста численности населения страны, и ее решение невозможно без реализации долгосрочных мероприятий по стимулированию увеличения численности населения, проводимых как в масштабах страны в целом, так и в отдельно взятых образованиях.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Ефремова, Л.И. Информационные системы в экономике: финансовые расчеты и статистический анализ в EXCEL: учебное пособие 2-е изд. доп. / Л.И. Ефремова. - Саранск, 2015. 229 с.
2. Ефремова, Л.И. Использование информационных технологий в организации персонифицированного учета в Республике Мордовия / Л И. Ефремова // Современный научный вестник. - 2016. Т. 3. - № 1. - С. 103 - 106.
3. Ефремова, Л.И. Модернизация автоматизированной информационной системы управления пенсионным фондом РФ в г.о. Саранск Республики Мордовия / Л.И. Ефремова // Информационные системы и технологии. - 2016. - № 3 (95). - С. 47 - 52.
4. Ефремова, Л.И. Совершенствование информационной системы пенсионного фонда РФ на региональном уровне / Л.И. Ефремова // Контентус. - 2016. - № 3 (44). - С. 72 - 75.
5. Ефремова, Л.И. Стратегическое управление светотехническим предприятием: автореф.дис. ... канд. эконом. наук / Л.И. Ефремова; Мордовский государственный университет им. Н.П. Огарева.
- Саранск, 2007. - 20 с.
6. Ефремова, Л И. Стратегическое управление светотехническим предприятием: дис.. канд. эконом. наук / Л.И. Ефремова. - Саранск, 2007. - 253 с.
7. Зинина, Л.И. Информационные системы в экономике (лабораторный практикум): учебное пособие 3-е издание, перераб и доп. / Л.И. Зинина, Л.И. Ефремова. - Саранск, 2009.- 224 с.
8. Зинина, Л.И. Стратегический мониторинг в информационном механизме управления предприятием / Л.И. Зинина, Л.И. Ефремова // Проблемы современной экономики. - Новосибирск. - 2011.
- № 3-2. - С. 93-97.
9. Зинина, Л.И. Стратегическое управление предприятием: структурно-функциональная модель / Л.И. Зинина, Л.И. Ефремова // Проблемы теории и практики управления. - 2011. - № 9. -С. 77-83.
10. Комарова, Т.А. Сравнительный анализ интегральных индикаторов экологической безопасности регионов Приволжского федерального округа / Т.А. Комарова, Е.А. Сысоева: материалы Межрегиональной научно-практической конференции, посвященной 150-летию образования в России Центрального статистического комитета: Статистическая информация в современном обществе: опыт, проблемы, перспективы формирования, использования и распространения. - Саранск, 2013. -
С. 10 - 14.
11. Официальная статистика. Население. URL: http://www.gks.ru/wps/wcm/connect/rosstat_main/ rosstat/ru/statistics/population/ (дата обращения: 27.09.2015).
12. Сажин, Ю.В. Анализ реализации приоритетных направлений функционирования экономики и выполнения федеральных программ развития Республики Мордовия: монография / Ю.В. Сажин, И.В. Парамонова, В.А. Басова и др. - Саранск: Изд-во Мордов. ун-та, 2011. - 152 с.
13. Сажин, Ю.В. Реализация социальной политики: региональный аспект: монография / Ю.В. Сажин, Л.И. Зинина, Н.В. Аникина, Т.В. Глухова, М.В. Бикеева, Л.И. Ефремова, Т.А. Ефремова, И.А. Иванова, Л.А. Карякина, А.В. Катынь, А.Ф. Кузнецов, К.Н. Николаев, Н.Г. Подзоров, Н.Н. По-дольная, Е.А. Сысоева, Л.Е. Тезина - Саранск: ЮрЭксПрактик, 2015. - 252 с.
14. Сажин, Ю.В. Социально-экономическое развитие региона на базе инновационных подходов в условиях модернизации: монография / Ю.В. Сажин, С.М. Вдовин, Н.Н. Подольная и др. - Саранск: Изд-во Мордов. ун-та, 2013. - 136 с.
15. Сысоева, Е.А. Сущность социального риска и его базовые компоненты в условиях развития современного общества / Е.А. Сысоева, Т.П. Вачаева: материалы V Всероссийской научно-практической интернет-конференции: Значение, проблемы и перспективы развития государственной статистики в современном российском обществе. - Саратов: ТО ФСГС по Саратовской области, 2012. - С. 141 - 142.