ЭКОНОМИЧЕСКИЕ НАУКИ
МНОГОФАКТОРНЫЙ КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ ПРОИЗВОДСТВА ЗЕРНОВЫХ КУЛЬТУР ПО СУБЪЕКТАМ РОССИЙСКОЙ ФЕДЕРАЦИИ Филиппова В.М.
Филиппова Виктория Маратовна - магистрант, направление: экономика и организация природопользования, кафедра экономики и управления развитием территорий, Финансово-экономический институт Северо-Восточный федеральный университет им. М.К. Аммосова, г. Якутск
Аннотация: в статье проводится анализ множественной корреляции и регрессии между валовым сбором зерна и основными факторами, которые влияют на валовый сбор зерна, по субъектам Российской Федерации за 2016 год. Целью данного анализа является построение модели с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их влияние на исследуемый результативный признак.
Ключевые слова: множественная корреляция и регрессия, зерновое производство, зерно, сельскохозяйственные культуры, многофакторный анализ, корреляция, регрессия, множественная корреляция, множественная регрессия.
Цель многофакторного корреляционно-регрессионного анализа состоит в построении модели с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их влияние на исследуемый результативный признак; и в построении прогноза на основе данной модели.
Цель работы определяет постановку следующих задач:
- обосновать включение факторов в модель множественной регрессии;
- построить уравнение множественной регрессии;
- рассчитать частные коэффициенты корреляции, частные коэффициенты эластичности, индекс множественной корреляции и регрессии;
- оценить статистическую надежность построенной модели;
- рассчитать прогноз по уравнению множественной регрессии.
На валовой сбор продукции любого вида растениеводства оказывают влияние такие факторы, как размеры посевных площадей, урожайность сельскохозяйственных культур, количество внесенных удобрений, состояние основных фондов, то есть наличие соответствующей техники, оборудования, хранилищ и т. д., а также количество и качество занятых в производство, то есть трудовые ресурсы. Кроме того, немаловажную роль играют климатические условия, территориальные особенности местности. Например, в Республике Саха (Якутия) (РС(Я)) климат резко континентальный, летнее время года короткое, в некоторых регионах засушливые земли, что, в свою очередь, приводит к затруднению ведения хозяйства.
Проведем анализ множественной корреляции и регрессии по субъектам Российской Федерации (РФ) за 2016 год. Результативным признаком выступает валовой сбор зерна, тыс. т (у), а в качестве факторных признаков были выбраны следующие факторы:
- внесение минеральных удобрений на 1 га посева сельскохозяйственных культур, кг (хх);
- внесение органических удобрений на 1 га посева сельскохозяйственных культур, т (х2);
- посевные площади зерновых культур, тыс. га (х3 );
- инвестиции в основной капитал сельского хозяйства, охоты и лесного хозяйства, млн. руб. (х4);
- обеспеченность сельскохозяйственных организаций тракторами, приходится на тыс. га пашни, штук (х5);
- обеспеченность сельскохозяйственных организаций зерноуборочными комбайнами, приходится на тыс. га посевов зерновых культур, штук (х6);
- энергообеспеченность сельскохозяйственных организаций, л. с. (х7);
- среднегодовая численность занятых в сельском хозяйстве, охоте, лесном хозяйстве, тыс. чел, (х8).
Исходные данные приведены в приложении 1 [1, 2, 3].
Проведем регрессионный анализ с помощью инструмента MS Excel «Регрессия». Регрессионная статистика приведена в табл. 1.
Таблица 1. Регрессионная статистика
Регрессионная статистика
Множественный R 0,923764922
R-квадрат 0,853341631
Нормированный R-квадрат 0,830778804
Стандартная ошибка 1025,089588
Наблюдения 61
Множественный R составил 0,924. Это означает, что между валовым сбором зерна и всеми выбранными факторами связь сильная.
R-квадрат составил 0,853. То есть на изменение валового сбора зерна влияет изменение всех учтенных факторов в совокупности на 85,3 %.
Проверим выбранные факторы на мультиколлинеарность (наличие линейной зависимости между факторами).
Для этого проведем корреляционный анализ с помощью инструмента MS Excel «Корреляция». Результаты данного анализа приведены в табл. 2.
Таблица 2. Корреляционный анализ
Корреляция
у х1 х2 х3 х4 х5 х6 х7 х8
у 1
х1 0,4296 1
х2 -0,1885 0,1102 1
х3 0,8107 0,0701 -0,3335 1
х4 0,6007 0,6379 0,1119 0,3493 1
х5 -0,1518 0,0284 0,4565 -0,3015 -0,0451 1
х6 -0,2841 -0,0598 0,0846 -0,3764 -0,2042 0,3597 1
х7 -0,2872 -0,09995 0,4109 -0,4156 -0,2158 0,81199 0,4581 1
х8 0,7505 0,1365 -0,1432 0,6869 0,4475 -0,1229 -0,1927 -0,1591 1
Исходя из результатов корреляционного анализа, между факторами х3 и х8, х5 и х7, возможно, существует мультиколлинеарность, так как их значения больше или равны 0,7.
Проверим наличие мультиколлинеарности факторов следующими способами.
Проверка мультиколлинеарности факторов на основе определителя матрицы парных коэффициентов корреляции
Построим матрицу парных коэффициентов корреляции в табл. 3.
Таблица 3. Матрица парных коэффициентов корреляции
х1 х2 х3 х4 х5 х6 х7 х8
х1 1 0,1102 0,0701 0,6379 0,0284 -0,0598 -0,09995 0,1365
х2 0,1102 1 -0,3335 0,1119 0,4565 0,0846 0,4109 -0,1432
х3 0,0701 -0,3335 1 0,3493 -0,3015 -0,3764 -0,4156 0,6869
х4 0,6379 0,1119 0,3493 1 -0,0451 -0,2042 -0,2158 0,4475
х5 0,0284 0,4565 -0,3015 -0,0451 1 0,3597 0,81199 -0,1229
х6 -0,0598 0,0846 -0,3764 -0,2042 0,3597 1 0,4581 -0,1927
х7 -0,09995 0,4109 -0,4156 -0,2158 0,81199 0,4581 1 -0,1591
х8 0,1365 -0,1432 0,6869 0,4475 -0,1229 -0,1927 -0,1591 1
Далее с помощью функции MS Excel «МОПРЕД» найдем определитель матрицы.
Det(R) составил 0,0291. Так как определитель близок к нулю, то предполагаем наличие мультиколлинеарности между факторами.
Проверка мультиколлинеарности факторов на основе критерия Пирсона.
Выдвигается нулевая гипотеза Н0 о том, что мультиколлинеарность факторов отсутствует, то есть Det(R) = 1.
Находим хфакт по формуле 1:
хфакт = [n-l-i-(2-m + 5)-lg D е t | R | ] (1)
*факт = [61 - 1 - \ ■ (2 " 8 + 5) " lg0,029l] = 65,38.
Так как хфакт < хфабл, то Н0 принимается, и с вероятностью 0,95 признается отсутствие мультиколлинеарности факторов.
Для того, чтобы определить, какие факторы нужно убрать из модели, проведем оценку статистической значимости параметров.
Оценка статистической значимости параметров в уравнении регрессии
Выдвигается нулевая гипотеза Н0 о том, что параметры а0, at - статистически не значимы. Для проверки гипотезы используем t-критерий Стьюдента. Найденное фактическое значение сравним с табличным значением , определяемым по
таблице Стьюдента (уровень значимости а=0,05). Результаты проверки приведены в табл. 4.
Таблица 4. Оценка статистической значимости параметров в уравнении регрессии
Гфакгао -4,085995908
£факга1 4,10498741
£факгаг -0,463056832 Проведя оценку статистической значимости коэффициентов уравнения регрессии, принимаем решение убрать
£факгаз 6,810484227
£факга4 1,205581209
0,533131252 из модели факторы х2, х4, х5 , х6, х7, т.к. их ^статистика меньше табличного значения.
Гфакгаб 0,010335558
Гфакга7 0,185056889
£факгав 3,38287895
^табл 2,006646805
Проведя оценку статистической значимости коэффициентов уравнения регрессии, принимаем решение убрать из модели следующие факторы, т.к. их ^статистика меньше табличного значения: х2, х4, х5, х6, х7.
В модель оставляем следующие факторы:
- внесение минеральных удобрений на 1 га посева сельскохозяйственных культур, кг (хх);
- посевные площади зерновых культур, тыс. га (х3);
- среднегодовая численность занятых в сельском хозяйстве, охоте, лесном хозяйстве, тыс. чел, (х8).
В итоге, модель имеет следующий вид:
у = -1534,59 + 24,46хх + 1,71х3 + 13,43х8
Коэффициент «чистой» регрессии ах при факторе хх показывает, что при увеличении внесения минеральных удобрений на 1 га посева сельскохозяйственных культур на 1 кг валовой сбор зерна в среднем увеличится на 24,46 тыс. т при фиксированном положении посевных площадей зерновых культур и среднегодовой численности занятых в сельском хозяйстве.
Коэффициент «чистой» регрессии а3 при факторе х3 показывает, что при увеличении посевных площадей зерновых культур на 1 тыс. га валовой сбор зерна в среднем увеличится на 1,71 тыс. т при фиксированном положении внесения минеральных удобрений и среднегодовой численности занятых в сельском хозяйстве.
Коэффициент «чистой» регрессии а8 при факторе х8 показывает, что при увеличении среднегодовой численности занятых в сельском хозяйстве на 1 тыс. человек валовой сбор зерна в среднем увеличится на 13,43 тыс. т при фиксированном положении внесения минеральных удобрений и посевных площадей зерновых культур.
Проведем анализ регрессионной статистики, который представлен в табл. 5.
Таблица 5. Регрессионная статистика
Регрессионная статистика
Множественный R 0,919980241
Я-квадрат 0,846363644
Нормированный R-квадрат 0,83827752
Стандартная ошибка 1002,119791
Наблюдения 61
Множественный Я составил 0,91. Это означает, что связь между валовым сбором зерна и такими факторами, как внесение минеральных удобрений, посевные площади зерновых культур и среднегодовая численность занятых в сельском хозяйстве в совокупности, сильная.
Я-квадрат составил 0,846. То есть, изменение валового сбора зерна обусловлено изменением внесения минеральных удобрений, посевных площадей зерновых культур и среднегодовой численности занятых в сельском хозяйстве в совокупности на 84,6%.
Далее рассчитаем частные коэффициенты эластичности.
_ х, 42,03
Э1 = а1-— = 24,46 ■ ЛГ1ППГ1Л = 0,602 1 1 у 1708,71
Эх означает, что при увеличении внесения минеральных удобрений на 1 га посева
сельскохозяйственных культур на 1% валовой сбор зерна в среднем увеличится на
0,602% при фиксированном положении других факторов модели.
_ х3 695,82
Э3 = а3 ■ — = 1,71 ■ ЛГ1ППГ1Л = 0,696 у 1708,71
Э з означает, что при увеличении посевных площадей зерновых культур на 1% валовой сбор зерна в среднем увеличится на 0,696% при фиксированном положении других факторов модели.
_ Хо 76,16
Э8 = а8 ■ — = 13,43 ■ ЛГ1ППГ1Л = 0,599 8 8 у 1708,71
означает, что при увеличении среднегодовой численности занятых в сельском хозяйстве на 1% валовой сбор зерна в среднем увеличится на 0,599% при фиксированном положении других факторов модели.
Рассчитаем прогнозное значение валового сбора зерна, если прогнозное значение факторных признаков увеличивается на 10% от их среднего уровня.
у = -1534,59 + 24,46хх + 1,71х3 + 13,43х8
Для начала найдем прогнозные значения факторов при увеличении на 10% от их среднего уровня:
хПр ! = 1,1 ■ хГ = 1,1 ■ 42,03 = 46,233 (кг) хПр з = 1,1 ■ х^ = 1,1 ■ 695,82 = 765,402 (тыс. га) хпр 8 = 1,1 ■ х^ = 1,1 ■ 76,16 = 83,776 (тыс. чел)
Т.е. найдем величину валового сбора зерна, если:
- внесение минеральных удобрений составит 46,233 кг;
- посевные площади зерновых культур составят 765,402 тыс. га;
- среднегодовая численность занятых в сельском хозяйстве составит 83,776 тыс. чел.
уЪр = -1534,6 + 24,5 ■ 46,2 + 1,7 ■ 765,4 + 13,43 ■ 83,8 = 2030,22 (тыс. т)
Если внесение минеральных удобрений составит 46,233 кг, посевные площади зерновых культур - 765,402 тыс. га, а среднегодовая численность занятых в сельском хозяйстве - 83,776 тыс. чел., то валовой сбор зерна будет 2030,22 тыс. т.
Анализ множественной корреляции и регрессии доказал, что валовой сбор зерна во многом зависит от внесения минеральных удобрений, размеров посевных площадей и среднегодовой численности работников. Рекомендуется увеличивать размеры посевных площадей, также повысить внесение удобрений под посевы сельскохозяйственных культур. Также необходимо привлекать больше молодых специалистов в зерновое производство, стимулировать сельскохозяйственный труд.
При соблюдении данных рекомендаций урожайность зерновых культур в Якутии в значительной мере увеличится, что будет обеспечивать хозяйства, предприятия сырьем для дальнейшей переработки и комбикормом для животных. Также откроются новые рабочие места, что, в свою очередь, будет способствовать росту занятости населения, увеличению численности населения в сельских местностях и т. д.
ПРИЛОЖЕНИЕ 1
Субъекты РФ у х1 х2 х3 х4 х5 х6 х7 х8
1 Белгородская область 3505,6 101,3 7,2 740,3 15948,8 3,7 2,7 224,143 104,2
2 Брянская область 1439,1 119,5 0,9 382,8 27308 3,9 2,9 186,102 52,5
3 Владимирская область 203,3 26,8 3,2 93,8 1750 6,8 3,5 313,871 36,9
4 Воронежская область 4817,3 75,8 3,1 1436,4 32230,2 3,6 2,3 179,223 147,3
5 Ивановская область 126,3 14,5 1,8 66 398,7 3 3,9 266,086 17,7
6 Калужская область 155,9 36,2 2,1 81,2 9230,6 5,2 3,7 239,703 24,8
7 Костромская область 54,4 6,3 1,8 39,2 410,7 3,7 5,5 339,607 24,3
8 Курская область 4379,8 138,6 0,5 1053,6 18469,5 2,9 2,1 174,997 63,5
9 Липецкая область 2877,2 121,4 2,3 819,1 14646,4 2,7 1,8 168,749 66,1
10 Московская область 357,5 44,3 2,7 144,8 9769,7 4,6 2,8 362,501 96,9
11 Орловская область 3131 99,7 1,3 942,3 5684,5 3,2 1,9 173 37,1
12 Рязанская область 1554,8 66,5 1,2 575,6 4458,9 3,3 2,4 206,58 29,7
13 Смоленская область 232,6 31 1,8 116,5 1304,6 2 3,4 214,574 27,4
14 Тамбовская область 3250,4 95,4 0,3 1034,3 12483,9 3,2 2,6 209,597 116,3
15 Тверская область 100 15,7 1,1 75,8 11011 2,3 5,3 223,909 51,7
16 Тульская область 1554,8 100,9 0,5 570,5 5773,2 2 1,8 198,265 43,6
17 Ярославская область 85 19,2 3,4 48,6 2786,5 7,4 5 331,257 50,7
18 г. Москва 6,2 40,6 3,9 3,3 1787,9 16,7 8,5 1017,061 15,6
19 Архангельская область 4,6 26,8 4,4 3,2 3899,4 6,1 7,3 567,386 30,4
20 Архангельская область без АО 4,6 26,8 4,4 3,2 3757,1 5,3 7,3 507,132 29,1
21 Вологодская область 222,5 38,4 3,7 116,4 4023,7 6 3,5 352,925 49,2
22 Калининградская область 399,9 106,9 3,6 135,5 3374,7 7 2,4 218,557 24,9
23 Ленинградская область 117,4 42,6 9,1 46,7 7050,9 8,8 4 645,022 84,9
24 Новгородская область 51,5 29,1 2,3 21,1 1058,8 2,4 3,4 204,532 26,6
25 Псковская область 116,8 32,9 3,1 45,4 2477,2 3,2 3,6 223,006 33,2
26 Республика Крым 1286,5 24,7 0,8 500,7 1399,1 4,4 2,4 608,499 115,6
27 Краснодарский край 13979 127,1 1,5 2477,4 26890,5 6,1 2,8 277,259 268,1
28 Ростовская область 11595,8 74,8 0,4 3281,5 11746,5 3,3 2,7 197,122 249,6
29 Республика Дагестан 375,9 13,1 0,3 137,7 603,6 4,4 6 422,817 252,9
30 Кабардино-Балкарская Респ. 1150,3 90,4 0,6 208,3 1332,6 3,6 2,1 283,055 74,6
31 Республика Башкортостан 3324 22,6 1,6 1810,7 10203,7 2,8 2,1 169,673 197,7
32 Республика Марий Эл 214,1 17,8 2 135,6 2313 3,6 2,4 294,953 30,3
33 Республика Мордовия 1192,4 58,5 1,5 442 4530,3 3 2,6 204,732 78,6
34 Республика Татарстан 4105,2 43,9 1,8 1587,4 17694,4 6 2,2 169,308 171,2
35 Удмуртская Республика 542,4 14,5 1,9 363,5 3863,3 5,8 3 211,297 65,9
36 Чувашская Республика 609,2 29,7 2,4 287,5 2292 4,6 2,8 253,673 65,9
37 Пермский край 246,7 13,8 2,1 247,3 2762,2 5,6 3,1 212,922 67,4
38 Кировская область 526,5 27 1,9 313,3 4440 7,7 3 250,212 56,2
39 Нижегородская область 1127,5 31,3 2,5 583 6060,8 3 2,7 246,813 69,1
40 Оренбургская область 3133,9 1,8 0,1 2707,3 2268,3 1,3 1,6 117,288 130
41 Пензенская область 1943,9 65 0,6 713,3 7364,4 1,7 1,4 134,883 68,5
42 Самарская область 2119,4 16,1 0,3 1129,9 3851,6 3,2 2,4 150,55 95,6
43 Саратовская область 4258,6 8,5 0,2 2107,3 4364,6 2 2,2 140,602 110
44 Ульяновская область 1187,1 26,6 0,3 557,1 590,1 1,7 1,9 131,47 48,6
45 Курганская область 1813,2 17,4 0,1 1128,8 787,2 3,9 1,9 148,702 35,5
46 Свердловская область 597 24,7 2,7 338,7 4907,1 4,5 2,6 265,756 88,3
47 Тюменская область 1286,4 37,7 0,6 694,9 8643,4 3,2 2,2 257,321 66,3
Субъекты РФ у х1 х2 х3 х4 х5 х6 х7 х8
48 Тюменская область без АО 1286,4 37,7 0,6 694,9 7565,6 3,6 2,2 251,748 49,3
49 Челябинская область 1947,7 6 0,7 1353,3 4146,4 2,1 1,5 154,324 97,1
50 Республика Бурятия 33,3 9,3 0,8 75,5 215,7 1,3 2,4 241,656 33
51 Алтайский край 4829,7 11,7 0,3 3646,2 4976,1 2,2 1,9 143,651 140,6
52 Красноярский край 2353,5 32,4 0,8 1054 5755,1 2,4 2,7 227,735 106,4
53 Иркутская область 771,9 23 0,7 406,9 4406,3 1,7 2,5 272,986 87,5
54 Кемеровская область 938 16,8 0,4 603,9 1451,4 2,2 2 172,367 43,2
55 Новосибирская область 2341,1 8,1 0,8 1553,9 4436,6 2,6 2,2 166,978 90
56 Омская область 3267,7 4,5 1 2171 4403,4 2,7 1,6 140,403 117,1
57 Томская область 303,5 15,5 1,1 190,4 2436,2 2,7 2,4 273,298 27,6
58 Республика Саха (Якутия) 12,1 27,5 0,4 11,1 402,6 12 8,1 820,952 34
59 Приморский край 296,6 77,8 1,1 106,9 2836 3,3 18,2 292,65 74,4
60 Хабаровский край 11,9 28,5 0,3 9,2 2307,9 6,3 13,3 357,129 25,8
61 Амурская область 474,7 21,1 0,1 219 2966,7 1,2 8 140,751 29,4
Список литературы
1. Регионы России. Социально-экономические показатели, 2017: Стат. сб. / Росстат. М., 2017. 1402 с.
2. Труд и занятость в России, 2017: Стат. сб. / Росстат. М., 2017. 261 с.
3. Бюллетени о состоянии сельского хозяйства. [Электронный ресурс], 2016. Режим доступа:
http://www.gks.ru/wps/wcm/connect/rosstat_main/rosstat/ru/statistics/publications/catalo g/doc_1265196018516/ (дата обращения: 1.04.2019).