НОВАЯ ИНДУСТРИАЛИЗАЦИЯ: ТЕОРЕТИКО-ЭКОНОМИЧЕСКИЙ АСПЕКТ
59
МЕТОДЫ РЕГРЕССИОННОГО АНАЛИЗА В ИССЛЕДОВАНИЯХ ПРОИЗВОДСТВА ОСНОВНЫХ ВИДОВ ПРОДУКЦИИ СЕЛЬСКОХОЗЯЙСТВЕННЫХ КУЛЬТУР В РОССИЙСКОЙ ФЕДЕРАЦИИ
Куленцан Антон Львович
кандидат физико-математических наук, доцент,
ФГБОУ ВО «Ивановский государственный химико-технологический университет», кафедра «информационных технологий и цифровой экономики», г. Иваново, Российская Федерация. E-mail: [email protected]
Марчук Наталья Александровна
старший преподаватель,
ФГБОУ ВО «Ивановский государственный химико-технологический университет», кафедра «информационных технологий и цифровой экономики», г. Иваново, Российская Федерация. E-mail: [email protected]
Аннотация: Актуальность тематики данного исследования обусловлена тем, что производство основных видов продукции сельскохозяйственных культур в Российской Федерации является одной из важнейших отраслей экономики нашей страны. Авторами выполнены исследования по применению различных методических подходов для описания динамики изменения производства основных видов продукции сельскохозяйственных культур за период времени 1990-2018 гг. Полученные результаты показали обоснованность использования многопараметрических регрессионных моделей. Авторами представлены результаты исследования зависимости изменения урожайности различных сельскохозяйственных культур от ряда параметров. Результаты свидетельствуют о том, что эти зависимости носят линейный характер.
Ключевые слова: сельскохозяйственные культуры, регрессионный анализ, МНК, коэффициент корреляции, коэффициент детерминации, линейные и нелинейные модели.
JEL: C15, J43
METHODS OF REGRESSION ANALYSIS IN RESEARCH OF PRODUCTION OF MAIN TYPES OF AGRICULTURAL CROPS IN THE RUSSIAN FEDERATION
Kulentsan Anton Lvovich,
Candidate of Physical and Mathematical Sciences,
Associate Professor Ivanovo State University of Chemical Technology, Department of Information Technology and Digital Economics
Ivanovo, Russian Federation
Marchuk Natalia Alexandrovna, Senior Lecturer,
Ivanovo State University of Chemical Technology, Department of Information Technology and Digital Economics Ivanovo, Russian Federation
Abstract: The relevance of this research is due to the fact that the production of main types of agricultural products in
the Russian Federation is one of the most important sectors of the economy of our country. The authors carried out research on the application of various methodological approaches to describe the dynamics of changes in the production of main types of agricultural crops over the period 1990-2018. The results obtained showed the validity of using multiparametric regression models. The authors present the results of a study of the dependence of changes in the yield of various crops on a number of parameters. The results show that these dependencies are linear.
Keywords: agricultural crops, regression analysis, MNC, correlation coefficient, determination coefficient, linear and nonlinear models
Для поддержания стабильного социально-экономического, политического состояния в Российской Федерации, необходимо чтобы продовольственное снабжение было бы всегда надежное, а отрасли, которые отвечают за это, развивались. Однако, начиная с 1990 г., произведенные реформы в нашей стране привели к тому, что техническое оснащение отраслей, занимающихся сельским хозяйством, заметно уменьшилось. Полученные результаты различных работ, показали, что уменьшились объемы внесения органических и минеральных удобрений, средств защиты растений [1]. Это привело к тому, что в нашей стране возросла степень отставания агропромышленного комплекса от ведущих мировых производителей. Чтобы избежать дальнейшего ухудшения, необходимы экстренные меры. Многие страны, которые сталкивались с такими проблемами, пошли по пути создания долгосрочных целевых прогнозов, которые в дальнейшем использовали как некоторые ориентиры для организации взаимосогласованной деятельности органов власти, бизнеса и науки [1].
Проведенный нами анализ динамики изменения производства основных видов продукции сельскохозяйственных культур за период времени 1990-2018 гг. позволяет сделать вывод о существовании функциональной зависимости изменения производства различных видов продукции сельскохозяйственных культур от момента времени. При описании ретроспективы производства овса и проса с помощью линейного уравнения функциональная зависимость имеет монотонно возрастающий характер. Графическая интерпретация динамики изменения производства данных культур в зависимости от времени за рассматриваемый период, полученная по линейному регрессионному уравнению, представлена на рис. 1. Самым распространенным методом оценки параметров уравнения линейной многопараметрической регрессии является метод наименьших квадратов (МНК) [7-10]. Суть данного метода заключается в минимизации суммы квадратов отклонений искомой аналитической функции у. от экспериментальной зависимости у.. Из этого
следует, что стандартная ошибка £. должна быть минимальна [10], т.е.
1 п п
- 9i )2=)2 ^min (1)
¿=1 ¿=1
В соответствии с МНК были получены значения коэффициентов регрессионного уравнения зависимости производства овса и проса от времени. Однопараметрическое линейное уравнение регрессии для описания изменения производства основных видов продукции сельскохозяйственных культур за период времени 1990-2018 гг., может быть представлено в следующем виде [10]:
# = 0,1764 • xt — 337,9 + £t для производства овса yt = 0,1804 • Xi — 350,88 + для производства проса
где у. - производство овса в .-й год, определенное с помощью линейного однопараметрического регрессионного уравнения; x. - порядковый номер года; £. - отклонение ретроспективных значений производства овса и проса от значений производства овса и проса, полученных по уравнению регрессии.
Для проверки общего качества уравнения регрессии нами использовалась оценка коэффициента детерминации R2. Значение данного коэффициента состоит в доле общего разброса значений
зависимой переменной, объясненной уравнением регрессии [5, 6]. Кроме того, при проведении корреляционного анализа выборки данных должны выполняться следующие условия:
- чтобы использовать данный анализ, необходимо чтобы проводилось большое количество наблюдений, которые в 5-6 раз превышают количество параметров;
- необходимо, чтобы совокупность значений всех факторных и результативных признаков подчинялась многомерному нормальному распределению;
- рассматриваемые показатели представлены в виде временных рядов, измерения выполнены через равный промежуток времени [10].
= (3) Ш - У О1
Проверка значимости генерального коэффициента корреляции основывается на расчете с использованием распределения Стьюдента (4):
Я --
¿набл = , , " Л/П - 2 (4)
л/1 -Я2 v ;
которая при истинности гипотезы Н : имеет ^распределение с п-2 степенями свободы. Данная гипотеза отвергается, и генеральный коэффициент корреляции считается значимым, если |1набл|>1:кр, где 1:кр=81:(а;п-2) определяется при уровне значимости а и числе степеней свободы п-2 [2-4].
Для данных линейных регрессионных уравнений производства овса и проса коэффициент детерминации составит 0,4848 и 0,3848, соответственно, результаты представлены на рис. 1.
70,0 60,0 50,0
8 40,0
ч
¡^Г 30,0 20,0 10,0 ОД)
1985 1990 1995 2000 2005 2010 2015 2020
год
Рисунок 1 - Модели динамического развития производства основных видов продукции сельскохозяйственных культур в Российской Федерации: овес (И2 = 0,4848), кукуруза на зерно (И2 =
0,7446), просо (Я2 = 0,3848)
Аналогичная ситуация будет иметь место в случае описания изменения производства остальных видов продукции сельскохозяйственных культур с помощью полинома второго порядка, результаты показаны на рис. 1-3.
Полиномиальное уравнение второго порядка, описывающее изменение изменения производства основных видов продукции сельскохозяйственных культур на рассматриваемом отрезке времени, будет иметь следующий вид:
ОбОЗх2- 24
V = 0,1 1,ОЧХ -г 7446
• « >
• • • • >1 •
4 ' V = 0,1764х - 337,9 К1 =0,4848 ► • • ^ * •
.....
... ............ * • • Г® • * * *у = 0,1804х- 350,88 Я2 = 0,3848
r y¿ = 0,0605 ■ x¿2 — 241,64 ■ x¿ + 241131 + £¿ для производства кукурузы на зерно
Ух = 0,0281 ■ x¿2 — 112,28 ■ x¿ + 112098 + £¿ для производства пшеницы Ух = 0,0125 ■ x¿2 — 49,604 ■ x¿ + 49465 + £¿ для производства ячменя i y¿ = 0,012 ■ x¿2 — 48,029 ■ x¿ + 48024 + £¿ для производства ржи
y¿ = 0,0234 ■ x¿2 — 92,728 ■ x¿ + 91701 + £¿ для производства риса y¿ = —0,0035 ■ x¿2 + 14,003 ■ x¿ — 14170 + £¿ для производства зернобобовых культур y¿ = 0,0052 ■ x¿2 — 20,635 ■ x¿ + 20496 + £¿ для производства гречихи
где у. - производство овса в i-й год, определенное с помощью линейного однопараметрического регрессионного уравнения; х - порядковый номер года; £. - отклонение ретроспективных значений производства овса и проса от значений производства овса и проса, полученных по уравнению регрессии. Коэффициент детерминации, описывающий качество уравнения, в данном случае составляет 0,7446, 0,7509, 0,5495, 0,191, 0,8891, 0,2426, 0,7243, соответственно.
35,0
30 О у = 0,028lx2 - 112,28х + 112098
№ = 0,7509
25,0 1......
v = 4942
* чЦффхtfd&Z»........" ••
15'° * * • * »• * у = 0,0 12j? -48,029x^48024
• №=0,191
10,0 • 5 J0 OJO
1985 1990 1995 2000 2005 2010 2015 2020
год
Рисунок 2 - Модели динамического развития производства основных видов продукции сельскохозяйственных культур в Российской Федерации: пшеница (R2 = 0,7509), рожь (R2 = 0,191),
ячмень (R2 = 0,5495)
Следующим этапом в исследовании тождественного описания изменения производства основных видов продукции сельскохозяйственных культур за рассматриваемый период является построение прогноза. Как видно из рис. 1-3, рассматриваемые регрессионные модели достаточно хорошо описывают изменение производства основных видов продукции сельскохозяйственных культур на ретроспективном отрезке времени. Коэффициенты детерминации полученных моделей имеют высокие значения, что определяет высокую сходимость наблюдаемых данных и значений, полученных с помощью линейной и полиномиальной моделей. Нами было принято, что прогнозируемый период не должен превышать 1/5 ретроспективного отрезка времени. В соответствии с данным обстоятельством прогноз изменения производства основных видов продукции сельскохозяйственных культур выполнен до 2023 г. Проведенные исследования показали, что в соответствии с прогнозами экономического развития при использовании линейной регрессионной модели происходит увеличение производства овса и проса к 2023 г. и составляет 20,0% по сравнению
у = 0,028lx2 - 112,28х + 112098 R2 = 0,7509
v =. (k 9Í2&*- + 4Í
......«—[-'"iVi.......■»" ..
ш ^ • • ■■>, .0. ф..........
* I # >' = 0,012¿- 48,029х + 4802-
• R' = 0,191
с уровнем 2010 г. При использовании полиномиальной модели для прогнозирования производства кукурузы на зерно, пшеницы, ячменя, ржи, риса, зернобобовых культур и гречихи полученные данные свидетельствуют о том, что произойдет увеличение производства этих культур к 2023 г. Это увеличение составит - 40,0% для производства кукурузы, 37,8% для производства пшеницы, 23,8% для производства ячменя, 16,7% для производства ржи, 29,2% для производства риса, 9,4% для производства зернобобовых культур и 11,1% для производства гречихи по сравнению с уровнем 2010
70,0 60,0 50,0
§ 40,0
S
а-
30,0 20,0 10,0 О J0
1985 1990 1995 2000 2005 2010 2015 2020
год
Рисунок 3 - Модели динамического развития производства основных видов продукции сельскохозяйственных культур в Российской Федерации: гречиха (R2 = 0,7243), рис (R2 = 0,8891),
зернобобовые культуры (R2 = 0,2426)
Далее мы в своей работе определили факторы, которые предположительно могут оказывать влияние на урожайность сельскохозяйственных культур в Российской Федерации. Полученные в таблице 1 данные отражают тесноту связи между урожайностью различных сельскохозяйственных культур РФ и различными факторами: посевная площадь, внесено минеральных и органических удобрений, а также количеством различной уборочной техники.
Таблица 1 - Значения коэффициентов корреляции для различных сельскохозяйственных культур РФ
сельскохозяйственные культуры (У) х2 х4 х5
пшеница 0,68 0,47 -0,04 0,67 0,64
рожь -0,09 0,45 0,13 0,28 0,26
ячмень 0,53 0,40 -0,08 0,64 0,61
овес 0,58 0,23 -0,21 0,65 0,63
кукуруза 0,85 0,39 -0,07 0,69 0,66
просо 0,46 0,44 -0,17 0,59 0,57
гречиха 0,48 0,30 -0,23 0,78 0,75
рис -0,03 0,28 -0,29 0,88 0,86
зернобобовые культуры -0,23 0,08 -0,24 0,49 0,49
где У - урожайность различных сельскохозяйственных культур, ц/га; Х: - посевная площадь различных сельскохозяйственных культур, тыс. гектар; Х2 - внесение минеральных удобрений, кг; Х3 -
У = С ,0234x¡ -92,728х + 91701
Л - 0 8X91 4.V'
i
« ...» •
•-••и« г • •• У = -0.0035Х3 + 14, ООЗх R* = 0,2426 -14170 •
Т...«.**. _1_i • • ...... А А . А. А Ж
'•» 4 V = 0,00Кх- - 20,635х + 20496 R' = 0 7241
внесение органических удобрений, т; Х4 - количество тракторов, шт.; Х5 - количество зерноуборочных комбайнов, шт.
Из данной таблицы видно, что, например, для данных по урожайности пшеницы, ячменя, проса наблюдается средняя оценка корреляции только между У - Хх, Х2, Х4, Х5. Во всех остальных случаях наблюдается слабая корреляция между фактором и откликом (У - Х3). Для данных по урожайности риса и зернобобовых культур наблюдается слабая корреляция между фактором и откликом (У - Хр Х2, Х3), в остальных же случаях - средняя оценка корреляции для зернобобовых культур и сильная оценка корреляции для риса (У - Х4, Х5). Полученный результат по всем сельскохозяйственным культурам свидетельствует о том, что все качественно выделенные факторы достаточно влияют на результативный параметр, за исключением Х3.
На основе полученных данных за последние 30 лет были построены регрессионные модели, выявляющие связь между посевной площадью (Хх), внесением минеральных и органических удобрений (Х2, Х3), количеством тракторов и зерноуборочных комбайнов (Х4, Х5) и урожайностью различных сельскохозяйственных культур. На основании оценки тесноты связи между исследуемыми параметрами и рассчитанными значениями уровня значимости и критерия Стьюдента (р= 0,05; гтаб=0,045) можно утверждать, что некоторые коэффициенты оказались незначимыми. Вследствие этого данные факторы нами были исключены из списка зависимых переменных, результаты представлены в табл. 2.
Таблица 2 - Модели регрессионной зависимости для сельскохозяйственных культур
сельскохозяйственные культуры (У) Вид регрессионной модели г Я2 р-1еуе1
пшеница 0,23 8,2-10-4
У=1,95+0,15Х2+0,16Х5 0,97 0,81 3,4-10-3
0,81 4,2-10-3
рожь У=16,58+0,14Х2 2,15 0,82 0,63 4,4-10-3 4,2-10-3
ячмень 1,05 3,0-10-4
У=7,56+0,35Х2+0,07Х4+0,26Х5 1,98 1,29 1,42 0,69 5,9-10-4 2,0-10-3 1,6-10-3
овес 1,56 1,6-10-3
У=12,79+0,13Х2+0,03Х4+0,14Х5 1,18 0,89 1,03 0,73 2,5-10-3 3,8-10-3 3,1-10-3
кукуруза 2,18 2,45 3,0-10-5 2,0-10-2
У=57,83+0,78Х2+21,36Х3+0,33Х4+0,99Х5 2,38 0,83 2,5-10-2
2,69 2,43 1,3-10-2 2,3-10-2
просо У=18,47+0,30Х5 1,77 1,96 0,53 8,1-10-5 6,1-10-3
гречиха 1,98 4,8-10-5
У=10,18+0,02Х4+0,06Х5 0,76 0,78 4,5-10-3
0,62 5,3-10-3
сельскохозяйственные культуры (Y) Вид регрессионной модели t R2 p-level
рис 1,56 1,0-10-6
Y=42,99+0,02X+0,17ХЦ ' ' 4 ' 5 0,20 0,94 8,3-10-4
0,68 5,1-10-3
зернобобовые культуры Y=14,96+0,03X4+0,09X5 2,00 0,47 0,51 0,63 6.2-10-3 6.3-10-3 6,1-10-3
Таким образом, в данной работе нами произведен анализ и построен прогноз динамики изменения производства основных видов продукции сельскохозяйственных культур. Полученные данные свидетельствуют о том, что почти для всех сельскохозяйственных культур полученные модели динамического развития производства основных видов продукции носят полиномиальный характер. Полученные в данной работе данные говорят также о том, что наблюдается линейная связь между рассматриваемыми факторами и урожайностью сельскохозяйственных культур в Российской Федерации. Эти результаты могут быть использованы, для разработки комплекса мер государственного поддержки сельского хозяйства.
СПИСОК ЛИТЕРАТУРЫ
1. Салманова И.Р. Разработка целевых прогнозов технологического развития производства основных видов продукции растениеводства в Российской Федерации / И.Р. Салманова // Вестник Ульяновской Государственной Сельскохозяйственной Академии. - 2013. - № 3 (23). - С. 144-147.
2. Goncharenko Ya. Economical and mathematical methods and models in the system of training students of economic majors. - 2011. - № 35. - P. 53-57.
3. Долгов Д.И. Роль методов математической статистики обработки экспериментальных данных в определении уровня конкурентоспособности и конкурентоустойчивости продукции / Д.И. Долгов // Актуальные проблемы гуманитарных и естественных наук. - 2013. - № 2. - С. 85-91.
4. Куленцан А.Л. Анализ объемов производства продукции растениеводства в различных хозяйствах / А.Л. Куленцан, Н.А. Марчук // Вестник Марийского государственного университета. Серия «Сельскохозяйственные науки. Экономические науки». - 2020. - Т. 6. - № 1. - С. 92-100. DOI: 10.30914/2411-9687-2020-6-1-92-100.
5. Макарова И.Л. Коэффициент детерминации для нелинейной регрессии / И.Л. Макарова, А.М. Игнатенко // Европейское научное объединение. - 2018. - № 3-3 (37). - С. 161-163.
6. Красильников Д.Е. Алгоритм вычисления коэффициента выборочной детерминации в MS-Excel / Д.Е. Красильников // Труды НГТУ Им. Р.Е. Алексеева. - 2016. - № 3 (114). - С. 20-30.
7. Юхно Л.Ф. О задаче исключения в методе наименьших квадратов для системы линейных алгебраических уравнений / Л.Ф. Юхно // Журнал вычислительной математики и математической физики. - 2019. - Т. 59. - № 10. - С. 1641-1647.
8. Базилевский М.П. Синтез модели множественной линейной регрессии и регрессии Деминга / М.П. Базилевский // Информационные технологии в моделировании и управлении: подходы, методы, решения. - 2019. - С. 67-72.
9. Жигало Д.С. Прогнозирование в бизнесе сезонных данных с использованием модели множественной регрессии / Д.С. Жигало // БГУ - 2019. - С. 104-107.
10. Стенников В.А. Методы регрессионного анализа в исследованиях теплопотребления в России / В.А. Стенников, Т.В. Добровольская // Вестник Российского Экономического Университета им. Г. В. Плеханова - 2018. - № 2 (98). - С. 142-153.