_сельскохозяйственные науки_
Potato yield prediction Ignatev V.
Прогнозирование урожайности картофеля Игнатьев В. М.
Игнатьев Виктор Михайлович /Ignatev Victor — кандидат технических наук, доцент, отдел прогнозирования развития мелиоративной отрасли, Российский научно-исследовательский институт проблем мелиорации, г. Новочеркасск
Аннотация: в статье предлагаются методы построения прогнозов урожайности картофеля в Ростовской области. Строится уравнение урожайности картофеля в виде ряда Фурье с помощью адаптивных методов и методами многомерного регрессионного анализа. Определяется значимость полученных уравнений и оценивается значимость остатков.
Abstract: the article offers methods of forecasting the yield of potatoes in the Rostov region. We construct the equation ofpotato yield in the form of a Fourier series, using adaptive methods and techniques of multivariate regression analysis. The significance of the equations and the estimated value of residues are determined.
Ключевые слова: однородность, теория временных рядов, адаптивные методы, регрессионный анализ, значимость, остатки.
Keywords: homogeneity, the theory of time series, adaptive methods, regression analysis, the significance, the remains.
Многолетний временной ряд урожайности картофеля для Ростовской области за 1989-2011 гг. построен на основании данных справочников [1]. Проверим данные на однородность с помощью критерия Колмогорова-Смирнова [2]. В табл. 1 приведены расчеты проверки. Исходный ряд приведен в 3-м столбце таблицы. В 4-м столбце из каждого элемента ряда вычли минимальное значение. 5-й столбец табл. 1 получен делением ряда из 4-го столбца на максимальный элемент этого же ряда. Значения ряда y.,i = 1..23 принадлежат интервалу ^J. В 6-м столбце табл. 1 строится первый
вспомогательный ряд с помощью следующей формулы: C1 = I--У I i = 1 23
i I 21 г /
Год № п/п Исходный ряд х X- ттх х'/ тах х У С1 С2 а6я(С1) аЬх(С2)
1989 1 58 20 0,2817 0,0000 0,0435 0,0000 0,0435 0,0000
1990 2 66 28 0,3944 0,0833 0,0036 0,0399 0,0036 0,0399
1991 3 56 18 0,2535 0,0833 0,0471 -0,0036 0,0471 0,0036
1992 4 77 39 0,5493 0,2222 -0,0483 0,0918 0,0483 0,0918
1993 5 84 46 0,6479 0,2778 -0,0604 0,1039 0,0604 0,1039
1994 6 73 35 0,4930 0,3333 -0,0725 0,1159 0,0725 0,1159
1995 7 58 20 0,2817 0,4444 -0,1401 0,1836 0,1401 0,1836
1996 8 38 0 0,0000 0,5000 -0,1522 0,1957 0,1522 0,1957
1997 9 64 26 0,3662 0,5000 -0,1087 0,1522 0,1087 0,1522
1998 10 49 11 0,1549 0,5278 -0,0930 0,1365 0,0930 0,1365
1999 11 44 6 0,0845 0,5556 -0,0773 0,1208 0,0773 0,1208
2000 12 57 19 0,2676 0,5833 -0,0616 0,1051 0,0616 0,1051
2001 13 85 47 0,6620 0,6667 -0,1014 0,1449 0,1014 0,1449
2002 14 64 26 0,3662 0,7222 -0,1135 0,1570 0,1135 0,1570
2003 15 70 32 0,4507 0,7778 -0,1256 0,1691 0,1256 0,1691
2004 16 82 44 0,6197 0,7778 -0,0821 0,1256 0,0821 0,1256
2005 17 96 58 0,8169 0,7778 -0,0386 0,0821 0,0386 0,0821
2006 18 94 56 0,7887 0,8056 -0,0229 0,0664 0,0229 0,0664
2007 19 79 41 0,5775 0,8056 0,0205 0,0229 0,0205 0,0229
2008 20 106 68 0,9577 0,8056 0,0640 -0,0205 0,0640 0,0205
2009 21 83 45 0,6338 0,8056 0,1075 -0,0640 0,1075 0,0640
2010 22 78 40 0,5634 0,8056 0,1510 -0,1075 0,1510 0,1075
2011 23 109 71 1,0000 1,0000 0,0000 0,0435 0,0000 0,0435
Исходный ряд приведен в 3-м столбце таблицы. В 4-м столбце из каждого элемента ряда вычли минимальное значение. 5-й столбец табл. 1 получен делением ряда из 4-го столбца на максимальный
У^,' = 1"23 [" !,+!] тз ^
элемент этого же ряда. Значения ряда ' принадлежат интервалу 1 ' -1. В 6-м столбце
табл. 1 строится первый вспомогательный ряд с помощью следующей формулы:
а, - - У. )' =1--23-
В 7-м столбце табл. 1 строится второй вспомогательный ряд с помощью следующей формулы:
с 2 =( У'- '~2Г )•' =1-23-
В столбцах С1 и С2 отыскиваются максимальные значения ряда
С1 = тах (С1,), С2 = тах (с2,),
'=1. .23
'=1. . 23
г
Критерий Колмогорова-Смирнова с - максимальное значение из двух числовых значений С1
или С2: С = max( С1, С2) = 0,19563.
Теоретический критерий отыскивается на 5 %-м уровне значимости с помощью функции вида
гу
— = 1.628 - = 0,480071. Так как значение С — —, то исходный временной ряд является
V 23
однородным. А однородность данных является необходимым условием из соответствия какому-либо закону распределения.
Исходный ряд урожайности картофеля в Ростовской области содержит положительный линейный тренд. В результате использования регрессионного анализа [3] было построено линейно-периодическое уравнение:
— • X I { — • X
0(х) = 1,257• х + 57,066 -2,433 • з1П| —х | +11,67• cos'
11
11
(1)
х
где - номер элемента временного ряда.
Коэффициент корреляции взаимосвязи значений уравнения (1) и значений фактической урожайности равен 0,75.
Расчет значимости модели временного ряда для аномалий температуры проведем с помощью дисперсионного анализа [4]. Проверку уравнения (1) на значимость проведем с помощью критерия Фишера для одномерной величины. Результаты проверки сведем в табл. 2.
Таблица 2. Результаты проверки уравнения (1) на значимость
Источник Сумма квадратов Число степеней свободы Исправленные дисперсии
Выборка 7731 22 -
Регрессия 4343 3 1448
Остаток 3388 19 178,321
В табл. 2 сумма квадратов (
.Б
Выб
) исходной выборки рассчитывается по следующей формуле:
Бвыб=Е (у - у
1=1
где У1 - I -й элемент данных урожайности;
у - среднее значение урожайности.
Сумма квадратов регрессии (см. табл. 2) рассчитывается по следующей формуле:
\2
Брегр =]22 - У)2 1=1
С
где 1 - 1 -й элемент уравнения (1).
Сумма квадратов остатков равна Б0 = БВыб — Б регр.
Число степеней свободы для выборки, регрессии и остатка приведены во втором числовом столбце табл. 2. Исправленные дисперсии приведены в третьем числовом столбце. Они являются результатом деления первого числового столбца на второй. Критерий Фишера рассчитывается по следующей
формуле: р = —^ = 8,119 —0 , , где — - исправленная дисперсия остатков;
о
D „ - исправленная дисперсия регрессии.
регр
Теоретический критерий Фишера отыскивается в среде табличного процессора Excel с помощью стандартной функции FРАСПОБР(0,05;3;19). Значение теоретического критерия (Ft ) равно 3,127. Значение 0,05 является уровнем значимости процесса. Значения 3 и 19 являются значениями степеней свободы регрессии и остатков. Если значение критерия Фишера F меньше теоретического критерия
Ft , то регрессионное уравнение значимо. В этом случае уравнение (1) может выступать в качестве числовой модели.
Работа с остатками позволит оценить погрешность расчетов по уравнению (1). Остатки - это разница между
значениями урожайности и значениями, рассчитанными с помощью уравнения. Проверка остатков уравнения (1) - это проверка погрешности на соответствие равномерному закону распределения. Проверку проведем с помощью критерия Уайта, который является наименее требовательным [5]. Метод Уайта требует построения параболической зависимости между квадратами остатков следующего вида:
в2 (x)=а2 • x2 + a •х+a в 2(x) ,,, x
где v ' - квадрат остатков уравнения (1) в зависимости от номера года
,a - искомые коэффициенты параболы.
Т?2
Далее находится детерминация (R ) взаимосвязи построенной параболы и квадрата фактических
остатков, которая позволяет вычислить статистику Уайта по формуле: W = n 'R , где n - количество лет временного ряда.
Теоретическое значение критерия Уайта подчиняется обратному распределению хи-квадрат при определенном уровне значимости (а ) [4]. Теоретическое значение найдем в среде пакета Excel с помощью специальной функции ХИ2ОБР(а ; 2). 2 - число степеней свободы параболы. ХИ2ОБР (0,05; 2) = 5,99. Если значение критерия Уайта меньше теоретического, то остатки гетероскедастичны, то есть погрешности значительные. Результаты проверки уравнения (1) сведем в табл. 3.
Таблица 3. Результаты проверки по критерию Уайта
Вид параболы R 2 Критерий Уайта
- 0,0241 • x2 + 0,578 • x - 2,4077 0,0067 0,1403
Критерий Уайта для остатков меньше теоретического критерия, равного 5,99. Поэтому по результатам проверки можно сделать вывод, что погрешности уравнения (1) значительны и поэтому уравнение (1) необходимо улучшать.
Используем для построения простейшего прогноза урожайности картофеля адаптивные методы [6]: Брауна, Хольта, Бокса-Дженкинса, Унитерса и Тейла-Вейджа. Для оценки построенных прогнозов использовался коэффициент корреляции, значения которого приведены в табл. 4.
Таблица 4. Коэффициент корреляции для адаптивных методов
Метод Брауна Хольта Бокса -Дженкинса Уитерса Тейла -Вейджа
Коэффициент корреляции 0,593 0, 568 0,59 0,634 0,588
Как видно из табл. 4, метод Уинтерса имеет значимый коэффициент корреляции, равный 0,634. Согласно этому методу прогноз урожайности картофеля на 2012 г. равен 85,71 ц/га. При сравнении методов уравнение (1) описывает урожайность картофеля более достоверно.
В монографии [7] урожайности сельскохозяйственных культур предлагается моделировать с помощью независимых параметров: аномалии температуры и аномалии осадков. Аномалии
температуры (А ) и аномалии осадков () можно представить следующими формулами:
Лг (х) = 0,071 • х — 0,134 — 0,246 • •^ ^ — 0,98 • С08|—х ^ (2) Ао (х) = 0,652 — 0,743 • 8т|—х ^ — 0,93 • С08|—х ^ (3)
С помощью регрессионного анализа построили зависимость урожайности картофеля от значений аномалий температуры и осадков. Получили параболо-мультипликативное уравнения:
О(Лг, Ло) = —36,96 • Лг2 + 92,145 • Лг —14,38 • Ло2 + 45,71 • Ло — 37,326 • Лг • Ло + 38,71 (4)
Коэффициент корреляции полученного уравнения равен 0,723 и значим. Результаты проверки уравнения сведем в табл. 5. Критерий Фишера для уравнения равен 6,933. Теоретический критерий Фишера
равен 3,127 при уровне значимости 0,05. Если значение критерия Фишера р больше теоретического
Рг
критерия Г1 , то регрессионное уравнение (4) значимо. В нашем случае уравнение (4) может выступать в качестве числовой модели. Остатки уравнения по критерию Уайта имеют 14 % погрешность.
Таблица 5. Результаты проверки уравнения (4) на значимость
Источник Сумма квадратов Число степеней свободы Исправленные дисперсии
Выборка 7731 22 -
Регрессия 4041 3 1347
Остаток 3691 19 194,26
Рассмотрим зависимость урожайности картофеля от факторов водно-пищевого режима [8]: плотность почвы (р ), т/м; наименьшая влагоемкость ( НВ), %;
уровень питания азотом (N ), кг/га действующего вещества (д. в.);
уровень питания фосфором (р ), кг/га д. в.;
уровень питания калием (К ), кг/га д. в.;
оросительная норма (М ), м3/га;
гидротермический коэффициент (О );
обеспеченность по дефициту водного баланса (р ), %.
Результирующий фактор - прибавка урожайности картофеля при орошении по сравнению с богарой (Ду ), ц/га. Зависимость урожайности картофеля имеет следующий вид:
Д7 =_01М_
196,75 —156,4 • М — 480,1 • О +107 • М • О — 9,45 • р +1,082 • М • р + 20 • С • р + 0,81 • М • С • р Зависимость прибавки урожайности для картофеля от исходных факторов представляется функцией от трех независимых факторов при коэффициенте корреляции равном 0,998. Зависимость является значимой на 5 %-м уровне. Остальные независимые факторы мало взаимосвязаны с
результирующим зависимым фактором .
Литература
1. Регионы России. Социально-экономические показатели. 2012: Статистический сборник / Росстат. М., 2012. 990 с.
2. КендаллМ., Стьюарт А. Теория распределений. М.: Наука, 1966. 574 с.
3. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 324 с.
4. Шеффе Г. Дисперсионный анализ. М.: Наука, 1980. 312 с.
5. ДрейперН. Р., Смит Г. Прикладной регрессионный анализ. М.: Диалектика. 2007. 932 с.
6. Валентинов А. В. Эконометрика. М.: Дашков и К°, 2009. 445 с.
7. Щедрин В. Н., Васильев С. М. Теория и практика альтернативных видов орошения черноземов юга Европейской территории России. Новочеркасск: Лик, 2011. 435 с.
8. Игнатьев В. М., Ильинская И. Н. Статистические модели прибавки урожайности сельскохозяйственных культур // Методы и алгоритмы прикладной математики в технике, медицине и экономике: сб. статей. Новочеркасск: Темп, 2002. Ч. 3. С. 11-12.