Научная статья на тему 'Прогнозирование урожайности картофеля'

Прогнозирование урожайности картофеля Текст научной статьи по специальности «Физика»

CC BY
190
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОДНОРОДНОСТЬ / HOMOGENEITY / ТЕОРИЯ ВРЕМЕННЫХ РЯДОВ / THE THEORY OF TIME SERIES / АДАПТИВНЫЕ МЕТОДЫ / ADAPTIVE METHODS / РЕГРЕССИОННЫЙ АНАЛИЗ / REGRESSION ANALYSIS / ЗНАЧИМОСТЬ / SIGNIFICANCE / ОСТАТКИ / REMAINS

Аннотация научной статьи по физике, автор научной работы — Игнатьев Виктор Михайлович

В статье предлагаются методы построения прогнозов урожайности картофеля в Ростовской области. Строится уравнение урожайности картофеля в виде ряда Фурье с помощью адаптивных методов и методами многомерного регрессионного анализа. Определяется значимость полученных уравнений и оценивается значимость остатков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Прогнозирование урожайности картофеля»

_сельскохозяйственные науки_

Potato yield prediction Ignatev V.

Прогнозирование урожайности картофеля Игнатьев В. М.

Игнатьев Виктор Михайлович /Ignatev Victor — кандидат технических наук, доцент, отдел прогнозирования развития мелиоративной отрасли, Российский научно-исследовательский институт проблем мелиорации, г. Новочеркасск

Аннотация: в статье предлагаются методы построения прогнозов урожайности картофеля в Ростовской области. Строится уравнение урожайности картофеля в виде ряда Фурье с помощью адаптивных методов и методами многомерного регрессионного анализа. Определяется значимость полученных уравнений и оценивается значимость остатков.

Abstract: the article offers methods of forecasting the yield of potatoes in the Rostov region. We construct the equation ofpotato yield in the form of a Fourier series, using adaptive methods and techniques of multivariate regression analysis. The significance of the equations and the estimated value of residues are determined.

Ключевые слова: однородность, теория временных рядов, адаптивные методы, регрессионный анализ, значимость, остатки.

Keywords: homogeneity, the theory of time series, adaptive methods, regression analysis, the significance, the remains.

Многолетний временной ряд урожайности картофеля для Ростовской области за 1989-2011 гг. построен на основании данных справочников [1]. Проверим данные на однородность с помощью критерия Колмогорова-Смирнова [2]. В табл. 1 приведены расчеты проверки. Исходный ряд приведен в 3-м столбце таблицы. В 4-м столбце из каждого элемента ряда вычли минимальное значение. 5-й столбец табл. 1 получен делением ряда из 4-го столбца на максимальный элемент этого же ряда. Значения ряда y.,i = 1..23 принадлежат интервалу ^J. В 6-м столбце табл. 1 строится первый

вспомогательный ряд с помощью следующей формулы: C1 = I--У I i = 1 23

i I 21 г /

Год № п/п Исходный ряд х X- ттх х'/ тах х У С1 С2 а6я(С1) аЬх(С2)

1989 1 58 20 0,2817 0,0000 0,0435 0,0000 0,0435 0,0000

1990 2 66 28 0,3944 0,0833 0,0036 0,0399 0,0036 0,0399

1991 3 56 18 0,2535 0,0833 0,0471 -0,0036 0,0471 0,0036

1992 4 77 39 0,5493 0,2222 -0,0483 0,0918 0,0483 0,0918

1993 5 84 46 0,6479 0,2778 -0,0604 0,1039 0,0604 0,1039

1994 6 73 35 0,4930 0,3333 -0,0725 0,1159 0,0725 0,1159

1995 7 58 20 0,2817 0,4444 -0,1401 0,1836 0,1401 0,1836

1996 8 38 0 0,0000 0,5000 -0,1522 0,1957 0,1522 0,1957

1997 9 64 26 0,3662 0,5000 -0,1087 0,1522 0,1087 0,1522

1998 10 49 11 0,1549 0,5278 -0,0930 0,1365 0,0930 0,1365

1999 11 44 6 0,0845 0,5556 -0,0773 0,1208 0,0773 0,1208

2000 12 57 19 0,2676 0,5833 -0,0616 0,1051 0,0616 0,1051

2001 13 85 47 0,6620 0,6667 -0,1014 0,1449 0,1014 0,1449

2002 14 64 26 0,3662 0,7222 -0,1135 0,1570 0,1135 0,1570

2003 15 70 32 0,4507 0,7778 -0,1256 0,1691 0,1256 0,1691

2004 16 82 44 0,6197 0,7778 -0,0821 0,1256 0,0821 0,1256

2005 17 96 58 0,8169 0,7778 -0,0386 0,0821 0,0386 0,0821

2006 18 94 56 0,7887 0,8056 -0,0229 0,0664 0,0229 0,0664

2007 19 79 41 0,5775 0,8056 0,0205 0,0229 0,0205 0,0229

2008 20 106 68 0,9577 0,8056 0,0640 -0,0205 0,0640 0,0205

2009 21 83 45 0,6338 0,8056 0,1075 -0,0640 0,1075 0,0640

2010 22 78 40 0,5634 0,8056 0,1510 -0,1075 0,1510 0,1075

2011 23 109 71 1,0000 1,0000 0,0000 0,0435 0,0000 0,0435

Исходный ряд приведен в 3-м столбце таблицы. В 4-м столбце из каждого элемента ряда вычли минимальное значение. 5-й столбец табл. 1 получен делением ряда из 4-го столбца на максимальный

У^,' = 1"23 [" !,+!] тз ^

элемент этого же ряда. Значения ряда ' принадлежат интервалу 1 ' -1. В 6-м столбце

табл. 1 строится первый вспомогательный ряд с помощью следующей формулы:

а, - - У. )' =1--23-

В 7-м столбце табл. 1 строится второй вспомогательный ряд с помощью следующей формулы:

с 2 =( У'- '~2Г )•' =1-23-

В столбцах С1 и С2 отыскиваются максимальные значения ряда

С1 = тах (С1,), С2 = тах (с2,),

'=1. .23

'=1. . 23

г

Критерий Колмогорова-Смирнова с - максимальное значение из двух числовых значений С1

или С2: С = max( С1, С2) = 0,19563.

Теоретический критерий отыскивается на 5 %-м уровне значимости с помощью функции вида

гу

— = 1.628 - = 0,480071. Так как значение С — —, то исходный временной ряд является

V 23

однородным. А однородность данных является необходимым условием из соответствия какому-либо закону распределения.

Исходный ряд урожайности картофеля в Ростовской области содержит положительный линейный тренд. В результате использования регрессионного анализа [3] было построено линейно-периодическое уравнение:

— • X I { — • X

0(х) = 1,257• х + 57,066 -2,433 • з1П| —х | +11,67• cos'

11

11

(1)

х

где - номер элемента временного ряда.

Коэффициент корреляции взаимосвязи значений уравнения (1) и значений фактической урожайности равен 0,75.

Расчет значимости модели временного ряда для аномалий температуры проведем с помощью дисперсионного анализа [4]. Проверку уравнения (1) на значимость проведем с помощью критерия Фишера для одномерной величины. Результаты проверки сведем в табл. 2.

Таблица 2. Результаты проверки уравнения (1) на значимость

Источник Сумма квадратов Число степеней свободы Исправленные дисперсии

Выборка 7731 22 -

Регрессия 4343 3 1448

Остаток 3388 19 178,321

В табл. 2 сумма квадратов (

Выб

) исходной выборки рассчитывается по следующей формуле:

Бвыб=Е (у - у

1=1

где У1 - I -й элемент данных урожайности;

у - среднее значение урожайности.

Сумма квадратов регрессии (см. табл. 2) рассчитывается по следующей формуле:

\2

Брегр =]22 - У)2 1=1

С

где 1 - 1 -й элемент уравнения (1).

Сумма квадратов остатков равна Б0 = БВыб — Б регр.

Число степеней свободы для выборки, регрессии и остатка приведены во втором числовом столбце табл. 2. Исправленные дисперсии приведены в третьем числовом столбце. Они являются результатом деления первого числового столбца на второй. Критерий Фишера рассчитывается по следующей

формуле: р = —^ = 8,119 —0 , , где — - исправленная дисперсия остатков;

о

D „ - исправленная дисперсия регрессии.

регр

Теоретический критерий Фишера отыскивается в среде табличного процессора Excel с помощью стандартной функции FРАСПОБР(0,05;3;19). Значение теоретического критерия (Ft ) равно 3,127. Значение 0,05 является уровнем значимости процесса. Значения 3 и 19 являются значениями степеней свободы регрессии и остатков. Если значение критерия Фишера F меньше теоретического критерия

Ft , то регрессионное уравнение значимо. В этом случае уравнение (1) может выступать в качестве числовой модели.

Работа с остатками позволит оценить погрешность расчетов по уравнению (1). Остатки - это разница между

значениями урожайности и значениями, рассчитанными с помощью уравнения. Проверка остатков уравнения (1) - это проверка погрешности на соответствие равномерному закону распределения. Проверку проведем с помощью критерия Уайта, который является наименее требовательным [5]. Метод Уайта требует построения параболической зависимости между квадратами остатков следующего вида:

в2 (x)=а2 • x2 + a •х+a в 2(x) ,,, x

где v ' - квадрат остатков уравнения (1) в зависимости от номера года

,a - искомые коэффициенты параболы.

Т?2

Далее находится детерминация (R ) взаимосвязи построенной параболы и квадрата фактических

остатков, которая позволяет вычислить статистику Уайта по формуле: W = n 'R , где n - количество лет временного ряда.

Теоретическое значение критерия Уайта подчиняется обратному распределению хи-квадрат при определенном уровне значимости (а ) [4]. Теоретическое значение найдем в среде пакета Excel с помощью специальной функции ХИ2ОБР(а ; 2). 2 - число степеней свободы параболы. ХИ2ОБР (0,05; 2) = 5,99. Если значение критерия Уайта меньше теоретического, то остатки гетероскедастичны, то есть погрешности значительные. Результаты проверки уравнения (1) сведем в табл. 3.

Таблица 3. Результаты проверки по критерию Уайта

Вид параболы R 2 Критерий Уайта

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- 0,0241 • x2 + 0,578 • x - 2,4077 0,0067 0,1403

Критерий Уайта для остатков меньше теоретического критерия, равного 5,99. Поэтому по результатам проверки можно сделать вывод, что погрешности уравнения (1) значительны и поэтому уравнение (1) необходимо улучшать.

Используем для построения простейшего прогноза урожайности картофеля адаптивные методы [6]: Брауна, Хольта, Бокса-Дженкинса, Унитерса и Тейла-Вейджа. Для оценки построенных прогнозов использовался коэффициент корреляции, значения которого приведены в табл. 4.

Таблица 4. Коэффициент корреляции для адаптивных методов

Метод Брауна Хольта Бокса -Дженкинса Уитерса Тейла -Вейджа

Коэффициент корреляции 0,593 0, 568 0,59 0,634 0,588

Как видно из табл. 4, метод Уинтерса имеет значимый коэффициент корреляции, равный 0,634. Согласно этому методу прогноз урожайности картофеля на 2012 г. равен 85,71 ц/га. При сравнении методов уравнение (1) описывает урожайность картофеля более достоверно.

В монографии [7] урожайности сельскохозяйственных культур предлагается моделировать с помощью независимых параметров: аномалии температуры и аномалии осадков. Аномалии

температуры (А ) и аномалии осадков () можно представить следующими формулами:

Лг (х) = 0,071 • х — 0,134 — 0,246 • •^ ^ — 0,98 • С08|—х ^ (2) Ао (х) = 0,652 — 0,743 • 8т|—х ^ — 0,93 • С08|—х ^ (3)

С помощью регрессионного анализа построили зависимость урожайности картофеля от значений аномалий температуры и осадков. Получили параболо-мультипликативное уравнения:

О(Лг, Ло) = —36,96 • Лг2 + 92,145 • Лг —14,38 • Ло2 + 45,71 • Ло — 37,326 • Лг • Ло + 38,71 (4)

Коэффициент корреляции полученного уравнения равен 0,723 и значим. Результаты проверки уравнения сведем в табл. 5. Критерий Фишера для уравнения равен 6,933. Теоретический критерий Фишера

равен 3,127 при уровне значимости 0,05. Если значение критерия Фишера р больше теоретического

Рг

критерия Г1 , то регрессионное уравнение (4) значимо. В нашем случае уравнение (4) может выступать в качестве числовой модели. Остатки уравнения по критерию Уайта имеют 14 % погрешность.

Таблица 5. Результаты проверки уравнения (4) на значимость

Источник Сумма квадратов Число степеней свободы Исправленные дисперсии

Выборка 7731 22 -

Регрессия 4041 3 1347

Остаток 3691 19 194,26

Рассмотрим зависимость урожайности картофеля от факторов водно-пищевого режима [8]: плотность почвы (р ), т/м; наименьшая влагоемкость ( НВ), %;

уровень питания азотом (N ), кг/га действующего вещества (д. в.);

уровень питания фосфором (р ), кг/га д. в.;

уровень питания калием (К ), кг/га д. в.;

оросительная норма (М ), м3/га;

гидротермический коэффициент (О );

обеспеченность по дефициту водного баланса (р ), %.

Результирующий фактор - прибавка урожайности картофеля при орошении по сравнению с богарой (Ду ), ц/га. Зависимость урожайности картофеля имеет следующий вид:

Д7 =_01М_

196,75 —156,4 • М — 480,1 • О +107 • М • О — 9,45 • р +1,082 • М • р + 20 • С • р + 0,81 • М • С • р Зависимость прибавки урожайности для картофеля от исходных факторов представляется функцией от трех независимых факторов при коэффициенте корреляции равном 0,998. Зависимость является значимой на 5 %-м уровне. Остальные независимые факторы мало взаимосвязаны с

результирующим зависимым фактором .

Литература

1. Регионы России. Социально-экономические показатели. 2012: Статистический сборник / Росстат. М., 2012. 990 с.

2. КендаллМ., Стьюарт А. Теория распределений. М.: Наука, 1966. 574 с.

3. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. М.: Финансы и статистика, 1983. 324 с.

4. Шеффе Г. Дисперсионный анализ. М.: Наука, 1980. 312 с.

5. ДрейперН. Р., Смит Г. Прикладной регрессионный анализ. М.: Диалектика. 2007. 932 с.

6. Валентинов А. В. Эконометрика. М.: Дашков и К°, 2009. 445 с.

7. Щедрин В. Н., Васильев С. М. Теория и практика альтернативных видов орошения черноземов юга Европейской территории России. Новочеркасск: Лик, 2011. 435 с.

8. Игнатьев В. М., Ильинская И. Н. Статистические модели прибавки урожайности сельскохозяйственных культур // Методы и алгоритмы прикладной математики в технике, медицине и экономике: сб. статей. Новочеркасск: Темп, 2002. Ч. 3. С. 11-12.

i Надоели баннеры? Вы всегда можете отключить рекламу.