Научная статья на тему 'Прогнозирование урожайности зерновых культур: методы и расчеты'

Прогнозирование урожайности зерновых культур: методы и расчеты Текст научной статьи по специальности «Математика»

CC BY
1916
211
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Хворова Любовь Анатольевна, Гавриловская Н. В.

Рассмотрены математические методы обработки и анализа многомерных агрометеорологических данных, на основе которых строится алгоритм определения года-аналога. Приведены расчеты урожайности яровой пшеницы по эмпирической модели с использованием погодного сценария года-аналога.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Хворова Любовь Анатольевна, Гавриловская Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Forecasting of Productivity of Grain Crops: Methods and Calculations

In clause mathematical methods of processing and the analysis multivariate agrometeorological data on the basis of whom the algorithm of definition of year-analogue is under construction are considered. Calculations of productivity of a spring wheat on empirical model with use of the weather script of year of analogue are resulted.

Текст научной работы на тему «Прогнозирование урожайности зерновых культур: методы и расчеты»

УДК 311:681.3.06

Л.А. Хворова, Н.В. Гавриловская

Прогнозирование урожайности зерновых культур: методы и расчеты

В задачах прогноза урожайности сельскохозяйственных культур важную роль играют методы классификации эмпирических данных. Общая же теория классификации сформировалась на основе работ по распознаванию образов. Поэтому классификация данных и распознавание образов, как правило, в любых научных исследованиях выступают в качестве двух взаимосвязанных этапов.

Классификация - это разбиение множества объектов на классы по степени их сходства (в нашем случае без информации о принадлежности объектов к каким-либо классам), так что объекты, отнесенные к одному и тому же классу, оказываются сходными в каком-то отношении, а отнесенные к разным классам - не сходными или менее сходными. Распознавание же образов предполагает отнесение нового объекта к определенному классу по некоторому решающему правилу [1].

С помощью методов классификации и распознавания образов авторами решается задача определения года-аналога с целью осуществления прогноза урожайности яровой пшеницы в условиях Алтайского края.

При определении года-аналога и решении задачи прогноза важно установить, какие исходные данные в большей степени определяют будущий урожай. С этой целью была проведена оценка влияния различных метеорологических ситуаций на урожай яровой пшеницы [2]. Анализ обработки экспериментальных данных показал, что урожайность, являясь биологическим свойством, несет в себе информацию о соответствии между оптимальными и фактическими значениями множества факторов по периодам (фазам) вегетационного цикла. В условиях Алтайского края существенное влияние на будущий урожай оказывают первые фазы развития яровой пшеницы: посев-всходы-кущение. В результате обработки агрометеорологических данных дисперсионным анализом по значимости и силе их влияния на урожайность из всех вариантов расчета агроклиматических показателей были отобраны следующие: сумма эффективных температур, сумма осадков, количество дней с осадками, дефицит влажности насыщения.

Проведем процедуру кластеризации (разбиение на классы или кластеры) с помощью программы статистической обработки данных 51а^1юа 6.0 несколько раз при различных значениях числа кластеров, после чего необходимо выбрать лучшую группировку

в смысле критерия минимума отношений средних внутрикластерных и межкластерных расстояний:

г

4 //*

Для сравнения нескольких типизаций и выбора наиболее оптимальной из них необходим критерий, численная мера качества классификации,

В качестве достаточно общего критерия успешности можно взять следующий показатель [3]

),

где

9 mm _____ 1 m _

—-£ Е D„, J2=-^D„

— m i=i

Здесь D - среднее расстояние между точками внутри /-го класса; £) - среднее расстояние между

парами точек /'-го и j- го классов.

Данные расстояния рассчитываются в модуле Cluster Analysis. Так, среднее расстояние между парами точек ¿-го иу-го классов можно подсчитать используя опцию «Кластерные усреднения & евклидова расстояния» (Cluster Means&Euclidean Distances).

Среднее расстояние между точками внутри /-го класса можно найти используя опцию «Элементы каждого кластера & расстояния» (Member of each cluster&distances). Подсчитав сумму строки расстояний каждого элемента до центра кластера, получим сумму расстояний между точками внутри /-го класса. Останется только просуммировать расстояния для каждого класса. Результаты расчетов приведены в таблице 1.

В общей форме критерий качества классификации представляется в виде условного математического ожидания (или среднего риска)

J(C)— JQ(X,C)p{X) dX,

х

где Q(X,С) - функция вектора С = (с,,с,,...,с ), зависящая также и от вектораX(точнее, от его расстояния до соответствующего эталона), с ,с ,...,сп - параметры классификации, р(Х) - функция плотности вероятности вектора X.

Для графической интерпретации используем критерий «каменистой осыпи». Обычно для выбора размерности какого-либо пространства используют

Таблица 1

Расчет численного показателя мера качества классификации

Кластеры Dij m Dii J1 J2 J

2 0.70 2 1,25 0,70 0.62 1,13

3 0.61 3 1,26 0,20 0,42 0.49

4 0,57 4 1,26 0,09 0,31 0,30

5 0.47 5 1,50 0,05 0,30 0,16

6 0,43 6 1,45 0.03 0.24 0,12

7 0,36 7 1,52 0.02 0,22 0,08

8 0.34 8 1,48 0,01 0,18 0,07

9 0,31 9 1,45 0,01 0,16 0,05

10 0.28 10 1,41 0,01 0,14 0,04

11 0,26 11 1,35 0,00 0,12 0,04

график зависимости стресса от размерности (график каменистой осыпи). Этот критерий впервые был предложен Кэттелом (СаИе11, 1966) в контексте решения задачи снижения размерности в факторном анализе.

Кэттел предложил найти такую абсциссу на графике, в которой график стресса начинает визуально сглаживаться в направлении правой, пологой его части, и, таким образом, уменьшение стресса максимально замедляется. Образно говоря, линия, на рисунке напоминает скалистый обрыв, а черные точки на графике напоминают камни, которые ранее упали вниз. Таким образом, внизу наблюдается как бы каменистая осыпь из таких точек. Справа от выбранной точки на оси абсцисс лежит только «факторная осыпь».

Выбор критерия качества классификации существенно зависит от цели, для которой она производится, и оставляет исследователю значительную свободу.

Лучший вариант - разбиение на 6 кластеров (рис. 1, 2). Так, например, годами-аналогами для 1997 г. по результатам кластеризации стали: 1971, 1973, 1974, 1976, 1981, 1988 гг.

Plot of Mean* for Each Cluster

Численная мера качества классификации

1.20 q 1.00

Я 0.80

я

^ |. 0.60

1 0.40

І 0,20 п

0.00

Количество кластеров

Рис. 1. Диаграмма численной меры качества классификации

Из рисунка 2 видно, что в первый кластер попали годы с низкими показателями суммы эффективных температур, количеством осадков и дней с осадка-

Рис. 2. Значения стандартизованных данных по кластерам: STEMP2D >10- сумма эффективных температур; OSAD2D - количество осадков; KOLOSAD2D - количество дней с осадками;

CROP - урожайность яровой пшеницы

ми за первые две декады вегетационного периода и с минимальной урожайностью яровой пшеницы. Во второй кластер - годы с минимальным показателем суммы эффективных температур, средними значениями показателей количества осадков и дней с осадками и максимальной урожайностью. Третий кластер содержит годы со средними значениями всех факторов. Четвертый кластер характеризуется высоким значением суммы эффективных температур, минимальными значениями количества осадков и дней с осадками и средней урожайностью. В пятый кластер попали годы с достаточно низкой суммой эффективных температур, большим количеством осадков, средним количеством дней с осадками и высокой урожайностью. Шестой кластер характеризуется следующим образом: достаточно низкое значение сумм эффективных температур, среднее значение количества осадков и большим числом дней с осадками, а урожайность яровой пшеницы имеет среднее значение.

Характеристики каждого класса достаточно точно подтверждают влияние комплекса соответствующих факторов на урожайность.

Используя данные по годам-аналогам, можно осуществлять предварительный прогноз урожайности после двух-трех недель вегетационного периода (когда сценарий погоды уже известен) по эмпирической модели с помощью функций отклика:

+(*',-Гии)-ПЯДх), если > У\

; = 1

ГшпНГ.п-Г'УПН.Іх), если Г, < У,

(1)

где У - урожайность текущего года (ожидаемая); У - урожайность предыдущего года; Утах - максимальная; Утт - минимальная; У - средняя урожайности по всему временному ряду урожайностей; Н (х) - нормированные функции отклика, к- количество рассматриваемых факторов, влияющих на урожайность.

Общий вид нормированных функций отклика Н.(х) установлен на основе экспериментальных и теоретических исследований. Совместное влияние нормированных функций отклика считается мультипликативным.

Н,(х)

0-*2)2 (•*1 Х2) (х-х3)2

, х, < х < х2;

, х, <х<х4;

(х4 -х3)

1, х2 < х < х3;

О, х < хр х > х4,

гдехх - минимальное;^-максимальноезначения /-го фактора, за пределами которых формирование урожая не происходит; хг, х3 - биологически оптимальные границы /-го фактора.

В общем случае задание параметрической формы частных функций отклика определяется нашими знаниями о качественном поведении рассматриваемого объекта. На основе выбранных частных функций отклика формируется обобщенная функция отклика, имеющая обычно мультипликативную или аддитивную формы. Определение параметров функций отклика производится процедурой совместной идентификации параметров всех рассматриваемых частных функций отклика [4].

Определение пороговых значений параметров функций отклика осуществляется из условия мини-

/V .. ||2

мизации функционала I = ¡У, ~ х>|| > гДе -т, ~

» = )

расчетная урожайность по модели; у1 - фактическая урожайность. В связи с этим рассматривалась следующая задача оптимального управления: минимизировать функционал

пип

' = £|я-*,Г

(=1

при условияхх1+1 = (*,к), 1 = 1 ,х0 = а;

где [и] = (и,...иы_х). и, ~(и],..:,и') - параметры

управления; х, = (х,',...,х") - искомые параметры; р' = (/V1,...,заданные функции; \у] =

уг = (у]у") - данные экспериментальных исследований.

Модель прогноза урожайности зерновых культур идентифицирована на основе данных, представленных Алтайским центром по гидрометеорологии. Пороговые значения параметров функций отклика найдены в результате проведения численных экспериментов с моделью по многолетним временным рядам экспериментальных данных. Результаты численных расчетов ожидаемой урожайности на 1989 и 1997 гг. представлены в таблице 2.

Таблица 2

Прогнозируемая величина урожайности, ц/га

Год Урожайность фактическая Урожайность расчетная Средняя абсолютная процентная ошибка

1989 25,3 23,97 5,2%

1997 12,8 12,6 1,5%

Процент отклонения предсказанных данных от фактических в среднем составляет 3,4%. Как видно из таблицы 1 и приведенных оценок, результаты численных расчетов, проведенных по эмпирической модели урожайности, хорошо согласуются с экспериментальными данными. Результаты исследований обобщены в многочисленных таблицах и представлены на графиках, отражающих связь между исследуемыми элементами метеорологической ситуации и урожайностью.

0.70 0.60 0.50 0,40 0,30 ; 0,20 0,10

0,00

0 1 2 3 4 5

7 8 9 10 11 12 13 14 15 16 17 18 Количество кластеров

Рис. 3. Зависимость отношения средних внутрикластерных и межкластерных расстояний от количества кластеров

Проведенная классификация и результаты расчетов позволяют взять погодный сценарий всего ве-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

гетационного периода года-аналога и осуществить уточняющий прогноз урожайности. Для этого была проведена повторная классификация для уточнения года-аналога. Лучший вариант - разбиение на 13 кластеров (рис. 3). Так, например, годами-аналогами для ! 997 г. по результатам кластеризации стали: 1964, 1965, 1973, 1991 гг.

Сравнительный анализ различных разбиений показал, что годом-аналогом для 1997 г. является 1973 г. Величина урожайности по погодному сценарию 1973 по формуле (1) составила 13,2 ц/га.

Проведенную классификацию и прогноз урожайности яровой пшеницы следует рассматривать как начальный этап работы по оценке урожайно-

сти зерновых культур в условиях Алтайского края. Однако он показывает, что данная методика имеет вполне определенный смысл и достаточно хорошо позволяет осуществлять прогноз. Практическое приложение разработанной методики по прогнозу урожайности состоит в возможности заблаговременно, еще до начала сева, оценивать вероятную урожайность. Данные оценки позволили бы рационально маневрировать структурой посевных площадей, целесообразно распределять производственные ресурсы, эффективно планировать внешнеторговые операции, более дифференцированно использовать арсенал технологических приемов воздействия на урожайность.

Библиографический список

1. Сонечкин, Д.М. Математическая теория классификации и ее применение в метеорологии / Д.М. Сонечкин // Метеорология и гидрология. - 1969.-№12.

2. Хворова, Л.А. Применение информационных технологий, математических методов и моделей для обработки и ана-

лиза многомерных данных /Л.А. Хворова, Н.В. Гавриловская, H.H. Лопатин // Известия АлтГУ. - 2006. - №1 (49).

3. Груза, Г.В. О принципах автоматической классификации метеорологических объектов / Г.В. Груза. Э.Я. Ранькова // Метеорология и гидрология. - 1970. -№32.

i Надоели баннеры? Вы всегда можете отключить рекламу.