АВТОМАТИЗАЦИЯ И УПРАВЛЕНИЕ
УДК 519.233.5:631.53.04
П.Г. Асалханов
ЛИНЕЙНЫЕ И НЕЛИНЕЙНЫЕ МНОГОФАКТОРНЫЕ МОДЕЛИ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ СРОКОВ АГРОТЕХНОЛОГИЧЕСКИХ ОПЕРАЦИЙ
Рассматривается применение линейных и нелинейных уравнений регрессии для прогнозирования дат посева зерновых культур. По данным трех районов Иркутской области построены линейные и нелинейные уравнения регрессии зависимости срока агротехнологических операций, связанных с посевом, от сумм температур воздуха и сумм осадков за предшествующие периоды. В результате анализа факторов, влияющих на даты посева, для их прогнозирования предложено использовать однофакторные, двухфакторные полиномиальные и однофакторные линейные уравнения в зависимости от климатических особенностей муниципальных районов. Предложенные модели вошли в математическое обеспечение разработанного программного комплекса прогнозирования сроков агротехнологических операций.
Многофакторный анализ, прогнозирование, дата посева, сельскохозяйственная культура, программный комплекс
P.G. Asalkhanov LINEAR AND NONLINEAR MULTIPLE FACTOR MODELS IN THE PROBLEM OF FORECASTING THE TERMS OF AGROTECHNOLOGICAL OPERATIONS
Application of the linear and nonlinear equations of regression for forecasting the dates of the grain crops is considered. According to the data referring the three regions in Irkutsk region, the linear and nonlinear equations relating the regression of seasonal dependence of agrotechnological operations connected with crops, from the sums of air temperatures and sums of the precipitation for the previous periods are constructed. As a result of the analysis referring the factors influencing the dates of crops for their forecasting, it is offered to use one-factorial, two-factorial polinomial and one-factorial linear equations depending on the climatic features of municipal areas. The offered models are entered into the software of the developed program complex used for forecasting the terms of agrotechnological operations.
Multiple-factor analysis, forecasting, crops date, crop, program complex
При планировании производства растениеводческой продукции актуальной проблемой является создание методики прогнозирования сроков агротехнологических операций. В условиях значительной изменчивости климатических условий, характерных для территории Восточной Сибири, прогнозирование дат посевов имеет особое значение [1].
Для различных сельскохозяйственных культур в зависимости от их требований к температуре и увлажнению, существуют рекомендации по дате начала посева. В качестве таковой для зерновых культур предлагается использовать дату прогрева почвы на глубине заделки семян до определенной температуры (td) [2].
Несмотря на большое количество работ, посвященных планированию возделывания культур, мало внимания уделено прогнозированию сроков технологических операций [3].
Согласно [3], впервые предложены алгоритмы прогнозирования дат посева на основе линейных уравнений регрессии зависимости рекомендуемых дат посева (Ti) от сумм среднесуточных температур воздуха (x1) и сумм осадков (x2) за предшествующие периоды k.
Для построения регрессионных моделей применяют агрометеорологические данные по пункту наблюдения за 7 и более лет. В качестве результативного признака (у) предложено использовать относительные даты прогрева почвы до оптимальной температуры как разность между ежегодной датой прогрева почвы Ti и датой, на 5 дней предшествующей самой ранней дате Ti за многолетний период.
В качестве начала периода суммирования параметров тепла и увлажнения k применяется дата перехода среднесуточной температуры воздуха, усредненной за многолетний период, через 0°С. Рассматриваются разные продолжительности этого периода: от 7 до 20 суток и более. В день окончания периода и при наличии данных о сумме температур и осадков, возможен расчет даты посева Т на текущий год.
Качество полученных линейных уравнений неодинаково и зависит от климатических условий конкретного года и территории возделывания, количества факторов, периода суммирования параметров тепла и увлажнения ^ многолетней продолжительности и заданной температуры прогрева, благоприятной для посева. Другими словами, уравнения имеют разную точность и адекватность и, следовательно, неодинаковую степень пригодности для прогнозирования. Для расчетов предлагается использовать зависимости с наибольшим коэффициентом детерминации или с наименьшей средней относительной ошибкой аппроксимации, при условии, что модель адекватна.
Для вычисления даты посева применительно к аграрному предприятию на текущий год задача сводится к выбору такого периода суммирования параметров, при котором уравнение регрессии имеет высокое значение коэффициента детерминации и достаточную заблаговременность прогноза -время от даты, когда возможен прогноз до расчетной даты посева. При увеличении периода суммирования параметров возможно повышение точности уравнений в ущерб заблаговременности прогноза. Однако не всегда уравнения с большим упреждением точнее.
Предложенные алгоритмы апробированы для трех районов Иркутской области, благоприятных для возделывания зерновых культур и находящихся в различных агроклиматических условиях: Иркутского, Усольского и Тулунского. Выявлено, что в отличие от Иркутского и Усольского районов для Тулунского района более пригодны двухфакторные линейные модели, однако точность уравнений регрессии в большинстве случаев невысока (К2<0,4). Для Иркутска уравнения регрессии обладают большей точностью, если в качестве оптимальной температуры для посева t(^ использовать 10 или 12°С, для Усолья-Сибирского - 8 или 10°С, а для Тулуна - 6°С. Полученные значения для всех трех пунктов входят в диапазон температур пригодных для посева зерновых культур.
Линейные уравнения регрессии благодаря универсальности их применения и простоте широко используются для моделирования производственных параметров. Между тем далеко не всегда зависимости этих параметров можно выразить линейными функциями, так как при этом могут возникать неоправданно большие ошибки [4].
Наряду с линейными моделями возможно использование нелинейных функций: полинома, логарифмической, экспоненциальной, степенной и др. Применение нелинейных уравнений может увеличить точность аппроксимации, что положительно скажется на прогнозировании [5].
При использовании некоторых нелинейных уравнений необходимо, чтобы результативный признак и факторы регрессии были положительными.
В качестве одного из факторов в регрессионных моделях, предложенных в [3], использовалась сумма среднесуточных температур воздуха за предшествующий период.
Для большинства рассматриваемых лет по Иркутску, Усолью-Сибирскому и Тулуну эта сумма температур за периоды суммирования k положительна. Однако в годы с холодными весенними периодами возможны их отрицательные значения. Например, в 2006 г. по данным Иркутска сумма температур с 1 по 19 апреля составила 62,7°С.
Для того, чтобы исключить отрицательные суммы температур, предлагается при расчете температуры использовать шкалу Фаренгейта (°Р).
При этом формула перевода суммы температур по Цельсию в суммы температур по Фаренгейту выглядит следующим образом:
где tF и tC - температуры в градусах Фаренгейта и Цельсия соответственно, k - продолжительность
периода суммирования температур.
В работе для аппроксимации однофакторных зависимостей дат посева от суммы температур (данные Иркутска и Усолья-Сибирского) использовались следующие функции: линейная, полином второй степени, логарифмическая, степенная и экспоненциальная.
(1)
При описании двухфакторных зависимостей (данные Тулуна) рассматривались линейное, логарифмическое и полиномиальные выражения в различных вариантах. В качестве дополнительного фактора, помимо суммы среднесуточных температур х1 воздуха, использовалась сумма суточных осадков х2.
В качестве температуры td для каждого пункта применялись рекомендуемые значения согласно [3]. Для Иркутска это значение 10°С, для Усолья-Сибирского - 8°С, а для Тулуна - 6°С.
Для каждого вида функции использовались периоды суммирования параметров, при которых уравнения имели наибольшее значение коэффициента детерминации. Для Иркутска при использовании полиномиальной функции коэффициент детерминации увеличивается до значения И2=0,81, по сравнению с линейной зависимостью (И2=0,72). У остальных уравнений (логарифмического, степенного и экспоненциального) это значение ниже (Я2<0,7). При этом согласно анализу остатка ряда результативного признака модель признана адекватной.
Для Усолья-Сибирского характерны приблизительно одинаковые и достаточно высокие значения Я для полинома второй степени, логарифмической и линейной зависимости Я2=0,81. Значения коэффициента детерминации для степенной и экспоненциальной функции ниже (Я2=0,71 и 0,76 соответственно). Другими словами, для Иркутска применимы полиномиальная, а для Усолья-Сибирского -линейная модели.
В отличие от Иркутска и Усолья-Сибирского дата посева для Тулуна зависит от суммы температур и суммы осадков. На основе линейной аппроксимации получено уравнение регрессии с Я2=0,42. Применение функций в виде полинома позволило получить уравнения регрессии с высоким коэффициентом детерминации (Я2=0,80), почти в два раза превышающим аналогичный показатель для линейной зависимости.
По данным Тулуна, полиномиальное уравнение обладает большим значением коэффициента детерминации (Я2=0,80) по сравнению с линейной зависимостью (Я2=0,42).
В табл. 1 приведены результаты сравнения точности некоторых линейных и нелинейных уравнений для всех трех пунктов и полученные прогностические даты прогрева почвы до оптимальной температуры.
Оценка точности моделей производилась по коэффициенту детерминации, стандартной ошибке и средней относительной ошибке аппроксимации. Согласно табл. 1, наибольшей точностью для Иркутска обладает полиномиальное уравнение, а линейное и логарифмическое имеют меньшую точность, но они также пригодны для прогнозирования. Ввиду больших относительных и абсолютных ошибок степенной и экспоненциальной зависимостей последние неприменимы для прогнозирования.
Для Усолья-Сибирского линейная и полиномиальная зависимость имеют практически одинаковую точность. Меньшей точностью обладает логарифмическая функция. Что касается степенной и экспоненциальной зависимости, то, как и в предыдущем случае, они не рекомендуются для использования в прогнозировании.
Высокие стандартные и средние относительные ошибки уравнений регрессии по некоторым пунктам связаны с тем, что в разные годы по-разному происходит накопление сумм температур и можно выделить два вида функции: одна - возрастающая, а вторая имеет волнообразный вид.
Расчетные даты посева зерновых на 2012 г. согласно уравнениям с наибольшими точностями (табл. 1) составили 30 апреля для Иркутска (дата прогрева почвы до 10°С), 29 апреля для Усолья-Сибирского (дата прогрева почвы до 8°С) и 2 мая для Тулуна (дата прогрева почвы до 6°С), что согласуется с реальными значениями.
Качество полученных регрессионных моделей также можно оценить с помощью ретроспективного прогноза. Для этого по нескольким прошедшим годам рассчитывается дата посева по данным за предшествующие им годы. При этом в зависимости от прогнозируемого года используются разные периоды суммирования, многолетние продолжительности и соответственно разные уравнения регрессии. Для расчетов дат посева в ретроспективном прогнозе для Иркутска и Тулуна применимы полиномиальные уравнения из табл. 1, так как они обладают наибольшими точностями, а для Усолья-Сибирского - линейные. В табл. 2 приведены некоторые результаты ретроспективного прогноза по трем пунктам.
Одной из проблем в построении уравнений регрессии является отсутствие фактических агроклиматических данных по некоторым годам и пунктам наблюдений. По Усолью-Сибирскому полностью отсутствуют сведения по температуре почвы за 1998, 2000, 2006-2008, 2011 гг. По Тулуну нет данных по этому показателю ранее 1 мая за многолетний период. В то же время прогрев почвы до 6°С за некоторые годы может осуществляться ранее этой даты. Поэтому при построении моделей по
этим пунктам использовались неполные выборки. Для восстановления отсутствующих данных по температуре почвы на глубине 5 см можно использовать температуры воздуха ввиду высокой корреляции этих параметров. Кроме того, температура почвы в Тулуне может быть восстановлена по данным соседних пунктов.
Оценка точности ретроспективных прогнозов для трёх пунктов приведена в табл. 3. Оценивались стандартная ошибка и средняя относительная погрешность отклонений фактических от расчетных дат по каждому году.
По данным табл. 3 можно сделать вывод об удовлетворительной точности ретроспективных прогнозов по всем трём пунктам. Стандартная ошибка прогноза по Иркутску составляет 4,2, что вполне приемлемо для расчетов. При этом использовались данные за достаточно продолжительный период - 14 лет. Наименьшей точностью обладают прогнозы по Усолью-Сибирскому. Аналогичный показатель по Тулуну достаточно высок, однако, как и в случае с предыдущим пунктом, для расчетов уравнений в них использовались данные по малому количеству лет (5 и 6 лет соответственно). Этим можно частично объяснить низкую точность ретроспективного прогноза по Усолью-Сибирскому.
Полученные модели и прогнозы позволили разработать программный комплекс прогнозирования сроков посева. В него входит база данных, включающая агроклиматические сведения: суточные средние температуры воздуха и осадки, температуры почвы на глубине 5 см и другие. Основным источником данных являются гидрометеорологические станции региона. Между тем простота получения информации позволяет использовать данные сельскохозяйственных предприятий о температуре воздуха, почвы и осадках. Кроме того, в качестве дополнительной информации возможно использование прогностических данных о температуре.
На рисунке показано функционирование программного комплекса и его взаимодействие с другими комплексами.
Таблица 1
Оценка точности линейных и нелинейных уравнений регрессии для Иркутской области
Показатели Пункт наблюдения Линейная функция Полиномиальная функция
Уравнение регрессии Иркутск у=-0,067х+60,3 у =-0,00018х2+0,21х-29,7
Рекомендуемая температура (с 10°С
Многолетний период 1989 - 2009 гг.
Период суммирования параметров 1-19 апреля
Коэффициент детерминации 0,72 0,81
Стандартная ошибка 2,7 2,5
Средняя относительная погрешность, % 16,80 14,10
Расчетная дата посева на 2012 г. 30 апреля 30 апреля
Уравнение регрессии Усолье- Сибирское у=-0,071х+66,4 у=0,00001 х2-0,079х+69,6
Рекомендуемая температура (с 80С
Многолетний период 1987 - 2010 гг.
Период суммирования параметров 1-21 апреля
Коэффициент детерминации 0,81 0,81
Стандартная ошибка 2,3 2,3
Средняя относительная погрешность, % 13,20 13,43
Расчетная дата посева на 2012 г. 29 апреля 29 апреля
Уравнение регрессии Тулун у=-0,048х1+ +0,047X2+40,4 у=-1,05х12-0,096х22+ +0,00072X1+0,0027X2+386
Рекомендуемая температура (с 60С
Многолетний период 1987 - 2008 гг.
Период суммирования параметров 11-30 апреля
Коэффициент детерминации 0,42 0,80
Стандартная ошибка 2,2 1,3
Средняя относительная погрешность, % 30,10 15,30
Расчетная дата посева на 2012 г. 4 мая 2 мая
Таблица 2
Результаты ретроспективного прогноза рекомендуемых дат посева зерновых на основе полиномиальной зависимости
Пункт наблюдения Прогно- зируемый год Многолетний период Коэффициент детерминации уравнения регрессии Фактическая дата прогрева почвы до (с Расчетная дата посева Расхождение фактической и расчетной дат
2002 1989-2001 0,80 7 мая 9 мая -2
2003 1989-2002 0,79 5 мая 5 мая 0
2004 1989-2003 0,78 11 мая 6 мая 5
2005 1989-2004 0,75 11 мая 7 мая 4
2006 1989-2005 0,74 13 мая 10 мая 3
Иркутск 2007 1989-2006 0,78 28 апреля 29 апреля -1
2008 1989-2007 0,81 10 мая 5 мая 5
2009 1989-2008 0,77 25 апреля 28 апреля -2
2010 1989-2009 0,81 10 мая 12 мая -2
2011 1989-2009 0,81 08 мая 24 апреля 13
2012 1989-2009 0,81 н.д. 30 апреля -
1997 1987-1996 0,79 22 апреля 4 мая 12
2002 1987-1997 0,89 4 мая 3 мая -1
2003 1987-2002 0,84 2 мая 3 мая 1
Усолье- 2004 1987-2003 0,83 6 мая 4 мая -2
Сибирское 2005 1987-2004 0,83 8 мая 3 мая -5
2010 1987-2005 0,78 16 мая 5 мая -11
2011 1987-2010 0,81 н.д. 23 апреля -
2012 1987-2010 0,81 н.д. 29 апреля -
2000 1987-1999 0,96 н.д. 14 мая -
2002 1987-2001 0,69 1 мая 2 мая -1
2003 1987-2002 0,71 3 мая 2 мая 1
2004 1987-2003 0,69 6 мая 3 мая 3
Тулун 2005 1987-2004 0,69 6 мая 5 мая 1
2006 1987-2005 0,72 11 мая 16 мая -5
2007 1987-2006 0,80 н.д. 14 мая -
2009 1987-2008 0,80 н.д. 5 мая -
2012 1987-2008 0,80 2 мая 2 мая 0
Таблица 3
Оценка точности ретроспективного прогноза рекомендуемых дат посева зерновых
Пункт наблюдения Иркутск Усолье-Сибирское Тулун
Рекомендуемая температура С 10°С 8°С 6°С
Многолетний период 1989 - 2009 1987 - 2010 1987 - 2008
Прогнозируемые годы 1997 2012 1997 - 2012 2000 - 2009
Количество прогнозируемых лет 14 6 5
Стандартная ошибка 4,2 7,6 3,0
Средняя относительная погрешность, % 12,3 16,1 9,9
Система предназначена для использования на средних и крупных аграрных предприятиях Иркутской области, расположенных в разных природно-экономических зонах. Основными пользователями системы являются агроном и экономист. Полученные результаты расчета рекомендуемых дат можно использовать в других программных комплексах - АСУ «Хозяйство» для расчета технологи-
ческих карт и ГИС-системах для получения карты пространственного распределения прогностических дат посева. Использование этого программного комплекса на предприятиях растениеводческой отрасли позволяет повысить эффективность планирования производства.
Схема функционирования программного комплекса прогнозирования сроков посева
Таким образом, построены различные линейные и нелинейные функции аппроксимации зависимости рекомендуемых дат посева зерновых от сумм температур и осадков за предшествующие периоды по Иркутску, Усолью-Сибирскому и Тулуну. Выявлено, что для Иркутска и Усолья-Сибирского наибольшей точностью обладают однофакторные уравнения зависимости дат посева от сумм температур, причем для первого пункта лучшей является полиномиальная функция, а для второго - линейная. По данным Тулуна наилучшей моделью для прогноза является двухфакторное полиномиальное уравнение. Проведен ретроспективный прогноз рекомендуемых дат посева зерновых по данным вышеназванных пунктов. В отличие от Усолья-Сибирского по Иркутску уравнения имели приемлемую точность для прогноза. Невысокая точность уравнений по первому пункту связана с отсутствием данных за некоторые годы.
Разработан программный комплекс прогнозирования сроков посева сельскохозяйственных культур на основе полученных моделей. Комплекс предназначен для использования на крупных и средних предприятиях растениеводческой отрасли и в сочетании с ГИС-системами позволяет строить интерактивные карты пространственно-временного распределения рекомендуемых дат посева по Иркутской области.
ЛИТЕРАТУРА
1. Растениеводство / Г.С. Посыпанов, В.Е. Долгодворов, Б.Х. Жеркухов и др. М.: КолосС, 2007. 612 с.
2. Хуснидинов Ш.К. Растениеводство Предбайкалья: учеб. пособие / Ш.К. Хуснидинов, А.А. Долгополов. Иркутск: Изд-во ИрГСХА, 2000. 462 с.
3. Асалханов П.Г. О некоторых алгоритмах прогнозирования дат технологических операций возделывания зерновых культур / П.Г. Асалханов, Я.М. Иваньо // Вестник ИрГСХА. Вып. 47. Иркутск: ИрГСХА, 2011. С. 116-120.
4. Иваньо Я.М. Методы моделирования производственных процессов в АПК: учеб. пособие по самостоятельной работе / Я.М. Иваньо, М.Н. Барсукова, Т.С. Бузина. Иркутск: ИрГСХА, 2008. 184 с.
5. Эконометрика: учеб. / под ред. И.И. Елисеевой. М.: Финансы и статистика, 2003. 344 с.
Асалханов Пётр Г еоргиевич - Peter G. Asalkhanov -
старший преподаватель кафедры «Информатика Senior Lecturer
и математическое моделирование» Иркутской Department of Informatics and Mathematical Modeling
государственной сельскохозяйственной академии Irkutsk State Agricultural Academy
Статья поступила в редакцию 15.07.12, принята к опубликованию 06.11.12