Научная статья на тему 'Прогнозирование в коротких временных рядах: методологические и методические аспекты'

Прогнозирование в коротких временных рядах: методологические и методические аспекты Текст научной статьи по специальности «Математика»

CC BY
958
244
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Вестник аграрной науки
ВАК
AGRIS
RSCI
Область наук
Ключевые слова
ПРОГНОЗИРОВАНИЕ ВО ВРЕМЕННЫХ РЯДАХ / КОРОТКИЕ ВРЕМЕННЫЕ РЯДЫ / ТРЕНДОВЫЕ МОДЕЛИ / АДАПТИВНЫЕ МОДЕЛИ / ТОЧНОСТЬ ПРОГНОЗА / АППРОКСИМАЦИЯ / КАЧЕСТВО МОДЕЛИРОВАНИЯ / TIME SERIES FORECASTING / SHORT TIME SERIES / TRENDING MODELS / ADAPTIVE MODELS / FORECAST ACCURACY / APPROXIMATION / MODELING QUALITY

Аннотация научной статьи по математике, автор научной работы — Барбашова Е. В., Гайдамакина И. В., Польшакова Н. В.

Прогнозирование будущих значений временного ряда на основе его исторических значений является основой для планирования, управления и оптимизации объемов производства сельскохозяйственной продукции. Эта задача решается путем создания модели, адекватно описывающей исследуемый процесс. Наиболее широко используются авторегрессионные и нейросетевые модели, однако их применение ограничивается рядами динамики значительной длины. Чаще в сфере АПК исследователь располагает короткими рядами динамики, что вынуждает применять лишь простые трендовые и адаптивные регрессионные модели, которые не обеспечивают требуемую точность. Это актуализирует данное исследование, цель которого повышение надежности прогноза в коротких рядах. Решение поставленной задачи требует адекватного ИТ-инструментария. В этой связи для построения регрессионных моделей использован пакет статистических программ BM SPSS Statistics Base 22, обладающий рядом преимуществ в сравнении с пакетом Excel . На примере статистического анализа исторических данных по динамике урожайности зерновых культур в Орловской области в период 1960-2009 гг. в работе выявлены следующие закономерности, носящие общий характер и имеющие определенное методологическое и методическое значение: при прогнозировании по регрессионным моделям следует анализировать не только результаты точечного прогноза, но и интервального, при этом аналитические расчеты необходимо дополнять анализом графиков модельных кривых с линиями доверительных границ; прогноз в коротких временных рядах по адаптивным моделям допустим лишь на шаг вперед, а по трендовым моделям на один-два шага вперед, прогнозирование на больший горизонт допустимо только в целях выявления тенденции; применение квадратичных и кубических моделей недопустимо вследствие высокой вероятности изменения характера динамики временного ряда при экстраполяции моделей за пределами исторических данных; для повышения надежности прогнозирования следует строить объединенные прогнозы путем усреднения частных прогнозов по конкурирующим моделям; дальнейшее повышение качества прогнозов требует обращения к экспертной информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Барбашова Е. В., Гайдамакина И. В., Польшакова Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING IN SHORT TIME SERIES: METHODOLOGICAL AND METHODICAL ASPECTS

Forecasting of a time series future values based on its historical values is the basis for planning, managing and optimizing agricultural production volumes. This problem is solved by creating a model that describes adequately the process under the study. The most widely used are autoregressive and neural network models, however, their use is limited to a series of dynamics of considerable length. More often in the field of agriculture, the researcher has short rows of dynamics, which force the use of only simple trend and adaptive regression models that do not provide the required accuracy. This actualizes this study, the purpose of which is to increase the reliability of the forecast in short rows. The solution to this problem requires adequate IT tools. In this regard, to build the regression models, the IBM SPSS Statistics Base 22 statistical software package is used, which has several advantages compared to the Excel package. On the example of a historical data statistical analysis on the dynamics of grain productivity in the Oryol region in the period 1960-2009 the following regularities are revealed in the work, which are of a general nature and have a certain methodological significance: when forecasting by regression models, it is necessary to analyze not only the results of the point forecast, but also the interval one, while the analytical calculations must be supplemented with the analysis of the graphs of model curves with confidence lines; short time series forecast for adaptive models is permissible only one step ahead, and for trend models it is one or two steps forward, forecasting for a larger horizon is permissible only in order to identify trends; the use of quadratic and cubic models is unacceptable due to the high probability of a change in the nature of the dynamics of the time series when extrapolating models beyond historical data; to increase the reliability of forecasting, it is necessary to build joint forecasts by averaging private forecasts over competing models; further improvement in the quality of forecasts requires recourse to expert information.

Текст научной работы на тему «Прогнозирование в коротких временных рядах: методологические и методические аспекты»

ЭКОНОМИЧЕСКИЕ НАУКИ

УДК / UDC 519.216.3:311.13

ПРОГНОЗИРОВАНИЕ В КОРОТКИХ ВРЕМЕННЫХ РЯДАХ: МЕТОДОЛОГИЧЕСКИЕ И МЕТОДИЧЕСКИЕ АСПЕКТЫ

FORECASTING IN SHORT TIME SERIES: METHODOLOGICAL AND METHODICAL ASPECTS

Барбашова Е.В.1*, кандидат экономических наук, доцент Barbashova E.V.1, Candidate of Economic Sciences Associate Professor Гайдамакина И.В.1, кандидат педагогических наук, доцент Gaydamakina I.V.1, Candidate of Pedagogical Sciences, Associate Professor Польшакова Н.В.2, кандидат экономических наук, доцент Polshakova N.V.2, Candidate of Economic Sciences, Associate Professor 1ФГБОУ ВО «Среднерусский институт управления - филиал Российской академии народного хозяйства и государственной службы», Орел, Россия Federal State Budgetary Educational Establishment of Higher Education "Central Russian Institute of Management - Branch of the Russian Academy of National Economy and Public Administration", Orel, Russia 2ФГБОУ ВО «Орловский государственный аграрный университет

имени Н.В. Парахина», Орел, Россия Federal State Budgetary Educational Establishment of Higher Education "Orel State Agrarian University named after N.V. Parakhin", Orel, Russia

*E-mail: work.67@mail.ru

Прогнозирование будущих значений временного ряда на основе его исторических значений является основой для планирования, управления и оптимизации объемов производства сельскохозяйственной продукции. Эта задача решается путем создания модели, адекватно описывающей исследуемый процесс. Наиболее широко используются авторегрессионные и нейросетевые модели, однако их применение ограничивается рядами динамики значительной длины. Чаще в сфере АПК исследователь располагает короткими рядами динамики, что вынуждает применять лишь простые трендовые и адаптивные регрессионные модели, которые не обеспечивают требуемую точность. Это актуализирует данное исследование, цель которого - повышение надежности прогноза в коротких рядах. Решение поставленной задачи требует адекватного ИТ-инструментария. В этой связи для построения регрессионных моделей использован пакет статистических программ BM SPSS Statistics Base 22, обладающий рядом преимуществ в сравнении с пакетом Excel. На примере статистического анализа исторических данных по динамике урожайности зерновых культур в Орловской области в период 1960-2009 гг. в работе выявлены следующие закономерности, носящие общий характер и имеющие определенное методологическое и методическое значение: при прогнозировании по регрессионным моделям следует анализировать не только результаты точечного прогноза, но и интервального, при этом аналитические расчеты необходимо дополнять анализом графиков модельных кривых с линиями доверительных границ; прогноз в коротких временных рядах по адаптивным моделям допустим лишь на шаг вперед, а по трендовым моделям - на один-два шага вперед, прогнозирование на больший горизонт допустимо только в целях выявления тенденции; применение квадратичных и кубических моделей недопустимо вследствие высокой вероятности изменения характера динамики временного ряда при экстраполяции моделей за пределами исторических данных; для повышения надежности прогнозирования следует строить объединенные прогнозы путем усреднения частных прогнозов по конкурирующим моделям; дальнейшее повышение качества прогнозов требует обращения к экспертной информации.

Ключевые слова: прогнозирование во временных рядах, короткие временные ряды, трендовые модели, адаптивные модели, точность прогноза, аппроксимация, качество моделирования.

Forecasting of a time series future values based on its historical values is the basis for planning, managing and optimizing agricultural production volumes. This problem is solved by creating a model that describes adequately the process under the study. The most widely used are autoregressive and neural network models, however, their use is limited to a series of dynamics of considerable length. More often in the field of agriculture, the researcher has short rows of dynamics, which force the use of only simple trend and adaptive regression models that do not provide the required accuracy. This actualizes this study, the purpose of which is to increase the reliability of the forecast in short rows. The solution to this problem requires adequate IT tools. In this regard, to build the regression models, the IBM SPSS Statistics Base 22 statistical software package is used, which has several advantages compared to the Excel package. On the example of a historical data statistical analysis on the dynamics of grain productivity in the Oryol region in the period 1960-2009 the following regularities are revealed in the work, which are of a general nature and have a certain methodological significance: when forecasting by regression models, it is necessary to analyze not only the results of the point forecast, but also the interval one, while the analytical calculations must be supplemented with the analysis of the graphs of model curves with confidence lines; short time series forecast for adaptive models is permissible only one step ahead, and for trend models it is one or two steps forward, forecasting for a larger horizon is permissible only in order to identify trends; the use of quadratic and cubic models is unacceptable due to the high probability of a change in the nature of the dynamics of the time series when extrapolating models beyond historical data; to increase the reliability of forecasting, it is necessary to build joint forecasts by averaging private forecasts over competing models; further improvement in the quality of forecasts requires recourse to expert information. Key words: time series forecasting, short time series, trending models, adaptive models, forecast accuracy, approximation, modeling quality.

Введение. Прогнозирование будущих значений временного ряда на основе его исторических значений является основой для планирования, управления и оптимизации объемов производства сельскохозяйственной продукции. Эта задача решается путем создания модели прогнозирования, адекватно описывающей исследуемый процесс.

В настоящее время существует множество моделей прогнозирования временных рядов: регрессионные и авторегрессионные модели, нейросетевые модели, модели экспоненциального сглаживания, модели на базе цепей Маркова, классификационные модели и др. Наиболее широко используемыми из них являются авторегрессионные и нейросетевые модели [1], однако их применение ограничивается наличием временных рядов значительной длины.

В сфере АПК для прогнозирования урожайности и объемов производства сельскохозяйственной продукции чаще всего используют регрессионные модели. Так, в работе О.В. Сидоренко и Т.И. Гуляевой [2] исследованы временные ряды урожайности зерновых культур за 1960-2009 гг., при этом выявлены определенные закономерности колебаний природных условий сельскохозяйственного производства в целях заблаговременной локализации негативных последствий неурожая. Авторы ограничились моделями линейного тренда, при этом выявлено, что устойчивость урожайности различных зерновых культур составляет значения от максимального значения 62,7% для зернобобовых до минимального 46,0% для проса. Даже после исключения «эффекта доперестроечного периода», обусловившего повышение социально-экономической неоднородности условий сельскохозяйственного производства, и перехода к семилетним и одиннадцатилетнему подпериодам (1985-1991, 19921998, 1999-2009 гг.), коэффициент устойчивости урожайности зерновых культур не превысил 80,6%, что, конечно, не обеспечивает достаточно точный прогноз урожайности. Это обусловило использование для повышения точности прогноза метода «ЗОНТ» [3], но и с учетом статистической информации об урожайности,

представленной, по И.Б. Загайтову, в форме цепных индексов и мажоритарных отношений, при этом остаются неучтенными риски, связанные с возможной засухой, а также другими макроэкономическими, природными и техногенными, технологическими, агроэкологическими, социальными рисками.

Гораздо чаще в сельскохозяйственных исследованиях приходится иметь дело с короткими временными рядами, при этом для разработки краткосрочных прогнозов широко используются модели экспоненциального сглаживания (см., например, [4]). Достоинства методов экспоненциального сглаживания состоят в возможности учета весов исходной информации, простоте вычислительных операций, гибкости описания различных динамик процессов [5]. Наряду с этим, в ряде работ отмечается, что применение для прогноза в коротких временных рядах регрессионных моделей не является достаточно эффективным, так как при этом интервальный прогноз даже на ближайший период характеризуется большими значениями [6, 7].

Известны попытки улучшить такие прогнозы. Так, автор работы [7] считает, что одним из способов повышения адекватности модели является ее адаптивность, и предлагает учитывать особенности изменения изучаемых процессов последних лет, корректируя формальную экстраполяцию достоверной информацией, которая может существенно изменить характер динамики процесса. На примере ключевых ресурсных и результативных показателей сельского хозяйства Курской области автор обсуждает пути «превращения» регрессионной модели временного ряда в адаптивную модель, что может повысить точность прогноза. Продуктивным, в частности, является предложение отказаться от обработки длинных временных рядов в пользу более коротких (например, 10-летних), если за период наблюдения произошел «разворот» динамического ряда, т.е. первоначальная тенденция, выявленная на начальных стадиях наблюдения, была преодолена. Короткие временные ряды также могут помочь, если существенно изменился темп роста (снижения) показателя в последние годы [7, с. 105].

Обращает на себя внимание, что большинство используемых в настоящее время методов статистической экстраполяции временных рядов основано на предположении об инерционности динамики значений наблюдаемых показателей: предполагается, что закономерности, выявленные по данным за предыдущий период, сохранятся в значительной мере в будущем, но при этом совершенно не учитывается экспертная информация. В то же время, многие исследователи полагают, что в случае коротких временных рядов прогнозирование практически невозможно без привлечения дополнительной, экспертной информации о предполагаемых свойствах наблюдаемого процесса [8]. Автор работы [8] среди причин, возникающих при прогнозировании по коротким временным рядам и связанных с недостатком априорной информации о поведении ряда, отмечает следующее:

1) имея короткий ряд данных, невозможно на основе только прошлых наблюдений выявить долгосрочные тенденции развития процесса;

2) оценки параметров модели ряда ненадежны;

3) применение традиционных статистических методов оценки точности прогноза (определение доверительных интервалов, проверка гипотез) оказывается невозможным;

4) теряет смысл детальный статистический анализ остатков модели и, следовательно, становятся неприменимыми такие критерии адекватности, как коэффициент детерминации;

5) не имеет смысла использовать сложные модели для описания трендов, так как их оценивание требует больших выборок.

Последнее обусловливает применение для описания тренда только простых моделей - линейных, экспоненциальных, логарифмических, степенных и других двухпараметрических моделей; по этой же причине проблематичным является использование широко распространенных квадратичных и кубических моделей и, тем более, полиномов более высоких степеней [9-10].

В этой связи одним из перспективных направлений повышения надежности прогноза во временных рядах является совместный учет статистической и экспертной информации, что может быть выполнено различными способами. Так, в работе [11] обсуждается составление агрегированного прогноза как взвешенной суммы прогнозируемых значений статистической экстраполяции и экспертного метода. Авторы отмечают, что при отсутствии информации о степени доверия к интервальным значениям прогноза веса берутся равными.

Актуальной проблеме установления весов при объединении прогнозов посвящены работы [12, 13]. Авторы [14] приводят описание некоторых наиболее распространенных методов объединения прогнозов: двух модификаций метода Грэнджера-Раманатхана, метод матрицы парных предпочтений, метод линейной комбинации частных показателей с различными весами. Эмпирически обосновано, что объединение прогнозов дает возможность использовать почти всю информацию, имеющуюся в частных прогнозах, и зачастую позволяет улучшить качество прогнозирования временного ряда, при этом наибольшую точность обеспечивают прогнозы, построенные с использованием подходов Грэнджера-Раманатхана [16].

В работе [15] предлагается подход к расчету весов частных прогнозов, основанный на экспертном методе анализа иерархий Т. Саати [17]. Автор [15] полагает, что применение метода анализа иерархий для получения и математической обработки экспертной информации является перспективным направлением совершенствования методики объединения прогнозов. При этом матрицу попарных сравнений - основной математический конструкт метода анализа иерархий - автор предлагает строить на основании экспертных оценок относительно точности того или иного метода прогнозирования. Каждый эксперт оценивает, какой из полученных прогнозов будет ближе к фактическим данным, и на основании этих суждений конструируется матрица попарных сравнений. Автор данной работы считает, что «использование экспертной информации в прогнозировании позволяет определять более гибкие прогнозы, которые будут зависеть не только от прошлых значений исследуемого процесса и проецировать его прошлую динамику на будущее развитие, но и от предположений на будущее, как поведет себя процесс в зависимости от внешних факторов (экономических, политических, социальных)» [15, с. 41].

Цель исследований. Изложенные выше методы повышения надежности прогнозирования относятся к достаточно длинным рядам. Так, в работе [14] рассматриваются временные ряды по годовым данным с 1950 по 2015 гг., в других публикациях по объединению прогнозов также фигурируют длинные ряды. Таким рядам соответствуют валидные методы прогнозирования, такие как модель Бокса-Дженкинса, метод гармонических весов, метод адаптивного экспоненциального сглаживания с использованием трэкинг-сигнала, другие «тонкие» методы, применение которых в случае коротких временных рядов невозможно или затруднено. Поэтому актуальными являются статистические исследования, направленные на разработку методики повышения надежности

прогнозирования в коротких рядах, адаптированной к высокой изменчивости показателей, органически присущей процессам АПК.

Условия, материалы и методы. Решение поставленной задачи требует адекватного ИТ-инструментария. Для построения регрессионных моделей и визуализации результатов моделирования использован пакет статистических программ анализа данных общественных наук IBM SPSS Statistics Base 22. Программный комплекс SPSS, развиваемый на протяжении более 50 лет, характеризуется широким охватом одномерных и многомерных статистических методов, большим количеством удобных средств визуализации результатов обработки. Предлагаемый SPSS Statistics Base 22 набор аналитических и графических процедур полностью отвечает поставленной задаче и обладает несомненным преимуществом в сравнении с широко распространенным среди исследователей в сфере АПК пакетом Excel.

В качестве эмпирической базы использовались исторические данные по урожайности зерновых культур в Орловской области за одиннадцатилетний период 1999-2009 гг. из работы [2], при этом уровни временного ряда за первые семь лет использовались для моделирования и прогнозирования урожайности (обучающая выборка), а данные за период с 2006 по 2009 гг. служили для расчета точности прогноза (тестовая выборка).

Из широкого разнообразия графических и аналитических процедур пакета анализа данных SPSS Base использовались диаграммы последовательностей (Sequence Plot), процедура регрессионного анализа «приближение кривых» (Curve Estimation), процедура двойного экспоненциального сглаживания (Exponential Smoothing).

Результаты и обсуждение. Из графика исследуемого временного ряда урожайности зерновых культур в Орловской области за период 1999-2009 гг., представленного на рис. 1, видно, что динамика показателя характеризуется сильной изменчивостью с циклами подъема и спада: с 1999 по 2002 гг. наблюдается быстрый рост урожайности зерновых, после чего вплоть до 2007 г. следует пятилетний период спада и стабилизации, затем вновь наблюдается рост показателя. Отсюда следует, что при общей тенденции к росту урожайности зерновых на протяжении рассматриваемого одиннадцатилетнего периода, динамика показателя не может быть с достаточной точностью аппроксимирована достаточно простой регрессионной моделью, а приближение эмпирических данных полиномом высокой степени, как было отмечено ранее, может не иметь прогностического смысла. Исходя из этого, а также с учетом сформулированного в работе [2] положения о семилетних периодах устойчивости урожайности, в анализ для получения трендовых и адаптивных моделей включены данные с 1999 по 2005 гг., что на рис. 1 показано вертикальной пунктирной линией, разделяющей моделируемую и тестовую (контрольную) части временного ряда.

Судя по характеру в целом нарастающей динамики урожайности зерновых за эти семь лет, из набора моделей тренда, предусмотренных в процедуре пакета SPSS Base «приближение кривых», конкурирующими являются четыре двухпараметрические модели: линейная, логарифмическая, гиперболическая и степенная (экспоненциальная модель исключается из анализа, так как рост урожайности с ускорением мало вероятен). Ввиду малой длины временного исследуемого ряда квадратичная и кубическая модели, содержащие три и четыре параметра соответственно, в качестве конкурирующих нами также не рассматривались.

Год

Рисунок 1 - Динамика урожайности зерновых культур в Орловской области

в 1999-2009 гг. [2]

Поскольку построение тренда в процедуре «приближение кривых» может и не дать положительных результатов из-за недостаточно высокого качества, помимо этих четырех двухпараметрических трендовых моделей (линейной, логарифмической, гиперболической и степенной), рассматривали также две модели двойного экспоненциального сглаживания: с линейным трендом (модель Хольта) и с затухающим линейным трендом. Использование модели Хольта для адаптивного прогнозирования урожайности зерновых культур описано в работе [18]; работ по применению в сфере АПК моделей двойного экспоненциального сглаживания с затухающим линейным трендом нами не обнаружено. В модели Хольта значения уровня и наклона сглаживаются путем использования различных постоянных для двух входящих в нее параметров - текущего уровня и тренда. Эти параметры сглаживания позволяют оценить текущий уровень и наклон, уточняя их для новых наблюдений [5, 19]. В модели двойного экспоненциального сглаживания с затухающим линейным трендом дополнительно проводится оценка скорости затухания тренда.

Важным является выбор характеристик качества прогнозных моделей. Речь здесь не идет о качестве аппроксимации, ибо высокая точность аппроксимации эмпирических данных не гарантирует высокую точность прогнозов, и модель, дающая наименьшие ошибки по обучающей выборке, не обязательно обеспечивает также наименьшие ошибки по тестовой выборке. С другой стороны, модель, плохо аппроксимирующая временной ряд данных, вряд ли обеспечит точный прогноз. С учетом сказанного, нами использованы следующие характеристики качества моделирования и прогнозирования:

- график временного ряда с аппроксимирующими кривыми и линиями 95% доверительного интервала как средство визуальный оценки качества аппроксимации;

- коэффициент детерминации, характеризующий долю объясняемой моделью дисперсии (рассчитывается по обучающей выборке);

- значение критерия Фишера и его значимости, отражающие уровень адекватности модели (рассчитываются также по обучающей выборке);

- взвешенная абсолютная процентная ошибка WAPE (Weighted Absolute Percent Error) модели, построенной по обучающей выборке;

- точность модели, построенной по обучающей выборке, определяемая по формуле: 100% - WAPE;

- 95% доверительный интервал прогноза на первый год прогноза (2006 г.);

- ширина 95% доверительного интервала прогноза на первый год прогноза (2006 г.);

- взвешенная абсолютная процентная ошибка WAPE прогноза на 2006-2009 гг.;

- точность прогноза, рассчитанная по тестовой выборке;

- ошибка прогноза MAE - средняя абсолютная ошибка прогнозирования;

- критерий ценности прогнозной модели FV (Forecast Value).

График временного ряда с аппроксимирующими кривыми и линиями 95% доверительного интервала, а также первые четыре коэффициента качества моделирования отвечают обучающей выборки и показывают, насколько хорошо модель описывает эмпирические данные. Следующие две характеристики относятся к 95% доверительному интервальному прогнозу на каждый год прогнозирования (2006-2009 гг.), а последующие два коэффициента - к прогнозу на весь срок прогнозирования. Предпоследний показатель в приведенном списке (MAE) характеризует ошибку прогноза, а также используется для оценки ценности прогнозной модели.

Ввиду большого числа показателей, характеризующих качество прогноза, поясним выбор для этой цели не столь часто используемых коэффициентов WAPE (Weighted Absolute Percent Error) и критерия ценности прогнозной модели FV (Forecast Value). Существует ряд ошибок, которые можно использовать для расчета точности прогнозирования [20]. Чаще всего прогнозисты используют среднюю абсолютную процентную ошибку MAPE (Mean Absolute Percentage Error), но этот коэффициент по-разному относится к положительным и отрицательным ошибкам: жестче к случаям завышенных прогнозов, чем заниженных. Коэффициент WAPE - наиболее оптимальный вариант, так как он является симметричной оценкой (положительные и отрицательные отклонения от факта рассматриваются в равной степени) [21].

Что касается критерия ценности прогнозной модели FV (Forecast Value), то этот показатель, рассчитываемый как отношение ошибки прогноза вне обучающей выборки к ошибке аппроксимации по прогнозной модели, на наш взгляд, наиболее подходит для измерения точности прогноза на конкретный год или весь горизонт прогнозирования. Эта относительная мера ценности прогнозной модели легко интерпретируется: значения FV, превышающие единицу, указывают, что качество прогнозов по тестовой выборке хуже, чем качество аппроксимации по обучающей выборке. Тем самым критерий FV выполняет ту же задачу, что и предлагаемый в работе [22] относительный показатель MASE (Mean Absolute Scaled Error), но нагляднее. Этот критерий можно также использовать для сравнения прогностической ценности различных моделей.

Качество моделирования динамики урожайности зерновых различными трендовыми регрессионными моделями, а также прогнозирования на четыре года вперед можно визуально оценить по представленным на рис. 2 графикам с нанесенными на них эмпирическими данными и модельными кривыми, а также линиями верхней (ВДГ) и нижней (НДГ) границ 95% доверительного интервала (для удобства сравнения моделей на графиках приняты одинаковые масштабы переменных).

а

б

Рисунок 2 - Моделирование и прогнозирование урожайности зерновых культур в Орловской области в 1999-2009 гг. трендовыми регрессионными моделями: а - линейная; б - логарифмическая, в - гиперболическая, г - степенная модели

Из рис. 2 видно, что ширина 95% доверительного интервала для линейной и гиперболической трендовых моделей с ростом горизонта прогнозирования увеличивается лишь незначительно, для гиперболической - в большей степени и существенно - для степенной модели.

Еще в большей степени этот критерий точности прогноза увеличивается с ростом горизонта прогнозирования для адаптивных моделей двойного экспоненциального сглаживания: с линейным трендом и с затухающим линейным трендом (рис. 3): если в пределах обучающей части выборки и в первый год прогноза (2006 г.) ширина 95% доверительного интервала адаптивных моделей еще сравнима с трендовыми, то в последующем, в 20072009 гг., точность интервального прогноза по адаптивным моделям становится недопустимо низкой.

в

г

а

б

Рисунок 3 - Моделирование и прогнозирование урожайности зерновых культур в Орловской области в 1999-2009 гг. адаптивными регрессионными моделями: а - модель двойного экспоненциального сглаживания с линейным трендом (модель Хольта); б - модель двойного экспоненциального сглаживания с

затухающим линейным трендом

Выявленные эмпирические факты говорят в пользу ограничения горизонта прогнозирования до 1/3 длины временного ряда для трендовых моделей (в рассматриваемом случае - на два года вперед) и всего лишь на один шаг - для адаптивных (в данном случае - на год вперед).

Что касается полиномиальных моделей второго и третьего порядков (квадратичной и кубической), то их применение для прогнозирования в коротких временных рядах исключается не только из-за низкой точности интервального прогноза, но также и по причине, как правило, нереального хода модельных кривых за пределами обучающей выборки. Этот факт, отмеченный в работе [9], подтверждают и наши исследования (рис. 4). Из данного рисунка следует, что квадратичная модель «предсказывает» снижение урожайности до нулевого значения на четвертый год прогноза (2009 г.), что противоречит здравому смыслу, а прогноз по кубической модели, хотя и вполне возможен по центральной тенденции (точечному прогнозу), не приемлем из-за чрезмерно большой ширины 95% доверительного интервала.

Выявленные выше эмпирические факты приводят к следующим важным в практическом отношении выводам:

1) при прогнозировании по трендовым моделям следует анализировать не только результаты точечного прогноза, но и интервального;

2) прогнозирование в коротких временных рядах по трендовым моделям более на два шага вперед допустимо только в обоснованных случаях и лишь для выявления вероятной тенденции;

3) прогнозирование в коротких временных рядах по адаптивным моделям допустимо только на шаг вперед.

а

б

Рисунок 4 - Моделирование и прогнозирование урожайности зерновых культур в Орловской области в 1999-2009 гг. полиномиальными регрессионными моделями: а - квадратичная модель; б - кубическая модель

Выполненное нами качественное сравнение моделей дополняют расчеты критериев качества моделирования (табл. 1).

Таблица 1 - Критерии качества трендовых и адаптивных моделей

Адап- Адап-

Критерии качества Линей- Логариф- Гипербо- Степен- тивная с тивная с

моделирования ная мическая лическая ная линейн. демпф.

трендом трендом

Коэф. детерминации R2 0,612 0,758 0,868 0,782 0,619 0,681

Критерий Фишера F 14,2 15,7 33,0 18,0 - -

Уровень значимости p 0,004 0,011 0,002 0,008 - -

Ошибка модели MAE, ц/га 2,4 1,7 2,1 1,2 3,1 3,4

Ошибка модели WAPE, % 11,1 8,0 9,5 5,4 11,4 12,3

Точность модели, % 88,9 92,0 90,5 94,6 88,6 87,7

Согласно табл. 1, наилучшее приближение эмпирических данных дает гиперболическая модель: ей отвечает высокое значение коэффициента детерминации Н2=0,868, критерий Фишера Г=33,0 значим на высоком уровне р=0,002. Однако по критериям точности гиперболическая модель уступает степенной модели, для которой средняя абсолютная ошибка моделирования урожайности минимальна и равна 1,2 ц/га, взвешенная абсолютная процентная ошибка также минимальна - 5,4%, а точность степенной модели составляет максимальное значение 94,6%.

Против ожидания, адаптивные модели динамики урожайности зерновых культур, построенные нами по семилетним историческим данным, имеют более низкие показатели качества аппроксимации, чем трендовые модели: лучшая из них - модель Хольта - характеризуется средней абсолютной ошибкой моделирования урожайности 3,1 ц/га, что хуже, чем для линейной модели (2,1 ц/га). Вероятно, причиной этого является малая длина временного ряда, недостаточная для оптимизации параметров адаптивных моделей. В пользу этого предположения свидетельствует недостаточная надежность их расчета.

Так, в модели Хольта характеризующий статистическую значимость ¿-критерий (критерий Стьюдента) для параметра уровня равен 2,247, что соответствует значимости р=0,075, а для параметра тренда ¿=0,993, т.е. величина параметра тренда даже меньше ошибки в его определении. Недостаточной является и надежность параметров модели двойного экспоненциального сглаживания с затухающим линейным трендом: значения ¿-критерия для трех ее параметров -уровня, тренда и фактора затухания тренда, составляют 1,331; 0,445 и 2,108 соответственно, при их статистической значимости (р-уровне) 0,254; 0,445 и 0,103. Выявленные факты не позволяют считать эти аддитивные модели адекватными эмпирическим наблюдениям, поэтому характеристики их точности в дальнейшем можно рассматривать только как ориентировочные.

Перейдем теперь к сравнению трендовых моделей динамики урожайности зерновых культур по качеству прогнозирования (табл. 2). В ней приведены значения основного критерия точности прогноза на 2006-2009 гг. - отклонения от фактических значений по каждому году, а также характеристики точности на весь горизонт года прогнозирования и ширина 95% доверительного интервала прогноза на шаг вперед (2006 г.).

Таблица 2 - Точность прогноза урожайности зерновых культур трендовыми и адаптивными моделями_

Год прогноза Урожайность, ц/га Линейная Логарифмическая Гиперболическая Степенная Адаптивная с линейн. трендом Адаптивная с демпф. трендом

Прогноз / отклонение (факт минус прогноз), ц/га

2006 24,1 26,2/-2,7 27,0/-2,9 25,4/-1,3 28,2/-4,1 24,5/-0,4 24,4/-0,3

2007 23,0 27,4/-4,4 27,7/-4,7 25,6/-2,6 29,3/-6,3 25,0/-2,0 24,8/-1,8

2008 31,4 28,6/+2,8 28,4/+3,0 25,8/+5,9 30,3/+1,1 25,5/+5,9 25,0/+6,4

2009 30,1 29,8/+0,3 28,9/+1,2 25,9/+4,2 31,2+1,1 26,0/+4,1 25,2/+4,9

Качество прогноза

Ошибка прогноза MAE, ц/га 2,4 3,0 3,2 3,4 3,1 3,4

Ошибка прогноза WAPE, % 8,9 10,9 11,6 12,6 11,4 12,3

Точность прогноза, % 91,1 89,1 88,4 87,4 88,6 87,7

95%-ный интервал прогноза на 2006 г., ц/га 16,0 15,4 10,7 22,5 16,4 18,0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из табл. 2 видно, что по средним показателям качества за весь горизонт прогнозирования (2006-2009 гг.) преимущество за линейной моделью: точность прогноза составляет 91,1%. Хотя по величине 95% доверительного интервала прогноза на 2006 г. линейная модель уступает гиперболической (16,0 ц/га против 10,7 ц/га), следует отметить, что обе эти величины слишком велики, чтобы считать прогноз по трендовым моделям хорошим даже всего на один шаг. Также низкой оказывается и точность точечного прогноза по трендовым моделям: отклонение расчетных значений урожайности на 2006 г. от фактической величины 24,1 ц/га составляет от 1,3 ц/га для гиперболической модели до 4,1 ц/га для степенной, тогда как для адаптивных моделей ошибка точечного прогноза всего 0,3-0,4 ц/га. Исходя из этого факта, а также из теоретических

положений, можно предположить, что преимущество в точности прогноза на один шаг - за адаптивными моделями.

Надежность прогноза можно повысить путем объединения результатов прогнозирования по различным моделям. Точность прогноза конкурирующих моделей на один шаг и весь горизонт прогнозирования, как правило, априори не известна, не известны и веса прогнозов, поэтому выполним объединение прогнозов простым усреднением, при этом ограничимся двумя вариантами объединения прогнозов: 1) усреднением только по трендовым моделям и 2) усреднением по всем моделям, включая адаптивные. Результаты приведены в табл. 3, причем достаточно надежными можно считать расчеты только на один и два года вперед (2006 и 2007 гг.).

Таблица 3 - Объединенный прогноз урожайности зерновых культур

на 2006-2009 гг. и точность п эогноза

Урожайность и показатели качества прогноза Год

2006 2007 2008 2009

Прогноз по трендовым моделям

Объединенный прогноз, ц/га 26,7 27,5 28,3 29,0

Ошибка прогноза MAE, ц/га 2,6 4,5 3,1 1,7

Ошибка прогноза MAPE, % 10,8 19,6 10,0 5,7

Точность прогноза, % 89,2 80,4 90,0 94,3

Прогноз по трендовым и адаптивным моделям

Объединенный прогноз, ц/га 26,0 26,6 27,3 27,8

Ошибка прогноза MAE, ц/га 1,9 3,6 4,1 2,6

Ошибка прогноза MAPE, % 7,7 15,8 13,2 8,8

Точность прогноза, % 92,3 84,2 86,8 91,2

Из сравнения таблиц 2 и 3 следует, что значения показателей точности объединенных прогнозов урожайности зерновых культур в среднем уступают аналогичным показателям для лучших трендовых моделей - линейной и гиперболической, при этом, если точность прогнозов на один шаг вперед (на 2006 г.) находится на удовлетворительном уровне (89,2% для трендовых моделей и 92,3% для всех шести моделей), то из-за низкой точности объединенные прогнозы на два года вперед (80,4% и 84,2% соответственно) нельзя считать приемлемыми.

Выводы. На примере статистического анализа исторических данных по динамике урожайности зерновых культур в Орловской области в период 19602009 гг. выявлены следующие закономерности, носящие общий характер и представляющие определенное методологическое и методическое значение.

1. Из-за высокой волатильности процессов в сфере АПК, а также влияния разнообразных природных, техногенных, технологических, агроэкологических и социальных рисков, для построения адекватных прогнозных моделей динамики исследователь вынужден использовать короткие временные ряды, содержащие не более семи-десяти исторических данных, что исключает возможность применения таких методов и моделей прогнозирования, как авторегрессионные методы, нейросетевые модели, модели и методы на базе классификационно-регрессионных деревьев и др. и ограничивает инструментарий моделирования простыми трендовыми и адаптивными регрессионными моделями.

2. При прогнозировании по трендовым и адаптивным моделям следует анализировать не только результаты точечного прогноза, но и интервального,

при этом аналитические расчеты необходимо дополнять анализом графиков модельных кривых с линиями доверительных границ.

3. Прогнозирование в коротких временных рядах по адаптивным моделям допустимо только на шаг вперед, при этом обязательно необходимо проводить анализ статистической значимости их параметров.

4. Прогнозирование в коротких временных рядах по трендовым моделям более на два шага вперед допустимо только в обоснованных случаях и исключительно для выявления вероятной тенденции.

5. Применение в прогностических целях полиномов второго и третьего порядков (квадратичных и кубических моделей) по коротким временным рядам, как правило, недопустимо, из-за высокой вероятности кардинального изменения характера динамики исследуемого ряда при экстраполяции полиномиальных моделей за пределами исторических данных.

6. Для повышения надежности результатов прогнозирования следует строить объединенные прогнозы путем усреднения частных прогнозов по конкурирующим моделям с весами, пропорциональными их прогностической точности. При отсутствии такой информации следует проводить усреднение прогнозов по конкурирующим моделям в предположении равных весов.

7. Одним из направлений дальнейшего повышения надежности и качества прогнозирования является совместный учет статистической и экспертной информации, при этом перспективным для установления весов частных прогнозов при их объединении является использование экспертного метода аналитических иерархий.

Благодарность. Авторы выражают глубокую признательность доктору экономических наук, почетному работнику высшего профессионального образования Российской Федерации, профессору кафедры информационных технологий и математики Орловского государственного аграрного университета имени Н.В. Парахина Вадиму Георгиевичу Шуметову за постановку задачи статистических исследований и участие в обсуждении полученных результатов.

БИБЛИОГРАФИЯ

1. Чучуева И. Модель прогнозирования временных рядов по выборке максимального подобия: дис. ... канд. техн. наук. М., 2012. 155 с.

2. Сидоренко О.В., Гуляева Т.И. Прогнозирование урожайности зерновых культур в Орловской области // Вестник ОрелГАУ. 2010. № 6. С. 64-68.

3. Загайтов И.Б., Воробьева Л.С. Прогноз колебаний природных условий сельскохозяйственного производства и всемирная статистика урожаев. Воронеж: ВГАУ, 1998. 216 с.

4. Мусина И.Р. Проектирование системы краткосрочного прогнозирования временных рядов // Известия Кыргызского государственного технического университета им. И. Раззакова. 2014. № 32-1. С. 51-55.

5. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования. М.: Финансы и статистика, 1979. 256 с.

6. Полищук Е.А., Барбашова Е.В. Выбор оптимальной модели динамики в случае экстраполяционного прогнозирования по коротким временным рядам (на примере рынка труда молодежи Республики Крым) // Региональные проблемы преобразования экономики. 2018. № 11 (97). С. 398-405.

7. Барбышева Г.И. Повышение адаптивности одномерных методов прогнозирования // Известия Юго-Западного государственного университета. 2013. № 5 (68). С. 97-111.

8. Головченко В.Б. Прогнозирование временных рядов по разнородной информации. Новосибирск: Наука. Сиб. издат фирма РАН, 1999. 88 с.

9. Шуметов В.Г., Крюкова О.А. Методология и практика анализа данных в управлении. Методы одномерного и двумерного анализа: монография. Орел: изд-во Орловского филиала РАНХиГС, 2012. 178 с.

10. Гайдамакина И.В., Музалевская А.А., Ширяева О.О. Модели краткосрочного прогнозирования экономических показателей на основе временных рядов // Вестник ОрелГИЭТ. 2019. № 2 (48). С. 76-82.

11. Колесов Д.Н., Котов Н.В., Федоренко А.С. Совместный учет статистической и экспертной информации при прогнозировании временных рядов экономических показателей // Вестник Санкт-Петербургского университета. 2007. Сер. В. Вып. 3. С. 93-101.

12. Объединение прогнозов как фактор повышения качества прогнозирования / А.А. Френкель, Н.Н. Волкова, А.Ф. Лобзова, Э.И. Романюк, А.А. Сурков // Экономика и предпринимательство. 2016. № 11. С. 1118-1126.

13. Френкель А.А., Волкова Н.Н., Сурков А.А. Повышение точности прогнозирования на основе объединения прогнозов // Финансы: теория и практика. 2017. Т. 21. № 5. С. 118-127.

14. Сравнительный анализ методов построения объединенного прогноза / А.А. Френкель, Н.Н. Волкова, А.А. Сурков, Э.И. Романюк // Вопросы статистики. 2017. № 7. С. 17-27.

15. Сурков А.А. Применение метода попарных сравнений при объединении экономических прогнозов // Учет. Анализ. Аудит. 2019. Т. 6. № 3. С. 32-42.

16. Granger C.W.J., Ramanathan R. Improved methods of combining forecasts // Journal of Forecasting. 1984. Vol. 3. P. 197-204.

17. Саати Т.Л. Принятие решений при зависимостях и обратных связях. Аналитические сети. М.: ЛКИ, 2008. 360 с.

18. Рогачев А. Адаптивное прогнозирование урожайности зерновых культур // УЭкС. 2005. №3. URL: https://cyberleninka.ru/artide/n/adaptivnoe-prognozirovanie-urozhaynosti-zernovyh-kultur (дата обращения: 18.03.2020).

19. Петрушин В.Н., Рытиков Г.О. Формализация временного ряда методом двойного сглаживания // Электронный журнал Cloud of Science. 2014. T. 1. № 2. С. 230-238.

20. Обзор оценок качества моделей прогнозирования / М.В. Щербаков, А. Бребельс, Н.Л. Щербакова, А.П. Тюков // URL: https://docplayer.ru/62095596-Udk-bbk-obzor-ocenok-kachestva-modeley-prognozirovaniya.html (дата обращения: 10.03.2020).

21. Ошибка прогнозирования: виды, формулы, примеры // https://shtem.ru/ошибка-прогнозирования-формула/ (дата обращения: 10.03.2020).

22. Hyndman R.J., Koehler A.B. Another look at measures of forecast accuracy // International Journal of Forecasting. 2006. No 22(4). P. 679-688.

REFERENCES

1. Chuchueva I. Model prognozirovaniya vremennykh ryadov po vyborke maksimalnogo podobiya: dis. ... kand. tekhn. nauk. M., 2012. 155 s.

2. Sidorenko O.V., Gulyaeva T.I. Prognozirovanie urozhaynosti zernovykh kultur v Orlovskoy oblasti // Vestnik OrelGAU. 2010. № 6. S. 64-68.

3. Zagaytov I.B., Vorobeva L.S. Prognoz kolebaniy prirodnykh usloviy selskokhozyaystvennogo proizvodstva i vsemirnaya statistika urozhaev. Voronezh: VGAU, 1998. 216 s.

4. Musina I.R. Proektirovanie sistemy kratkosrochnogo prognozirovaniya vremennykh ryadov // Izvestiya Kyrgyzskogo gosudarstvennogo tekhnicheskogo universiteta im. I. Razzakova. 2014. № 32-1. S. 51-55.

5. Lukashin Yu.P. Adaptivnye metody kratkosrochnogo prognozirovaniya. M.: Finansy i statistika, 1979. 256 s.

6. Polishchuk Ye.A., Barbashova Ye.V. Vybor optimalnoy modeli dinamiki v sluchae ekstrapolyatsionnogo prognozirovaniya po korotkim vremennym ryadam (na primere rynka truda molodezhi Respubliki Krym) // Regionalnye problemy preobrazovaniya ekonomiki. 2018. № 11 (97). S. 398-405.

7. Barbysheva G.I. Povyshenie adaptivnosti odnomernykh metodov prognozirovaniya // Izvestiya Yugo-Zapadnogo gosudarstvennogo universiteta. 2013. № 5 (68). S. 97-111.

8. Golovchenko V.B. Prognozirovanie vremennykh ryadov po raznorodnoy informatsii. Novosibirsk: Nauka. Sib. izdat firma RAN, 1999. 88 s.

9. Shumetov V.G., Kryukova O.A. Metodologiya i praktika analiza dannykh v upravlenii. Metody odnomernogo i dvumernogo analiza: monografiya. Orel: izd-vo Orlovskogo filiala RANKhiGS, 2012. 178 s.

10. Gaydamakina I.V., Muzalevskaya A.A., Shiryaeva O.O. Modeli kratkosrochnogo prognozirovaniya ekonomicheskikh pokazateley na osnove vremennykh ryadov // Vestnik OrelGIET. 2019. № 2 (48). S. 76-82.

11. Kolesov D.N., Kotov N.V., Fedorenko A.S. Sovmestnyy uchet statisticheskoy i ekspertnoy informatsii pri prognozirovanii vremennykh ryadov ekonomicheskikh pokazateley // Vestnik Sankt-Peterburgskogo universiteta. 2007. Ser. V. Vyp. 3. S. 93-101.

12. Obedinenie prognozov kak faktor povysheniya kachestva prognozirovaniya / A.A. Frenkel, N.N. Volkova, A.F. Lobzova, E.I. Romanyuk, A.A. Surkov // Ekonomika i predprinimatelstvo. 2016. № 11. S. 1118-1126.

13. Frenkel A.A., Volkova N.N., Surkov A.A. Povyshenie tochnosti prognozirovaniya na osnove obedineniya prognozov // Finansy: teoriya i praktika. 2017. T. 21. № 5. S. 118-127.

14. Sravnitelnyy analiz metodov postroeniya obedinennogo prognoza / A.A. Frenkel, N.N. Volkova, A.A. Surkov, E.I. Romanyuk // Voprosy statistiki. 2017. № 7. S. 17-27.

15. Surkov A.A. Primenenie metoda poparnykh sravneniy pri obedinenii ekonomicheskikh prognozov // Uchet. Analiz. Audit. 2019. T. 6. № 3. S. 32-42.

16. Granger C.W.J., Ramanathan R. Improved methods of combining forecasts // Journal of Forecasting. 1984. Vol. 3. P. 197-204.

17. Saati T.L. Prinyatie resheniy pri zavisimostyakh i obratnykh svyazyakh. Analiticheskie seti. M.: LKI, 2008. 360 s.

18. Rogachev A. Adaptivnoe prognozirovanie urozhaynosti zernovykh kultur // UEkS. 2005. №3. URL: https://cyberleninka.ru/artide/n/adaptivnoe-prognozirovanie-urozhaynosti-zernovyh-kultur (data obrashcheniya: 18.03.2020).

19. Petrushin V.N., Rytikov G.O. Formalizatsiya vremennogo ryada metodom dvoynogo sglazhivaniya // Elektronnyy zhurnal Cloud of Science. 2014. T. 1. № 2. S. 230-238.

20. Obzor otsenok kachestva modeley prognozirovaniya / M.V. Shcherbakov, A. Brebels, N.L. Shcherbakova, A.P. Tyukov // URL: https://docplayer.ru/62095596-Udk-bbk-obzor-ocenok-kachestva-modeley-prognozirovaniya.html (data obrashcheniya: 10.03.2020).

21. Oshibka prognozirovaniya: vidy, formuly, primery // https://shtem.ru/oshibka-prognozirovaniya-formula/ (data obrashcheniya: 10.03.2020).

22. Hyndman R.J., Koehler A.B. Another look at measures of forecast accuracy // International Journal of Forecasting. 2006. No 22(4). P. 679-688.

i Надоели баннеры? Вы всегда можете отключить рекламу.