Научная статья на тему 'Прогнозирование временных рядов с регулярными циклическими компонентами с помощью модели периодически коррелированных случайных процессов'

Прогнозирование временных рядов с регулярными циклическими компонентами с помощью модели периодически коррелированных случайных процессов Текст научной статьи по специальности «Математика»

CC BY
855
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННЫЕ РЯДЫ / ПРОГНОЗИРОВАНИЕ / ЭКСТРАПОЛЯЦИЯ / ПЕРИОДИЧЕСКИ КОРРЕЛИРОВАННЫЙ СЛУЧАЙНЫЙ ПРОЦЕСС / СЕЗОННАЯ МОДЕЛЬ АРПСС / TIME SERIES / FORECAST / EXTRAPOLATION / PERIODIC-CORRELATED STOCHASTIC PROCESS / SEASONAL ARIMA

Аннотация научной статьи по математике, автор научной работы — Игнатов Николай Анатольевич

Предложен метод прогнозирования временных рядов с регулярными циклическими компонентами, основанный на модели периодически коррелированных случайных процессов. Прогноз, получаемый с помощью предложенного метода, сравнивается с результатами прогнозирования сезонной моделью АРПСС. Результаты сравнения позволяют сделать вывод об эффективности применения предложенного метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Forecasting Periodic Time Series with Periodic-Correlated Stochastic Process Model

This article introduces a method of forecasting time series with regular periodic components based on a periodic-correlated stochastic process model. Forecast computed with periodic-correlated model is compared with results of a seasonal ARIMA model. The results show effectiveness of introduced model.

Текст научной работы на тему «Прогнозирование временных рядов с регулярными циклическими компонентами с помощью модели периодически коррелированных случайных процессов»

ЗД. Игнатов

ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ

С РЕГУЛЯРНЫМИ ЦИКЛИЧЕСКИМИ КОМПОНЕНТАМИ С ПОМОЩЬЮ МОДЕЛИ ПЕРИОДИЧЕСКИ КОРРЕЛИРОВАННЫХ СЛУЧАЙНЫХ ПРОЦЕССОВ

Временные ряды с регулярными циклическими компонентами. Прогнозирование временного ряда общего вида основано на его декомпозиции на трендовую, циклическую и случайную компоненты. Выбор и применение одной из известных в настоящее время математических моделей прогнозирования связаны, в первую очередь, с определением степени статистической значимости каждой из данных компонент (доли дисперсии компоненты в дисперсии временного ряда) и степени ее регулярности (параметры регулярных компонент меняются сравнительно медленно, закон их изменения известен или возможно получение его достоверной оценки).

Для определенных временных рядов наибольшую статистическую значимость могут иметь регулярные циклические компоненты.

Трендовая компонента в таких рядах, как правило, имеет постоянные либо сравнительно медленно меняющиеся параметры, проблем с построением ее модели, оценкой параметров и прогнозированием, как правило, не возникает, случайная же компонента либо имеет малую статистическую значимость, либо также носит циклический характер.

Природа таких временных рядов может быть самой разной [1-3]. Примерами могут служить помесячные значения индексов промышленного производства; почасовые объемы выработки электрической и тепловой энергии объектами генерации (как для отдельных объектов генерации, так и для региональных рынков) и, как следствие, цена 1 кВт-ч электрической энергии на нерегулируемом рынке РФ; ежедневные объемы продаж некоторых товаров, пользующихся преимущественно сезонным спросом; помесячные объемы пассажирских перевозок и множество других.

Теория случайных процессов классифицирует такие временные ряды как реализации квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами.

Прогнозирование квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами целе-

4 61

сообразно осуществлять посредством математических моделей, позволяющих учесть эти периодические компоненты в явном виде.

Предположим, что исходные данные для прогнозирования представляют собой реализацию исследуемого случайного процесса Х(?), заданную N значениями с некоторым интервалом дискретизации Д:

Х(4), к=0.^, 4+1-4 = Д. (1)

При этом интервал дискретизации, очевидно, должен быть меньше предполагаемого периода циклической компоненты. Кроме того, он должен позволять отследить периодические закономерности (так, при предполагаемом периоде циклической компоненты, равном одному году, целесообразно интервал дискретизации брать равным, по крайней мере, одному месяцу, а при предполагаемом периоде циклической компоненты, равном одним суткам - одному часу).

Объем исходных данных в этом случае должен позволять исследовать как минимум несколько периодов циклической компоненты (по аналогии с исследованием обычного эргодического случайного процесса, когда исходная выборка должна быть в несколько раз больше, чем период затухания его автокорреляционной функции [4]).

Выбор слишком малого интервала дискретизации значительно увеличивает объем исходных данных и затрудняет их обработку - оценку статистических характеристик и непосредственно прогнозирование. Например, при периоде циклической компоненты, равном одному году (циклическая компонента в таком случае носит сезонный характер), выбор интервала дискретизации, равному одному часу, вряд ли будет целесообразен, поскольку периоду будут соответствовать 8760 точек исходного ряда, а требование к объему исходных данных означает выборку, размер которой должен составлять несколько десятков (или сотен) тысяч точек, что не только неоправданно замедлит обработку, но и затруднит, собственно, поиск и исследование периодических закономерностей.

Сделанные выше допущения о высокой степени регулярности трен-довой компоненты в рассматриваемых временных рядах позволяют при прогнозировании соответствующих квазистационарных случайных процессов разделить прогнозирование их центрированных стохастических компонент (с нулевым математическим ожиданием) и прогнозирование их неслучайных составляющих в виде трендовых компонент.

Прогнозирование на основе модели периодически коррелированных случайных процессов (ПКСП). Предлагаемый в работе метод прогнозиро-

78

вания предполагает аддитивное представление временных рядов :

78 Этот метод принципиально допускает обобщение также на случай мультипликативного представления. Его допустимость и способы реализации подробно рассмотрены в [1, 2].

462

X(t) = XT(t) + X(), (2)

где XT(t) - трендовая, a Xc(t) - стохастическая компонента. Стохастическая компонента в рамках предлагаемого метода включает в себя и циклическую компоненту.

Критерий качества прогноза определен как минимизируемый средний квадрат ошибки прогнозирования.

Q(t) = M[E2(t)], (3)

где E(t) - ошибка прогноза.

Исходя из сделанных допущений о классе прогнозируемые временных рядов, трендовая компонента адекватно описывается линейным уравнением:

Xö(t, ao, bo) = ao + bot, (4)

и содержит только линейные параметры.

Поскольку в качестве критерия качества прогнозирования выбран критерий минимума среднего квадрата ошибки, оценивать параметры трендовой компоненты также следует исходя из аналогичного критерия:

'max

Qm (ao, bo) = ( Z X (t ) - XT (tt, ao, bo))/(/max - 'min), (5)

' = 'min

что эквивалентно несмещенной оценке дисперсии стохастической компоненты на интервале оценки параметров трендовой компоненты [imin, imax].

С учетом характера выбранного критерия оптимальности (4), используя метод наименьших квадратов (приравнивая производные критерия по линейным параметрам к нулю, и решая полученную систему алгебраических линейных уравнений), можно получить известные соотношения [5] для оценок коэффициентов линейного тренда:

'max

Z t' Z X (t' ) - ('max - 'min + 1) Z X (t, )t,

bonux = L!m

max max max

Z t' Z t' - ('max - 'min + 1) Z tf (6)

«Оопт = ( У X(t ) - Ь0 У t )/(i - i + 1),

иош у / ^ v i / 0 опт / 2 i / V max mm ' '

i =imin i=imin

Исходя из выбранного представления (2), стохастическая компонента временного ряда определяется соотношением

Xc(t) = X(t) - XT(t), (7)

и представляет собой центрированный случайный процесс, который, в силу сделанных ранее допущений является квазистационарным и содержит регулярные стохастические периодические компоненты.

4 63

Предлагаемый в настоящей работе метод прогнозирования квазистационарных случайных процессов с регулярными стохастическими периодическими компонентами основан на статистической модели периодически коррелированных случайных процессов (ПКСП) [3], представляющих собой частный случай периодически нестационарных в широком смысле слова случайных процессов. Такая модель процесса предполагает, что для его автокорреляционной функции Дх(?1, х2) выполняется следующее условие:

ад+Т х2+т) = (8)

Одним из свойств ПКСП, очевидно вытекающих из (8), является то, что последовательность

£(Хо, к) = Х(Хо + кТ), 0<Го<Т, к = 0,1,..«>, (9)

т.е. последовательность отсчетов его значений относительно некоторого начального значения х0с[0, Т) с интервалом, равным периоду его автокорреляционной функции, является эргодической [4].

Из этого следует, что оценку автокорреляционной функции случайного процесса при рассмотрении его как периодически коррелированного можно получить по одной продолжительной реализации, несмотря на то, что с точки зрения классической теории он является нестационарным.

Автокорреляционная функция случайного процесса определяется [4] соотношением:

ВД^) = М№) - т^ОХВД - ш»] =

Ц (Х1 - Шх{Н))(Х2 - ш^))У(Х1,Х2,?1,?2) йххйх2,

(10)

где шх(Х) - математическое ожидание случайного процесса в момент времени X, _/(х1,х2,?1,?2) - двумерная плотность распределения вероятности случайного процесса для моментов Х1 и х2.

Учитывая приведенное выше определение автокорреляционной функции (10), свойство (8) и эргодичность последовательности (9), можно получить следующее выражение для определения автокорреляционной функции ПКСП путем усреднения по времени любой его продолжительной реализации х(Х) с учетом интервала периодичности Т его автокорреляционной функции: 1 К

ад^Н™жК (х(Х1+кТ)-шх(Х1+кТ))(х(Х2+кТ)-шх(Х2+кТ)). (11)

Формула оценки автокорреляционной функции ПКСП по реализации, представленной дискретной выборкой конечной длины с учетом (1) и (11) будет выглядеть следующим образом:

464

2 ((/'А+кТ) - тХ (/'А+кТ)))(/Д+кТ) - тХ (/А+кГ}) =к=0-;-' „ ^

ктах (12)

ГДе ктах

(N - тах(/, /))Д

Г

Предлагаемый метод предполагает формализацию задачи прогнозирования случайного процесса по критерию минимума среднего квадрата ошибки в виде задачи поиска оптимального по критерию минимума среднего квадрата ошибки оператора (в нашем случае, прогнозирующего). Эта задача - одна из наиболее распространенных среди задач статистической оптимизации систем управления.

Оптимальным оператором в классическом понимании называется такой оператор, который обеспечивает экстремальное значение некоторого критерия качества функционирования оптимальной системы, на вход которой поступает известный случайный процесс Х(0.

Постановка задачи прогнозирования предполагает, что на выходе этой системы нужно получить заданный требуемый выходной сигнал Х^+у), равный сформированному на интервале у выходному сигналу, в то время как на самом деле система формирует некий реальный выходной сигнал 7(?). Разность идеального и реального выходного сигналов, очевидно, возникает вследствие невозможности точно предсказать будущее процесса.

Ошибка прогнозирования определяется в этом случае соотношением Е(0 = 7(0 - Х(*+у). (13)

В качестве характеристики процесса Е(0 и критерия качества функционирования системы выбран средний квадрат ошибки:

0(0 = М[Е2(01 = М\_т - Х(?+у))2]. (14)

Критерий 0(0 является квадратичной функцией, что позволяет минимизировать его аналитически.

Пусть на вход оптимизируемой системы на интервале [?0, ?] поступает скалярный случайный процесс - сигнал Х(0 с известными статистическими характеристиками. Реализуя некоторое преобразование А входного сигнала, система формирует выходной сигнал 7(0 = А{Х(0}. Решая задачу поиска оптимального преобразования А , обеспечивающего минимум критерия 0, методами вариационного исчисления (решение подробно рассматривается в [3]), можно получить общее условие оптимальности:

А{Х(0} = ЩХ(?+у) / х(т)], те[?о, (15)

Это соотношение показывает, что оптимальное преобразование есть условное математическое ожидание вектора требуемого выход-

465

ного сигнала Х(х+у) при условии наблюдения на интервале [Х0, X] некоторой реализации х(т) входного сигнала Х(Х).

Ограничивая процесс поиска оптимального по условию (15) оператора классом линейных, физически реализуемых, нестационарных операторов и учитывая, что в этом случае

t

7(0 = Л{Х(?)} = | а(Х, т)Х(т) От, (16)

t0

где а(Х,т) - импульсная весовая функция оптимальной системы, из необходимого и достаточного условия минимума критерия Q можно вывести интегральное уравнение Винера для оптимального по критерию минимума (14) прогнозирующего устройства (экстраполято-ра) на интервал прогнозирования у: t

| а(Х, ?2) Кх(Х2, ?:) О?2 = Ых+у, ?:), ?0 < ?1 < X, (17)

причем неоднородная компонента в данном уравнении не учитывается в силу (7).

Подстановка в уравнение (17) автокорреляционной функции случайного процесса в виде автокорреляционной функции периодически коррелированного случайного процесса (8) и позволяет получить импульсную весовую функцию оптимальной прогнозирующей линейной системы, учитывающую наличие в прогнозируемом случайном процессе Х(Х) регулярных стохастических периодических компонент.

Дискретизируя выражение (16) с учетом (1), получаем уравнение оптимального по критерию минимума среднего квадрата ошибки прогноза процесса Х(Х) из точки с индексом г на интервал у с помощью линейного экстраполятора, учитывающего п+1 значение известной реализации процесса:

7 (Г,) = ¿а к (у) ~(х-к ), (18)

к=0

где коэффициенты ак(у) определяются из системы линейных уравнений, которую можно записать, дискретизируя уравнение (17) с учетом соотношений (1) и (18):

п У

¿а к (у)Кх(Х,_к,Хи) =Кх (X, , Хи ), 0< 1 <п. (19)

к=0 д

Учет регулярных стохастических периодических компонент при прогнозировании случайного процесса Х(Х) с помощью соотношений

466

(18) и (19) обеспечивается расчетом оценки автокорреляционной функции прогнозируемого процесса по формуле (12).

По аналогии с общим случаем, рассматриваемым в [4], можно оценить минимальное теоретически возможное в классе линейных оптимальныгс преобразований значение среднего квадрата ошибки прогноза для рассматриваемого прогнозируемого процесса:

Qmm(0 = DXit+i) - Dj(t). (20)

С учетом того, что априорных данных об автокорреляционной функции прогнозируемого процесса нет, и в основе решения уравнения Винера лежит ее оценка, на практике возможно получить лишь оценку значения критерия прогнозирования.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Малые ошибки при определении исходных данных, в частности, оценки автокорреляционной функции прогнозируемого процесса, могут привести при возрастании интервала функционирования прогнозирующей системы к существенным ошибкам при определении импульсной весовой функции оптимальной системы, что необходимо учитывать, ограничивая по возможности интервал функционирования прогнозирующей системы [4], или, иначе говоря, ограничивать число сечений, на основании которых осуществляется прогноз.

Сезонная модель АРПСС. Одной из наиболее распространенных и эффективных современных моделей для прогнозирования временных рядов c регулярными циклическими компонентами является сезонная модель АРПСС (Season ARIMA, SARIMA) [6, 7].

Сезонная модель АРПСС представляет собой естественное развитие и обобщение обычной модели АРПСС на ряды, в которых имеется циклическая сезонная компонента. В дополнение к несезонным параметрам порядка авторегрессии, скользящего среднего и разности в сезонную модель АРПСС вводятся дополнительные сезонные параметры авторегрессии, скользящего среднего и разности для определенного лага (фактически - интервала сезонности, устанавливаемого на этапе идентификации порядка модели).

Формально уравнение прогноза процесса X(t) на интервал, кратный периоду T циклической (или сезонной) компоненты, посредством авторегрессионной компоненты сезонной модели АРПСС можно записать следующим образом:

n

м^) = Za kX (w ь (21)

k=0

где коэффициенты регрессии ak определяются методом наименьших квадратов, исходя из минимума среднего квадрата ошибки прогнозиро-

467

вания, либо с помощью известных соотношений [7] (например, уравнения Юла-Уолкера, или методом максимального правдоподобия).

Компонента скользящего среднего в соотношении (21) отсутствует в силу ее двойственности компоненте авторегрессии, доказанной в [6], а взятие несезонной разности общего вида уравнения прогноза не меняет.

Сравнение предлагаемого метода и сезонной модели АРПСС. Можно показать, что прогнозирование по критерию минимума среднего квадрата ошибки методом непосредственного решения интегрального уравнения Винера полностью эквивалентно прогнозированию моделью АРПСС с точки зрения теоретического значения критерия прогнозирования для случайного процесса с автокорреляционной функцией произвольного вида [4, 7].

Исходя из этого, можно сделать вывод, что для периодически коррелированные случайных процессов (фактически - случайных процессов с автокорреляционными функциями специального вида) предлагаемый метод с точки зрения теоретического значения критерия среднего квадрата ошибки прогнозирования также будет эквивалентен сезонной модели АРПСС.

Очевидно, что при решении реальные задач значения оценок критерия будут отличаться от его теоретических значений, во-первых, в силу ограниченности интервала, на котором наблюдается реализация прогнозируемого процесса и осуществляются оценки, и, во-вторых, в силу того, что прогнозируемый процесс является квазистационарным, и его статистические характеристики, в отличие от строго стационарного, медленно, но меняются, что в итоге также влияет на точность оценок.

Сравнивая соотношения (18) и (21) можно заметить, что сезонная модель АРПСС предполагает стационарность связи между сечениями процесса, отстоящими от точки, из которой осуществляется прогнозирование на интервалы, кратные периоду циклической компоненты. При этом статистические связи между другими сечениями процесса не учитываются. Это происходит вследствие того, что сезонная модель АРПСС использует операцию взятия разности с лагом, равным периоду циклической компоненты [7], что, фактически, означает отбрасывание значительной части исходных данных при непосредственном прогнозировании.

Предлагаемый метод, напротив, учитывает статистические связи между всеми доступными для исследования сечениями прогнозируемого процесса. При решении реальных задач, это, с одной стороны, приводит к увеличению числа сечений, учитываемых при прогнозе (для фиксированного временного интервала автокорреляции число учитываемых

468

сечений увеличивается пропорционально периоду Т), но с другой, предъявляет более жесткие требования к степени стационарности статистической связи между сечениями прогнозируемого процесса, отстоящими друг от друга на интервалы, не кратные периоду циклической компоненты (в отличие от сезонной модели АРПСС).

Обобщая сказанное, можно сделать вывод, что на практике применение предложенного метода при условии выполнения требований к степени стационарности прогнозируемого процесса должно приводить к меньшим (более близким к теоретическим значениям) оценкам ошибки прогнозирования по сравнению с оценками ошибки прогнозирования при применении сезонной модели АРПСС.

Исходные данные для анализа и прогнозирования. Исходными данными для анализа и прогнозирования выступают реализации случайных процессов (временные ряды), представленные в табл. 1.

Описание исходных данных

Таблица 1

№ пп

Наименование

Объемы продаж коммерческой организации по одному из сезонных видов

товаров Цена 1 кВт-ч на нерегулируемом рынке электрической энергии РФ

Индекс выпуска товаров и услуг по базовым видам деятельности Российской Федерации, в % к предыдущему периоду

Интервал дискрети зации 1 сутки

1 час

1 месяц

Объем выборки

212 точек

10991 точка (июль 2008 - декабрь 2009)

83 точки (февраль 2003 -декабрь 2009)

Источник данных

ГК "ЮНЭКТ"

ОАО «АТС» (Администратор Торговой Системы) Федеральная служба государственной статистики Российской Федерации

2

3

Графики, демонстрирующие участки реализаций, по которым можно качественно оценить характер и поведение данных случайных процессов, приведены на рис. 1.

Качественно данные процессы можно охарактеризовать как квазистационарные случайные процессы с постоянным математическим ожиданием. Помимо этого на графиках реализаций данных процессов видно существенное влияние периодических факторов, т.е. в данных случайных процессах присутствует циклическая компонента.

469

Объем продаж

Индекс выпуска товаров и услуг, %

120 и 110 100 90

1, мес.

80

70

Рис. 1. Графики реализаций рассматриваемых случайных процессов

Характер этой циклической компоненты может быть как детерминированным, так и стохастическим, тем не менее, с точки зрения стороннего наблюдателя, влияние которого на ход данных процессов пренебрежимо мало, данная циклическая компонента, скорее, является стохастической, так как точное значение процесса в будущем наблюдатель предсказать не может.

Анализ исходных данных. Исследовать периодические закономерности, как известно, целесообразно в частотной области. На рис.

470

2 приведены оценки спектральных плотностей исследуемых случайных процессов, полученные периодограммным методом [7].

На первом графике рис. 2 виден максимум в области частоты, соответствующей периоду 7 дней, на втором - максимумы в области частот, соответствующих периодам 24 часа и 168 часов (1 неделя), на третьем -максимумы в области частот, соответствующих периодам 12 и 4 месяцев.

Спектральная плотность

60 -50 -40 -30 } 20 10 0

Спектральная плотность [Цена 1 МВтч]

250000

200000

150000 -

100000 -

50000

Спектральная плотность [Индекс выпуска товаров и услуг]

250 200 -150 -100 -50 0

w

0

w

w

Рис. 2. Графики оценок спектральных плотностей рассматриваемых случайных процессов

4 71

Таким образом, спектральный анализ подтверждает сделанные выше на основе результатов качественного анализа предположения о наличии регулярных периодических компонент в данных процессах.

Вопрос выбора величины периода циклической компоненты T как параметра ПКСП решается однозначно в случае, когда спектральная плотность имеет один ярко выраженный максимум.

Если таких максимумов несколько, то величину T целесообразно соотносить с интервалом прогнозирования у. Если y>>T (интервал прогнозирования значительно превосходит интервал периодичности автокорреляционной функции ПКСП), влияние компонент с периодом T на интервале y при прогнозировании может быть не столь существенным, что ставит вопрос о необходимости их учета в принципе.

В обратном случае, когда y<T, необходимо соотносить T с объемом исходных данных с учетом рекомендаций, которые были даны выше.

Обоснование возможности применения модели ПКСП для анализа и прогнозирования случайного процесса фактически заключается в проверке выполнения свойства (9), если оно выполняется, то выполняется и условие (8), следовательно, автокорреляционную функцию такого процесса можно определить выражением (8) и использовать формулу (12) для ее оценки.

Проверка свойства (9) по достаточному условию эргодичности [4] показала, что оно выполняется для всех исследуемых процессов (для первого при T=7 суток, для второго при T=24 часа и T=168 часов, для третьего при T=3 месяца и T=12 месяцев).

Моделирование процесса прогнозирования. Линейный оптимальный экстраполятор, построенный в соответствии с соотношениями (5), (10) и (11) на базе модели ПКСП, а также сезонная модель АРПСС реализованы в программном комплексе, разработанном на языке программирования Object Pascal.

С целью сравнения эффективности предлагаемого метода прогнозирования на основе модели ПКСП с сезонной моделью АРПСС проведено моделирование процесса прогнозирования для трех рассматриваемых случайных процессов.

Моделирование процесса прогнозирования осуществлялось по следующему известному алгоритму [5]:

• оценка статистических характеристик процесса (постоянное математическое ожидание и автокорреляционная функция ПКСП) для каждой текущей точки (точки, из которой осуществлялось прогнозирование на текущем шаге) на предшествующем ей интервале;

472

• прогнозирование на интервал у вперед посредством модели ПКСП и сезонной АРПСС;

• расчет значений ошибки;

• выбор в качестве текущей точки, следующей после текущей.

Алгоритм, очевидно, является итерационным и повторяется до тех

пор, пока не будут получены значения ошибки для всех точек на заданном интервале моделирования. После завершения работы алгоритма оценивались статистические характеристики ошибки прогнозирования -математическое ожидание, дисперсия и средний квадрат ошибки (20).

Величина периода Т как параметра ПКСП выбиралась исходя из исследований, проведенных в предыдущем разделе.

Возникает необходимость регуляризации прогнозирующей модели, в первую очередь, для приближения выборочных значений критерия прогнозирования к минимальному теоретически возможному.

Прогнозирование на основе уравнения Винера обеспечивает теоретическую оптимальность прогнозирующей системы, иначе говоря, минимум среднего квадрата ошибки прогнозирования для идеальных условий (оценки автокорреляционной функции совпадают с самой автокорреляционной функцией, в прогнозируемом процессе отсутствуют нерегулярные составляющие). Очевидно, что на практике идеальные условия нереализуемы, что существенно влияет на получаемые на практике значения оценок критерия прогнозирования.

Существует множество способов регуляризации прогнозирующей модели [5]; одним из распространенных и эффективных способов является введение внешнего критерия регулярности. Зависимость внешнего критерия регулярности от параметра регуляризации при этом должна обеспечивать возможность оптимизации прогнозирующей модели по данному критерию с небольшой вычислительной сложностью, в идеале - быть унимодальной функцией параметра регуляризации.

В рамках решения поставленной задачи предлагается использовать указанный выше факт, что для ограничения влияния накопления ошибок оценок статистических характеристик случайного процесса на результаты прогнозирования целесообразно ограничивать интервал функционирования линейного экстраполятора.

Дополнительно осуществлялась регуляризация прогнозирующей модели по критерию регулярности [5]. В результате моделирования получаем оценку среднего квадрата ошибки прогнозирования в зависимости от параметра регуляризации - числа точек, используемых для построения прогноза (обозначенного п в соотношении (18)).

473

С помощью алгоритма, описанного выше, моделирование процесса прогнозирования осуществлялось на интервале исследования для п = 1,2,.. 10. Регуляризация прогнозирующих моделей непосредственно заключалась в выборе прогноза обеспечивающего минимум критерия регулярности при соответствующем п.

Оптимальное значение параметра регуляризации п во всех случаях оказалось больше 2. Поскольку п аналогично порядку авторегрессии модели АРПСС, можно сделать вывод, что периодические закономерности, описываемые предлагаемой моделью, вряд ли могут быть описаны моделью АРПСС в силу существующих трудностей оценивания этих моделей высоким порядком авторегрессии [7].

Графики, показывающие результаты моделирования процесса краткосрочного прогнозирования моделью ПКСП и сезонной моделью АРПСС приведены на рис. 3 для объема продаж при у = 1 сутки и Т = 7 суток, на рис. 4 для цены 1 кВт-ч на нерегулируемом рынке при у = 24 часа и Т = 24 часа и на рис. 5 для индекса выпуска товаров и услуг при у = 12 месяцев и Т = 12 месяцев.

Объемы продаж

30 25 -20 -15 -10 -5 0

150 155 160 165 170 175 180 185 190 195 200 205 210

1, сутки

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а)

Объемы продаж

5

0

150 155 160 165 170 175 180 185 190 195 200 205 210 1, сутки

б)

Рис. 3. Прогнозирование объемов продаж (-)

сезонной моделью АРПСС(—) (а) и моделью ПКСП (-----) (б)

474

Руб./МВт ч

950

г, ч.

Руб./ МВт ч

Рис.4. Прогнозирование цены 1 кВт-ч (-) на нерегулируемом рынке сезонной

моделью АРПСС (а) (-—) и моделью ПКСП (б) (-—)

Индекс выпуска товаров и услуг, %

105 -

85 -

65 -

г, мес.

а)

Индекс выпуска товаров и услуг, %

105 -

85 -

65 -

г, мес.

б)

Рис. 5. Прогнозирование индекса выпуска товаров и услуг (-) сезонной

моделью АРПСС (а) (----- ) и моделью ПКСП (б) (----- )

475

На всех графиках реализации исходных процессов отображаются линиями темного цвета, результаты прогнозирования - линиями светлого цвета.

Результаты сравнения модели ПКСП и сезонной АРПСС на основе статистических характеристик ошибок прогнозирования для рассматриваемых случайных процессов приведены в табл. 2.

Таблица 2

Результаты сравнения модели ПКСП и сезонной АРПСС

Сезонная АРПСС

Тест

Оценка

МО ошибки

Оценка дисперсии ошибки

Модель ПКСП

Оценка Оценка

МО дисперсии ошибки ошибки

Уменьшение дисперсии ошибки модели ПКСП относительно сезонной АРПСС, %

Прогнозирование объемов продаж коммерческой организации по одному из сезонных видов товаров на интервал 1 сутки -0,3 11,37 -0,29 7,58 33 Прогнозирование цены 1 кВт-ч на нерегулируемом рынке электрической энергии РФ на интервал 24 часа 10,36 3408,51 9,52 3016,89 11,5 Прогнозирование индекса выпуска товаров и услуг по базовым видам деятельности РФ, в процентах относительно предыдущего периода на интервал 12 месяцев -0,4 11,22 -0,38 9,14 18,5

Результаты сравнения показывают, что предложенный метод прогнозирования временных рядов с регулярными циклическими компонентами на основе модели ПКСП обеспечивает меньший средний квадрат ошибки прогнозирования, чем сезонная модель АРПСС, что подтверждает сделанное выше на основании теоретических выкладок предположение об эффективности предложенного метода.

Более жесткие требования предложенного метода к степени стационарности случайного процесса на интервале оценки параметров модели и прогнозирования, чем у сезонной модели АРПСС, при решении рас-

476

смотренных задач прогнозирования временных рядов с регулярными циклическими компонентами различной физической природы не привели к ухудшению результатов. Данное утверждение справедливо как с точки зрения оценок значений среднего квадрата ошибки прогнозирования, так и с точки зрения полученных реализаций прогнозов, степень стационарности которых соответствует степени стационарности соответствующих прогнозируемых процессов. Очевидно, это обеспечивается проведенной при моделировании процесса прогнозирования дополнительной регуляризацией прогнозирующих моделей по критерию минимума оценки среднего квадрата ошибки прогнозирования по параметру числа точек, используемых для построения прогноза.

Следовательно, можно сделать вывод о значительной эффективности применения предложенного метода в процессе принятия решений, опирающихся на прогнозные значения тех или иных временных рядов, содержащих регулярные циклические компоненты.

Литература и информационные источники

1. Кендэл М. Временит ряды. М.: Финансы и статистика, 1981.

2. Орлов Ю.Н., Осминин К.П. Нестационарные временные ряды: Методы прогнозирования с примерами анализа финансовых и сырьевых рынков. М.: URSS, 2011.

3. Драган ЯП. Периодические и периодически нестационарные случайные процессы // Отбор и передача информации. Киев: Наук. думка, 1985. Вып. 72. с. 3-17.

4. Росин М.Ф., Булыгин B.C. Статистическая динамика и теория эффективности систем управления. М.: Машиностроение, 1981.

5. Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными системами. Киев: Техн1ка, 1975.

6. Бокс Д.Ж., Дженкинс Г. Анализ временных рядов, прогноз и управление, М.:1974.

7. Боровиков В.П., Ивченко Г.И. Прогнозирование в системе STATISTICA в среде

WINDOWS. М.: Финансы и статистика, 2006.

4 77

i Надоели баннеры? Вы всегда можете отключить рекламу.