Т.И. Грекова, Т. В. Филатова ПОСТРОЕНИЕ ТРЕНДОВЫХ МОДЕЛЕЙ ЭКОНОМИЧЕСКОЙ СИСТЕМЫ
Рассматривается один из подходов прогнозирования экономических показателей, основанный на построении трендовых моделей.
Задачами экономико-статистического прогнозирования являются выявление перспектив ближайшего или более отдалённого будущего в исследуемой области на основе реальных процессов деятельности; выработка оптимальных тенденций и перспективных планов с учётом составленного прогноза и оценки принятого решения с позиций его последствий в прогнозируемом периоде.
Временной ряд, динамический ряд (РД) - это последовательность упорядоченных по времени показателей, характеризующих уровень развития изучаемого явления. В составе динамического ряда в принципе можно выделить четыре компоненты:
1) общую тенденцию развития, или тренд;
2) регулярные колебания относительно тренда (типа циклов);
3) сезонные колебания;
4) остаток, или случайную компоненту, отражающую влияние разнообразных факторов стохастического характера.
Одной из важнейших задач исследования динамических рядов является установление общих закономерностей или тенденций развития. Для решения этой задачи используются разнообразные приемы уменьшения колеблемости динамического ряда (сглаживающие фильтры), среди которых можно выделить два основных метода: сглаживание ряда с помощью скользящей средней и аналитическое выравнивание. Аналитическое выравнивание динамического ряда - это метод выражения тенденций развития в виде функции изучаемого показателя от времени, называемой моделью тренда.
Рассмотрим задачу сглаживания ряда динамики, т. е. построение трендовой модели, на реальном примере, с целью применения модели для решения задач анализа и прогнозирования социально-экономических показателей. На рис. 1 представлены графически данные о продаже авиабилетов за 3 года (Ы = 36 - длина РД).
10000 1 9000 -8000 -7000 -6000 -5000 -4000 -
• •
1 4 7 10 13 16 19 22 25 28 31 34
Месяцы
Рис.1. Периодический ряд динамики продаж авиабилетов
Для этого РД характерны внутригодичные, повторяющиеся устойчиво из месяца в месяц изменения в уровнях. Это стационарный периодический РД, т.е. общей тенденции развития нет, но явно выделяется сезонная составляющая временного ряда и, естественно, случайная компонента. Поэтому для сглаживания данного РД будем использовать в качестве моделей про-
гноза мультипликативную модель и модель тригонометрического тренда - ряд Фурье [1].
Если в РД отсутствует тенденция, то уровень временного ряда рассматривается как функция сезонности и случайности: у1: = / (£, е), где у1 - фактические уровни РД, £ - сезонная составляющая, е - случайная компонента с математическим ожиданием Ее, = 0 и дисперсией Бе, = ст2 < ж, соу(е,, ек) = 0, V/ Ф к.
При мультипликативной модели уровень РД можно представить как произведение его составляющих:
У, = у •уу*1у) • [у,1у* ^,1 Ы, (1)
где отношение (у!/у) представляет собой коэффициент сезонности (К), а (у,/у,) - отражает влияние случайного фактора, у5 - средний уровень ряда соответствующего периода внутри года (месяца, квартала) за ряд лет.
Чем больше коэффициент сезонности, тем больше амплитуда колебаний уровней ряда относительно его среднего уровня, тем существеннее влияние сезонности. Чем меньше влияние случайной составляющей, тем в большей мере рассматриваемая модель адекватно описывает исходный РД. На рис.2 изображен коэффициент сезонности К, для каждого месяца.
Рис.2. Коэффициент сезонности Оценочные значения для модели (1) можно пред-
ставить в виде
у, = у • (К ),, г = 1, N.
(2)
Прогнозирование РД с помощью модели (1) сводится к прогнозированию среднего уровня (ур) с последующей корректировкой его на сезонную компоненту -умножение на К£ :
У, = уР • (К,),, , > Ы. (3)
Теоретически любой стационарный временной ряд может быть представлен как сумма среднего значения (у заменяется часто параметром а0) и ряда синусоид и косинусоид, что и называется рядом Фурье:
2п1 -П, ■ 2пг ...
(4)
у, = а0 + У а, ооэ —г-;— г + У Ъ, зіп—77-г + є,,
7! о і N 1 N
где а0, а,, Ь, - неизвестные параметры; п - число гармоник, , = , = 1, Ы.
Для решения задачи идентификации параметров данного уравнения применим классический метод наименьших квадратов (МНК) и дискретный фильтр Калмана.
Параметры уравнения (4), оцениваемые МНК, определяются формулами [1]
а0 = У у, /N = у,
2пі
2У у, соз-^г
. 2п1
2Уу,
(5)
' Ы ' Ы
Применим дискретный фильтр Калмана [2] для идентификации параметров ряда Фурье. Так как для (4) параметры а0, а,, Ь,, I = 1, п, должны быть постоянными, то модель динамической системы имеет вид х(к+1) = х(к), г(к) = Н(к) х(к) + п, (6)
где г(к) - известный выход (исходные значения ук), п -случайные погрешности измерения, шум на выходе с ковариацией Я (моделируется белым гауссовским шумом), х(к) - вектор состояния, к = 1, Ы, - момент времени. В качестве наблюдаемого процесса будем рассматривать
2п1
2п1
у(к) = а0 + У аі соз-^^к + У Ьі зіп —^ , что в приме
N
х(к)= [і
а0 а.
Ъ2 к ап
к У
-*0 “1 Ь1 а2 Оценка состояния системы, описываемой уравнениями (4), в момент времени к + 1 по наблюдениям г(1), г(2),..., г(к), которая минимизирует ковариацию ошибки оценки е(к)= б (к) - х(к), удовлетворяет рекуррентному уравнению
~ (к+1) = ~ (к)+Кф(к) (г (к) - 2 (к)),
2 (к) = Н(к) ~ (к)+п(к),
Г(к+1) = Г(к)-Г(к)Щк)(Н(к)Г(к)Н'(к)+Я)_1Н(к)Г(к), Кф(к) = Г(к)Н'(к)(Н(к)Г(к)Н'(к)+Я)-1, к= Щ (7)
где Г(к) - ковариация ошибки, Кф(к) - коэффициент фильтрации. В качестве начальных значений возьмём ~ (1)=[ 5000 0 0 0 0 ... 0 0 ]т, Г(1)=Г0.
Рассмотрим построение ряда Фурье (4) для исходных данных в обоих случаях с разным числом гармоник. Выбор ряда Фурье, который наилучшим образом отражает исходный временной ряд, основывался на расчёте коэффициентов детерминации Я2 (таблица), являющиеся критерием адекватности построенной модели, характеризующих так называемую долю «объяснённой» дисперсии (чем ближе Я2 к 1, тем лучше выбрана модель). Коэффициент детерминации определяется как
У (у, - у, )2/( N - р)
Я 2 =1 - 4--------------------,
У (у, - у)2/( Ы -1)
,=1
где р - число оцениваемых параметров.
Коэффициент детерминации для уравнений с разным числом гармоник
(9)
1=1 1 4 1=1
нении к оцениванию по методу фильтрации Калмана-
Бьюси можно записать для каждого момента времени к
следующим образом: у(к)= Н(к)х(к), где
2п 2п 2 • 2п 2 • 2п
Н(к) = [1 сое—к б1п—к соэ——— к б1п—— к ...
Ы Ы Ы Ы
2пп , . 2пп „ соэ-^к эш-^к] - матрица измерений,
Число гармоник К2, при применении МНК К2, при применении фильтра Калмана
3 0,65893 0,65878
4 0,74412 0,74388
5 0,74493 0,74523
6 0,80935 0,81259
7 0,80775 0,81028
Таблица показывает, что уже уравнение с четырьмя гармониками хорошо описывает исходный РД, но в качестве модели прогноза возьмём ряд Фурье с шестью гармониками (что характерно для сезонных колебаний), который объясняет 81 % вариации уровней. Для мультипликативной модели (2) коэффициент детерминации равен 0,732618.
Оценочные значения для модели тригонометрического тренда (4) имеют вид
6 2 Пі 6 * 2 Пі
у(к) = а0 +У а. соз2ік + У Ъ. Зіп2ік,
п 0 « ' N £ 1 N ’
(8)
Полученные оценки коэффициентов ряда Фурье (4) методами МНК и дискретным фильтром Калмана мало отличаются друг от друга, поэтому для дальнейших исследований выбрана модель (8) с параметрами, оценки которых были получены с помощью фильтра Калмана.
Графики выровненных динамических рядов по моделям (2) и (8) приведены на рис. 3.
• фактические значения месяцы т „ __
......сглаженный РД по модели (2)
-------сглаженный РД по модели (8)
Рис. 3. График исходных и сглаженных значений по формулам (2) и (8)
Исследуем полученные остатки (разность между на- го отклонения стє =633,5933 и стє =428,5408 соответствен-
блюдаем^іми и шдельны^ значениями) моделей (2) и (8). но для моделей (2) и (8). Рассмотрим гипотезу о согласии
Выборочное среднее Еєї0 ; оценка среднеквадратическо- распределения остатков с нормальным распределением. На
рис. 4 изображены гистограммы (оценка плотности распределения) остатков моделей (2) и (8) с наложенной на них плотностью нормального распределения.
обычно а = 0,05) и числом степеней свободы/ = Ы - к; £ -колеблемость уровней РД относительно полученного тренда, которая определяется формулой
£2 =Е (у, - у )2/(ы - к),
(7)
где к - число параметров в уравнении тренда; I - глубина предсказания (период упреждения); у12 - границы интервала предсказания.
Построенные доверительные интервалы содержат исходный РД с заданной доверительной вероятностью у = 1- а = 0,95. Результаты прогнозирования и построения интервала предсказания изображены на рис. 5.
Рис. 4. Гистограммы остатков построенных моделей (2) и (8) соответственно
Значение статистики х2=1,76335 и вероятности р = = 0,62294 для остатков модели (2), х2=1,8707 и вероятности р = 0,599966 для остатков модели (8); критиче-
2
ское значение распределения хи-квадрат %0 с параметрами 1-а/2 (а - заданный уровень значимости, а = 0,05) и числом степеней свободы/= 3 х2 =7,81. Так как %2< ,
то нет оснований отвергать гипотезу о нормальном распределении остатков модели на уровне значимости а = = 0,05. Аналогичный вывод можно сделать по значениям вероятностей. Так как вероятность р неправильного отвержения гипотезы, когда она верна, довольно большая, то гипотеза о нормальности остатков моделей (2) и (8) принимается на уровне значимости а = 0,05.
Если предположить, что структура наблюдаемого процесса существенно не изменится в ближайшем будущем, то, используя одну из построенных моделей - либо мультипликативную, либо ряд Фурье - можно построить прогноз количества продаж авиабилетов на следующий год. На основе полученного уравнения тренда даётся точечная оценка прогноза. Однако более надёжный прогноз предполагает оценку его в интервале предсказания, который определим как доверительный интервал для предсказанного значения:
у1,2 = у,+1 + ,0 £ , (6)
где ,0 - табличное значение распределения Стьюдента с параметрами: 1- а/2 (а - заданный уровень значимости,
с построенным прогнозом по моделям (3) и (8)
Итак, в поставленной задаче для построения трендовой модели использованы мультипликативная модель и ряд Фурье, параметры которого оценивались с применением фильтра Калмана и по МНК. Сравнительный анализ результатов моделирования для конкретного числового примера - объемов продаж авиабилетов - подтверждает применимость предложенных подходов построения трендовых моделей и обеспечивает высокое качество аппроксимации данных и прогнозирования поведения экономической системы.
Использование трендовых моделей хозяйствующими субъектами позволит получить значительный экономический эффект, так как организация может заблаговременно просчитать возможное развитие событий, например при увеличении объемов продаж авиабилетов организовать дополнительные авиарейсы на маршрутах, по которым ожидается увеличение потока пассажиров.
ЛИТЕРАТУРА
1. Статистика: Учебник / Под ред. проф. И.И. Елисеевой. М.: ООО «ВИТРЭМ», 2002.
2. Брамер К., Зиффлинг Г. Фильтр Калмана-Бьюси. М.: Наука, 1982.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 20 апреля 2004 г.
-1480 -11би -84и -52и -2ии 120 44и 760 Ю8и 14Ш 1/20
540 -1320 -1000 -680 -360 -40 280 600 920 1240 1560
330 550 770 990
220 440 660 880
-440