© Семёнычев В. К., Павлов В. Д., Семёнычев В. В., 2009
СЕМЁНыЧЕВ Валерий Константинович
Доктор экономических наук, доктор технических наук, профессор, ректор
Самарский муниципальный институт управления
443084, РФ, г. Самара, ул. Стара Загора, 96 Контактные телефоны: (846) 951-54-66, (917) 107-54-32 e-mail: [email protected]
ПАВЛОВ Владимир Дмитриевич
Аспирант кафедры математических методов в экономике
Самарский государственный аэрокосмический университет
443086, РФ, г. Самара, Московское шоссе, 34а Контактный телефон: (902) 292-69-35
СЕМЁНыЧЕВ Виталий Валерьевич
Аспирант кафедры экономики и управления городским хозяйством
Самарский муниципальный институт управления
443084, РФ, г. Самара, ул. Стара Загора, 96 Контактный телефон: (846) 243-69-62
Моделирование и прогнозирование временного ряда суммой логистической, линейной и гармонической компонент
на основе ARMA-модели
Ключевые слова: функция Рамсея; логистическая динамика; ARMA-модели; прогноз.
Аннотация. Рассмотрен новый подход к моделированию и прогнозированию временных рядов суммой логистической, линейной и гармонической компонент на основе параметрической модели авторегрессии-скользящего среднего. В качестве основного логистического тренда использовалась логиста Рамсея, по своему виду близкая к функции Верхулста, но при этом имеющая более простое аналитическое выражение. Проведены исследования точности предложенной модели, как на тестовых выборках, так и на реальных статистических данных. Полученные результаты показали высокую точность моделирования и прогнозирования в широком диапазоне значений параметров модели, соотношения «шум/сигнал», а тестирование на реальных данных показало возможность использования предложенной модели и метода ее параметризации для различных экономических процессов.
В экономической практике широко используют моделирование временных рядов логистическими функциями (логистами) в случаях, когда наблюдаемый показатель сначала растет медленно, потом ускоряется, а затем снова замедляет свой рост, стремясь к некоторому уровню насыщения [1. С. 785; 2. С 21]. Известно более десятка моделей логистической функции [3. С. 17], из которых чаще используются модели Верхулста (Перла-Рида).
Для моделирования логистой Верхулста обычно выполняют нелинейные операции перехода к обратным значениям уровней временного ряда У , затем операции логарифмирования [2. С. 79]. При этом принимают скорее удобные, чем отвечающие реальным
условиям предположения: считают известным уровень насыщения временного ряда, а стохастическую компоненту {, - мультипликативной по отношению к экспоненте, входящей в формулу Верхулста и имеющей логарифмически нормальный закон распределения.
При принятии некоторых предположений известно и использование эвристических разностных схемы из наблюдений уровней Yk [4. С. 123]. В рассматриваемых методах значимые объемы выборок, достигаемая точность моделирования и прогнозирования невелики.
При моделировании временного ряда логистой Верхулста с аддитивной и мультипликативной по отношению к тренду стохастической компонентой можно применить параметрические ARMA-модели [5. С. 101], которые позволяют достичь высокой точности моделирования и прогнозирования на сравнительно малых объемах выборки.
Задачей, не получившей до настоящего времени решения, является приближение моделирования логистической тенденции показателя к реальным условиям практики путем дополнительного учета в Tk линейного тренда, например для передачи процесса инфляции, и учета колебательной компоненты для отражения влияния сезонности или экономических циклов.
Во-первых, будем исходить из того, что в работе [6. С. 12] на основе параметрических ARMA-моделей предложены эффективные по точности и реализуемые на сравнительно коротких выборках методы моделирования и прогнозирования временного ряда Yk с детерминированной компонентой Tk в виде суммы линейного тренда и колебательной компоненты S,.
k
Во-вторых, предложим моделировать логисту функцией Рамсея [7. С. 46]:
C (D - B (1 + akA)exp (-акД)),
где C, D, B, и а - параметры (обычно принимают D = B =1); к = 0, 1, ..., N - номера наблюдения (отсчеты); N - объем выборки; А - период дискретизации (опроса) динамической траектории (год, квартал, месяц, декада, день, час и т. д.).
Подбором параметров можно сделать модели Верхулста и Рамсея весьма близкими друг другу, т. е. функция Рамсея передает логистическую динамику, что будет показано ниже и на примерах реальных экономических процессов. Использование функции Рамсея оказывается удобным для параметризации имеющейся на практике многокомпонентной структуры ряда динамики: обычно кроме логисты в наблюдениях присутствует дополнительный тренд, в простейшем случае - линейный, вида А2кА, где А2 - параметр, и колебательная компонента в виде гармоники A1sin(wkA + ф), где A1 -амплитуда гармоники, ш - частота гармоники, а ф - фаза гармоники.
Таким образом, будем рассматривать следующую модель временного ряда:
Yk =C (1 -(1 + акД)ехр (-акД))+A1 sin (юкД + ф) +A2 кД + ^, (1)
где ^к - стохастическая компонента, отвечающая условиям применения метода наименьших квадратов (МНК).
1. Метод параметризации модели
Известный метод «сезонной декомпозиции» рядов с колебательной компонентой для обеспечения удовлетворительной точности предполагает анализ наблюдений на 4-10 периодах колебательной компоненты [2. С. 312], т. е. требует от 48 до 120 ежемесячных наблюдений.
Статистические данные на таких длительных интервалах времени часто отсутствуют (например, при оценке эффективности инноваций). На подобных интервалах
времени могут произоити столь существенные эволюции в моделируемых экономических процессах, которые потребуют мониторинга параметров (или даже видов) моделеИ компонент, что приведет к малоИ точности моделирования и особенно прогнозирования. Заметим, что присутствие во временном ряде логистической компоненты делает весьма актуальной задачу раннего прогнозирования как уровня, так и момента насыщения, что обусловливает использование возможно коротких статистических выборок на первой и второй фазах логисты: до наступления уровня насыщения.
Используя известную методику [3. С. 14], можно сконструировать при к > 6 для (1) следующую параметрическую АК.ЫА-модель шестого порядка:
У = 2Ук-1 - 2Ук-2 + 2Ук-3 - Ук-4 + т (2Ук-1 - 4Ук_2 + 4^_з - 4Ук-4 + 2*к_5 )-
- т2 (Ук-2 - 2Ук-з + 2Ук-4 - 2Ук-5 + Ук-6)+ тз (Ук-1 - 2Ук-2 + Ук-з)- (2)
- т4 (2Ук-2 -Ук-3 +2Ук-4 )+т5 (Ук-3 -2У к - 4 +Ук-5 )+^,
где «новая» стохастическая компонента также отвечает условиям применения МНК и равна
^ = 24к-1 - 24к-2 + 24к-3 Чк-4 + т1(2^к-1 - 4£к-2 + 4^-3 - 4^-4 + 2^-5 )-
- т2 (^к-2 - 2^к-3 + 2^к-4 - 2^к-5 + ^к-6 )+ т3 (^к-1 - 2^к-2 + ^к-3 )-
- т4 (2^к-2 - ^к-3 + 2^к-4 )+ т5 (^к-3 - 2^к-4 + ^к-5 ) ,
т1 =Х1, т2 =^2, т3 =Х2, т4 =Х1Х2, т5 =^2 Х2,
Х1 = ехр (-аД), Х2 = 2со8 (юД).
Видим, что в (2) осуществлена «трансформация» параметров а и ш, нелинейно входящих в модель (1), в линейные коэффициенты т1, т2, т3, т4 и т5 АЯЫА-модели. Для нахождения МНК-оценок параметров т°, т2, т°, т0 и т0 коэффициентов АЯЫА-мо-
дели составим и решим нормальную систему линейных алгебраических уравнений
(СЛАУ) пятого порядка:
Г2Ук-1 - 2Ук-2 + 2Ук-3 - Ук-4 + А
+ т1 (2Ук-1 - 4Ук-2 + 4Ук-3 - 4Ук-4 + 2Ук-5 ) -- т2 (Ук-2 - 2Ук-3 + 2Ук-4 - 2Ук-5 + Ук-6 ) +
+ т3 (Ук-1 - 2Ук-2 + Ук-3 ) +
+ т4 (2Ук-2 - Ук-3 + 2Ук-4 ) +
+ т5 (Ук-3 - 2Ук-4 + Ук-5 )
где М0 { } - оператор среднеквадратического сглаживания.
По найденным из (3) оценкам т0, т0, т0, т0, т0 определим Х0 = т0 и Х2 = т0, а затем рассчитаем оценки параметров модели а0 и ш0 по формулам
0 0 0 0 0 • 1/1 тх, т2, тъ, ^, т = argmln М
тх, т2, т3, т4, т5
Ук -
,(3)
х0
1п Х0
а = —
Д
ю =-
Д
Подстановка а0 и ш0 в (1) приводит к выражению
Ук = С (1 -(1 + а0 кД)ехр (-а0 кД))+А381п (ю0 кД)+А4со8 (ю0 кД)+А2 кД + ^, (4)
где приняты обозначения А3 = А1соз(ф), А4 = А^ш^).
2
Из соответствующей нормальной СЛАУ четвертого порядка получим МНК-оценки С°, А0, А0, А0 и затем рассчитаем МНК-оценки оставшихся параметров модели (2) по формулам
I------------- А
А0 =7((А0)2 + (А0)2), ф0 = агсЛд(5)
А4
2. Исследование точности метода на тестовых выборках
Область применения в эконометрической практике предложенной АК.МА-модели и метода ее параметризации зависит от соотношения мощности стохастической компоненты (помехи) и параметров модели (полезного сигнала), при которых удовлетворительны точность моделирования и прогнозирования временного ряда на анализируемой выборке.
Использовалась следующая методика исследования точности:
• осуществлялась генерация уровней Тк детерминированных компонент модели (1), с которыми суммировалась генерируемая стохастическая компонента ^к с нормальным законом распределения и регулируемой (назначаемой) мощностью. Для уменьшения зависимости исследования точности от конкретных выборок ^к использовалось усреднение по десяти тестовым выборкам;
• в качестве критерия точности моделирования использовался коэффициент детерминации
£ у - ум )2
к2 = 1 —-------------N-----------, (6)
-УМ)2 +£у -ур)2
к=1 к=1
где Ук - отсчеты моделируемого временного ряда; Ум - модельные значения временного ряда; У - среднее арифметическое анализируемой выборки; N - объем анализируемой выборки;
• выборка разбивались на рабочую и контрольную части, а точность прогноза характеризовалась средней относительной ошибкой прогноза (МАРЕ-оценкой прогноза).
N+1
£Ук -ум|
МАРЕ = ----------100%, (7)
У
где I - объем контрольной части выборки (горизонт прогноза, или период упреждения);
• точность исследовалась в функции коэффициента «шум/сигнал» при различных объемах выборки
К = Я®. (8)
” Бфк )’
где 0(9 - дисперсия стохастической компоненты с назначаемой дисперсией (путем центрирования, нормирования и умножения на соответствующий коэффициент); -0(Ок) - дисперсия детерминированной компоненты модели (сумма логисты Рамсея, линейного тренда и гармоники).
При тех же выборках Ук и соответствующих параметрах моделирования определялась зависимость МАРЕ-оценки с глубиной прогноза, как это обычно максимально допускают, в 1/3 от длины исходной выборки. Назначавшиеся параметры генерации детерминированных компонент в модели (1) сведены в таблицу.
Параметры выборок детерминированных компонент
№ теста 1 2 3 4 5 6 7 8 9 10
С 70 35 140 70 70 70 70 140 70 70
а1рЬ 0,4 0,4 0,4 0,05 0,4 0,4 0,4 0,4 0,4 0,4
А1 3 3 3 3 0,3 9 3 5 3 3
А2 0,01 0,01 0,01 0,01 0,01 0,01 1 0,5 0,01 0,01
0,5235 0,5235 0,5235 0,5235 0,5235 0,5235 0,5235 0,5235 0,2618 0,3491
fi 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1
Ниже представлены результаты моделирования и прогнозирования на различных тестовых выборках в функции коэффициента «шум/сигнал» при различных объемах выборки.
-♦---М = 24
-■—N = 36 -Л—N = 48
Рис. 1. Зависимость коэффициента детерминации от соотношения «шум/сигнал» при различных объемах выборки и параметрах теста № 3 таблицы
№
а
<
-♦---М = 24
-■—N = 36 -А—N = 48
Рис. 2. Зависимость ошибки прогноза от соотношения «шум/сигнал» при различных объемах выборки и параметрах теста № 3 таблицы
.+...N = 24
-■—N = 36 -Д—N = 48
Рис. 3. Зависимость коэффициента детерминации от соотношения «шум/сигнал» при различных объемах выборки и параметрах теста № 6 таблицы
N = 24 --я--М = 36
—А—N = 48
Кш, %
Рис. 4. Зависимость ошибки прогноза от соотношения «шум/сигнал» при различных объемах выборки и параметрах теста № 6 таблицы
Таким образом, предложенный метод позволяет осуществлять с высокой точностью моделирование и прогнозирование многокомпонентной модели (1) в широком динамическом диапазоне значений параметров модели и на более коротких выборках, чем известный метод «сезонной декомпозиции».
3. Исследование точности модели Рамсея и предложенного метода на реальных статистических данных
Результаты исследования точностных характеристик модели (1), полученные при имитационном моделировании, позволяют нам сделать предположение о возможности широкого использования предложенной модели для моделирования и прогнозирования на реальных статистических данных. Результаты проверки представлены на рис. 5-12.
Из рис. 5-12 видим, что модель (1) и предложенный способ ее параметризации позволяет с высокой точностью осуществлять моделирование и прогнозирование разнообразных экономических процессов, причем на коротких выборках.
О 2 4 б 6 10 12 14 16 18
[ Находимо ДИХЮ.И» Мод иг». -*- Прогноз
КооФФтиоиг детер*»*4пации О.ОТЗ/ ц
Рис. 5. Модель Yk = -3,027 (l - (1 + 0,6928k )exp (-0,6928k ))- 5,9643 sin (0,5235k + 0,9479) + 5,2701k для моделирования и прогнозировании роста стоимости одного квадратного метра жилья в жилищном комплексе «Волжская вольница» г. Самара. MAPE-оценка равна 3% при глубине прогноза l = 3
Рис. 6. Модель Ук =-23,891(1 -(1 + 0,5419к )ехр (-0,5419к ))-1,5278т (1,8783к - 0,945)+ 4,5473к для моделирования и прогнозирования роста стоимости одного квадратного метра жилья в жилищном комплексе «Янтарный берег» г. Самара. Количество отсчетов N = 16. МАРЕ-оценка равна 6% при глубине прогноза I = 3
Рис. 7. Модель Ук =-20,683(1 -(1 + 0,6007к )ехр (-0,6007к ))-2,8948т (1,0471к-0,635) + 4,5152к для моделирования и прогнозирования роста стоимости одного квадратного метра жилья однокомнатной квартиры в среднем ценовом районе г. Самара с июня 2004 по июль 2005 г. МАРЕ-оценка равна 1% при глубине прогноза I = 1
_>и
**65
Л со
а £5 1 60 % 40
т 35 • 30
I»
Роуяыоты иодениросвинч
■—1И [81 .ет и1
' Исходные ли>«1».н1 ГЛ1ДИ11|
Копф^циянт лятярг>«м«цни 0.3874
Рис. 8. Модель Ук =-19,92 (1 -(1 + 0,5376к )ехр (-0,5376))+10,9738т (0,1208к + 0,4257) + 1,9279к для моделирования и прогнозирования роста стоимости одного квадратного метра в однокомнатной квартире среднего ценового диапазона вторичного рынка г. Самара. МАРЕ-оценка равна 7% при глубине прогноза I = 3
Рис. 9. Модель Ук = 0,0011(1 -(1 - 0,996к )ехр (0,996к ))+ 5,19858т (1,2691к - 0,3521) + 8,3858к для моделирования данных стоимости 1 т арматуры в г. Самара
Рис. 10. Модель Ук = 14,518(1 -(1 + 3,3012к )ехр(-3,3012))-50,268т (0,5235к + 0,4903) + 35,453к для моделирования роста стоимости одного кирпича в г. Самара. МАРЕ-оценка равна 5%
при глубине прогноза I = 1
Рис. 11. Модель Ук = 357,00 (1 -(1 + 1,0286к )ехр (-1,0286к ))+ 36,6328т (0,2617к - 0,977) + 4,1421к для моделирования стоимости одного литра бензина (А-76) в г. Самара. МАРЕ-оценка равна 4% при глубине прогноза I = 3
!!!■!!
Ре<уяк1*1ы мадеяировмсня
Ис>од>*.*е • Модель
К<0'1-5шиснг детеф^лмаиии 0,9732
Рис. 12. Модель Ук =-61250 (1 -(1 + 0,5952к )ехр (-0,5952к ))-23813вт (0,1745к -1,439) + 75637к для моделирования объемов кредитования филиала Сбербанка в г. Самара. МАРЕ-оценка равна 3% при глубине прогноза I = 3
На рис. 13-15 приведены результаты исследования точности моделирования на реальных экономических данных, подтверждающие аналогичные исследования, приведенные на тестовых выборках.
Количество отсчетов N
Рис. 13. Зависимость коэффициента детерминации от количества отсчетов для данных стоимости одного квадратного метра жилья однокомнатной квартиры в среднем ценовом районе г. Самара
а
<
Количество отсчетов N
Рис. 14. Зависимость МАРЕ-оценки от количества отсчетов. Прогноз на один шаг по данным стоимости одного квадратного метра жилья однокомнатной квартиры в среднем ценовом районе г. Самара
2
а
5
а
-6-
-6-
Количество отсчетов N
Рис. 15. Зависимость коэффициента детерминации от количества отсчетов по данным стоимости одного квадратного метра жилья в жилищном комплексе «Волжская вольница» г. Самара
Заключение
Предложен метод моделирования и прогнозирования на сравнительно коротких выборках временных рядов, содержащих сумму логисты Рамсея, линейный тренд, гармонику и стохастическую компоненту.
Исследования на тестовых выборках показали высокую точность моделирования и прогнозирования в широком диапазоне значений параметров модели, соотношения «шум/сигнал».
Тестирование на реальных данных подтвердили высокую точность и возможность использования метода для различных экономических процессов и явлений.
Можно утверждать, что предложенный метод допускает развитие на случай нелинейного дополнительного тренда и моделирования колебательной компонентой дву-мя-тремя гармониками.
Источники
1. Айвазян С. А., Мхитарян В. С. Прикладная статистика и основы эконометрики : учеб. пособие. М.: ЮНИТИ, 1998.
2. Эконометрика : учебник / И. И. Елисеева, С. В. Курешева, Т. В. Костеева, И. В. Бабаева, Б. А. Михайлов; под ред. И. И. Елисеевой. М. : Финансы и статистика, 2003.
3. Семенычев В. К. Эконометрическое моделирование и прогнозирование рядов динамики на основе параметрических моделей авторегрессии : автореф. ... д-ра экон. наук. М. : РЭА им. Г. В. Плеханова, 2005.
4. Четыркин Е. М. Статистические методы прогнозирования : учеб. пособие. 2-е изд., перераб. и доп. М. : Статистика, 1977.
5. Семёнычев В. К., Семёнычев Е. В. Информационные системы в экономике. Эконометрическое моделирование инноваций : учеб. пособие. Самара : Изд-во Самар. гос. аэрокосм. ун-та, 2006. Ч. 1.
6. Семёнычев Е. В. Параметрическое моделирование и прогнозирование рядов экономической динамики с колебательной компонентой : автореф. ... канд. экон. наук. Самара : СГАУ, 2006.
7. Ramsay J. O. A comparative study of several robust estimates of slope, intercepts an scale in linear regression // JASA. 1997. № 3.