ЭКОНОМИКА И УПРАВЛЕНИЕ
51
УДК 330.46(045)
ГИБРИДНЫЕ И СЕЛЕКТИВНЫЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ ФИНАНСОВЫХ ИНДЕКСОВ В РАМКАХ РАНДОМИЗИРОВАННОЙ КОЛЛОКАЦИИ
Бабешко Людмила Олеговна, д-р экон. наук, профессор Департамента анализа данных, принятия решений
и финансовых технологий, Финансовый университет, Москва, Россия
babeshko_ls@mail.ru
Ясакова Анна Михайловна, аспирант Департамента анализа данных, принятия решений и финансовых
технологий, Финансовый университет, Москва, Россия
yasakova.ann@gmail.com
Работа нацелена на повышение точности прогнозов финансовых индексов, которые отражают ситуацию на рынке в целом и являются важнейшими индикаторами российской экономики. Повышение точности достигается построением гибридных прогнозов, базовый набор которых включает модели рандомизированной коллокации и тривиального прогнозирования. Механизм рандомизации в коллокационном подходе, основанный на селективной процедуре комбинированного прогнозирования, предназначен для обоснованного выбора между моделями чистой и параметрической коллокации. Оценки весовых коэффициентов гибридных прогнозов строятся по прогнозам из базового списка моделей в классе линейных процедур, удовлетворяющих стандартным требованиям оптимальности: несмещенность ошибок прогнозирования и минимизация их дисперсий. Алгоритмы разработанных моделей реализованы в программной среде R и апробированы на данных индекса РТС за 2016 г.
Ключевые слова: рандомизированная коллокация; комбинированные прогнозы; селективная модель; гибридная модель; весовые коэффициенты.
HYBRID AND SELECTIVE MODELS OF FINANCIAL INDEX FORECASTING IN THE RANDOMIZED COLLOCATION FRAMEWORK
Babeshko Ludmila O., ScD (Economics), full professor of the Data Analysis Department, Financial University,
Moscow, Russia
babeshko_ls@mail.ru
Yasakova Anna M., post-graduate student of the Data Analysis Department, Financial University, Moscow, Russia yasakova.ann@gmail.com
The study aims to improve the accuracy of forecasting financial indices that reflect the general market situation and are important indicators of the Russian economy. The enhanced accuracy is achieved by making hybrid forecasts that basically include a set of randomized collocation and trivial forecast models. The randomization mechanism in the collocation approach based on the selective procedure of combined forecasting is used to make a justified choice between the models of pure and parametric collocation. The weighted coefficients of hybrid forecasts are evaluated based on forecasts of the basic model list in the class of linear processes that meet the standard optimality requirements: unbiased prediction errors and minimization of their variances. Algorithms of developed models are implemented in the R software environment and tested on the RTS index data for 2016.
Keywords: randomized collocation; combined forecasts; selective model; hybrid model; weighted coefficients.
52
экономика и управление
типы моделей прогнозирования, основанные на комбинированных методах
Фондовый рынок является сферой, где финансовые инструменты используются для мобилизации сбережений в экономике и их конвертации в инвестиционные ресурсы, направляемые в наиболее эффективные мероприятия экономического развития. При прогнозировании характеристик финансовых инструментов необходимо учитывать их волатильность. Изменениям подвергаются не только уровни временных рядов показателей, но и их динамические свойства. Выбор одной модели для построения прогнозов приводит, как правило, к большим дисперсиям оценок ее параметров и соответственно ошибкам прогнозов. Вот почему для повышения точности прогноза применяются комбинированные методы [1, 2].
Модели прогнозирования, основанные на комбинированных методах, подразделяются на модели селективного типа и гибридные [3]. В моделях селективного типа в качестве критерия отбора одной модели из базового набора используются такие показатели, как средняя ква-дратическая ошибка прогнозирования, информационные критерии (Акаике, Шварца, Хенна-на — Куина), коэффициент Тейла.
В гибридных моделях при формировании комбинированного прогноза учитываются веса индивидуальных прогнозов, полученных по моделям, включенным в базовый список. В данной работе комбинированные модели как селективного, так и гибридного типа, основаны на колло-кационном подходе прогнозирования финансовых индексов.
Прогнозирование финансовых индексов в рамках стационарной модели логарифмической прибыли
Значение финансового индекса в текущий момент St определяется его начальным значением S0 и коэффициентом наращения:
н
где
^ = 3, • ^
И = к + ... + к + ... + к
t 0 I t
(1)
— логарифмическая прибыль за период V;
к = _1) при i > 0, к = 0, при i = 0
— логарифмическая прибыль в момент ' ^
Последовательность значений логарифмической прибыли (к) предполагается стационарной с характеристиками:
Е {} = т, С^ {к, к+к } = ^ (т .
Значение индекса на некоторый момент в будущем (t = п + к), в соответствии с формулой (1),
равно:
^ = ^ • ^ = ^ • вн • = ^ • в"», (2)
где Sn — последнее наблюдаемое значение, п — число наблюдений,
п+к
АН = £ к
(3)
I = п+1
— приращение логарифмической прибыли за период упреждения к Таким образом, для прогноза финансового индекса (2) на момент ? = п + k,
^= ^ • «Ш = ^ • ехр\АН\,
(4)
необходимо оценить величину приращения логарифмической прибыли А Н. Для оценки линейного функционала (3) в работе используется рандомизированный алгоритм коллокации, основанный на проверке нулевой гипотезы Н0 : т = 0 против альтернативной Н1 : т Ф 0 [4,5].
комбинированное прогнозирование финансовых индексов в рамках коллокационных моделей
При справедливости нулевой гипотезы Н0 : т = 0 прогноз приращения логарифмической прибыли выполняется при помощи модели чистой коллокации (оптимальный средний квадратический прогноз Колмогорова-Винера):
ан = сАН , ■ с:1, ■ н,
АН,Н нн
(5)
где h = (к[, /г2,..., ^)т — известные значения уровней динамического ряда;
Сш — автоковариационная функция уровней ряда;
Сн,а н — вектор взаимных ковариаций значений к, i = 1,..., п стационарного динамического ряда и значения линейного функционала дН .
Точность оценки (5) характеризуется автоковариационной матрицей ошибок прогнозов
C = C - C C C
ее AH AH h^hh^AH '
(6)
где C&H — автоковариационная матрица оценок приращения логарифмической прибыли.
В случае справедливости альтернативной гипотезы H1 : m Ф 0 оценка линейного функционала логарифмической прибыли (3) выполняется посредством модели параметрической коллокации:
АН = m ■ k + СН, • С-
AH,h hh
(h -1
(7)
где т — оценка математического ожидания стационарного случайного процесса логарифмической прибыли, полученная по выборочным данным h = (к1, h2)Т . Дисперсия ошибки оценки (7) вычисляется по формуле
а2 = k2 - а2 + а2 - q ■ С,,и + q ■ I - а2 • 1Т ■ оТ -
е т АН ^ h,AH ^ т ^
2k ■ ai ■ IT ■ qT ,
m J
где am — дисперсия оценки m ;
m. i
(8)
q ~ CAH ,h ' Chh '
Для практической реализации алгоритмов коллокации используются аналитические модели ковариационных функций [6]:
C(т) = а2 • е-
C (
2 sm а • т
ат
(9)
(10)
Параметры моделей (9)—(11) оцениваются методом существенных параметров, в качестве которых используется набор характеристик ковариационной функции:
а2 = C (0) — дисперсия процесса (h ). , т0 5 — радиус корреляции — значение аргумента функции C (т), при котором ее значение равно половине дисперсии: C (т05 ) = C (О) 2,
т0 — наименьший положительный нуль функции C (т), если она имеет нули. Связь параметров ковариационных функций с существенными параметрами устанавливается исходя из их спецификаций.
Прогнозные модели (4)-(8), построенные на основе аппроксимирующих функций (9)-(11), имеют одинаковую структуру, но отличаются значениями параметров, поэтому будут давать различные результаты. Для выбора одной из них, в рамках селективного подхода, в качестве критерия отбора используются дисперсии ошибок прогноза, которые вычисляются по формулам (6) и (8) рандомизированного алгоритма.
При построении комбинированных прогнозов, в рамках гибридного подхода, в качестве базового набора прогнозных моделей используются модели рандомизированной коллокации: прогнозы, полученные при помощи ковариационных функций (9)-(11), комбинируются путем выбора оптимальных весов [7].
Для определения оптимальных весов g = (gi,g2,..., g ^T комбинированного прогноза
m
Y = X gf, = g + g2Y2 + ... + gmt, (12)
i=1
представим структуру его составляющих в виде суммы
Y. = Y + et, i = 1,...,m,
(13)
где У — п-мерный вектор истинных значений финансового индекса;
— п-мерный вектор ошибок прогноза г-й модели базового набора,
C(т) = а2 • e а cos ß • т, а > 0,
(11)
E <ei} = 0, i = 1,..., m.
(14)
где а — дисперсия стационарного процесса; а, т — параметры.
Запишем выражение для ошибки комбинированного прогноза (13):
экономика и управление
Таблица 1
значения индекса Ртс за период с 11.01.2016 по 07.03.2016 г.
дата индекс Ртс дата индекс Ртс
11.01.2016 11 067,9 08.02.2016 11 540,37
12.01.2016 11 131,43 09.02.2016 11 383,00
13.01.2016 11 089,72 10.02.2016 11 435,65
14.01.2016 11 069,65 11.02.2016 11 303,70
15.01.2016 10 588,08 12.02.2016 11 407,53
18.01.2016 10 685,95 15.02.2016 11 504,98
19.01.2016 10 849,47 16.02.2016 11 604,72
20.01.2016 10 752,65 17.02.2016 11 726,85
21.01.2016 11 074,11 18.02.2016 11 985,36
22.01.2016 11 369,15 19.02.2016 11 883,72
25.01.2016 11 368,1 22.02.2016 12 091,38
26.01.2016 11 276,47 24.02.2016 11 910,29
27.01.2016 11 569,19 25.02.2016 11 953,80
28.01.2016 11 770,39 26.02.2016 12 042,04
29.01.2016 11 874,94 29.02.2016 12 201,68
01.02.2016 11 762,08 01.03.2016 12 220,54
02.02.2016 11 644,88 02.03.2016 12 135,21
03.02.2016 11 541,63 03.03.2016 12 320,71
04.02.2016 11 854,41 04.03.2016 12 465,37
05.02.2016 11 801,67 07.03.2016 12 680,63
Источник: Информационно-аналитическая система Bloomberg Professional, (дата обращения: 13.04.2016).
в, = Г - Г = ИХ + gY +... + gmr - Г = = gY + ) + g2(Y + e2) + ... + gm(Y + em) - Y =
Как следует из (16), требование несмещенности ошибки комбинированного прогноза
Е {е ) = Е { - Г) = 0
= ^ g¡Y - Y + ^ g.e. = ^ g . -1 Y + ^ g.e., (15) сводится к условию нормировки коэффициентов
Ы Ы ^ Ы ) Ы т
Е gi = 1, (17)
и определим ее математическое ожидание '
с учетом (14): при котором несмещенная ошибка комбиниро-
ванного прогноза равна
E {ep } =
i= 1
Z S -1 E {Y} + Z giE {ei } =
i=1
Z Si -1
i=1
E {Y
(16)
e = e ■ g ,
p
(18)
где е — (п х т) — матрица, столбцами которой являются векторы ошибок прогнозов, полу-
Таблица 2
Результаты прогнозирования
дата значение индекса ртс Модель (0) Модель (9) Модель (10) Модель (11) комбинированный прогноз
1 2 3 4 5 6 7
08.02.2016 11 540,37 11 801,67 11 803,42 11 807,19 11 787,39 11 818,77
09.02.2016 11 383,00 11 540,37 11 533,68 11 513,62 11 568,28 11 515,69
10.02.2016 11 435,65 11 383,00 11 371,98 11 334,78 11 450,95 11 329,59
11.02.2016 11 303,70 11 435,65 11 399,53 11 305,49 11 528,28 11 328,31
12.02.2016 11 407,53 11 303,70 11 311,15 11 332,35 11 285,64 11 320,51
15.02.2016 11 504,98 11 407,53 11 417,35 11 442,50 11 393,82 11 425,92
16.02.2016 11 604,72 11 504,98 11 498,79 11 491,99 11 475,85 11 510,8
17.02.2016 11 726,85 11 604,72 11 645,93 11 722,06 11 516,51 11 782,74
18.02.2016 11 985,36 11 726,85 11 749,83 11 800,32 11 699,75 11 784,5
19.02.2016 11 883,72 11 985,36 11 982,00 11 974,98 11 993,22 11 972,08
22.02.2016 12 091,38 11 883,72 11 878,30 11 866,69 11 874,13 11 885,82
24.02.2016 11 910,29 12 091,38 12 114,41 12 226,81 12 087,64 11 979,37
25.02.2016 11 953,80 11 910,29 11 921,29 11 952,91 11 850,50 11 968,36
26.02.2016 12 042,04 11 953,80 11 957,10 11 963,36 11 919,79 11 995,32
29.02.2016 12 201,68 12 042,04 12 032,81 12 003,46 12 081,93 12 010,51
01.03.2016 12 220,54 12 201,68 12 193,40 12 167,68 12 257,27 12 151,63
02.03.2016 12 135,21 12 220,54 12 216,55 12 207,81 12 251,54 12 183,48
03.03.2016 12 320,71 12 135,21 12 148,86 12 184,10 12 049,36 12 228,65
04.03.2016 12 465,37 12 320,71 12 310,37 12 227,50 12 318,53 12 451,38
07.03.2016 12 680,63 12 465,37 12 442,49 12 284,87 12 456,07 12 698,38
ченных при помощи моделей базового набора. Дисперсия ошибки прогноза (18)
Гаг { } = Сот (, ер ) = gTceeg (19)
определяется квадратичной формой с матрицей Сее (матрицей взаимных ковариаций ошибок прогнозов по моделям базового набора).
Таким образом, задача определения оптимальных весовых коэффициентов (оптимальных в смысле несмещенности ошибок прогноза и минимальности их дисперсий) — это задача на условный экстремум с целевой функцией вида
L (я, Х) = gTCeeg - 2х(т I -1 , (20)
где А — множитель Лагранжа; I — единичный вектор-столбец. Необходимые условия экстремума первого порядка для функции (20) приводят к следующей системе уравнений:
ОТ
— = 2C g - 2kI = 0
- T ее
dg .
= 2(gTI -1) = 0
ok
(21)
Решением системы (21) является вектор g, который минимизирует дисперсию ошибок комбинированного прогноза (19) и удовлетворяет ограничению (17):
56
ЭКОНОМИКА И УПРАВЛЕНИЕ
Таблица 3
Коэффициенты комбинированного прогноза
Номер модели
0 -4,4537
8 8,8383
9 -2,3584
10 -1,0262
Таблица 4
Оценки средних квадратических ошибок прогнозов базовых моделей и их комбинации
Число прогнозов Модель (0) Модель (1) Модель (2) Модель (3) Комбинированный прогноз
20 150,98 149,41 173,11 174,18 118,94
8 = (1ТСеХе1) С-1. (22)
Для построения матрицы Сее, выполняется оценка значений эмпирических ковариационных и взаимных ковариационных функций ошибок прогнозов, которые затем аппроксимируются моделями (9)-(11).
Реализация алгоритма комбинированного прогнозирования
Описанный алгоритм комбинированного прогнозирования реализован в векторно-ориен-тированной среде Д и апробирован на данных индекса РТС за 2016 г. (табл. 1).
При настройке коллокационных моделей в качестве обучающей выборки выбрано скользящее окно, включающее 20 наблюдений, период упреждения — 1 шаг.
В базовый набор включены модели тривиального прогнозирования (столбец 3 табл. 2) и модели рандомизированной коллокации с применением ковариационных функций (9)—(11)
(столбцы 4-6 табл. 2). Результаты комбинированного прогноза, полученного в рамках гибридной модели, приведены в столбце 7 табл. 2. Весовые коэффициенты для гибридного прогноза (12), вычисленные по формуле (22), представлены в табл. 3.
Средние квадратические ошибки прогнозов показывают оптимальность процедуры гибридного прогнозирования (табл. 4) по сравнению с индивидуальными прогнозами, включенными в базовый набор.
Весовые коэффициенты, приведенные в табл. 3, совпадают с оценками параметров регрессионной модели при наличии ограничений (17), в которой эндогенной переменной является вектор У, а регрессорами — его индивидуальные прогнозы, построенные по моделям базового набора [8]. Однако практическая реализация комбинированной модели с весами (22) удобнее, чем решение аналогичной задачи в рамках эконометрической модели с ограничениями на параметры [9].
ЛИТЕРАТУРА
1. Bates J. M., Granger C. W.J. The combination of forecasts. Operation Research Quarterly, 1969, vol. 20, No. 4, pp. 451-468.
2. Granger C. W.J. Invited review: combining forecasts — twenty years later. Journal of Forecasting, 1989, No. 8, pp.167-173.
3. Лукашин Ю. П. Адаптивные методы краткосрочного прогнозирования временных рядов. М.: Финансы и статистика, 2003. 416 c.
4. Бабешко Л. О. Коллокационные модели прогнозирования в финансовой сфере. М.: Экзамен, 2001. 288 с.
5. Бывшев В. А., Бабешко Л. О., Клапко А. О. Прогнозирование динамических рядов финансово-экономической информации рандомизированным алгоритмом коллокации // Управление риском. 2004. № 1. С. 35-39.
6. Бывшев В.А., Бабешко Л. О., Арсеньева Л. В. Алгоритм оценивания основных инвестиционных характеристик финансовых активов при помощи оптимальной статистической процедуры Эйткена // Управление риском. 2000. № 4. С. 31-37.
7. Бабешко Л. О., Ясакова А. М. Комбинированные модели прогнозирования финансовых индексов // Актуальные вопросы в научной работе и образовательной деятельности. Сборник научных трудов по материалам Международной научно-практической конференции: в 10 томах. Тамбов, 2015. Т. 4. С. 18-22.
8. Бабешко Л. О., Ясакова А. М. Гибридные модели с ограничением на параметры в рамках коллокацион-ного подхода // Сборник статей Международной научной конференции, Орловский государственный университет. Воронеж, 2015. С. 74-80.
9. Бабешко Л. О. Эконометрическое прогнозирование по разнородной информации / Л. О. Бабешко. М.: Вега-Инфо, 2016.— 232 с. ISBN 978-5-91590-024-9.
REFERENCES
1. Bates J. M., Granger C. W.J. The combination of forecasts. Operation Research Quarterly, 1969, vol. 20, No. 4, pp. 451-468.
2. Granger C. W.J. Invited review: combining forecasts — twenty years later. Journal of Forecasting, 1989, No. 8, pp.167-173.
3. Lukashin Y. P. An adaptive methods of short-term time series forecasting [Adaptivnye metody kratkosrochnjgo prognozirovaniya]. Moscow, Finansy i statistika — Finance and statistics, 2003, 416 p.
4. Babeshko L. O. Collocation forecasting models in the financial sector [Kollokacionnye modely prognozirovaniya v finansovoy sfere], Moscow, 2001, 288 p.
5. Byvshev V.A., Babeshko L. O., Klapko A. O. Prediction of time series of financial and economic information within randomized collocation [Prognozirovaniye dynamicheskih rjadov finansovo-ekonomicheskoj informacii randomizirovannym algoritmom kollokacii]. Upravlenie riskom — Risk management, 2004, No. 1, pp.18-22.
6. Byvshev V.A., Babeshko L. O., Arsenyeva L. V. Estimator of basic investment characteristics of the financial assets within optimal statistical Aitken procedure [Algoritm ocenivanija osnovnyh investicionnyh haracteristic finansovyh aktivov pri pomoschi optimal'noj statisticheskoj procedury Aitkena]. Upravlenie riskom — Risk management, 2000, No. 4, pp. 31-37.
7. Babeshko L. O., Yasakova A. M. Combined forecasting models of financial indices [Kombinirovannye modely prognozirovaniyja finansovyh indeksov: sbornik statei Mezhdunarodnoi nauchnoi konferensii]. Tambov, 2015, pp.18-22.
8. Babeshko L. O., Yasakova A. M. Hybrid models with restriction on the parameters within the collocation approach [Gibridnye modeli s ogranichenijami na parametry v ramkah kollokaciionnogo podhoda: sbornik statei Mezhdunarodnoi nauchnoi konferensii]. Orel, State University. Voronezh, 2015, pp. 74-80.
9. Babeshko L. O. Econometric forecasting for heterogeneous information [Ekonometricheskoye prognozirovaniye po raznorodnoy informatsii]. Moscow, Vega-Info, 2016. 232 с. ISBN 978-5-91590024-9.