Научная статья на тему 'СРАВНЕНИЕ GARCH И HAR-RV МОДЕЛЕЙ ДЛЯ ПРОГНОЗА РЕАЛИЗОВАННОЙ ВОЛАТИЛЬНОСТИ НА РОССИЙСКОМ РЫНКЕ'

СРАВНЕНИЕ GARCH И HAR-RV МОДЕЛЕЙ ДЛЯ ПРОГНОЗА РЕАЛИЗОВАННОЙ ВОЛАТИЛЬНОСТИ НА РОССИЙСКОМ РЫНКЕ Текст научной статьи по специальности «Математика»

CC BY
279
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная эконометрика
Scopus
ВАК
Область наук
Ключевые слова
GARCH / РЕАЛИЗОВАННАЯ ВОЛАТИЛЬНОСТЬ / REALIZED VOLATILITY / HAR-RV / MCS ТЕСТ

Аннотация научной статьи по математике, автор научной работы — Аганин А.Д.

В работе выполняется множественное сравнение большого количества моделей GARCH, ARFIMA и HAR-RVсемейств на данных по качеству одношагового прогноза реализованной волатильности на один день вперед. Сравнение проводится при помощи MCS теста на 10 российских биржевых активах, включая 8 акций и 2 биржевых индекса. Результаты говорят о явном преимуществе моделей семейства HAR-RV над семействами GARCH и ARFIMA и подтверждают обнаруженные в литературе результаты при сравнении отдельных представителей данных семейств.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Аганин А.Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Forecast comparison of volatility models on Russian stock market

This article is dedicated to multivariate comparison of big number of GARCH, ARFIMA and HAR-RV families' models considering their one-day ahead realized volatility, which is known to be a consistent measure of daily volatility. A total of 102 models from three families were included in comparison. Comparison was completed with the help of Model Confidence Set test using 3 different loss functions on 10 Russian stock assets, including eight stock assets and two stock market indices. Received results strongly suggest HAR-RV superior performance to other two families of volatility models on Russian stock market and confirm local findings of previous studies

Текст научной работы на тему «СРАВНЕНИЕ GARCH И HAR-RV МОДЕЛЕЙ ДЛЯ ПРОГНОЗА РЕАЛИЗОВАННОЙ ВОЛАТИЛЬНОСТИ НА РОССИЙСКОМ РЫНКЕ»

Прикладная эконометрика, 2017, т. 48, с. 63-84. Applied Econometrics, 2017, v. 48, pp. 63-84.

А. Д. АганиН

Сравнение GARCH и HAR-RV моделей для прогноза реализованной волатильности на российском рынке

В работе выполняется множественное сравнение большого количества моделей GARCH, ARFIMA и HAR-RV семейств на данных по качеству одношагового прогноза реализованной волатильности на один день вперед. Сравнение проводится при помощи MCS теста на 10 российских биржевых активах, включая 8 акций и 2 биржевых индекса. Результаты говорят о явном преимуществе моделей семейства HAR-RV над семействами GARCH и ARFIMA и подтверждают обнаруженные в литературе результаты при сравнении отдельных представителей данных семейств. ключевые слова: GARCH; реализованная волатильность; HAR-RV; MCS тест. JEL classification: C52; C53; C58.

введение

Волатильность является важным финансовым показателем на финансовых рынках. Обычно под волатильностью принято понимать величину, описывающую изменчивость цены актива. Хотя волатильность не может быть рассчитана напрямую, существуют разнообразные методы ее оценки. Для описания свойств и предсказания волатильности существует множество различных моделей, разрабатываемых на протяжении уже более чем сорока лет, и много работ посвящено исследованию их свойств. Одним из наиболее популярных на протяжении долгого времени является семейство GARCH моделей. Основной особенностью этих моделей является то, что они рассматривают волатильность как ненаблюдаемую величину. Одновременно GARCH модели способны моделировать некоторые важные эмпирические особенности волатильности, чем и объясняется их популярность. Помимо семейства GARCH моделей, в литературе предлагается использование других семейств, таких как ARFIMA, MIDAS, модель Хестона и др. В качестве оценки волатильности и качества прогнозной силы в литературе и на практике широко используется «реализованная волатильность», которая получила широкое применение с появлением высокочастотных внутридневных данных котировок цен. Согласно свойствам этой оценки, реализованная волатильность сходится к ненаблюдаемой волатильности при высокой частоте данных, т. е. является состоятельной оценкой ненаблюдаемой волатильности.

1 Аганин Артем Давидович — Национальный исследовательский университет «Высшая школа экономики», Москва; aaganin@hse.ru.

После того как Corsi (2009) предложил новое семейство HAR-RV моделей, появилось много работ с различными модификациями этой модели, а также сравнениями моделей этого семейства с уже существующими по их прогнозной силе. В литературе можно найти множественные сравнения большого числа GARCH моделей, однако сравнение GARCH и HAR-RV моделей не выполнялось. Среди работ, посвященных сравнению и выбору наилучших моделей с наибольшей прогнозной силой, основное внимание уделяется сравнению небольшого числа моделей из разных семейств, либо сравнению моделей из одного семейства, на основе информационных критериев или R статистиках. Несмотря на то что сравнение GARCH моделей выполнялось многократно, большая прогнозная сила HAR-RV моделей по сравнению с GARCH моделями остается под вопросом. Некоторые исследования (например (Mastro, 2014)) обнаружили, что простейшая HAR-RV модель превосходит модели GARCH(1,1) и EGARCH(1,1).

Целью настоящей работы является сравнение разных семейств моделей волатильности и проверка большей прогнозной силы HAR-RV моделей по сравнению с GARCH и ARFIMA моделями. Сравнивается большое число широко используемых GARCH моделей с распространенным в использовании набором HAR-RV моделей и несколькими ARFIMA моделями. В качестве критерия используется реализованная волатильность. Сравнение моделей выполняется на «out-of-sample» данных, т. е. по имеющимся данным до дня прогноза, и фактическое значение реализованной волатильности, как и другая информация о дне прогноза, являлются неизвестными для моделей в момент построения прогноза. В качестве данных были выбраны 10 российских биржевых активов. Сравнение выполняется при помощи MCS теста, предложенного в (Hansen et al., 2011). В результате сравнения HAR-RV модели с логарифмическим преобразованием имеют статистически большую прогнозную силу и превосходят семейства GARCH и ARFIMA моделей по прогнозу значений реализованной во-латильности.

1. Сравниваемые модели

1.1. Семейство GARCH моделей

Волатильность — один из важнейших показателей, характеризующий разброс временного ряда. Известно, что финансовые ряды на практике имеют непостоянную волатильность, что нарушает условия моделей Блэка-Шоулза и ARIMA, которые часто используются для оценивания опционов и прогнозирования значений финансовых рядов. Поскольку эти и другие модели исходят из предположений о постоянной волатильности, которые нарушаются на практике, для изучения переменной волатильности необходимы специальные модели.

Эмпирические исследования свойств финансовых рядов показали, что волатильности свойственны такие свойства, как кластеризация («группирование» периодов с высокой и низкой волатильностью), а также так называемый эффект «рычага» — уменьшение во-латильности при росте цены, и наоборот.

Одним из первых семейств моделей, предназначенных для изучения рядов волатильности, стало семейство GARCH моделей, первая из которых была представлена в (Engle, 1982) и получила название ARCH (AutoRegressive Conditional Heteroscedasticity). Основным достоинством этой модели был учет гетероскедастичности волатильности. В названии

модели «AR» означает авторегрессию в квадратах доходностей, а «CH» — моделирование § волатильности как условной дисперсии в момент t при известной информации только 2 до момента t — 1 включительно. Фактически в ARCH модели предполагается, что диспер- cj сия текущих «инноваций» (нововведений на финансовом рынке) является функцией от зна- ч чений инноваций в предыдущие моменты времени. ARCH модель можно описать следующим образом. Стандартно для моделей GARCH семейства определяется два уравнения: условного математического ожидания доходности и процесс условной дисперсии. Обозначим через оt дисперсию актива в момент t, а его доходность в этот момент как rt . Тогда доходность финансового актива можно представить в виде процесса

r = m+е, (1)

где et = оtzt — инновации (остатки) и zt ~ i.i.d.N(0,1). Условная дисперсия ARCH(1) модели может быть записана как

о; = w + a1ei2— 1. (2)

На коэффициенты ARCH модели накладываются следующие ограничения: w >0, a1 > 0 для положительности значений дисперсии, а также a1 <1 для стационарности ряда (2). Безусловная волатильность такого процесса может быть рассчитана из уравнения (2) взятием

w

математического ожидания, и она равняется-.

1 — a1

Можно показать, что безусловное распределение остатков е в ARCH модели имеет более толстые хвосты по сравнению с нормальным распределением, т. е. обладает большим куртозисом (показателем, отражающим остроту вершины и толщину хвостов одномерных распределений, и равным 3 для нормального распределения). Куртозис распределения е определяется как

= E(е,) _ E(о4)E(z4) = 3E(о,4) ) = (E(е; )); = (E(о2 )); (E(z; )); = (E(о2 )); ' (3)

Поскольку zt нормально распределена (с куртозисом, равным 3), то из формулы (3) с учетом неравенства Иенсена (E(f (X)) > f (E(X)) для выпуклой функции f (х)) следует, что Kurt(et) > 3, а это говорит о «толстых хвостах» распределения остатков.

Bollerslev (1986) предложил обобщенную GARCH(p, q) модель, которая предлагает более элегантный способ представления ARCH модели с большим числом лагов:

а2 = ю-

> i. (4)

¿=i i=i

На параметры модели (4) налагается ограничение w >0, а также условие стационарности 2 >>+2'j* i<L

Можно заметить, что GARCH модель фактически является ARMA моделью в квадратах остатков. Для этого запишем GARCH(1,1) модель как

о2 = а0 +«ie2-i +/?ia2-i. (5)

Условный прогноз ошибки (разность между квадратом остатков доходностей ег и его условным математическим ожиданием) обозначим как vt = е2 — Бм (е2) = е2 — о2, где Ем (е() является математическим ожиданием еt, основанным на доступной информации в момент t — 1. Это позволяет переписать GARCH(1,1) модель как

что является уравнением ARMA(1,1) модели относительно квадратов остатков. Из этого следует, что GARCH модели обладают свойствами ARMA моделей.

После введения классической GARCH модели было предложено множество ее модификаций, которые позволяют учесть дополнительные эффекты, наблюдаемые на эмпирических данных, такие как асимметрическая реакция на прошлые изменения волатильности, эффект «рычага», замеченный в (Black, 1976) и др. Наиболее популярными моделями GARCH семейства являются следующие.

11. H-GARCH или ALLGARCH: оf = w + ^" «,-ôof—j[| et ~k I I £t ~ k 1Г + 2 " ßj°2-

Множество исследований показывают негативный вклад увеличения количества лагов в качество прогноза GARCH моделей. Поэтому обычно используются спецификации с р <2 и q <2 . Следует отметить, что GARCH(1,1) модель является наиболее популярной и часто используемой среди остальных.

Для оценивания параметров GARCH моделей по данным доходностей актива общепринятым является метод максимального правдоподобия, а также его модификация — метод

£i2 — vt = «о +«А-1 + ßi («M - Vi),

£2t = «0 + («i +ßi K-i +vt -ßvt-1,

(6)

10. CSGARCH: qt = w+pqt — 1 + ^(e2_i — o2—1),

o 2=q^(e2—i—q—)+2i=iß j (o t—j—q—j) 2.

i=1

квази-правдоподобия. Несмотря на их повсеместное применение, эти методы обладают су- § щественными недостатками: их сходимость не гарантирована, а оптимизация для поиска S параметров может занимать длительное время. Основным достоинством этих процедур яв- ej. ляется состоятельность полученных оценок.

В качестве процесса доходностей актива (1) часто также используется ARMA процесс c малым количеством лагов. Выбору лаговой структуры этого ARMA процесса обычно не уделяется много времени, поскольку он слабо влияет на прогноз волатильности. Помимо общепринятого предположения о нормальности ошибок, в (1) было предложено множество других распределений, которые могут лучше описывать некоторые наблюдаемые особенности финансовых данных, такие как асимметрия и толстые хвосты распределения остатков. Среди наиболее используемых можно выделить следующие четыре.

1. Нормальное распределение с плотностью

2

1 _ ( x~m)

f (x) = ^= e 2^ . (7)

a

2

Я0 2

2. Скошенное /-распределение Стьюдента. Пусть xV имеет /-распределение, V — число степеней свободы. Обозначим

V

(8)

' ф I (v- 2)

и его стандартизированную функцию плотности как

f(e I v) =

Г(( v + 1)/2 )

V(v- 2) ^r(v/ 2)

v-2

-( v+1V2

(9)

где Г( x) — гамма-функция, v — число степеней свободы /-распределения. Lambert, Laurent (2001) предложили использовать подход (Fernandez, Steel, 1998) к стандартизированному /-распределению и из него получить стандартизированное скошенное /-распределение Стьюдента с учетом как скошенности, так и эксцесса стандартизированных остатков:

g (e I X, v) =

2

x + 1/ X Pf (X(pe + w)| v), если e < -w I p, X 2 X (10) pf ((pe + w)I£ I v), если e >-w Ip.

В этом представлении X есть параметр скошенности, а р и т можно рассчитать как

*=^^Щгр2(е-1/X)' = <Х= +1/Х2 -.)-(т)2.

3. Нормальное обратное гауссовское распределение. Плотность вероятности случайной величины X с обратным гауссовским распределением и вектором параметров в = (а, Д б, т) можно записать как

„л Kj (Jd2 +(x -m)2)

/(x; 0) = ™ ex—m) Л12 2 ' , (11)

* д/л2 + (x —m)2

где x £ R, a > 0, ^ £ (-a; a), Л £ (0, ю), g = a2 , а kj обозначает модифицированную функцию Бесселя третьего рода с индексом 1: kj (w) = j^ exp {— (w(i + Г1 ))/2}flfr.

4. Johnson's reparametrized SU распределение. Первоначальное Johnson's SU распределение было предложено Johnson (1949). Репараметризированная версия этого распределения имеет больший, по сравнению с нормальным, куртозис и выводится из Johnson's SU распределения с теми же математическим ожиданием и дисперсией, как и первоначальное распределение. Функцию плотности вероятности такого распределения можно записать в виде следующих выражений:

t 1 1 — jz2

/(УI m,s,v,t) =---_=e 2 , (12)

cs Vr +J

z = —v + t/ sinh r, (13)

y — (m + csVw sinh Q) ,, ^

r = -—---, (14)

cw

c = ^2/((w — 1)[wcosh(2Q) +1]). (15)

Здесь т >0 — куртозис этого распределения, V — коэффициент скошенности, т и □ определяются как т = ехр{г— } и □ = v/т соответственно. Если т то это распределение совпадает с нормальным.

Как можно заметить, GARCH модели рассматривают волатильность как ненаблюдаемую величину и поэтому требуют полностью определенного условного математического ожидания и условной вероятности для расчета латентной волатильности. Несмотря на такое представление, GARCH модели неспособны воспроизвести важные наблюдаемые особенности волатильности финансовых данных. В частности, GARCH модели не обладают долгой памятью (автокорреляция уменьшается с экспоненциальной скоростью), а использование сложных оптимизационных процедур оценивания требует больших затрат времени.

1.2. Семейство HAR-RV моделей

Первая HAR-RV (The Heterogeneous Autoregressive model of the Realized Volatility) модель была предложена F. Corsi в 2009 году (Corsi, 2009). Эта модель основана на концепции поведения агентов на финансовых рынках, согласно которой они отличаются своим восприятием волатильности в зависимости от их инвестиционных горизонтов и делятся на краткосрочных, среднесрочных и долгосрочных. Гипотеза о существовании таких гетерогенных структур на финансовых рынках (гипотеза о гетерогенности рынков) была сформулирована в (Müller et al., 1997) следующим образом.

1. Разные агенты на гетерогенном рынке обладают разными сроками инвестирования § и участвуют в торговле на бирже с разной частотой. Например, к участникам высокочастот- S ных торгов (краткосрочным агентам) относятся Forex дилеры и маркетмейкеры (чьи пози- ej. ции открываются и закрываются в течение дня), к долгосрочным агентам можно отнести центральные банки и некоторые фонды. Каждая отдельная группа таких агентов (компонент гетерогенного рынка) реагирует на новости, поступающие на рынок, с разной скоростью

в зависимости от ее горизонта инвестирования. Если предположить, что память каждого компонента (т. е. скорость убывания значений автокорреляционной функции с ростом лага) является экспоненциально убывающей с определенной временной константой (что верно для GARCH(1,1) модели), то память всего рынка будет состоять из множества таких экспоненциально убывающих составляющих с разнообразными значениями временных констант. При этом их суперпозиция будет вести себя как процесс с гиперболически убывающей автокорреляцией.

2. В то же время, чем больше агентов присутствует на гомогенном рынке, тем быстрее оценки стоимости некоторого актива разных агентов сходятся к «реальной рыночной цене», относительно которой все агенты имеют рациональные ожидания. То есть в случае однородного рынка должна наблюдаться отрицательная корреляция волатильности с рыночной активностью, что не наблюдается в действительности. Однако на гетерогенном рынке агенты будут надеяться на разные уровни цены и будут принимать разные решения о покупке/ продаже активов в различных ситуациях, что приведет к росту волатильности с увеличением числа агентов на рынке.

3. Рынки также отличаются по географическому положению своих агентов. Так, была замечена низкая корреляция между внутридневными ценами с лагом 1.5 суток, что соответствует агентам в противоположных полушариях, и высокая корреляция между ценами с лагом в 1-2 суток, что соответствует одним и тем же агентам.

Согласно гипотезе о гетерогенности рынка, рыночные агенты отличаются также по другим характеристикам, таким как склонность к риску, институциональные ограничения и транзакционные издержки.

В результате агенты с разными временными горизонтами будут анализировать рынок с разной частотой и поэтому создавать (либо оказывать влияние на) разные виды волатильности. Экономическая интерпретация долгосрочной волатильности оm заключается в наличии неопределенности фундаментальных макроэкономических факторов, среднесрочная компонента волатильности оw отражает текущую неопределенность на рынке, связанную с обработкой поступающих на рынок новостей, а краткосрочная волатильность оd включает в себя неопределенность, связанную с возникновением спекулятивных моментов.

Семейство HAR-RV моделей основывается на гипотезе о гетерогенности рынка. Модели этого семейства способны воспроизводить наблюдаемые свойства волатильности, такие как: «длинная память» и устойчивость волатильности, «каскад волатильности» (иерархич-ная структура волатильности, при которой долгосрочная волатильность оказывает сильное влияние на краткосрочную волатильность, однако краткосрочная волатильность почти не влияет на долгосрочную), «толстые хвосты», а также имеют экономическую интерпретацию. Хотя сами по себе они не являются моделями с длинной памятью, а представляют собой сумму AR процессов, однако в работе (LeBaron, 2001) было показано наличие эффекта долгой памяти даже для суммы трех AR(1) процессов, что также подтверждается эмпирическими результатами расчета корреляционной функции для HAR-RV моделей. Еще одной

особенностью HAR-RV модели является рассмотрение волатильности как ненаблюдаемой величины, для которой существует наблюдаемая оценка, которую можно оценить при помощи высокочастотных данных. Эта оценка называется реализованной волатильностью и обозначается RV.

Простейшую HAR-RV модель можно сформулировать следующим образом. Пусть pt . — цена актива в день t на конец внутридневного интервала j длины А (секунд), j = 1,...,N с общим числом таких интервалов за один день, равным N . Тогда rt . = log(pt .) — log(pt j—1) — внутридневная доходность актива на временном интервале длины А .

Реализованную волатильность в день t можно записать как

N

RV = . (16)

j=i

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Такая форма RV является оценкой дневной волатильности. Использование высокочастотных данных о ценах позволяет моделировать волатильность как некоторую виртуальную, но обозримую величину, в отличие от моделирования ненаблюдаемой латентной переменной, как это делается в ранее рассмотренных GARCH моделях (Engle, 1982; Bollerslev, 1986) или латентной стохастической модели волатильности (например (Taylor, 1994)). Другой важной особенностью HAR-RV модели является ее гетерогенная структура, которая позволяет учесть рассмотренную выше гетерогенность рынка. HAR-RV модель представляет волатильность как сумму дневного, недельного и месячного компонентов. Обычно HAR-RV модель рассчитывается с параметрами (1,5,21), что соответствует лагам дневной, недельной и месячной RV:

RVt+1 = ßo + W + W +ßmRVtm +еж, (17)

где £t+1 — случайный шок, RVt d — реализованная волатильность в день t, RVtw — лагирован-

w

ная недельная волатильность за предыдущую неделю, определяемая как RVtw = - У RV_,

4 *=1

и RVtm — месячная волатильность, определяемая похожим образом как RVtm = — у RVt-i.

Вместо параметров (1,5,21) можно использовать любой другой набор лагов в правой части уравнения (17). Однако в работе (Andersen et al., 2007) в результате сравнения моделей с разными параметрами было показано, что дневная, недельная и месячная компоненты наиболее точно описывают гетерогенную структуру и являются оптимальным набором параметров. В последнее время во многих сравнительных работах авторы рассматривали HAR-RV модель как возможно наилучшую модель при анализе и моделировании RV. Таковы, например, статья (Soucek, Todorova, 2014), посвященная исследованию с помощью HAR-RV модели роли скачков в эффекте увеличения волатильности одного актива при увеличении волатильности другого для индекса S&P500, а также работа (Lahaye, Shaw, 2014), в которой для моделирования индекса S&P500 оказалось достаточно линейной спецификации HAR-RV модели.

Спецификация лагов HAR-RV модели была протестирована в работе (Craioveanu, Hillebrand, 2012), где также подтвердилось преимущество HAR-RV(1,5,21) модели. Относительно частоты внутридневных данных, используемых при построении RV, Liu et al. (2013) обратили особое внимание на оценку RV, построенную по данным пятиминутных интервалов.

Это важное для настоящей статьи исследование показало, что из 400 оценок волатильности, t построенных для 31 актива из пяти разных классов активов, ни одна оценка не может пре- g взойти RV, построенную по пятиминутным интервалам, при прогнозировании будущей во-латильности при помощи HAR-RV модели. В соответствии с этим результатом в настоящей ^ статье реализованная волатильность также рассчитывалась по данным цен закрытия пятиминутных интервалов.

Поскольку реализованная волатильность имеет логнормальное распределение, то естественно перейти к HAR-RV модели с логарифмами:

log(RVi+i ) = & + & log(RVtd) + & log(RVtw) + & log(RV;) + ei+i. (18)

Другой популярный подход заключается в моделировании стандартных отклонений, а не самих реализованных волатильностей, в результате чего получается нелинейная модель вида

= & +(idJRvf +/3wJRÎ7 +Pm4RÎ7 (19)

Позже было предложено множество модификаций базовой HAR-RV модели, учитывающих дополнительные свойства RV. Одной из первых стала LHAR-RV-J модель, отдельно рассматривающая скачки. Рассмотрим построение этого компонента.

Общим подходом к расчету компоненты скачков является подход, основанный на работе (Barndorff-Nielsen, Shephard, 2004), который формулируется следующим образом.

Пусть, как и прежде А — период (длина внутридневного интервала) внутридневной доходности. Как было сказано выше, реализованная волатильность получается суммированием соответствующих N внутридневных доходностей:

N

RVt+1 (А) = 2й,,. (20)

j=1

Из свойств квадратической вариации (см., например, (Andersen et al., 2003)) следует, что реализованная волатильность равномерно (по t из любого конечного интервала [0, T] ) сходится по вероятности к приращению квадратической вариации процесса доходности с уменьшением длины внутридневного интервала А , используемого для расчета RV. Это одна из главных причин использования реализованной волатильности в качестве критерия прогнозирования при сравнении моделей волатильности. Так, если предположить наличие дискретных скачков в RV, то получим, что при А^ 0

RVM (А) ^ /"а2 (s)ds + 2 *(s), (21)

t < s<t+1

где s) — величина скачка, а суммирование идет по скачкам в t+1 день (по всем интервалам внутри дня, на которых были скачки). Если бы скачки в рядах RV отсутствовали, то реализованная волатильность была бы состоятельной оценкой интегрированной волатильности, широко используемой в научной литературе по стохастической волатильности и оцениванию опционов. Однако реализованная волатильность часто включает в себя и непрерывный процесс, и процесс скачков. Из этого можно сделать вывод, что модель с наибольшей прогнозной силой должна моделировать эти компоненты по отдельности, в отличие от базовой

HAR-RV модели (17), в пользу чего говорит исследование (Corsi et al., 2010). На практике было предложено использовать оценку bipower variation, рассчитанную как

N

BVM (А) = Ц-j II Г,j-il, (22)

2 j=2

для которой можно показать, что при А — 0 она будет сходиться к интегрированной вола-тильности:

BV+ (А) —/+а2 (s)ds. (23)

Объединяя результаты (21) и (23), можно сделать вывод, что вклад скачков, вносимый в процесс квадратической вариации, может быть состоятельно оценен (при А — 0) как

RV+ (А) - BVM (А) — (s). (24)

t < s<t+1

Это основная идея расчета скачков. Barndorff-Nielsen, Shephard (2004) предложили при расчетах ограничивать разность в левой части (24) нулем, чтобы обойти ситуации с отрицательным значением для квадрата скачка. Формально это можно записать так:

J+ = max {RVM (А) - BV+ (А), 0} . (25)

Первой модификацией, рассматривающей скачки как отдельный компонент, стала HAR-RV-J модель, включающая значение скачка за предыдущий день:

RVi+i = ( + (DRVf +($WRV; +Р MRVtm + (j.Jd + , (26)

а также ее лог-модификация

log RVt+1 = ( +(d log RVd +(w log RVW +(m log RVm +(j log(Jd +1) + еж. (27)

Рассчитав скачок, его можно включать не только как значение в момент t (как это делается в HAR-RV-J модели), но и представлять в виде той же гетерогенной структуры, которая используется при разбиении RV на гетерогенные компоненты, аналогично поступая и с непрерывной частью реализованной волатильности. Полученная модель получила название HAR-RV-CJ модели и может быть записана в виде

RVt+1 = (0 + (cDCd + (cwCW + (cmCT + (jDJd + (jwJW + ( jmJT + ^+1, (28)

где C соответствует непрерывному компоненту RV и оценивается как bipower variation по формуле (22).

Помимо скачка, в литературе было предложено включать компонент «рычага» для учета соответствующего эффекта, объясненного ранее. В качестве оценки для дня t предлагается использовать минимум между дневной доходностью и нулем: r- = min(rt,0). Это позволяет отдельно оценить эффект от увеличения волатильности в случае отрицательных доходностей.

В результате для учета эффекта «рычага» были предложены LHAR-RV-J модель и ее § лог-версия: S

RVM = ( + ( DRVtd +(iwRV; +/3MRVm + ( J d + A" + , (29) 3

logRV+i = (0 +( logRVtd +( logRVW +(m logRVm +( ++log(Jdt +1) + /r" +e+, (30)

а также LHAR-RV-CJ модель и ее лог-модификации:

RV+i = (о + (cDQd + + (cmC + (J +(jwJW +(JMJ7 + + Ydrtd-+Ywr;-+Ymrr-+eM,

log RVt+1 = (о + (CD log Cd +(cw log Cf + (cm log Ctm + (jd log( Jd +1) +

+ (jw log(Jf +1) + (jm log(Jtm +1) + />/" +gf-rtf" +gm-rtm- +

(31)

(32)

Эти и другие варианты модели с эффектом рычага были рассмотрены в (Corsi, Reno, 2012). В целом, семейство HAR-RV моделей показывает хорошие результаты при моделировании волатильности (по информационным критериям и R ), а простота применения этих моделей и понятная экономическая интерпретация коэффициентов служат катализаторами роста их популярности.

1.3. ARFIMA модели

Еще одной моделью, получившей распространение для моделирования волатильности после появления оценок реализованной волатильности, является АЯЛМА( р, й, q) модель, которая является обобщением АММА модели. Ее главным отличием является возможность использования действительного показателя интегрированности, принимающего значения от -0.5 до 0.5. Основным ее преимуществом является возможность моделирования долгосрочных зависимостей, т. е. она обладает долгой памятью, в отличие от обычной АЫМА модели с короткой памятью.

АЯЛМА( р, й, q) модель можно записать как

Ф(Е)(1 — Е)а (КУ< — т) = ©ак, е, ~1.Ы. (0, аЕ2),

где L — лаговый оператор, Ф(£) = 1 — —... — <рри, ©(О = 1 + L +... + vqZ' и (1 — L)а — оператор дробного интегрирования, определяемый как

Г(к — й) ¿к

q

(1 — L)d =2

=0 Г(—d ) Г( к+1)

к=0

В литературе по примеру Andersen et al. (2003) в качестве параметров p, d, q принято использовать наборы (1,0.401,0) и (5,0.401,0). Использование данной модели позволяет напрямую моделировать реализованную волатильность и учитывать долгосрочные зависимости, которые не способны учесть GARCH и HAR-RV модели.

2. методика сравнения

К настоящему времени в литературе предложено множество тестов для сравнения набора конкурирующих моделей. Основным недостатков всех этих тестов является зависимость результата от особенностей природы используемых данных, что на практике может привести к разным результатам сравнения для разных активов. Большинство существующих тестов предназначены для сравнения небольшого числа моделей, поэтому неуместны при сравнении двух больших семейств.

Для сравнения больших наборов моделей можно выделить два подхода. Первый из них опирается на использовании тестов, предложенных Hansen. Первым тестом, получившим большую популярность при сравнении большого набора моделей, стал тест из (Hansen, Lunde, 2004) под названием Superior Predicative Ability (SPA). Будучи модификацией теста White (2000), он использовался для сравнения представителей GARCH моделей, обладая при этом большей робастностью и мощностью, что и было продемонстрировано в (Hansen, Lunde, 2004). SPA тест оставался популярным некоторое время, поскольку мог использоваться для сравнения наборов моделей и даже стратегий, не связанных с волатильностью. Основное достоинство и одновременно недостаток этого теста заключается в возможности сравнить одну модель (бенчмарк) с набором конкурирующих и выявить среди них наличие либо отсутствие моделей, превосходящих бенчмарк. При этом возможность одновременного существования нескольких одинаковых по прогнозной силе моделей не рассматривается, и выявить множество таких моделей нельзя.

Позже Hansen et al. (2011) предложили тест Model Comparison Set (MCS), имеющий более широкое применение, допускающий существование набора нескольких наилучших моделей с одинаковой прогнозной силой (или с одинаковой производительностью по какому-то другому критерию). Другим часто используемым подходом являются тесты Value at Risk (VaR), основанные на понятии VaR. Эти тесты требовательны к размеру периода прогнозирования, размеру базового периода и производительности компьютера, чаще всего применяются для оптимизации портфелей, поэтому проведение VaR тестов для данной задачи сравнения моделей можно считать нецелесообразным и излишне времязатратным.

Тест Model Confidence Set

Для описанных ранее целей Hansen et al. (2011) предложили новый тест — Model Confidence Set (MCS). Этот тест не требует предположения о превосходстве какой-либо одной модели над другими (выбора бенчмарка), допускает возможность существования множества моделей (а не единственной, как в SPA тесте) с одинаковым превосходством над остальными, а также позволяет учитывать несовершенство данных. Под этим учетом понимается расширение искомого множества моделей с включением некоторых дополнительных, не являющимися равными им по заданному критерию, в случае, если имеющейся информации в данных недостаточно для определения истинного набора «равнопроизводи-тельных» моделей.

Перейдем к построению самого теста. Пусть M0 — множество, включающее конечное число моделей (проиндексированных i = 1,..., m0). Выполнение теста начинается с оценивания всех моделей из множества по ряду данных за R дней, предшествующих дню,

для которого необходимо выполнить прогноз. После получения оценок коэффициентов § модели делается прогноз на следующий день k, где k = 1,..,n, an — общая длина гори- S зонта прогнозирования. Полученный прогноз обозначим через hk, а фактическую реали- ej. зованную волатильность в этот день — RVk. После прогнозирования модель оценивается по данным за R дней, но уже со сдвигом на один день вперед, включая информацию дня k, на который перед этим сделан прогноз. После оценивания моделей по новым данным снова делается прогноз на день k + 1 и так далее, пока для каждой модели не будет получен ряд прогнозов для всех k.

Для каждого дня t и каждой модели i обозначим функцию «потерь» через Lit. Эта функция является тем самым критерием, относительно которого выполняется сравнение моделей. Поскольку данная работа посвящена сравнению моделей волатильности, то в качестве критерия можно использовать, например, функции потерь (33). Очевидно, чем ближе прогнозное значение к фактическому, тем лучше выполнен прогноз.

1 n

MSE = -Y(RVt —h)2, nf-1n

MAE = -21 RVt -ht |, (33)

n

R2LOG = - ^(log (RVjht ))2. n t=i

Относительную производительность модели i относительно модели j в день t определим как dj t = Lit — Lj t для всех i, j G M0. Производительность модели i в день t относительно всех остальных моделей можно определить как

^ , i = 1,.., m. (34)

i,t

m .

* jGM

Поскольку в дальнейшем нас будет интересовать прогнозная сила моделей на всем интервале, то индекс t будет опускаться. Множество моделей с наилучшей производительностью (финальное множество) на всем временном интервале определим как

M* ={i G M0 : E(dy) < 0 для всех j G MJ. (35)

Формально нулевую и альтернативную гипотезы теста на эквивалентность можно сформулировать двумя способами:

Ho m : E(dj) = 0 для всех i, j G Mo,

, (36)

HA M : E(diy) ^ 0 для некоторых i, j G M0 или ,

H0M : E(d,..) = 0 для всех i G M0,

(37)

HA M : E(d,..) ^ 0 для некоторых i G M0,

где E(dj.) и E(di.) предполагаются конечными и не зависящими от времени. Hansen et al. (2011) использовали следующие две статистики для тестирования нулевой гипотезы H0 против H A :

t.. =

d Jfötd,), t, = d,./^Var(d ..) для i, j G M, (38)

где M — тестируемое множество моделей, dи dt, — относительные потери, рассчитанные по имеющимся данным, Var(dj) и Var(dI.) являются оценками дисперсии истинных дисперсий Var(dj) и Var(dI.) соответственно, полученными при помощи процедуры бутстрапа. Hansen et al. (2011) использовали процедуру блочного бутстрапа с построением 5000 «повторных» выборок, которые состоят из значений имеющихся потерь моделей, случайным образом переставленных блоками на произвольные места. Такие блоки позволяют сохранить временную зависимость, имеющуюся в исходных данных.

От нулевых гипотез теста на эквивалентность, сформулированных в (36) и (37), логично перейти к статистикам

TR,M = maX 1 t j L Tmax,M = maX ti. , (39)

i, j£M J i, j£M

где tj и t. определены в (38). Асимптотическое распределение этих статистик не является стандартным, поэтому это распределение при выполнении гипотезы H0 тоже необходимо оценивать при помощи процедуры бутстрапа.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выбор наихудшей модели на исключение из множества M выполняется при помощи исключающего правила, которое основывается на тесте, основанном на статистике (38), и формулируется как

/>/vaT(dj) )L

: arg max -j sup

,GM 1 jGM J (40)

/>/Vàï(dI..)}.

emax,M = argmax <c

iEM

Фактически, MCS тест состоит из двух повторяющихся шагов, применяемых к множеству M — проведение теста на эквивалентность dM и проверка исключающего правила eM . Если тест dM отклоняется, то не все модели в множестве M одинаково «хороши» по заданному критерию, и в этом случае применяется исключающее правило, чтобы исключить модель с наихудшей производительностью на используемых данных в множестве M . После исключения такой модели процедура повторяется заново до тех пор, пока нулевая гипотеза теста dM не будет отклонена, что будет означать, что M состоит только из моделей с одинаковой производительностью. При проведении всех тестов используется один и тот же уровень значимости а, что гарантирует lim P (M* С M—) > 1 — а. Процедура MCS теста рассчитывает Р-значения для каждой из моделей. Для модели i Е M0 MCS Р-значение pt является порогом, при котором модель i Е M1—a тогда и только тогда, когда pt >а. В результате модели с маленькими Р-значениями, скорее всего, имеют плохую производительность относительно других моделей в M0.

Алгоритм выполнения MCS теста состоит из следующих шагов.

1. Изначально считаем все модели равносильными: M = M0.

2. Тестируем H0M , используя dM с доверительным уровнем а.

3. Если H0M не отвергается, то алгоритм_завершается, и искомым множеством моделей с вероятностью 1 — а является текущее: M 1-а = M . Если же H0 отвергается, то не все

модели статистически равны по производительности, и используется исключающее прави- § ло ем, чтобы определить модель с наихудшей производительностью и исключить ее из те- 2 кущего множества М , после чего алгоритм возвращается к шагу 2. ^

В лучшем случае после выполнения алгоритма MCS теста в финальном множестве остается единственная модель. Однако если в данных содержится недостаточно информации для теста на эквивалентность, то ему не будет хватать мощности для разделения моделей по их производительности на хорошие и плохие. Недостаток мощности приведет к тому, что алгоритм MCS теста будет в среднем завершаться преждевременно, а финальное множество будет состоять из большого числа моделей, включая некоторые с худшей производительностью.

Если же имеющейся информации в данных достаточно, то тест отвергнет все ложные нулевые гипотезы, и, более того, исключающее правило не будет ставить под сомнения действительно превосходящие модели, пока в текущем множестве остаются модели с плохой производительностью. При этом вероятность того, что одна или несколько наилучших моделей будут исключены, асимптотически ограничена доверительным уровнем теста.

В силу последовательного применения тестов при выполнении алгоритма MCS логично задуматься о проблеме накопления ошибок первого рода с нежелательными последствиями. Однако последовательное применение тестов прекращается, как только нулевая гипотеза отвергается.

В целом, в результате выполнения MCS теста определяется множество моделей с одинаковой производительностью согласно заданного критерия, что может быть, в частности, полезно для прогнозирования волатильности.

3. результаты эмпирического сравнения

Для эмпирического сравнения были взяты 88 GARCH моделей со структурой, рассмотренной в разделе 1.1, десять HAR-RV моделей, описанных в разделе 1.2, а также четыре ARFIMA модели — две с фиксированными параметрами: (1, 0.401, 0), (5, 0.401, 0), и две с оцениваемым параметром d : (1, d, 0), (5, d, 0). Сравнение выполнялось на данных котировок десяти российских активов: акциях алмазодобывающей компании «АЛРОСА» (ALRS), акциях энергетической корпорации «Газпром» (GAZP), горно-металлургической компании «Норникель» (GNWK), нефтяной компании «ЛУКОЙЛ» (LKOH), композитного фондового индекса ММВБ (MICEX), телекоммуникационной компании «МТС» (MTSS), нефтегазовой компании «Роснефть» (ROSN), биржевого индекса Russian Trading System Cash Index (RTSI), акциях Сбербанка России (SBER) и акциях ВТБ банка (VTBR) с 09 сентября 2013 г. по 12 мая 2016 г., что в целом составляет 654 торговых дня.

Для сравнения использовались данные котировок на закрытии торговых сессий, а также внутридневные данные — цены закрытия внутридневных пятиминутных интервалов. При этом данные первых 504 дней использовались исключительно для оценивания моделей, а «out-of-sample» периодом служили следующие 150 дней, на которых происходило сравнение прогнозной силы моделей.

На рисунке 1 темные линии соответствуют логарифму из корня реализованной волатиль-ности, рассчитанной согласно (16), а более светлые линии соответствуют логарифму из корня дневной волатильности, рассчитанному как log оt = log^(log pt — log pt—1) .

2013-09-02 / 2016-05-12

2013-09-02 / 2016-05-12

IHIMIVMHIHiMI

»■Il шат шя lia

2013-09-02 / 2016-05-12

-6,----

2013-09-02 / 2016-05-12

■—

2013-09-02 / 2016-05-12

^——

2013-09-02 / 2016-05-12

-

Sep 02 2013 Jan 06 2014 May 02 2014 Sep 01 2014 Jan 05 2015 May 05 2015 Sep 01 2015 Jan 04 2016 May 04 2016

Рис. 1. Реализованные и дневные лог-волатильности

По графику легко убедиться в наличии большого количества шумов в дневной оценке во-латильности (глядя на высоту вершин дневных оценок реализованной волатильности и оценок дневной волатильности, построенной по ценам закрытия), в то время как реализованная волатильность выглядит более сглаженной. Это подтверждает сказанное выше о преимуществе использования реализованной волатильности в качестве критерия при прогнозировании волатильности.

Как видно, у всех активов наблюдаются два пика: в марте и в декабре 2014 г., что соответствует падениям рынка, связанным с политическими событиями. Программа для сравнения моделей была написана на языке программирования R с использованием библиотеки rugarch, реализованной Ghalanos (2015), которая способна оценивать большое число

GARCH моделей. Эта библиотека написана большей частью на языке С, что позволяет § оценивать GARCH модели гораздо быстрее по сравнению с кодом, написанным на R, что 2 существенно для данной работы из-за необходимости многоразовой переоценки большо- cj го числа моделей.

Из GARCH семейства были взяты 11 моделей, описанных в разделе 1.1, с двумя структурами лагов ((1,1) и (2,1)), а также четырьмя разными условными распределениями случайной ошибки (нормальное, скошенное /-распределение Стьюдента, обратное гауссовское распределение и Johnson's reparametrized SU распределение, описанные в (7)-(15)), что в сумме дает 88 моделей. В качестве процесса математического ожидания доходностей использовался ARMA(1,1) процесс.

Из семейства линейных HAR-RV моделей в сравнении участвовали HAR-RV, HAR-RV-J, HAR-RV-CJ, LHAR-RV-J и LHAR-RV-CJ модели, а также их логарифмические нелинейные модификации, описанные в уравнениях (17)-(28). Все модели оценивались со стандартными параметрами гетерогенности (1, 5, 22).

Использовались данные «движущегося окна» из 504 торговых дней с дальнейшим расчетом «out-of-sample» одношагового прогноза на один день вперед. Это означает, что в каждый момент времени t модель оценивалась по данным дней [t — 503: t], а затем выполнялся прогноз на день t +1. Затем модель заново оценивалась в день t +1 и строился прогноз для дня t + 2.

В итоге для каждой из 102 моделей было получено 150 одношаговых прогнозов волатиль-ности на один день вперед. Затем они сравнивались с фактическими реализованными вола-тильностями в эти дни при помощи теста MCS для выявления множества моделей, значительно превосходящих остальные по прогнозной силе, а также разницы в прогнозах между GARCH, ARFIMA и HAR-RV семействами. Сравнение большого набора GARCH, ARFIMA и HAR-RV моделей, а также использование теста MCS позволяет ответить на вопрос «Действительно ли HAR-RV модели превосходят семейство GARCH моделей при прогнозе реализованной волатильности?», о чем говорят сравнения отдельных представителей этих семейств. Включение ARFIMA моделей должно не только проверить обнаруженное в литературе преимущество HAR-RV моделей за счет включения реализованной волатильности, но и ответить на вопрос «Действительно ли гетерогенная структура HAR-RV необходима для прогнозирования реализованной волатильности?».

В таблице 1 приведены результаты выполнения теста MCS для 10 биржевых активов. В качестве функции потерь были рассмотрены три варианта, приведенные в (33), при этом каждый раз строилось 5000 ресэмплов для тестовых статистик процедуры MCS теста. В результате сравнения можно сделать вывод, что семейство HAR-RV моделей значительно превосходит все рассмотренные GARCH и ARFIMA модели при прогнозировании реализованной волатильности. Согласно проведенным тестам, при трех разных функциях потерь в финальное множество моделей, равных по предсказательной силе и превосходящих остальные, вошли только HAR-RV модели.

Более того, практически всегда финальное множество состояло из нелинейных LOG-HAR-RV моделей, что согласуется с логнормальным распределением реализованной волатильности и предыдущими исследованиями. Поскольку на практике реализованная во-латильность чаще всего используется в качестве наиболее точной оценки волатильности, то логарифмические модификации HAR-RV моделей являются предпочтительными для использования при работе с дневной волатильностью.

Таблица 1. Результаты тестирования при помощи процедуры МС8

Модели АЬШЭА ОАгР ОМКЫ ЬКОН МГСЕХ МТЭЭ ШвЫ КШ ЭВЕЯ УТВЯ

1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3

НАЯ-Ю/ * * * * * * * * * * * * * * *

ШО-НАЯ-Ю/ * * * * * * * * * * * * * * * * * * * * * * * * * * * * *

* * *

ШО-НАЯ-Ю« * * * * * * * * * * * * * * * * * * * * * * * * * * * *

ЮО-НАК-Ю/-С1 * * * * * * * * * * * * * * * * * * * * *

* * *

* * * * * * * * * * * * * * * * * * * * * * * *

ЬНАЯ-Ю/-С1 * * * *

ШО-ЬНАК-Ю/-С1 * * * * * * * * * * * * * * * * * * * * *

Примечание. Цифры 1,2,3 обозначают функции потерь МБЕ, МАЕ, К2ЬОО соответственно. Звездочками отмечены модели, попавшие в финальное множество МСЭ теста.

Выводы g

s

В работе выполнено сравнение более 100 представителей трех семейств моделей по их про- cj гнозной силе при прогнозировании реализованной волатильности на один день вперед с ис- ч пользованием котировок 10 российских биржевых активов, в том числе по ценам 8 акций российских компаний и двух биржевых индексов. Поскольку в абсолютном большинстве работ реализованная волатильность используется в качестве критерия при прогнозировании волатильности и как наилучшая оценка дневной волатильности, то на основе выполненного сравнения можно сделать вывод в пользу HAR-RV моделей. Полученные результаты уверенно говорят в пользу выбора модели из HAR-RV семейства при построении одношагово-го прогноза волатильности.

Главной причиной таких результатов является использование реализованной волатильности при оценивании HAR-RV моделей. GARCH модели, оцениваемые по ценам закрытия торговых дней, неспособны воспроизводить особенности реализованной волатильности, в результате чего ни одна из 88 моделей не попала в множество незначимо отличающихся по прогнозной силе моделей. Хотя ARFIMA модели напрямую моделируют реализованную волатильность, им также не удалось попасть в финальное множество моделей. Это говорит о том, что представление реализованной волатильности в виде суммы трех компонент в модели HAR-RV позволяет значительно улучшить прогноз.

Полученные результаты согласуются с проведенными в литературе исследованиями, содержащими сравнения отдельных представителей семейств GARCH, ARFIMA и HAR-RV моделей, и подтверждают превосходство HAR-RV семейства над остальными на данных российских биржевых активов.

Список литературы

Andersen T., Bollerslev T., Diebold F. X. (2007). Roughing it up: Including jump components in measuring, modeling and forecasting asset return volatility. Review of Economics and Statistics, 89 (4), 701-720.

Andersen T., Bollerslev T, Diebold F. X., Labys P. (2003). Modeling and forecasting realized volatility. Econometrica, 71 (2), 579-625.

Barndorff-Nielsen O., Shephard N. (2004). Power and bipower variation with stochastic volatility and jumps. Journal of Financial Econometrics, 2 (1), 1-37.

Black F. (1976). Studies of stock price volatility changes. In: Proceedings of the 1976 Meeting of the American Statistical Association, Business and Economic Statistics Section, 177-181.

Bollerslev T. (1986). Generalized autoregressive conditional heteroskedasticity. Journal of Econometrics, 31, 307-327.

Corsi F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics, 7 (2), 174-196.

Corsi F., Pirino D., Reno R. (2010). Threshold bipower variation and the impact of jumps on volatility forecasting. Journal of Econometrics, 159 (2), 276-288.

Corsi F., Reno R. (2012). Discrete-time volatility forecasting with persistent leverage effect and the link with continuous-time volatility modeling. Journal of Business and Economic Statistics, 30 (3), 368-380.

Craioveanu M., Hillebrand E. (2012). Why it is OK to use the HAR-RV(1,5,21) model. Working Papers No 1201, University of Central Missouri, Department of Economics & Finance.

Engle R. (1982). Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation. Econometrica, 50 (4), 987-1008.

Fernandez C., Steel M. (1998). On Bayesian modelling of fat tails and skewness. Journal of the American Statistical Association, 93, 359-371.

Ghalanos A. (2015). Rugarch: Univariate GARCH models. https://cran.r-project.org/web/packages/ rugarch/index.html.

Hansen P., Lunde A. (2004). A forecast comparison of volatility models: Does anything beat a GARCH(1,1)? Journal of Applied Econometrics, 20 (7), 873-889.

Hansen P., Lunde A., Nason J. (2011). The model confidence set. Econometrica, 79 (2), 453-497.

Johnson N. (1949). System of frequency curves generated by method of translation. Biometrika, 36, 149-176.

Lahaye J., Shaw P. (2014). Can we reject linearity in an HAR-RV model for the S&P 500? Insights from a nonparametric HAR-RV. Economics Letters, 125 (1), 43-46.

Lambert P., Laurent S. (2001). Modelling skewness dynamics in series of financial data using skewed location-scale distributions. Stat Discussion Paper, 0119. Université Catholique de Louvain.

LeBaron B. (2001). Stochastic volatility as a simple generator of financial power-laws and long memory. Quantitative Finance, 1 (6), 621-631.

Liu L., Patton A. J., Sheppard K. (2013). Does anything beat 5-minute RV? A comparison of realized measures across multiple asset classes. Journal of Econometrics, 187 (1), 293-311.

Mastro D. (2014). Forecasting realized volatility: ARCH-type models vs. the HAR-RV model. Dissertation, Kingston University, London.

Müller U. A., Dacorogna M. M., Davé R. D., Olsen R. B., Pictet O. V., von Weizsäcker J. E. (1997). Volatilities of different time resolutions — analyzing the dynamics of market components. Journal of Empirical Finance, 4 (2-3), 213-239.

Soucek M., Todorova N., (2014). Realized volatility transmission: The role of jumps and leverage effects. Economics Letters, 122 (2), 111-115.

Taylor S. (1994). Modeling stochastic volatility: A review and comparative study. Mathematical Finance, 4, 183-204.

White H. (2000). A reality check for data snooping. Econometrica, 68 (5), 1097-1126.

Поступила в редакцию 11.04.2017; принята в печать 20.09.2017.

Aganin A. Forecast comparison of volatility models on Russian stock market. Applied Econometrics, 2017, v. 48, pp. 63-84.

Artem Aganin

National Research University Higher School of Economics, Moscow, Russian Federation; aaganin@hse.ru

Forecast comparison of volatility models on Russian stock market

This article is dedicated to multivariate comparison of big number of GARCH, ARFIMA and HAR-RV families' models considering their one-day ahead realized volatility, which is known to be a consistent measure of daily volatility. A total of 102 models from three families were included in comparison.

Comparison was completed with the help of Model Confidence Set test using 3 different loss functions t on 10 Russian stock assets, including eight stock assets and two stock market indices. Received results | strongly suggest HAR-RV superior performance to other two families of volatility models on Russian stock market and confirm local findings of previous studies. ^

Keywords: GARCH; realized volatility; HAR-RV; MCS. JEL classification: C52; C53; C58.

References

Andersen T., Bollerslev T., Diebold F. X. (2007). Roughing it up: Including jump components in measuring, modeling and forecasting asset return volatility. Review of Economics and Statistics, 89 (4), 701-720.

Andersen T., Bollerslev T, Diebold F. X., Labys P. (2003). Modeling and forecasting realized volatility. Econometrica, 71 (2), 579-625.

Barndorff-Nielsen O., Shephard N. (2004). Power and bipower variation with stochastic volatility and jumps. Journal of Financial Econometrics, 2 (1), 1-37.

Black F. (1976). Studies of stock price volatility changes. In: Proceedings of the 1976 Meeting of the American Statistical Association, Business and Economic Statistics Section, 177-181.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Bollerslev T. (1986). Generalized autoregressive conditional heteroskedasticity. Journal of Econometrics, 31, 307-327.

Corsi F. (2009). A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics, 7 (2), 174-196.

Corsi F., Pirino D., Reno R. (2010). Threshold bipower variation and the impact of jumps on volatility forecasting. Journal of Econometrics, 159 (2), 276-288.

Corsi F., Reno R. (2012). Discrete-time volatility forecasting with persistent leverage effect and the link with continuous-time volatility modeling. Journal of Business and Economic Statistics, 30 (3), 368-380.

Craioveanu M., Hillebrand E. (2012). Why it is OK to use the HAR-RV(1,5,21) model. Working Papers No 1201, University of Central Missouri, Department of Economics & Finance.

Engle R. (1982). Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation. Econometrica, 50 (4), 987-1008.

Fernandez C., Steel M. (1998). On Bayesian modelling of fat tails and skewness. Journal of the American Statistical Association, 93, 359-371.

Ghalanos A. (2015). Rugarch: Univariate GARCH models. https://cran.r-project.org/web/packages/ru-garch/index.html.

Hansen P., Lunde A. (2004). A forecast comparison of volatility models: Does anything beat a GARCH(1,1)? Journal of Applied Econometrics, 20 (7), 873-889.

Hansen P., Lunde A., Nason J. (2011). The model confidence set. Econometrica, 79 (2), 453-497.

Johnson N. (1949). System of frequency curves generated by method of translation. Biometrika, 36, 149-176.

Lahaye J., Shaw P. (2014). Can we reject linearity in an HAR-RV model for the S&P 500? Insights from a nonparametric HAR-RV. Economics Letters, 125 (1), 43-46.

Lambert P., Laurent S. (2001). Modelling skewness dynamics in series of financial data using skewed location-scale distributions. Stat Discussion Paper, 0119. Université Catholique de Louvain.

LeBaron B. (2001). Stochastic volatility as a simple generator of financial power-laws and long memory. Quantitative Finance, 1 (6), 621-631.

Liu L., Patton A. J., Sheppard K. (2013). Does anything beat 5-minute RV? A comparison of realized measures across multiple asset classes. Journal of Econometrics, 187 (1), 293-311.

Mastro D. (2014). Forecasting realized volatility: ARCH-type models vs. the HAR-RV model. Dissertation, Kingston University, London.

Müller U. A., Dacorogna M. M., Davé R. D., Olsen R. B., Pictet O. V., von Weizsäcker J. E. (1997). Volatilities of different time resolutions — analyzing the dynamics of market components. Journal of Empirical Finance, 4 (2-3), 213-239.

Soucek M., Todorova N., (2014). Realized volatility transmission: The role of jumps and leverage effects. Economics Letters, 122 (2), 111-115.

Taylor S. (1994). Modeling stochastic volatility: A review and comparative study. Mathematical Finance, 4, 183-204.

White H. (2000). A reality check for data snooping. Econometrica, 68 (5), 1097-1126.

Received 11.04.2017; accepted 20.09.2017.

i Надоели баннеры? Вы всегда можете отключить рекламу.