Моделирование длительности в анализе высокочастотных финансовых временных рядов

Пырлик В. Н.

УДК 330.43+336.76

В. Н. Пырлик

Институт экономики и организации промышленного производства СО РАН пр. Акад. Лаврентьева, 17, Новосибирск, 630090, Россия

E-mail: vladimir.pyrlik@gmail.com

МОДЕЛИРОВАНИЕ ДЛИТЕЛЬНОСТИ В АНАЛИЗЕ ВЫСОКОЧАСТОТНЫХ ФИНАНСОВЫХ ВРЕМЕННЫХ РЯДОВ

Статья представляет собой теоретический обзор аппарата параметрических эконометрических моделей для анализа динамики промежутков времени между заключаемыми на финансовых рынках сделками. Приведены основные модели авторегрессионной условной длительности и описаны методы работы с ними и расширения класса моделей за счет усложнения авторегрессионных параметризаций и использования обобщающих законов распределения случайного фактора.

Природа феномена высокочастотных данных, нерегулярность

Как и на любом другом рынке, на финансовых рынках агенты принимают решения исходя из изменяющейся информации о структуре рынка. Хотя само по себе понятие рыночной структуры довольно растяжимо, большинство исследователей сошлись во мнении, что основными элементами структуры именно финансового рынка, влияющими на принятие решений его агентами, являются длительность, объем (стоимость) и волатильность.

По мере роста необходимости и возможностей развивались экономико-математические (в том числе и эконометрические) исследования закономерностей поведения финансовых показателей. Однако, хотя еще в начале прошлого века было известно, что большинство характерных исключительно для финансовых рынков показателей обладают специфическими с точки зрения теории вероятностей и статистики свойствами (относительно больший разброс, асимметричная реакция на различные случайные шоки, изменчивость волатильности во времени и пр.), долгое время среди исследователей тема специфических моделей финансовых показателей была не слишком популярна. В силу различных причин подавляющее большинство эконометрических исследований до 80-х гг. прошлого века были сконцентрированы на показателях типа доходности (объем), а основными динамическими эконометрическими моделями были модели линейной фильтрации условного среднего.

Лишь в начале 1980-х гг. была предложена модель, объектом которой являлась динамика условной дисперсии финансовых показателей, что позволяло в исследованиях формализовать тот факт, что волатильность финансовых показателей меняется во времени. В дальнейшем модель была не раз модифицирована и усовершенствована, что в конечном счете сделало возможным формализацию связи многих финансовых показателей, их волатильности, асимметричной реакции на шоки и, что наиболее важно, связи уровня волатильности с показателями объема и стоимости.

Однако по-прежнему и эти модели оперировали исключительно агрегированными данными, хотя современные финансовые показатели относятся к так называемым сверхвысокочастотным данным (ultra high frequency, UHF data), и количество их изменений, как, например, количество сделок на фондовых биржах, измеряется десятками тысяч в течение одного дня. Особенностью этого типа данных является то, что наблюдения во временном ряде фиксируются через различные промежутки времени. Отказ от учета нерегулярности является потерей информации о динамике рынка.

В последние i0 лет благодаря прежде всего росту технических возможностей регистрации и первичной обработки таких данных исследователи заинтересовались третьим элементом рыночной структуры - длительностью. Хотя в эконометрических исследования этот тип данных не являлся новым, специфика финансовых показателей, а в первую очередь высокая степень их межвременной зависимости, обусловила необходимость разработки новых моделей длительности. Первая такая модель была предложена в 1994 г. Робертом Энглом [1]. В основу модели

ISSN 1818-7862. Вестник НГУ. Серия: Социально-экономические науки. 2007. Том 7, выпуск 3 © В. Н. Пырлик, 2007

легло понятие условной длительности, которая, в отличие от безусловной, представляет собой условно независимый процесс, что делает возможным применение стандартного аппарата исследования длительностей до момента прекращения. Ввиду предложенной спецификации модели условной длительности как линейной функции прошлых состояний условных и безусловных длительностей данный класс моделей получил название авторегрессионных условных длительностей (autoregressive conditional duration, ACD Models).

Длительность: традиционный подход к моделированию

Хотя анализ динамики финансовых показателей долгое время обходился без учета нерегулярности, длительности рассматривались в ряде других задач. Прежде всего, длительности возникали при анализе наступления различных страховых случаев в технике. Классическим является пример распределения времени работы лампочки. Специфика первых задач, вовлекающих промежутки времени как самостоятельную переменную, обусловила сложившуюся в этой области терминологию. Сами промежутки времени стали называть длительностями до момента прекращения, а на основе закона их распределения ввели понятие риска прекращения, т. е. вероятность наступления события после определенного момента времени.

Наиболее распространенными объектами исследования являлись длительности безотказной работы оборудования, время между катастрофами на шахтах, интервалы между телефонными звонками в телефонных компаниях, промежутки времени между моментами поступления пациентов в пункты скорой помощи и т. д.

Хотя в исследованиях этих показателей использовались формальные методы описания статистических и вероятностных свойств исследуемых данных, их характер был исключительно прикладной, а используемые модели предельно просты. Фактически анализ сводился к описанию вероятностных свойств длительностей как строго случайного процесса.

С 1980-х гг. этот аппарат получил более широкое распространение и был модифицирован. К объектам исследования добавились такие данные, как перемещение индивидуумов между состояниями занятости и безработицы, однако в сфере применения аппарата по-прежнему отсутствовали объекты, требующие отказа от предположения о независимости длительностей, хотя развитие неуклонно продвигалось в этом направлении - модели стали учитывать возможность варьирования параметров распределений длительностей в соответствии с различными законами (как детерминированными, так и случайными). Кроме того, на данном этапе были разработаны первые модели длительности с экзогенными факторами, влияющими на распределение длительностей.

Суть подхода заключается в следующем. Рассматривается процесс длительностей dt (либо порожденный исходным процессом фиксации моментов времени tt наступления наблюдаемых событий i = 1, N, dt = tt —ti—1, либо представляющий собой последовательность длительностей наблюдаемых событий i = 1, N, dt = tt — t., где событие i начинается в момент t0 и заканчивается в ti ). Самая простая модель длительностей заключается в предположении, что

Оценивать неизвестные параметры 0 в таком случае проще всего методом максимального правдоподобия. Для любого закона 30 логарифмическая функция правдоподобия легко записывается и максимизируется:

d. ~ iidЗе,

I U"

где Зе - некоторый закон распределения с параметрами 0 и плотностью f0 (.) .

N

Проверка качества модели сводится к проверке того, насколько имеющиеся наблюдения соответствуют, во-первых, первоначальным предположениям (независимость, совпадение

распределения) и, во-вторых, соответствующей оценкам ММП 0 нулевой гипотезе H0: {di ~ iid^0}, для чего можно использовать множество статистических критериев.

Решающую роль в таком моделировании длительностей играет выбор вида закона распределения 30. Со временем исследователи выделили наиболее часто используемые распределения длительностей, к которым в первую очередь относится распределение Вейбулла (изначально использовался только его частный случай - экспоненциальное распределение). Однако выделяются и некоторые общие характеристики распределений, которые могут претендовать на описание процессов длительностей. Главным таким свойством, несомненно, является тот факт, что длительность - величина почти наверное положительная. Остальные свойства являются менее строгими и довольно часто варьируются, однако, например, скошенные влево распределения более характерны для длительностей, чем скошенные вправо; также довольно часто множество единичной вероятности ограничено сверху.

Основной сферой применения моделей длительностей в экономике долгое время оставались исследования безработицы. Основным распределением в моделях было экспоненциальное, его использование было просто и эффективно (с точки зрения качества описания). Такая модель выглядит следующим образом:

dt ~ iid EX, i = 1, N,

т. е.

fd (t) = Xt",

тогда функция правдоподобия имеет вид

Л = N ln X- NXd ^ max!,

X>0

N

_ S d,

где d = —-------выборочная средняя длительность. Оценкой максимального правдоподобия

N

для параметра X будет

X = i.

d

С ростом масштабов и спектра задач исследований естественным стало изменение модели, допускающее вариации параметра X для различных наблюдений в зависимости от некоторого внешнего параллельно наблюдаемого фактора. Таким образом, объектом исследования становится условное распределение длительностей. Первым таким изменением стала предложенная Коксом в 1972 г. модель пропорционального риска (the Proportional Hazard Model), которая формулируется следующим образом:

dt | zt ~ iid EX , i = 1, N.

Здесь

XI = Xe&z,

где - соответствующий i -му наблюдению вектор регрессоров, а 0 и X - неизвестные параметры.

Кокс также предложил подход, частично позволяющий отразить межвременной характер связи длительностей и других показателей. Для этого в вектор zt включалась информация о

краткосрочной прошлой динамике предполагаемых регрессоров. Такие модели применялись в 1980-х гг. для исследования краткосрочной динамики индивидуальной занятости. Использование для исследования статистики длительностей периодов безработицы за короткие промежутки времени по многим индивидам оставило открытым вопрос о том, отражает ли

модель действительную межвременную зависимость или просто улавливает неизмеряемую разнородность 1.

Другое разумное предположение относительно изменения параметра X заключается в том, что ему приписывают случайный характер (у Кокса - также с экспоненциальным распределением вероятности - X ~ iidEx). Хотя такая модель в целом выглядит разумной, предположение о независимости не обосновано в случае исследования экономических данных (безработица, фондовые рынки и пр.)

Помимо предложенных Коксом существует также ряд других, менее распространившихся моделей длительностей. Однако их общей чертой, которая делает невозможным их применение для анализа промежутков времени между сделками на фондовых рынках, является то, что они полностью не отказываются от предположения о взаимной независимости длительностей. Это подтолкнуло исследователей к разработке новой модели.

Модели авторегрессионной условной длительности

Несостоятельность традиционного подхода, базовая модель Энгла. Первые исследования неагрегированных данных о торгах на финансовых рынках показали, что при необходимости учета длительности в анализе воспользоваться существующими моделями длительностей до момента прекращения не представляется возможным, так как, в отличие от традиционных показателей длительности до момента прекращения, промежутки времени между заключаемыми сделками являлись не наблюдениями за независимыми объектами, а временным рядом, относящимся к одному объекту - конкретному финансовому инструменту [1; 2]. Кроме того, исключительно для всех анализируемых инструментов промежутки времени между сделками показали существенную положительную автокорреляцию. Таким образом, было невозможно рассматривать эти длительности как последовательность реализаций независимых одинаково распределенных случайных величин.

Все представленные выше модели можно переформулировать в терминах условной функции максимального правдоподобия

N N

Л = -£ I, =-£ 1п £ ЦК; 9).

Новым направлением в моделировании длительностей стала непосредственная параметризация этой функции. Большинство предложенных моделей несколько ослабляют это общее представление, принимая в качестве параметров предыдущие значения самой длительности, т. е.

={<■ ^..^ ^}.

Другим ослабляющим предположением новых моделей является то, что всю информацию о предыдущих длительностях можно отобразить в скаляр с помощью некоторой функции у так, что исходный процесс длительностей можно стандартизировать следующим образом:

d

— ~ iid, (*)

V

причем

Л ^ ^ 1

Е — = 1. (**)

V

1 Фактически отсутствие ответа на этот вопрос не рассматривалось как проблема, поскольку если и не соответствовало, то как минимум не противоречило основной цели таких исследований - вычислению «хорошего» краткосрочного прогноза длительностей, для чего достаточно иметь хорошее приближение конкретной функции распределения (или плотности распределения), для чего в каждом конкретном случае достаточно было использовать подходящий по некоторым соображениям и статистически оправданный набор экзогенных факторов.

В таком случае процесс у, называют условной длительностью, а процесс —— стандар-

V

газированной длительностью. Очевидно, что для стандартизированных длительностей справедливы следующие утверждения:

Л/ — z;6 = fd,,

v,

_L; 0

vV , у

и

E (d, | z,.;0) = v(z,.;0).

Автором данного подхода является Роберт Энгл, он же предложил первую параметризацию функции у. Модель авторегрессионной условной длительности (Autoregressive Conditional Duration Model, ACD Model) схожа с предложенной им же в 1986 г. моделью авторегрессионной условной гетероскедастичности (Autoregressive Conditional Heteroskedastic Model, ARCH Model), поскольку также оперирует ненаблюдаемым явно показателем - условной длительностью, который линейно зависит от истории процесса [1; 2]. Однако, предупреждая свою модель от недостатка ограниченной памяти, которым обладала ARCH 2, Энгл сразу предполагает зависимость условной длительности не только от прошлых значений длительности, но и от прошлых значений самой условной длительности:

у,=ю + а( L ) dt +р( L ) v ,., (1)

где

a(L ) = Е а L, (2)

j=1

P(L ) = £ esE, (3)

s=1

где L - оператор сдвига назад (Lmy, = y ,т).

Ввиду неотрицательности длительностей на параметры модели накладываются ограничения:

ю> 0; a j, р s > 0 3. (4)

Эта модель получила название ACD(p, q). Энгл предложил два ее варианта, отличающихся распределением стандартизированный длительностей.

Первый вариант - это экспоненциальная модель ACD (Exponential ACD, EACD), в которой

— ,dE1, (5)

V,

т. е., поскольку плотность экспоненциального распределения с параметром 1 (E1) имеет вид

/г~Е1 ( У) = У,

2 Этот недостаток модели авторегрессионной условной гетероскедастичности впервые был отмечен самим Энглом, когда в расчетах приходилось прибегать к моделям высокого авторегрессионного порядка, а решение его предложил Тим Боллерслев своей моделью обобщенной авторегрессионной условной гетероскедастичности (Generalized ARCH, GARCH), память которой безгранична, так как текущее значение условной дисперсии процесса зависит не только от истории наблюдаемого процесса, но и от предыдущих значений самой условной дисперсии.

3 Понятно, что это ограничение на параметры слишком строго, и можно легко показать (как показали в 1992 г. Нельсон и Као для модели GARCH), что некоторые из параметров могут быть отрицательными, оставляя условную длительность положительной с вероятностью 1.

ln / \z, (е) = - ln у, -

d. ___і

У,

(б)

Второй, но не последний из возможных, как отмечает сам Энгл, вариант - это предположить распределение стандартизированных длительностей Вейбулла 4 (^еШиП ЛСБ, WACD). Работу с этим распределением облегчает следующее представление модели:

(л V

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

iidE

(7)

и

У, = E (di \ zt) = Г

(

l

\

1 + -

v Yj

Ф.

И, аналогично (б) 5,

ln/dl\,l (е) = YlnГ(1/У + 1)-УlnУ+lnУ + (у -1)lndr -

Г(1/у + 1), У,

Xу

(8)

(9)

Тогда, если ф определяется как в (1)-(4), то коэффициенты параметризации у , получа-

ются простым умножением коэффициентов ф на коэффициент Г

Г,+

. у.

. Понятно, что мо-

дель EACD является частным случаем WACD, поскольку при у = 1 E1 = W(1,у),

Г 1'

Г 1 + - =Г(2) = 1.

V у J

Простые варианты авторегрессионной длительности. Баувенс и Гиот [3] предложили модификацию модели, для которой ограничения на параметры (4) не является необходимым. Проводя аналогию с моделированием условной гетероскедастичности, можно сказать, что если ACD - аналог модели GARCH, то модель Гиота и Баувенса - аналог модели Нельсона EGARCH, поскольку в ней объектом параметризации является, в отличие от ACD, логарифм условного математического ожидания процесса длительности [4; 5]. Названа новая модель была логарифмической авторегрессионной моделью условной длительности (Logarithmic ACD, LogACD). В общем виде она изначально была представлена следующим образом:

iidW (1, у), ln E(di \ zt) = yt =® + О? (zt/ zi-l) + РУм ,

откуда также следует, что

(

еф Г

l

1 +

v YJ

= еУ.

(10)

(11)

(12)

Здесь нет необходимости ограничивать как-либо параметры ю , а и р, поскольку область значения логарифмической функции - вся действительная прямая, а область определения -только ее положительная часть.

4 В русскоязычной литературе по теории вероятностей и математической статистике это распределение носит название Вейбулла - Гнеденко.

5 Иначе можно задать в стандартном виде Л. = ф.е,., е,. ~ Ш(1,у) , т. е. у (у) = уут-1е-у', у >0 (плотность случайной величины, имеющей распределение Вейбулла ^ ~ ш(а, у) имеет вид £ (у) = ауу?-1е-ау’).

Возможны различные варианты этой модели, отличающиеся видом функции g (.). Баувенс и Гиот предложили две основные параметризации [3]:

1) LogACDl, g(_!, є,—і ) = ln d- , т. е.

ln y,. =0 + а ln dt-1 + p ln y ,-1;

(11*)

2) LogACD2, g (-!, є,—і ) = є,- , т. е.

ln y, = 0+ає, -l +Pln Уi-l,

или

(11**)

Зная плотность распределения Вейбулла Ж (1, у), можно аналогично (8) записать условную плотность процесса , определяемого (10)-(12):

Если у = 1, то имеем модель LogACD для экспоненциального Е1 распределения. Тогда ф = у., а условная плотность длительностей выглядит следующим образом:

Семейство авторегрессионной длительности и расширенная модель. Модели ACD и LogACD можно условно считать основой класса моделей авторегрессионной условной длительности, однако существует и множество различных модификаций. Удобным способом обобщения нескольких таких модификаций является семейство моделей ACD, основанное на предложенной Фернандесом и Граммингом расширенной модели авторегрессионной условной длительности (Augmented ACD, AACD) [б]. Параметризация AACD является результатом применения преобразования Бокса - Кокса с параметрами

Этой моделью допускается асимметрия реакции процесса условной длительности уг. на

шоки различной величины.

ЛЛСБ действительно образует целое семейство моделей авторегрессионной длительности, поскольку, накладывая различные ограничения на параметры (14) в выражении (15), можно свести его как к параметризациям (1) и (11), так и к некоторым другим моделям клас-

(13)

Х> 0, b, с, v

(14)

к условной длительности ACD(1,1):

(15)

где

са ACD [б].

1. ACD: X = v = 1, b = с = 0.

2. LogACDi: X,v ^ 0, b = с = 0.

3. LogACD2: X^0, v = 1, b = с = 0.

4. Асимметричная степенная ACD (Asymmetric Power ACD, AsPACD):

X = v,

yX = ю + ^y^l [\ є- - b \ -с(є,,1 - b)] X + РіУX-i .

5. Асимметричная логарифмическая ACD (Asymmetric Logarithmic ACD, AsLACD):

0, v = 1,

In у, = ю + ai [| s,-i - b | —c (e,-i - b)] + Pi In уj_i.

6. Асимметричная ACD (Asymmetric ACD, AsACD) 6:

A = v = i,

у, = ш + aiу,—i[| e,—i — b 1 —c(e,—i — b)] + Piy,—i.

7. Степенная ACD (Power ACD, PACD):

A = v, b = c = 0,

yA = Ш + ai XA— i +PiyA—i.

8. ACD Бокса - Кокса (Box - Cox ACD, BCACD):

A^0, b = c = 0,

ln у, = ю + aieV—i + Pi ln y,—i.

Еще одно обобщение, предложенное Фернандесом и Граммингом, касается распределения скорректированных длительностей: было предложено использовать для работы с моделями AACD распределение Бурра (Burr’s Distribution, Brr(A,B,C,D)) [7], плотность которого имеет следующий вид:

—D—i

A,B,C,D) = CD' y A

Однако в АСБ-моделировании целесообразно использовать обратное распределение Бурра 7 единичного масштаба без сдвига (1Вгг (к,у)), т. е. у исходного распределения Бурра заданы параметры А = 0, В = 1. Плотность такого распределения удобно записать (для сопоставимости) в следующем виде:

/(у) = уу~7-1 (1+ку~у)1Ук.

Обобщающий эффект использования обратного распределения Бурра состоит в том, что оно включает в себя распределение Вейбулла (при к ^ 0), а также часто использующееся в моделях длительностей до момента прекращения лог-логистическое распределение (при к = 1). Плотность лог-логистического распределения LogLog (0,1, С) 8 соответственно имеет вид

/(у; с)=Су-С-'(1+уСу.

(Основные распределения, использующиеся в моделях авторегрессионной условной длительности, см. в прил. 1.)

Некоторые расширения класса авторегрессионных моделей условной длительности. Особенностью всех вышеизложенных модификаций модели АСБ Энгла является то, что их авторы, согласно терминологии, предложенной Энглом, предлагают использовать параметризации условного среднего длительностей только авторегрессионного порядка не выше (1,1). Соответственно наиболее простое расширение этих моделей, которое можно предложить, -это включение в функцию условной длительности зависимостей от лагов истории порядка выше 1.

6 Первоначально эта модель была предложена для Ь = 1 Энглом.

7 С.в. '% имеет обратное распределение Бурра, если распределение Бурра имеет с.в. 1/'% .

8 В общем виде распределение LogLog (А,В,С) также является частным случаем распределения ВМА, В, С, В) для В = 1.

Стоит отметить, что Энгл в своих расчетах показал, что, скорее всего, наилучшим вариантом модели (E/W)ACD для описания данных является модель порядка именно (1,1). Хотя, с другой стороны, это утверждение требует проверки в каждом конкретном случае. «Подмена» некоторой модели в статистических расчетах моделью более низкого порядка является аддитивной ошибкой спецификации, для проверки которой разработан ряд статистических критериев и тестовых процедур.

В своей первой работе, посвященной разработке новой модели (ACD), Энгл не сообщает источники мотивации для использования в основе моделей экспоненциального распределения и распределения Вейбулла. Авторы дальнейших исследований в основном придерживались этой линии. Первым существенным отклонением стало использование распределения Бурра. Однако и оно также оставило открытым вопрос о возможности использования других распределений, соответствующих вероятностным свойствам процессов длительностей (в том числе тех, что ранее использовались для моделирования длительностей до момента прекращения).

Поскольку процессы условной и стандартизированной длительностей определяются независимо от конкретного распределения, на котором основана модель, условную плотность (у) можно представить как суперпозицию на основе безусловной плотности /в(.) шу-

мов в,.:

/^,(У ) = — /В — , (16)

—

где

Ц = Ев ,,

и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

—, = Е (d , I г,-).

Помимо уже приведенных выше распределений в основе моделей класса ACD можно также

9 р

использовать такие распределения, как хи и хи-квадрат, логнормальное , г-распределение Фишера - Снедекора, распределение Шермана и пр.

Стоит уделить особое внимание следующим распределениям-гибридам.

1. Распределение гамма-Вейбулла (ОЖ (у, А)), плотность которого имеет вид

^ >=Щ) у ~‘-"

Очевидно, что ОЖ (1, А) = О (А), а ОЖ (у,1) = Ж (у).

2. Распределение-гибрид гамма-распределения и обратного распределения Бурра (О1Вгг (к, у, А)), плотность которого имеет вид

. , уГ (1 +1/ к) А 1 А / \-1-1/к

Л (у)= / ч /------- ч у7 к (1 + куу) .

} Г(А)Г(1 +1/к-А) У '

9 Фактически, любое распределение, носитель которого является положительным, почти наверное, теоретически подходит для описания длительностей. Так, например, это может быть любое логарифмическое распределение. Однако не любое из них использовать разумно, поскольку, как уже отмечалось, за длительностями замечены некоторые устойчивые свойства, которые должны адекватно учитываться в распределении. В частности, большинство длительностей распределено со скосом влево (медиана больше моды) и, вообще говоря, не являются объективно ограниченными сверху, т. е. использование таких распределений, как бета-распределение или распределение Шермана, интереса не представляет.

Работа с авторегрессионной длительностью. Наилучшим в среднеквадратическом смысле прогнозом случайной величины при наблюдении некоторого множества факторов является условное по этому множеству математическое ожидание этой величины. Тогда для некоторой модели класса ЛСБ

Очевидно, невозможно в общем виде аналитически выразить эту дисперсию, однако для каждой конкретной модели это возможно численно.

Прогноз на большее количество шагов вперед исчисляется итеративно, аналогично моделям линейного фильтра, т. е. для прогнозирования на т шагов вперед в момент / принимается для у = 1,..., т -1 ^ + . =у; + .. Для модели ЛСБ(1;1) Энгл показал, что прогноз на несколько шагов вперед является средним безусловного среднего процесса длительностей (которое существует и является конечным в случае, если процесс условной длительности не является интегрированным, т. е. (а + в)<1) и прогноза на один шаг, причем чем дальше

процесс условной длительности от того, чтобы быть интегрированным ((а + в) мало), тем

быстрее (с ростом горизонта прогноза) ожидаемое значение длительностей сходится к безусловному среднему. К сожалению, показать нечто подобное для других спецификаций ЛСБ не представляется возможным аналитически.

Оценивание параметров. Поскольку в основе каждой модели класса ЛСБ лежит строгое предположение о распределении процесса, логично использовать для оценивания метод максимального правдоподобия, причем его «усеченный вариант» (условный метод максимального правдоподобия), поскольку процесс условной длительности является ненаблюдаемым и при оценивании его значения рассчитываются итеративно, что не позволяет использовать всю информацию о процессе длительности для нахождения оценок параметров.

Для каждой конкретной спецификации легко записать логарифмическую функцию максимального правдоподобия, поскольку известны функции плотности условных распределений соответствующих процессов - (6), (8), (13), (16) и т. д. Однако также можно записать общий вид функции правдоподобия для модели ЛСБ, определяемой (17)-(19). Из того, что условное и безусловное распределение скорректированной длительности совпадают, следует, что

(17)

где

И ((01)) = * + а (Ь)г (йг; 0) + в (Ь) И(у, (01)) = Ч,,

(18)

и

(19

Прогнозом на один шаг вперед будет

с/ = уаг(+1 - V,+1) = Е(£ (И_1 (,+1)),+! - И^ (Ч)

ст2/ = уаг

где /Д.) - функция плотности распределения ^ (01) (см. прил. 2).

Соответственно определяется вклад одного наблюдения в логарифмическую функцию правдоподобия:

1, =1п (;е) =1п ^(е1)- 1п V, (е2)+1п / (в (е)).

Тогда логарифмическая функция правдоподобия для этого процесса будет иметь следующий вид:

л(2м; е) = Е1, = м 1п ^(е1 )-Е1п у +Е1п /е

^(е1)

, (е2 )у

где множество 10 - номера наблюдений, для которых рассчитывается вклад в функцию правдоподобия, т. е., например, для модели АСБ(р, д)

Iо = {тах {р, д},..., N}.

Аналитически оценки метода максимального правдоподобия не удается получить даже для самых простых моделей, поэтому оценивание проводится численно, причем в доступной литературе ни одним автором не упоминался какой-либо метод численной оптимизации функции правдоподобия, отличный от алгоритма ОРО (ВННН).

Использование численного метода обосновано сложностью дифференцирования выражения (20), однако, с другой стороны, не существует никаких препятствий для использования других методов численной оптимизации, некоторые из них, возможно, способны обеспечить большую надежность (в плане сходимости) и сравнительно лучшую точность. Например, к таким методам относятся симплекс-метод и аналитический алгоритм ВБО8.

Для расчета значений процесса условной длительности, входящих в аргументы функции правдоподобия, необходимо знание нескольких первых его значений (у ,, Ц10). Целесообразным представляется принятие этих начальных значений равными исходным значениям длительностей: у , := , Ц10.

При использовании алгоритмов оптимизации для поиска оценок максимального правдоподобия следует также учитывать, что функция максимального правдоподобия может иметь (обычно имеет) по параметрам несколько локальных экстремумов. Вектору оценок максимального правдоподобия соответствует глобальный максимум ФМП. Однако большая часть методов численной оптимизации сходится к локальным экстремумам 10. Соответственно нахождение оценок максимального правдоподобия заключается не только в нахождении экстремума ФМП, но и в соответствующей проверке. И если убедиться в том, является ли найденная точка действительно максимумом, а не минимумом довольно легко (для этого используют как численные, так и аналитические оценки соответствующей найденным оценкам параметров модели матрицы Гессе функции максимального правдоподобия), то убедиться в его глобальности может быть гораздо сложнее. Это связано с тем, что не всегда точно можно сказать, сколько локальных экстремумов имеет функция правдоподобия. Если анализ функции действительно не отрицает возможность множественности этих экстремумов, то модель оценивается несколько раз с такими различными начальными значениями параметров, от которых выбранный метод (методы) может сойтись к различным экстремумам, из которых будет выбран один - с наибольшим значением ФМП.

Основным предположением, на котором основывается любая модель класса АСБ, является предположение о законе распределения шумов в,. Соответственно выделяют несколько

10 Большинство алгоритмов ориентировано на поиск именно локального максимума в соответствии с направлением градиента, однако существуют и общие алгоритмы поиска экстремального значения (исходя из равенства в них нулю первых производных).

ориентиров, свидетельствующих о качестве модели с точки зрения соответствия оценки параметров базовому предположению.

1. Шумы гi являются процессом независимым. Существует ряд критериев для проверки выборки с.в. на независимость. В случае, если анализируемая выборка - временной ряд, то визуальным критерием может служить вид графика выборочной автокорреляционной функции, который для независимого процесса колеблется на низком уровне. Однако если в случае невыполнения этого условия можно строго сказать, что рассматриваемый процесс не является строго случайным, то при его наблюдении строго утверждать независимость процесса нельзя, поскольку, как известно, существуют некоррелированные зависимые случайные величины.

2. Распределение si совпадает с предположенным. Заключение о выполнении этого условия можно принимать на основе таких критериев согласия, как критерий хи-квадрат Пирсона или критерий Колмогорова; при этом в качестве оценок выборочного распределения могут выступать различные оценки плотности распределения, полученные по выборке si.,

соответствующей оценкам максимального правдоподобия параметров 01 и 02, тогда как в качестве «теоретического» распределения выступает соответствующий предположению закон в точке оценок параметров 01 . Например, разумным выглядит сравнение ядерной оценки плотности шумов si и плотности распределения предполагаемого закона распределения шу-

мов F) .

Очевидно, если шумы в, признаны независимым процессом, то стандартизированные

длительности —- являются также процессом независимым (так как в. = — = —-ц). Однако V, ф V,

из определения стандартизированных длительностей для них должно также выполняться ус-

( d. \

ловие E —- = 1. Проверка этого условия равносильна проверке гипотезы о том, что

E (в, ) = Ц, и, следовательно, в чем-то дублирует сравнение выборочного и предполагаемого распределения шумов в,, но тем не менее может служить хорошим дополнительным показателем качества модели.

В отличие от модели линейной регрессии для оценки значимости отдельных коэффициентов-оценок параметров модели ACD (так же, как, например, при оценке моделей класса ARCH или др. нелинейных или основанных не на нормальном распределении ошибок моделях) нельзя использовать /-критерий Стьюдента, поскольку распределение соответствующей статистики отличается от распределения Стьюдента. Однако у распределений этих статистик есть общая черта - они асимптотически нормальны, что позволяет построить на их основе асимптотический критерий проверки значимости параметров. Этот критерий получил название z-критерий. Поскольку работа с моделями класса ACD связана с выборками больших объемов, можно рассчитывать на высокую точность применения этого критерия.

Одного этого критерия не достаточно. В случае его применения нулевой гипотезой является равенство соответствующего коэффициента нулю, проверяется она против сложной альтернативы, а при оценке качества моделей класса ACD важно иметь возможность проверять более сложные гипотезы. Например, при оценке качества модели WACD можно поставить задачу проверки обоснованности использования распределения Вейбулла против более простой альтернативы - экспоненциального; в таком случае нулевая гипотеза будет H0 = {у = 1} . Или в случае необходимости проверки адекватности предположения об асимметрии влияния шоков на условную длительность гипотеза будет состоять в одновременном равенстве { = с = 0}. Для проверки таких гипотез используется один из трех специфических

для моделей, оцениваемых методом максимального правдоподобия, критериев - множителей Лагранжа (LM-тест), отношения правдоподобия (LR-тест) или Вальда (Wald).

Стоит также отметить, что последние критерии являются и инструментом проверки спецификации модели. В основном модели класса ACD проверяются на аддитивную ошибку спецификации путем попытки включения в параметризацию процесса условной длительности лаги истории более высокого порядка и проверки изменения значимости (в случае с логарифмической моделью это проверка мультипликативной ошибки спецификации). Другой способ проверки на наличие ошибки спецификации - построение модели класса ACD для шумов (предполагается, что уже построенная модель уловила не весь авторегрессионный

эффект изменения длительностей).

Нередко возникает ситуация, когда несколько вариантов оценок представляются хорошими альтернативами. Решающую роль в выборе конечного варианта модели может сыграть знание свойств исследуемого процесса и соответствие анализируемых альтернативных моделей этим свойствам. Однако такая ситуация вряд ли возможна в случае работы с моделями класса ACD, поскольку лежащий в их основе процесс условной длительности является ненаблюдаемым, а оцениваемые модели, скорее, являются инструментом исследования его на наличие тех или иных свойств, а не показателем, это подтверждающим. Таким образом, сравнение конкурирующих моделей проводится на основе статистических критериев. В случае, если невозможно сделать определенный вывод на основе вышеуказанных критериев качества отдельных элементов модели, решающую роль играет сводный информационный критерий (Акаике, AIC; Шварца, SIC; Байесовский, BIC).

Выводы

Нерегулярность высокочастотных временных рядов делает анализ длительностей необходимой составляющей работы с такими данными. Высокая автокорреляция длительностей между сделками на финансовых рынках делает невозможным применение традиционного подхода анализа длительностей до момента прекращения. Разработка новой методологии началась с предложенной в 1994 г. Робертом Энглом модели авторегрессионной условной длительности. Особенность подхода состоит в том, что процесс длительностей описывается двумя мультипликативными компонентами. Первая компонента - условная длительность -является скалярной функцией истории процесса и улавливает характер межвременной зависимости. Вторая компонента - случайная длительность, или инновация, - является чисто случайным процессом. Энгл предложил использовать в модели распределение Вейбулла и его частный случай - экспоненциальное, в качестве закона распределения случайных длительностей. В дальнейшем класс моделей развивался в двух направлениях. Во-первых, были предложены более общие параметризации условной длительности (логарифмическая длительность, расширенная длительность). Во-вторых, стали использоваться сложные законы распределения случайных длительностей, в том числе распределения гибриды (гамма-Вейбулла, гамма-обратное Бурра). Зарубежные авторы показали, что этот аппарат успешно улавливает межверменной характер зависимости длительностей в высокочастотных временных рядах.

Выделяют несколько вариантов дальнейшего использования класса моделей авторегрессионной условной длительности в анализе высокочастотных финансовых временных рядов. Во-первых, это прогнозирование длительностей между сделками. Кроме того, в этом направлении модели можно также использовать для прогнозирования количества сделок за заданный промежуток времени. Во-вторых, более важным является вопрос о взаимозависимости динамики длительностей и цены (доходности и волатильности). Естественной является гипотеза о кластеризации частоты сделок и связь с кластеризацией волатильности доходности. В-третьих, модели длительностей позволяют проверять возможность влияния на рынок внешних факторов (воздействие фундаментальных событий на динамику частоты сделок).

Приложение 1

Распределения, которые возможно взять за основу модели класса ЛСБ, соответствующие плотности и математические ожидания

Закон распределения 8 Ограни- * чения Плотность распределения /8( У ) Математическое ожидание д = Ее

аТВтт - ^ + 1/,К) ,)У^О + ку,)"‘"1'1 к-1/уГ(А +1/у)Г(1 +1/к-А-1/у)

Г(Х)Г(1 +1/к-Х) у ’ Г(А)Г(1 +1/к-А)

к —0 7 У%-хе~У' г(а/ Г(А + 1/ у) Г(А)

1Вгг А = 1 1 / \—1—1 / к YУ7 (1+ КУу) к-1' уг(1/у)г(1/к-1/Г)г(1,г) У

к —— 0, А = 1 уу у— Г(1 +1/у)

а к — 0, Y =1 у1-1.-у Г(Ц А

А = 1, к = 1 ууу-1 (1 + Уу)2 п Y sin (п / у)

Е к — 0, А = 1, Y =1 г~ У 1

* Ограничения на параметры наиболее общего распределения - гамма-обратное Бурра, которые сводят его к соответствующему.

Приложение 2

Связь плотности распределения шоков 8; и плотности условного распределения длительностей й;

Для модели класса ЛСБ, которая в общем виде определяется следующим образом:

dг = ф8, > 8, ~ ^ (61 ) ,

E (е, ) = ц(0),

V, = Е (I г, ) = к (г,; 02),

известно, что

F — F

di / Vi _ di / Villi'

т. е.

Si |zi ’

так как

Тогда

Е (ёг 1 zt) — ^(0

\) Mi •

FdM (y) = P (di < У1 zt) — P

s, <-

^(0\ ) У I 77 ( ^(0\ ) У

— FS

v,

V

и

fdM (y) —

dFdik (y)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

dy

dFs

^(0\) y

v Vi / dy

v,

Vi

V * i J

Соответственно можно в общем виде записать вклад одного наблюдения в логарифмическую функцию правдоподобия:

— In ц(0\)- In V, + In f

^(0\) di

V

— ln ^(0\)- ln V, + lnf (S, )..

V * i J

Список литературы

\. Engle R. F., Russell J. F. Forecasting Transaction Rates: The Autoregressive Conditional Duration Model / National Bureau of Economic Research, Working Paper No. 4966, December \994.

2. Engle R. F. The Econometrics of Ultra-high Frequency Data / National Bureau of Economic Research, Working Paper No. 58\6, November \996.

3. Bauwens L., Giot P. Recent Developments in the Econometrics of Financial Markets Using Intra-day Data // Bulletin EU & US Inflation and Macroeconomic Analysis. Instituto Flores de Le-mus de Estudios Avanzados en Economia. \999. No. 57. P. 60-70.

4. Bauwens L., Giot P. The Logarithmic ACD Model: an Application to the Bid-ask Quote Process of Three NYSE Stocks // Annales d'Economie et Statistique. 2000. No. 60. P. 117-149.

5. Bauwens L. Econometric Analysis of Intra-daily Trading Activity on Tokyo Stock Exchange // IMES DP. 2005. No. 2005-E-3.

6. Fernandes M., Gramming J. A Family of Autoregressive Conditional Duration Models // CORE discussion papers. 2001. No. 36.

7. Grammig, J., Mauer, K.-O. Non-monotonic Hazard Functions and the Autoregressive Conditional Duration Model // Econometrics Journal. 2000. No. 3. P. 16-38.

Материал поступил в редколлегию 16.07.2007

V. N. Pyrlik

Duration Models for Ultrahigh Frequent Financial Time Series Analysis

The paper is a theoretical review of econometric parametrical models of durations between successful trades in financial markets. There are basic autoregressive conditional duration models described. Two kinds of the models’ class widening methods are discussed. First, it is the generalization of autoregressive parameterizations. The second is fitting the random factor with wider distributions.

Моделирование длительности в анализе высокочастотных финансовых временных рядов Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Пырлик В. Н.

Похожие темы научных работ по математике , автор научной работы — Пырлик В. Н.

Duration Models for Ultrahigh Frequent Financial Time Series Analysis

Текст научной работы на тему «Моделирование длительности в анализе высокочастотных финансовых временных рядов»