Научная статья на тему 'Моделирование многомерных распределений с использованием копула-функций. III'

Моделирование многомерных распределений с использованием копула-функций. III Текст научной статьи по специальности «Математика»

CC BY
360
88
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Прикладная эконометрика
Scopus
ВАК
Область наук
Ключевые слова
КРИТЕРИЙ СОГЛАСИЯ / КРИТИЧЕСКАЯ СТАТИСТИКА / КОПУЛА-ФУНКЦИЯ / БАЙЕСОВСКИЙ ВЫБОР / ИНФОРМАЦИОННЫЙ КРИТЕРИЙ КАЧЕСТВА ПОДГОНКИ / ЭМПИРИЧЕСКИЙ АНАЛИЗ / COPULA / COPULA SELECTION / TEST STATISTIC / INFORMATION CRITERIA / BAYESIAN COPULA SELECTION / COPULA EVALUATION / GOODNESS-OF-FIT TEST / EMPIRICAL ANALYSIS

Аннотация научной статьи по математике, автор научной работы — Фантаццини Д.

Заключительная часть консультации посвящена описанию подходов к эмпирическому подбору подходящей копула-функции и методов статистической проверки гипотез, связанных с моделями копула-функций.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of multidimensional probability distributions with copula functions. III

The final part of the consultation series on copula functions is devoted to the description of copula selection methods to choose the copula model that provides the best fit for the empirical data at hand, as well as to the description of copula evaluation methods by using goodness-of-fit tests.

Текст научной работы на тему «Моделирование многомерных распределений с использованием копула-функций. III»

№ 4 (24) 2011

Д. Фантаццини

Моделирование многомерных распределений с использованием копула-функций. III1

Заключительная часть консультации посвящена описанию подходов к эмпирическому подбору подходящей копула-функции и методов статистической проверки гипотез, связанных с моделями копула-функций.

Ключевые слова: критерий согласия, критическая статистика, копула-функция, байесовский выбор, информационный критерий качества подгонки, эмпирический анализ.

JEL classification: C69, C49.

Содержание

8. выбор копула-функции

8.1. Информационный критерий Акаике (А1С)

8.2. Тесты отношения правдоподобия

8.3. Байесовский выбор копула-функции

8.4. Эмпирические приложения: пример выбора копула-функции

9. критерии согласия для когола-функций

9.1. Тесты, основанные на преобразовании Розенблатта

9.2. Тесты, основанные на использовании эмпирических копула-функций

9.3. Другие подходы к построению критериев согласия

9.4. Тесты, основанные на усреднении критических статистик

9.5. Эмпирические приложения с пакетом К: пример реализации подхода А2

8. Выбор копула-функции

Из нескольких моделей копула-функций (определение копула-функции см. в (Фантаццини, 2011а)) следует выбрать ту, которая наилучшим образом описывает рассматриваемые данные. В разделах 8.1 - 8.3 описываются различные критерии, руководствуясь которыми исследователи обычно осуществляют такой выбор.

8.1. Информационный критерий Акаике (AIC)

Этот метод выбора копула-функций является достаточно простым, см., например, (Breymann et al., 2003; Dias, Embrechts, 2004).

1 Окончание. Первые две части консультации см. в журнале «Прикладная эконометрика», №№ 22 (3) и 23 (2), 2011. Перевод с английского А. В. Кудрова под научной редакцией С. А. Айвазяна. Сохранена сквозная нумерация разделов, рисунков, формул, определений и теорем, начатая в первой части.

№ 4 (24) 2011

AIC (Akaike Information Criterion) — это критерий, позволяющий выбрать копула-функ- |

s

цию, которая отвечает наименьшему значению из следующих:

где Ck — k-ая модель копула-функции, ck (•) — плотность для Ck; а k — вектор параметров копула-функции Ck, qk — число параметров, от которых зависит функция Ck. Функция AIC(Ck,аk) в определенном смысле штрафует модели с большим числом параметров.

AIC предполагает, что наиболее адекватная модель находится среди рассматриваемых моделей. Если сравнивать «невложенные» модели, то слагаемое 2qk является не вполне корректным штрафом, и указанная выше формула становится неприменимой. Для того чтобы разрешить эту проблему, Такеучи предложил в (Takeuchi, 1976) информационный критерий TIC. Однако TIC редко используется на практике, поскольку для него требуется наличие весьма больших (по размеру) выборок наблюдений.

В применении AIC некоторые вопросы остаются открытыми. Например, до сих пор неизвестно, что происходит с AIC в случае, если в качестве частных одномерных распределений использовать эмпирическую функцию распределения. Использование эмпирической функции распределения как оценки соответствующей частной функции распределения на практике является стандартной процедурой, но последствия такого использования для AIC до сих пор не изучены.

В работе (Chen, Fan, 2006) предлагаются так называемые тесты отношения псевдоправдоподобия, которые учитывают случайность, возникающую в AIC при использовании нормированных рангов. Эти тесты позволяют удостовериться в том, что среди рассматриваемых моделей нет такой, которая была бы значительно лучше выбранной (проверяемой) модели. При этом не требуется, чтобы рассматриваемый класс моделей содержал истинную модель. Таким образом можно сравнивать невложенные модели.

Основной идеей тестов является сравнение каждой из рассматриваемых моделей-кандидатов с остальными моделями с точки зрения меры их правдоподобия, по результатам сравнения выбирается та модель, которая оказывается наиболее правдоподобной. А именно, пусть Cj(uj,...,ип;aj) — выбранная из числа рассматриваемых модель-образец копула-функции, C(u,...,ип;ai), i = 2,...,M — остальные модели-кандидаты, C (uj,...,ип) — истинная (и ненаблюдаемая) копула-функция, в действительности описывающая зависимости между компонентами многомерных наблюдений. В работе (Chen, Fan, 2006) предлагается, используя расстояние Кульбака-Лейблера, тестировать гипотезу о том, является ли модель-образец наиболее правдоподобной среди всех рассматриваемых моделей. Таким образом, нулевой гипотезой является:

T

8.2. Тесты отношения псевдоправдоподобия

№ 4 (24) 2011

где а*, 1 = 1,..., М — параметры рассматриваемых моделей копула-функций; ^0 (•) — истинные (неизвестные) частные распределения для е^, ] = 1,...,п2. Указанная нулевая гипотеза означает, что среди всех рассматриваемых моделей модель-образец оказывается, в определенном смысле, ближе к истинной модели, чем все остальные из рассматриваемых. Альтернативная гипотеза

HM : max E0

1 i=2,...,M

ln-

c,[ F (£1,),...,F0 (e„ );a*

CilFJ0(eu),_,F„ (e,);a*

> 0

означает, что среди рассматриваемых моделей существует модель-кандидат, которая ближе к истинной модели, чем модель-образец. Тест из работы (Chen, Fan, 2006) основан на следующей статистике отношения псевдоправдоподобия (i = 2,.,M):

1 т

LRn (F1T v. FnT ;a bCt 1) = T 2

ln

ci (F1T (eit ), ■ ■ ■, FnT (e nt

);£c i)

ci (F1T (eit ),■■■,FnT (e nt

);a i)

где , у = 1,.,п — нормированные ранги; знак ~ над буквой означает, что соответствующий параметр а оценен при помощи квази метода максимального правдоподобия (КММП). Возьмем Й = (а к )1к=2, где

>s

S

г

?

w ^

с

Si §

<u s t

W Щ

о

■а §

С о S о >s

5

t

ф

§

6

о w а

Й л t а

ф §

S

о

t §

ф s t

W Щ

о

8ч ф

S = Cov0

ln

с (Uit v-,Unt ;a*) с (Uit ,.,Unt ;a*)

+

2Q, j (Uft ;a*) Si, j (U;a*)},

j=i

ln

с (Uit ,.,Unt ;ak) с (Uit .Vnt ;a*)

+

2{Qk, j (Ujt ;ak)-Qi, j (Ujt ;a*)}

j=1

при Ujt = Fj (e jt) и Qh] (Ujt ;a*) °E0{lj (Us ;a* )[1^ ^}-Ujs ]\Ujt} для i = 1,...,M, j = 1. d, добавочные слагаемые Qt j (•) введены в связи с необходимостью оценивать частные распределения Fj(•), j = 1V..,n, а }, как и прежде, индикаторная функция множества {x < x0}. Более подробно см. (Chen, Fan, 2006). Отметим, что если частные распределения известны, то эти слагаемые исчезают. Как показано в работе (Chen, Fan, 2006), при некоторых условиях регулярности:

.„1/2

LRn (F1T,.,FnT; ai, a 1,) - E

ln

с (U1t,., U nt ;a*) с (U1t ,.,Unt ;a*).

®(Z2V,ZM ) ,

где вектор (Х2,...,2М) имеет нормальное распределение N(0,^), так что

max n

i=2.,M

1/2

LRn (F1T,..., FnT ;a i,a 1) - E0

ln

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с (Ut ;a*)

с (Ut ;a*)

® max Z:.

i=2,...,M

(24)

2 Верхний индекс 0 здесь и в дальнейшем означает, что соответствующая характеристика вычислена в усло-

виях гипотезы HM

102

/

№ 4 (24) 2011

О ik T

T t=i

X

В (Chen, Fan, 2006) показано, что при так называемой «наименее благоприятной» кон- | фигурации g

I

TT4 = max [П2LRn(FlT,...,Fnr»аъ0)] ——® max Zi, (25) §

i=2,...,M i=2,...,M

т. к. второе слагаемое в (24) обнуляется: E0[] = 0. Поскольку асимптотическая ковариационная матрица W для Z2,..., ZM зависит от а*,..., а*м, распределение max Zi неизвестно. Но, несмотря на это, можно использовать p-значения, получаемые либо методом Монте-Карло, либо бутстрап методом, см. (White, 2000; Chen, Fan, 2006).

Состоятельная оценка для W = (ok )Mk=2 определяется формулой:

=T 1 (- Cf§ - TI 'n Ш+I (QJ- Ft а i) - Qj F, ;a,))jx

''n - TI 'n Ctf+| ^ F.*k) - to F ;a.))j.

где Q . — состоятельная оценка Qt j, которая вычисляется следующим образом:

1 т

Q;ад = T | h(U;ад(U £Ut}-UJt)3.

t=1

Затем можно вычислить разложение Холецкого W = CC' и сформировать

Zb = (Zb,2,., Zb,M ) = Cl1b ,

где hb N(0,IM-ъ), т. е. имеет (M -1)-мерное стандартное нормальное распределение. После чего найдем наибольшую порядковую статистику ZbM-1 = max Zbk, а для того, чтобы вычислить p-значение методом Монте-Карло, повторим эти итерации много раз (например,

порядка B = 100000), см. (Chen, Fan, 2006):

1 в

BI i{Zb ,M-1 £ TM}.

8.3. Байесовский выбор копула-функций

В (НиаМ et а1., 2006) предлагается байесовская процедура выбора наиболее вероятного двумерного семейства копула-функций среди заданного множества копула-функций. В этом подходе параметры копула-функций интерпретируются как случайные величины, и, следовательно, они не должны оцениваться. Кроме того, в указанной работе параметризация плотности копула-функции осуществляется в терминах г-Кендалла (см. (Фантаццини, 2011Ь, п. 5.2)), так что априорные распределения параметров заменены априорными распределениями г -Кендалла, которые концептуально являются более удобными. Априорное распре-

3 Здесь и в дальнейшем 1{} означает, как и раньше, индикаторную функцию множества {•}.

№ 4 (24) 2011

деление г-Кендалла берется одним и тем же для всех тестируемых копула-функций и используется как базис для сравнения.

Пусть С — множество всех копула-функций. Возьмем из С конечное подмножество Сд С С копула-функций, которые необходимо включить в предложенный метод. Каждая копула-функция из Сд обозначается С1, 1 = 1,...,д. Метод, предложенный в работе (НиаМ et а1., 2006), на первом шаге состоит в проверке следующих д гипотез:

Иг : данные извлечены из копула-функции С1, 1 = 1,...,Q.

Для этого вычисляются Р(Н1 | О) — вероятности реализации гипотезы Н1 при заданных наблюдениях О, которые представляют собой Т независимых пар (и,V), ^ = 1,...,Т, с равномерно распределенными компонентами (в работе (НиаМ et а1., 2006) называемые квантилями). Если используются нормированные ранги, то условие независимости может нарушаться, и предложенный метод следует рассматривать как аппроксимацию и применять с некоторой осторожностью. Используя теорему Байеса, получим:

Р( О|Н1,1 )Р(Н1 11) Р(Н1 | О, I) = 1 , ^ 11 ', (26)

V н , > р(о|I) ' V у

где Р(О | Н1, I) — функция правдоподобия, Р(Н1 11) — априорное распределение для копу-3 ла-функции, Р(011) — нормирующая константа; I соответствует дополнительной информа-'! ции. «Правильной» копула-функцией, в терминах работы (Huard et а1., 2006), называют копу-ла-функцию, отвечающую наибольшему значению апостериорной вероятности Р(Н1 | О, I).

Ц В (НиаМ et а1., 2006) плотность копула-функции перепараметризируется в терминах | г-Кендалла (г = g1 (а)), который становится общим параметром для всех копула-функций

из Сд .

5

Я

15 Таблица 3. Выражения для г-Кендалла для некоторых копула-функций

л §

с о 5 О

>¡5 »

Ф §

¡г §■

о я а

Й

л »

Следовательно, г -Кендалла может использоваться в (26) как случайная величина

§

* шншп Гшн шпи +Г РФ |Н1 ,г,I)Р(Н1 |г,I)Р(г 11^г | Р(Н1 1 D, 1) = J р(Н1,г 1 ^ 1 ^г = J -р( )-, (27)

о

^ где Р(Н1 | г,I) — априорная вероятность гипотезы Н1 для копула-функции; Р(г| I) — ап-

| риорная плотность для г-Кендалла; правдоподобие Р(О|Н1 ,г, I), которое теперь зависит

§ от г, может быть вычислено следующим образом:

Копула-функция г = & (а) Область изменения г

Клейтон 1 —2(2 + а)—1 [0;1] \ {0}

Гумбель 1 — а—1 [0;1]

Франк 1 — 4а-1 (1 - а"1 5 / (е5 -1)ds) [—1;1] * {0}

Гаусс 2р-1 arcsin р [-1;1]

104

№ 4 (24) 2011

т т 5

Рф | Н,г,I) = П Р(".•| г,/,I) = П С; и•V, I 2Г1 (г)), (28) ||

t=\ ,=1

Р(Г| Л) =

Я(Л) ' (29)

0 иначе,

Р(Н' I*') = Щ)IП * к* 'г =

1 т

= Р(в]адА) С/ (и •1 й"'( ^г

(31)

где с1 (и,V, | g1 (г)) — плотность /-ой копула-функции, параметризованной в терминах в г-Кендалла. 4

Для того чтобы выбрать априорные распределения, в работе (НиаМ et а1., 2006) указываются некоторые требования и правила:

(11) г-Кендалла принадлежит множеству А и каждая реализация гЕА равновероятна;

(12) для заданного г все копула-функции, для которых , равновероятны, здесь ^ — область значений г в условиях справедливости гипотезы Н;.

Область А необходима для того, чтобы включать дополнительную информацию относительно зависимости между переменными. Например, если известно, что г положительно, то можно предположить, что А = [0; 1]; если априорная информация относительно значений г отсутствует, то А = [— 1; 1]. Следовательно, учитывая (11), априорное распределение г есть:

1

при гёЛ;

где Я(-) обозначает меру Лебега, т. е. Я(А) — длина интервала А. Кроме того, условие (12) определяет априорное распределение для копула-функции:

Р(Н/ |г, 12) «1{гЕЙ,}, (30)

где предполагается, что все копула-функции равновероятны относительно г. В случае, если известно, что г концентрируется вокруг определенного значения, то в работе (НиаМ et а1., 2006) предлагается использовать бета-распределение на интервале [-1; 1] с параметрами, обеспечивающими такую форму распределения, которая соответствует априорной информации.

Если подставить (28), (30) и (29) в (27), то получим:

+1 т

где нормирующая константа Р(^ 1I) в (31) вычисляется при помощи так называемого правила суммы, более подробно об этом см. (Jaynes, ВгеНЬоге^ 2003):

я

Рф| I) = 2 РФ| Н/,I)Р(Н/ 1I).

/=1

№ 4 (24) 2011

Важно отметить, что правило суммы справедливо только тогда, когда гипотезы Н/ являются взаимоисключающими и исчерпывающими (в совокупности). К сожалению, эти условия обычно не выполняются по двум причинам. Во-первых, если данные сгенерированы из копула-функции, не входящей в Сд (что является довольно распространенной ситуацией), то гипотезы Н/ в совокупности не являются исчерпывающими. Во-вторых, если множество гипотез Н/ содержит две или более похожих копула-функции, то в этом случае гипотезы Н; не являются исчерпывающими. В работе (НиаМ et а1., 2006) весьма кратко рассматриваются возможные решения, которые бы обеспечили полноту, но более детальное изучение этого вопроса оставлено для дальнейшего исследования.

Этот метод представляется весьма интересным, поскольку не требует предварительного оценивания параметров копула-функций. Более того, отметим, что рассматриваемые копула-функции не обязаны быть вложенными.

8.4. Эмпирические приложения: пример выбора копула-функций

Критерий А1С не вычисляется напрямую в пакете Я, но несложно написать небольшую функцию, которая бы вычисляла значение А1С при заданных значении максимума логарифмической функции правдоподобия и числе параметров. Эта задача остается в качестве 3 упражнения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

'! В пакете МАТЪАВ реализован код для байесовского выбора копула-функции из работы (НиаМ et а1., 2006), он доступен на сайте http://code.goog1e.com/p/copu1a/.

Л

о 9. Критерии согласия для копула-функций

§

ф

| После того, как, согласно указанным выше процедурам, выбрана «наиболее подходящая»

о копула-функция, следующим шагом является проверка того, насколько хорошо она согласи

¡2 суется с имеющимися данными.

с

о $

Одним из вариантов такой проверки является неформальная графическая диагностика,

о в соответствии с которой сравниваются нормированные ранги со случайными выборками,

g сгенерированными в соответствии с используемой копула-функцией. А именно, графиче-

4 ски сравнивается эмпирическая оценка копула-функции с параметрической моделью. Од-(? нако эту процедуру можно рассматривать в качестве предварительного и приблизительно-§ го анализа.

^ С недавнего времени начали появляться работы, в которых изучаются статистические тес-

ig ты, используемые в критериях согласия. Вот лишь некоторые из них: (Genest, Rivest, 1993;

| Shih, 1998; Breymann et al., 2003; Malevergne, Sornette, 2003; Scaillet, 2005; Fermanian, 2005;

5 Panchenko, 2005; Genest et al., 2006a; Berg, Bakken, 2007; Dobric, Schmid, 2007; Quessy et al., t 2007; Genest et al., 2009; Genest, Rémillard, 2008; Berg, 2009).

| Пусть C () — «-мерная копула-функция для рассматриваемой выборки. Необходимо про-

| тестировать следующую гипотезу:

t H0 : C ÎC = {Ca ; aE0} против H, : C Ï C,

<b

5

g где Ca () — параметрическая копула-функция, 0 — пространство параметров.

№ 4 (24) 2011

В случае, когда выбирается наиболее приемлемая одномерная модель, обычно исполь- | зуются такие критерии согласия, как критерий Колмогорова-Смирнова или критерий Ан- g дерсона-Дарлинга. £

Возможным вариантом построения критерия согласия для копула-функций, используе- в мых для описания многомерных распределений, являются подходы, основанные на много- 4 мерном группировании, см., например, (Dobric, Schmid, 2005). К сожалению, при этом, как и во всех подходах, основанных на группировании, используется дискретизация вероятностного пространства, которая практически нереализуема в случае задач большой размерности. Более того, группирование данных в некотором смысле произвольно и весьма нетривиально. Аналогично, подходы, основанные на использовании многомерных ядерных оценок копула-функций, представленные, например, в работах (Fermanian, 2005; Scaillet, 2005), являются в случае большой размерности (характерной для задач из области финансов и страхования) чрезмерно затратными с вычислительной точки зрения. Поэтому далее, характеризуя многомерный случай, будут рассматриваться некоторые другие подходящие подходы.

Перед тем как приступить к анализу различных тестов, кратко определим, что представляет собой преобразование Розенблатта. Изначально оно было предложено в работе (Rosenblatt, 1952) и стало известным как условно-вероятностное интегральное преобразование (Conditional Probability Integral Transform, CPIT). Оно позволяет преобразовать набор зависимых случайных величин, описываемых некоторым многомерным распределением, в набор независимых равномерно распределенных на [0; 1] случайных величин. Таким образом, если для многомерных случайных величин имеется тест на независимость и равномерность, то, используя преобразование Розенблатта, можно протестировать адекватность любой модели.

Если взять случайную величину n = F (X), где F (•) — функция распределения случайной величины X, то n будет иметь равномерное распределение на [0; 1]. Если в качестве F (•) взять иную функцию распределения, скажем G(), то n = G( X) уже не будет равномерно распределенной. Это простое свойство лежит в основе большинства работ, в которых изучаются вопросы, связанные с тестированием распределений и копула-функций.

Дадим формальное определение преобразования Розенблатта.

Определение 13 (преобразование Розенблатта). Пусть X = (Xj,...,Xn) — случайный вектор с функцией распределения FX (xj, х2,..., xn); FX = P( Xi < xi) — функция распределения случайной величиныX, i = 1,...,n. Рассмотрим следующее вероятностно-интегральное преобразование, определяющее n случайных величин V = T(Xi):

T(xj) = P(Xj < xj) = FXi (xj);

T(x2) = P(X2 < x21 Xj = xJ) = Fx2|x (x21 xJ);

T(xn) = P(Xn < xn|Xj = xj,...,Xn-j = xn-j) =

= FXn |Xj ,...,Xn-1 (xn 1 x1,.", xn-1).

Тогда случайные величины V = T (Xi) (i = 1,2,..., n) являются равномерно распределенными на отрезке [0; 1] и взаимно независимыми, а сами преобразования T(Xt) называют-^ 107

№ 4 (24) 2011

ся преобразованиями Розенблатта или условно-вероятностными интегральными преобразованиями (CPIT).

Предположим, что многомерная функция распределения FX (•) имеет копула-функцию C(•), т. е.

FX (X1 , Х2 , • " , Xn ) = C(FX, (X1 ), • • •, FXn (Xn )).

Обозначим через Ci (u1 ,•.., ui ) совместное /-мерное распределение, такое, что:

Ci (ui ,•.., u ) = C (ui ,•.., u ,1,-.,1), i = 1,2, •.., n -1.

При этом C1 (u1 ) = u1 и Cn (u1 ,•.., un ) = C (u1 ,•.., un ). Пусть случайный вектор (U1, — ,Ui ) имеет распределение Ci(u1 ,•..,un). Тогда плотность условного распределения Ui в точке ut при заданных значениях u1,u2,•..,ui_1 случайных величин U1 ,^,Ui_1 соответственно равна:

Ci („i|u1,-, „i 1) = i_CiWu>/ C^^u»

i V i I 1 ~ ~ i — 1 ' /

du1 •..oui_1 j du1 •..öui_ 1

'¡s при i = 1, •.., n . Теперь с использованием условных распределений C{ (•) можно определить

■g случайные величины V{ при i = 2,„.,n : ■fr

Il V = C,(Fx (X,) | FX, (X1 ),•..,fx— , (X,_ 1 )).

c — 1 — 1

Si

§ Как указано в работе (Berg, 2009), преобразование Розенблатта дает значительное пре-

I имущество при тестировании критериев согласия. В (Hong, Li, 2005) представлены резуль-

о таты многомерных тестов с использованием имитационного моделирования и преобразо-

е; ванных исходных случайных величин, которые оказались лучше, чем результаты с исполь-

g зованием непреобразованных случайных величин. В работе (Chen et al., 2004) высказывается

0 предположение, что аналогичный вывод справедлив и для критериев согласия для копула-

1 функций.

I В качестве недостатка тестов, основанных на преобразовании Розенблатта, следует от-

(? метить отсутствие инвариантности относительно принятого порядка нумерации рассмат-

§ риваемых случайных величин. Общее число возможных преобразований случайных вели-

^ чин тогда будет равно n!. В (Berg, 2009) показано, что для некоторых подходов, основан-

£ ных на преобразовании Розенблатта, оценки /-значений критической статистики зависят

1 от того, какой порядок преобразований выбран для рассматриваемых случайных величин.

2 Однако в этой работе также указывается, что по мере роста числа наблюдений различия Ц в /»-значениях уменьшаются, причем эти /-значения асимптотически сходятся к некоторым I общим критическим уровням. Таким образом, в работе (Berg, 2009) высказывается предпо-§ ложение, что выбор порядка преобразований лишь незначительным образом влияет на ре-

® Следуя схеме, представленной в (Berg, 2009), критерии согласия для копула-функций

¡^ зультаты теста. Следуя схем! могут быть классифицированы в девять семейств:

108 |

№ 4 (24) 2011

A : Тесты, основанные на преобразовании Розенблатта. Предложены в работе (Berg, | Bekken, 2007). Этот подход в качестве частных случаев включает в себя подходы, предло- g женные в работах (Malevergne, Sornette, 2003; Breymann et al., 2003; Chen et al., 2004). Se

A : Тесты, основанные на эмпирических оценках копула-функций. Предложены в ра- в ботах2 (Kole et al., 2007; Genest, Rémillard, 2008). ^

A : Тесты, основанные на подходе A и преобразовании Розенблатта. Предложены в (Genest et al., 2009).

A : Тесты, основанные на эмпирических оценках копула-функций и их функций распределения. Предложены в работах (Genest, Rivest, 1993; Wang, Wells, 2000; Savu, Trede, 2008; Genest et al., 2006a).

A : Тесты, основанные на функциях спирменовской меры зависимости (см. (Фантац-цини, 2001b, п. 5.2)). Предложены в (Quessy et al., 2007).

A : Тесты, основанные на критерии Шиха (Shih, 1998) для двумерной модели Клейтона. Обобщены на случай произвольной размерности в работе (Berg, 2009).

A : Тесты, основанные на внутреннем произведении векторов, как мере расстояния между ними. Предложены в работе (Panchenko, 2005).

А : Тесты, основанные на подходе А и преобразовании Розенблатта. Предложены в (Berg, 2009).

А : Тесты, основанные на объединении указанных выше подходов. Предложены в (Berg, 2009).

Подходы А — A основаны на снижении размерности, поскольку статистики этих тестов являются одномерными, тогда как статистика подхода A строится с использованием моментов; критерии А, A представляют собой многомерные подходы. В следующих разделах 9.1 - 9.4 будем придерживаться структуры, предложенной в работах (Berg, 2009; Berg, Bekken, 2007).

9.1. Тесты, основанные на преобразовании Розенблатта Подход А (СР1Т-подход)

Подход А основан на преобразовании Розенблатта, примененном к нормированным рангам 1!1 = (г?11,^,йп1),...,иТ = (и^,...,unT), где компоненты йи вектора и( вычисляются в предположении справедливости нулевой гипотезы о копула-функции Ca по следующей формуле (см. п. 1 из раздела 7.1 работы (Фантаццини, 2001Ь)):

1 T

К = F1,T(xt X где FhT(x) = T+1xt

< x}, i = 1,2,...,n . (32)

В соотношении (32) правая часть определяет непараметрическую оценку частной функции распределения переменной Xi в точке хи. При справедливости нулевой гипотезы, выборка V = (у1 ,..., vT) представляет собой выборку из копула-функции P, отвечающей случаю независимости (также обозначаемой как C±). К сожалению, эмпирический аналог преобразования Розенблатта предполагает использование рангов, что индуцирует зависимость эмпирических значений V i = 1,2,...,п . Таким образом, V, i = 1,...,п , не являются независимыми одинаково распределенными случайными величинами. Тем не менее, как показа-

109

№ 4 (24) 2011

но в работе (Genest et al., 2006а), можно получать достаточно надежные оценкиp-значений критических статистик при помощи параметрической бутстрап процедуры. Теоретические свойства этих оценок представлены в работе (Genest, Rémillard, 2008)4.

Общий вид критической статистики критериев согласия для подхода Д следующий:

n

W = 2^}, t = 1,..., T, (33)

i=i

где Г{} — весовая функция, используемая для взвешивания информации из (v1, ..., vT). В качестве весовой функции может быть использована, например, r{vit } = (Ф-1 (vt ))2, что соответствует подходу из (Breymann et al., 2003). Более того, если нулевая гипотеза соответствует гауссовской копула-функции, тогда имеем подход, предложенный в работе (Malevergne, Sornette, 2003). В двух последних упомянутых работах используется статистика Андерсона-Дарлинга (Anderson, Darling, 1954). В работе (Berg, Bekken, 2007) показано, что статистика Андерсона-Дарлинга с r{vit} = |vit — 0.5| дает достаточно хорошие результаты при тестировании нулевой гипотезы, соответствующей гауссовской копула-функции. Следовательно, для двух упомянутых выше вариантов выбора весовой функции имеем два подхода:

s Aif=2(ф—1v))2 и мь=2>,—0.51.

i=1 i=1

S

3 ( )

Ig Можно показать, что для подхода Ду4 функция распределения F1 (•) статистики W1t для

любых t представляет собой сП -распределение. Однако, как говорилось выше, если ис-Ц пользовать нормированные ранги, распределение Wlt неизвестно. Но для аппроксимации | функции распределения F (') при справедливости нулевой гипотезы необходимо обратить-§ ся к бутстрап процедуре.

| Так называемый «тестовый датчик» (test observator) Sj подхода Д определяется как S5 функция распределения для F(Wt), см. (Berg, 2009):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-о §

С о

5

0

1 При справедливости нулевой гипотезы имеем Slt (w) = w при всех t. Эмпирическая вер-Ii сия тестового датчика может быть вычислена в виде:

Ü

6

о

S1t(w) = P (F (Wt) < w), w e [0;1].

* S (w) = T+^F W) £ w}, w = T+T (34)

Для всех подходов, которые предполагают снижение размерности, в работе (Berg, 2009)

рассматривается статистика Крамера-фон Мизеса, но следует иметь в виду, что могут быть

s использованы и другие статистики (например, Андерсона-Дарлинга, Колмогорова-Смир-w

Щ

о -

&

g

g: A2 и A4. Однако результаты, полученные в работах (Berg, Bekken, 2007; Dobric, Schmid, 2007; Berg, 2009), ука-

ä л t а

<u §

S

о

t §

4 Асимптотические свойства этой бутстрап процедуры до сих пор были получены лишь для подходов 42 и A4. Однако результаты, полученные в работах (Berg, Bekken, 2007; Dobric, Schmid, 21 зывают на справедливость упомянутых асимптотических свойств и для других подходов.

110

i №

4 (24) 2011

нова, см. (Berg, Bekken, 2007; Marsaglia, Marsaglia, 2004)). Если использовать статистику |

H = )) = 1

/ , \Я-(1-1)

1- v(i)

1- Vi)

i = 1,...,n; У(0) = 0. (36)

s

Крамера-фон Мизеса, то критическая статистика имеет вид: g

+ --?_у(2, + 1)$[_Ц (35)

1 3 T + l^f + (Т +1) ^ 4^ + 1/

(см. доказательство в (Berg, 2009)).

Некоторое расширение: CPIT-2 подход. В работе (Berg, Bekken, 2007) показано, что описанный выше подход, в котором используется весовая функция (Ф- ( )) , не всегда является адекватным, поскольку данным, расположенным на границе n-мерного единичного гиперкуба, присваиваются большие веса: при небольших выборках такой способ взвешивания делает подход менее устойчивым и менее мощным, поскольку будут присутствовать несколько наблюдений в граничных областях. Более того, в (Berg, Bekken, 2007) показано, что CPIT-подход может давать плохие результаты в случаях, когда рассматриваемые данные расположены радиально асимметрично.

Учитывая указанные недостатки, в (Berg, Bekken, 2007) был предложен новый подход, названный CPIT-2, который позволяет использовать любую весовую функцию в (33) и при помощи дополнительного интегрального условно-вероятностного преобразования, построенного с использованием порядковых статистик, идентифицировать радиальную асимметрию. По существу, в работе (Berg, Bekken, 2007) предлагается на первом шаге применить условное интегрально-вероятностное преобразование к нормированным рангам U, а на втором шаге применить условное интегрально-вероятностное преобразование к V, полученному на первом шаге.

Пусть V = (V1 ,...,Vn), где V1,...,Vn — независимые равномерно распределенные на [0; 1] случайные величины (будем обозначать это V G U(0; 1)n ). Вектор V получен путем применения интегрального условно-вероятностного преобразования к U. В работе (Berg, Bekken, 2007) соответствующие порядковые статистики обозначаются как:

V(1) <V(2) <... £V( n-1) < V( n).

Если V(1),.,V(n) — порядковые статистики выборки независимых одинаково распределенных из U(0; 1) случайных величин, тогда V^) имеет бета-распределение с параметрами (i, n - (i -1)), см. (D'Agostino, Stephens, 1986, глава 8). Для того чтобы вычислить интегральное условно-вероятностное преобразование для порядковых статистик, Берг и Беккен используют результаты теоремы 2.7 из (David, 1981). С использованием результатов теоремы 1 из (Deheuvels, 1984) и того факта, что в условиях справедливости нулевой гипотезы V G U(0; 1)n, в работе (Berg, Bekken, 2007) получено следующее выражение для интегрального условно-вероятностного преобразования порядковой статистики V:

е et

№ 4 (24) 2011

Слишком большое или слишком малое значение Ht может означать ошибочность нулевой гипотезы, см. (Glen et al., 2001). Позднее в работе (Berg, Bekken, 2007) получена статистика, основанная на одновременном использовании V и H:

n

W2t = (V,,0) -Гн (H), t = 1,..., T, (37)

i=i

где GV (-) и Г н (-) — весовые функции, используемые для взвешивания информации из V и H соответственно. Выбор весовых функций зависит от того, какой области определения копула-функции уделяется наибольшее внимание. Например, если TV = (Ф-1 ())2 и Г н = 1, то получим исходный CPIT-подход (33) из (Breymann et al., 2003).

В работе (Berg, Bekken, 2007) указывается на то, что во многих тестах могут быть получены достаточно хорошие результаты при использовании следующей комбинации двух весовых функций:

а) Tv (X) =| X - 0.51, Гн (X) = 1,

б) Tv (X) = (X - 0.5)2, Гн (X) = 1.

Более того, в случае сильной асимметрии рекомендуется выбрать TV (X) =|X — 0.51, Гн (X) =| X — 0.5 |.

3 Наконец, важно отметить, что в целом распределение W2t неизвестно, и для его оценки '! необходимо использовать бутстрап приближение. Если вычислить W2t с использованием некоторых весовых функций TV и Гн, то можно смоделировать n независимых одинаково рас-

пределенных и(0; 1) случайных величин V, вычислить Ж2(, используя те же самые весовые Ц функции, что и для Ж21. Повторяя эту процедуру большое число раз в предположении справед-

| ливости нулевой гипотезы, можно аппроксимировать функцию распределения ^ для Ж21. §

ф

| Реализация тестов

О Далее представлено подробное описание тестовых процедур, включая вычисление оцеп

г? нок соответствующих ^-значений в предположении справедливости нулевой гипотезы

§ о параметрическом виде копула-функции. Среди описанных процедур — СР1Т и СР1Т-2

0 подходы.

>¡5

® Процедура 9.1. Реализация теста в подходе Д

ч 1. Получить псевдо-наблюдения (ЦЦ,..., и Т) путем преобразования выборочных данных

1

о я а

Й

л »

а

ф §

2 3. Вычислить (у1 ,..., уТ), полученные путем применения интегрального условно-веро-! ятностного преобразования к (и^..., 11Т), в предположении справедливости нулевой гипо-

^ (x1,..., xT) в нормированные ранги с использованием (32).

2. Оценить параметры копула-функции a с использованием состоятельной ММП-оценки a = arg max l(ü1,..., uT; a), где l — логарифмическая функция правдоподобия наблюдений

I тезы о том, что копула-функция равна Ca .

t

о 4. Вычислить CPIT-2 выборку (h1,..., hT), применяя интегральное условно-вероятност-

о

¡^ ное преобразование (36) к (у1 ,..., ут ).

® 5. Используя весовые функции ГV и Гя (если Гн = 1, то и Ж21 совпадают), вычислить Жи или Ж2( по формулам (33) или (37) соответственно.

о

112

i №

4 (24) 2011

6. Если при справедливости нулевой гипотезы для W1t или W2t функция распределения | известна, вычислить F1(W1) или F2 (W2) и перейти к шагу 8. Если распределение неизвест- g но, аппроксимировать F(W) или F2 (W2) следующим образом: для некоторого достаточ- £ но большого целого Nb итеративно повторять нижеприведенную процедуру для каждого в

1 е i1'-,Nb}.

а) сгенерировать случайную выборку v* = (vu,...,vnl), компоненты которой представляют собой компоненты U(0; 1)n случайного вектора;

б) применяя интегральное условно-вероятностное преобразование (36) к (v1l,..., vBl), вычислить h** = (h*,..., h'nJ);

в) в соответствии с (33) или (37), используя те же весовые функции, что и на шаге 5, и беря (v1l,...,vBl) и (h1l,...,hnl), вычислить Wu или W2l соответственно.

1 TT*\Nb ~ *

7. Вычислить F1(W1) =-> 1{JV1l > W1} . F2 (W2) вычисляется аналогичным образом. Nb + 1 l=1 ,

8. В соответствии с (34) и (35) вычислить Т1 (относительно статистики Андерсона-Дар-линга см. (Berg, Bekken, 2007)). T2 вычисляется аналогично.

9. Для некоторого достаточно большого целого K повторить следующие шаги для каждого k = 1,..., K:

а) получить псевдо-наблюдения (ü°k,..., и0к) путем преобразования выборочных данных (x°k,..., x° к) в нормированные ранги с использованием (32);

б) по полученным таким образом псевдо-наблюдениям оценить параметры копула-функ-ции а0 с использованием состоятельной ММП-оценки = argmaxl(ü°k,...,ü°k; а), т. е. полупараметрического метода;

в) вычислить (v°k,..., v°k), полученные путем применения интегрального условно-вероятностного преобразования к (ü1k,..., ü°k) в предположении справедливости нулевой гипотезы о том, что копула-функция равна С.0;

г) вычислить CPIT-2 выборку (h°k,...,h°k) путем применения интегрального условно-вероятностного преобразования (36) к (v°k,..., v° к);

д) используя такие же весовые функции, как на шаге 5, примененные к (v°k,..., v°k) и (h°k,...,h°k), вычислить W1('k или W20k по формулам (33) или (37) соответственно;

е) если при справедливости нулевой гипотезы для W1 к или W2 к функция распределения известна, вычислить F1(W1k) или F2(W2k) и перейти к шагу (з);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• если распределение неизвестно, аппроксимировать F(') или F2 (•), итеративно повторяя (для некоторого достаточно большого целого Nb ) нижеприведенную процедуру для каждого l е {1,..., Nb} :

• сгенерировать случайную выборку v°k = (v1<)lk,...,v°nlk) из U(0; 1)n случайного вектора;

• применяя интегральное условно-вероятностное преобразование (36) к (v1<)*k,...,v°nlk),

hü* / j 0* j 0* \ , , , , i = (h1,*,k h„,l ,k);

• в соответствии с (33) или (37), используя те же весовые функции, что и на шаге 5, и беря (vu,kvn0*l,k) и (CkKl,k), вычислить WWT0l*k или W2°lk соответственно;

ж) вычислить F1(W10k) =-^ b V{Wuk >W<ük}. F2(W2llk) вычисляется аналогичным

образом; Nb +1 ' 1

з) в соответствии с (34) и (35) вычислить Tj°k (относительно статистики Андерсона-Дарлинга см. (Berg, Bekken, 2007)); T2k вычисляется аналогично.

№ 4 (24) 2011

<u

о

10. Для оценки p-значения для подхода Д воспользоваться формулой:

1 к

p=K+T > ^

k=1

9.2. Тесты, основанные на использовании эмпирических копула-функций Подход Д

Подход A2, описанный в (Berg, 2009), основан на тесте, предложенном в работе (Genest, Remillard, 2008). А именно, этот подход основан на использовании эмпирической копула-функции, впервые представленной в (Deheuvels, 1979):

1 т

C(u) = — £«i,• • •,ünt £ип} , (38)

т +1 i=i

где u = (и1,...,ип) Е [0; 1]п. Идея, лежащая в основе этого теста, состоит в сравнении £(•) с параметрической оценкой копула-функции Ca (•). Это классический подход в статистике, 3 который состоит в построении одномерного критерия согласия, основанного на расстоянии '! между эмпирической функцией распределения и распределением, предполагаемым при ну-■g левой гипотезе. С использованием статистики Крамера-фон Мизеса, в работе (Genest et al., ■fr 2009) получена следующая критическая статистика:

I T

! T2 = T f]d (C(U)-C a (U))2 dC(U) = j(<£(U,) - Ca (U, ))2 . (39)

ф »

я

(5 Далее более подробное представлено описание параметрической бутстрап процедуры п

г? вычисления оценок ^-значений при тестировании параметрической нулевой гипотезы для

с о 5 О

копула-функции.

§ Процедура 9.2. Реализация теста в подходе A2

® 1. Получить псевдо-наблюдения (uT,..., uT) путем преобразования выборочных данных Ц (xT,..., xT) в нормированные ранги с использованием (32).

^ 2. Оценить параметры a копула-функции с использованием состоятельной ММП-оцен-ки a = arg maxl(uT ,...,uT; a), т. е. полупараметрического метода.

■с 3. В соответствии с формулой (38) вычислить C(u).

л л

| 4. Если имеется аналитическое выражение для Са (•), то, подставляя С(и) и Са (и) в (39), 2 вычислить оценку Т2 и перейти к шагу 5.

Ц Если аналитического выражения для Са (•) нет, то выбрать достаточно большое нату-| ральное Ыъ > T и реализовать следующие шаги:

И \

о а) согласно предположению о справедливости нулевой гипотезы сгенерировать случай-

^ ную выборку (х*,..., х*^) и, согласно (32), вычислить ассоциированную с ней псевдовыбор-

| ку (и*и^);

§ б) вычислить аппроксимацию Са при помощи

114 I

i №

4 (24) 2011

1 N 1

ca (u)=2 i{u* £ u>, u e [°;чn; i

Nb + 1 l=1 £

<0 e

в) по формуле (39) вычислить приближение статистики Крамера-фон Мизеса: 4

t 2

T = 2(C (Ü,) - Ca (u ,)).

i=1

5. При некотором достаточно большом натуральном K для k = 1,..., K последовательно повторить следующие шаги:

а) согласно предположению о справедливости нулевой гипотезы сгенерировать случайную выборку (xlk,..., xTk) и, используя (32), вычислить ассоциированную с ней псевдовыборку (üT,k,.,UT,k);

б) по полученным таким образом псевдо-наблюдениям оценить параметры а0 копула-функции с использованием состоятельной ММП-оценки ak = arg max l (u Tk,..., ii (0к; a0), т.е. с использованием полупараметрического метода; a

1 T

в) определить C°(u) по формуле C(u) = —— 2% £u>, u e [0; 1]n;

T +1 i=i

г) если определено аналитическое выражение для Ca (•), то положить:

T 2

T20k=2 (Ck0 (U Tk) - с о(U Tk))

и перейти к шагу 6; если аналитическое выражение для Са (•) не определено, то выбрать достаточно большое натуральное Ыь > Т и реализовать следующие шаги:

• согласно предположению о справедливости нулевой гипотезы сгенерировать случайную выборку (х°*.,...,х0** к) и, используя (32), вычислить ассоциированную с ней псевдовыборку (и°;,...,и0*ьк);

• вычислить аппроксимацию С„0 при помощи:

ак

1 N

С* (и) = N"+12 ^ £ и};

"Ь + 1 1=1

• по формуле (39) вычислить приближение статистики Крамера-фон Мизеса:

^=2 (с*°фк) - са* (иок))2.

(=1

6. Для оценки /»-значения в подходе А2 воспользоваться формулой

1 К

Р = ^2 ^ > Т2} .

№ 4 (24) 2011

Некоторое расширение. В работе (Kole et al., 2007) предложен тест, который можно рассматривать в качестве расширения подхода A2 на случаи, когда аналитическое выражение (гауссовское, стьюдентовское и т. п.) для копула-функции отсутствует.

В основе этого теста лежит та же идея, что и в (Genest et al., 2009), состоящая в вычислении расстояния между эмпирической и параметрической копула-функциями. Однако формальное представление функции распределения эллиптического типа, как правило, невозможно, и вычисление их значений с вычислительной точки зрения очень трудоемко в условиях большой размерности. В работе (Kole et al., 2007) используется свойство постоянства функции плотности эллиптических распределений на эллипсоидах. Каждой случайной величине, имеющей эллиптическое распределение, отвечает одномерная случайная величина со специфическим распределением, которое соответствует радиальным эллипсоидам, для которых плотность постоянна (см. (Fang et al., 1990)). Вместо того чтобы рассматривать исходные наблюдения, в работе (Kole et al., 2007) рассматриваются квадраты радиусов эллипсоида, отвечающего постоянной плотности. Как следствие, авторы последней упомянутой работы сравнивают эмпирические распределения квадратов радиусов с их теоретическими распределениями, которые представляют собой некоторые стандартные распределения в случае гауссовской и стьюдентовской копула-функции.

Пусть имеется случайный вектор U = (u1t,...,unt), t = 1,...,T, с частными равномерными на [0; 1] распределениями, зависимости между компонентами которого определяются гаус-3 совской копула-функцией с корреляционной матрицей S . В работе (Kole et al., 2007) стро-5 ится квадрат радиуса следующим образом:

I

? Z0=Z2-1Z, (40)

W

I где Z = (Ф 1 (u1t),. ,Ф 1 (unt))' — вектор значений обратной функции гауссовского одномер-

§ ного распределения в точках u1t,...,unt. Легко показать, что случайная величина ZF имеет

I X -распределение.

Щ

о

и

с; Пусть V = (v1v..,vn)' — случайный вектор, в котором vt имеет равномерное распределе-

g ние на [0; 1], а зависимости между компонентами совместного распределения определяются

о копула-функцией Стьюдента с корреляционной матрицей S и числом степеней свободы n.

| В (Kole et al., 2007) квадрат радиуса строится следующим образом:

ф

S §■

о

W

^ где Zn = (t-1 (v1),..., t~1 (vn))' — вектор значений обратной функции одномерного распреде-¡| ления Стьюдента с числом степеней свободы v . Случайная величина Zn имеет ^-распре-деление с параметрами n и v, т. к. Zn имеет распределение Стьюдента и может быть пред-

§ ставлено как Zn = W / *Js]~n , где W — n-мерная нормальная случайная величина с коваль риационной матрицей S , а S — одномерная случайная величина с хп -распределением. Как следствие, для Z из (41) имеем:

CQ О

| W 'S-1W / n

® Z = -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 n

Zn=CS-1Zn/ n, (41)

S/n

№ 4 (24) 2011

Это представление показывает, что Zn есть отношение двух независимых %2 -распределенных случайных величин, каждая из которых делится на соответствующее ей количество степеней свободы. Тем самым Zn имеет ¥п п -распределение.

Практическая реализация этого расширения подхода А2 аналогична реализации самого А2 и состоит из четырех шагов.

1. При помощи ШМ-метода (Фантаццини, 2011Ь) оценить параметры а копула-функции следующим образом:

а) для моделирования частных распределений воспользоваться полупараметрическим методом из работы фаше^оп, de Vries, 2000), который состоит в том, чтобы моделировать центральную часть функции распределения при помощи эмпирического распределения, а хвосты — при помощи одномерных распределений из теории экстремальных значений; в частности, для моделирования хвостов можно использовать распределение Парето; соответственно, хвосты определяются левым эмпирическим 0.01-квантилем и правым эмпирическим 0.99-квантилем;

б) при помощи метода максимума правдоподобия оценить параметры а копула-функции.

2. Оценить качество выбранной параметрической копула-функции, вычисляя ее расстояние до эмпирической копула-функции; если копула-функция принадлежит эллиптическому семейству (например, гауссовская или стьюдентовская), то с использованием (40) или (41) воспользоваться одним из стандартных критериев согласия. В работе (Ко1е et. а1., 2007) используются следующие меры расстояния:

D1s = max|3B -FH l

Dls =/|Зв -Fh IdFH

x

- F„

m _ I E * H

DAD = max

ОЛ i-

' 4Fh (1 - Fh )

Dam = J I,E 1 dFH J4 Fh (1 - FH )

где SE — эмпирическая функция распределения, а FH — гипотетическое распределение. Первая мера расстояния — расстояние Колмогорова-Смирнова, второе расстояние — среднее абсолютное отклонение, третья мера — расстояние Андерсона-Дарлинга, четвертое — аналог расстояния Андерсона-Дарлинга с усреднением. Для того чтобы уменьшить влияние выбросов при использовании расстояний Андерсона-Дарлинга, в работе (Kote et al., 2007), следуя (Malevergne, Sornette, 2003), исходное | FE - FH | заменено на (Fe - Fh )2.

3. Если форма меры расстояния известна, а параметры копула-функции оценены, для вычисления распределения случайных величин, отвечающих указанным выше четырем расстояниям, в работе (Kole et al., 2007) используется параметрическая бутстрап процедура с K итерациями, это отвечает в точности шагу 5 в реализации подхода A2. Отме-

№ 4 (24) 2011

тим, что двухшаговый IFM-метод также должен быть использован в упомянутой бутстрап процедуре.

4. Подобно шагу 6 в реализации подхода A, для оценки ^-значений использовать полученное на предыдущем шаге распределение для мер расстояний, т. е. подсчитать, сколько раз значения меры расстояния, вычисленные с использованием бутстрап выборок, превышают значение, отвечающее исходной выборке, и поделить это число на K +1.

Подход A3

В работе (Genest et al., 2009) предложено применить предыдущий подход A к случайным величинам, подвергнутым преобразованию Розенблатта, т. е. к V = (v1,..., vT). Следующий шаг состоит в сравнении C (v) с копула-функцией C± (v), отвечающей независимости, с использованием статистики Крамера-фон Мизеса, см. (Genest et al., 2009):

T

Тз = T f (<£(v) - C± (v))2 d<t(v) = 2 (<£(v) - C± (v,))2. (42)

t=\

Процедура 9.3. Реализация теста в подходе A3

Получить псевдо-наблюдения (ü1,..., ü T) путем преобразования выборочных данных (x1,..., xT) в нормированные ранги с использованием (32).

Оценить параметры a копула-функции с использованием состоятельной ММП-оценки

| a = argmax l (ü1,..., ü T; a), т. е. с использованием полупараметрического метода.

Ii a

В предположении справедливости нулевой гипотезы относительно копула-функции Ca <S вычислить интегральное условно-вероятностное преобразование (CPIT) выборочных данных (v1,..., vT) путем применения CPIT к (ü1,..., ü T).

§ Согласно формуле (38) вычислить C(v).

je Согласно формуле (42) вычислить T3.

о При некотором достаточно большом натуральном K для k = 1,2,..., K последовательно п

4 повторить следующие шаги:

§ а) отправляясь от справедливости нулевой гипотезы, сгенерировать случайную вы-

5

борку (x0k,..., x0k) и, используя (32), вычислить ассоциированную с ней псевдовыборку

5 ' ,

S (ili,küT,k ); (Ъ

i? б) по сгенерированной таким образом псевдовыборке оценить параметры a0 копула-

>s

а

5 функции с использованием состоятельной ММП-оценки а? = argmaxI(и,0. ,..., 110 к;а0), т. е.

2 а0

^ с использованием полупараметрического метода;

£ в) в предположении справедливости нулевой гипотезы о параметрическом виде копула-

| функции С_0 вычислить интегральное условно-вероятностное преобразование выборочных ¡2 "к

§ данных (у?к,..., V? к), применяя СР1Т к (и?к,..., 11 ? к);

си $

»

§ 1) определить (И) = у Х{

1T

г) определить C0 (u) = — J 1{v0k < u}, u E [0; 1]";

t=1

I T 2

t д) вычислить T30k = 2 0 (v%) - C±(vlk)) .

S i=i

№ 4 (24) 2011

Вычислить оценку /-значения следующим образом:

1 K

. = — 21(T3°k

> 73}.

Подход A4

В работах (Genest, Rivest, 1993; Wang, Wells, 2000; Savu, Trede, 2008; Genest et al., 2006а) для построения критериев согласия для копула-функций предлагается использовать так называемую функцию зависимости Кендалла K(w) = P (C(U) < w) (см. (Фантаццини, 2011b)). Тестовый датчик S4 для подхода A4 определяется в форме этой функции, т. е.

t

и

е et

= Р(С(и) < w), w е [0; 1] ,

где и — псевдовектор, каждая компонента которого составлена из соответствующих нормированных рангов. При справедливости нулевой гипотезы £4= £4 а , где £4 а — функция зависимости Кендалла, рассчитанная в условиях нулевой гипотезы Н0 и зависящая от параметров соответствующей копула-функции. Непараметрическая оценка для тестового датчика £4 равна:

S.

(w) = 7+21{C (U,) < w}.

Статистика Крамера-фон Мизеса вычисляется следующим образом:

(43)

T = T/ (§4(w) - S4,ä (w))2 dS,(w) = 2(S.

T +1

- S

T + 1

2

(44)

°

i=1

Процедура 9.4. Реализация теста в подходе А4

1. Получить псевдо-наблюдения (и,..., 11Т) путем преобразования выборочных данных (х1,..., хТ) в нормированные ранги с использованием (32).

2. Оценить параметры а копула-функции с использованием состоятельной ММП-оцен-ки а = а^тах I (и,..., 11Т; а), т. е. полупараметрического метода.

а

3. В соответствии с формулой (38) вычислить С(и).

4. Если для 5"4а можно получить аналитическую выражение, то в соответствии с (43) и (44) вычислить статистику Т4, а затем перейти к шагу 5. Если аналитическое выражение для £4 а получить невозможно, то выбрать Ыъ > Т и реализовать следующие шаги:

а) согласно предположению о справедливости нулевой гипотезы сгенерировать случайную выборку (х*,..., х*^) и, используя (32), вычислить ассоциированную с ней псевдовыборку (и*,...,^); л 1 ^^

б) вычислить аппроксимацию £4 а при помощи (м>) = ^ +1 X (и*) £ где

/=1

-•р

C* (и)=ж+г2 i{u* < u}' и е [0;1]";

р 1=1

в) по формуле (44) вычислить приближение для статистики Крамера-фон Мизеса:

№ 4 (24) 2011

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а

T N" \2

T = -N2(s4 (ê* (Û;)) - S4 ((£* (û;})).

Nb 1=1

5. При некотором достаточно большом натуральном K для k = 1,..., K последовательно повторить следующие шаги:

а) согласно предположению нулевой гипотезы сгенерировать случайную выборку (xlk,..., X0k ) и, используя (32), вычислить ассоциированную с ней псевдовыборку (иi,k,...,иt,k),

б) оценить параметры a0 копула-функции с использованием состоятельной ММП-оцен-ки ak = argmaxl(iî10k,...,û0k; a0), т. е. с использованием полупараметрического метода;

T T

в) определить = ^J 1{C0(û0,k £ w}, где ¿0(u) = ^ J 1{û0,k < u}, u Î [0;1f;

г) если для S4 а можно получить аналитическое выражение, то с использованием £4 к и 5"4 а0 в формуле (44) вычислить 1°к и перейти к шагу 6; если аналитическое выражение для 5"4 а получить невозможно, тогда выбрать достаточно большое натуральное Ыъ > Т и реализовать следующие шаги:

• в условиях справедливости нулевой гипотезы сгенерировать случайную выборку . 0* 0*

(х? *,..., к) и в соответствии с (32) вычислить ассоциированную с ней псевдовыборку

Л 0* \

11°*ък); - * , ^ * * „0*

вычислить аппроксимацию S4ao по формуле: S4l*k(м>) = ^ +, X °* (И*/0к ) £ где

>s

S /л0* Л 0* \

? (uU ,.,UûNib к );

£ •

Ï ^

II ¿0* (u) = N+î J 1{û0k < u}, u e [0; 1]" ;

p b i=î

i=î

■s • по формуле (44) вычислить приближение для статистики Крамера-фон Мизеса:

T«=N2 (¿Г (ûz)) - % (êk* (û0;))).

s

i T N is T

2 T N _

§ Nb 1=1

с о

0 6. Вычислить оценку p-значения с использованием формулы:

S

* l k

1 p =-Ji{T40k > T4}.

5 K + 4,k 4

6 "

о

Подход А

В работе (Quessy et а1., 2007) предлагается критерий согласия для двумерных копула-|| функций, который основан на функции зависимости Спирмена Ь2(м>) = Р(иЦ12 < При § этом Р(иф2 < м>) = Р (с±фф2) < м>). Этот подход обобщается на случай произвольной раз-¡3 мерности п, при этом Ьп= Р(и) < и тестовый датчик S5 подхода А определяет-

S5(w) = P(с±(TLJ) < w), w G [0; 1],

§

® ся соотношением: »

Щ

0

1

® где и — псевдовектор, каждая компонента которого составлена из соответствующих нор-§ мированных рангов. При справедливости нулевой гипотезы (Н0), S5 = S5a где

a

№ 4 (24) 2011

55 а (М — функция зависимости Кендалла, рассчитанная при справедливости Н0 и зави- |

сящая от параметров соответствующей копула-функции. Возьмем непараметрическую оцен- §

ку для 55 : £

1 т *

$5 М = т+Г 2^ Я) £ (45) *

Статистика Крамера-фон Мизеса вычисляется следующим образом:

1 T

T = T f(S5(w) - S5ß (w))2dS5(w) = 2 (тгт) - S,a ))2. (46)

0 i=1

Процедура 9.5. Реализация теста в подходе A

1. Получить псевдо-наблюдения (ür,..., üT) путем преобразования выборочных данных (xj,..., xT) в нормированные ранги с использованием (32).

2. Оценить параметры a копула-функции с использованием состоятельной ММП-оцен-ки a = arg maxl(ür,•..,üT; a), т. е. полупараметрического метода.

a

3. Если для S5 a существует аналитическое выражение, то, используя формулы (45) и (46), вычислить T50k и перейти к шагу 4. Если аналитическое выражение для S5 a получить невозможно, тогда выбрать достаточно большое натуральное Nb > T и реализовать следующие шаги:

а) согласно предположению о справедливости нулевой гипотезы сгенерировать случайную выборку (x*,..., xN) и, используя (32), вычислить ассоциированную с ней псевдовыборку (ü*,., ü N);

б) вычислить аппроксимацию S5 a при помощи: S5 (w) = N+Г 2(u*) £ w};

b i=j

в) по формуле (46) вычислить приближение для статистики Крамера-фон Мизеса:

T

T = -TT 2(4 (C (ü;)) - s;(C± (ü; >)).

Nb Ы

4. При некотором достаточно большом натуральном K для k = 1,..., K последовательно повторить следующие шаги:

а) в условиях справедливости нулевой гипотезы сгенерировать случайную выборку (xj0k,..., x°k) и, используя (32), вычислить ассоциированную с ней псевдовыборку

("0 "0 ). (ü 1,k ,•••,11T, k );

б) оценить параметры a0 копула-функции с использованием состоятельной ММП-оцен-ки a° = arg max l (ü °k ,•.., ü °k; a0), т. е. полупараметрического метода;

a0

T

в) определить S°,k (w) = j+Г 2^С. ("Ik) £ w};

i=j

г) если для S5a существует аналитическое выражение, то с использованием S50k и S510

,a 5,ak

по формуле (46) вычислить T5 k и перейти к шагу 5; если аналитическое выражение для S5 a

121

№ 4 (24) 2011

получить невозможно, то выбрать достаточно большое натуральное Ыь > Т и реализовать следующие шаги:

• в условиях справедливости нулевой гипотезы сгенерировать случайную выборку (х01^,...,х0** к) и, используя (32), вычислить ассоциированную с ней псевдовыборку

/«0* ~ 0* \ . (111,Ь---, 11 ыь ,к);

• вычислить аппроксимацию 10 при помощи формулы

Щ

^о; м=21С (и о*) £ ^

ь 1=1

по формуле (46) вычислить приближение для статистики Крамера-фон Мизеса

rp N, 2

% = N-К))-(Ü0;))) .

Nb 1=1

5. Вычислить оценку /-значения по формуле

1 к

Р=21T0k > .

k=1

'S 5

Ig 9.3. Другие подходы к построению критериев согласия

| Подход Д

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

| В работе ^ЫЬ, 1998) предложен основанный на моментных тождествах критерий согла-§ сия для двумерных моделей, задаваемых копула-функцией Клейтона. В ней рассматривает ются невзвешенные и взвешенные оценки параметра зависимости а с использованием г-Кен-

о далла и взвешенной ранговой оценки, а именно: п

5

I а 21 а 2<Аз / Ш (47)

^ ч г=-г и ч ш --, (47)

1 1-г ш 2<(1 -А,)/ш' ' ; ф

ч

| где г = -1 + 42 , А, / Г(Г-1), А, = 1{(ии){иъ-V,) > 0},

с ' 3

а Ш, = 2Т=11&1' £ тах^Д з), ^ £ тах^ ,и,)}.

»

® Учитывая, что а г и аш являются несмещенными оценками для а, в предположении спра-

2 ведливости нулевой гипотезы (С = Са для а> 0) в ^Ы^ 1998) была предложена следую-| щая критическая статистика:

Tshih ( « г-« W ).

ф

5 t

w

Щ

о

6

® В (Shih, 1998) показано, что при справедливости нулевой гипотезы приведенная выше

§ статистика имеет асимптотически нормальное распределение. Однако позднее в (Genest et al.,

№ 4 (24) 2011

2006b) было указано, что представленная в (Shih, 1998) формула для дисперсии этого асим- |

S.

птотического нормального распределения неверна, и предложен исправленным вариант g этой формулы. В работе (Berg, 2009) предлагается расширить этот подход на случай про- fe

,, „ ^ (С

извольном размерности n путем сравнения а t и аW для каждом пары случайных величин. в Как следствие, результирующий вектор, составленный из n( n — 1) / 2 статистик, будет иметь 4 асимптотическое n( n — 1) / 2-мерное нормальное распределение с невырожденной ковариационной матрицей, формула для которой пока не выведена. Если умножить вектор статистик на матрицу, обратную к квадратному корню ковариационной матрицы, то результирующий нормированный вектор имеет асимптотическое стандартное нормальное распределение, а сумма квадратов нормированных статистик будет иметь %2 -распределение с n(n — 1) / 2 степенями свободы.

Не имея формулы ковариационной матрицы, Berg (2009) вычисляет ненормированные суммы квадратов и использует параметрическую бутстрап процедуру для оценки ^-значения. Критическая статистика для подхода A6 равна:

6 =22 ("^ IV„)2. (48)

¿=1 7=1+1

Отметим, что а№ и в целом подход А6 может быть использован только для тестирования копула-функции Клейтона.

Процедура 9.6. Реализация теста в подходе А6

1. Получить псевдо-наблюдения (й;,..., 11Т) путем преобразования выборочных данных (х1,..., хТ) в нормированные ранги с использованием (32).

2. Оценить параметры а копула-функции с использованием состоятельной ММП-оцен-ки а = а^тах I (й;,..., й Т; а), т. е. полупараметрического метода.

а

3. В соответствии с (47) вычислить параметры аг и а № .

4. В соответствии с (48) вычислить Т6.

5. При некотором достаточно большом натуральном К для к = 1,...,К последовательно повторить следующие шаги:

а) в условиях справедливости нулевой гипотезы сгенерировать случайную выборку (х°к,..., х°к) и, используя (32), вычислить ассоциированную с ней псевдовыборку

( 1 0 1 0 ); (й 1,к ,.••,й Т, к );

б) в соответствии с (47) вычислить аг к и а№ к;

в) в соответствии с (48) и используя полученные на предыдущем шаге а(].к и к , вычислить 16к .

Вычислить оценку p-значения, используя формулу

1 к

p=к+12 «Ъ >T >•

к=1

Подход А7

В работе (РапЛепко, 2005) предложен тест, основанный на скалярном произведении и и и а , где и — псевдовектор, каждая компонента которого равна соответствующему нор-

123

№ 4 (24) 2011

мированному рангу, а иа — аналог вектора и, отвечающий нулевой гипотезе (при этом а — состоятельная оценка параметра копула-функции). Идея этого теста состоит в использовании скалярного произведения в качестве меры расстояния между двумя векторами. Определим квадрат расстояния Q между двумя векторами формулой

2 = <й-иа К |и-йа>5,

где kn — положительно определенное симметричное ядро; в частности, в качестве kn может быть взято гауссовское ядро:

kn (U, U') = exp{-1| U - U' ||2 /(2nh2)},

где || • || обозначает евклидову норму в Rn; h > 0 — ширина «окна». Очевидно, что Q будет равно нулю тогда и только тогда, когда U = U a .

Если имеются случайные выборки (u,..., ü T) из U, то следующим шагом является генерация случайных выборок (ü*,...,ü*T) вектора Ua , отвечающего нулевой гипотезе. Скалярное произведение Q может быть представлено в виде Q = Qjj — 2QJ2 + Q22, а каждое слагаемое этого разложения может быть оценено с использованием V-статистики (в качестве введения в теорию U- и V-статистик см. (Denker, Keller, 1983)). Критическая статистика

I подхода A7 имеет вид:

| Т = т* 2 2 *« (й,, и,) - 2 2 (й,, и*)+^ 2 2 к-(и*, и*). (49)

^ 1=1 }=1 1=1 }=1 1=1 }=1

С §

§

^ Процедура 9.7. Реализация теста в подходе А7

| 1. Получить псевдо-наблюдения (й,...,йТ) путем преобразования выборочных данных

8 (х1,..., хт) в нормированные ранги с использованием (32).

| 2. Оценить параметры а копула-функции с использованием состоятельной ММП-оцен-

« ки а = а^тахI(й,...,йт;а), т. е. полупараметрического метода.

° а

| 3. В условиях справедливости нулевой гипотезы сгенерировать случайную выборку

§ (х1,...,хТ) и, используя (32), вычислить ассоциированную с ней псевдовыборку (йЦ,...,йТ).

а 4. В соответствии с (49), используя (и1,...,йт) и (жж 1,...,йТ), вычислить Т7.

о

я

а *

5. При некотором достаточно большом натуральном К для к = 1,.,К последовательно повторить следующие шаги: ® а) в условиях справедливости нулевой гипотезы сгенерировать случайную выбор-¡2 ку (х0к,..., х0к) и, используя (32), вычислить ассоциированную с ней псевдовыборку

§ (и°ки°,к ); ® о

| б) оценить параметры а копула-функции с использованием состоятельной ММП-оцен-

С5

(5 ки а°о = argmax/(й°к,..., й0к; а0), т. е. полупараметрического метода;

§■ а , ,

ч

ф _

§ 5 Определение и подробности см. в (Panchenko, 2005).

№ 4 (24) 2011

в) используя копула-функцию С„0, отвечающую нулевой гипотезе, сгенерировать слу- 5

а к ¡5

чайную выборку (х°к,..., х°*к) и, используя (32), вычислить ассоциированную с ней псевдо- Ц сборку (и ,..., и );

г) в соответствии с (49) и с использованием (и°к,...,и°к) и (и^,...,и°*к) вычислить Т7°>к. с*

6. Вычислить оценку p-значения по формуле

1 к

p=к+217

> T7).

Подход Ag

В работе (Berg, 2009) предложено расширение подхода A7, которое состоит в применении подхода A7 к величинам, подвергнутым преобразованию Розенблатта, т. е. к V = (v1,...,vT). Если имеются выборки (v*,...,vT), извлеченные из копула-функции, отвечающей случаю независимости, статистика подхода Ag равна:

T8=72 22*» (v, vi) - T2r (v, v*)+72 (v*, v*). (50)

i=1 j=1 1=1 j=1 1=1 j=1

В работе (Berg, 2009) отмечается, что может показаться странным желание строить выводы относительно отклонения от проверяемой (нулевой) гипотезы на основании единственной выборки, отвечающей нулевой гипотезе. Тем не менее, этот подход изначально рассматривался в работе (Panchenko, 2005), и Берг (2009) предпочел рассматривать этот тест именно в таком виде. Более того, подход A8 направлен на то, чтобы проверить эффект преобразования Розенблатта в случае использования подхода A7.

Процедура 9.8. Реализация теста в подходе Ag

1. Получить псевдо-наблюдения (u1,..., u T) путем преобразования выборочных данных (x1,..., xT) в нормированные ранги с использованием (32).

2. Оценить параметры a копула-функции с использованием состоятельной ММП-оцен-ки a = arg maxl(u 1 ,...,uT; a), т. е. полупараметрического метода.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

a

3. В предположении справедливости нулевой гипотезы относительно копула-функции Ca вычислить интегральное условно-вероятностное преобразование (CPIT) выборочных данных (v1,..., vT) путем применения CPIT к (ü1,..., u T).

4. Сгенерировать выборку (v1,...,vT) из копула-функции, отвечающей независимости.

5. В соответствии с (50) и с использованием (v1,...,vT) и (v1,...,vT) вычислить Tg .

6. При некотором достаточно большом натуральном Kдля k = 1,.,K последовательно повторить следующие шаги:

а) в условиях справедливости нулевой гипотезы сгенерировать случайную выборку (x0k,..., x0k) и, используя (32), вычислить ассоциированную с ней псевдовыборку (ui,k,•••,11 t,k) ;

б) оценить параметры a0 копула-функции с использованием состоятельной ММП-оцен-ки i"0 = argmax l(ii10k ,..., u°k; a0), т. е. полупараметрического метода;

125

№ 4 (24) 2011

в) в предположении справедливости нулевой гипотезы относительно копула-функции

С10 вычислить интегральное условно-вероятностное преобразование (СР1Т) выборочных

а к

данных (у°к,..., у°к) путем применения СР1Т к (й0,ь..., и 0,к);

г) используя копула-функцию, отвечающую независимости, сгенерировать случайную выборку (у111*^^у°^к);

д) в соответствии с (50), используя (v°k,..., v0k) и (у0*,..., v°*k), вычислить T8 7. Вычислить оценку /-значения по формуле

1 к

f=к+12 «fc >^

0.

8,k '

9.4. Тесты, основанные на усреднении критических статистик

Выше были рассмотрены некоторые критерии согласия для копула-функций. Справедливо задаться вопросом, а может ли усреднение этих тестов (с разными способами измерения отклонений от нулевой гипотезы) дать более устойчивые результаты? Ответ на этот вопрос дается в работе (Berg, 2009), где подход с усреднением обозначен как A . 3 Понятно, что усреднение должно осуществляться по стандартизированным переменным. '! Более того, следует использовать оптимальные веса для расчета взвешенного среднего. Тем ■g не менее, в силу некоторых вычислительных аспектов, в работе (Berg, 2009) представлены * только два варианта усреднения:

Ц первый вариант состоит в усреднении всех девяти указанных выше подходов; ему от-Р вечает статистика:

| t? = + 7Г + 24 (5D

и

§

g второй вариант состоит в усреднении лишь тех подходов, которые основаны на исполь-

о зовании эмпирической копула-функции, а именно подходов A, A3 и A4; статистика для

g такого усреднения равна:

ф 5

I Tf = 3 (f2 +T +f4).

(52)

55 Процедура 9.9. Реализация теста в подходе Ад

Л 1. Получить псевдо-наблюдения (и,..., и Т) путем преобразования выборочных данных

| (х1,..., хТ) в нормированные ранги с использованием (32).

| 2. Оценить параметры а копула-функции с использованием состоятельной ММП-оцен-

| ки а = а^тах I (и,..., и Т; а), т. е. с использованием полупараметрического метода.

и а „ Т

о 3. Используя (и^..., 11Т) и а, реализовать необходимые шаги для вычисления критиче-

| ских статистик процедур 9.1 - 9.8 и вычислить ?1(а), Т^, Т2 — Т8.

Ч /v

4. В соответствии с (51) - (52) вычислить Тд(а) и Тд(Ь) соответственно.

126

№ 4 (24) 2011

5. При некотором достаточно большом натуральном К для к = 1,...,К последовательно |

повторить следующие шаги: §

¡3

а) в условиях справедливости нулевой гипотезы сгенерировать случайную выбор- *

ку (х0к,..., х0к) и, используя (32), вычислить ассоциированную с ней псевдовыборку ^

("0 "0 ) . (и^ к,...,ит,к) ;

б) оценить параметры а0 копула-функции с использованием состоятельной ММП-оцен-ки <"0 = а^тах I (и0к,..., и °к; а0), т. е. с использованием полупараметрического метода;

а0

в) используя (и 1к,...,итк) и а° , реализовать необходимые шаги для вычисления критических статистик из процедур 9.1 - 9.8 и вычислить гТ1(0)(а), ТУ, Т20к — Т80к;

г) в соответствии с (51)-(52), используя Т^), ТУ, Т20к — Т80к, вычислить Т9«ка) и Т90кЬ). Вычислить оценку ^-значений по формулам:

)(а) = 1 ^ >f9(a)p(b) = K+i1 >T(b)}. K+1 k=i k=i

Сравнение подходов с помощью имитационного моделирования. В работе (Berg, 2009) проведено объемное имитационное моделирование с целью сравнения описанных выше подходов к построению критериев согласия для копула-функций. И хотя показано, что не существует критерия, превосходящего по мощности любой другой из рассматриваемых подходов, подходы Д, A4 и A9 дают очень хорошие результаты, причем последний из них можно признать лучшим.

Интересно, что при тестировании гипотезы гауссовости (при альтернативе распределения с «тяжелыми хвостами») слабый в других ситуациях подход A дает очень хорошие результаты для высоких размерностей и больших объемов выборок. Следовательно, его целесообразно использовать в качестве предварительного теста проверки эллипсоидальности распределения с тем, чтобы решить, какой из подходов выбрать для дальнейшего исследования, см. (Huffera, Park, 2007).

9.5. Эмпирические приложения с пакетом R: пример реализации подхода A2

Модули пакета R дают возможность численно реализовать критерии согласия, основанные на сравнении эмпирической копула-функции с ее параметрической оценкой (в предположении справедливости проверяемой гипотезы), т. е. практически осуществить подход A2. Критическая статистика строится с использованием расстояния Крамера-фон Мизеса. Приближения для ^-значений критической статистики вычисляются с использованием параметрических бутстрап-процедур, предложенных в (Genest, Remillard, 2008; Genest et al., 2009), или с помощью подхода, изложенного в (Kojadinovic et al., 2011; Kojadinovic, Yan, 2011). Ниже приведен код процедуры в соответствующем модуле пакета R.

127

№ 4 (24) 2011

library(copula)

x <- rcopula(claytonCopula(3), 200)

## Does the Gumbel family seem to be a good choice? gofCopula(gumbelCopula(l), x) ## What about the Clayton family? gofCopula(claytonCopula(1) , x)

## The same with a different estimation method gofCopula(gumbelCopula(l), x, method="itau") gofCopula(claytonCopula(1), x, method="itau")

## A three-dimensional example

x <- rcopula(tCopula(c(0.5, 0.6, 0.7), dim = 3, dispstr = "un"),200) ## Does the Clayton family seem to be a good choice? gofCopula(gumbelCopula(l, dim =3), x) ## What about the t copula?

t.copula <- tCopula(rep(0, 3), dim = 3, dispstr = "un", df.fixed=TRUE) gofCopula(t.copula, x)

## The same with a different estimation method

gofCopula(gumbelCopula(l, dim =3), x, method="itau")

gofCopula(t.copula, x, method="itau")

55 ## The same using the multiplier approach >S

S gofCopula(gumbelCopula(l, dim =3), x, simulation="mult") 5

¡^ gofCopula(t.copula, x, simulation="mult") ■fr w

§ fit tests:

§ > gofCopula(gumbelCopula(l), x) <u s t w

§ Iteration 100 .a

S3 "'

C Iteration 1000 o 5 o

For sake of space, we report only the output relative to the first two goodness-of-

Progress will be displayed every 100 iterations.

$statistic [1] 0.2648942

'! $pvalue [1] 0.0004995005 t <u

is

$parameters [1] 1.980118

J > gofCopula(claytonCopula(1), x)

С Progress will be displayed every 100 iterations.

a Iteration 100

•o ... t

^ Iteration 1000 §

<3 $statistic [1] 0.01489807 о

| $pvalue [1] 0.54995

^ $parameters [1] 3.317709

t

w

QQ О

¡^ Отметим, что в пакете, созданном Даниэлем Бергом, рассмотрен более широкий диапазон

® критериев согласия для копула-функций. Однако к моменту написания статьи (июль 2011 г.)

§ существовала только предварительная версия этого пакета.

128

i №

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4 (24) 2011

Список литературы g

I

Фантаццини Д. (2011a). Моделирование многомерных распределений с использованием копула- 2 функций. I. Прикладная эконометрика, 22 (2), 98 - 134. §

Фантаццини Д. (2011b). Моделирование многомерных распределений с использованием копула- ct функций. II. Прикладная эконометрика, 23 (3), 98 - 132.

Anderson T. W., Darling D. A. (1954). A test of goodness of fit. Journal of the American Statistical Association, 49, 765 - 769.

Berg D. (2009). Copula goodness-of-fit testing: An overview and power comparison. The European Journal of Finance, 15, 675 - 701.

Berg D., Bakken H. (2007). A goodness-of-fit test for copulas based on the probability integral transform. Technical report, University of Oslo, Statistical research report no. 10.

Breymann W., Dias A., Embrechts P. (2003). Dependence structures for multivariate high-frequency data in finance. Quantitative Finance, 3, 1 - 14.

Chen X., Fan Y. (2006). Estimation and model selection of semiparametric copula-based multivariate dynamic models under copula misspecification. Journal of Econometrics, 135, 125 - 154.

Chen X., Fan Y., Patton A. (2004). Simple tests for models of dependence between multiple financial time series, with applications to U. S. equity returns and exchange rates. London Economics Financial Markets Group, Working Paper n. 483.

D'Agostino R. B., Stephens M. A. (1986). Goodness-of-fit techniques. New York: Marcel Dekker Inc.

Danielsson J., de Vries C. G. (2000). Value-at-risk and extreme returns. Annales d'Economie et de Statistique, 60, 239 - 270.

David H. A. (1981). Order statistics. 2 ed., Wiley.

Deheuvels P. (1979). La fonction de dépendance empirique et ses proprietés: Un test non paramétrique d'indépendence. Bulletin de l'Académie Royale de Belgique, Classe des Sciences, 5e série, 65, 274 - 292.

Deheuvels P. (1984). The characterization of distributions by order statistics and record values: A unified approach. Annals of Eugenics, 21 (2), 326 - 334.

Denker M., Keller G. (1983). On U-statistics and v. Mises' statistics for weakly dependent processes. Probability Theory and Related Fields, 64 (4), 505 - 522.

Dias A., Embrechts P. (2004). Change-point analysis for dependence structures in finance and insurance. In: Risk Measures for the 21st Century, ed. by Giorgio Szegoe, 321 - 335. Wiley Finance Series.

Dobric J., Schmid F. (2005). Testing goodness of fit for parametric families of copulas — application to financial data. Communications in Statistics: Simulation and Computation, 34 (4), 1053 - 1068.

Dobric J., Schmid F. (2007). A goodness of fit test for copulas based on Rosenblatt's transformation. Computational Statistics and Data Analysis, 51 (9), 4633 - 4642.

Fang K. T. Kotz S., Ng K. (1990). Symmetric multivariate and related distributions. In: Monographs on Statistics and Applied Probability, vol. 36. Chapman and Hall: London.

Fermanian J. (2005). Goodness of fit tests for copulas. Journal of Multivariate Analysis, 95, 119 - 152.

Genest C., Rivest L. (1993). Statistical inference procedures for bivariate Archimedean copulas. Journal of the American Statistical Association, 88, 1034 - 1043.

Genest C., Rémillard B. (2008). Validity of the parametric bootstrap for goodness-of-fit testing in semi-parametric models. Annales de l'Institut Henri Poincaré, Probabilités et Statistiques, 44 (6), 1096 - 1127.

№ 4 (24) 2011

Genest C., Quessy J. F., Rémillard B. (2006a). Goodness-of-fit procedures for copula models based on the probability integral transform. Scandinavian Journal of Statistics, 33, 337 - 366.

Genest C., Quessy J. F., Rémillard B. (2006b). On the joint asymptotic behavior of two rank-based estimators of the association parameter in the gamma frailty model. Statistics and Probability Letters, 76, 10 - 18.

Genest C., Rémillard B., Beaudoin D. (2009). Goodness-of-fit tests for copulas: A review and a power study. Insurance: Mathematics and Economics, 44 (2), 199 - 213.

Glen A. G., Leemis L. M., Barr D. R. (2001). Order statistics in goodness-of-fit testing. IEEE Transactions on Reliability, 50 (2), 209 - 213.

Hong Y., Li H. (2005). Nonparametric specification testing for continuous-time models with application to spot interest rates. Review of Financial Studies, 18, 37 - 84.

Huard D., Ivin G., Favre A. C. (2006). Bayesian copula selection. Computational Statistics and Data Analysis, 51 (2), 809 - 822.

Huffera F. W., Park C. (2007). A test for elliptical symmetry. Journal of Multivariate Analysis, 98 (2), 256 - 281.

Jaynes E. T., Bretthorst G. L. (2003). Probability theory: The logic of science. Cambridge University Press.

Kojadinovic I., Yan J. M., Holmes M. (2011). Fast large-sample goodness-of-fit tests for copulas. Sta-tistica Sinica, 21 (2), 841 - 871. 'g Kojadinovic I., Yan J. (2011). A goodness-of-fit test for multivariate multiparameter copulas based on | multiplier central limit theorems. Statistics and Computing, 21 (1), 17 - 30.

■I Kole E., Koedijk K., Verbeek M. (2007). Selecting copulas for risk management. Journal of Banking SS and Finance, 31, 2405 - 2423.

| Malevergne Y., Sornette D. (2003). Testing the gaussian copula hypothesis for financial assets depen-§ dence. Quantitative Finance, 3, 231 - 250.

¡5

* Marsaglia G., Marsaglia J. (2004). Evaluating the Anderson-Darling distribution. Journal of Statistical o Software, 9 (2), 1 - 5.

§ Panchenko V. (2005). Goodness-of-fit test for copulas. PhysicaA, 355 (1), 176 - 182. is

§ Quessy J. F., Mesfioui M., Toupin M. H. (2007). A goodness-of-fit test based on Spearmans dependence

>s function. Working paper, Université du Québec à Trois-Rivières. s

œ Rosenblatt M. (1952). Remarks on a multivariate transformation. The Annals of Mathematical Statis-

| tics, 23, 470 - 472.

<u

^ Savu C., Trede M. (2008). Goodness-of-fit tests for parametric families of Archimedean copulas. Quanta

w titative Finance, 8 (2), 109 - 116.

3 Scaillet O. (2005). Kernel based goodness-of-fit tests for copulas with fixed smoothing parameters. FAME

^ Research Paper Series n. 145, International Center for Financial Asset Management and Engineering. §

2 Shih J. H. (1998). A goodness-of-fit test for association in a bivariate survival model. Biometrika, 85,

| 189 - 200.

| Takeuchi K. (1976). Distribution of information statistics and criteria for adequacy of models. Math-

ca ematical Sciences, 153, 12 - 18. o

& Wang W., Wells M. T. (2000). Model selection and semiparametric inference for bivariate failure-time

^ data. Journal of the American Statistical Association, 95, 62 - 72. ^ White H. (2000). A reality check for data snooping. Econometrica, 68, 1097 - 1126.

i Надоели баннеры? Вы всегда можете отключить рекламу.