Научная статья на тему 'ПРИМЕНЕНИЕ МЕТОДА РАЗДЕЛЕНИЯ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ В ЗАДАЧАХ ФИНАНСОВОГО АНАЛИЗА'

ПРИМЕНЕНИЕ МЕТОДА РАЗДЕЛЕНИЯ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ В ЗАДАЧАХ ФИНАНСОВОГО АНАЛИЗА Текст научной статьи по специальности «Математика»

CC BY
103
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
стохастические дифференциальные уравнения / конечные смеси нормальных распределений / оптимизационный метод разделения смеси вероятностных распределений / волатильность / оценка Value at Risk / stochastic differential equations / finite mixtures of normal distributions / optimization method for separating mixtures of probability distributions / volatility / Value at Risk estimation

Аннотация научной статьи по математике, автор научной работы — А О. Лагно, И С. Кузьмин

Данная работа посвящена задаче разделения смесей вероятностных распределений. Для статистического оценивания параметров смеси предложен оптимизационный метод как альтернатива ЕМ-алгоритму (Expectation-Maximization). Рассматривается идея аппроксимации распределения приращений (логарифмов) финансовых данных смесью нормальных законов. Представлено практическое приложение такой аппроксимации к задачам расчета и прогнозирования волатильности, а также к задаче вычисления меры риска (Value at Risk). Полученные результаты позволяют сделать вывод об адекватности применения смесей нормальных распределений к описанию финансовых данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF THE METHOD OF SEPARATION OF MIXTURES OF PROBABILITY DISTRIBUTIONS IN FINANCIAL ANALYSIS PROBLEMS

This paper is devoted to the problem of separation of mixtures of probability distributions. An optimization method is proposed as an alternative to the EM-algorithm (Expectation-Maximization) for statistical estimation of mixture parameters. The idea of approximating the distribution of increments (logarithms) of financial data by a mixture of normal laws is considered. The practical application of such an approximation to the problems of calculating and predicting volatility, as well as to the problem of calculating the risk measure (Value at Risk), is presented. The results obtained allow us to conclude that the application of mixtures of normal distributions to the description of financial data is adequate.

Текст научной работы на тему «ПРИМЕНЕНИЕ МЕТОДА РАЗДЕЛЕНИЯ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ В ЗАДАЧАХ ФИНАНСОВОГО АНАЛИЗА»

ВЕСТН. МОСК. УН-ТА. СЕР. 15. ВЫЧИСЛ. МАТЕМ. И КИБЕРН. 2023. № 3. С. 33-48 Lomonosov Computational Mathematics and Cybernetics Journal

УДК 793.71

А. О. Лагно1, И. С. Кузьмин2

ПРИМЕНЕНИЕ МЕТОДА РАЗДЕЛЕНИЯ СМЕСЕЙ ВЕРОЯТНОСТНЫХ РАСПРЕДЕЛЕНИЙ В ЗАДАЧАХ ФИНАНСОВОГО АНАЛИЗА

Данная работа посвящена задаче разделения смесей вероятностных распределений. Для статистического оценивания параметров смеси предложен оптимизационный метод как альтернатива ЕМ-алгоритму (Expectation-Maximization). Рассматривается идея аппроксимации распределения приращений (логарифмов) финансовых данных смесью нормальных законов. Представлено практическое приложение такой аппроксимации к задачам расчета и прогнозирования волатильности, а также к задаче вычисления меры риска (Value at Risk). Полученные результаты позволяют сделать вывод об адекватности применения смесей нормальных распределений к описанию финансовых данных.

Ключевые слова: стохастические дифференциальные уравнения, конечные смеси нормальных распределений, оптимизационный метод разделения смеси вероятностных распределений, волатиль-ность, оценка Value at Risk.

DOI: 10.55959/MSU/0137-0782-15-2023-47-3-33-48

1. Введение. Нормальное распределение в силу своей привычности и простоты расчетов завоевало широкую распространенность в качестве основы различных моделей финансовых данных. Однако такие неотъемлемые свойства, как несимметричность, островершинность и "толстые хвосты" эмпирических распределений доходностей и других финансовых рядов призывают к отходу от нормальности.

В качестве модели распределения приращений (логарифмов) биржевых цен стоит обратить внимание на смеси вероятностных распределений, и в частности сдвиг-масштабные смеси нормальных законов, в силу их высокой адекватности. Благодаря своей гибкости, обусловленной большим числом параметров, модели конечных смесей нормальных законов демонстрируют очень хорошее согласие с реальными данными. Смешанные вероятностные распределения способны дать лучшее согласие с эмпирическими данными, чем набирающие популярность распределения Стьюдента, Коши, Лапласа, так как последние являются "частным случаем", поскольку могут быть представлены в виде смесей нормальных законов.

Идея применения нормальных смесей в качестве моделей распределений приращений (логарифмов) стохастических процессов зародилась довольно давно. Так, классические ARCH- и GARCH-модели были предложены для анализа таких временных рядов, условные распределения которых являются гауссовскими, вследствие чего их безусловные распределения являются смесями нормальных законов. То же самое относится и к модели геометрического броуновского движения, задаваемой стохастическим дифференциальным уравнением.

При определении параметров смеси нормальных распределений по эмпирическим данным возникает задача статистического разделения смеси. Для численного решения задачи разделения конечной смеси вероятностных распределений (т.е. задачи отыскания статистических оценок весов компонент смеси и параметров компонент смеси) при потенциально большом числе компонент традиционно применяется ЕМ-алгоритм (Expectation-Maximization) [1]. Этот метод представляет собой итерационный процесс, в ходе которого оцениваются неизвестные параметры. Однако ЕМ-алгоритм имеет ряд проблем.

Так, ЕМ-алгоритм обладает сильной неустойчивостью по начальным данным. Например, при объеме выборки 200-300 наблюдений стоит заменить лишь одно наблюдение другим и итоговые оценки кардинально изменятся. Аналогично, при старте итерационного процесса из разных

1 Факультет ВМК МГУ, студ. магистратуры, e-mail: alex.lagno@mail.ru

2 Экономический факультет МГУ, студ. магистратуры, e-mail: kuzmin.iv.20@gmail.com

начальных точек на одной и той же выборке могут быть получены заметно отличающиеся результаты. Если функция правдоподобия регулярна, то ЕМ-алгоритм, как правило, находит наиболее правдоподобные оценки параметров смеси. Однако если функция правдоподобия нерегулярна, имеет много локальных максимумов (возможно, к тому же бесконечных), то ЕМ-алгоритм становится крайне неустойчивым. К сожалению, эти обстоятельства являются серьезным препятствием применения ЕМ-алгоритма к разделению смесей.

Поэтому крайне необходимо иметь альтернативный метод разделения смесей, ориентированный не на максимизацию "полной" функции правдоподобия, а на оптимизацию других разумных критериев качества получаемых оценок. Наличие такого альтернативного достаточно эффективного метода является принципиально важным с точки зрения возможности адекватной практической интерпретации получаемых оценок. В данной работе в качестве такой альтернативы для поиска оценок параметров смеси предлагается оптимизационный метод, основанный на решении задачи минимизации.

В п. 7 будет рассмотрено приложение разделения смесей нормальных распределений оптимизационным методом к классическим задачам финансового анализа: расчет и прогнозирование волатильности, вычисление меры риска Value at Risk.

2. Постановка задачи разделения конечных смесей нормальных распределений.

Рассмотрим смесь функций распределения вида

Oi

Г(х) = хеК, (1)

г= 1 г

х у2

где к ^ 1 — целое, Ф(ж) = -т== / е 2~ ¿у — функция распределения стандартного нормального

—те

закона. Смесь представляется в виде конечной суммы функций распределений стандартных нормальных законов с некоторыми параметрами сдвига и масштаба — аг и аг соответственно, взятых с некоторыми весами рг. Функции распределения Ф(-) называются компонентами смеси, а числа рг — весами соответствующих компонент, при этом число компонент конечно. Или то же самое можно записать в терминах плотности распределений:

= ж ем, кеъ, (2)

= аг \ аг )

где ф(х) = 2 — плотность стандартного нормального закона.

Задачей разделения смеси называется задача статистического оценивания параметров (рг ,аг,

к

аг), г = 1,...,к, аг € М, аг > 0, рг ^ 0. Следует отметить, что ^ рг = 1. Задача разделения

г=1

смеси — это задача по выборке, по известным реализациям случайной величины X, оценить функцию распределения как смесь нормальных распределений с некоторыми параметрами.

3. Нормальные смеси как модели распределений финансовых данных. Рассмотрим стохастическое дифференциальное уравнение Ланжевена

дх (г) = а(г) дг + ь(г) дш, (3)

определяющее случайный процесс X(г), где Ш(г) — стандартный винеровский процесс. Коэффициенты а(г) и Ь(г) — случайны. В финансовой математике известны специальные версии уравнения (3). В частности, в финансовой математике весьма популярна модель геометрического броуновского движения вида

дх (г) = ах (г) дг + ь х (г) дш, (4)

где а € М, Ь > 0. Известно много обобщений модели (4) с конкретными видами зависимости а и Ь от X(г) и других случайных процессов, например, модели Леланда, Барлса-Сонера, Хе-стона, Кокса-Ингерсолла-Росса, Халла-Уайта и другие так называемые модели стохастической волатильности.

Пусть п ^ 1, ¿о = 0 и ¿о < ¿1 < ... < Ьп — моменты времени, в которые наблюдается процесс X(¿). Для простоты предположим, что и — ¿¿—1 = 1 для любого г ^ 1. Из уравнения (3) видно, что распределение приращения X) — X(¿¿-1) процесса X(¿) можно аппроксимировать распределением вида

Р(Х(и)-Х(и-1) <х) (5)

где Ф(х) — стандартная нормальная функция распределения, А € М и В > 0 — случайные величины. В свою очередь, для распределений случайных величин А и В, по отношению к которым берется математическое ожидание в (5), можно использовать дискретную аппроксимацию. Тогда вместо (5) для распределения приращения X) — X(¿¿—1) можно применить приближение вида

к

р{х{и)-х{и.1) <х)ъ (6)

к= 1

где К € N рк ^ 0, к = 1,..., К, р1 +... + рк = 1. Очевидно, параметры рк, ак и Ьк зависят также от г и изменяются при переходе от к ¿¿+1.

Рассматривая модель (4) со случайными и зависящими от времени коэффициентами а^) и Ь(£), т.е.

¿X(¿) = а(*) X(¿) ^ + Ь(*) X(¿) йШ, (7)

и применяя формулу дифференцирования Ито [3]

можно записать следующее приближение логарифмических приращений рассматриваемого процесса:

к

к=1

В2 ь2

где Сг = А* - € М, Вг > О, ск = ак -

В [2] с использованием асимптотического подхода, основанного на предельных теоремах для обобщенных дважды стохастических пуассоновских процессов как моделей неоднородных хаотических случайных блужданий, доказывается, что законы, аппроксимирующие распределения приращений логарифмов процессов эволюции финансовых индексов, следует искать в виде общих сдвиг-масштабных смесей нормальных законов.

Для статистического оценивания параметров рк, ак и Ьк можно использовать метод скользящего разделения смесей (СРС), описанный в [2]. Статистические закономерности поведения рассматриваемых процессов X(¿), а^), Ь^) изменяются во времени, вообще говоря, нерегулярным образом, результатом чего является отсутствие универсального смешивающего закона. Таким образом, чтобы изучить динамику изменения статистических закономерностей в поведении исследуемого процесса, задача статистического разделения конечных смесей нормальных законов должна быть последовательно решена на интервалах времени, постоянно сдвигающихся в направлении астрономического времени. Тем самым параметры смесей оцениваются как функции времени.

Для оценивания параметров сдвига (дрейфа) ак (или Ск), масштаба (диффузии) Ьк и весов компонент рк при каждом положении скользящего окна предлагается использовать оптимизационный метод, подробно описанный в п. 4. В этом методе принимается соглашение, что наблюдения на каждом окне (отрезке временного ряда) трактуются как независимая однородная выборка, по которой строится эмпирическая функция распределения Fttn(х). Здесь £ — параметр, характеризующий положение (например, номер) окна, п — число наблюдений, попавших в окно ("ширина окна"). Затем решается задача минимизации какого-либо расстояния (например, £2)

между Ft,n(x) и смесью, стоящей в правой части (6) (или (8)), по параметрам ak (или Ck), bk и pk. Можно также минимизировать расстояние между плотностью смеси в правой части (6) (или (8)) и какой-либо эмпирической оценкой плотности.

4. Оптимизационный метод. Пусть x = (xi,... ,xn) — выборка наблюдений случайной величины X объема п. Задача состоит в оценивании параметров (pi,ai,Ui), i = l,...,k, смеси f (x) из (2), k — число компонент смеси, при этом число неизвестных параметров, которые нужно оценить методом разделения смеси, равно 3 k.

Оптимизационный метод заключается в решении задачи условной минимизации какого-либо расстояния d(■, ■) между эмпирической плотностью распределения fn(x) и плотностью смеси f (x) (2) по параметрам смеси (pi,ai,Ui) с дополнительными условиями, накладываемыми на эти параметры:

(pi,...,pk ,ai,..., ak ,oi,...,ak) = arg min d(fn(x),f (x)),

p1,...,pk,a1,...,ak ,a!,...,ak

k

ai € R, и > 0,'i € [0, l], £pi = l.

i=l

Для построения эмпирической плотности распределения необходимо разбить всю область значений выборки [X(i),X(n)] (X(i) — первая порядковая статистика или минимальное значение выборки, X(n) — n-я порядковая статистика или максимальное значение выборки, п — объем выборки) на непересекающиеся интервалы Ai,..., As, l < s < п. Это можно сделать двумя способами:

выбрать в качестве границ интервалов равноотстоящие точки (Х(1), Х(1) + Н, Х(1) + 2Н,... , Х(п)) с шагом Н =

X(n) - X(i)

• выбрать в качестве границ интервалов равновероятные точки (Х(1), Х(п/8), Х(2п/8), • ••, Х(п)) (предполагается целочисленное деление п на 8).

Тогда эмпирическая плотность (гистограмма) распределения задается так:

,, X € А,-, 7 = 1, ... ,5,

п |А,|'

0, х/ [Х(1) ,Х(п)],

где — эмпирическая (наблюдаемая) частота — число наблюдений, попавших в интервал Дj, | обозначает здесь длину интервала Aj•.

Пусть п — точки, в которых происходит минимизация. Рассмотрим различные варианты выбора расстояния й(-, ■). Наиболее очевидным кажется выбор квадрата векторной нормы ¿2:

Л{!п(х),1 (х)) = ||/п(х) - /(х)1Ц = ¿(Ш) - /ы) . (9)

г=1 ^ '

Точки VI, г = 1,...,«, 3к ^ в < п, можно выбрать центрами некоторых интервалов разбиения Д1,..., Д которые строятся аналогично интервалам Дj с равноотстоящими или равновероятными границами.

Векторная норма ¿2, на самом деле, представляет собой дискретный аналог нормы в пространстве ¿2, задаваемой интегралом

2

- f HL = Е (fn(ri) - f (»"i)) j (fn(x) - f (x))2dx.

Стремясь добиться близости непрерывной плотности / (х) и кусочно-постоянной функции /п(х) именно в пространстве ¿2, необходимо наилучшим образом приблизить интеграл от квадрата погрешности между ними некоторой квадратурной суммой, т.е. построить квадратурную

формулу. Выбрав формулу центральных прямоугольников, получим расстояние /п(ж), /(ж)) для последующей минимизации:

Т 5 / \2

I (Ш - /(ж))2Лж «^А^/п(п) - /(г^ = ^ /(ж),/(ж)). (10)

-те г=1

Здесь для каждого г = 1,... , в точка г г является центром интервала А а | А г | обозначает длину интервала Аг. Если выбрать равноотстоящие границы интервалов А1,..., А5, т.е. эти интервалы будут равной длины, то минимизация нормы (10) будет эквивалентна минимизации нормы (9).

В качестве расстояния ■) также можно рассмотреть дивергенцию Кульбака-Лейблера Акь(/п(ж) || /(ж)), которая является мерой того, насколько одно распределение вероятностей, а именно его информационная энтропия, отличается от другого распределения. Первый аргумент функционала (распределение /п(ж)) обычно интерпретируется как истинное распределение или априорные данные, наблюдения, второй (распределение /(ж)) — как предполагаемая модель, приближение /п(ж). Данную меру расстояния можно понимать как количество неучтенной информации распределения /п(ж), если / (ж) было использовано для приближения /п(ж). Интеграл в определении дивергенции Кульбака-Лейблера Дкь(/п(ж) || /(ж)) также можно приблизить квадратурной формулой центральных прямоугольников и получить расстояние йкь (/п(ж),/(ж)) для последующей минимизации:

+те 5

Пкь(Ш II/(ж)) = I =йкь{Ш,т).

-те г=1

Важным является вопрос оптимального выбора числа интервалов разбиения в для построения эмпирической плотности и числа точек минимизации в. Исходя из того, что для аппроксимации минимизируемого расстояния используется квадратурная формула центральных прямоугольников (т.е. кусочно-постоянное приближение подынтегральной функции) и гистограмма также является кусочно-постоянной функцией, логично положить в = в. Ясно, что число в целесообразно выбирать на основании размера исходной выборки, т.е. чем больше объем выборки, тем больше можно брать интервалов разбиения, так как в каждый интервал попадет достаточное количество наблюдений.

В зависимости от объема выборки п число интервалов в задавалось с использованием материала, изложенного в [7], и на основании эмпирического исследования следующим образом:

[л/п], если п ^ 200 12. Bn ^

[7.20948 n1/5], если n> 200,

где [ж] обозначает целую часть числа ж.

В программной реализации на языке python для минимизации расстояния по параметрам применялся встроенный усеченный метод Ньютона из пакета scipy.optimize. Как и другие методы оптимизации этот метод требует задания начальных приближений для параметров, по которым будет вестись оптимизация. В силу того, что минимизируемая функция имеет много локальных минимумов, необходимо начальное приближение задавать аккуратно, чтобы метод сошелся к глобальному минимуму или близкому к нему. Выбор начального приближения с помощью датчика псевдослучайных чисел или попытка задать хоть сколько-нибудь близкие к истинным значения параметров, ориентируясь только на выборку, далеко не гарантирует успешность минимизации, т.е. нахождение "правильных" оценок параметров. Решить эту проблему поможет сеточный EM-алгоритм [2,5,6]. Этот метод разделения смеси заключается в разбиении множеств возможных значений параметров математического ожидания и среднеквадратического отклонения расчетной сеткой, а затем поиска веса, соответствующего паре параметров в каждом узле сетки. Здесь

достаточно одного запуска на довольно грубой равномерной сетке, чтобы приближенно оценить параметры смеси, точность такой оценки вполне сгодится для начальных приближений. При скользящем разделении смеси в качестве начального приближения на следующем окне естественно можно задавать оценку минимизации, полученную на данном окне.

5. Результаты работы алгоритма на модельных задачах. В данном разделе рассматриваются примеры модельных задач разделения смесей, т.е. задач, в которых выбирается заранее известная смесь с плотностью / (х), из нее генерируется выборка, и по этой выборке оптимизационным методом восстанавливается плотность смеси. Затем оценивается точность восстановления, т.е. расстояние от полученной оптимизационным методом оценки функции плотности /(х) до истинной / (х), которое считается в метриках С, Ь\, Ь и КЬ:

Шх) - /(х)11с = тах|/(х) - /(х)|, ||/(х) - /(х)11ы = \!(х) - /(х)|

X .]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— X

+х 1/2 ~

\\7(Х)-/(Х)\\ь2 = ^1\7(Х)-/(Х)\2С1Х^ , \\/(х)-Цх)\\кь= I ¡{х)1оё^Му1х_ —( —(

Точность в указанных метриках для задач данного раздела представлена в табл. 1.

На рис. 1, а-г приведены результаты применения оптимизационного метода к задаче разделения трехкомпонентной смеси при увеличивающемся объеме выборки п. Компоненты этой смеси имеют одинаковое математическое ожидание равное нулю и различаются только по дисперсиям, т.е. рассматривается масштабная смесь нормальных законов. Как полагается, точность аппроксимации повышается при увеличении объема выборки. Рассматривая сумму нормальных распределений с разными стандартными отклонениями, можно получить совершенно иную, как видно из данного примера, форму плотности распределения, далекую от "колоколообразной" нормальной плотности.

Помимо собственно сумм нормальных распределений смесями нормальных законов можно приближать и другие распределения с более тяжелыми хвостами. В [2] приводится лемма, согласно которой смеси нормальных законов всегда имеют более тяжелые хвосты, чем само нормальное распределение. Под распределением с тяжелыми хвостами будем понимать распределение, хвосты которого имеют более низкую скорость убывания по сравнению с нормальным законом при неограниченном росте аргумента.

В отличие от нормального распределения с очень быстро (как | х | 1 е—х ) убывающими (при |х| ^ то) хвостами, хвосты распределения Стьюдента убывают при |х| ^ то как |х| и с произвольным V > 0, в частности распределению Коши соответствует случай V = 1.

Плотность распределения Стьюдента с V степенями свободы и параметрами сдвига хо и масштаба 7 имеет вид

2 и + 1

Мх) =-^ 2 /ч (1 + ) 2 е м е м е м > 0 у е м у > 0_

/ V \ у у 72 )

Пгй 7Г,

На рис. 1, д приведен пример приближения распределения Стьюдента с параметрами V = 3, хо = 0, 7 = 0.015 четырехкомпонентной смесью нормальных законов по выборке объема п = 400. Параметры этого распределения подобраны таким образом, чтобы его гистограмма напоминала возможную гистограмму логарифмических доходностей некоторого актива, которые будут рассмотрены в п. 7.

Частным случаем распределения Стьюдента при V = 1 является распределение Коши. На рис. 1, е четырехкомпонентной смесью нормальных законов по выборке объема п = 400 приближено стандартное распределение Коши с параметром сдвига х0 = 0 и масштаба 7 = 1.

0.3М0.0,0.2) + 0.3М0.0,2.0) + 0.4М0.0,4.0)

0.3М0.0,0.2) + 0.3М0.0,2.0) + 0.4М0.0,4.0)

0.3М0.0,0.2) + 0.3М0.0,2.0) + 0.4М0.0,4.0)

-0.100 -0.075 -0.050 -0.025 0.000 0.025 0.050 0.075 0.100

а

-15 -10

Рис. 1. Результаты применения оптимизационного метода на модельных задачах: а, б, в, г — трехкомпо-нентная смесь нормальных распределений при увеличивающемся объеме выборки п = 200, 400, 800, 1 600; д — распределение Стьюдента, п = 400; е — распределение Коши, п = 400

Таблица 1

Точность оптимизационного метода на модельных задачах

Распределение Объем выборки n II/-/He / - / ii / - / ¿2 / - /\\KL Рис.

0.3Л/'(0.0,0.2) + 0.3Л/'(0.0,2.0) + 0.4./V'(0.0, 4.0) 200 0.1675 0.2376 0.1276 0.0432 1, a

0.3Л/'(0.0,0.2) + 0.3Л/'(0.0,2.0) + 0.4Л/'(0Д 4.0) 400 0.1119 0.1360 0.0642 0.0196 1, 6

0.3Л/'(0.0,0.2) + 0.3Л/'(0.0,2.0) + 0.4Л/'(0Д 4.0) 800 0.0523 0.0904 0.0340 0.0082 1, в

0.3./V'(0.0,0.2) +0.3./V'(0.0,2.0) + 0.4./V'(0.0, 4.0) 1600 0.0200 0.0585 0.0175 0.0056 1, г

Student's()7 = 3, xq = 0, 7 = 0.015) 400 1.3714 0.0803 0.2561 0.0126 1, д

Cauchy(0.0, 1.0) 400 0.0198 0.1027 0.0237 0.0117 1, e

6. Три подхода к вычислению волатильности. Существует множество способов интерпретации и методов оценивания волатильности. В данной работе рассматриваются три подхода к вычислению волатильности, два из которых достаточно просты и широко используются на практике, а третий относительно нов и основан на методе разделения смесей.

Рассмотрим приращения логарифмов биржевых цен:

щ = \nX(U) - In J£(ti—i) = In г = 1, 2, 3,...,

X (ti-1)

где ti — момент времени, в который зарегистрировано i-е наблюдение (i-й элемент временного ряда).

Самый простой метод вычисления волатильности представляет собой несмещенное оценивание стандартного отклонения рассматриваемого процесса, представленного временным рядом приращений логарифма финансового индекса. Текущая волатильность в момент времени tm, такая, что am = a(tm), вычисляется следующим образом:

/ i n-1 \ 1/2 i n-1

— I 7 / ,\U"m—i А^ш) ) i Ц"т — / .^m—it (И)

Vn — 1 ^ ) П ^

4 i=0 7 i=0

где число n ^ m определяет "ширину окна", т.е. период, по которому осуществляется усреднение.

Недостаток оценки (11) в том, что недавние наблюдения вносят в волатильность такой же вклад, что и более старые. Чтобы учесть ближайшее прошлое с большим весом, применяется подход экспоненциального взвешивания наблюдений. Предполагая бесконечную глубину исторических значений и то, что среднее этих значений близко к нулю, модель экспоненциально взвешенного скользящего среднего или сокращенно EWMA (Exponentially Weighted Moving Average)

предлагает следующее приближение волатильности в момент времени ¿т:

те

о2 = (1 - А) ^ Хи2т-1 = (1 - \)п2т + А(1 - А)^1 + \п2т-2 + Ь2и2т-3 + ...), (12)

i=0

где А — это параметр сглаживания, обычно полагается равным одному из значений {0.94, 0.97, 0.99}. Из представления (12) можно получить рекуррентную формулу

п— 1

От = \! А ат —1 + (1 - А) ит, т > п; Оп = (1 - А) ^ Аi и^—г. (13)

i=0

Волатильности часто ставится в соответствие коэффициент диффузии, тесно связанный с дисперсией распределения соответствующих приращений биржевых цен или других изучаемых процессов. В случае, если эволюция финансового индекса описывается броуновским движением с нулевым сносом (дрейфом), волатильность естественно отождествляется со стандартным отклонением нормальных распределений приращений на временных интервалах единичной длины. Однако для случаев броуновского движения с ненулевым сносом или ненормальных моделей такое тождество не имеет места.

В действительности, волатильность содержит компоненту, трактовка которой выходит за пределы представления об обычном коэффициенте диффузии, а именно, "динамическую" компоненту, наличие которой обусловлено существованием некоего тренда. Идея выделения специфических компонент волатильности видна в моделях типа СЛИСИ, в частности EWMA (13), однако такие декомпозиции, как правило, связаны с конкретными параметрическими моделями, и идентификация или интерпретация отдельных компонент волатильности при этом адекватна только в рамках конкретной модели и является довольно условной, если сама соответствующая модель оказывается неадекватной. Такие модели все же не учитывают все стохастические закономерности изменения волатильности. Подход, основанный на разделении смеси, позволяет осуществить декомпозицию, которая не зависит от той или иной модели взаимозависимости компонент вола-тильности.

Пусть и — случайная величина, описывающая логарифмические приращения финансового индекса. Перепишем выражение (8), которое говорит о том, что распределение случайной величины и является конечной сдвиг-масштабной смесью нормальных законов:

п к 'X - С \ / X - вк

X ' ■ ~ '

Р(С/<о0 = еф(^)=5>Ф(

В ) кН V Ьк

к=1

где пара случайных величин В, С имеет дискретное распределение

Р((В,С) = (Ьк,вк)) = Рк, к = 1,..., К.

Волатильность случайной величины и можно отождествить со стандартным отклонением смеси. Опуская доказательство, приведенное в [2], выпишем формулы для его вычисления:

к к к

(ти = у/0С + Ш, ОС = у^(ск-с)2рк, с = У^скрк, ЕВ2 = У^Ъ\рк. (14)

к=1 к=1 к=1

Напомним, что параметры вк, Ьк, Рк, определяющие а и, оцениваются заново при каждом сдвиге скользящего окна.

В выражении для аи первое слагаемое под корнем зависит только от весов Рк и параметров положения (сдвига) вк компонент и потому является характеристикой разбросанности локальных трендов, т.е. характеризует "динамическую" компоненту волатильности, тогда как второе слагаемое зависит только от весов Рк и параметров масштаба ("коэффициентов диффузии") Ьк компонент и потому характеризует "чисто диффузионную" компоненту волатильности.

Если сравнить традиционное одномерное представление о волатильности (11) как о стандартном отклонении приращений процесса, то можно заметить, что (14) уточняет это представление за счет учета локальных трендов. Если локальные тренды отсутствуют, то волатильность смеси равна корню квадратному из взвешенной суммы квадратов волатильностей компонент, причем веса компонент показывают важность соответствующей диффузионной компоненты. В случае наличия только одной компоненты, т.е. предполагая нормальное распределение случайной величины U с некоторым средним ci и стандартным отклонением bi, волатильность ац, рассчитанная по формуле (14), совпадает с волатильностью Ъ\ единственной компоненты.

7. Применение метода разделения смесей к задачам финансового анализа.

7.1. Расчет волатильности и меры риска Value at risk. Для анализа далее были выбраны следующие финансовые данные, для которых рассматривались дневные значения только в рабочие дни за период 01.01.2020-01.01.2023.

1. Цена акции в рублях российской энергетической компании ПАО "Газпром" (рис. 2,а), основным видом деятельности которой является добыча и реализация природного газа.

2. Значения основного фондового индекса Китая CSI 300 (рис. 3,а), который предназначен для агрегирования показателей трехсот крупнейших торгуемых акций как на Шанхайской, так и на Шэньчжэньской фондовых биржах.

3. Цена акции в долларах американской компании NVIDIA Corporation (рис. 4,а), крупнейшего в мире разработчика графических процессоров.

Сравним волатильность логарифмических приращений указанных процессов, рассчитанную тремя способами, рассмотренными в п. 6: с помощью несмещенной оценки с одинаковыми весами для всех наблюдений (11) (равномерно взвешенная волатильность), с помощью метода EWMA (13) (экспоненциально взвешенная волатильность), с помощью разделения смеси (14) (волатильность смеси). На рис. 2,в, 3,в, 4,в приведены графики значения волатильности логарифмических приращений цены акции ПАО "Газпром", значения индекса CSI 300 и цены акции NVIDIA Corporation соответственно при сдвигающемся положении скользящего окна, дата по оси абсцисс соответствует правой (верхней) границе окна, ширина окна равна 260 рабочих дней, что соответствует одному году. Волатильность EWMA изображена для того значения параметра А, при котором достигается наилучшая точность оценки VaR, расмотренной далее. Для логарифмических приращений всех указанных процессов на каждом окне подбиралась шестикомпонентная смесь.

Рассмотрим еще одно приложение метода разделения смесей нормальных распределений, а именно его применение в оценке риска. Ключевым фактором, формирующим основу для управления рисками, является мера тех потенциальных убытков, с которыми инвестиционный актив может столкнуться в течение определенного периода времени. Стоимость, подверженная риску, Value at Risk (VaR) является наиболее часто используемой мерой для количественной оценки уровня риска и реализации управления рисками.

Мера VaR обычно определяется как максимальный убыток (убытками считаются отрицательные отклонения логарифма цены), который не должен быть превышен в течение определенного периода времени с заданным уровнем достоверности, т.е. с доверительной вероятностью а:

P(U < VaR (а)) =1 - а,

где U, как и в п. 6, — случайная величина с реализациями Ui = ln X(ti) —ln X(¿¿-i). Таким образом, VaR(a) выражает собой квантиль уровня 1 — а распределения логарифмических приращений цены некоторого актива.

Рассмотрим классический дельта-нормальный подход, который также известен как вариационно-ковариационный метод, для оценки VaR [4]. В его основе лежит гипотеза о нормальном законе распределения изменений факторов риска, например, приращений логарифмов цен акций

или финансового индекса. Параметры нормального распределения оцениваются статистически: математическое ожидание оценивается как выборочное среднее Д исторических наблюдений, а в качестве стандартного отклонения может быть выбрана несмещенная оценка 0 (11) с одинаковым весом всех наблюдений или оценка методом EWMA oewma (13) c экспоненциальными весами. Тогда оценка VaR, представляющая собой квантиль уровня 1 — а, вычисляется следующим образом:

VaR(a) = Д + 0 Ф-1(1 — а), VaR(a) = Д + oewma Ф-1(1 — а)

где Ф-1(х) — функция, обратная к функции распределения стандартного нормального закона, т.е. Ф-1(1 — а) — квантиль уровня 1 — а стандартного нормального закона.

Наиболее существенным недостатком дельта-нормального подхода является частое невыполнение на практике основополагающей посылки о нормальном распределении доходностей, в то время как реальные распределения приращений цен характеризуются значительным эксцессом — более толстыми хвостами и острыми вершинами по сравнению с нормальным распределением. Эта проблема может быть решена путем подбора смеси нормальных законов в качестве распределения логарифмических приращений цен. Оценка VaR методом разделения смеси определяется как квантиль уровня 1 — а функции распределения смеси, для чего численно (с помощью встроенного метода Брента из пакета scipy.optimize) решается следующее уравнение относительно q1-a: F(q1-a) = 1 — а, где F(x) — функция распределения смеси (1).

На рис. 2,б, 3,б, 4,б рассмотрена аппроксимация плотности распределения по историческим значениям логарифмических приращений цены акции ПАО "Газпром", значения индекса CSI 300 и цены акции NVIDIA Corporation соответственно. Аппроксимация рассматривается трех видов: плотностью нормального распределения с параметрами Д, 0 (равномерно взвешенная вола-тильность), плотностью нормального распределения с параметрами Д, oewma (экспоненциально взвешенная волатильность с тем параметром Л, при котором достигнута наилучшая точность оценки VaR), плотностью смеси. Показателен рис. 2,б, в этом случае первые две аппроксимации, которые предполагает дельта-нормальный метод оценки VaR (15), подбирают одну достаточно большую по величине компоненту волатильности, стремясь учесть толстые хвосты, но тем самым не описывая распределение в целом, тогда как смесь дает намного более адекватное приближение распределения логарифмических приращений за счет соединения разных компонент.

В данной работе оценка VaR будет проводиться для двух значений а — 0.95 (или 95%) и 0.99 (или 99%). Для определения наиболее точной модели проводится процедура бэктестинга. На каждом окне вычисляется значение VaR(ti), где ti — правая (верхняя) граница скользящего окна, затем значение VaR(ti) сравнивается со значением реализованного логарифмического приращения в момент времени ti+1. После проведения расчетов за весь период вероятность 1 — а сравнивается с долей превышений VaR. Превышением будем называть ситуацию, когда убыток превысил предполагаемую оценку риска, но так как убытками считаются отрицательные изменения логарифма цены, это соответствует случаю, когда U < VaR^). Доля превышений вычисляется как отношение числа значений логарифмических доходностей, которые оказались меньше оценки VaR, к общему числу доходностей за период. Наилучшей моделью волатильности считается та, согласно которой доля превышений продемонстрировала наименьшее отклонение от вероятности 1 — а (или от 5% и от 1% для каждого доверительного уровня).

В табл. 2-4 приведены полученные доли превышений значения VaR для акции ПАО "Газпром", значения индекса CSI 300 и акции NVIDIA Corporation соответственно разными методами: дельта-нормальным с равномерно взвешенной волатильностью о = 0, дельта-нормальным с экспоненциально взвешенной волатильностью о = oewma при трех различных значениях параметра Л, методом разделения смеси. Оценка VaR проводилась для трех значений ширины окна: 130 рабочих дней, что соответствует периоду в полгода; 260 рабочих дней, что соответствует одному году; 520 рабочих дней, что соответствует двум годам. Самым слабым по точности ожидаемо оказывается дельта-нормальный метод с равномерно взвешенной волатильностью, дельта-нормальный

(15)

метод с экспоненциально взвешенной волатильностью при правильном выборе параметра А может обеспечить неплохие результаты, метод разделения смеси во всех случаях оказывается не хуже, а в большинстве случаев лучше дельта-нормального метода с а = Тешил-

Наиболее точным и подходящим для портфелей, зависящих от нескольких факторов риска, считается иной метод оценки УаИ — метод Монте-Карло, в котором на основе выбранного распределения с помощью генератора псевдослучайных чисел моделируется большое количество (тысячи или десятки тысяч) гипотетических значений фактора риска. В этом методе в качестве имитируемого распределения можно выбрать смесь нормальных распределений, оцененную по статистическим данным.

Еще раз вернемся к волатильности. На рис. 3,в, 4,в можно заметить колебания экспоненциально взвешенной волатильности, т.е. периоды резкого снижения и повышения волатильности, в силу наличия в формуле (13) слагаемого и^, выражающего доходность, реализованную в последний момент времени, которое заставляет волатильность быстро отреагировать на изменения рынка. Волатильность смеси не обладает подобного рода колебаниями. Несмотря на то, что дельта-нормальный метод с EWMA-волатильностью дает неплохую оценку УаИ, т.е. нет сильного занижения волатильности, сильное завышение волатильности явно присутствует, что приводит непосредственно к завышению риска. Показательна волатильность индекса СЯ1 300 (рис. 3,в), где волатильность смеси практически на всем рассматриваемом промежутке времени ниже и равномерно, и экспоненциально взвешенной волатильности, а доля превышений УаИ при этом ближе к теоретической квантили.

400

300-

Цена акции ПАО «Газпром»

0.2-

0.05-

0.04-

Волатильность смеси Равномерно взвешенная волатильность

Экспоненциально взвешенная волатильность, Л = 0.99

2021 Apr

Jul

Oct

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2022 в

Apr

Jul

Oct 2023

2020 May Sep 2021 May Sep 2022 May Sep 2023 Логарифмические приращения цены акции ПАО «Газпром»

2020 May Sep 2021 May Sep 2022 May Sep 2023 a

25

20

10

Плотность смеси Плотность a) Плотность Oewma)

0.06-

0.05-

0.04-

2022

-0.3

-0.2

-0.1 б

0.0

0.1

- Волатильность смеси

........ Одномерный прогноз волатильности

---- Многомерный прогноз волатильности

May

Jul

Sep

Nov

2023

Рис. 2. Анализ цены акции ПАО "Газпром": а — цена акции и ее логарифмические приращения; б — аппроксимация распределения логарифмических приращений плотностями нормального распределения с равномерно взвешенным и экспоненциально взвешенным стандартным отклонением и плотностью смеси, правая граница окна шириной 260 рабочих дней соответствует апрелю 2022 г.; в — волатильность логарифмических приращений, ширина окна равна 260 рабочих дней; г — результаты прогнозирования волатильности, одномерная модель соответствует АШМА(р, д), многомерная — УАИ(р)

15

5

0

Маг

?

Индекс CSI 300

2020 May Sep 2021 May Sep 2022 May Sep 2023 a

0.016 0.015 0.014 0.013 0.012 0.011 0.010

Волатильность смеси Равномерно взвешенная волатильность

Экспоненциально взвешенная волатильность, Л = 0.99

2021 Apr

Jul

Oct 2022 Apr

Jul

Oct 2023

40353025-

Плотность смеси ПЛОТНОСТЬ MIß, Ô) ПЛОТНОСТЬ miß, ôewma)

0.00 в

0.01200 0.01175 0.01150 0.01125 0.01100 0.01075 0.01050 0.01025

May

Jul

Sep

Рис. 3. Анализ индекса СБ1 300: а — индекс СБ1 300 и его логарифмические приращения; б — аппроксимация распределения логарифмических приращений плотностями нормального распределения с равномерно взвешенным и экспоненциально взвешенным стандартным отклонением и плотностью смеси, правая граница окна шириной 260 рабочих дней соответствует июню 2022 г.; в — волатильность логарифмических приращений, ширина окна равна 260 рабочих дней; г — результаты прогнозирования волатильности, одномерная модель соответствует АШМА(р, д), многомерная — УАИ(р)

Цена акции NVIDIA Corp.

200 100

2020 May Sep 2021 May Sep 2022 May Sep 2023 Логарифмические приращения цены акции NVIDIA Corp.

2020 May Sep 2021 May Sep 2022 May Sep 2023 a

-0.15 -0.10 -0.05 0.00 0.05 0.10 0.15 6

2021 Apr Jul Oct 2022 Apr Jul Oct 2023 Nov 2022 Mar May Jul 5ep Nov 2023

в г

Рис. 4. Анализ цены акции NVIDIA Corporation: а — цена акции и ее логарифмические приращения; б — аппроксимация распределения логарифмических приращений плотностями нормального распределения с равномерно взвешенным и экспоненциально взвешенным стандартным отклонением и плотностью смеси, правая граница окна шириной 260 рабочих дней соответствует июню 2022 г.; в — волатильность логарифмических приращений, ширина окна равна 260 рабочих дней; г — результаты прогнозирования волатильности, одномерная модель соответствует ARIMA(p, d, q), многомерная — VAR(p)

5000

4000

0

2022

Маг

Nov

2023

в

300

о

Таблица 2

Сравнение точности моделей УаИ на примере логарифмических приращений цены акции

ПАО "Газпром"

Доля превышений 95%-го уровня VaR, %

^^^^ Метод Ширина^^^^ окна ^^^^ Дельта-нормальный Разделения смеси

а = à о" = &EWMA, А = 0.94 о" = &EWMA, А = 0.97 о" = &EWMA, А = 0.99

130 4.276 3.947 4.112 4.276 4.441

260 6.067 3.975 4.393 5.230 4.812

520 6.881 4.128 4.587 5.046 5.046

Доля превышений 99%-го уровня VaR, %

^^^^ Метод Ширина^^^^ окна ^^^^ Дельта-нормальный Разделения смеси

а = & с = &EWMA, А = 0.94 с = &EWMA, А = 0.97 с = &EWMA, А = 0.99

130 2.467 1.645 1.645 2.138 1.480

260 2.720 1.883 1.883 2.301 1.464

520 4.128 1.835 1.835 2.294 1.376

Таблица 3

Сравнение точности моделей УаИ на примере логарифмических приращений индекса

С81 300

Доля превышений 95%-го уровня VaR, %

^^^^ Метод Ширина^^^^ окна ^^^^ Дельта-нормальный Разделения смеси

а = à о" = &EWMA, А = 0.94 о" = &EWMA, А = 0.97 о" = &EWMA, А = 0.99

130 5.193 6.533 5.863 5.025 5.025

260 5.567 6.424 6.424 5.567 4.711

520 5.314 5.797 5.797 5.797 4.831

Доля превышений 99%-го уровня VaR, %

^^^^ Метод Ширина^^^^ окна ^^^^ Дельта-нормальный Разделения смеси

а = а с = VEWMA, А = 0.94 с = VEWMA, А = 0.97 с = VEWMA, А = 0.99

130 2.345 2.178 2.345 2.345 1.508

260 2.141 2.355 2.784 2.570 0.857

520 2.899 2.899 2.899 2.899 0.483

Таблица 4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сравнение точности моделей VaR на примере логарифмических приращений цены акции

NVIDIA Corporation

Доля превышений 95%-го уровня VaR, %

^^^^ Метод Ширина^^^^ окна ^^^^ Дельта-нормальный Разделения смеси

а = & о" = VEWMA, А = 0.94 о" = VEWMA, А = 0.97 о" = vewma, А = 0.99

130 5.600 5.440 4.960 5.920 4.960

260 7.677 6.263 5.657 6.263 5.253

520 11.489 6.809 6.383 8.511 5.957

Доля превышений 99%-го уровня VaR, %

^^^^ Метод Ширина^^^^ окна ^^^^ Дельта-нормальный Разделения смеси

а = & о" = VEWMA, А = 0.94 о" = VEWMA, А = 0.97 о" = VEWMA, А = 0.99

130 2.080 1.760 1.440 1.600 0.960

260 2.020 1.616 1.010 1.818 1.010

520 4.255 1.277 1.277 2.128 1.277

7.2. Прогнозирование волатильности. В задачах финансового анализа большое внимание уделяется не только оценке волатильности исторических показателей, но и ее прогнозированию. Прогнозирование волатильности — задача, во многом обусловленная потребностью финансовой теории касательно рядов доходностей финансовых активов [8]. Также, прогнозы волатильности могут быть использованы в ненаправленных трейдинговых стратегиях (так называемая

"торговля волатильностью"), основная идея которых состоит в том, что прибыль трейдера не зависит от направления роста/падения цены актива и определяется исключительно его ожидаемой волатильностью. Основные примеры таких стратегий —"стрэддл" (straddle) и "стрэнгл" (strangle), более подробно описанные в [9,10].

Метод прогноза волатильности тесно связан с методом ее вычисления. Рассмотрим прогнозы для подходов, представленных в п. 6. Для базовой оценки при помощи стандартного отклонения используется "наивный" прогноз на один шаг вперед, представленный исторической волатиль-ностью на последнем окне наблюдений и, соответственно, равный текущей волатильности. Для прогнозирования методом EWMA используется более продвинутая оценка. Ввиду рекуррентной природы формулы волатильности актива, прогноз на один шаг вперед представим в виде, аналогичном представленному в формуле (13).

Использование метода разделения смесей позволяет получить некоторый временной ряд во-латильности, также представимый в формате стохастического процесса, определяемого стохастическим дифференциальным уравнением Ланжевена (3). Такой подход был предложен в [11] и в дальнейшем нередко использовался в академической литературе. Данное представление позволяет, с одной стороны, рассматривать волатильность как временной ряд сам по себе, а с другой, использовать аппроксимацию (5) и, соответственно, декомпозировать ее первые разности как смесь нормальных законов.

Вышеописанный метод позволяет применить два подхода к прогнозированию: одномерный и многомерный. Одномерный подход предполагает использование ряда волатильности для получения его же будущих прогнозов. Многомерный, помимо самого ряда, включает в себя параметры нормальных распределений, полученные методом статистического разделения смесей на некотором окне наблюдений. Предположение об авторегрессионной структуре данных позволяет использовать для прогнозирования стандартные эконометрические модели временных рядов. Для одномерной постановки задачи применялась модель ARIMA(p, d, q) (AutoRegressive Integrated Moving Average), где параметры p, d, q обозначают соответственно порядок авторегрессионной части, порядок интегрированности ряда и порядок скользящего среднего. Для многомерной постановки задачи использовалась модель векторной авторегрессии VAR(p) (Vector AutoRegression) порядка p. В обоих случаях прогнозы производились в оконном режиме — прогноз строился на основе m предыдущих наблюдений. Параметры обеих моделей подбирались на каждом окне отдельно путем минимизации байесовского информационного критерия (критерия Шварца). Для определения параметров модели ARIMA(p, d, q) использовался пакет pmdarima, предоставляющий возможность подбора оптимальных порядков p, d, q путем поиска лучшей модели по выбранному критерию среди pmax -(dmax + 1)'qmax моделей. Для подбора оптимальной модели VAR(p) был использован пакет statsmodels, предназначенный для проведения статистических тестов, оценивания статистических и эконометрических моделей. Поиск оптимальной VAR(p) модели производился выбором среди pmax моделей. В работе использовались (pmax,dmax,qmax) = (5, 0, 5),pmax = 15, что, соответственно, создает отбор среди 25 моделей класса ARIMA и 15 моделей класса VAR.

Ввиду возможности резкого изменения параметров смеси во времени (параметр долгое время оставался примерно на одном уровне, но затем резко изменил свое значение), было решено ввести дополнительные фиктивные переменные для случаев, когда изменение переменной превышает десять ее стандартных отклонений за последние десять наблюдений. Для сравнения полученных прогнозов и оценки качества моделей были использованы среднеквадратичное отклонение (MSE) и средняя абсолютная ошибка (MAE).

По результатам оценивания в большинстве случаев было выявлено снижение среднеквадратичного отклонения при использовании параметров смеси как дополнительной статистической информации. Результаты представлены в табл. 5 и на рис. 2, г, 3,г, 4, г. Стоит отметить, что данные со значительным структурным шоком (такие как акции Газпрома) сложнее поддаются прогнозированию обеими моделями, при этом векторная авторегрессия ввиду добавления информации о распределении на окне реагирует на шок в течение более длительного времени.

Следует отметить также снижение времени построения прогноза при применении метода скользящего разделения смесей. Оптимизационный метод при аккуратном задании начально-

го приближения и использовании прошлых оптимальных параметров для пересчета новых занимает достаточно мало времени, так как при сдвиге окна на одно наблюдение распределение выборки меняется незначительно. Согласно проведенному анализу о времени работы алгоритмов, использование скользящего разделения смесей совместно с УЛИ позволяет ускорить (по сравнению с АШМА) получение прогнозов в среднем более чем в три раза1. При этом, как показано выше, в большинстве случаев (исключая сильные структурные шоки) можно получить сравнимые или более точные прогнозы.

Таблица 5

Сравнение точности прогнозирования волатильности разными методами

ПАО "Газпром" CSI 300 NVIDIA Corporation

ARIMA VAR ARIMA VAR ARIMA VAR

MSE 1.819 Ю-® 2.591 • 10"6 5.674 • 10"9 5.629 10"9 1.213 • Ю"7 1.206 10"7

МАЕ 2.954 10"4 4.585 • 10"4 3.929 10"5 3.945 • 10"5 2.295 • 10"4 2.229 10"4

8. Заключение. В работе рассмотрена задача разделения конечных смесей нормальных распределений. Для статистического оценивания параметров смеси предложен оптимизационный метод, который доказал свою пригодность к решению задачи разделения смеси, продемонстрировав хорошую точность на модельных задачах.

Смеси нормальных распределений демонстрируют высокую адекватность при описании распределения логарифмических приращений биржевых цен, т.е. правильно улавливают особенности эмпирической плотности, в отличие от гауссовского распределения.

Выбор смеси нормальных законов в качестве распределения логарифмических приращений цен финансовых инструментов поспособствовал повышению точности оценки метрики Value at Risk (в смысле наименьшего отклонения от теоретического квантиля) по сравнению с дельта-нормальным подходом.

Применение метода разделения конечных смесей нормальных законов в сочетании с базовыми эконометрическими моделями анализа временных рядов привело к повышению точности прогнозирования волатильности по метрике MSE, что говорит о значимости параметров смеси как дополнительной информации об исходных данных.

Результаты, полученные в данной работе, могут быть полезны как аналитикам и трейдерам, так и теоретикам, а также стимулируют дальнейшее совершенствование оптимизационного метода разделения смеси и поиск новых приложений смесей вероятностных распределений к задачам финансового анализа.

СПИСОК ЛИТЕРАТУРЫ

1. Королев В.Ю. ЕМ-алгоритм, его модификации и их применение к задаче разделения смесей вероятностных распределений. Теоретический обзор. М.: Изд-во ИПИ РАН, 2007.

2. Королев В.Ю. Вероятностно-статистические методы декомпозиции волатильности хаотических процессов: учебное пособие. М.: Изд-во МГУ, 2011.

3. Назаров А.А., Терпугов А.Ф. Теория вероятностей и случайных процессов: учебное пособие. 2-е изд., испр. Томск: Изд-во НТЛ, 2010.

4. Saunders A., Cornett M. Financial Institutions Management: A Risk Management Approach. New York, NY : McGraw-Hill Education, 2018.

5. Королев В. Ю., Назаров А. Л. Разделение смесей вероятностных распределений при помощи сеточных методов моментов и максимального правдоподобия // Автоматика и телемеханика. 2010. № 3. С. 98-116.

6. Королев В. Ю., Корчагин А. Ю., М о р е в а О. А. Непараметрическое оценивание функции плотности смесей вероятностных законов с помощью EM-алгоритма // Системы и средства информатики. 2012. 22. № 2. С. 197-226.

Сравнение проводилось на платформе Yandex.Datasphere в конфигурации c1.4. Подробное описание на официальном сайте https://cloud.yandex.ru/docs/datasphere/concepts/configurations

7. Д е в р о й Л., Д ь е р ф и Л. Непараметрическое оценивание плотности. Ll-подход. М.: Мир, 1988.

8. Andersen T. G., Bollerslev T., C h r i s t o f f e r s e n P. F., Diebold F.X. Volatility Forecasting // NBER. 2005. N 11188.

9. Конноли К. Б. Покупка и продажа волатильности. М.: ИК Аналитика, 2006.

10. Hull J. C. Options, Futures, and Other Derivatives. 8th ed. Pearson College Div, 2011. 841 p.

11. Wilmott P., Oztukel A. Uncertain parameters, an empirical stochastic volatility model and confidence limits // Intern. J. Theor. and Appl. Finance. 1998. 1. N 1. P. 175-189.

Поступила в редакцию 11.04.23 Одобрена после рецензирования 15.05.23 Принята к публикации 15.05.23

i Надоели баннеры? Вы всегда можете отключить рекламу.