Научная статья на тему 'Анализ методов заполнения пропусков во временных рядах показателей финансовых рынков'

Анализ методов заполнения пропусков во временных рядах показателей финансовых рынков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
939
335
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВОССТАНОВЛЕНИЕ / ЗАПОЛНЕНИЕ ПРОПУСКОВ / РАНДОМИЗАЦИЯ / RESTORATION / FILLING OF ADMISSIONS / RANDOMIZATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Концевая Н. В.

В данной работе исследуются методы восстановления пропусков во временных рядах. Предложен критерий оценки заполнения пропусков. Приведены результаты численных экспериментов, демонстрирующие возрастание устойчивости параметров распределения исходных данных

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Концевая Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE ANALYSIS OF METHODS OF FILLING OF ADMISSIONS IN TEMPORARY RANKS OF INDICATORS OF THE FINANCIAL MARKETS

In this work methods of recovery of admissions in temporary ranks are investigated. The criterion of an assessment of filling of admissions is offered. The results of numerical experiments showing increase of stability of parameters of distribu-tion of basic data are given

Текст научной работы на тему «Анализ методов заполнения пропусков во временных рядах показателей финансовых рынков»

УДК 51.77+ 303.447.3

АНАЛИЗ МЕТОДОВ ЗАПОЛНЕНИЯ ПРОПУСКОВ ВО ВРЕМЕННЫХ РЯДАХ ПОКАЗАТЕЛЕЙ ФИНАНСОВЫХ РЫНКОВ Н.В. Концевая

В данной работе исследуются методы восстановления пропусков во временных рядах. Предложен критерий оценки заполнения пропусков. Приведены результаты численных экспериментов, демонстрирующие возрастание устойчивости параметров распределения исходных данных

Ключевые слова: восстановление, заполнение пропусков, рандомизация

Основной причиной, приводящей к появлению пропусков во временных рядах данных, является невозможность получения информации в определенные моменты времени. Например, специфика анализа финансовых рынков связанна с объективными пропусками данных и заключается в том, что информация, накопившаяся за то время, пока торги не велись, может привести к скачкообразным движениям цен, что, в свою очередь, может привести к существенному изменению параметров вероятностного распределения доходности активов, изменению корреляционных связей и т. д.

Сегодня существует множество методов восстановления пропусков, однако единая методология обработки данных с пропусками отсутствует, несмотря на ее необходимость.

Какие подходы (кроме эмпирического) могут быть полезны в выборе наиболее приемлемого метода заполнения пропусков и каким образом может исказить характер исходных данных выбранный алгоритм заполнения? Рассмотрим заполнение пропусков в дневных рыночных котировках, когда объем данных для восстановления устанавливает определенные ограничения на процедуры восстановления. С учетом всех праздников и выходных дней, необходимо добавить около 50% наблюдений (перейдя от 240 торговых к 365 календарным дням). Корректность выбора метода заполнения в таких условиях становится важнейшей задачей.

Так, например, в [1] предлагается оптимизация параметра экспоненциального сглаживания после заполнения пропусков с помощью метода линейной интерполяции на примере данных о курсе доллара США. Значение параметра сглаживания до заполнения пропусков равно 0,99, после обработки данных значение становится равным 0,92 и является оптимальным. В качестве параметра оптимизации выбирается величина ошибки прогноза. Поскольку заполнения для выходных дней являются линейными комбинациями значений за текущую неделю, при последующем экспоненциальном сглаживании, естественно, лучшую аппроксимацию будет давать коэффициент меньшей величины, поз-

Концевая Наталья Валерьевна - Финансовый университет при правительстве РФ, канд. экон. наук, доцент, e-mail: [email protected]

воляющий учитывать с большим весом отстоящие наблюдения. Уменьшение параметра сглаживания демонстрирует лишь «добавленную» взаимозависимость между данными. В результате, за счет добавления искусственной автокоррелированности в исследуемые данные, возникает минимум ошибки расхождения между сглаженными значениями и фактическими наблюдениями, что, формально, позволяет обосновать наилучшее значение параметра сглаживания, которое на самом деле получается искусственно.

Таким образом, любая процедура заполнения, базирующаяся на восстановлении с помощью значений предыдущих наблюдений, будет, в большей или меньшей степени, добавлять автокорреляцию в ряд исследуемых показателей. В частности, заполнение на базе регрессии, увеличит автокорреляцию в среднем на 40-50%, что формально сделает допустимым использование авторегрессионных моделей для описания и прогнозирования процесса.

В итоге, можно говорить о необходимости использования методов заполнения, которые не добавляли бы несуществующую связь между наблюдениями, а исключали бы ее появление. В частности, при исследованиях показателей валютного рынка, наилучшие результаты при заполнении пропусков были получены путем генерации случайных нормально распределенных отклонений от усредненных значений за неделю. Границы интервала распределения отклонений подбирались таким образом, что бы оценки распределения по генеральной совокупности оставались постоянными.

Рассмотрим предлагаемый подход на примере дневных котировок пары USD/JPY (источник котировок http://www.fxeuroclub.ru) с 1972 по 2011 гг., всего более 11 тыс. наблюдений.

Рассмотрим поведение показателя Херста, характеризующего меру случайности процесса:

п log(^.V)

log(N)

где R - максимальный размах накопленных отклонений, S- стандартное отклонение, N - количество наблюдений.

Для исследования был создан ряд однодневных логарифмических прибылей. Интервал между наблюдениями увеличивался от 1 до 720 дней, для каждого из сформированных рядов рассчитывался

1B

показатель Херста, результаты расчетов представлены на рис. 1.

0,60

Рис.1. Показатель Херста в зависимости от расстояния между наблюдениями

Для всех торговых инструментов величина интервала устойчивости одинакова. Как видно из рис.1., при сдвиге между наблюдениями менее 5 дней значение показателя Харста свидетельствуют об антиперсистентности соответствующих временных рядов, а при превышении 5 дневного интервала ряд становится более устойчивым.

Рассмотрим причины такого изменения, оценив корреляцию между отдельными днями, присвоив порядковый номер (от 1 до 5) каждому дню недели. Смещая ряды относительно исходного на все большее число дней, оценим связь между их номерами. Максимальная взаимосвязь при таком подходе, естественно, периодична и соответствует рядам с лагом кратным 5. С другой стороны, если измерять разрывы между наблюдениями, можно сформировать новый ряд, со значениями от 1 до 3 (в случае выходных), увеличивая длину ряда, можно добавить случайных разрывов по типу праздников и оценить корреляционные связи в соответствующей имитационной модели. На рис.2. оба варианта - со строгой периодичностью в первом случае и циклическим характером во втором.

1,50

Рис.2. Два подхода к оценке связей между разными днями недели Можно обобщить два подхода исходя из условия, что при нулевом сдвиге корреляция равна 1. На рис.3. представлены результаты обобщенного моделирования.

Рис.3. Имитационная модель взаимосвязей между рабочими днями Данная модель объясняет скачкообразное поведение показателя Херста при сдвиге между днями более чем на 5 дней, который может быть обусловлен не столько характером исходных данных, сколько периодичностью разрывов в исходной информации. Доказательством упорядочения и персистентности исходного временного ряда будет служить не наличие (отсутствие) скачка в изменении показателя, а его абсолютные значения по дням недели до и после процедуры заполнения. На рис.4 представлен показатель Херста, рассчитанный по восстановленному временному ряду (без пропусков). Пропуски заполнялись при помощи генерации случайных нормально распределенных отклонений от усредненных значений за 5 дней.

Рис.4. Показатель Херста после заполнения пропусков

Сравнивая рис.4 с рис.1 можно отметить те же характерные изменения в поведении показателя устойчивости, но в диапазоне сдвига от 5 до 100 дней абсолютные значения этого показателя увеличились. Рассмотрим результаты, полученные при сдвиге рядов в 7 дней до и после заполнения пропусков. Данный подход позволит оценить корректность восстановления данных.

70

заполнение через выходные Рис.5. Нормированный размах при различных схемах заполнения пропусков

На рис.5 приведены итоговые значения после восстановления данных по разным схемам - с использованием усреднения по 5 и по 7 дням. В таблице 1 приведены значения показателя Херста по дням недели, первый вариант заполнения выполнен на базе скользящего усреднения и, как видно из рис.6, вносимая искусственная корреляция из-за участия в усреднении восстановленных данных увеличивает значения показателя в выходные дни. При моделировании пропущенных данных в этом варианте использовалась равномерно распределенное случайное отклонение в диапазоне двух среднеквадратических.

1 ч о § § м э о О п к заполнение по 5 дням нормальное заполнение заполнение по 7 дням

пнд 0,54 0,55 0,56 0,56

втр 0,54 0,55 0,55 0,55

срд 0,54 0,55 0,55 0,55

чтв 0,54 0,56 0,55 0,56

птн 0,53 0,55 0,55 0,55

сбб 0,53 0,57 0,55 0,55

вскр 0,53 0,57 0,55 0,55

Таким образом, наилучшим вариантом заполнения можно считать восстановление путем усреднения только по фактическим значением с добавлением случайных нормально распределенных отклонений от усредненных фактических значений.

Целью заполнения пропусков является не только увеличение устойчивости параметров распределения, но и возможная оценка наличия возможной цикличности. Присутствие коротких волн в динамике рыночных показателей не очевидно, но следует из фрактальной природы рынков.

Последующим этапом исследование является сглаживание наблюдений восстановленного ряда. Проблема сглаживания подробно изучалась авторами, например, в [2] предложен метод модифицированного усреднения с нелинейными коэффициентами, позволяющий выравнивать данные, не те-

ряя информации об амплитуде колебаний ряда в сравнении с традиционными методами. В [3] решается проблема динамического интервала усреднения. Данные методы позволяют более качественно обрабатывать в том числе и ряды с восстановленными пропусками.

0,58

0,52 -I-----1------1-------1------1------1----->п

1 2 3 4 5 6 7

—■—до заполнения

заполнение через 5 дней заполнение через выходные

Рис.6. Показатель Херста при различных схемах заполнения пропусков

Предлагаемые методы анализа рыночных показателей предполагают поэтапную комбинацию процедур, которые обеспечат восстановление информации, оценивание и выявление возможных закономерностей в динамических рядах рыночных показателей.

Литература

1. Лобанов А.А. и др. Энциклопедия финансового риск-менеджмента / А.А.Лобанов, А.В.Чугунов // Альпина Паблишер, М: 2003, с.227

2. Агранович Ю.Я. и др. Метод многоугольных чисел в процедуре сглаживания временных рядов и приложения к исследованию финансовых рынков / Ю.Я. Агранович, Н.В. Концевая, В.Л. Хацкевич // Экономика и математические методы, т. 46; вып.3 (2010), с. 71-81.

3. Агранович Ю.Я. и др. Скользящее усреднение на основе минимизации невязки в формуле Эйлера - Ма-клорена / Ю.Я. Агранович, Н.В. Концевая, С.Л. Подвальный, В.Л. Хацкевич //Вестник воронежского государственного технического университета,Т.7, № 12.1, 2011, стр.4 -6.

Финансовый университет при правительстве РФ, (Воронежский филиал)

THE ANALYSIS OF METHODS OF FILLING OF ADMISSIONS IN TEMPORARY RANKS OF INDICATORS OF THE FINANCIAL MARKETS

N.V. Kontsevaya

In this work methods of recovery of admissions in temporary ranks are investigated. The criterion of an assessment of filling of admissions is offered. The results of numerical experiments showing increase of stability of parameters of distribution of basic data are given

Key words: restoration, filling of admissions, randomization

i Надоели баннеры? Вы всегда можете отключить рекламу.