Научная статья на тему 'Прогнозирование эволюционных временных рядов'

Прогнозирование эволюционных временных рядов Текст научной статьи по специальности «Математика»

CC BY
347
135
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ / ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ / R/S-АНАЛИЗ / ДЕТЕРМИНИРОВАННЫЙ ХАОС / R/SANALYSIS / TIME SERIES PREDICTION / IDENTIFICATION OF DYNAMIC SYSTEMS / DETERMINISTIC CHAOS

Аннотация научной статьи по математике, автор научной работы — Егошин А. В.

В статье рассмотрена задача прогнозирования эволюционных временных рядов в контексте теории хаоса, описываемых как последовательность реализаций сменяющих друг друга динамических систем. Исследуется возможность определения по наблюдаемому ряду, участков, порожденных предположительно различными динамическими системами, на основе фрактальных и хаотических характеристик временного ряда или восстановленного аттрактора сложной системы. Выявление реализаций более простых динамических систем позволит более обосновано выбирать длину временного ряда для обучения аппроксиматора, который будет строить прогноз.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

In this article the problem of forecasting of evolutional transient series in the context of chaos`s theory, described as order of realizations of dynamic systems who change each other, has been examined. The possibility of definition for observed line of the parts who was born by different dynamic systems admittedly, is analyzed on the base of fractal and chaotic characteristics of time series or recovered attractor of complicated system. The revelation of realization of more simple dynamic systems shall permit to choose the extension of time range for approximator`s training who make forecast more seriously.

Текст научной работы на тему «Прогнозирование эволюционных временных рядов»

Егошин А. В.

ПРОГНОЗИРОВАНИЕ ЭВОЛЮЦИОННЫХ ВРЕМЕННЫХ РЯДОВ Аннотация

В статье рассмотрена задача прогнозирования эволюционных временных рядов в контексте теории хаоса, описываемых как последовательность реализаций сменяющих друг друга динамических систем. Исследуется возможность определения по наблюдаемому ряду, участков, порожденных предположительно различными динамическими системами, на основе фрактальных и хаотических характеристик временного ряда или восстановленного аттрактора сложной системы. Выявление реализаций более простых динамических систем позволит более обосновано выбирать длину временного ряда для обучения аппроксиматора, который будет строить прогноз.

Ключевые слова: прогнозирование временных рядов, идентификация

динамических систем, R/S-анализ, детерминированный хаос.

Annotation

In this article the problem of forecasting of evolutional transient series in the context of chaos's theory, described as order of realizations of dynamic systems who change each other, has been examined. The possibility of definition for observed line of the parts who was born by different dynamic systems admittedly, is analyzed on the base of fractal and chaotic characteristics of time series or recovered attractor of complicated system. The revelation of realization of more simple dynamic systems shall permit to choose the extension of time range for approximator's training who make forecast more seriously.

Keywords: time series prediction, identification of dynamic systems, R/S- analysis, deterministic chaos.

Постановка задачи

Многие эволюционные процессы, будь-то экономические, социальные, природные или химические можно рассматривать с позиций теории хаоса и нелинейной динамики, т.е. как проявление некоторой хаотической нелинейной динамической системы. Прогнозирование таких временных рядов (ВР) основывается на реконструкции фазовой траектории аттрактора, с тем, чтобы по имеющейся истории состояний получить точку следующего перехода [2, 4].

У такого подхода есть несколько слабых мест. Во-первых, это доказательство выхода траектории на аттрактор. В большинстве наблюдаемых процессов это можно только предполагать [5]. Во-вторых, недостаток количества наблюдений или значительная вычислительная трудоемкость оценок фрактальных и хаотических характеристик системы. В-третьих, наблюдаемая по реализации некоторая нелинейная система сама может быть не автономна, в таком случае траектория системы может представлять собой череду сменяющих друг друга реализаций различных динамических систем. Если при этом для прогнозирования используется локальный метод реконструкции динамики системы (т.е. не по всем имеющимся данным), то необходимо знать, когда наблюдаемая реализация принадлежит аттрактору A, а когда аттрактору B или промежуточному между A и B процессу C. Глобальный метод реконструкции не всегда приемлем или возможен, т.к. при более длинных по времени наблюдениях оцениваемая сложность системы, как правило, увеличивается, не последнюю роль играет и увеличивающаяся вычислительная сложность.

Целью настоящего исследования является определение по наблюдаемому ряду участков, порожденных предположительно различными динамическими системами, на основе фрактальных и хаотических характеристик восстановленного аттрактора сложной системы. Выделение в составе сложного аттрактора динамической системы наличие более простых (по хаотическим характеристикам) аттракторов (назовем их локальными) позволит, используя лишь их траекторию в фазовом пространстве для обучения аппроксиматора, выполнять прогноз. При чем, в зависимости от рассчитанных характеристик предполагаемого локального аттрактора, возможно давать оценку степени надежности прогноза (т.е. чем проще аттрактор, тем надежней должен быть прогноз) [1].

В качестве экспериментальных данных использовались модельные системы (отображение Хенона, система Лоренца, система Росселера), их комбинации и реальные данные финансовых временных рядов. Финансовые временные ряды выбраны по нескольким причинам: они наиболее точно соответствуют понятию «эволюционные», данные по ним доступны за большие временные интервалы и с различными уровнями дискретизации, что делает их удобными для исследования.

Методика исследования

В качестве критериев автономности системы, порождающей наблюдаемый сигнал, выбраны оценки следующих характеристик:

• Фрактальная размерность (показатель Херста);

• Корреляционная размерность (по методу Грассбергера - Прокаччи);

• Максимальный показатель Ляпунова (по методу Вольфа);

• Энтропия Колмогорова (на основе расчетов корреляционного интеграла);

• Размерность (по методу самопересечения восстановленной фазовой траектории).

Предполагается, что смена аттрактора на участке вызовет изменение некоторых из данных характеристик.

Для проведения экспериментов и исследований разработан программный комплекс ChaosExpert на языке C#. Распараллеливание вычислений позволяет на многоядерных процессорах увеличить скорость расчетов до 80%.

Исследование модельных систем и их производных

Задача: выяснить возможность обнаружения по ряду наблюдаемых значений, присутствие динамических систем с различными аттракторами.

C - оценка корреляционной размерности;

E - оценка энтропии Колмогорова (нат);

L - оценка наибольшего показателя Ляпунова - в качестве размерности пространства вложения аттрактора используется наибольшее из значений: ближайшее большее целое C или Dz;

Lmax - максимальная оценка наибольшего показателя Ляпунова;

H - оценка показателя Херста;

Dz -минимальная размерность вложения фазового пространства, при которой не происходит самопересечения траектории;

Dl - последняя размерность пространства вложения, при которой заканчивается алгоритм по оценке корреляционной размерности.

Lag - размер используемого лага (задержки) - используется либо первый локальный минимум автовзаимной информации, либо меньшее значение;

N - количество используемых отсчетов, восстановленных в лаговом пространстве;

В таблице 1. показаны расчеты хаотических и фрактальных характеристик для модельных систем, выполненные при наличии 8000 отсчетов.

Система L(Lm ax) E і z N (тыс.)

Отображение Хенона .23 0.75 (1.22) 0 .7 .54 40 00

Аттрактор Росселера .7 0.19 (0.59) 0 .18 .23 40 00

Система Лоренца .98 0.35 (0.68) 0 .05 .73 6 20 00

Случайный ряд .54 80 00

Таблица 1. Характеристики модельных систем В таблице 2 показаны расчеты тех же характеристик, выполненные для комбинаций модельных систем. ВР такой сложной системы длиной в 16000 отсчетов на половину (т.е. из 8000 отсчетов) состоит из ВР одной системы, и наполовину из другой.

Система С L(L max) і z N (тыс.)

Хенон- Лоренц 3. 64> 0.04 (0.6) .61 .61 40 00

Хенон- Росселер 1. 23> 0.29 (0.88) .27 .34 40 00

Лоренц- Росселер 1. 73 0.24 (0.76) .21 .54 40 00

Хенон- Случайный 1. 66> .41 .56 32 00

Лоренц- Случайный 6. 96> .56 .57 9 20 00

Росселер- Случайный 3. 84> 0.065 (0.17) .29 .47 80 00

2. Характеристики сложных систем, полученных как комбинация модельных

А и ^

О 0.5 1 1.5 2 2.5 3 3.5 4

Рис. 1. Зависимость Log(R/S) к Log(N) для системы Хенон-Лоренц

На рисунках 1 и 2 показаны графики Я/Б анализа, выполненные для системы Хенон-Лоренц. Участок АВ соответствует отображению Хенона, ВС - системе Лоренца. На них четко заметен переход от одной хаотической системы к другой. На всех сложных системах на основе Я/Б анализа можно было выявить границу перехода от одной системы к другой. В системах со случайным рядом такой переход более размытый, однако явно заметен.

А В С

0 500 1000 1500 2000 2500 3000 3500 4000 4500

Рис. 2. Зависимость показателя Херста от длины периода для системы Хенон-

Лоренц

Сравнение и анализ хаотических характеристик и графиков позволяет сделать следующие выводы:

• Корреляционная размерность сложной системы может превосходить размерности отдельных простых систем, однако это в значительной степени будет зависеть от восстановления предполагаемого аттрактора системы (в частности лага).

• Значительное отличие значения оценки энтропии Колмогорова от оценки максимального показателя Ляпунова говорит о недостаточном количестве используемых отсчетов либо неверно восстановленном фазовом пространстве аттрактора.

• Наиболее четко о наличии различных систем может сказать график Я/Б анализа, по сильному изменению значения показателя Херста.

Исследование финансовых временных рядов

В качестве финансовых временных рядов рассмотрены котировки российских и американских акций, цены на золото, котировки валютной пары БиЯ-ИБВ в периоде от 03.07.2006 до 27.02.2007 на минутном интервале. Указанный период включает праздничные дни Нового года, что позволяет предполагать наличие различных аттракторов в эволюции систем до праздников и после, в составе более сложного глобального аттрактора. Поэтому сделаны расчеты хаотических характеристик на всем интервале и на двух внутренних - допраздничном и после Нового года. Результаты расчетов представлены в Таблице 2.

Эмитент С E H Dl Dz N (тыс.) Lag

10:40 03-07-2006 по 17:28 27-02-2007

10:40 10.01.2007 по 17:30 27-02-2007

03.07.2006.10.40-29.09.2006.17.30

American Express 4.55 0.014 0.89 157 7 14.1 4

American Express (усредн)НЬ 4.09 0.019 0.89 93 4 14.1 4

American Express (усредн)НЬ 4.17 0.046 0.87 45 17 11.9 1

American Express (усредн)НЬ 4.69 0.047 0.89 172 5 10.6 2

Boing 4.04 0.074 0.88 48 7 15.5 4

Boing (усредн)НЬ 4.37 0.084 0.88 82 3 15.5 4

Boing (усредн)НЬ 3.72 0.029 0.87 65 7 12.4 1

Boing (усредн)НЬ 4 0.051 0.88 53 3 11.9 2

Coca-Cola 5.17 0.066 0.89 57 10 15.2 4

Coca-Cola (усредн)НЬ 5.23 0.03 0.89 100 7 15.2 4

Coca-Cola (усредн)НЬ 4.96 0.054 0.89 48 16 12.3 1

Coca-Cola (усредн)НЬ 4.7 0.068 0.87 38 7 11.6 2

EUR-USD 4.33 0.03 0.89 107 9 16.9 16

EUR-USD (усредн. HL) 4.61 0.076 0.89 79 3 16.9 16

EUR-USD (усредн. HL) 5.03 0.014 0.9 108 5 14.9 3

EUR-USD (усредн. HL) 5.62> 0.077 0.9 60 6 15.3 6

Nasdaq 4.52 0.111 0.91 95 5 14.5 4

Nasdaq (усредн) 4.16 0.076 0.91 88 3 14.5 4

Nasdaq (усредн. HL) 3.87 0.205 0.9 44 3 11.3 1

Nasdaq (усредн. HL) 3.55 0.07 0.89 57 2 11.7 2

Газпром 5.43 0.025 0.89 100 5 16.1 5

Газпром (усред)ИЬ 4.56 0.063 0.89 58 3 16.1 5

Газпром (усред)ИЬ 4.69 0.046 0.88 55 4 16.7 1

Эмитент С E H Dl Dz N (тыс.)

Газпром (усред)НЬ 4.22 0.038 0.9 80 3 16 2

Золото 5.27 0.063 0.9 50 6 15.3 8

Золото (усредн)НЬ 4.97 0.027 0.9 93 3 15.3 8

Золото (усредн)НЬ 3.9 0.012 0.89 135 6 14.5 2

Золото (усредн)НЬ 4.42 0.057 0.9 64 4 14 3

Индекс ММВБ 4.43 0.044 0.9 114 3 16.1 5

Индекс ММВБ (усредн) 4.13 0.04 0.9 101 2 16.1 5

Индекс ММВБ (усредн) 4.04 0.015 0.87 159 3 16.7 1

Индекс ММВБ (усредн) 3.94 0.0007 0.9 45 3 16 2

Лукойла 4.82 0.1 0.9 36 6 16 5

Лукойла (усредн)НЬ 4.59 0.045 0.9 75 2 16 5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лукойла (усредн)НЬ 4.5 0.033 0.89 62 4 16.6 1

Лукойла (усредн)НЬ 4.22 0.028 0.9 93 2 15.9 2

Норникель 4.82 0.043 0.9 105 4 15.7 5

Норникель (усредн)НЬ 3.43 0.62 0.9 35 2 15.7 5

Норникель (усредн)НЬ 5.37 > - 0.88 396 > 4 16.4 1

Норникель (усредн)НЬ 4.02 0.26 0.91 40 3 15.7 2

Полюс Золото 5.22 0.056 0.88 74 13 15.6 3

Полюс Золото (усредн)НЬ 4.86 0.026 0.88 113 5 15.6 3

Полюс Золото (усредн)НЬ 4.82 0.07 0.88 83 10 11.3 1

Полюс Золото (усредн)НЬ 3.87 0.04 0.87 79 7 8.6 2

РАО ЕЭС 4.62 0.097 0.9 95 5 16.1 5

РАО ЕЭС (усреднен.)НЬ 4.81 0.045 0.9 142 3 16.1 5

РАО ЕЭС (усреднен.)НЬ 4.14 0.041 0.88 89 4 16.7 1

РАО ЕЭС (усреднен.)НЬ 4.68 0.02 0.87 118 3 16 2

РАО ЕЭС-п 4.22 0.146 0.9 41 6 15.6 3

РАО ЕЭС-п (усредн.НЬ) 3.86 0.077 0.9 68 3 15.6 3

РАО ЕЭС-п (усредн.НЬ) 5.03 0.067 0.88 44 9 12.8 1

РАО ЕЭС-п (усредн.НЬ) 5.27 0.035 0.89 64 10 14.9 1

Таблица 3. Характеристики реальных систем (финансовые ВР)

Усредн.НЬ - означает усреднение по максимальной и минимальной цене за период дискретизации, т.е. берутся не просто значения с лагом 3 например, а среднее по 6 значениям - 3 - максимальные цены и соответственно 3 минимальные. При такой предобработке данных, как правило, корреляционная размерность ниже. Лаг выбирался исходя из заданного временного интервала и ограничения на максимальное количество анализируемых наблюдений в 17000 значений. Большие значения Dl могут говорить о том, что неверно восстановлено лаговое пространство.

Анализ выполненных расчетов показал, что действительно, на внутренних интервалах есть различия по корреляционной размерности, энтропии и фазовой размерности. Причем не всегда эти различия в меньшую сторону. Отличия по показателю Херста незначительны. Примечательно, что на рассмотренном интервале показатель Херста для котировок валютной пары БиЯ-ИБВ показал значение, сходное для акций. Т.е. на временных отрезках, меньших нескольких лет, валютный курс показывает персистентное поведение [3].

Не выявлено заметных отличий в характеристиках для российских и американских акций, цен на золото и валюты, что говорит о том, что биржевые ВР на интервалах в несколько месяцев ведут себя достаточно одинаково.

В целом можно заключить, что на основании проведенных исследований, предложенная гипотеза об эволюции ВР как сменяющейся последовательности реализаций нелинейных динамических систем находит подтверждение.

Список литературы:

1. Егошин А. В. Постановка задачи прогнозирования временного ряда порождаемого динамической системой. - Информационные технологии в профессиональной деятельности и научной работе: сборник материалов всероссийской научно-практической конференции с международным участием. - Йошкар-Ола: Марийский государственный технический университет, 2007. - 136 - 140 с.

2. Заботнев М.С. Статья// Динамика инвестиционного процесса: анализ и прогноз. ИПМ им. М.В.Келдыша РАН. - Москва, 2001.

3. Петерс Э. Хаос и порядок на рынках капитала. - М.: Мир. 2000.

4. Головко В.А. Нейросетевые методы обработки хаотических процессов. - Научная сессия МИФИ-2005. VII Всероссийская научно-техническая конференция «Нейроинформатика-2005»: - лекции по нейроинформатике. - М.: МИФИ, 2005. - 76 с.

5. Н. Г. Макаренко. Эмбидология и нейропрогноз. Лекции по нейроинформатике. М.: Изд-во МИФИ, 2003. с. 32.

i Надоели баннеры? Вы всегда можете отключить рекламу.