Научная статья на тему 'Исследование возможности выявления динамических систем по наблюдаемому временному ряду в задаче прогнозирования'

Исследование возможности выявления динамических систем по наблюдаемому временному ряду в задаче прогнозирования Текст научной статьи по специальности «Математика»

CC BY
301
163
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ / ИДЕНТИФИКАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ / R/S-АНАЛИЗ / ДЕТЕРМИНИРОВАННЫЙ ХАОС / R/SANALYSIS / TIME SERIES PREDICTION / IDENTIFICATION OF DYNAMIC SYSTEMS / DETERMINISTIC CHAOS

Аннотация научной статьи по математике, автор научной работы — Егошин Алексей Валерьевич, Сидоркина Ирина Геннадьевна

Рассмотрена задача прогнозирования эволюционных временных рядов в контексте теории хаоса, описываемых как последовательность реализаций сменяющих друг друга динамических систем. Исследуется возможность определения по наблюдаемому ряду участков, порожденных различными динамическими системами, на основе фрактальных и хаотических характеристик временного ряда или восстановленного аттрактора сложной системы. Выявление реализаций более простых динамических систем позволит обоснованно выбирать длину временного ряда для обучения аппроксиматора, который будет строить прогноз.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH OF THE OPPORTUNITY OF DEFINITION OF DYNAMIC SYSTEMS ON AN OBSERVABLE TIME RANGE IN THE PROBLEM OF FORECASTING

In this article the problem of forecasting of evolutional transient series in the context of chaos`s theory, described as order of realizations of dynamic systems who change each other, has been examined. The possibility of definition for observed line of the parts who was born by different dynamic systems admittedly, is analyzed on the base of fractal and chaotic characteristics of time series or recovered attractor of complicated system. The revelation of realization of more simple dynamic systems shall permit to choose the extension of time range for approximator`s training who make forecast more seriously.

Текст научной работы на тему «Исследование возможности выявления динамических систем по наблюдаемому временному ряду в задаче прогнозирования»

УДК 681.586

А.В. ЕГОШИН, И Г. СИДОРКИНА

ИССЛЕДОВАНИЕ ВОЗМОЖНОСТИ ВЫЯВЛЕНИЯ ДИНАМИЧЕСКИХ СИСТЕМ ПО НАБЛЮДАЕМОМУ ВРЕМЕННОМУ РЯДУ В ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ

Ключевые слова: прогнозирование временных рядов, идентификация динамических систем, R/S-анализ, детерминированныш хаос.

Рассмотрена задача прогнозирования эволюционных временныгх рядов в контексте теории хаоса, описываемых как последовательность реализаций сменяющих друг друга динамических систем. Исследуется возможность определения по наблюдаемому ряду участков, порожденныгх различными динамическими системами, на основе фрактальных и хаотических характеристик временного ряда или восстановленного аттрактора сложной системы. Выгявление реализаций более простых динамических систем позволит обоснованно выбирать длину временного ряда для обучения аппроксиматора, который будет строить прогноз.

А.^ EGOSHIN, I.G. SIDORKINA RESEARCH OF THE OPPORTUNITY OF DEFINITION OF DYNAMIC SYSTEMS ON AN OBSERVABLE TIME RANGE IN THE PROBLEM OF FORECASTING Key words: time series prediction, identification of dynamic systems, R/S- analysis, deterministic chaos.

In this article the problem of forecasting of evolutional transient series in the context of chaos's theory, described as order of realizations of dynamic systems who change each other, has been examined. The possibility of definition for observed line of the parts who was born by different dynamic systems admittedly, is analyzed on the base of fractal and chaotic characteristics of time series or recovered attractor of complicated system. The revelation of realization of more simple dynamic systems shall permit to choose the extension of time range for approximator's training who make forecast more seriously.

Постановка задачи. Многие эволюционные процессы, экономические, социальные, природные или химические, можно рассматривать с позиций теории хаоса и нелинейной динамики, т.е. как проявление некоторой хаотической нелинейной динамической системы. Прогнозирование таких временных рядов (ВР) основывается на реконструкции фазовой траектории аттрактора, с тем, чтобы по имеющейся истории состояний получить точку следующего перехода [2, 4].

У такого подхода есть несколько слабых мест. Во-первых, это доказательство выхода траектории на аттрактор. В большинстве наблюдаемых процессов это можно только предполагать [5]. Во-вторых, недостаток количества наблюдений или значительная вычислительная трудоемкость оценок фрактальных и хаотических характеристик системы. В-третьих, наблюдаемая по реализации некоторая нелинейная система сама может быть не автономна, в таком случае ее траектория может представлять собой череду сменяющих друг друга реализаций. Если при этом для прогнозирования используется локальный метод реконструкции динамики (т.е. не по всем имеющимся данным), то необходимо знать, когда наблюдаемая реализация принадлежит аттрактору A, а когда аттрактору B или промежуточному между A и B процессу C. Глобальный метод реконструкции не всегда приемлем или возможен, так как при более длинных по времени наблюдениях оцениваемая сложность системы, как правило, увеличивается, не последнюю роль играет и увеличивающаяся вычислительная сложность.

Целью настоящего исследования является определение по наблюдаемому ряду участков, порожденных различными динамическими системами, на основе фрактальных и хаотических характеристик восстановленного аттрактора сложной системы. Выделение в составе сложного аттрактора динамической системы, наличие более простых (по хаотическим характеристикам) аттракторов (назовем их локальными) позволят, используя лишь их траекторию в фазовом пространстве для обучения аппроксиматора, выполнять прогноз. Причем в зависимости от рассчитанных характеристик предполагаемого локального аттрактора возможно давать оценку степени надежности прогноза (т.е. чем проще аттрактор, тем надежней должен быть прогноз) [1].

В качестве экспериментальных данных использовались модельные системы (отображение Хенона, система Лоренца, система Росселера), их комбинации и реальные данные финансовых временных рядов. Финансовые временные ряды выбраны по нескольким причинам: они наиболее точно соответствуют понятию «эволюционные», данные по ним доступны за большие временные интервалы и с различными уровнями дискретизации, что делает их удобными для исследования.

Методика исследования. В качестве критериев автономности системы, порождающей наблюдаемый сигнал, выбраны оценки следующих характеристик:

- фрактальная размерность (показатель Херста);

- корреляционная размерность (по методу Грассбергера - Прокаччи);

- максимальный показатель Ляпунова (по методу Вольфа);

- энтропия Колмогорова (на основе расчетов корреляционного интеграла);

- размерность (по методу самопересечения восстановленной фазовой траектории).

Предполагается, что смена аттрактора на участке вызовет изменение некоторых из данных характеристик.

Для проведения экспериментов и исследований разработан программный комплекс ChaosExpert на языке C#. Распараллеливание вычислений позволяет на многоядерных процессорах увеличить скорость расчетов до 80%.

Исследование модельных систем и их производных. Задача: выяснить возможность обнаружения по ряду наблюдаемых значений присутствие динамических систем с различными аттракторами.

C - оценка корреляционной размерности;

E - оценка энтропии Колмогорова (нат.);

L - оценка наибольшего показателя Ляпунова - в качестве размерности пространства вложения аттрактора используется наибольшее из значений: ближайшее большее целое C или Dz;

Lmax - максимальная оценка наибольшего показателя Ляпунова;

H - оценка показателя Херста;

Dz -минимальная размерность вложения фазового пространства, при которой не происходит самопересечения траектории;

Dl - последняя размерность пространства вложения, при которой заканчивается алгоритм по оценке корреляционной размерности;

Lag - размер используемого лага (задержки) - используется либо первый локальный минимум автовзаимной информации, либо меньшее значение;

N - количество используемых отсчетов, восстановленных в лаговом пространстве.

В табл. 1 показаны расчеты хаотических и фрактальных характеристик для модельных систем, выполненные при наличии 8000 отсчетов.

Таблица 1

Характеристики модельных систем

Система С LCLmax) Е Н т Бг N (тыс.)

Отображение Хенона 1.23 0.75 (1.22) 0.7 0.54 6 1 2 4000

Аттрактор Росселера 1.7 0.19 (0.59) 0.18 0.23 8 2 2 4000

Система Лоренца 1.98 0.35 (0.68) 0.05 0.73 26 2 8 2000

Случайный ряд - - - 0.54 - - 1 8000

В табл. 2 показаны расчеты тех же характеристик, выполненные для комбинаций модельных систем. ВР такой сложной системы длиной в 16000 отсчетов наполовину (т.е. из 8000 отсчетов) состоит из ВР одной системы и наполовину из другой.

Таблица 2

Характеристики сложных систем, полученных как комбинация модельных

Система С LCLmax) Е Н Б1 Бг N (тыс.)

Хенон-Лоренц 3.64> 0.04 (0.6) 0.61 0.61 9 2 4 4000

Хенон-Росселер 1.23> 0.29 (0.88) 1.27 0.34 5 1 4 4000

Лоренц-Росселер 1.73 0.24 (0.76) 0.21 0.54 9 2 4 4000

Хенон-Случайный 1.66> - 2.41 0.56 3 1 5 3200

Лоренц-Случайный 6.96> - 0.56 0.57 19 1 8 2000

Росселер-Случайный 3.84> 0.065 (0.17) 0.29 0.47 6 2 2 8000

На рис. 1 и 2 показаны графики Л/^ анализа, выполненные для системы Хенон-Лоренц. Участок АВ соответствует отображению Хенона, ВС - системе Лоренца. На них четко заметен переход от одной хаотической системы к другой. На всех сложных системах на основе Л/^ анализа можно было выявить границу перехода от одной системы к другой. В системах со случайным рядом такой переход более размытый, но он явно заметен.

Сравнение и анализ хаотических характеристик и графиков позволяют сделать следующие выводы:

- корреляционная размерность сложной системы может превосходить размерности отдельных простых систем, однако это в значительной степени будет зависеть от восстановления предполагаемого аттрактора системы (в частности лага);

- значительное отличие значения оценки энтропии Колмогорова от оценки максимального показателя Ляпунова свидетельствует о недостаточном количестве используемых отсчетов либо неверно восстановленном фазовом пространстве аттрактора;

- наиболее четко наличие различных систем демонстрирует график Л/^ анализа, на котором можно видеть сильно измененные значения показателя Херста.

Рис. 1. Зависимость Ьоо(Ж?) к Ьоо(ЛО для системы Хенон-Лоренц

А Б С

О да 1000 1500- 2000 2500 ЭХО 3500 40Ш 4500

Рис. 2. Зависимость показателя Херста от длины периода для системы Хенон-Лоренц

Исследование финансовых временных рядов. В качестве финансовых временных рядов рассмотрены котировки российских и американских акций, цены на золото, котировки валютной пары БиЯ-^Б в периоде 03.07.200627.02.2007 на минутном интервале. Указанный период включает праздничные дни Нового года, что позволяет предполагать наличие различных аттракторов в эволюции систем до праздников и после в составе более сложного глобального аттрактора. Поэтому сделаны расчеты хаотических характеристик на

всем интервале и на двух внутренних - допраздничном и после Нового года.

Результаты расчетов представлены в табл. 3.

Таблица 3

__________________Характеристики реальных систем (финансовые ВР)___________________

Эмитент С E H Dl Dz N (тыс.) Lag

American Express* 4.55 Q.Q14 Q.S9 І57 7 І4.І 4

American Express (усредн)БЬ** 4.Q9 Q.Q19 Q.S9 93 4 І4.І 4

American Express (усредн)БЬ*** 4.17 Q.Q46 Q.S7 45 І7 ІІ.9 І

American Express (усредн)БЬ**** 4.69 Q.Q47 Q.S9 І 72 5 iQ.6 2

Boing* 4.Q4 Q.Q74 Q.SS 4S 7 І5.5 4

Boing (усредн)БЬ** 4.З7 Q.QS4 Q.SS S2 3 І5.5 4

Boing (усредн)БЬ*** З.72 Q.Q29 Q.S7 65 7 І2.4 І

Boing (усредн)ЯЬ**** 4 Q.Q5 І Q.SS 53 3 ІІ.9 2

Coca-Cola* 5.17 Q.Q66 Q.S9 57 iQ І5.2 4

Coca-Cola (усредн)БЬ** 5.2З Q.Q3 Q.S9 iQQ 7 І5.2 4

Coca-Cola (усредн)БЬ*** 4.96 Q.Q54 Q.S9 4S 16 І2.З І

Coca-Cola (усредн)БЬ**** 4.7 Q.Q6S Q.S7 3S 7 ІІ.б 2

EUR-USD* 4.ЗЗ Q.Q3 Q.S9 iQ7 9 Іб.9 Іб

EUR-USD (усредн. HL)** 4.61 Q.Q76 Q.S9 79 3 Іб.9 Іб

EUR-USD (усредн. HL)*** 5.Q3 Q.Q14 Q.9 iQS 5 І4.9 3

EUR-USD (усредн. HL)**** 5.б2> Q.Q77 Q.9 6Q б І5.З б

Nasdaq* 4.52 Q.iii Q.9i 95 5 І4.5 4

Nasdaq (усредн)** 4.16 Q.Q76 Q.9i SS 3 І4.5 4

Nasdaq (усредн. HL)*** 3.S7 Q.2Q5 Q.9 44 3 ІІ.З І

Nasdaq (усредн. HL)**** З.55 Q.Q7 Q.S9 57 2 ІІ.7 2

Газпром* 5.4З Q.Q25 Q.S9 iQQ 5 Іб.І 5

Газпром (усред)БЬ** 4.56 Q.Q63 Q.S9 5S 3 Іб.І 5

Газпром (усред)БЬ*** 4.69 Q.Q46 Q.SS 55 4 Іб.7 І

Газпром (у сред)БЬ * * * * 4.22 Q.Q3S Q.9 SQ 3 Іб 2

Золото* 5.27 Q.Q63 Q.9 5Q б І5.З S

Золото (усредн )HL** 4.97 Q.Q27 Q.9 93 3 І5.З S

Золото (усредн)БЬ*** З.9 Q.Q12 Q.S9 ІЗ5 б І4.5 2

Золото (усредн)БЬ**** 4.42 Q.Q57 Q.9 64 4 14 3

Индекс ММВБ* 4.4З Q.Q44 Q.9 ІІ4 3 Іб.І 5

Индекс ММВБ (усредн)** 4. ІЗ Q.Q4 Q.9 iQi 2 Іб.І 5

Индекс ММВБ (усредн)*** 4.Q4 Q.Q15 Q.S7 І59 3 Іб.7 І

Индекс ММВБ (усредн)**** З.94 Q.QQQ7 Q.9 45 3 Іб 2

Лукойл* 4.S2 Q.i Q.9 36 б Іб 5

Лукойл (усредн)БЬ** 4.59 Q.Q45 Q.9 75 2 Іб 5

Лукойл (усредн)БЬ*** 4.5 Q.Q33 Q.S9 62 4 Іб.б І

Лукойл (усредн)БЬ**** 4.22 Q.Q2S Q.9 93 2 І5.9 2

Норникель* 4.S2 Q.Q43 Q.9 iQ5 4 І5.7 5

Норникель (усредн)БЬ** З.4З Q.62 Q.9 35 2 І5.7 5

Норникель (усредн )HL*** 5.З7 > - Q.SS 396 > 4 Іб.4 І

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Норникель (усредн)БЬ**** 4.Q2 Q.26 Q.9i 4Q 3 І5.7 2

Полюс Золото* 5.22 Q.Q56 Q.SS 74 ІЗ 15.6 3

Полюс Золото (усредн)БЬ** 4.S6 Q.Q26 Q.SS ІІЗ 5 15.6 3

Полюс Золото (усредн)БЬ*** 4.S2 Q.Q7 Q.SS S3 iQ ІІ.З І

Полюс Золото (усредн)БЬ**** 3.S7 Q.Q4 Q.S7 79 7 S.6 2

РАО ЕЭС* 4.62 Q.Q97 Q.9 95 5 Іб.І 5

РАО ЕЭС (усреднен. )HL** 4.Si Q.Q45 Q.9 І 42 3 Іб.І 5

РАО ЕЭС (усреднен.)БЬ*** 4.І4 Q.Q41 Q.SS S9 4 Іб.7 І

РАО ЕЭС (усреднеп.)БЬ**** 4.6S Q.Q2 Q.S7 iiS 3 Іб 2

Эмитент С Е Н Б1 Б/ N (тыс.)

РАО ЕЭС-п* 4.22 0.146 0.9 41 6 15.6 3

РАО ЕЭС-п (усредн.ИЬ)** 3.86 0.077 0.9 68 3 15.6 3

РАО ЕЭС-п (усредн.ИЬ)*** 5.03 0.067 0.88 44 9 12.8 1

РАО ЕЭС-п (усредн.ИЬ)**** 5.27 0.035 0.89 64 10 14.9 1

Примечание: * - с 10:40 03-07-2006 по 17:28 27-02-2007; ** - с 10:40 03-07-2006 по 17:28 27-02-2007; *** - 10:40 10.01.2007 по 17:30 27-02-2007; **** - с 03.07.2006.10.40 по 29.09.2006.17.30.

Усредн.ИЬ - означает усреднение по максимальной и минимальной ценам за период дискретизации, т.е. берутся не просто значения с лагом 3, например, а среднее по 6 значениям - 3 - максимальные цены и, соответственно, 3 минимальные. При такой предобработке данных, как правило, корреляционная размерность ниже. Лаг выбирался исходя из заданного временного интервала и ограничения на максимальное количество анализируемых наблюдений в 17000 значений. Большие значения В1 могут говорить о том, что неверно восстановлено лаговое пространство.

Анализ выполненных расчетов показал, что, действительно, на внутренних интервалах есть различия по корреляционной размерности, энтропии и фазовой размерности. Отличия по показателю Херста незначительны. Примечательно, что на рассмотренном интервале показатель Херста для котировок валютной пары ЕИЯ-^Б показал значение, сходное для акций. То есть на временных отрезках, меньших нескольких лет, валютный курс показывает персистентное поведение [3].

Не выявлено заметных отличий в характеристиках для российских и американских акций, цен на золото и валюты, что говорит о том, что биржевые ВР на интервалах в несколько месяцев ведут себя достаточно одинаково.

В целом можно заключить, что на основании исследований предложенная гипотеза об эволюции ВР как сменяющейся последовательности реализаций нелинейных динамических систем находит подтверждение.

Литература

1. Егошин А.В. Постановка задачи прогнозирования временного ряда порождаемого динамической системой / А.В. Егошин // Информационные технологии в профессиональной деятельности и научной работе: сборник материалов Всероссийской науч.-практ. конф. с международным участием. Йошкар-Ола: Марийский государственный технический университет, 2007. С. 136-140.

2. Заботнев М.С. Динамика инвестиционного процесса: анализ и прогноз / М.С. Забот-нев // http://www.keldysh.ru/papers/2001/prep32/prep2001_32.html.

3. Петерс Э. Хаос и порядок на рынках капитала / Э. Петерс. М.: Мир, 2000.

4. Головко В.А. Нейросетевые методы обработки хаотических процессов / В.А. Головко // VII Всероссийская науч.-техн. конф. «Нейроинформатика-2005»: лекции по нейроинформатике. М.: МИФИ, 2005. 76 с.

5. МакаренкоН.Г. Эмбидология и нейропрогноз. Лекции по нейроинформатике. М.: Изд-во МИФИ, 2003. с. 32.

ЕГОШИН АЛЕКСЕЙ ВАЛЕРЬЕВИЧ родился в 1984 г. Окончил Марийский государственный технический университет. Аспирант кафедры информационно-вычислительных систем Марийского технического университета. Область научных интересов - прогнозирование временных рядов, 8УМ, деревья решений. Автор 5 научных публикаций.

СИДОРКИНА ИРИНА ГЕННАДЬЕВНА. См. с. 203.________________________________________

i Надоели баннеры? Вы всегда можете отключить рекламу.