Научная статья на тему 'Информационная технология прогнозирования нестационарных временных рядов с использованием сингулярного спектрального анализа'

Информационная технология прогнозирования нестационарных временных рядов с использованием сингулярного спектрального анализа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
523
106
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННОЙ РЯД / ПРОГНОЗИРОВАНИЕ / ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ / СИНГУЛЯРНЫЙ СПЕКТРАЛЬНЫЙ АНАЛИЗ / ФАЗОВОЕ ПРОСТРАНСТВО / TIME SERIES / FORECASTING / INFORMATION TECHNOLOGY / SINGULAR SPECTRUM ANALYSIS / PHASE SPACE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чистякова А. А., Шамша Б. В.

В работе предложена информационная технология прогнозирования нестационарных временных рядов, которые не приводятся к стационарным, характеризуются нелинейным трендом и завуалированными периодическими компонентами. Для построения модели прогнозирования определяется поведение компонент временного ряда в нескольких фазовых пространствах, построенных с использованием метода сингулярного спектрального анализа (SSA)

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Чистякова А. А., Шамша Б. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Information technology of forecasting non-stationary time-series data using singular spectrum analysis

The information technology of forecasting non-stationary time series data, which cannot be reduced to stationary is proposed in the paper. Today, this time series class is often found in various fields, including economics, sociology, and is characterized by nonlinear trend, presence of several periodic components with variable frequency and amplitude, high noise level. Identification of non-stationary time series components is achieved using the method of singular spectrum analysis (SSA), which does not require a priori information about the time series structure. It is proposed to use several phase spaces, which can be constructed using different parameter of time window length in the SSA method, for building the models of predicting and identifying the most stable time series components. It is assumed that the time series is described by linear recurrence formulas, the coefficients of which are calculated in various phase spaces. Forecasting results are characterized by stability and efficiency as the nonstationary time series data analysis is performed in various states of the system and the most significant components are considered. The proposed information technology allows to select the amount of considered phase spaces in the forecasting model and their dimensions, as well as to make an effective short-term forecast of non-stationary time series data.

Текст научной работы на тему «Информационная технология прогнозирования нестационарных временных рядов с использованием сингулярного спектрального анализа»

6. Jain, A. K. Flynn Data clustering: a review [Text] / A. K. Jain, M. N. Murty // ACM Comput. Surv. - 1999. - Vol. 31(3). -P. 264-323.

7. Пістунов, І. М. Кластерний аналіз в економіці [Текст] / І. М. Пістунов, О. П. Антонюк та ін. - Дніпропетровськ: Національний гірничий університет, 2008.- 84 с.

8. Ким, Дж. Факторный, дискриминантный и кластерний анализ [Текст] / Дж. Ким, Ч. У. Мьюллер, У. Р. Клекка. - М.: Финансы и статистика, 1989. - 215 с.

9. Дюран, Б. Кластерный анализ [Текст] / Б. Дюран, П. Оделл. - М.: «Статистика», 1977. - 128 с.

10. Кондрук, Н. Е. Застосування багатокритеріальних моделей для задач збалансованого харчування [Текст] / Н. Е. Кондрук, М. М. Маляр // Вісник Черкаського державного технологічного університету. Серія: технічні науки. - 2010. - Вип. 1, № 1. -

С. 3-7.

11. Кондрук, Н. Э. Некоторые применения кластеризации критериального пространства для задач выбора [Текст] / Н. Э. Кондрук, Н. Н. Маляр // Компьютерная математика. - 2009. - № 2. - С. 142-149.

12. А61К8/19, А61К8/30, МПК (2006.01). Патент на корисну модель 64777 Україна. Спосіб автоматизованого складання дієтичного харчування «Дієтолог» [Текст] / Маляр М. М., Кондрук Н. Е., Горленко О. М., Томей А.І . - № u201100007; Заявл. від 04.01.2011; Опубл. 25.11.2011, Бюл.№ 22.

-----------------□ □---------------------

В роботі запропонована інформаційна технологія прогнозування нестаціонарних часових рядів, яка не зводяться до стаціонарних, характерізуються нелінійним трендом та завуальованимі періодичними компонентами. З метою побудови моделі прогнозування визначається поведінка компонент часового ряду у декілької фазових просторах, побудованних з використанням методу сингулярного спектрального аналізу (ББЛ)

Ключові слова: часовий ряд, прогнозування, інформаційна технологія, сингулярний спектральний аналіз, фазовий простір

□----------------------------------□

В работе предложена информационная технология прогнозирования нестационарных временных рядов, которые не приводятся к стационарным, характеризуются нелинейным трендом и завуалированными периодическими компонентами. Для построения модели прогнозирования определяется поведение компонент временного ряда в нескольких фазовых пространствах, построенных с использованием метода сингулярного спектрального анализа (ББЛ) Ключевые слова: временной ряд, прогнозирование, информационная технология, сингулярный спектральный анализ, фазовое пространство -----------------□ □---------------------

1. Введение достоверные оценки возможного развития изучаемых

явлений, изменения технико-экономических показа-Прогнозирование является одним из решающих телей и событий в будущем. элементов эффективной организации управления Применение прогнозирования в информационных

предприятиями вследствие того, что результат при- технологиях (ИТ) позволит воздействовать на уско-

нимаемых решений в большой степени определяется ренный процесс анализа, обработки, распростране-

качеством прогнозирования их последствий. Поэтому ния и использования обширной базы информации, а

решения, принимаемые сегодня, должны опираться на также своевременно принимать управленческие ре-

УДК 517.534

ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ ПРОГНОЗИРОВАНИЯ НЕСТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ С ИСПОЛЬЗОВАНИЕМ СИНГУЛЯРНОГО СПЕКТРАЛЬНОГО АНАЛИЗА

А. А. Чистякова

Аспирант*

Е-mail: anna.chistyakova.prn@gmail.com Б. В. Шамша

Кандидат технических наук, профессор* Е-mail: shamsha.b.v@gmail.com *Кафедра информационных управляющих систем Харьковский национальный университет радиоэлектроники пр. Ленина, 16, г. Харьков, Украина, 61166

шения и планировать деятельность в соответствии с полученными результатами. На сегодняшний день информационные технологии выступают своего рода катализатором эволюции в мире. Поэтому применение ИТ в прогнозирования приводит к развитию научнотехнического прогресса и к использованию результатов в хозяйственной практике.

В этой связи применение современных компьютерных технологий и разработка новых методов с их использованием обусловлена рядом причин, в числе которых:

- рост объемов информации;

- сложность структуры данных;

- появление современных методов прогнозирования, их развитие и внедрение;

- сложность алгоритмов расчета и интерпретации результатов;

- высокие требования к качеству прогнозов;

- необходимость использования результатов прогнозирования для решения задач планирования и управления.

Множество рядов технико-экономических показателей, отражающих рост предприятий и компаний, имеют нелинейный характер, что затрудняет их анализ, прогнозирование и принятие управленческих решений на основании статистических данных. Задача прогнозирования таких рядов становится все более и более актуальной на сегодняшний день, так как активно развиваются технологии, изменяются бизнес-процессы, существует большое количество внешних нелинейных аттракторов и т. д.

2. Постановка задачи

На сегодняшний день существует множество методов и подходов к прогнозированию временных рядов, среди которых можно выделить наиболее современные и широко использующиеся в практических задачах. К ним относят: метод АШМА, классификационно-регрессионные алгоритмы, метод максимального правдоподобия, метод идентификации кластеров на основании статистических характеристик, метод GARCH, нейросетевой метод и др. Каждый из данных методов имеет свои предпосылки и предположения при практическом использовании. Так, в частности, для построения авторегрессионных моделей необходимо, чтобы временной ряд был стационарным или приводился к таковому путем взятия разности первого, второго или большего порядков. Метод GARCH применяется для и построения моделей волатильности временного ряда, нейросетевые методы требуют достаточного, но не избыточного количества данных обучающей последовательности, а также выбора адаптивной структуры нейросети. Другие методы имеют свои особенности и требуют своих предпосылок и предположений. Однако, нестационарные временные ряды характеризуются нелинейностью, сезонной компонентой со смещением, периодическими компонентами с изменяющейся амплитудой, частотой, которые слабо разделимы с компонентой шума, что затрудняет их прогнозирование и оценку доверительного интервала.

В виду выделенных особенностей нестационарные временные ряды стоит рассматривать не только как

набор некоторых детерминированных компонент, но и как реализацию данных компонент в различных состояниях системы. В работе предлагается разработать информационную технологию для решения задачи прогнозирования нестационарных временных рядов, которые не приводятся к стационарным и характеризуются неоднородной структурой, с использованием метода сингулярного спектрального анализа. Целью данного исследования является построение модели прогнозирования сложных стохастических временных рядов с учетом нескольких фазовых пространств при отсутствии априорной информации о структуре ряда.

Реализация предложенного метода, построение модели временного ряда и оценка результатов выполнена с использованием языка программирования Я в среде R-studio.

3. Анализ литературных данных

Традиционные подходы к проблеме прогнозирования достаточно подробно изложены в научных трудах Айвазяна С. А., Андерсена Т., Бендита Дж., Бокса Дж., Беллинджера Д., Дженкинса Г., Кенделла М., Монтгомери Б., Пирсола А., Степанова В. С., Стюарта А., Уолкера Г. [1 - 3]. Наиболее известными пакетами прикладных программ, реализующими традиционные методы, модели и алгоритмы прогнозирования, являются: CSS, Deductor, Forecast Expert, Predictor, SAS, S-plus, SPSS, STATISTICA, STATGRAPHICS. Однако, эти пакеты не могут быть использованы для прогнозирования нестационарных временных рядов без предварительной обработки и подготовки данных, зачастую используют ансамбль методов для построения модели прогнозирования.

В работе рассматривается метод сингулярного спектрального анализа (SSA), который появился в 70-90-г.г. XX века и привлек внимание многих исследователей, как новая и эффективная техника анализа структуры временных рядов [4, 5]. Метод включает элементы классического анализа временных рядов, многомерного статистического анализа, многомерной геометрии, методы динамических систем и обработки сигналов. Области применения SSA: от математики и естественных наук до экономики и банковской сферы, от метеорологии и океанологии до социологии и исследования рынка. Основные этапы метода реализованы с помощью языка программирования R [6].

Метод прогнозирования с использованием сингулярного спектрального анализа в последние несколько лет привлек внимание множества исследователей из различных предметных областей [7 - 10]. Однако, в работах рассматриваются проблемы прогнозирования стационарных временных рядов или таковых, которые приводятся к стационарным. Таким образом вопрос построения модели прогнозирования нестационарных временных рядов является нерешенным.

4. Описание метода SSA

Отличительной особенностью и достоинством метода SSA является отсутствие требования априорно-

Е

го задания модели временного ряда, метод является адаптивным и не требует стационарности исходных данных. К преимуществам метода также можно отнести возможность выделения нелинейного тренда и работу с модулированными гармониками.

Основными шагами метода SSA являются:

- построение траекторной матрицы X с выбором глубины погружения или длины окна L, который также называют этапом вложения;

- сингулярное разложение матрицы ХХТ

X = Х1 + Х2 + + Ха,Х, = >/Хи;У;,

(1)

где Х1 > Х2 >... > Хл > 0 - упорядоченные ненулевые собственные числа матрицы ХХТ , {и;}|=: и еЭДЦ;

- выбор главных компонент на основании собственных векторов матрицы и их группировка;

- восстановление временного ряда путем усреднения матрицы X , построенной на основании выбранных главных компонент, по ее побочным диагоналям.

Подробно метод изложен в работе [11].

Входными параметрами метода являются временной ряд Y и глубина погружения L. Для определения фазового пространства временного ряда необходимо определить его размерность, которая определяется параметром L, представив его в виде пространства ортонормированных векторов. Вопрос определения размерности, при которой фазовое пространство наилучшим образом демонстрирует характеристики нестационарного временного ряда подробно рассматривается в [12].

Самым неформализуемым шагом метода SSA является шаг группировки. Вся информация о каждой из компонент Х; содержится в собственном числе X; а также в собственном и; и факторном V векторах, которые имеют определенную структуру в построенном фазовом пространстве временного ряда ^ Собственный и факторный вектора называют сингулярными векторами, а совокупность (^/Х~,и;,У;) - собственной тройкой, каждая из которых отражает величину дисперсии Х; в направлении и;. Поиск компонент для требуемой группировки, главным образом на основе анализа собственных троек, будем называют процедурой идентификации.

Для идентификации компоненты тренда нестационарного временного ряда в работе используется анализ автокорелляционных функций собственных векторов. Если характер автокорреляционной функции является монотонно убывающим, то гипотеза о компоненте тренда принимается, иначе отвергается.

Для идентификации периодических составляющих используется периодограммный метод, суть которого состоит в оценке спектральной плотности с применением преобразования Фурье. Проводится анализ пиков периодограмм собственных векторов, если два соседних собственных вектора имеют единственный пик на периодограмме, который соответствует одинаковой частоте, то гипотеза о периодической компоненте принимается, иначе отвергается.

В результате построения фазового пространства одномерного временного ряда Y и выделения детерминированных компонент на этапе восстановления получают модель временного ряда и его составляющих, что является важным этапом при прогнозиро-

вании нестационарных временных рядов. Метод SSA является робастным методом и может быть применен в качестве фильтра с настраиваемой пропускной способностью.

4. 1. Информационная технология прогнозирования

Прогнозирование временного ряда F возможно, если ряд имеет определенную структуру, выбран метод нахождения структуры временного ряда, с помощью которого ряд может быть продолжен, и спрогнозированы его значения, структура модели ряда сохраняется в период прогнозирования. Определить и обеспечить стабильность модели для прогнозируемых значений практически невозможно, так как возникают новые флуктуации, влияющие на поведение временного ряда, а также непредсказуемые интервенции. Наличие шумовой компоненты во временном ряду также влияет на прогнозируемые значения.

Для нестационарных временных рядов, которые характеризуются нелинейной динамикой и не приводятся к стационарным, применение классических методов прогнозирования является некорректным, так как нарушаются предпоссылки и предположения методов прогнозирования. Метод SSA не требует задания структуры модели ряда, в следствии этого особый интерес представляет использование данного метода для прогнозирования нестационарных временных рядов.

Рассмотрим наиболее распространённые структуры моделей нестационарных временных рядов. В модели “сигнал плюс шум” элемент представляется следующим образом:

(2)

то есть можно представить такой ряд, как детерминированный сигнал sT,...,sn_1, наблюдения которого проводятся с ошибкой £п . Сигнал в общем случае может быть представлен с помощью рекуррентной формулы S.

Для процессов авторегрессии (порядка р) полагают, что функция F имеет линейный вид и ^ зависит от р предыдущих значений, случайная шумовая составляющая имеет нулевое среднее и постоянную ковариацию. Таким образом, параметрами такого процесса, кроме ковариации, будут коэффициенты а1,...,ар функции F:

4 = а14п_1 + . + ар4п_р + £п .

(3)

Подход, подобный авторегрессионному, используется и в моделях “сигнал плюс шум” следующим образом: полагают, что сигнал ряда задается линейной рекуррентной формулой (ЛРФ):

(4)

Такая модель тоже имеет р неизвестных параметров а1,...,ар вдобавок к параметрам распределения шума. Наложим следующие стандартные ограничения на шум: £0,...,еп_1 независимы, одинаково распределены, Е(еп) = 0 и D(en) = о2. Для определения коэффициентов в рамках метода SSA необходимо выбрать пространство определенной размерности (эквивалентно выбору глубины погружения Ц) и идентифицировать

главные детерминированные компоненты временного ряда в данном пространстве.

При построении модели прогнозирования методом SSA предполагается, что временной ряд описывается с помощью линейных рекуррентных формул (ЛРФ), то есть является линейной комбинацией экспонент, полиномов и гармоник. Класс таких рядов достаточно широк. Доказано [13], что траекторное пространство порождает ЛРФ порядка L-1, если размерность данного пространства LхK. При нахождении фазового пространства временного ряда с определенной глубиной погружения L можно построить ЛРФ управляющую рядом в пределах данного пространства. Покажем, как с помощью главных собственных векторов можно найти авторегрессионные коэффициенты порядка р, используя известные результаты метода SSA о продолжении восстановленных компонент [13]. В методе SSA для определения коэффициентов модели прогнозирования используется формула:

a = Т-V £иьХ-1. (5)

1 - v j=1

2 2 2 и

где v = uL1 + uL2 +... + uLr является суммой квадратов последних элементов собственных векторов j = 1,2.r (вертикальные коэффициенты), а обозна-

чает (k -1 х 1) вектор с первыми L-1 элементами собственных векторов j = 1,2,__,r . Продолжение восста-

новленной компоненты ряда возможно если v2 < 1.

Представим обобщенную информационную технологию прогнозирования.

Входные данные:

- временной ряд Fn и/или его модель Fn ;

- сингулярное разложение траекторной матрицы временного ряда FN , построенное с фиксированной глубиной погружения L: S = V^UVT ;

- выбранные номера компонент (g eG), которые соответствуют детерминированному сигналу тренда или периодической компоненты и образуют базис главных компонент временного ряда;

- количество точек прогноза M.

Шаг 1. Построение линейной рекуррентной формулы (вектора) ЛРФ.

1. 1. Построение матрицы UG из собственных векторов детерминированного сигнала размером L х r (где r - размерность множества G)

1. 2. Нахождение вектора lpf = UG хUG , гдеи^ -последняя строка матрицы UG.

1.3. Получение коэффициентов ЛРФ lrr = (a1,...,aL-1) путем масштабирования (преобразования) вектора lpf :

1. 4.

lrr = lpfT/(1 - lpf,), (6)

где lpfn - последний элемент вектора

Шаг 2. Построение M точек прогноза, последовательно применяя одну из формул:

FN+1 = L FN+i-L х lrri , (7)

i=1

FN+1 = L FN+i-L х lrri . (8)

i=1

В первом варианте (7) для построения прогноза используется исходный временной ряд, во втором (8) -модель временного ряда.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В результате выполнения всех шагов предложенной информационной технологии строится линейная авторегрессионная модель прогнозирования, коэффициенты которой учитывают особенности нестационарного временного ряда ^ а также L-1 последних лагов исходного временного ряда или построенной ее модели с использованием метода SSA.

4. 2. Информационная технология построения фазовых портретов нестационарных временных рядов

Возникает несколько проблем прогнозирования временного ряда с использованием ЛРФ:

- стабильность и состоятельность выбранного фазового пространства;

- корреляция коэффициентов ЛРФ и значений временного ряда, что зачастую приводит к значительной ошибке прогноза;

- оценка точности прогнозируемых данных.

Для решения первой проблемы предлагается провести анализ различных фазовых пространств временного ряда F с использованием разной глубины погружения. При относительно небольшой величине параметра L более точно проводится идентификация тренда, при L^N/2 высокочастотные и низкочастотные части спектра хорошо разделяются. При выборе параметра глубины погружения с учетом сезонной составляющей необходимо выбрать величину L кратную периоду определенной сезонности. Для построения модели с высоким коэффициентом детерминации и определения недетерминированной случайной компоненты данный параметр выбирается минимальным из допустимых, т. е. L ^ 1. Последний подход используется при идентификации модели «сигнал+шум».

При построении нескольких фазовых пространств одномерного нестационарного временного ряда необходимо определить оптимальное их количество и размерности. Данная задача решается методом анализа суммарных коэффициентов корреляции независимых векторов траекторных матриц. Независимыми векторами назовем те, которые не пересекаются и взяты последовательно. Опишем информационную технологию выбора параметров глубины погружения в методе SSA для прогнозирования нестационарных временных рядов на основании нескольких фазовых пространств или портретов. Данная информационная технология реализована с помощью языка программирования Я, что позволяет использовать различные хранилища данных для импорта информации.

Шаг 1. Импорт данных из базы данных или в формате .csv, .хк, Ла^ ^а^ .txt.

Шаг 2. Предварительный анализ данных, восстановление пропущенных значений, подготовка вектора временного ряда для дальнейшего анализа.

Шаг 3. Построение множества N/2 траекторных матриц с использованием параметра L, L е[1^/2], где N - длина временного ряда.

Шаг 4. Вычисление среднего коэффициента корреляции независимых векторов траекторной матрицы Е(г1_), как математического ожидания степени линейной зависимости между соседними участками временного ряда одинаковой длины L .

Е

Шаг 5. Построение вектора V(E(rL)), из множества Е(^) , каждый элемент которого строго соответствует определенному пространству временного ряда при L £[^N/2].

Шаг 6. Определение индексов локальных минимумов вектора V(E(rL)), которые достигнуты при

1 = ^тштЕ(О)) .

Шаг 7. Построение нескольких фазовых пространств временного ряда при L = I с использованием главных детерминированных компонент данных пространств, полученных с помощью информационной технологии идентификации структуры временно ряда методом SSA.

В работе предлагается использовать К фазовых пространств, соответствующие L £^,...^К} и построенные ЛРФ, как продолжения временного ряда в разных базисах. Таким образом, адекватность модели прогнозирования может быть улучшена, так как учитывается несколько состояний системы в разных К базисах, порождаемых самим временным рядом. Данный подход повысит устойчивость прогноза и определит сбалансированное влияние ортонормированных векторов при различных состояниях системы, а также позволит учитывать разное количество последних лагов в соответствии с глубиной погружения, размерностью фазового пространства и главными компонентами временного ряда.

4. 3. Информационная технология прогнозирования нестационарных временных рядов с использованием нескольких фазовых пространств

В работе предлагается модифицировать модель прогнозирования временного ряда, используя выбранные К фазовых пространств временного ряда. При выборе параметра глубины погружения и построении матриц разных размерностей может наблюдаться приблизительно одинаковая слабая разделимость компонент ряда, что показывает средний коэффициент корреляции траекторных матриц. Для построения модели прогнозирования нестационарных временных рядов необходимо рассчитать К наборов коэффициентов ЛРФ, отражающих поведение главных компонент ряда в каждом выбранном фазовом пространстве, и задать весовые коэффициенты оценки разделимости в данном фазовом пространстве wk,k £[1;К]. Если ряд имеет приблизительную равную слабую разделимость во всех базисах, то коэффициенты могут быть равны, однако, необходимо выполнение следующих условий:

К

wk < 1 и ^wk = 1. Тогда для построения 1-й точки про-

к=1

гноза временного ряда FN используем модифицированную ЛРФ:

FN+l = 2>Д, (9)

1=1

Р;

К1=! FN+H),x 1гг (10)

]=1

где Р; - соответствует размерности 1-го фазового пространства, фактически является количеством коэффициентов ЛРФ в данном 1 -м пространстве;

1гг; - коэффициенты ЛРФ в 1 -м фазовом про-

странстве;

w1 - весовой коэффициент 1 -го фазового пространства.

Используя модифицированную формулу прогнозирования временного ряда можно получить несмещенную и устойчивую оценку прогнозируемого временного ряда.

Коэффициенты ЛРФ в 1 -м фазовом пространстве определяются по методу изложенному выше при описании информационной технологии прогнозирования в выбранном пространстве нестационарного временного ряда с определенным параметром L.

5. Экспериментальные данные и их обработка

В работе покажем реализацию информационной технологии идентификации структуры и прогнозирования нестационарного временного ряда в различных фазовых пространствах. Построение модели прогнозирования с использованием метода SSA и предложенной информационной технологии реализовано посредством языка программирования R-programming в среде R-studio.

В качестве входных данных используем временной ряд курсов валют EUR/USD с 2012-12-1 по 2013-12-9, обозначим его FN , график данных представлен на рис. 1.

Рис. 1. График временного ряда курсов валют EUR/USD

Для проверки ряда на стационарность применим тест KPSS к исходным данным, а также разностям первого и второго порядков, который является расширенным тестом Дикки-Фуллера. Результаты представлены в табл. 1.

Таблица 1

Результаты теста KPSS к исходным данным, а также разностям первого и второго порядков

Результат теста KPSS

KPSS Level = 2.8924, p-value = 0.01

Первая разность KPSS Level = 0.0673, p-value = 0.1

Вторая разность KPSS Level = 0.0718, p-value = 0.1

Результаты теста показывают, что ряд не является стационарным и не может быть приведен к таковому.

Были определены параметры фазовых пространств L= [36, 75, 91, 121, 181], в которых данный временной

ряд проявляет детерминированные свойства различного характера на разных его участках. В каждом фазовом пространстве ряд может быть кусочно аппроксимирован, а выделенные компоненты ряда показывают наиболее стабильные структуры данных, которые сохраняются в фазовых пространствах различной размерности.

Восстановим модели временного ряда с использованием разного параметра глубины погружения L. График восстановленных моделей ряда FN представлен на рис. 2.

зовых пространств в модели прогнозирования. Так как сумма весовых коэффициентов построенных ЛРФ должна равняться 1, то коэффициент каждого из фазовых пространств вычисляется на основании доли учтенной дисперсии в данном пространстве. Обозначим gri - индексы детерминированных собственных векторов в -м фазовом пространстве. Тогда:

ІХк/V

' І»' І V»

(її)

Рис. 2. График моделей временного ряда

FN , построенных с различным параметром глубины погружения L

Построенные модели описывают временной ряд, однако, с различной степенью «сглаживания». Безусловно, наблюдаются общие компоненты, например, компонента возрастающего тренда и некоторые выделенные периодики.

Так как временной ряд является нестационарным, что говорит о высокой степени изменчивости различного характера, можно утверждать, что все компоненты при различной величине погружения могут повлиять на продолжение ряда. В модели прогнозирования предлагается учитывать все выделенные на этапе сингулярного разложения главные компоненты в различных пространствах. Базисы всех выделенных фазовых пространств, которыми являются собственные вектора каждого из сингулярных разложений, являются основой аддитивной модели прогнозирования. Построенные фазовые пространства будут расширены, что представит продолжение нестационарного временного ряда в его различных состояниях.

Таким образом, влияние тех главные детерминированных компонент, которые дублируются в нескольких фазовых пространствах, будет усилено, а компоненты, выделенные ошибочно, будут элиминированы.

Рассмотрим алгоритм построения модели прогнозирования с технической точки зрения, используем информационную технологию построения прогноза временного ряда на основе ЛРФ и метода SSA в определенном базисе (траекторном пространстве) ряда F и модель прогнозирования, согласно формулам 5, 6, 9, 10, рассмотренные ранее.

Остановимся подробнее на методе определения весовых коэффициентов каждого из выбранных фа-

где X' - значения собственных чисел і -го сингулярного разложения, что соответствует і -му собственному пространству;

Х^. - значения собственных чисел соответствующих главным детерминированным собственным векторам і -го сингулярного разложения;

К - количество учитываемых фазовых пространств,

Построим модель прогнозирования с использованием 5-ти выделенных фазовых пространств, ЛРФ и SSA (формулы [9, 10]) и полученные коэффициенты (12). Длина исследуемого временного ряда равна N=374.

36

^N+1 = °.201426І Р374+^36 X Ц +

І=1

+°.20°675І Рз74+І_75 X ІГГ, +

І=1

91

+°.1993201І Рз74+]_91 х ІГГ, +

(12)

И

121

+°.19943°9І Рз74+Н21 х ІГГ, +

І=1

181

+°.199148І Рз74+,і_181 Х ІГГ5).

І=1

Модель(12) описывает временной ряд FN с помощью ЛРФ с использованием различной величины глубины погружения. Расчет прогноза проводится последовательно на 1 лаг.

График прогноза нестационарного временного ряда курсов валют на 7 лагов представлен на рис. 3

Рис. 3. Модель прогнозирования нестационарного временного ряда курсов валют на 7 лагов

Е

Для построения модели прогнозирования нестационарного временного ряда курсов валют были использованы пять фазовых пространств, что позволило определить и учесть его наиболее стабильные компоненты.

6. Выводы

В работе предложена информационная технология прогнозирования нестационарных временных рядов, которые не могут быть приведены к стационарным. Идентификация структуры временного ряда проводится с и применением метода SSA, так как данный метод не требует априорной информации о характере ряда. Для построения модели прогнозирования предложено использовать нескольких фазовых пространств исходных данных, что позволяет учитывать поведение компонент временного ряда в различных состояниях системы. Построение фазовых пространств проводится путем представления одномерного временного ряда в новом ортогональном базисе, оси которого ориентированы по направлени-

ям максимальной дисперсии набора входных данных. При изменении параметра глубины погружения в методе SSA временной ряд может быть представлен в различных базисах, в каждом из которых такие компоненты, как тренд и периодическая составляющая имеют разный характер.

Предполагается, что временной ряд описывается набором линейных рекуррентных формул, коэффициенты каждой из которых определены в некотором фазовом пространстве. При идентификации и использовании детерминированных компонент временного ряда, в нескольких базисах можно выделить наиболее перманентные и устойчивые, что влияет на качество прогноза. Построенная модель прогнозирования учитывает различную глубину погружения и весовые коэффициенты каждого из построенных фазовых портретов нестационарного временного ряда, что позволяет получить адекватные оценки прогноза.

Реализация предложенной информационной технологии проведена на языке программирования Я и может быть использована с целью построения краткосрочного прогноза для нестационарных временных рядов.

Литература

1. Айвазян, С. А. Прикладная статистика и основы эконометрики [Текст] / С. А. Айвазян, В. С. Мхитарян. - М.: ЮНИТИ, 1998. - 1006 с.

2. Box, G. E. P. Time Series Analysis: Forecasting and Control [Text] : 4rd ed / G. E. P. Box, G. M. Jenkins, G. C. Reinsel. - US: John Wiley & Sons, 2008.

3. Kendall, M. Design and analysis, and time series, the advanced theory of statistics [Text] ; 3rd ed./ M. Kendall, A. Stuart // London: Charles Griffin. - 1976. - Vol. 3.

4. Данилов, Д. Л. Главные компоненты временных рядов: Метод “Гусеница” [Текст] / Д. Л. Данилов, А. А. Жиглявский. -СПб.: Изд. дом “ПРЕССКОМ”, 1997. — 307 с.

5. Vautard, R. Singular-Spectrum Analysis: a toolkit for short, noisy chaotic signals [Text] / R. Vautard, P. Yiou, M. Ghil // Physica

D. - 1992. - №58. - P. 95-126.

6. Golyandina, N. Basic Singular Spectrum Analysis and forecasting with R [Text] / N. Golyandina, A. Korobejnikov // Computational Statistics & Data Analysis. - 2014. - № 71. - P. 934-954.

7. Nekrutkin, V. Perturbation expansions of signal subspaces for long signals [Text] / V. Nekrutkin // Statistics and Its Interface. -2010. - №3. - P. 297-319.

8. Hassani, H. Singular Spectrum Analysis: Methodology and Application to Economics Data [Text] / H. Hassani, A. Zhigljavsky // Journal of System Science and Complexity. - 2009. - № 22(3). - P. 372-394.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Briceno, H. Singular Spectrum Analysis for Forecasting of Electric Load Demand [Text] / H. Briceno, C. M. Roccoa, E. Zio / / Chemical endineering transactions. - 2013. - № 33. - P. 919-924.

10. Pepelyshev, A. Assessing the stability of long-horizon SSA forecasting [Text] / A. Pepelyshev, A. Zhiglyavsky // Statistics and Its Interface. - 2010. - №3. - P. 321-327.

11. Чистякова, А. А. Идентификация структуры нестационарного временного ряда при помощи метода сингулярного спектрального анализа [Текст] / А. А. Чистякова, Б. В. Шамша // Радиоэлектронные и компьютерные системы. - 2011. -№ 4(52). - С. 105-111.

12. Чистякова, А. А. Оценка глубины погружения в методе SSA при моделировании нелинейных временных рядов [Текст] / А. А. Чистякова, Б. В. Шамша // Вестник развития науки и образования. - 2013. - № 4. - С. 59-68.

13. Голяндина, Н. Э. Метод «Гусеница^-SSA: прогноз временных рядов [Текст] : уч. пос. / Н. Э. Голяндина. - СПб., 2004. - 52 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.