Научная статья на тему 'О прогнозирование временного ряда c помощью нейронных сетей'

О прогнозирование временного ряда c помощью нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
449
75
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННОЙ РЯД / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / НЕЙРОННАЯ СЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Василькин Николай Викторович, Мамедова Татьяна Фанадовна

В статье решается задача о прогнозировании временного ряда. Рассматривается пример энергопотребления. Для примера проводится анализ модели экстраполяции временных рядов по выборке максимального подобия с помощью применения нейронных сетей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Василькин Николай Викторович, Мамедова Татьяна Фанадовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article solves the problem of time series forecasting. The case of energy consumption is considered. The article presents an analysis of the model of time series extrapolation on a maximum similarity sampling by using of neural networks.

Текст научной работы на тему «О прогнозирование временного ряда c помощью нейронных сетей»

ВАСИЛЬКИН Н. В., МАМЕДОВА Т.Ф.

О ПРОГНОЗИРОВАНИЕ ВРЕМЕННОГО РЯДА С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ

Аннотация. В статье решается задача о прогнозировании временного ряда. Рассматривается пример энергопотребления. Для примера проводится анализ модели экстраполяции временных рядов по выборке максимального подобия с помощью применения нейронных сетей.

Ключевые слова: нейронная сеть, временной ряд, математическая модель.

VASILKIN N. V., MAMEDOVA T. F.

ON TIME SERIES PREDICTION WITH NEURAL NETWORKS

Abstract. The article solves the problem of time series forecasting. The case of energy consumption is considered. The article presents an analysis of the model of time series extrapolation on a maximum similarity sampling by using of neural networks.

Keywords: neural networks, time series, mathematical model.

В настоящее время задача анализа временных является актуальной темой для большого количества практических исследователей. От выбора метода анализа временных данных существенно зависит скорость расчётов и точность полученных прогнозов. На текущий момент разработано множество моделей прогнозирования временных рядов [1- 9]. С целью повышения точности результатов прогнозирования и увеличение скорости обработки данных временного ряда, наиболее перспективным является создание комбинированных моделей, в которых первоначально выполняется кластеризация, а затем производиться прогнозирование временного ряда для нужного кластера.

Рассмотрим временной ряд вида: Z (t) — Z (1), Z (2),...,Z (t).

Предположим, что последовательность значений, Zf — Z(t),Z(t + 1),...,Z(t+M+1), представляет собой выборку длины M с момента начала отсчета t; M е {1,2,..., T}, t е {l,2,..., T -M +1}. Тогда выборкой будет является фрагмент временного ряда, имеющий точку начала отсчета и длину. Обозначим через временную задержку k Zf — Z(t),...Z(t +M-1)и Zf_k — Z(t-k),...Z(t-к +M-1),где к е{1,2,..., t-1} - две выборки одинаковой длины, принадлежащие одному временному ряду.

Тогда справедлива формула

Zf — а^_к +а0 Iм + EM. (1)

или

!у М _ ГуЫ тМ

= а1^г-к + а01 •

где ах и а0 - некоторые коэффициенты.

Для зависимости (1) функция ошибки аппроксимации Б^1 для выборок Z1М и ZМk с

задержкой к будет имеет вид

М-1

БМ (а ) = X ^ (г+О -а z (г - к+о -а)2 •

(3)

(=0

Необходимо подобрать такие значения а и а0, чтобы при подстановке в (3) было получено минимально возможное значение Б^1 (а ,а0). Решение находится методом наименьших квадратов.

Рассмотрим временной ряд Z(t) и некоторую выборку ZМ, принадлежащую данному

временному ряду. Определим все значения Б^1(а ,а0) для к е {1,2.....г-1}, м=сопб1. Затем

найдем минимальное

¿Гтт = тп(БМ, ^ЛМ.). (4)

Определим множество значений модуля линейной корреляции при к е {1,2,..., г-1}, M=const по формуле:

м

Рк =

Р&М, zм)

X ^ (г+0 - z )(z (г+1) - z)

г=1

(5)

II

[0,1].

X & (г+0 - z )2 X (Z (г+0 - z )2

г=1

г=1

Тогда справедливо:

М / М М М ч

Рк тах = тахр1 , Р2 ,... р ). (6)

Очевидно, что задержка ктт из (4) и задержка ктахиз (6) будут совпадать между

собой, т.е. ктт = ктах. Полученную задержку, соответствующую минимуму ошибки

регрессии ¡пи максимуму модуля корреляции рМахобозначим ктах. Назовем выборку

ZíMtmax выборкой максимального подобия. Выборка максимального подобия Zм_k тахявляется

2

выборкой, которая при подстановке в уравнение (2) дает в результате значения выборки , которая максимально точно описывает исходную выборку .

Чтобы определить значения прогнозной выборки , учитывая влияние внешних факторов, представленных в виде временных рядов Х1(г),..., Х8(г), был разработан алгоритм, аналогичный предыдущему случаю. Выразим прогнозную выборку исходного временного ряда , и выборки Хр1)Г+х,...,Хр3)Г+следующим образом

¿г+1 = а8+12т + а8Х(8)]+1 +...+ а1Х(1)Т+1 + а01 . (10)

Алгоритм.

1. Определяется выборка максимального подобия для выборки новой истории.

2.. Вычисляется выборка .

3. Вычислим выборку ¿Р+1. Экстраполяция значения выборки определяем по формуле

¿Т+1 = а^Х* + а8Х? )Т+1 +...+ахХРш+1 + «01Р. = ЕЫМ&ХМ),

Средняя абсолютная ошибка дает точность аппроксимации и экстраполяции временных рядов

-1 (г) - 2 (г)

1 г+м -

МАРЕ=— У

Л/Г

М ^ 2 (г)

(12) 100%.

На текущий момент явно определена проблема быстрого и точного нахождения коэффициентов линейной корреляции, близкого единице. Данную проблему можно решать, основываясь на комбинированной модели с помощью многослойной нейронной сети с алгоритмом обучения, основанным на принципе обратного распространения ошибки

Найдем коэффициенты линейной корреляции при помощи модели нейронной сети. Пусть каждый нейрон сети имеет нелинейную функцию активации:

1 (13)

Уг =

1 + ехр(-у. У

где V . - индуцированное локальное поле; уг - выход нейрона.

Пусть сеть содержит несколько слоев скрытых нейронов, не являющихся частью

входа или выхода сети, которые позволяют сети обучаться решению сложных задач.

Алгоритм обратного распространения ошибки заключается в следующем:

3

1. Сигнал ошибки выходного нейрона j на итерации п (соответствующей п-му примеру обучения) определяется выражением

е, (п) = (п)-у] (п). (14)

2. Энергия среднеквадратичной ошибки вычисляется как нормализованная по N сумма всех значений энергии ошибки Е(п)

Е(п) = 1 ХЕ(п). (15)

п=1

3. Индуцированное локальное поле у (п) , равно

т

у , (п) = Х(п)У! (п)'

¡=0

(16)

где т-общее число входов.

4. Функциональный сигнал у . (п) на выходе нейрона j на итерации п:

у, (п) = р, (у, (п)). (17)

Алгоритм обратного распространения состоит в применении к синаптическому весу (п) коррекции Д^ (п), пропорциональной частной производной дЕ(п)/ дм^ (п).

Градиент можно представить следующим образом:

дЕ(п) _ дЕ(п) де, (п) ду, (п) ду, (п) (18)

ды^ (п) деj(п) ду (п) ду (п) дwj(п)

Построив по описанному методу модель нейронной сети, появляется возможность быстрого нахождения выборки максимального подобия и нахождения значения линейной корреляции Пирсона.

Таблица 1

Прогнозные значения энергопотребления на территории населенного пункта

по состоянию на 24 апреля 2013 года

№ Дата (24.03.2014), ч. Значения ряда, МВт/ч. Прогнозные значения ряда МВт • ч. MAE (MAPE) МВт • ч., (%)

1 1:00 1,013 1,023 (0,94)

2 2:00 1,075 1,086 (1,03)

3 3:00 1,192 1,203 (0,98)

4 4:00 1,308 1,325 (1,32)

5 5:00 1,416 1,436 (1,45)

6 6:00 1,478 1,494 (1,14)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 7:00 1,489 1,512 (1,57)

8 8:00 1,512 1,539 (1,83)

9 9:00 1,460 1,484 (1,67)

10 10:00 1,473 1,486 (0,95)

11 11:00 1,436 1,459 (1,66)

12 12:00 1,437 1,456 (1,37)

13 13:00 1,417 1,429 (0,91)

14 14:00 1,389 1,410 (1,55)

15 15:00 1,382 1,398 (1,22)

16 16:00 1,307 1,324 (1,34)

17 17:00 1,338 1,358 (1,56)

18 18:00 1,472 1,498 (1,77)

19 19:00 1,391 1,405 (1,05)

20 20:00 1,241 1,258 (1,43)

21 21:00 1,093 1,108 (1,45)

22 22:00 1,024 1,036 (1,22)

23 23:00 1,000 1,012 (1,27)

24 0:00 1,013 1,031 (1,83)

С помощью созданного СПО на основе заданной комбинированной модели получены результаты прогноза для временного ряда энергопотребления. Полученные результаты внесены в таблицу 1.

ЛИТЕРАТУРА

1. Draper N. Applied regression analysis. - New York: Wiley, In press, 1981. - 693 p.

2. Gheyas I. A. A Neural Network Approach to Time Series Forecasting // Proceedings of the World Congress on Engineering. - London, 2009. - pp. 1292-1296.

3. Mazengia D. H. Forecasting Spot Electricity Market Prices Using Time Series Models: Thesis for the Degree of Master of Science in Electric Power Engineering. - Gothenburg: Chalmers University of Technology, 2008. - 89 p.

4. Morariu N., Iancu E., Vlad S. A. A neural network model for time series forecasting // Romanian Journal of Economic Forecasting. - 2009. - No. 4. - pp. 213-223.

5. Norizan M. Short Term Load Forecasting Using Double Seasonal ARIMA Model // Regional Conference on Statistical Sciences. - Malaysia, Kelantan, 2010. - pp. 57-73.

6. Prajakta S. K. Time series Forecasting using Holt-Winters Exponential Smoothing // Kanwal Rekhi School of Information Technology Journal. - Boston, 2004. - pp. 1-13.

7. Бокс Дж., Дженкинс Г. М. Анализ временных рядов, прогноз и управление. - М.: Мир, 1974. - 406 с.

8. Хайкин С. Нейронные сети: полный курс. - М.: Вильямс, 2006. - 1104 с.

9. Чучуева И. А. Модель прогнозирования временных рядов по выборке максимального подобия: автореф. дис. ... канд. техн. наук. - Москва, 2012. - 16 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.