Научная статья на тему 'Алгоритм интервального прогнозирования динамических показателей на основе робастной вероятностной кластерной модели'

Алгоритм интервального прогнозирования динамических показателей на основе робастной вероятностной кластерной модели Текст научной статьи по специальности «Математика»

CC BY
77
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕРВАЛЬНОЕ ПРОГНОЗИРОВАНИЕ / РОБАСТНАЯ ВЕРОЯТНОСТНАЯ КЛАСТЕРНАЯ МОДЕЛЬ / ДИНАМИЧЕСКИЕ ПОКАЗАТЕЛИ / ПОДОБИЕ КЛАСТЕРОВ

Аннотация научной статьи по математике, автор научной работы — Краковский Ю. М., Лузгин А. Н.

Предложен алгоритм интервального прогнозирования, основанный на робастной вероятностной кластерной модели. Интервальное прогнозирование заключается в оценке прогнозных значений динамического показателя на основе вероятностей их принадлежности введённым интервалам. Динамические показатели в работе формализуются в виде временных рядов. Принимая во внимание, что при интервальном прогнозировании оценивается не само будущее значение показателя, а то, в каком интервале оно будет находиться, такое прогнозирование названо интервальным, а соответствующие вероятности интервальными. В качестве общедоступного примера динамического показателя для тестирования предлагаемого алгоритма интервального прогнозирования использовались данные по среднесуточной солнечной радиации. Эти данные были получены из открытого научного интернет-проекта «Solar Energy Services for Professionals». Для реализации предлагаемого алгоритма интервального прогнозирования использовался язык «R». Результаты испытаний подтвердили состоятельность и возможность практического применения алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Краковский Ю. М., Лузгин А. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритм интервального прогнозирования динамических показателей на основе робастной вероятностной кластерной модели»

Наука и Образование

МГТУ им. Н.Э. Баумана

Наука и Образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2016. № 11. С. 113-126.

JSSN 19&4-Ü4Ü(1

DOI: 10.7463/1116.0849839

Представлена в редакцию: Исправлена:

© МГТУ им. Н.Э. Баумана

17.10.2016 31.10.2016

УДК 519.688

Алгоритм интервального прогнозирования динамических показателей на основе робастной вероятностной кластерной модели

Краковский Ю. М.1, Лузгин А. Н.

2,*

1 Иркутский государственный университет путей сообщения, Иркутск, Россия 2Администрация города Иркутска, Иркутск, Россия

Предложен алгоритм интервального прогнозирования, основанный на робастной вероятностной кластерной модели. Интервальное прогнозирование заключается в оценке прогнозных значений динамического показателя на основе вероятностей их принадлежности введённым интервалам. Динамические показатели в работе формализуются в виде временных рядов. Принимая во внимание, что при интервальном прогнозировании оценивается не само будущее значение показателя, а то, в каком интервале оно будет находиться, такое прогнозирование названо интервальным, а соответствующие вероятности интервальными. В качестве общедоступного примера динамического показателя для тестирования предлагаемого алгоритма интервального прогнозирования использовались данные по среднесуточной солнечной радиации. Эти данные были получены из открытого научного интернет-проекта «Solar Energy Services for Professionals». Для реализации предлагаемого алгоритма интервального прогнозирования использовался язык «R». Результаты испытаний подтвердили состоятельность и возможность практического применения алгоритма.

Ключевые слова: интервальное прогнозирование, робастная вероятностная кластерная модель, динамические показатели, подобие кластеров

Введение

Большинство современных организаций и предприятий осуществляет свою деятельность в условиях неопределённости, где принятие эффективных решений по управлению производственными, технологическими и финансовыми процессами напрямую зависит от точности прогнозирования базовых динамических показателей, являющихся по своей природе случайными величинами. Именно для таких показателей разработка новых и совершенствование существующих методов прогнозирования является актуальным исследовательским направлением [1-4].

Существует множество распространённых методов и математических моделей прогнозирования динамических показателей. К наиболее перспективным методам прогнозирования таких показателей следует отнести кластерные и нейронные методы [5-14].

Особенностью прогнозирования в процессе принятия управленческих решений является отсутствие постоянной необходимости знать фактическое будущее значение показателя. Часто достаточно знать превысит оно или нет некоторое заранее заданное пороговое значение [2,14]. Так как при таком прогнозировании оценивается не само будущее значение показателя, а то, в каком интервале оно будет находиться, такое прогнозирование было предложено называть интервальным [14].

В данной работе авторами предлагается алгоритм интервального прогнозирования (ИП) динамических показателей на основе робастной вероятностной кластерной модели (ВКМ). ИП динамических показателей заключается в определении принадлежности их будущих значений заранее введённым интервалам на основе оценок вероятностей.

Формализуем понятие показателя в виде временного ряда:

О = е т}. (1)

Здесь qt - значения прогнозируемого показателя, доступные в дискретные моменты времени t, t принимает значения из множества Т = {0,...,п -1}, п - количество доступных значений.

Введем интервал возможных значений показателя (с; с2) и внутреннюю точку с : С < с < с. Это позволяет создать два интервала:

!1= С; с], 1Т = (с; с2). (2)

Значение внутренней точки для введённых интервалов (2) предлагается вычислять

так:

(п-1 Л

с = qn-lА = «- -qt-l\ I/(п-1) (3)

V t=1 )

где а е [-1;1] - коэффициент, который задается заранее.

При ИП в момент времени t = п -1 необходимо провести оценку вероятности р+ того, что будущее значение qt+р > с или оценку вероятности р~+ р того, что будущее значение qt+ < с, где р = 1,...,г есть время упреждения, а р++ р + р-+ р = 1. Прогнозирование

т

проводится по правилу: будущее значение qí+í е I , если р+ > р~+ ; будущее значение

е , если р-+р < р++р; если оценки вероятностей р+ = р- (ситуация неопределённости), то прогнозирование не делается.

Расчет оценок вероятностей р]+ р и р-р осуществляется так:

~ + , N * о, ~ - Ы;/N, N * о,

р [0.5, N = о, р+р |о.5, N = о, где р - оценка вероятности для р~++ р, р-р - оценка вероятности для р+р, N - количество оценок будущего значения ^ превышающих с , а - количество оценок будущего значения ^ равных, либо не превышающих с , N = N + N .

Оценки будущего значения ^ проводятся на основе подобных кластеров. Проверка подобия кластеров проводится согласно изложенному далее алгоритму.

1. Параметрический алгоритм проверки подобия кластеров

В настоящее время известны различные методы проверки кластерного подобия или методы оценок их «близости», большинство из которых изложены в работах [15-18]. В данной работе предлагается проводить проверку кластерного подобия на основе коэффициента «линейного сопряжения», который определяет «степень» линейной взаимосвязи между значениями кластеров и основан на коэффициенте линейной корреляции Пирсона

[19].

Под кластером = qi+/_1} будем понимать выборку последовательных значений из О = е т} с позиции i е Т и с количеством значений / = 1,...,п, так чтобы (1 + / -1) е Т .

Выберем из О = ^^ е Т} два произвольного кластера и .

Алгоритм проверки подобия кластеров и (назовем его A-1) состоит из следующих этапов:

Если кластеры содержат одинаковое количество значений (/ = g ), то переходим к этапу 2; иначе кластеры не подобны;

Если значение коэффициента линейного сопряжения ^ к > , где та е [0;1] - допустимое значение (это значение задаётся заранее), кластеры подобны; иначе кластеры не подобны.

Коэффициент линейного сопряжения предложено определять так:

д а, д 1к * °

1, д 1 =д к, д а = 0, 0, д1 *д ^ да = 0, /-1 /-1 g-l

=/ • Е qi+« ■ qk+«- Е • Е qk+?,

?=0 ^=0 ^=0

д=

{ /-1 / 2

д к =

?=0 g-1

/ •Е qU - Е

V^=0 ) )

g • Е qk2+f- Е qk+?

(5)

Ч ?=0 V^=0

д г,к = л/д 1 -дк.

Здесь qi+^ - значения кластера , qk+^ - значения кластера . Значения величин Зг или дк в (5) равны нулю только в том случае, если все значения соответствующего кластера или равны между собой, о < г,к < 1.

Способ расчета и название коэффициента предложено авторами данной статьи. Фактически значение коэффициента «линейного сопряжения» можно интерпретировать как численную «меру» подобия или «близости» двух кластеров. Допустимое значение такой «меры» определяется через параметр ^ .

2. Проведение робастных оценок будущего значения показателя на

основе подобных кластеров

Выделим из О = е Т} кластер = f-х} при / = п - / и назовем его базо-

вым кластером, где / е [1;п].

Предположим, что в О = ^^ е Т} найден кластер Ок = ^к,...^к+ -1}, подобный базовому кластеру , для которого выполняется условие к < п - g - р.

Так как между значениями кластеров и существует некоторая линейная взаимосвязь, можно аппроксимировать значения базового кластера посредством значений кластера следующим образом:

к ■ qkн +Кк, о < £ < / -1. (6)

Здесь qk+^ - значения кластера , ^ - аппроксимированные значения базового кластера , ~к, Ьик - коэффициенты выражения (6).

Наиболее часто определение коэффициентов выражения (6) проводят методом наименьших квадратов, который имеет свои преимущества и недостатки. Следует, однако, отметить, что для многих реальных динамических показателей метод наименьших квадратов неприемлем, так как большинство необходимых для него требований нарушается, при этом в исходных данных присутствуют выбросы, встречаются нелинейные взаимосвязи, наблюдается гетероскедастичность и т.п. [20].

По этим причинам для определения коэффициентов выражения (6) выбран непараметрический робастный метод Тейла-Сена [21-23]. При этом данный метод был незначительно модифицирован на тот случай, когда значения базового кластера или значения подобного ему кластера равны между собой.

Введём формулы расчета следующих величин:

а1+4,к+т '

(Ч+4- ч+4 чк +т Чк+4 * Чк+r, дк * 0,

1 д1 =дк, д1,к=а [0, д *дк, д1,к = 0, ()

Ъ1+4, к+4 = Ч1 +4 - а1,к • Чк+4.

Здесь Чк+4 - значения кластера , 4+4 - значения базового кластера , величины д i к, д , дк определяются из выражения (5), 0 <4 <т < / -1.

Рассчитав множество всех значений а^ к+т и Ъг+^^, коэффициенты выражения (6) находятся так:

а1к = Мей (~+4,к+т} Ъ1, к = Мг^ (Ъ1+4Л+4 ) (8)

Здесь Мей() - медиана по множеству значений, значения а^ к+т и Ъ+4,к+г рассчитываются по формуле (7).

Когда все значения базового кластера равны между собой и значения подобного ему кластера равны между собой, в этом случае величины а^ к+т = 1 и, следовательно, а1к = 1 . Если равны между собой только значения кластера или кластера , то г- = 0 и, следовательно, = 0. В этом состоит модификация метода Тейла-Сена.

Рассчитав значения (~1к и Ъi к, найдем оценку ~1+ / 1+ _ будущего (неизвестного) значения р :

~1+/-1+р = ~1, к • Чк+/-1+р + к. (9)

Напомним, что 1 = п - /, а момент прогнозирования t = п -1. Тогда t = 1 + / -1 и (9) можно переписать в виде:

~+р = к • Чк+/-1+р + к. (10)

Получив множество оценок (10) будущего значения показателя ч для всех

кластеров, подобных базовому, определяются значения и и осуществляется расчет оценок вероятностей по формуле (4).

3. Алгоритм интервального прогнозирования на основе робастной вероятностной кластерной модели

Итоговый алгоритм ИП на время упреждения р на основе ВКМ содержит следующие этапы:

1) Подготовка исходных данных: О = е Т}, задание ^ , а , р , / ;

2) Подготовка вспомогательных данных: расчет с (3);

3) Определение базового кластера = /-1};

4) Выбор начальных значений k = 0, Nt = 0, Nt = 0;

5) Определение из Q = {qt:í е т} кластера Qg ( g = f ) и проверка его подобия по алгоритму (А-1);

6) Если кластеры подобны, то проводим оценку коэффициентов aik и bik (8). Если qt+р > c, то N+ = N+ +1, если qt+р < c, то N- = N- +1.

7) Если k < n - f - p , то k = k + 1 и возвращаемся на этап 5; иначе этап 8;

8) Оценка вероятностей , ~+р (4);

9) Проведение прогноза:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а) будущее значение qt+p е 1т, если ~+р > р;

б) будущее значение qt+p е I1, если ~+р < р;

в) прогноз не делается, если ~+р = ~+р .

Таким образом, ВКМ имеет четыре параметра: f - количество значений в кластере, а - коэффициент, влияющий на значение внутренней точки интервала, р - время упреждения, rd - допустимое значение коэффициента «линейного сопряжения».

4. Проверка точности интервального прогнозирования

В качестве общедоступного примера динамического показателя были выбраны данные по среднесуточной радиации от солнца (NASA-SSE, Вт/м ), полученные из проекта «Solar Energy Services for Professionals» [24]. Этот ресурс предоставляет временные ряды по средней суточной солнечной радиации с 1.07.1983 г. по 30.06.2005 г. Количество ретроспективных значений в исходной выборке показателя n = 8036. Для проведения экспериментов данная выборка была сокращена до n = 2500 (т.е. использовалось только 2500 последних значений исходной выборки).

На рисунке 1 приведен пример последних 500 значений выбранного показателя.

Рис.1. График ретроспективных значений выбранного показателя

Проверка точности ИП проводилась для w последних значений ряда (1), при w = 250. При этом предыдущие значения временного ряда в объеме равном n — j, j = w,...,1 использовались для вычисления точечных оценок вероятностей (4).

Для оценки результатов тестирования РКМ были использованы следующие показатели:

PL = L x100/(L+M) (11)

Здесь PL - процент оправдавшихся прогнозов, L - число оправдавшихся прогнозов; M - число ошибочных прогнозов;

PPS = PS x100/(L+M + PS) (12)

Здесь PPS - процент случаев, когда прогноз не делался; PS - число случаев, когда прогноз не делался.

Чем выше процент оправдавшихся прогнозов PL, тем адекватнее модель и точнее ИП. Если PL < 50 модель нужно признать неадекватной. Вместе с тем желательно, чтобы показатель PPS ^ 0.

Приемлемой точностью ИП будем считать PL > 60.

Для программной реализации всех алгоритмов был выбран свободно распространяемый язык программирования для статистической обработки данных «R» [25].

В таблице 1 приведены результаты тестирования ВКМ при заданных значениях параметров: rd = 0.9, а = 0, p = 1; значение параметра f варьировалось.

Таблица 1. Результаты тестирования ВКМ при заданных значениях параметров алгоритма

f 2 3 4 5 6

PL (%) 64.0 64.8 68.8 67.9 67.6.

PPS (%) 0.0 0.0 0.0 1.6 2.4

Из этой таблицы видно, что во всех случаях получена приемлемая точность ИП. Наилучшая точность ИП обеспечивается при числе элементов в кластере f = 4. При этом PPS = 0.0%. При больших значениях f точность ИП ухудшалась, одновременно возрастало значение показателя PPS . Поэтому значение f = 4 было выбрано для дальнейших экспериментов.

В таблице 2 приведены результаты тестирования ВКМ при заданных значениях параметров: f = 4, а = 0, p = 1; значение параметра rd варьировалось.

Таблица 2. Результаты тестирования ВКМ при заданных значениях параметров алгоритма

rd 0.70 0.75 0.80 0.85 0.90 0.95

PL (%) 69.2 68.8 68.8 69.6 68.8 68.8

PPS (%) 0.0 0.0 8.8 0.0 0.0 1.2

Из этой таблицы видно, что во всех случаях получена приемлемая точность ИП. Наилучшая точность ИП обеспечивается при rd = 0.85. При этом PPS = 0.0%. Для дальнейших экспериментов было выбрано значение rd = 0.85.

В таблице 3 приведены результаты тестирования ВКМ при заданных значениях параметров: f = 4, а = 0, rd = 0.85; значение параметра p варьировалось.

Таблица 3. Результаты тестирования ВКМ при заданных значениях параметров алгоритма

p 1 2 3 4 5 6 7

PL (%) 69.6 70.8 72.0 68.4 69.6 66.8 64.4

PPS (%) 0.0 0.0 0.0 0.0 0.0 0.0 0.0

Из этой таблицы видно, что во всех случаях получена приемлемая точность ИП.

Заключение

1) Предложенный алгоритм интервального прогнозирования на основе робастной вероятностной кластерной модели подтвердил свою состоятельность и возможность практического применения.

2) При различных значениях параметров алгоритма для выбранного показателя точность интервального прогнозирования оставалась приемлемой.

3) В дальнейшем целесообразно провести проверку точности интервального прогнозирования для показателей с другими статистическими свойствами.

Список литературы

1. Чучуева И.А., Павлов Ю.Н. Экстраполяция псевдослучайных процессов по максимуму подобия // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2009. №7. Режим доступа: http://technomag.neicon.ru/doc/129712.html (дата обращения 17.11.2016).

2. Краковский Ю.М., Лузгин А.Н. Оценка прогнозируемости динамических показателей на основе коэффициента ранговой корреляции // Наука и образование. МГТУ им.

Н.Э. Баумана. Электрон. журн. 2016. №9. Режим доступа: http://technomag.neicon.ru/doc/845015.html (дата обращения 17.11.2016). DOI: 10.7463/0916.0845015

3. Shumway R.H., Stoffer D.S. Time Series Analysis and Its Applications. With R Examples. Third edition. Springer Science+Business Media LLC, 2011. DOI: 10.1007/978-1-4419-7865-3

4. Gooijer J.G., Hyndman R.J. 25 years of time series forecasting. International Journal of Forecasting, 2006, vol. 22, issue 3, pp. 443-473. DOI: 10.1016/j.ijforecast.2006.01.001

5. Mitrea C. A., Lee K. M., Wu Z. A Comparison between Neural Networks and Traditional Forecastin. International Journal of Engineering Business Management, 2009. vol. 1, no. 2, pp. 19-24. DOI: 10.5772/677777

6. Gosasang V., Chandraprakaikul W., Kiattisin S. A Comparison of Traditional and Neural Networks Forecasting Techniques for Container Throughput at Bangkok Port. The Asian Journal of Shipping and Logistics, 2011, vol. 27, issue 3, pp. 463-482. DOI: 10.1016/s2092-5212(11)80022-2

7. Surajit C., Deepak J., Goutami C. Trend estimation and univariate forecast of the sunspot numbers: development and comparison of ARMA, ARIMA and autoregressive neural network models. Comptes Rendus Geoscience, 2011, vol. 343, pp. 433-442.

DOI: 10.1016/j.crte.2011.07.008

8. Flores J., Graff M., Rodriguez H. Evolutive design of ARMA and ANN models for time series forecasting. Renewable Energy, 2012, vol. 44, pp. 225-230.

DOI: 10.1016/j.renene.2012.01.084

9. Valipour M., Banihabib M.E., Behbahani M R. Comparison of the ARMA, ARIMA, and the autoregressive artificial neural network models in forecasting the monthly inflow of Dez dam reservoir. Original Research Article Journal of Hydrology, 2013, vol. 476, pp. 433-441. DOI: 10.1016/j .jhydrol.2012.11.017

10. Panapakidis I.P. Clustering based day-ahead and hour-ahead bus load forecasting models. International Journal of Electrical Power & Energy Systems. 2016, vol. 80, pp. 171-178. DOI: 10.1016/j.ij epes.2016.01.035

11. Jiménez-Pérez P.F., Mora-Lopez L. Modeling and forecasting hourly global solar radiation using clustering and classification techniques. Original Research Article Solar Energy, 2016, vol. 135, pp. 682-691. DOI: 10.1016/j.solener.2016.06.039

12. Azimi R., Ghayekhloo M., Ghofrani M. A hybrid method based on a new clustering technique and multilayer perceptron neural networks for hourly solar radiation forecasting. Original Research Article Energy Conversion and Management, 2016, vol. 118, p. 331-344.

DOI: 10.1016/j.enconman.2016.04.009

13. Singh S. Pattern Modelling in Time-Series Forecasting. Cybernetics and Systems, 2000, vol. 31, no.1. P. 49-65.

14. Краковский Ю.М., Лузгин А.Н. Адаптивная вероятностно-статистическая кластерная модель интервального прогнозирования нестационарных динамических показателей // Современные технологии. Системный анализ. Моделирование. 2015. № 1 (45). C. 80-84.

15. De La Vega E., Flores J.J, Graff M. K-Nearest-Neighbor by Differential Evolution for Time Series Forecasting. 13th Mexican International Conference on Artificial Intelligence, 2014, pp. 50-60. DOI: 10.1007/978-3-319-13650-9 5

16. Walters-Williams J., Li Y. Comparative Study of Distance Functions for Nearest Neighbor. Advanced Techniques in Computing Sciences and Software Engineering, 2010, pp. 123-456. DOI: 10.1007/978-90-481-3660-5 14

17. Cha Sung-Hyuk. Comprehensive Survey on Distance/Similarity Measures between Probability Density Functions. International Journal of Mathematical Models and Methods in Applied Sciences, 2007, vol. 1 (4), pp. 300-307.

18. Jousselme A., Maupin P. Distances in evidence theory: Comprehensive survey and generalizations. International Journal of Approximate Reasoning, 2007, vol. 53, issue 2, pp. 118-145. DOI: 10.1016/j.ijar.2011.07.006

19. Pearson product-moment correlation coefficient // Wikipedia the free encyclopedia: https://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient#cite_note-1, accessed 17.11.2016. На Википедию нельзя ссылаться. По ссылке в этой статье есть три ссылки на материалы XIX века автора Фрэнсиса Гальтона.

20. Burger M., Repisky J. Problems of Linear Least Square Regression. Proceedings in Advanced Research in Scientific Areas: The 1st Virtual International Conference, 2012, issue 1, pp. 257-262.

21. Sen P.K. Estimates of Regression Coefficient Based on Kendall's tau. Journal of the American Statistical Association, 1968, vol. 63, issue 324, pp. 1379-1389.

22. Wilcox R.R., Clark F. Comparing robust regression lines associated with two dependent groups when there is heteroscedasticity. Computational Statistics, 2014, vol. 29. issue 5, pp. 1175-1186. DOI: 10.1007/s00180-014-0485-2

23. Ohlson J.A., Kim S. Linear valuation without OLS: the Theil-Sen estimation approach. Review of Accounting Studies, 2015, vol. 20, issue 1, pp. 395-435. DOI: 10.1007/s11142-014-9300-0

24. Solar Energy Services for Professionals. SoDa. Режим доступа: http://www.soda-is.com/eng/services/services radiation free eng.php (дата обращения 17.11.2016).

25. The R project of statistical computing. The R Project. Режим доступа: http://www.r-project.org (дата обращения 17.11.2016).

Science ¿Education

of the Bauinan MSTU

Science and Education of the Bauman MSTU, 2016, no. 10, pp. 113-126.

DOI: 10.7463/1116.0849839

Received: 17.10.2016

Revised: 31.10.2016

© Bauman Moscow State Technical Unversity

Interval Forecasting Algorithm for Dynamic Indicators Based on Robust Probabilistic Cluster Model

Yu.M. Krakovsky1, A.N. Luzgin2'* 'alexJnigmailjii

Irkutsk State University of Railway Transport, Irkutsk, Russia 2Administration of Irkutsk City, Irkutsk, Russia

Keywords: interval forecasting, robust probabilistic cluster model, dynamic indicators, inter-cluster

similarity

In the contemporary world, in decision-making management process the forecasting results of different dynamic indicators are often used. The indicators are random variables because of uncertainty and, as a rule, are formalized as the time series. In practice, there is a continuing need to provide an acceptable forecasting accuracy of the indicators. In this regard, to develop new and improve existing forecasting methods of dynamic indicators with different statistical characteristics is a relevant line of research.

It should be noted that in decision-making management process based on the forecasting results of the dynamic indicators there is no constant need to know an actual future value of the indicator. Often it is enough to know whether the future value is greater than a predetermined one or not. The predetermined value divides a range of possible future values of the indicator into two intervals. Considering that this forecasting estimates the interval where will be the future value rather than the future value itself, such forecasting has been called an «interval forecasting».

There are a variety of widely used methods and mathematical models to forecast dynamic indicators. The most advanced methods are cluster and neural network ones. In previous articles the authors proposed the interval forecasting approaches of the dynamic indicators using such methods and developed two algorithms: 1) an algorithm based on an adaptive probabilistic statistical cluster model; 2) an algorithm based on a probabilistic neural network model. The paper proposes an interval forecasting algorithm of dynamic indicators based on robust probabilistic cluster model. The proposed algorithm was implemented in the programming language «R». As a public example of the dynamic indicator to test the proposed interval forecasting algorithm was used a dataset of average values of daily solar radiation. The dataset was obtained from the public scientific Internet-project «Solar Energy Services for Professionals». The algorithm test results proved the viability and potential for its practical application.

References

1. Chuchueva I.A., Pavlov Iu.N. Ekstrapoliatsiia psevdosluchainykh protsessov po maksimumu podobiia [Extrapolation of pseudorandom processes to the maximum similarity]. Nauka i obrazovanie = Science and education. Electronic scientific and technical publication. 2009, no. 7. Available at: http://technomag.neicon.ru/doc/129712.html, accessed 17.11.2016. [In Russian]

2. Krakovskii Iu.M., Luzgin A.N. Otsenka prognoziruemosti dinamicheskikh pokazatelei na osnove koeffitsienta rangovoi korreliatsii [Estimate of predictability dynamic indicators based on the coefficient of rank correlation]. Nauka i obrazovanie = Science and education. Electronic scientific and technical publication. 2016, no. 9. Available at: http://technomag.neicon.ru/doc/129712.html accessed 17.11.2016.

DOI: 10.7463/0916.0845015 [In Russian]

3. Shumway R.H., Stoffer D.S. Time Series Analysis and Its Applications. With R Examples. Third edition. Springer Science+Business Media LLC, 2011. DOI: 10.1007/978-1-44197865-3

4. Gooijer J.G., Hyndman R.J. 25 years of time series forecasting. International Journal of Forecasting, 2006, vol. 22, issue 3, pp. 443-473. DOI: 10.1016/j.ijforecast.2006.01.001

5. Mitrea C. A., Lee K. M., Wu Z. A Comparison between Neural Networks and Traditional Forecastin. International Journal of Engineering Business Management, 2009. vol. 1, no. 2, pp. 19-24. DOI: 10.5772/677777

6. Gosasang V., Chandraprakaikul W., Kiattisin S. A Comparison of Traditional and Neural Networks Forecasting Techniques for Container Throughput at Bangkok Port. The Asian Journal of Shipping and Logistics, 2011, vol. 27, issue 3, pp. 463-482. DOI: 10.1016/s2092-5212(11)80022-2

7. Surajit C., Deepak J., Goutami C. Trend estimation and univariate forecast of the sunspot numbers: development and comparison of ARMA, ARIMA and autoregressive neural network models. Comptes Rendus Geoscience, 2011, vol. 343, pp. 433-442.

DOI: 10.1016/j.crte.2011.07.008

8. Flores J., Graff M., Rodriguez H. Evolutive design of ARMA and ANN models for time series forecasting. Renewable Energy, 2012, vol. 44, pp. 225-230.

DOI: 10.1016/j.renene.2012.01.084

9. Valipour M., Banihabib M.E., Behbahani M R. Comparison of the ARMA, ARIMA, and the autoregressive artificial neural network models in forecasting the monthly inflow of Dez dam reservoir. Original Research Article Journal of Hydrology, 2013, vol. 476, pp. 433-441. DOI: 10.1016/j.jhydrol.2012.11.017

10. Panapakidis I.P. Clustering based day-ahead and hour-ahead bus load forecasting models. International Journal of Electrical Power & Energy Systems. 2016, vol. 80, pp. 171-178. DOI: 10.1016/j .ijepes.2016.01.035

11. Jiménez-Pérez P.F., Mora-López L. Modeling and forecasting hourly global solar radiation using clustering and classification techniques. Original Research Article Solar Energy, 2016, vol. 135, pp. 682-691. DOI: 10.1016/j.solener.2016.06.039

12. Azimi R., Ghayekhloo M., Ghofrani M. A hybrid method based on a

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

new clustering technique and multilayer perceptron neural networks for hourly solar radiation forecasting. Original Research Article Energy Conversion and Management, 2016, vol. 118, p. 331-344. DOI: 10.1016/j.enconman.2016.04.009

13. Singh S. Pattern Modelling in Time-Series Forecasting. Cybernetics and Systems, 2000, vol. 31, no. 1. P. 49-65.

14. Krakovskii Iu.M., Luzgin A.N. Adaptivnaia veroiatnostno-statisticheskaia klasternaia model' interval'nogo prognozirovaniia nestatsionarnykh dinamicheskikh pokazatelei [Adaptive probabilistic statistical cluster model for interval prediction of non-stationary dynamic indicators]. Sovremennye tekhnologii. Sistemnyi analiz. Modelirovanie. = Modern technologies. System analysis. Modeling. 2015, no. 1 (45), pp. 80-84. [In Russian]

15. De La Vega E., Flores J.J, Graff M. K-Nearest-Neighbor by Differential Evolution for Time Series Forecasting. 13th Mexican International Conference on Artificial Intelligence, 2014, pp. 50-60. DOI: 10.1007/978-3-319-13650-9 5

16. Walters-Williams J., Li Y. Comparative Study of Distance Functions for Nearest Neighbor. Advanced Techniques in Computing Sciences and Software Engineering, 2010, pp. 123-456. DOI: 10.1007/978-90-481-3660-5 14

17. Cha Sung-Hyuk. Comprehensive Survey on Distance/Similarity Measures between Probability Density Functions. International Journal of Mathematical Models and Methods in Applied Sciences, 2007, vol. 1 (4), pp. 300-307.

18. Jousselme A., Maupin P. Distances in evidence theory: Comprehensive survey and generalizations. International Journal of Approximate Reasoning, 2007, vol. 53, issue 2,

pp. 118-145. DOI: 10.1016/j .ijar.2011.07.006

19. Pearson product-moment correlation coefficient - The free encyclopedia «Wikipedia». Available at: https://en.wikipedia.org/wiki/Pearson product-

moment_correlation_coefficient#cite_note-1, accessed 20.09.2016. There are three references in the Wikipedia article, all three linking to articles of Francis Galton.

20. Burger M., Repisky J. Problems of Linear Least Square Regression. Proceedings in Advanced Research in Scientific Areas: The 1st Virtual International Conference, 2012, issue 1, pp. 257-262.

21. Sen P.K. Estimates of Regression Coefficient Based on Kendall's tau. Journal of the American Statistical Association, 1968, vol. 63, issue 324, pp. 1379-1389.

22. Wilcox R.R., Clark F. Comparing robust regression lines associated with two dependent groups when there is heteroscedasticity. Computational Statistics, 2014, vol. 29. issue 5, pp. 1175-1186. DOI: 10.1007/s00180-014-0485-2

23. Ohlson J.A., Kim S. Linear valuation without OLS: the Theil-Sen estimation approach. Review of Accounting Studies, 2015, vol. 20, issue 1, pp. 395-435. DOI: 10.1007/s11142-014-9300-0

24. Solar Energy Services for Professionals. SoDa. Available at: http://www.soda-is.com/eng/services/services_radiation_free_eng.php, accessed 17.11.2016.

25. The R project of statistical computing. The R Project. Available at: http://www.r-project.org, accessed 17.11.2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.