Научная статья на тему 'Об автоматизации прогнозирования временных рядов дифференцированным генетическим алгоритмом'

Об автоматизации прогнозирования временных рядов дифференцированным генетическим алгоритмом Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
152
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Паротькин Н.Ю.

Рассматривается способ объединения модели прогнозирования на основе нечеткого временного ряда и генетического алгоритма для автоматического нахождения ее оптимальных параметров. Приводятся результаты сравнительного тестирования эффективности прогнозирования с нейронной сетью.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Паротькин Н.Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT AUTOMATION OF TIME SERIES FORECASTING BY DIFFERENTIATED GENETIC ALGORITHM

The article discusses a way to combine a forecasting model based on fuzzy time series and genetic algorithm for automatically finding its optimal parameters. Results of comparative testing are adduced of forecasting effectiveness with a neural network.

Текст научной работы на тему «Об автоматизации прогнозирования временных рядов дифференцированным генетическим алгоритмом»

Решетневскце чтения

© Олегин И. П., Коваленко Н. А., 2011

УДК 519.67

Н. Ю. Паротькин

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

ОБ АВТОМАТИЗАЦИИ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ ДИФФЕРЕНЦИРОВАННЫМ ГЕНЕТИЧЕСКИМ АЛГОРИТМОМ

Рассматривается способ объединения модели прогнозирования на основе нечеткого временного ряда и генетического алгоритма для автоматического нахождения ее оптимальных параметров. Приводятся результаты сравнительного тестирования эффективности прогнозирования с нейронной сетью.

Анализ временных рядов играет важную роль в решении многих актуальных задач. Чаще всего для этой цели применяется аппарат математической статистики, что обязывает использующего его человека разбираться в применяемых моделях и понимать заложенный в них смысл, поскольку использование неверной модели дает результат, далекий от реальности. Это обусловлено тем, что выполнение численных операций в различных моделях не приводит к алгебраическим ошибкам и, следовательно, применение ошибочной модели незаметно для неквалифицированного человека.

Большой группе пользователей необходим краткосрочный прогноз на один-два шага вперед на основе временного ряда, содержащего 50-100 значений, поскольку накопление большей статистике по интересующему пользователя процессу накапливается редко, в связи с отсутствием необходимости в ней. Следовательно, для данной категории людей необходимо использовать модель краткосрочного прогнозирования процессов с преобладающей детерминированной составляющей, представленных временными рядами с короткой длиной актуальной части, в условиях отсутствия априорной информации о вероятностных характеристиках процесса с автоматической настройкой параметров модели для достижения оптимальных результатов. Перечисленным требованиям удовлетворяет модель временного ряда на основе нечетких множеств, оптимальные параметры которой будут настраиваться при помощи генетического алгоритма (ГА).

Модель построения нечеткого временного ряда частично описана в работе [1]. Для поиска ее оптимальных параметров, позволяющих спрогнозировать значение временного ряда на t + 1 шаге, необходимо выбрать ее оптимизируемые параметры. Для этого определим универсум и для приращений значений фактора как и = [Отш - Д, Бтах + Д], на основании

которого будем вводить нечеткое множество А. Здесь Атт(Атт = тШ^) - ^ - 1))) и ДтахДтах = тЗХ^) -- - 1))) - минимальное и максимальное приращения значений фактора на основе известных данных временного ряда соответственно;= Т,, (, = 1, 2, ...) -реальные значения временного ряда для некоторого фактора; Д и Д - два действительных числа, использование которых позволяет разбить универсум и на п интервалов равной длины: щ, и2, ..., ип. Далее по алгоритму, приведенному в [1], строится нечеткий временной ряд для выбранных значений параметров.

Для обеспечения возможности работы обычного пользователя с рассматриваемой моделью необходимо автоматизировать поиск оптимальных значений для действительных чисел Д, Д, используемых при корректировке универсума и, количества интервалов разбиения п универсума и и параметра ае[0; 1], определяющего промежуточное значение степени принадлежности в лингвистических термах Аг. Применение ГА позволит автоматизировать нахождение оптимальной комбинации значений выше перечисленных параметров. Поэтому хромосома ГА будет иметь следующий вид: (Д, Д, п, а). В качестве целевой функции для ГА следует использовать среднюю относительную ошибку прогноза:

Ь т 1( ^ Т.) / Т.\

АЕЕК = Ь ,-Л ■-100 %,

т

где и _ - предсказанное и реальное значения для ,-го периода; т - количество значений временного ряда.

В качестве ГА был использован дифференцированный ГА [2]. Алгоритм построения нечеткого временного ряда (для деффазификации при поиске решения используется только метод центра тяжести, а также учет повторяющихся НМ) и ГА, позволяющий находить его оптимальные параметры, были реализованы в виде программного средства [3]. Для проверки

Математические методы моделирования, управления и анализа данных

работоспособности реализованного алгоритма проведено прогнозирование и моделирование с его помощью 4 временных рядов [4] в сравнении с результатами нейронной сети (см. таблицу), где error - относительная ошибка прогнозирования для t + 1 интервала.

Комбинация нечетких временных рядов и ГА позволяет создать программное средство, обладающее минимум настраиваемых параметров для достижения оптимальных показателей надежности прогнозирования при стандартных настройках. Рассматриваемая модель подходит для краткосрочного прогнозирования как стационарных, так и нестационарных коротких временных рядов, что подтверждается низким значением ошибки на тестовых данных. В сравнении с другим интеллектуальным методом анализа данных -нейросетью - данная комбинация алгоритмов незначительно уступает ей в точности аппроксимации и значительно лучше в точности прогнозирования.

Библиографические ссылки

1. Дегтярев К. Ю. Прогнозирование валютных котировок с использованием модифицированного стационарного метода, основанного на нечетких временных рядах [Электронный ресурс] // Проект Exponenta.ru (компания AXOFT). 2008. URL: http://www.exponenta.ru/educat/news/degtyarev/paper2.pdf.

2. Жуков В. Г., Паротькин Н. Ю. Дифференцированный адаптивный генетический алгоритм // Вестник Новосиб. гос. ун-та. Сер. Информационные технологии. Новосибирск, 2011. Т. 9. Вып. 1. С. 5-11.

3. Пат. 2011614846 Российская Федерация. Прогнозирование временных рядов / В. Г. Жуков, Н. Ю. Паротькин ; правообладатель Сиб. гос. аэро-космич. ун-т ; рег. 21.06.11.

4. Time Series Data Library [Electronic resource]. URL: http://robjhyndman.com/TSDL/.

Ошибки прогнозирования НВР и нейросети

№ ряда НВР Нейросеть

AFER, % error, % AFER, % error, %

1 0,24898 0,23415 0,23427 0,19793

2 14,53275 1,60655 7,58778 12,98713

3 8,53093 2,94043 5,95831 2,85008

4 18,18118 2,37419 11,99008 13,92147

N. Yu. Parot'kin

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

ABOUT AUTOMATION OF TIME SERIES FORECASTING BY DIFFERENTIATED GENETIC ALGORITHM

The article discusses a way to combine a forecasting model based on fuzzy time series and genetic algorithm for automatically finding its optimal parameters. Results of comparative testing are adduced of forecasting effectiveness with a neural network.

© napoTLKHH H. ro., 2011

УДК 62.506.1

В. Ф. Первушин

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИССЛЕДОВАНИЕ П-ГЕНЕРАТОРА СЛУЧАЙНЫХ ЧИСЕЛ, РАСПРЕДЕЛЕННЫХ

ПО ЛОГНОРМАЛЬНОМУ ЗАКОНУ

Рассматривается задача получения случайных величин, распределенных по логнормальному закону с заданными параметрами заданного объема. Проведено исследование точности эмпирических функций плотности распределения, полученных по выборкам меньшего объема, чем заданные.

Значительная часть исследований в области моделирования, управления, классификации и оптимизации сталкивается с проблемой исследования объектов, имеющих стохастические свойства, а также их реакции на случайные воздействия окружающей сре-

ды. Такие исследования нуждаются в качественных измерениях значений случайных величин с различными законами распределения, с помощью которых исследователи могут описать стохастическую природу объектов изучения.

i Надоели баннеры? Вы всегда можете отключить рекламу.