УДК 004.8
ИНТЕГРАЦИЯ НЕЧЕТКИХ МОДЕЛЕЙ ДЛЯ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ
© 2010 Н.Г.Ярушкина1, И.Г.Перфильева2, Т.В.Афанасьева1
1 Ульяновский государственный технический университет 2 Университет г. Острава (Чешская республика)
Поступила в редакцию 14.05.2010
Работа посвящена актуальной задаче извлечения новых знаний о поведении временных рядов. Ключевые слова: нечеткие модели, временные ряды.
Растущий интерес к нечеткому моделированию временных рядов обусловлен, тем, что оно свободно от предположений, требуемых в статистическом подходе, позволяет строить нелинейные модели, обеспечивая снижение требований к математической подготовке персонала и делая современные технологии доступными для широкого круга пользователей. При этом существующие нечеткие модели и методы, так же как и количественные ставят своей единственной целью увеличение точности числового прогноза в максимальной степени. В тоже время в задачах управления и принятия решений большую значимость имеют знания экспертов о тенденциях развития процессов. Такие тенденции относятся к классу нечетких, так как выражаются оценочными суждениями эксперта, которые обладают внутренней нечеткостью. Данная работа посвящена методу нечеткого моделирования временных рядов, который позволяет извлекать из временных рядов контекстно-зависимые знания о нечетких тенденциях, выражать их в лингвистической форме и использовать для получения числового прогноза.
Системы, использующие нечеткие модели, базы знаний для хранения экспертных знаний о состоянии и функционировании процессов выраженных в виде оценочных и причинно-следственных лингвистических выражений, обеспечили новый виток в развитии экспертных систем и систем поддержки принятия решений. Однако, работа с экспертами по извлечению зна-
Ярушкина Надежда Глебовна, доктор технических наук, профессор, проректор по научной работе, заведующая кафедрой "Информационные системы". E-mail: jng@ulstu.ru
Перфильева Ирина Григорьевна, кандидат физико-математических наук, профессор. E-mail: Irina.Perfilieva@osu.cz
Афанасьева Татьяна Васильевна, кандидат технических наук, доцент. E-mail: tv.afanaseva@mail.ru
ний о тенденциях во временных рядах трудоемка и дорогостояща.
Поэтому при создании нечетких моделей ВР перспективным является применение интеллектуальных методов направления Times-Series Data Mining, в котором нечеткое моделирование ВР позволяет извлекать дополнительные знания в виде легко интерпретируемых продукционных правил. Нечеткое моделирование и представление ВР в виде нечеткого временного ряда (НВР) активно развивается в трудах иностранных ученых, таких как Х. Танака, Келминс и Диамонд, К.Сонг, К. Хирота, Я. Капржик, В. Педрич, В. Новак, И.Перфильева, И. Батыршин, а также в работах отечественных ученых - Н. Ярушкиной, С. Ковалева, К.Дегтярева. Несмотря на перечисленные работы, ряд научных проблем нечеткого моделирования ВР в новом направлении TimesSeries Data Mining остаются нерешенными, в частности проблемы моделирования, анализа и прогноза развития такого объекта временного ряда, как нечеткая тенденция.
Здесь для постановки задачи исследований выбран временной ряд в виде последовательности упорядоченных в моменты времени пар Y={t,,x}, таких что x. е В, t . е Bt, i е [1,n]. Требуется построить нечеткую модель временного ряда, позволяющую извлекать знания о тенденциях и правилах их следования, образующую базу знаний Rule={R p }, где k - количество нечетких продукционных правил в базе знаний, p - количество переменных (нечетких высказываний) в каждом правиле:
Rf : Если х1 есть х, и х есть 3Xj и... xp есть xp то y есть yt .
Метод нечеткого моделирования заключается в построении для исследуемого ВР контекстно-зависимой параметрической ACL-шкалы [1], генерации базы знаний нечеткой модели ВР, со-
держащей отношения между нечеткими элементарными тенденциями [2] временного ряда, и поиск такого параметра р базы правил Rule={R p }, для которого ошибка прогноза минимальна.
В основу моделирования поведения ВР в терминах нечетких тенденций положим предположение о развитии поведения ВР как результата зависимости нечеткой тенденции от значений нечетких тенденций в предыдущие моменты времени.
Предлагаются три нечеткие модели временного ряда, выражающие эту зависимость через компоненты модели элементарной нечеткой тенденции. Результатами прогноза ВР являются параметры нечеткой элементарной тенденции т выражающие тип ~ , интенсивность ~ , степень принадлежности л будущих изменений и числовая оценки уровней ВР, полученные по наилучшей модели.
В основе нечеткой модели временного ряда F2S лежит нечеткая модель элементарной тенденции т=(л, ~ , ~ ), Тогда нечеткая модель ВР порядка р, выраженная через компоненты модели элементарной тенденции представима следующим образом:
v (t - р ) o R~(t, t - р ) ),
a(t - р) o R~(t,t - р) ^a(t).
Результатом моделирования ВР является база правил {R(t,t-p)} нечеткой системы логического вывода, выявляющая нечеткую зависимость следования отдельных компонент модели элементарной тенденции, извлеченная из нечеткого ВР, пример которой с частотной характеристикой каждого правила для р=1 представлен в табл. 1.
Данная модель временного ряда F1N основана на представлении временного ряда в виде числового ВР дефазифицированных интенсивнос-тей нечеткой элементарной тенденции:
т=(л,н,а), н= DeFuzzy(~ ), a=DeFuzzy(~).
Для прогнозирования значений этого ряда удобно использовать трехслойную нейросетевую модель, с количеством входов, равным порядку модели р и одним выходом:
а
F
' = F (Z wa, )
циентов, f - оператор нелинейного преобразования, неявно выражающий зависимость выхода от входа.
Модель F3N1S использует представление нечеткой элементарной тенденции в виде т =(a М2М) гдеМ, М, М3 - числовые временные ряды степеней принадлежностей (функции принадлежностей) типов элементарных тенденций:
a(t - р) o Rs(t, t - р) ^ с? (t)
р
Vi' = F1( Z wi Vu ) , ^2 = F2( Z w> ^2 i ) ,
i = 1 р
i = 1
<"3 = Fз(Z w i <"зi), r = arg(max(X,^,
i = 1
где r - номер типа тенденции.
Далее проводится вычислительный эксперимент, целью которого является исследование продуктивности метода нечеткого моделирования ВР для генерации авторских моделей временных рядов, позволяющих извлекать знания о нечетких тенденциях в форме продукционных правил "IF-THEN" и использовать их для прогнозирования ВР.
Для выбора наилучшей из трех предлагаемых нечетких моделей ВР в терминах нечетких тенденций используются следующие критерии качества:
1 N
МАРЕ = —Z NtT
У, - У,
100%
MSE =1Z (y, - У0 ) ,
где (а1,а2,...,ар) - вектор входных интенсивно-стей, (wl5 w2,..., wp ) - вектор весовых коэффи-
ТТвпЛ = (ЕттотСоиМ/ ШаЮоиШ) * 100% .
МАРЕ - средняя абсолютная процентная ошибка. Данный критерий удобно использовать для сравнения продуктивности метода при его применении на множестве временных рядов.
МБЕ - средняя квадратичная ошибка, традиционно используется для выбора наилучшей модели временных рядов из множества конкурирующих. Иногда применяют корень квадратный из ЫБЕ. Такой показатель качества обозначают ЯМБЕ.
ТТвпЛ - коэффициент ошибок в обнаружении типов нечетких элементарных тенденций вре-
Таблица 1. Таблица извлеченных правил для типов тенденций
i=i
i=i
Правило Частота
if ((InputO is Падение)) then (Output is Рост) 3
if ((InputO is Рост)) then (Output is Рост) 1
if ((InputO is Рост)) then (Output is Падение) 2
if ((InputO is Падение)) then (Output is Падение) 2
менного ряда в процентах, где БгготСоиШ - количество ошибок в моделировании типов нечетких элементарных тенденций, ТоЬсйСоипЬ - общее количество нечетких элементарных тенденции временного ряда.
Вычислительный эксперимент на нестационарных временных рядах показал, что авторские нечеткие модели ВР в терминах нечетких тенденций имеют недостаточно хорошие показатели качества для среднесрочного и долгосрочного прогноза за счет обработки "сырых данных" без выделения тренда. В то же время для краткосрочного прогноза авторские модели показали неплохие результаты, как по критериям качества моделирования и оценки прогноза нечетких тенденций, так и для оценки числовых уровней ВР.
В эксперименте были использованы авторские нечеткие модели тенденций Е2Б(Х,У,1), ЕШ(Х, У.I), Е3М1Б(Х, У,.I) и для сравнения нечеткие модели Б(ХЛ) [3], С(Х,У.) [4]. В этих моделях Х обозначает мощность генерируемой АСЬ-шкалы, У - порядок модели, I - глубина
прогноза (количество интервалов для прогноза). В некоторых моделях будет использоваться авторский алгоритм отбора нечетких правил, где к модели добавляется текст "+ отбор".
Метод нечеткого моделирования и анализа тенденций временных рядов применяется для моделирования и прогнозирования временного ряда статьи 211 по данным бухгалтерской отчетности "Доходы и расходы" бюджетной организации. Данные, образующий ВР, характеризуют месячные расходы на заработную плату за четыре с половиной года (рис. 1). Для этого нестационарного ВР проводился прогноз на один интервал сначала (а) для усеченного ВР на 3 точки, (б) затем - на две точки, (в) затем на одну точку, в заключении (с) исследован весь временной ряд. Целью такого исследования одного и того же временного ряда - проанализировать устойчивость краткосрочного прогноза авторских нечетких моделей по сравнению с известными 8- и D-моделями. Результаты лучших моделей приведены в табл. 2.
211-0
I О 21 1-Р |
—I—•—•—•—•—I—•—1—•—;—I—•—•—;—•—I—•—•—•—•—I-
Ю 20 ЗО ¿40 50
Время
Рис. 1. Временной ряд статьи 211 Таблица 2. Показатели внешних мер качества. Прогноз на один интервал
Название модели МАРЕ там М8Е
(а) Р28(10,1,1) 5,4 0 0,69* 10Л12
8(10,1,1) 0,6 50 0,8* 10Л10
0(10,3,1) 9,4 0 0,2* 10Л13
(б) Р28(10,1,1) 8,2 0 0,43* 10л13
8(10,3,1) 22 0 0,3* 10л14
0(10,1,1) 42 50 0,1*10л15
(в) ^N(10,1,1) 5,9 0 0,1*10л13
8(10,4,1) 17 0 0,28*10л13
0(10,1,1) 52 0 0,24*10л15
(с) ^N(10,2,1) 4 0 0,1*10л13
8(10,4,1) 30 0 0,78*10л14
0(10,1,1) 29 0 0,7*10л14
Таблица 3. Показатели внешних мер качества. Прогноз на три интервала
Название модели MAPE RMSE TTend
F1N(3,3,3)+ot6op 28 70*10A5 16,6
F3N1S(3,3,3) + отбор 36 122*10A5 16,6
F2S(3,4,3) + отбор 42 80*10A5 16,6
SARIMA(1,1,1)X(1,0,0) 49 88*10A5 50
F3N1S(3,4,3) + отбор 49 101*10A5 0
F2S(3,1,3) + отбор 55 88*10A5 0
Анализ внешних мер качества показывает, что авторские модели при прогнозе на один интервал характеризируются стабильными показателями качества (МАРЕ < 10%, ТТепё=0), что нельзя сказать о нечетких 8- и D- моделях.
Проведенное статистическое моделирование и прогнозирование данного ВР на три интервала в пакете "Статистика" показало, что наименьшее М8Е соответствует модели 8ARIMA(1,1,1)x(1,0,0), для которой МАРЕ=49%, RMSE=88*10Л5. При нечетком моделировании предлагаемым методом были получены следующие результаты, приведенные в табл.3.
Таким образом, исследование предлагаемого метода нечеткого моделирования и анализа тенденций временных рядов позволяет сделать вывод о его полезности при решении задач извлечения знаний о правилах следования нечетких
тенденций и краткосрочного прогноза временных рядов.
СПИСОК ЛИТЕРАТУРЫ
1. Афанасьева Т.В. Модель ACL-шкалы для генерации лингвистических оценок в принятии решений // Вопросы современной науки и практики. Университет им. В.И.Вернадского. Т.2. Серия "Технические науки". 2008. № 4 (14). С. 91-97.
2. Интегральный метод принятия решений и анализа нечетких временных рядов/Новак В., Перфильева И.Г., Ярушкина Н.Г., Афанасьева Т.В. // Программные продукты и системы. 2008. № 4. С. 65-68.
3. Song Q. Fuzzy time series and its models/Song, Q. Chissom B.//Fuzzy Sets and Systems, 54 (1993). Р. 269-277.
4. Дегтярев К.Ю. Применение специализированных компьютерных программ и методов, основанных на нечетких временных рядах для краткосрочного прогнозирования USB/RUB котировок [Электронный ресурс] URL: http://Exponenta.ru (дата обращения 16.02.2010)
FUZZY MODELS' INTEGRATION IN TIME SERIES ANALYSIS
© 2010 N.G. Yarushkina1, I.G. Perfilieva2, T.V. Afanaseva1
1 Ulyanovsk State Technical University
2 University of Ostrava, Czech Republic
In this article we described the fuzzy models for Time Series Data Mining. Key words: fuzzy models, time series.
Nadezhda Yarushkina, Doctor of Technics, Professor, Vice-Rector of Scientific Work, Head at the Information Systems Department. E-mail: jng@ulstu.ru.
Irina Perfilieva, Candidate of Physics and Mathematics, Professor, E-mail: Irina.Perfilieva@osu.cz. Tatjana Afanasieva, Candidate of Technics, Associate Professor, E-mail: tv.afanaseva@mail.ru