Научная статья на тему 'Интеграция нечетких моделей для анализа временных рядов'

Интеграция нечетких моделей для анализа временных рядов Текст научной статьи по специальности «Математика»

CC BY
488
154
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЕТКИЕ МОДЕЛИ / ВРЕМЕННЫЕ РЯДЫ / FUZZY MODELS / TIME SERIES

Аннотация научной статьи по математике, автор научной работы — Ярушкина Н. Г., Перфильева И. Г., Афанасьева Т. В.

Работа посвящена актуальной задаче извлечения новых знаний о поведении временных рядов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FUZZY MODELS INTEGRATION IN TIME SERIES ANALYSIS

In this article we described the fuzzy models for Time Series Data Mining.

Текст научной работы на тему «Интеграция нечетких моделей для анализа временных рядов»

УДК 004.8

ИНТЕГРАЦИЯ НЕЧЕТКИХ МОДЕЛЕЙ ДЛЯ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ

© 2010 Н.Г.Ярушкина1, И.Г.Перфильева2, Т.В.Афанасьева1

1 Ульяновский государственный технический университет 2 Университет г. Острава (Чешская республика)

Поступила в редакцию 14.05.2010

Работа посвящена актуальной задаче извлечения новых знаний о поведении временных рядов. Ключевые слова: нечеткие модели, временные ряды.

Растущий интерес к нечеткому моделированию временных рядов обусловлен, тем, что оно свободно от предположений, требуемых в статистическом подходе, позволяет строить нелинейные модели, обеспечивая снижение требований к математической подготовке персонала и делая современные технологии доступными для широкого круга пользователей. При этом существующие нечеткие модели и методы, так же как и количественные ставят своей единственной целью увеличение точности числового прогноза в максимальной степени. В тоже время в задачах управления и принятия решений большую значимость имеют знания экспертов о тенденциях развития процессов. Такие тенденции относятся к классу нечетких, так как выражаются оценочными суждениями эксперта, которые обладают внутренней нечеткостью. Данная работа посвящена методу нечеткого моделирования временных рядов, который позволяет извлекать из временных рядов контекстно-зависимые знания о нечетких тенденциях, выражать их в лингвистической форме и использовать для получения числового прогноза.

Системы, использующие нечеткие модели, базы знаний для хранения экспертных знаний о состоянии и функционировании процессов выраженных в виде оценочных и причинно-следственных лингвистических выражений, обеспечили новый виток в развитии экспертных систем и систем поддержки принятия решений. Однако, работа с экспертами по извлечению зна-

Ярушкина Надежда Глебовна, доктор технических наук, профессор, проректор по научной работе, заведующая кафедрой "Информационные системы". E-mail: jng@ulstu.ru

Перфильева Ирина Григорьевна, кандидат физико-математических наук, профессор. E-mail: Irina.Perfilieva@osu.cz

Афанасьева Татьяна Васильевна, кандидат технических наук, доцент. E-mail: tv.afanaseva@mail.ru

ний о тенденциях во временных рядах трудоемка и дорогостояща.

Поэтому при создании нечетких моделей ВР перспективным является применение интеллектуальных методов направления Times-Series Data Mining, в котором нечеткое моделирование ВР позволяет извлекать дополнительные знания в виде легко интерпретируемых продукционных правил. Нечеткое моделирование и представление ВР в виде нечеткого временного ряда (НВР) активно развивается в трудах иностранных ученых, таких как Х. Танака, Келминс и Диамонд, К.Сонг, К. Хирота, Я. Капржик, В. Педрич, В. Новак, И.Перфильева, И. Батыршин, а также в работах отечественных ученых - Н. Ярушкиной, С. Ковалева, К.Дегтярева. Несмотря на перечисленные работы, ряд научных проблем нечеткого моделирования ВР в новом направлении TimesSeries Data Mining остаются нерешенными, в частности проблемы моделирования, анализа и прогноза развития такого объекта временного ряда, как нечеткая тенденция.

Здесь для постановки задачи исследований выбран временной ряд в виде последовательности упорядоченных в моменты времени пар Y={t,,x}, таких что x. е В, t . е Bt, i е [1,n]. Требуется построить нечеткую модель временного ряда, позволяющую извлекать знания о тенденциях и правилах их следования, образующую базу знаний Rule={R p }, где k - количество нечетких продукционных правил в базе знаний, p - количество переменных (нечетких высказываний) в каждом правиле:

Rf : Если х1 есть х, и х есть 3Xj и... xp есть xp то y есть yt .

Метод нечеткого моделирования заключается в построении для исследуемого ВР контекстно-зависимой параметрической ACL-шкалы [1], генерации базы знаний нечеткой модели ВР, со-

держащей отношения между нечеткими элементарными тенденциями [2] временного ряда, и поиск такого параметра р базы правил Rule={R p }, для которого ошибка прогноза минимальна.

В основу моделирования поведения ВР в терминах нечетких тенденций положим предположение о развитии поведения ВР как результата зависимости нечеткой тенденции от значений нечетких тенденций в предыдущие моменты времени.

Предлагаются три нечеткие модели временного ряда, выражающие эту зависимость через компоненты модели элементарной нечеткой тенденции. Результатами прогноза ВР являются параметры нечеткой элементарной тенденции т выражающие тип ~ , интенсивность ~ , степень принадлежности л будущих изменений и числовая оценки уровней ВР, полученные по наилучшей модели.

В основе нечеткой модели временного ряда F2S лежит нечеткая модель элементарной тенденции т=(л, ~ , ~ ), Тогда нечеткая модель ВР порядка р, выраженная через компоненты модели элементарной тенденции представима следующим образом:

v (t - р ) o R~(t, t - р ) ),

a(t - р) o R~(t,t - р) ^a(t).

Результатом моделирования ВР является база правил {R(t,t-p)} нечеткой системы логического вывода, выявляющая нечеткую зависимость следования отдельных компонент модели элементарной тенденции, извлеченная из нечеткого ВР, пример которой с частотной характеристикой каждого правила для р=1 представлен в табл. 1.

Данная модель временного ряда F1N основана на представлении временного ряда в виде числового ВР дефазифицированных интенсивнос-тей нечеткой элементарной тенденции:

т=(л,н,а), н= DeFuzzy(~ ), a=DeFuzzy(~).

Для прогнозирования значений этого ряда удобно использовать трехслойную нейросетевую модель, с количеством входов, равным порядку модели р и одним выходом:

а

F

' = F (Z wa, )

циентов, f - оператор нелинейного преобразования, неявно выражающий зависимость выхода от входа.

Модель F3N1S использует представление нечеткой элементарной тенденции в виде т =(a М2М) гдеМ, М, М3 - числовые временные ряды степеней принадлежностей (функции принадлежностей) типов элементарных тенденций:

a(t - р) o Rs(t, t - р) ^ с? (t)

р

Vi' = F1( Z wi Vu ) , ^2 = F2( Z w> ^2 i ) ,

i = 1 р

i = 1

<"3 = Fз(Z w i <"зi), r = arg(max(X,^,

i = 1

где r - номер типа тенденции.

Далее проводится вычислительный эксперимент, целью которого является исследование продуктивности метода нечеткого моделирования ВР для генерации авторских моделей временных рядов, позволяющих извлекать знания о нечетких тенденциях в форме продукционных правил "IF-THEN" и использовать их для прогнозирования ВР.

Для выбора наилучшей из трех предлагаемых нечетких моделей ВР в терминах нечетких тенденций используются следующие критерии качества:

1 N

МАРЕ = —Z NtT

У, - У,

100%

MSE =1Z (y, - У0 ) ,

где (а1,а2,...,ар) - вектор входных интенсивно-стей, (wl5 w2,..., wp ) - вектор весовых коэффи-

ТТвпЛ = (ЕттотСоиМ/ ШаЮоиШ) * 100% .

МАРЕ - средняя абсолютная процентная ошибка. Данный критерий удобно использовать для сравнения продуктивности метода при его применении на множестве временных рядов.

МБЕ - средняя квадратичная ошибка, традиционно используется для выбора наилучшей модели временных рядов из множества конкурирующих. Иногда применяют корень квадратный из ЫБЕ. Такой показатель качества обозначают ЯМБЕ.

ТТвпЛ - коэффициент ошибок в обнаружении типов нечетких элементарных тенденций вре-

Таблица 1. Таблица извлеченных правил для типов тенденций

i=i

i=i

Правило Частота

if ((InputO is Падение)) then (Output is Рост) 3

if ((InputO is Рост)) then (Output is Рост) 1

if ((InputO is Рост)) then (Output is Падение) 2

if ((InputO is Падение)) then (Output is Падение) 2

менного ряда в процентах, где БгготСоиШ - количество ошибок в моделировании типов нечетких элементарных тенденций, ТоЬсйСоипЬ - общее количество нечетких элементарных тенденции временного ряда.

Вычислительный эксперимент на нестационарных временных рядах показал, что авторские нечеткие модели ВР в терминах нечетких тенденций имеют недостаточно хорошие показатели качества для среднесрочного и долгосрочного прогноза за счет обработки "сырых данных" без выделения тренда. В то же время для краткосрочного прогноза авторские модели показали неплохие результаты, как по критериям качества моделирования и оценки прогноза нечетких тенденций, так и для оценки числовых уровней ВР.

В эксперименте были использованы авторские нечеткие модели тенденций Е2Б(Х,У,1), ЕШ(Х, У.I), Е3М1Б(Х, У,.I) и для сравнения нечеткие модели Б(ХЛ) [3], С(Х,У.) [4]. В этих моделях Х обозначает мощность генерируемой АСЬ-шкалы, У - порядок модели, I - глубина

прогноза (количество интервалов для прогноза). В некоторых моделях будет использоваться авторский алгоритм отбора нечетких правил, где к модели добавляется текст "+ отбор".

Метод нечеткого моделирования и анализа тенденций временных рядов применяется для моделирования и прогнозирования временного ряда статьи 211 по данным бухгалтерской отчетности "Доходы и расходы" бюджетной организации. Данные, образующий ВР, характеризуют месячные расходы на заработную плату за четыре с половиной года (рис. 1). Для этого нестационарного ВР проводился прогноз на один интервал сначала (а) для усеченного ВР на 3 точки, (б) затем - на две точки, (в) затем на одну точку, в заключении (с) исследован весь временной ряд. Целью такого исследования одного и того же временного ряда - проанализировать устойчивость краткосрочного прогноза авторских нечетких моделей по сравнению с известными 8- и D-моделями. Результаты лучших моделей приведены в табл. 2.

211-0

I О 21 1-Р |

—I—•—•—•—•—I—•—1—•—;—I—•—•—;—•—I—•—•—•—•—I-

Ю 20 ЗО ¿40 50

Время

Рис. 1. Временной ряд статьи 211 Таблица 2. Показатели внешних мер качества. Прогноз на один интервал

Название модели МАРЕ там М8Е

(а) Р28(10,1,1) 5,4 0 0,69* 10Л12

8(10,1,1) 0,6 50 0,8* 10Л10

0(10,3,1) 9,4 0 0,2* 10Л13

(б) Р28(10,1,1) 8,2 0 0,43* 10л13

8(10,3,1) 22 0 0,3* 10л14

0(10,1,1) 42 50 0,1*10л15

(в) ^N(10,1,1) 5,9 0 0,1*10л13

8(10,4,1) 17 0 0,28*10л13

0(10,1,1) 52 0 0,24*10л15

(с) ^N(10,2,1) 4 0 0,1*10л13

8(10,4,1) 30 0 0,78*10л14

0(10,1,1) 29 0 0,7*10л14

Таблица 3. Показатели внешних мер качества. Прогноз на три интервала

Название модели MAPE RMSE TTend

F1N(3,3,3)+ot6op 28 70*10A5 16,6

F3N1S(3,3,3) + отбор 36 122*10A5 16,6

F2S(3,4,3) + отбор 42 80*10A5 16,6

SARIMA(1,1,1)X(1,0,0) 49 88*10A5 50

F3N1S(3,4,3) + отбор 49 101*10A5 0

F2S(3,1,3) + отбор 55 88*10A5 0

Анализ внешних мер качества показывает, что авторские модели при прогнозе на один интервал характеризируются стабильными показателями качества (МАРЕ < 10%, ТТепё=0), что нельзя сказать о нечетких 8- и D- моделях.

Проведенное статистическое моделирование и прогнозирование данного ВР на три интервала в пакете "Статистика" показало, что наименьшее М8Е соответствует модели 8ARIMA(1,1,1)x(1,0,0), для которой МАРЕ=49%, RMSE=88*10Л5. При нечетком моделировании предлагаемым методом были получены следующие результаты, приведенные в табл.3.

Таким образом, исследование предлагаемого метода нечеткого моделирования и анализа тенденций временных рядов позволяет сделать вывод о его полезности при решении задач извлечения знаний о правилах следования нечетких

тенденций и краткосрочного прогноза временных рядов.

СПИСОК ЛИТЕРАТУРЫ

1. Афанасьева Т.В. Модель ACL-шкалы для генерации лингвистических оценок в принятии решений // Вопросы современной науки и практики. Университет им. В.И.Вернадского. Т.2. Серия "Технические науки". 2008. № 4 (14). С. 91-97.

2. Интегральный метод принятия решений и анализа нечетких временных рядов/Новак В., Перфильева И.Г., Ярушкина Н.Г., Афанасьева Т.В. // Программные продукты и системы. 2008. № 4. С. 65-68.

3. Song Q. Fuzzy time series and its models/Song, Q. Chissom B.//Fuzzy Sets and Systems, 54 (1993). Р. 269-277.

4. Дегтярев К.Ю. Применение специализированных компьютерных программ и методов, основанных на нечетких временных рядах для краткосрочного прогнозирования USB/RUB котировок [Электронный ресурс] URL: http://Exponenta.ru (дата обращения 16.02.2010)

FUZZY MODELS' INTEGRATION IN TIME SERIES ANALYSIS

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

© 2010 N.G. Yarushkina1, I.G. Perfilieva2, T.V. Afanaseva1

1 Ulyanovsk State Technical University

2 University of Ostrava, Czech Republic

In this article we described the fuzzy models for Time Series Data Mining. Key words: fuzzy models, time series.

Nadezhda Yarushkina, Doctor of Technics, Professor, Vice-Rector of Scientific Work, Head at the Information Systems Department. E-mail: jng@ulstu.ru.

Irina Perfilieva, Candidate of Physics and Mathematics, Professor, E-mail: Irina.Perfilieva@osu.cz. Tatjana Afanasieva, Candidate of Technics, Associate Professor, E-mail: tv.afanaseva@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.