Научная статья на тему 'Методика построения компактных и точных нечетких систем типа Такаги-Сугено'

Методика построения компактных и точных нечетких систем типа Такаги-Сугено Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1487
329
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЕТКИЕ СИСТЕМЫ / ДИНАМИЧЕСКОЕ РАЗБИЕНИЕ / КУСОЧНО-ЛИНЕЙНАЯ ИНИЦИАЛИЗАЦИЯ / АЛГОРИТМ "КУКУШКИН ПОИСК" / РЕКУРРЕНТНЫЙ МЕТОД НАИМЕНЬШИХ КВАДРАТОВ / СТАТИСТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ КРИТЕРИИ / TAKAGI-SUGENO FUZZY SYSTEMS / DYNAMIC PARTITIONING / PIECEWISE LINEAR INITIALIZATION / CUCKOO SEARCH ALGORITHM / RECURSIVE LEAST SQUARES METHOD / STATISTICAL INFORMATION CRITERIA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ходашинский Илья Александрович, Сарин Константин Сергеевич

Рассматриваются этапы построения нечетких систем типа Такаги-Сугено: формирование исходных данных, генерация структуры нечеткой системы, оптимизация параметров антецедентов и консеквентов нечетких правил. Компромисс между компактностью и точностью модели достигается использованием трех статистических информационных критериев: Akaike, Bayesian, Hannan-Quinn Information Criterion. Приведены результаты экспериментов по аппроксимации реальных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ходашинский Илья Александрович, Сарин Константин Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper presents the new technique to design accurate and compact Takagi-Sugeno fuzzy systems. The technique includes the following steps: forming the initial data, the generation of fuzzy system structure, optimization of parameters consequent and antecedents of fuzzy rules. The compromise between compactness and accuracy of the model is achieved by using three statistical information criteria: Akaike, Bayesian, Hannan-Quinn Information Criterion. Results of experiments on the approximation of the actual data are delivered. Simulation experiments show validation of the proposed technique.

Текст научной работы на тему «Методика построения компактных и точных нечетких систем типа Такаги-Сугено»

УДК 004.85

И.А. Ходашинский, К.С. Сарин

Методика построения компактных и точных нечетких систем типа Такаги-Сугено

Рассматриваются этапы построения нечетких систем типа Такаги-Сугено: формирование исходных данных, генерация структуры нечеткой системы, оптимизация параметров антецедентов и консеквентов нечетких правил. Компромисс между компактностью и точностью модели достигается использованием трех статистических информационных критериев: Akaike, Bayesian, Hannan-Quinn Information Criterion. Приведены результаты экспериментов по аппроксимации реальных данных.

Ключевые слова: нечеткие системы, динамическое разбиение, кусочно-линейная инициализация, алгоритм «кукушкин поиск», рекуррентный метод наименьших квадратов, статистические информационные критерии. doi: 10.21293/1818-0442-2016-19-1-50-56

Нечеткое моделирование является одним из перспективных методов оценки отношения «вход-выход» в сложных нелинейных системах. Выполняется такое моделирование, как правило, с помощью нечетких систем типа Такаги-Сугено [1]. Нечеткая система представляет реальный объект или процесс в форме, легко понимаемой и интерпретируемой непрофессиональным математиком. В системе нечеткого моделирования собственно знания или модель изучаемого объекта (процесса) отделены от средств манипулирования этими знаниями, что позволяет исследователям ускорить процесс разработки модели, сосредоточившись на вопросе «что делать» вместо вопроса «как делать» [2].

Построение нечетких систем включает четыре основных этапа: 1) формирование исходных данных -задание типа нечеткой системы и сопутствующих этому типу параметров; 2) формирование структуры (грубая настройка); 3) поиск оптимальных значений параметров консеквентов (ТО-частей правил) и параметров функций принадлежности (ФП) антецедентов (ЕСЛИ-части) на основе заданных критериев качества и метода оптимизации выбранного критерия (тонкая настройка); так как антецеденты и кон-секвенты в системе взаимозависимы, этот этап является итеративным; 4) проверка правильности построенной системы [3].

Подавляющее большинство методов формирования структуры основано на методах нечеткого кластерного анализа, среди которых наиболее часто применяемыми являются метод нечетких с-средних, алгоритмы О^аТБОп-КеББе! и ваШ-веуа, метод нечеткой с-регрессии (БСИМ) [4], алгоритм субтрак-тивной кластеризации [5], а также комбинации указанных методов [6]. Среди перечисленных выше методов БСИМ, формирующий форму кластера в виде гиперплоскости, наиболее предпочтителен для решения задач построения нечетких систем типа Такаги-Сугено. Однако реализация алгоритма БСИМ для нечеткого моделирования сталкивается со следующими проблемами: 1) длительное время выполнения; 2) неустойчивость к шумам; 3) высокая чувствительность к данным инициализации [7, 8].

Так как оптимизация параметров антецедентов нечетких правил относится к классу КР-трудных задач, выполняется она с использованием различных метаэвристик и их гибридизации [9]. Для оптимизации параметров консеквентов используются различные модификации метода наименьших квадратов.

Проверить правильность построенной системы и избежать переобучения можно, используя процедуру кроссвалидации [10].

В последнее время нечеткие методы моделирования сконцентрированы на проблемах улучшения интерпретируемости нечетких систем без потери точности [11-13]. Лучшая интерпретируемость достигается на компактных базах правил. Однако невозможно построение системы одновременно с высокой степенью точности и компактности, так как эти свойства являются противоречивыми; на практике одно из них преобладает над другим.

При построении компактных и точных нечетких систем задача выбора чаще всего решается либо как двухкритериальная, либо сведением указанных двух критериев к единому критерию. В первом случае различные компромиссы между критериями представлены в виде Парето-оптимального множества сгенерированных нечетких систем [13-19]. Во втором случае из двух критериев либо конструируются один критерий, учитывающий веса каждого [10, 20, 21], либо используются статистические информационные критерии, информационный характер которых связан с концепцией информации Кульбака-Лейблера и которые алгебраически выражаются через сумму меры ошибки аппроксимации и штрафа за количество параметров системы [22-24]. Лучшей считается система с минимальным значением критерия.

Целью настоящей работы является описание оригинальной методики проектирования нечетких систем типа Такаги-Сугено, содержащих оптимальное количество правил и обладающих приемлемой точностью аппроксимации.

Нечеткая система типа Такаги-Сугено

Система типа Такаги-Сугено задается правилами следующего вида [1]:

ЕСЛИ хх=Ац И ... И хп=А„ ТО у = йо,- +йи Х1+ ... + й^ хп.

Выход системы определяет следующее отображение [1]:

R n

f (x;0, D)=

ЕП Aji (Xj) -(do, + dbxi +... + dm Xn ) /=1j=l

Rn

ЕП Aj,(xj) /=1j=i

где x - входной вектор; R - число правил; n - количество входных переменных; ^Aji - ФП j-й входной переменной; 0 - вектор параметров ФП; D - вектор параметров линейных функций консеквентов правил

D = [d01, d0R, d11, d1R, • ••, dn1, • ••, dnR] •

В таблице наблюдений T = {(xp; yp), p = 1 ,..., m} критерий качества аппроксимации может быть выражен среднеквадратической функцией ошибки [1]:

m

Е ( Ур - f (x p ;0, d))2

p=1

М8Б(0,Б) =

т

Цель построения системы - подбор структуры и параметров, при которых при минимальном количе -стве правил ошибка М8Б(0, Б) сведена к минимуму.

Ниже приведено описание этапов построения нечеткой системы типа Такаги-Сугено.

Формирование исходных данных

Построение нечеткой системы базируется на данных наблюдений, однако в настоящее время не представляется возможным исключить в этом процессе участие специалиста, который решает следующие задачи: 1) задает таблицу наблюдений; 2) указывает входные переменные; 3) определяет тип функций принадлежности.

Формирование структуры

Для формирования структуры системы предлагается использовать два алгоритма: алгоритм динамического разбиения входного пространства (ДРВП), работающий с функциями принадлежности треугольного типа, и алгоритм кусочно-линейной инициализации (КЛИ), использующий гауссовы функции принадлежности.

Алгоритм ДРВП начинает работу с разбиения входного пространства каждой переменной на один или два нечетких терма таким образом, чтобы ошибка аппроксимации М8Б сформированной нечеткой системы не превышала заданного порога е. Если указанное условие не выполняется, то каждое входное пространство разбивается на два терма. Множество нечетких термов (функций принадлежности), на которые разбита /-я переменная (I = 1, ..., п), обозначим Л,-. База правил задается сочетаниями термов из {Л1, Л2 , ..., Лп}. Консеквенты определяются рекуррентным методом наименьших квадратов. Далее выполняется итерационный процесс, на каждом шаге которого добавляется новая ФП в одно из множеств Ль..., Лп и находятся параметры 0 и Б. Процесс продолжается, пока ошибка аппроксимации М8Б больше заданного порога е [25].

Кусочно-линейная инициализация относится к алгоритмам кластеризации и отличается от описанного выше тем, что здесь не проводится разбиение

входного пространства на нечеткие термы. Вместо этого данные таблицы наблюдений разделяются на группы-кластеры, каждая такая группа будет ассоциироваться с нечетким правилом. Кластеры формируются следующим образом. Задается отклонение е. Находится самая удаленная точка от начала координат (на входных наблюдаемых данных). Относительно этой точки ведется построение кластера: в группу итерационно добавляются ближайшие к этой точке данные до тех пор, пока среднеквадратичная ошибка между выходными данными, входящими в кластер, и линейной регрессией, найденной с помощью данных в кластере рекуррентным методом наименьших квадратов, меньше е. На основе полученного кластера строится нечеткое правило.

Параметры 5 - среднее и с - отклонение гауссовых ФП определяются следующим образом [25]: I

Е хк

5 = С

I

2 1 2

- -Е(хк-s)

1 k=1

суммирование ведется по данным, входящим в отдельный кластер; I - количество данных в кластере. Консеквенты правил соответствуют уравнениям линейной регрессии, найденной методом наименьших квадратов на входящих в кластер данных. Построение кластеров и правил продолжается до тех пор, пока не будут просмотрены все наблюдаемые данные [25].

Оптимизация параметров

Для поиска оптимальных параметров антецедентов используется градиентный метод и метаэври-стический алгоритм «кукушкин поиск» [26].

Идея градиентного метода основана на том, что последующее решение получается из предыдущего движением в направлении, противоположном направлению градиента целевой функции. При оценивании параметров нечетких систем целевой функцией является среднеквадратичная ошибка, а вектор параметров определен на множестве параметров функций принадлежности. Основное достоинство метода - относительно быстрая сходимость, основной недостаток - способность застревать в локальных оптимумах.

Метаэвристический алгоритм «кукушкин поиск» построен на основе имитации способа размножения кукушки, когда она находит недавно построенные гнезда и подкладывает в них свои яйца (заменяет своими), которые в итоге могут быть выкинуты хозяином гнезда [26]. В основе алгоритма лежат три следующих правила: 1) кукушка откладывает по одному яйцу в случайно выбранное гнездо, которое представляет собой решение; 2) часть лучших решений будет перенесена в следующее поколение; 3) количество гнезд фиксировано и есть вероятность того, что хозяин может обнаружить чужое яйцо; в этом случае хозяин может выбросить яйцо из гнезда или вовсе отказаться от гнезда и построить новое на новом месте.

Пошаговая реализация алгоритма представлена ниже.

Шаг 1. Инициализация исходной популяции.

Задается S - размер популяции 0=(0,5 е[1, S]), «начальное положение кукушки» выбирается значением 0 после построения структуры или после предыдущих этапов оптимизации параметров, являющееся текущим решением 0cur. Задается p - вероятность, с которой гнездо может быть «покинуто» хозяином, т.е. вероятность удаления векторов из множества 0. Задается количество итераций N в качестве критерия остановки и m - число «худших» решений. Количество генерируемых векторов l полагаем равным S.

Шаг 2. Случайным образом генерируется l векторов решений 0.

Шаг 3. Генерация нового решения на основе полетов Леви.

Выполняется «случайное перемещение кукушки», которое выражено изменением 0cur по закону Леви 0cur = 0cur + Levi, где Levi - случайный прыжок полета Леви, вычисляемый по правилу Levi = у • u /V|, где у - коэффициент прыжка полета

Леви; параметр в принимает значения из интервала [1, 2]; u,v - нормально распределенные величины

v~N(0;ст2), u~N(0;ст2),

2 1 2 I

5,, =1, СТ„ =<

Г(1 + ß)sin( rcß/2)

,1/ß

[26],

[г[(1 + Р)/2]- 2(р_1)/2]

Г(х) - гамма-функция.

Случайным образом выбирается другое решение 0х из популяции 0.

Шаг 4. Оценка качества решения. Если М8Б(0СШ) > МБЕ(0), то 0сиг= 0х , иначе 0х = 0сиг.

Шаг 5. Удаление плохих решений.

Если не выполнено заданное количество итераций Ы, то выбирается заранее заданное количество т «худших» решений; для каждого из них генерируется случайное число к в диапазоне [0, 1], и если значение к для решения оказывается больше значения заданной вероятности р, гнездо-решение удаляется; вместо удаленного решения формируется новое; I полагается равным количеству уничтоженных векторов-решений, переход на шаг 2.

Иначе выбирается лучшее решение с минимальным значением М8Б(0) и выход из алгоритма.

Градиентный метод рано или поздно застревает в локальном минимуме, т.е. при текущей итерации не может улучшить решение, полученное ранее. Решением этой проблемы может быть применение метаэвристического алгоритма «кукушкин поиск», который в силу своего стохастического характера слабо неуязвим для локальных оптимумов. Целесообразно начинать работу гибридного алгоритма с алгоритма «кукушкин поиск», поскольку заранее неизвестно, насколько удачны начальные параметры нечеткой системы.

Статистические информационные критерии

Компактность нечеткой системы определяется количеством самих нечетких правил и количеством антецедентных и консеквентных параметров в пра-

вилах. В нашей работе компактность определяется как сумма количества правил и количества нечетких термов.

Как правило, ошибка MSE на обучающих данных уменьшается по мере усложнения модели, т.е. увеличения числа правил и нечетких термов. Для соблюдения компромисса между компактностью и точностью модели можно использовать три статистических информационных критерия: критерий AIC (Akaike Information Criterion) и BIC (Bayesian Information Criterion), HQC (Hannan-Quinn Information Criterion) [24]. Алгебраически критерии выражаются через сумму меры ошибки модели и штрафа за число параметров модели. Информационный характер критериев связан с концепцией информации Кульбака-Лейблера. Различия между критериями заключаются в определении штрафа (второе слагаемое). С учетом специфики нечеткого моделирования k-я сгенерированная система будет иметь следующие оценки [22]:

AIC(k ) = ln MSE(0, d) + — (ma +1 + cR), m

ln m

BIC(k ) = ln MSE(0, D) +-(ma +1 + cR),

m

HQC(k) = lnMSE(0, D) + 2ln(lnm) (ma +1 + cR),

m

где m - количество наблюдений; ma - общее число параметров правил; R - число правил; c - эмпирический коэффициент; учитывающий относительную стоимость каждого правила [24].

Согласно приведенным выше критериям из множества сгенерированных систем выбирается та, у которой значение оценки критерия минимально. Таким образом, достигается компромисс между компактностью и точностью системы.

Пошаговое описание выполнения методики

Входными данными для построения нечеткой системы являются данные, сформированные специалистом, выход - компактная и точная система. Ниже приведено пошаговое описание предлагаемой методики.

НАЧАЛО

Шаг 1. Выполнить формирование исходных данных.

Шаг 2. Задать максимальное количество правил Rm.

Шаг 3. ЕСЛИ функция принадлежности гауссо-вого типа,

ТО сгенерировать множество структур алгоритмом КЛИ, содержащим правил не больше Rm, перейти на шаг 4;

ИНАЧЕ ЕСЛИ функция принадлежности треугольного типа,

ТО сгенерировать множество структур алгоритмом ДРВП, содержащим правил не больше Rê, перейти на шаг 4;

ИНАЧЕ ВЫХОД.

Шаг 4. Оценить каждую полученную структуру статистическими информационными критериями AIC, BIC, HQC. Сформировать множество S, состоящее из структур с минимальным значением лю-

бого критерия среди структур с одинаковым количе -ством нечетких правил.

Шаг 5. Извлечь структуру из 5"; у:=0; М8Б& а0:=®.

Шаг 6.¡:=;+1;

Шаг 7. Оптимизировать параметры антецедентов 0 алгоритмом «кукушкин поиск».

Шаг 8. Оптимизировать параметры антецедентов 0 алгоритмом градиентного спуска.

Шаг 9. Оптимизировать параметры консеквен-тов Б рекуррентным алгоритмом наименьших квадратов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Шаг 10. ЕСЛИ МББйо,^ МББйо,-, ТО перейти на шаг 6.

Шаг 11. ЕСЛИ 5 не пусто, ТО перейти на шаг 5.

Шаг 12. Оценить каждую нечеткую систему статистическими информационными критериями.

Шаг 13. ЕСЛИ система после оптимизации параметров показала результаты лучше по двум или более критериям, ТО выбрать оптимизированные системы и перейти на шаг 14.

Шаг 14. Выбрать нечеткую систему путем ранжирования по сумме критериев.

КОНЕЦ

Здесь МББйи обозначает среднеквадратичную ошибку вывода нечеткой системы на обучающей части таблицы наблюдений. Следует заметить, что все оценки критериев на шагах 4 и 12 проводились на тестовой части таблицы наблюдений, т.е. на данных, которые не входили в этапы формирования структур (шаг 3) и оптимизации параметров (шаги 7-10).

Результаты этапа

Эксперимент

Исследование методики проводилось при решении задач аппроксимации по схеме кросс-валидации на трех наборах данных из репозитория KEEL (http://www.keel.es): ELE-1 (2; 495), Quake (3; 2178), Friedman (5; 1200), здесь в скобках указаны количество входных переменных и общее количество образцов в таблице наблюдений, соответственно.

На этапе структурной идентификации генерируется множество структур алгоритмом кусочно-линейной инициализации. Параметр алгоритма «отклонение» меняется от среднеквадратичной ошибки аппроксимирующей линии регрессии до значения, которому соответствует количество правил в нечеткой системе, равное шести, с интервалом в 1% от ошибки линии регрессии. Лучшие структуры, отобранные по статистическим информационным критериям, приведены в табл. 1, которая представляет собой множество S на шаге 4 методики. Здесь Data -наименование набора данных, N - количество сгенерированных структур, R - количество нечетких правил, MSEtm - среднеквадратичная ошибка вывода нечеткой системы на обучающей части таблицы наблюдений, MSEtst - среднеквадратичная ошибка на тестовой части таблицы наблюдений, AIC, BIC и HQC - значения статистических информационных критериев.

На рис. 1 показаны значения критериев и количества правил для нечетких систем, сгенерированных для набора данных Friedman после выполнения шага 3 методики.

Таблица 1

Data N R MSEtra MSEtsf AIC BIC HQC

1 389540 476950 13,105 13,256 13,129

2 497905 457351 13,089 13,366 13,133

ELE-1 26 3 489137 442391 13,081 13,483 13,144

4 433578 404435 13,016 13,545 13,100

5 353234 413880 13,065 13,719 13,168

6 355111 404474 13,067 13,847 13,190

1 0,03508 0,03798 -3,262 -3,202 -3,252

2 0,03507 0,03785 -3,257 -3,146 -3,239

Quake 16 3 0,03510 0,03790 -3,248 -3,084 -3,222

4 0,03504 0,03914 -3,207 -2,992 -3,174

6 0,03510 0,03952 -3,182 -2,863 -3,132

1 7,262 7,127 1,989 2,136 2,012

2 6,677 6,410 1,906 2,187 1,950

Friedman 30 3 6,489 6,440 1,933 2,349 1,999

4 5,912 5,900 1,869 2,419 1,956

5 4,927 4,721 1,669 2,353 1,777

На этапе оптимизации параметров производился поиск оптимальных параметров для каждой структуры из табл. 1. Значения статистических информационных критериев и среднеквадратичные ошибки полученных систем после настройки параметров приведены в табл. 2 (результат работы шага 12 методики).

По результатам работы двух этапов (см. табл. 1 и 2) сформирован набор нечетких систем с минимальными значениями критериев, и далее путем ранжирования по сумме критериев была выбрана лучшая нечеткая система. Полученные результаты

приведены в табл. 3, здесь поле X соответствует сумме рангов трех информационных критериев.

Из табл. 3 видно, что нечеткая система с четырьмя правилами имеет наименьшее значение суммы рангов, равное для набора данных ELE1. Для набора данных Quake наилучшее значение суммы рангов имеет нечеткая система с одним правилом, а для набора данных Friedman - система с тремя правилами. Таким образом, выбранные нечеткие системы будут рекомендованы для аппроксимации указанных наборов данных.

IC AI

и р

ер рите

е ач

н

00 1,6

2,6

и

рит кр

еч а н

го

2,1

О

C Q

H

1,8

- и ач

н

го 1,7

1

Количество правил R

Количество правил R

Количество правил R

а б в

Рис. 1. Значение статистических информационных критериев нечетких систем после этапа формирования структуры для набора данных Friedman. Значения критериев: AIC - а; BIC - б; HQC - в

Таблица 2

Результаты этапа оптимизации параметров__

Data R MSEtra MSEtst AIC BIC HQC

1 389535 478138 13,239 13,82 13,324

2 364092 498897 13,423 14,513 13,582

ELE-1 3 356150 522588 13,611 15,209 13,844

4 350950 460548 13,626 15,732 13,934

5 276579 1635828 15,035 17,65 15,417

6 264097 788690683 21,355 24,478 21,811

1 0,03508 0,03798 -3,225 -2,992 -3,188

2 0,03477 0,03803 -3,141 -2,489 -3,038

Quake 3 0,03474 0,03689 -3,213 -2,77 -3,142

4 0,03455 0,03874 -3,081 -2,219 -2,945

6 0,03413 0,04148 -2,930 -1,649 -2,727

1 7,262 7,127 2,081 2,603 2,162

2 4,663 4,467 1,722 2,730 1,879

Friedman 3 2,513 2,270 1,153 2,646 1,387

4 2,444 2,401 1,318 3,297 1,627

5 1,781 2,134 1,308 3,773 1,694

Таблица 3

Выбор лучшей нечеткой системы по сумме рангов

Data

R

MSEtra

MSEtst

AIC

Значение

Ранг

BIC

Значение

Ранг

HQC

Значение

Ранг

X

ELE-1

389540

476950

13,105

13,256

13,129

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

497905

457351

13,089

13,366

13,133

489137

442391

13,081

13,483

13,144

433578

404435

13,016

13,545

13,1

353234

413880

13,065

13,719

13,168

355111

404474

13,067

13,847

13,19

10

11

12

15

Quake

0,03508

0,03798

-3,225

-2,992

-3,188

0,03477

0,03803

-3,141

-2,489

-3,038

0,03474

0,03689

-3,213

-2,77

-3,142

0,03455

0,03874

-3,081

-2,219

-2,945

0,03413

0,04148

-2,93

-1,649

-2,727

12

15

Friedman

7,262

7,127

1,989

2,136

2,012

4,663

4,467

1,722

2,730

1,879

2,513

2,270

1,153

2,646

1,387

2,444

2,401

1,318

3,297

1,627

1,781

2,134

1,308

3,773

1,694

11

11

10

1

6

1

2

9

2

5

2

3

3

4

3

4

4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1

4

1

6

5

2

5

5

6

3

6

6

1

1

1

1

3

2

3

3

3

9

3

2

2

2

6

4

4

4

4

6

5

5

5

1

5

1

5

2

4

3

4

3

1

2

1

4

4

3

4

2

9

5

2

5

3

Результаты проведенных экспериментов были сопоставлены с результатами работы четырех методов построения нечетких систем типа Такаги-Суге-но [27] и приведены в табл. 4. Краткое описание указанных методов приведено ниже.

ANFIS-SUB - адаптивная нейро-нечеткая система, использующая субтрактивную кластеризацию.

Т8К-ЖЬ - метод, использующий индуктивный алгоритм для структурной идентификации нечеткой модели, параметрическая идентификация выполнялась при помощи эволюционного метода.

ЬБЬ-Т8К - метод, основанный на комбинации индуктивного алгоритма для структурной идентификации и эволюционной стратегии для параметрической идентификации.

МБТ8К-ИВе - масштабируемый двухэтапный метод нечеткого моделирования; структурная идентификация выполняется при помощи генетического алгоритма, для параметрической идентификации используется комбинация генетического алгоритма и фильтра Калмана [27].

Из табл. 4 видно, что при сопоставимой точности (поле М8Б18/) количество нечетких правил (поле К) в системах, построенных по предлагаемой методике, существенно меньше, что соответствует цели работы - построение компактных и точных нечетких систем.

Таблица 4

Сравнение результатов работы

Data ANFIS-SUB TSK-IRL LEL-TSK METSK-HDe Наша методика

R MSEtsf R MSEtsf R MSEtsf R MSEtsf R MSEtsf

ELE-1 2S 430000 19 414S00 27 4S0400 11 404400 4 404435

Quake 40 0,31 102 0,046 127 0.0616 1S 0,0362 1 0,0379S

Friedman 54 6,316 3055 2,S3S 435 2,14 66 3,776 3 2,270

Заключение

В работе предложена методика построения нечетких систем типа Такаги-Сугено, включающая этапы формирования исходных данных, идентификацию структуры нечеткой системы, оптимизацию параметров антецедентов и консеквентов нечетких правил и выбор оптимальной системы по точности и сложности.

Работоспособность нечетких аппроксиматоров, построенных по разработанной методике, проверена на трех наборах данных из репозитария KEEL.

Последовательная и независимая схема идентификации нечетких систем себя исчерпала, выбрать какой-либо один эффективный алгоритм решения проблемы оптимизации не представляется возможным ввиду сложности и многоплановости самой проблемы, поэтому методика предполагает совместное использование алгоритмов и эвристик одновременно. Дальнейшее развитие предложенной методики заключается в распараллеливании отдельных этапов и процедур.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 16-07-00034а.

Литература

1. Takagi T. Fuzzy identification of systems and its application to modeling and control / T. Takagi, M. Sugeno // IEEE Transaction Systems, Man and Cybernetics. - 1985. -Vol. 15, No. 1. - P. 116-132.

2. Tron E. Mathematical modeling of observed natural behavior: a fuzzy logic approach / E. Tron, M. Margaliot // Fuzzy Sets and Systems. - 2004. - Vol. 146. - P. 437-450.

3. Ходашинский И.А. Идентификация нечетких систем: методы и алгоритмы // Проблемы управления. - 2009. -№ 4. - С. 15-23.

4. Abonyi J. Cluster Analysis for Data Mining and System Identification / J. Abonyi, B. Feil. - Birkhauser, 2000. -319 p.

5. Yager R. Generation of fuzzy rules by mountain method / R. Yager, D. Filev // Journal of Intelligent & Fuzzy Systems. - 1994. - Vol. 2. - P. 209-219.

6. Sadrabadi M.R. Identification of the linear parts of nonlinear systems for fuzzy modeling / M.R. Sadrabadi, M.H.F. Zarandi // Applied Soft Computing. - 2011. - Vol. 11. -P. 807-819.

7. T-S fuzzy model identification based on a novel fuzzy ¿■-regression model clustering algorithm / C. Li, J. Zhou, Q. Li,

X. Xiang, X. An // Engineering Applications of Artificial Intelligence. - 2009. - Vol. 22. - P. 646-653.

8. Soltani M. A novel fuzzy c-regression model algorithm using a new error measure and particle swarm optimization / M. Soltani, A. Chaari, F. Ben Hmida // International Journal of Applied Mathematics and Computer Science. -2012. - Vol. 22, No. 3. - P. 617-628.

9. Handbook of Metaheuristics / Editors M. Gendreau, J.-Y. Potvin. - Springer, 2010. - 669 p.

10. Ishibuchi H. Repeated double cross-validation for choosing a single solution in evolutionary multi-objective fuzzy classifier design / H. Ishibuchi, Y. Nojima // Knowledge-Based Systems. - 2013. - Vol. 54. - P. 22-31.

11. Nguyen C.H. A discussion on interpretability of linguistic rule based systems and its application to solve regression problems / C.H. Nguyen, V.T. Hoang, V.L. Nguyen // Knowledge-Based Systems. - 2015. - Vol. 88. - P. 107-133.

12. Gorzalczany M.B. A multi-objective genetic optimization for fast, fuzzy rule-based credit classification with balanced accuracy and interpretability / M.B. Gorzalczany, Rudzinski F. // Applied Soft Computing. - 2016. - Vol. 40. -P. 206-220.

13. Galende-Hernandez M. Complexity reduction and interpretability improvement for fuzzy rule systems based on simple interpretability measures and indices by bi-objective evolutionary rule selection / M. Galende-Hernandez, G.I. Sainz-Palmero, M.J. Fuente-Aparicio // Soft Computing. -2012. - Vol. 16. - P. 451-470.

14. Pulkkinen P. A Dynamically Constrained Multiobjective Genetic Fuzzy System for Regression Problems / P. Pulkkinen, H. Koivisto // IEEE Transaction on Fuzzy Systems. - 2010. - Vol. 18, No. 1. - P. 161-177.

15. Alcala R. A Fast and Scalable Multiobjective Genetic Fuzzy System for Linguistic Fuzzy Modeling in High-Dimensional Regression Problems / R. Alcala, M.J. Gacto, F. Herrera // IEEE Transaction on Fuzzy Systems. - 2011. -Vol. 19, No 4. - P. 666-681.

16. Antonelli M. An efficient multi-objective evolutionary fuzzy system for regression problems / M. Antonelli, P. Ducange, F. Marcelloni // International Journal of Approximate Reasoning. - 2013. - Vol. 54, No 9. - P. 1434-1451.

17. Горбунов И.В. Методы построения трехкритери-альных Парето-оптимальных нечетких классификаторов / И.В. Горбунов, И.А. Ходашинский // Искусственный интеллект и принятие решений. - 2015. - № 2. - С. 75-87.

18. Ходашинский И.А. Алгоритмы поиска компромисса между точностью и сложностью при построении нечётких аппроксиматоров / И.А. Ходашинский, И.В. Горбунов // Автометрия. - 2013. - Т. 49, № 6. - С. 51-61.

19. A Review of the Application of Multiobjective Evolutionary Fuzzy Systems: Current Status and Further Direc-

tions / M. Fazzolari, etc. // IEEE Trans. Fuzzy Systems. -

2013. - Vol. 21, No. 1. - P. 45-65.

20. Alcala-Fdez J. Genetic learning of accurate and compact fuzzy rule based systems based on the 2-tuples linguistic representation / J. Alcala-Fdez, J. Otero // International Journal of Approximate Reasoning. - 2007. - Vol. 44. - P. 45-64.

21. A new method for designing neuro-fuzzy systems for nonlinear modelling with interpretability aspects / K. Cpalka, K. Lapa, A. Przybyl, M. Zalasinski // Neurocomputing. -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2014. - Vol. 135. - P. 203-217.

22. Yen J. Application of Statistical Information Criteria for Optimal Fuzzy Model Construction / J. Yen, L. Wang // IEEE Transaction on Fuzzy Systems. - 1998. - Vol. 6, No 3. -P. 362-372.

23. Zhou S.-M. Low-level interpretability and high-level interpretability: a unified view of data-driven interpretable fuzzy system modeling / S.-M. Zhou, J.Q. Gan // Fuzzy Sets and Systems. - 2008. - Vol. 159. - P. 3091-3131.

24. Ходашинский И.А. Построение компактных и точных нечетких моделей на основе статистических информационных критериев // Информатика и системы управления. - 2014. - № 1 (39). - С. 99-107.

25. Сарин К.С. Три алгоритма генерации структуры нечеткой системы типа Такаги-Сугено / К.С. Сарин, И.А. Ходашинский // Знания-Онтологии-Теории (ЗОНТ-2015): матер. Всерос. конф. с междунар. участием. Российская академия наук, Сибирское отделение; Институт математики им. С. Л. Соболева, 2015. - С. 124-132.

26. Yang X.-S. Engineering optimisation by cuckoo search / X.-S. Yang, S. Deb // Int. J. Mathematical Modelling and Numerical Optimisation. - 2010. - Vol. 1, №э. 4. -P. 330-343.

27. METSK-HDe: A multiobjective evolutionary algorithm to learn accurate TSK-fuzzy systems in high-dimensional and large-scale regression problems / M.J. Gacto, M. Galende, R. Alcalá, F. Herrera // Information Sciences. -2014. - Vol. 276. - P. 63-79.

Ходашинский Илья Александрович

Д-р техн. наук, профессор каф. комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) ТУСУРа Тел.: +7 (382-2) 90-01-11 Эл. почта: hodashn@rambler.ru

Cарин Константин Сергеевич

Ассистент каф. КИБЭВС ТУСУРа

Тел.: +7 (382-2) 70-15-29

Эл. почта: sks@security.tomsk.ru

Hodashinsky I.A., Sarin K.S.

Technique for designing accurate and compact Takagi-Sugeno fuzzy systems

The paper presents the new technique to design accurate and compact Takagi-Sugeno fuzzy systems. The technique includes the following steps: forming the initial data, the generation of fuzzy system structure, optimization of parameters consequent and antecedents of fuzzy rules. The compromise between compactness and accuracy of the model is achieved by using three statistical information criteria: Akaike, Bayes-ian, Hannan-Quinn Information Criterion. Results of experiments on the approximation of the actual data are delivered. Simulation experiments show validation of the proposed technique.

Keywords: Takagi-Sugeno fuzzy systems, dynamic partitioning, piecewise linear initialization, cuckoo search algorithm, recursive least squares method, statistical information criteria.

i Надоели баннеры? Вы всегда можете отключить рекламу.