УДК 004.021 ББК 32.813.55
АЛГОРИТМ ЛОКАЛЬНОЙ НАСТРОЙКИ СИСТЕМ НЕЧЁТКОГО ЛОГИЧЕСКОГО ВЫВОДА ТИПА МАМ ДАНИ С СОХРАНЕНИЕМ ИНТЕРПРЕТАБЕЛЬНОСТИ ПРОДУКЦИОННЫХ
ПРАВИЛ
Голосовский М. С.1
(Государственный научно-исследовательский испытательный институт военной медицины Минобороны России, Москва)
Приведён алгоритм локальной подстройки систем Мамдани с сохранением интерпретабельности продукционных правил нечёткого логического вывода, что позволяет решить проблему настройки экспертной системы на основании статистических данных или на основании информации о точном (чётком) значении выхода системы для определённого значения входов.
Ключевые слова: нечёткий логический вывод, системы Мамдани, системы Сугено, нечёткое моделирование, локальная настройка.
1. Введение
Теория нечётких множеств как инструмент, позволяющий учитывать неопределённость, а также применять выражения естественного языка для описания данных, предложен Л. Заде в 1965 году [4]. В 1993 году Б. Коско в доказал теорему [13], согласно которой система нечёткого логического вывода типа Мамдани равномерно аппроксимирует функцию /. X ^ У, если множество X компактно и функция / непрерывна. Теорема ут-
1 Михаил Сергеевич Голосовский, младший научный сотрудник (^01080У8к1у@уапйех. ги).
верждает, что для любой константы е > 0, можно подобрать такую систему нечёткого логического вывода F(x), использующую центроидный метод дефаззификации, что будет выполняться условие
(1) (х) - /(х)| < е, Ух е X, е > 0.
Следствием теоремы определяется необходимость выполнения соотношения для получения заданной точности е [2]:
где g - число перекрытий функций принадлежности входных переменных. Согласно этому условию для систем типа Мамда-ни увеличение числа пересекающихся функций в терм-множествах входных переменных требует уменьшения расстояния между ядрами функций принадлежности выходных переменных. В работе [14] приведено доказательство, что число правил вывода должно быть не меньше числа экстремумов аппроксимируемой функции. Тем не менее доказательства обоснования минимального числа правил вывода, обеспечивающих заданную точность аппроксимации для нечётких систем типа Мамдани, нет. Одними из наиболее распространённых методов синтеза систем нечёткого вывода типа Мамдани являются экспертные методы [1, 3, 5-9, 16]. Это обусловлено тем, что применение лингвистических переменных и правил вывода предполагает моделирование человеческого мышления и использование экспертных суждений в терминах «ЕСЛИ, ТО» в качестве источника знаний о процессе функционирования моделируемой системы [15]. Но использование только экспертных методов накладывает ограничение на размер системы в связи с тем, что средний человек способен одновременно оперировать 4-9 единицами информации [17] и эксперту весьма сложно представить нечёткую модель, содержащую более двух входов, и со сложной зависимостью выхода от входов. Для настройки моделей в условиях, когда получение информации от экспертов затруднено или невозможно, применяют способы настройки системы на основе имеющейся статистической информации [12]. Одними из
наиболее часто применяемых инструментов подстройки модели являются нейронные сети или генетические алгоритмы. Но ней-росетевые и генетические алгоритмы дают хорошие результаты при условии наличия большой по объёму обучающей выборки. При этом как класс систем нечеткого логического вывода, больше ориентированный на точность соответствия выходного значения моделируемой зависимости, выделяются системы типа Сугено. Системы Сугено первого порядка, использующие в качестве заключений правил константы, содержат меньшее число требуемых для подстройки параметров, чем аналогичные системы типа Мамдани, за счёт чего активно используются в адаптивных системах, как пример в нейро-нечётких моделях [8]. В связи с чем в статье предлагается выполнить преобразование системы типа Мамдани к системе типа Сугено.
Отдельный вопрос в части настройки систем Мамдани касается сохранения интерпретабельности продукционных правил [10]. В работе [11] проведено исследование подходов к определению термина «интерпретабельность» и способов её измерения для систем нечёткого логического вывода. В этой работе интерпретабильность определена как способность системы выразить своё поведение в понятном для восприятия человеком виде. Поскольку определение субъективное, для его уточнения выделены основные два направления:
- интерпретабельность, определяемая сложностью модели -выражающаяся в числе продукционных правил, числе входных переменных и числе функций принадлежности в терм-множествах: уменьшение указанных характеристик упрощает интерпретацию модели экспертом;
- семантическая интерпретабельность - выражающаяся в сохранении семантической корректности значений переменных, функций принадлежности и их взаимоотношений, а также последовательностью и различимостью продукционных правил.
В предложенном алгоритме при настройке модели число выходных и выходных переменных, а также число продукционных правил изменяться не будет. Поэтому под сохранением ин-терпретабельности модели и продукционных правил будет пониматься сохранение семантической интерпретабельности.
С учётом введённых ограничений, разработан следующий алгоритм настройки систем Мамдани с сохранением интерпре-табельности настраиваемой модели:
Шаг 1. Выполнение прямого преобразования системы типа Мамдани к системе типа Сугено.
Шаг 2. Выполнение точной локальной подстройки системы нечёткого логического вывода типа Сугено.
Шаг 3. Выполнение обратного преобразования системы типа Сугено к системе типа Мамдани.
Шаг 4. Применение лингвистических модификаторов к лингвистическим значениям изменённых в процессе настройки функций принадлежности выходной переменной.
2. Прямое и обратное приведение систем типа Мамдани к системам типа Сугено
Рассмотрим класс систем Мамдани, которые возможно быстро приводить к системам типа Сугено и обратно без потери в точности вычислений и сохранением интерпретабельности модели. Для этого наложим на систему Мамдани следующие ограничения:
- у каждого продукционного правила только одна функция принадлежности в заключении;
- функции принадлежности в терм-множествах лингвистических переменных из заключений продукционных правил симметричны, ширина и форма их одинакова;
- дефаззификация производится по методу центра тяжести. Если использовать симметричные функции принадлежности в заключении правил, как показано на рис. 1, то вычисление результирующего значения у по методу центра тяжести:
да
| х/и(х)
(3) у =
— да
да
I и(х)
—да
где х - переменная, соответствующая выходной лингвистической переменной, ^(х) - функция принадлежности нечёткого множества, можно свести к формуле
Zwb
1 i
(4) У
w
где y - результирующее значение системы нечёткого логического вывода; wt - степень истинности заключения /-го правила; bi - ядро функции принадлежности - точка, в которой значение функции принадлежности равно 1: [(b,) = 1. Формула (4) соответствует выводу для систем Сугено первого порядка, при котором значение функции заключения равно константе: fx) = const. Для рассматриваемой системы значение константы заключения правила в системе Сугено совпадает со значением ядра функции принадлежности системы Мамдани, что делает возможным прямой и обратный переход от системы одного типа к системе другого типа.
w1
w2
bi
Рис. 1. Срабатывание заключений правил нечёткого логического вывода для двух функций
1=1
x
b
3. Точная локальная подстройка системы нечёткого логического вывода типа Сугено
В системе нечёткого вывода типа Сугено формирование результирующего значения осуществляется по формуле
(5) У
М + ™2Ъ2 + ••• + ™„Ь„
W1 + W. + ••• + W
12 „
2
В случае если параметры входных переменных системы нечёткого логического вывода остаются неизменными, степень истинности заключения каждого правила для фиксированного чёткого входного значения Wi останется неизменной. Тогда результирующее значение у зависит только от значения заключения каждого правила Ь, причём одному и тому же значению у могут соответствовать разные наборы значений ЬЕсли в системе только два правила, то эти наборы значений будут лежать на некоторой прямой, которая задаётся общим уравнением прямой:
(6) + — у ^ + w2) = 0.
В системе из трёх правил наборы значений будут лежать на плоскости, заданной общим уравнением:
(7) wlbl + w2b2 + — у+ w2 + w3) = 0 .
В случае для системы из п правил наборы возможных значений для точечной подстройки системы будут лежать на (п - 1)-мерной фигуре или (п - 1)-мерном аналоге двумерной плоскости, заданной общим уравнением:
(8) ^Ь1 + М>2Ь2 + + ••• + w„b„ — УК + ^ + ^ + ••• + ^ ) = 0.
Пусть для заданного значения входных переменных системой нечёткого логического вывода формируется выходное значение у, обусловленное заданным значением параметров (Ьь Ь2, ..., Ьп). Требуется скорректировать это значение параметров таким образом, чтобы получить значение новое значение у. Так как количество вариантов подстройки, как комбинаций точек, лежащих на фигуре, заданной общим уравнением по формуле (8), бесконечно, то в качестве критерия выберем кратчайшее расстояние от точки на текущей поверхности до точки на новой поверхности - перпендикуляр от текущей точки до поверхности с новым состоянием системы. В этом случае каждый новый параметр будет рассчитан по следующей формуле:
2 2 2 2 W, + W9 + w2 +... + w
12 3 n
b>=b _ w W1b1 + w2b2 + w3b3 + ... + wnbn - -KW1 + W2 + W3 + ... + Wn ) =
(9) v , v
= b - w,. -^—
n
w,2
L
i=1
В соответствии с формулой (9), форма функций принадлежности на скорость подстройки модели не влияет. Форма функций принадлежности будет оказывать влияние только на форму поверхности нечёткого логического вывода.
Рассмотрим результаты работы формулы подстройки на примере системы Сугено с одним входом и одним выходом для различного числа входных функций принадлежности (возьмём 5, 11, 21 шт.), и двух видов типов ФП - гауссовых, и треугольных. Графическое представление терм-множеств входных переменных приведено на рис. 2. Область определения входной переменной [0, 10].
Для каждой входной ФП в системе задано правило нечёткого логического вывода (НЛВ). При начальных настройках система НЛВ реализует зависимость y(x) = 2 для любого x, принадлежащего интервалу [0, 10]. С применением рассматриваемого алгоритма подстройка системы будет производиться до целевого значения y(x0) = 7, где x0 - специальная точка, выбранная на области определения. Зависимость чёткого значения выхода системы НЛВ (выходное значение системы) от четких значений входов системы НЛВ (входные значения системы) носит название поверхности нечёткого логического вывода. Рассмотрим следующие зависимости подстройки системы. Первая - зависимость подстраиваемой поверхности НЛВ от количества ФП входной переменной, вторая - зависимость вида поверхности НЛВ от выбора x (в точке экстремума ФП, в точке пересечения ФП, в промежуточной точке между точкой экстремума и точкой пересечения ФП). Графики поверхностей НЛВ настроенных систем с числом функций принадлежности (MF - membership function) 5, 11, 21 представлены на рис. 3.
Рис. 2. Графическое представление терм-множеств входных переменных
На основании полученных графиков можно сделать следующий вывод: чем больше функций принадлежности у входной переменной, тем шире затрагиваемая область изменений. У гауссовых функций принадлежности, в связи с тем, что они являются ФП с бесконечным носителем, изменения могут затрагивать всю область значения выходной переменной. При этом поверхности гауссова типа дают гладкие поверхности нечёткого логического вывода. Для более независимой и локальной подстройки системы нечёткого логического вывода требуется увеличение числа функций принадлежности. Но большое число ФП увеличивает количество правил. В этом случае можно создавать системы с неравномерным распределением ФП и увеличивать количество функций
принадлежности в точках, где велико число подстраиваемых элементов и высока сложность подстраиваемой поверхности.
Рис. 3. Графики поверхностей НЛВ настроенных систем с разным числом ФП
На основании полученных графиков можно сделать следующий вывод: чем больше функций принадлежности у входной переменной, тем шире затрагиваемая область изменений. У гауссовых функций принадлежности, в связи с тем, что они являются ФП с бесконечным носителем, изменения могут затрагивать всю область значения выходной переменной. При этом поверхности гауссова типа дают гладкие поверхности нечёткого логического вывода. Для более независимой и локальной подстройки системы нечёткого логического вывода требуется увеличение числа функций принадлежности. Но большое число ФП увеличивает количество правил. В этом случае можно создавать системы с неравномерным распределением ФП и увеличивать количество функций принадлежности в точках, где велико число подстраиваемых элементов и высока сложность подстраиваемой поверхности.
На рис. 4 представлены графики функций поверхности НЛВ с 11 ФП у входной переменной, с подстроенным
значениему(х0) = 7 при х0 = 5, х0 = 4,75, х0 = 4,5.
о 8
5
Б т
а Я 6
Я <
2 2 о >Ь
5 5 4
0 и 3
и «
5
Б
1 3 6
2 а
с ^
5 3 4
с «
3
СО 2
О
Входное значение системы
Рис. 4. Графики функций поверхности НЛВ с подстроенным значением у(х0) = 7 при х0 = 5, х0 = 4,75, х0 = 4,5
При подстройке в точке максимума ФП входной переменной и в точке пересечения ФП входных переменных при равномерном распределениии ФП график поверхности НЛВ имеет симметричную форму. Это связано с тем, что участок входных ФП будет также симметричным. Отличие для подстройки в точке экстремума ФП или в точке пересечения двух соседних ФП будет заключаться в ширине пика результирующей поверхности, который будет шире для точки пересечения ФП, так как в этом случае происходит равномерная подстройка выходного значения системы для двух входных ФП. При промежуточном положении входного значения симметрия нарушается. И в этом случае максимальное четкое значение, получаемое на выходе системы НЛВ, может принимать значения большие, чем значение системы, под которое происходит подстройка.
Входное значение системы
4. Применение лингвистических модификаторов для корректировки значений лингвистической переменной функций заключения
Решение задачи сохранения интерпретабельности модели получим за счёт введения понятия опорных функций принадлежности и лингвистического модификатора, позволяющего определить лингвистическое значение новой функции принадлежности относительно ближайших соседних опорных функций. Опорные функции принадлежности задаются для выходной лингвистической переменной таким образом, что расстояние между ядрами любых двух соседних функций принадлежности одинаковое. Рекомендуется задавать минимум 5 опорных ФП. Это обусловлено тем, что для интерпретации модели требуется указать по одной ФП с каждого края интервала области определения лингвистической переменной, одну ФП - посередине интервала области определения и по одной ФП - между центральной и граничными ФП. Для каждой опорной функции принадлежности задаются лингвистические значения, относительно которых будет определяться новое лингвистическое значение ФП, полученной в результате подстройки системы.
Пусть М = и(х) - опорная функция принадлежности выходной переменной с номером / е [1, Л], где N - число опорных функций принадлежности. Зададим лингвистическую переменную «Лингвистический модификатор» и далее рассмотрим переменную, состоящую из пяти треугольных функций принадлежности Млм, = ^лму(х), где , е [1, 5] - номер функции принадлежности. Число 5 выбрано для примера и может быть увеличено. Основное ограничение: одна функция принадлежности должна быть в центре интервала и по одной функции принадлежности - по краям интервала. Область определения переменной «Лингвистический модификатор» задана на интервале (-Ах, Ах), где Ах - расстояние между ядрами двух соседних опорных функций принадлежности. Графическое представление лингвистической переменной «Лингвистический модификатор» приведено на рис. 5.
Рис. 5. Графическое представление лингвистической переменной «Лингвистический модификатор»
М' - функция принадлежности заключения одного из правил системы, у которой положение ядра относительно оси X настроено с использованием оптимизирующего алгоритма. Вычисление нового лингвистического значения функции принадлежности М' с использованием лингвистического модификатора производится по следующему алгоритму:
Шаг 1. Если ядро Ь' функции принадлежности М' совпадает с ядром 7-й опорной функции принадлежности Ьг, то функции принадлежности М' присваивается лингвистическое значение ФП М7. Работа алгоритма останавливается. Иначе производится переход на Шаг 2.
Шаг 2. Вычисляется расстояние между ядрами двух соседних опорных функций принадлежности:
(10) Лг = Ь2 - Ьь
Шаг 3. Производится поиск двух соседних опорных ФП М7 и М7+1, между ядрами которых расположено ядро подстроенной функции принадлежности. Для чего проверяется условие
(11) Ьг < Ь' < Ьт.
Шаг 4. Вычисляется смещение ядра подстроенной функции принадлежности относительно ядер ФП Мг и Мг+1:
(12) Г = Ь' - Ьг,
(13) Гг+1 = Ь' - Ьг+1.
Шаг 5. Производится отбор функций принадлежности лингвистического модификатора, у которых значение максимально для входных аргументов х, и хг+1.
(14) Mi = м(х) | max ^дму(хг),
(15) Ы'г = м(х) | max Цлм(хт).
Шаг 6. Вычисляются модифицированные значения опорных функций принадлежности md(M) как прибавление лингвистического значения ФП модификатора к лингвистическому значению опорной ФП:
(16) md(Mi) = lingv(M\) + lingv(M),
(17) md(Mi+1) = lingv(M'2) + lingv(Mm).
Поскольку в формулах (15) и (16) производится сложение строковых лингвистических значений, то свойство коммутативности операции сложения нарушается, и важно сохранять порядок следования элементов операции.
Шаг 7. Вычисляется результирующее лингвистическое значение ФП M' как модифицированные лингвистические значения опорных функций принадлежности, объединённые союзом «И».
(18) lingv(M') =md(Mi) И md(Mm).
Рассмотрим пример выполнения алгоритма. На рис. 6 изображено графическое представление лингвистической переменной «Сложность», используемой в качестве выходной переменной системы нечёткого логического вывода. Название переменной приведено для примера и может интерпретироваться как сложность решения некоторого набора задач, для оценки которых настраивается система НЛВ. Опорные функции принадлежности. М1 - очень маленькая, М2 - маленькая, М3 - средняя, М4 - большая, М5 - очень большая - показаны сплошной линией и равномерно распределены по области определения [0, 1]. M' - функция принадлежности заключения одного из правил системы, у которой положение ядра относительно оси X настроено с использованием оптимизирующего алгоритма.
В соответствии с формулой (10), расстояние между соседними функциями принадлежности Ах = 0,25. Опорные функции принадлежности, между которыми расположена ФП M'. М2 - маленькая, М3 - средняя. В соответствии с (12) и (13), вы-
численные значения смещения ядер х, = 0,17 и хг+1 = -0,08. На основании полученных значений смещения ядер отобраны функции принадлежности: М\ = «Больше чем» и М'2 = «Меньше чем», при помощи которых получены модифицированные значения опорных функций принадлежности шё(М2) = «Больше чем маленькая» и шё(М2) = «Меньше чем средняя». Результирующее лингвистическое значение М\ в соответствии с (18), будет представлено как: М' = «больше чем маленькая и меньше чем средняя».
1
0 0,25 0,42 0,5 0,75 1 ' x
Сложность
Рис. 6. Графическое представление лингвистической переменной «Сложность» с опорными функциями и новой функцией М'
5. Заключение
Предложенный алгоритм позволяет решить задачу точечной подстройки систем типа Мамдани с сохранением интерпре-табельности правил нечёткого вывода. Ограничением алгоритма является необходимость использования систем типа Мамдани с симметричными функциями принадлежности в выходной переменной. Дополнительно формулу (9) можно использовать для локальной подстройки систем нечёткого вывода типа Сугено первого порядка.
Работа выполнена при финансовой поддержке РФФИ (грант 16-06-00486).
Литература
1. БОГОМОЛОВ А.В. Использование лингвистических переменных и методов обработки экспертной информации для автоматизированного распознавания ранних стадий нарушения функционального состояния человека // Информационные технологии. - 2000. - №8. - С. 12-18.
2. БОРИСОВ ВВ., КРУГЛОВ ВВ., ФЕДУЛОВ АС. Нечёткие модели и сети. - M.: Горячая линия - Телеком, 2007. -284 с.
3. ГОЛОСОВСКИИ М.С. Применение системы на основе нечёткой логики в задачах управления проектами по разработке программного обеспечения // Материалы Х международной научной конференции «Инновационное развитие общества: условия, противоречия, приоритеты» / Под ред. А.В. Семенова. - 2014. - С. 400-404.
4. ЗАДЕ Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. - М.: Мир, 1976. - 167 с.
5. КРУГЛОВ В.В. Сравнение алгоритмов Мамдани и Сугено в задаче аппроксимации функции // Математическая морфология: электронный математический и медико-биологический журнал. - 2001. - №4. - C. 69-76.
6. КУДИНОВ Ю.И., КЕЛИНА А.Ю. Методы синтеза и настройки нечетких ПИДрегуляторов Мамдани // Информационные технологии. - 2012. - №6 (приложение). - 32 с.
7. ПАКЛИН Н.Б Адаптивные модели нечеткого вывода для идентификации нелинейных зависимостей в сложных системах: Автореф. дис. канд. техн. наук. - Ижевск, 2004. -20 с.
8. ПЕГАТ А. Нечёткое моделирование и управление. 2-е издание. - M.: БИНОМ. Лаборатория знаний, 2013. - 798 с.
9. СИЛИЧ В.А., СИЛИЧ М П., АКСЕНОВ С В. Алгоритм построения нечеткой системы логического вывода Мамдани, основанный на анализе плотности обучающих примеров // Доклады ТУСУР. - 2013. - №3(29). - C. 76-82.
10. ШТОВБА С.Д., МАЗУРЕНКО В В., ТЫЛЕЦ Р.О. Информационная технология нечеткой идентификации для синтеза точных, компактных и интерпретабельных баз знаний // Computer Sciences and Telecommunications. - 2016. -№1(47). - С. 8-22.
11. GACTO M., ALCALA R., Herrera F. Interpretability of linguistic fuzzy rule - based systems: An overview of interpretability measures // Information Sciences. - 2011. - №20. -Vol. 181, - P. 4340-4360.
12. GANG F. Analysis and synthesis of fuzzy control systems: a model-based approach (automation and control engineering). -CRC Press, 2017. - 299 p.
13. KOSKO B. Fuzzy systems as universal aproximators // IEEE Transactions on Computers. - 1994. - Vol. 43, №11. -P. 1329-1333.
14. KOSKO B. Global stability of generalized additive fuzzy systems // IEEE Transactions on Systems, Man, and Cybernetics. Part C. Applications and Reviews. - 1998. - Vol. 28, №3. -P.441-452.
15. MAISTROU A.I., BOGOMOLOV A.V. Technology of automated medical diagnostics using fuzzy linguistic variables and consensus ranking methods // IFMBE Proc. of the World Congress on Medical Physics and Biomedical Engineering. Diagnostic and Therapeutic Instrumentation, Clinical Engineering. Cycle. "World Congress on Medical Physics and Biomedical Engineering. Diagnostic and Therapeutic Instrumentation, Clinical Engineering". - Munich, 2009. - Р. 38-41.
16. MANENTIA F., ROSSIA F., GORYUNOV A., DYADIK A., KOZIN K., NADEZHDIN I., MIKHALEVICH S. Fuzzy adaptive control system of a non-stationary plant with closed-loop passive identifier // Resource-Efficient Technologies. - 2015. -Vol. 1, №1. - P. 10-18.
17. MILLER G.A., The magical number seven plus or minus two: some limits on our capacity for processing information // The Psychological Review. - 1956. - №63. - P. 81-97.
MAMDANI FUZZY INFERENCE SYSTEM LOCAL TUNING ALGORITHM WITH THE SAVING INTERPRETATION CAPABILITY OF INFERENCE RULES
Mikhail Golosovskiy, State Research Institute of the Military Medicine of the Ministry of Defense of the Russian Federation, Moscow, junior research fellow ([email protected]).
Abstract: The article presents the Mamdani systems local tuning algorithm with saving interpretation capability of inference rules, which allows us to solve the problem of expert system configuration on the basis of statistical data or on the basis of information on the exact (crisp) value of the system output for certain input values. Restrictions were set on the conclusion rules for applying direct and inverse transformation of the Mamdani-type system to the Sugeno-type system. In this article a formula for local tuning of the Sugeno-type system is proposed. This formula calculates the values of the fuzzy logical rules consequences based on the construction of the perpendicular bisector between n-dimensional surfaces. Surfaces equations are based on the values of the conclusions of each rule before and after tuning. The Sugeno-type system is transformed back to the Mamdani-type system after local tuning. The saving of interpretation capability of inference rules is ensured by the introduction of a linguistic modifier. The modifier allows us to set the new language values to rules consequences by adding the degree of change based on reference linguistic values.
Keywords: fuzzy inference system, Mamdani, Sugeno fuzzy systems, fuzzy modeling, local setting.
Статья представлена к публикации членом редакционной коллегии Э.Ю. Калимулиной.
Поступила в редакцию 17.11.2017.
Опубликована 31.07.2018.