УДК 007:631.4
О методике фаззификации нечёткой экспертной информации
В. П. Димитров, Л. В. Борисова, И. Н. Нурутдинова
(Донской государственный технический университет)
Рассматриваются основные аспекты методики фаззификации при формировании нечёткой экспертной информации для построения логического вывода в экспертных системах. Приведён модельный пример использования методики.
Ключевые слова: лингвистическая переменная, функция принадлежности, фаззификация, показатель согласованности.
Введение. При построении интеллектуальных информационных систем поддержки принятия решений в сфере эксплуатации сложных машин, при решении различных задач менеджмента качества и в других областях широко используются базы знаний, основанные на нечётких знаниях, т. е. нечёткие продукционные системы [1]. Блок приобретения и корректировки знаний является одним из основных блоков интеллектуальных информационных систем (экспертных систем), поэтому актуальны вопросы представления нечёткой экспертной информации.
Нечёткая экспертная информация трудноформализуема в рамках традиционных математических формализмов, что обусловило широкое применение в этой области теории нечётких множеств, которая оперирует нечёткими знаниями и понятиями и позволяет делать выводы на основе правил нечёткой логики.
При отображении лингвистических значений качественных признаков на числовые элементы порядковых шкал информация огрубляется, теряется та её ценная составляющая, которая характеризует индивидуальный опыт и знания эксперта. Приближённое представление значений функций принадлежности (ФП) термов семантических пространств может приводить к неадекватности нечётких моделей субъективным суждениям и исходным данным. Например, для описания признаков предметной области эксперты могут применять разные множества их лингвистических значений. В одном случае возникают трудности в связи с недостаточностью значений, в другом — в связи с их избыточностью, в результате чего следует ожидать увеличения нечёткости и рассогласованности поступающей от экспертов информации. Естественным вопросом при оценивании экспертом проявлений признаков является вопрос о критериях, по которым должен производиться выбор оптимального множества значений лингвистической шкалы при оценивании того или иного признака.
Основные положения методики. Описание критериев оптимальности выбора значений лингвистических переменных в [2] содержит требования минимальной неопределённости для экспертов при описании реальных объектов и максимальной согласованности экспертной информации.
Важной практической задачей является выбор оптимального множества лингвистической шкалы, используемой для оценивания входных факторов модели.
Для адекватного представления нечёткой экспертной информации о предметной области необходимо установить оптимальное число термов (т0) лингвистической переменной (ЛП). Сверху число термов ограничено соображениями точности измерения рассматриваемого параметра. А нижняя граница должна быть такой, чтобы возможно было выявить и описать взаимодействие данного фактора с выходными факторами. При решении рассматриваемой задачи проводят оценку согласованности нечётких экспертных знаний.
При анализе согласованности нечёткой экспертной информации вначале вычисляются аддитивный и мультипликативный показатели общей согласованности, а потом по их величинам формулируется суждение о согласованности моделей экспертного оценивания. Затем строится матрица парной согласованности моделей Х,\л А} экспертов.
Общая согласованность множества моделей экспертного оценивания признака определяется аддитивным к и мультипликативным к показателями [3]:
¡•ггигф,, (л-)сйг
1< = ±.^у~_^ к =
т^^тахцн^с/х '
¥/=1,2 ,...,к
¡.ггиг\у;1(х)с1х
| У/=1,2,...,/г
Пт-Г-^Г' (1)
■ | |тахц7 {х)с!х
У/=1,2,...,/г
где /= 1, 2,..., т— номер терма, /'= 1, 2,..., к— номер эксперта, \1„ (х) — ФП, которую задал ¡-V эксперт для /-го терма.
Очевидно, что 0 < А" < 1,0 < £ < 1.
Если все модели Xlr Xz, ..., Хк совпадают (все эксперты одинаково определяют ФП у всех термов), то к = к =1. Если нет пересечений у ФП всех термов, то к = 0. Если нет пересечений у ФП хотя бы одного терма, то к = 0.
Показатель согласованности между моделями двух экспертов, /-го и j-го, в рамках 1-го терма определяется величиной [1]:
}min[u, (x)f[ie(x)]dx
k,=f---—. (2)
[max[и, {x),vg{x)\dx
Затем строится матрица K°m парной согласованности моделей X, и Xj экспертов. Очевидно, что на главной диагонали матрицы стоят единицы, и матрица симметрична.
На основе матриц парной согласованности моделей для всех термов находится матрица Кт согласованности моделей X, и Xj по всем термам. Её элементы определяются формулой [2]:
о)
ill /=i
где т— число термов.
Анализ аддитивных и мультипликативных показателей, а также матриц парной согласованности для моделей с разным количеством термов может быть использован для выбора оптимального количества термов ФП [3]. Результаты такого анализа необходимо сопоставлять с результатами определения оптимального числа термов ЛП методом минимизации средневзвешенного квадратического отклонения Fm индивидуальных параметров, задаваемых экспертами, от усреднённых значений этих параметров. Из условия минимума Fm определяют значения параметров обобщённой ФП:
т к 4 j
(4)
i=i /=i j=i
где a'l и a'-l — границы толерантности нечёткого числа м,/ (х), з'! и а'1 — его левый и правый коэффициенты нечёткости соответственно, а'- — их усреднённые значения, со, — весовые коэффициенты экспертов.
Из необходимого условия экстремума функции Fm получаем:
а;=£со,а;. (5)
/=1
При заданных весовых коэффициентах и постоянном количестве и составе экспертов Fm зависит только от числа термов модели. Оптимальным числом термов будет такое, для которого Fm примет наименьшее значение.
Рассмотрим подробно вопрос о выборе весовых коэффициентов. Обычно в качестве начального приближения для решения прикладных задач весовые коэффициенты принимают для всех экспертов одинаковыми, что естественно при равной квалификации экспертов, однако это не всегда реализуется. Кроме того, экспертная информация служит для получения обобщённой ФП, которая используется затем для построения нечёткого логического вывода, поэтому необходимо, чтобы она была адекватна реальности. Это требование обеспечивается в значительной степени максимальной согласованностью экспертной информации. Устранение экспертных данных, которые существенно отличаются от остальных, может привести к потере возможно ценной информации. Более целесообразно ввести различные весовые коэффициенты, ранжируя экспертов по степени согласованности их информации с остальными. Величины весовых коэффициентов можно вычислить по правилу Фишберна [4], которое отражает тот факт, что об уровне значимости показателей неизвестно ничего, кроме того, что ранги экспертов гх >г2 >... > гк. Тогда формула отвечает максимальной энтропии наличной информационной неопределённости знаний об объекте. Веса Фишберна — это рациональные дроби, в знаменателе которых стоит сумма арифметической прогрессии N первых членов натурального ряда с шагом 1, а в числителе — убывающие на 1 элементы натурального ряда от N до 1. Таким образом, предпочтение по Фишберну выражается в убывании на 1 числителя рациональной дроби весового коэффициента более слабой альтернативы. Набор весов Фишберна для системы строгих предпочтений определяется по формуле:
со, =
2(Л/-/'+!)
N(N+1) '
где /V— число экспертов, /'— номер эксперта по значимости.
(6)
Рис. 1. Функции принадлежности пяти термов ЯП
Для смешанной системы предпочтений, когда наряду с предпочтениями в систему входят отношения безразличия, числители а, рациональных дробей определяются по реккурентной формуле:
[з,, если /-_,»/-
=
з,+1, если г, 1 > г,
1 ' 1 г = 1 /' = /V 2
, /д, / / V , . . . ,
Тогда общий знаменатель £ дробей Фишберна:
N
(7)
(8)
со, =■
И окончательно весовые коэффициенты Фишберна имеют вид:
й. ь'
Таблица 1
Значения коэффициентов а, Ь, с, с/функций принадлежности для различных экспертов
(9)
Вид терма Значения параметров ФП для различных экспертов
1-й эксперт 2-й эксперт 3-й эксперт 4-й эксперт 5-й эксперт
1. Левый а = 0,04 Ь= 0,10 а = 0,05 Ь= 0,12 а = 0,05 Ь= 0,14 а = 0,03 Ь= 0,10 а = 0,08 Ь= 0,16
2. Центральный а = 0,04 Ь = 0,20 с = 0,10 а= 0,14 а = 0,05 Ь = 0,20 с = 0,12 а= 0,15 а = 0,05 Ь = 0,22 с = 0,14 а= о,1б а = 0,03 Ь = 0,20 с = 0,10 а= 0,14 а = 0,08 Ь = 0,26 с = 0,16 а= 0,20
3. Центральный а= 0,14 Ь = 0,30 с = 0,20 а= 0,24 а= 0,15 Ь = 0,32 с = 0,20 а= 0,26 а= 0,16 Ь = 0,32 с = 0,22 а= 0,26 а= 0,14 Ь = 0,30 с = 0,20 а= 0,25 а = 0,20 Ь = 0,35 с = 0,26 а= 0,30
4. Центральный а = 0,24 Ь = 0,44 с = 0,30 а= 0,36 а =26 Ь = 0,44 с = 0,32 а= о,38 а = 0,26 Ь = 0,46 с = 0,32 а= о,зб а = 0,25 Ь = 0,42 с = 0,30 а= 0,36 а = 0,30 Ь = 0,44 с = 0,35 а= о,38
5. Правый а = 0,36 Ь= 0,44 а = 0,38 Ь = 0,44 а = 0,36 Ь = 0,46 а = 0,36 Ь = 0,42 а = 0,38 Ь = 0,44
Рассмотрим использование методики на примере модельной лингвистической переменной. Пусть пять экспертов дали оценки ФП для трёх термов, для четырёх термов и пяти термов. Функции принадлежностей описываются уравнениями трапециевидной формы [1], причём область определения для хот 0 до 1 (нормированные значения), а область определения для коэффициентов
Таблица 2,
Результаты расчёта показателей Аги к
Модель к к
3-термовая 0,572 0,562
4-термовая 0,479 0,466
5-термовая 0,469 0,436
уравнения ФП: а, Ь, с, с! от 0 до 1. Значения коэффициентов ФП, установленные экспертами для каждой из моделей, представлены в табл. 1 (фрагмент данных).
Графическая иллюстрация ФП для 5-термовой модели представлена на рис. 1.
Для расчётов аддитивных и мультипликативных показателей по формулам (1) и вычисления матриц парной согласованности по формулам (2) и (3) использована программная система приобретения и корректировки знаний экспертной системы [5]. Для рассматриваемых ФП результаты расчётов аддитивных и мультипликативных показателей представлены в табл. 2.
Анализ полученных показателей общей согласованности экспертной информации показывает, что наиболее согласованной является 3-термовая модель, менее согласована 4-термовая и ещё менее — 5-термовая. При этом различие в степени согласованности 4- и 5-термовых моделей незначительно. Одна из причин этого может заключаться в том, что увеличение числа термов влечёт за собой и усиление рассогласованности экспертной информации.
Результаты вычислений матриц парной согласованности для всех моделей имеют вид:
к,
( 1 0,741 0,9 0,9
1,0,741 < 1 0,861 = 0,713 0,741
I 0,7 ' 1 0,822 0,743 0,925 .0,523
Vй
0,741 1
0,667 0,667 0,964 0,861 1
0,735 0,721 0,656 0,822 1
0,868 0,786 0,64
0,9 0,667 1
0,946 0,667 0,713 0,735 1
0,828 0,64 0,743 0,868 1
0,71 0,658
0,9 0,667 0,946 1
0,667 0,741 0,721 0,828 1
0,529 0,925 0,786 0,71 1
0,49
0,741*] 0,964 0,667 0,667 1
0,7 { 0,656 0,64 0,529 1
'4,282^
4,039 4,18 4,18 4,039 4,015^ 3,973 3,916 3,819 [3,525,
/4,013Л 4,116 3,979 3,911
V ' )
(12)
у
0,523Л 0,64 0,658 0,49
Во втором столбце выражений (10) — (12) приведены суммы элементов строк матриц, анализ которых позволяет выделить экспертную модель с наибольшей парной согласованностью. Видно, что это 3-термовая модель.
Таблица 3
з 2 2
Л гп 2
3
4
Г
1
3
4
V5;
1/9 2/9 2/9 119) [1/3 > 4/15 1/5 2/15 1/15
(10)
(11)
1/3 1/5 2/15 1/15
Вид терма Параметры 3-те эмовой модели Параметры 4-термовой модели Параметры 5-термовой модели
одинак. вес. коэф. вес. коэф. Фишберна одинак. вес. коэф. вес. коэф. Фишберна одинак. вес. коэф. вес. коэф. Фишберна
Левый а = 0,052 Ь= 0,168 а = 0,046 Ь= 0,161 а = 0,05 Ь= 0,128 а = 0,046 Ь= 0,124 а = 0,05 Ь= 0,124 а = 0,047 £> = 0,119
Центральный а= 0,052 Ь = 0,364 с = 0,168 б= 0,232 а = 0,046 Ь = 0,358 с = 0,161 б= 0,229 а = 0,05 Ь = 0,228 с = 0,128 б= 0,166 а = 0,046 Ь= 0,221 с = 0,124 б= 0,16 а = 0,05 Ь= 0,216 с = 0,124 б= 0,158 а = 0,047 Ь = 0,208 с = 0,119 б= 0,151
Центральный а= 0,166 Ь= 0,4 с = 0,228 а= 0,312 а= 0,16 Ь = 0,403 с = 0,221 а= 0,318 а= 0,158 Ь= 0,318 с = 0,216 а= 0,262 а= 0,151 Ь= 0,314 с = 0,208 а= 0,256
Центральный а = 0,262 Ь = 0,44 с = 0,318 а= 0,368 а = 0,256 Ь = 0,441 с = 0,314 а= 0,368
Правый а = 0,232 Ь = 0,364 а = 0,229 Ь = 0,358 а= 0,312 Ь= 0,4 а= 0,318 Ь = 0,403 а = 0,368 Ь = 0,44 а = 0,368 Ь = 0,441
Сопоставим полученные результаты с результатами определения оптимального числа термов ЛП методом минимизации средневзвешенного квадратического отклонения индивидуальных параметров, задаваемых экспертами, от усреднённых значений этих параметров. Рассмотрим два случая: одинаковых весовых коэффициентов и вычисленных по правилу Фишберна. Распределяя экспертов по степени согласованности их информации с остальными, определим их ранги — они указаны в третьих столбцах выражений (10) — (12). Видно, что в 4- и 5-термовых моде-
лях имеет место система строгих предпочтений, а для 3-термовой модели — система смешанных предпочтений. Поэтому для 4- и 5-термовых моделей вычислим весовые коэффициенты по формуле (6), а для 3-термовой — по формулам (7) — (9). Результаты расчётов представлены в четвёртых столбцах выражений (10) — (12).
Результаты расчётов параметров обобщённой ФП по формуле (5) и величины Fm для обоих рассматриваемых случаев представлены в табл. 3, 4.
В результате анализа полученных показателей выяснилось, что наиболее согласованными при одинаковых весовых коэффициентов экспертов являются 3- и 5-термовые модели, а при разных — 5-термовая модель. Таким образом, для построения обобщённой ФП оптимальное количе-
Таблица ство термов при различных весах экспертов Величины Fm для 3-, 4- и 5-термовых моделей равно пяти.
Выводы. Рассмотрены основные этапы методики фаззификации нечёткой экспертной информации, включающие анализ экспертной информации на основе критериев согласованности. Предложено ввести различные весовые коэффициенты экспертов для увеличения согласованности моделей с целью максимальной адекватности нечётких знаний реальной ситуации. Рассмотрен модельный пример ЛП с 3-, 4- и 5-термовой ФП. Вычислены характеристики общей и парной согласованности моделей экспертов, параметры обобщённой ФП в случаях равных весовых коэффициентов и весов Фишберна. На модельном примере показана методика выбора оптимальной модели, используемой на последующих этапах (композиции и дефаззификации) разработки механизма вывода решений. Библиографический список
1. Борисова, Л. В. К вопросу построения нечёткой экспертной системы продукционного типа для технологической регулировки машин / Л. В. Борисова, В. П. Димитров, А. К. Туген-гольд // Вестник Донского гос. техн. ун-та. — 2008. — Т. 8. — № 3 (38). — С. 278—287.
2. Димитров, В. П. Оценка параметров лингвистических переменных факторов внешней среды / В. П. Димитров, Л. В. Борисова // Искусственный интеллект в XXI веке. Решения в условиях неопределённости: мат-лы V Междунар. науч.-техн. конф. — Пенза, 2007. — С. 30—32.
3. Нечёткие множества в моделях управления и искусственного интеллекта / А. Н. Аверкин [и др.]. — Москва: Наука, 1986. — 312 с.
4. Nedosekin, A. Fuzzy Financial Management / A. Nedosekin. — Moscow: AFA Library, 2003. - 183 p.
5. Программная система для ввода экспертных знаний / В. П. Димитров [и др.] // Вестник Донского гос. техн. ун-та. — 2011. — Т. 11. — № 1 (52). — С. 83—90.
Материал поступил в редакцию 10.09.2011.
References
1. Borisova, L. V. К voprosu postroeniya nechyotkoj e kspertnoj sistemy" produkcionподо tipa dlya texnologicheskoj regulirovki mashin / L. V. Borisova, V. P. Dimitrov, A. K. TugengoPd // Vestnik Donskogo gos. texn. un-ta. — 2008. — T. 8, № 3 (38). — S. 278—287. — In Russian.
2. Dimitrov, V. P. Ocenka parametrov lingvisticheskix peremenny" x faktorov vneshnej sredy" / V. P. Dimitrov, L. V. Borisova // Iskusstvenny'j intellekt v XXI veke. Resheniya v usloviyax neoprede-lyonnosti: mat-lyN V Mezhdunar. nauch.-texn. konf. — Penza, 2007. — S. 30—32. — In Russian.
3. Nechyotkie mnozhestva v modelyax upravleniya i iskusstvennogo intellekta / A. N. Averkin [i dr.]. — Moskva: Nauka, 1986. — 312 s. — In Russian.
4. Nedosekin, A. Fuzzy Financial Management / A. Nedosekin. — Moscow: AFA Library, 2003. - 183 p.
5. Programmnaya sistema dlya woda eNkspertnyNx znanij / V. P. Dimitrov [i dr.] // Vestnik Donskogo gos. texn. un-ta. — 2011. — T. 11, № 1 (52). — S. 83—90. — In Russian.
ON EXPERT INFORMATION FUZZIFICATION METHOD
V. P. Dimitrov, L. V. Borisova, I. N. Nurutdinova
(Don State Technical University)
The focal points of the fuzzification method under the fuzzy expert data processing for the logical deduction construction in expert systems are considered. The model pattern of the method application is given. Keywords: linguistic variable, membership function, fuzzification, consistency index.
Модель Fm
одинак. вес. коэф. вес. коэф. Фишберна
3-термовая 0,005664 0,004968
4-термовая 0,006864 0,005436
5-термовая 0,005744 0,003155