МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
ПОСТРОЕНИЕ НЕЧЕТКИХ РЕГРЕССИОННЫХ МОДЕЛЕЙ В УСЛОВИЯХ ГРУППОВОЙ ЭКСПЕРТНОЙ ИНФОРМАЦИИ
О.М. ПОЛЕЩУК, проф. каф. высшей математики МГУЛ, д-р техн. наук,
Е.Г. КОМАРОВ, зав. каф. информационно-измерительных систем и технологии приборостроения МГУЛ, доц., д-р техн. наук
[email protected], [email protected]. ru ФГБОУ ВПО «Московский государственный университет леса» 141005, Московская обл., г. Мытищи-5, ул. 1-я Институтская, д. 1, МГУЛ
В статье предлагается подход к построению регрессионных моделей на основе групповой экспертной информации, формализованной с помощью интервальных нечетких множеств второго типа. Проблема агрегирования информации, полученной от группы экспертов, не является новой, но актуальность ее решения не утрачена, поскольку одновременно с созданием новых, более сложных систем в различных областях деятельности человека, усложняются процедуры проведения их экспертиз и ответственность экспертов за свои решения и подходы. Необходимо не только получить информацию от экспертов, но и максимально сохранить уникальный индивидуальный опыт и знания. Методы теории экспертного оценивания стали давать сбой с тех пор, как существенно усложнились процедуры оценивания, возросла цена ошибки и соответственно ответственность эксперта за оценку как в индивидуальном плане, так и в плане коллективного решения. Интервальные нечеткие множества второго типа имеют достаточно степеней свободы, чтобы сохранить индивидуальную экспертную информацию и получить групповую экспертную модель. Чтобы включить эти множества в регрессионную модель, необходимо разработать новый метод. Неизвестные коэффициенты модели считаются треугольными числами. Основная идея построения модели состоит в определении взвешенных отрезков для нижних и верхних функций принадлежности интервальных нечетких множеств второго типа. Взвешенные отрезки предлагается использовать в ситуациях, когда необходимо агрегировать больше информации о нечетких множествах, чем она содержится в числах, но при этом отсутствует требование отобразить нечеткое множество именно в число.
Ключевые слова: групповая экспертная информация, интервальное нечеткое множество второго типа, нечеткая регрессионная модель.
При построении регрессионных моделей в качестве исходной информации достаточно часто выступает информация, поступающая от одного или нескольких экспертов. Эксперты, оценивая показатели и выражая свои знания, используют в рамках профессионального языка лингвистические значения этих показателей, что является объективной причиной появления нечетких данных. Учитывая сложность проведения экспертиз одновременно со сложностью постоянного привлечения экспертов, знания и опыт экспертов пытаются формализовать и использовать для анализа данных, построения прогнозных моделей, экспертных систем, поддержки принятия решений и т.д.
Использование экспертами баллов для оценки качественных показателей критикуется давно. Окончательные результаты при этом не всегда обладают устойчивостью, а сами оценки являются слишком грубыми и не могут передать особенности индивидуального процесса оценивания [1-4]. Для устранения подобных недостатков при формализации экспертных оценок стали использоваться лингвистические переменные [5], которые, как показали теоретические и практические
исследования, адекватно моделируют мыслительную деятельность экспертов и с успехом могут применяться для формализации экспертных знаний и опыта [6-9].
К настоящему времени разработан ряд моделей, позволяющих на основе лингвистических переменных формализовать информацию, полученную от группы экспертов в результате оценивания ими качественных показателей или описания в лингвистических термах количественных показателей [7]. Функциями принадлежности термов лингвистических переменных являются T-числа или треугольные числа.
Предположим, что информация, полученная от k экспертов, формализована согласно методу [7] и соответственно построено k лингвистических переменных с
функциями принадлежности терм-множеств {Щ/ (х)М/п}, /=и ( 0)=0f ,al2 ,all ,alR ) ,
[ail1, aiI2] - интервал толерантности, aiIL, ailR - соответственно левый и правый параметры нечеткости). Построенные лингвистические переменные будем называть критериями экспертов оценивания некоторого качественного показателя.
170
ЛЕСНОЙ ВЕСТНИК 4/2014
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
На основе экспертных критериев Xf4=lk будем определять обобщенный экспертный критерий X (с функциями принадлеж-ноститермов {/,(х)/=1,/и},
, для которого сформулируем условие Парето
к к
nX-cXczuX,.
i=i i=i
или
тт(ц„ (х), \i2l (х), О)) ^ h О) ^
* < тах(ц1;(х), ц2/(х),.ци(х))
V/ = l,/w,Vxe[0,l].
Предположим, что определены весовые коэффициенты со,., / = \,к экспертных критериев Х,,/=1 Jz.
Параметры функций принадлежности a1,a2,aL,aR, 1 = \,т обобщенного экспертного критерия будем искать из условия
т к
F=ZZ®>
1=1 !=1
(а;'-а1^+(а''-а^+
—»min.
Неизвестные параметры находятся из системы нормальных уравнений:
dF
да[
Т=2 JjoX’-al
dF
dal
>1
к
7=2 -я'
dF
dal
>1
к
i _2 Z®*^ aL
dF
dal
i=1 ' к
i “2 Z®A ciR
-0,1-l,m, -0J-l,m, =0,l=\,m, -0J-\,m.
i=1
Получаем решения:
к ___ к ___
а\ =^Ло,я1г/ , а12=улща,2 J-l,m,
i=l i=l
к к ___
aL =Yl°iaL ’ aR =Z®^ J=[’m •
i=1 i=1
Таким образом, получаем
x={^(^y=1»w}=|//(x)=Z0)^!v(x)/=1’?w|=
={fi (x)=fZ®<af Z®/a2 Z®;a« >/=1’wl •
[ V/=i ;=l ы i=i у J
Докажем выполнение условия Парето для построенного обобщенного экспертного критерия. Так как
=Zra^min(|i1/(x)^2/(x)...^w(x)))^
к *=1
=шах(ц1/(х)|д2/(x).. .цн (x))Vxe[0,l]/=l,m,
(=1 Jc 4
то получаем
<max(pu (х)ц2/ (х). ..,\kkl (х))
i=ljc
Vxe[0,l]/=l,m.
Таким образом, для построенного обобщенного экспертного критерия выполняется условие Парето.
Однако, формализуя групповую экспертную информацию, хотелось бы учесть не только разброс экспертных мнений, но и нечеткость степени уверенности экспертов в оценке того или иного показателя. Помочь в этом могут нечеткие множества второго типа, значениями функций принадлежности которых являются не числа из отрезка [0,1] (как у обычных нечетких множеств), а нечеткие множества из отрезка [0,1]. Рассмотрим интервальные нечеткие множества второго типа (interval type-2 fuzzy sets (IT2 FSs)), значениями функций принадлежности которых, являются интервалы. IT2 FSs
Рисунок. Верхняя и нижняя функции принадлежности IT2 FS.
Fig. The upper and lower membership functions IT2 FS
ЛЕСНОЙ ВЕСТНИК 4/2014
171
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
традиционно определяются верхней (UMF) и нижней №л_ функциями принадлежности (LMF) . Будем рассматривать IT2 FSs, UMF и LMF которых являются Г-числа (рисунок).
Значениями оси х являются степени интенсивности проявления некоторого качественного признака, значениями оси ц(х) степени уверенности эксперта в этом проявлении. Отличие нечеткого числа второго типа от нечеткого числа первого типа состоит в том, что значениями функции принадлежности нечеткого числа первого типа (или обычного нечеткого числа) являются числа от нуля до единицы, а значениями функции принадлежности нечеткого числа второго типа являются нечеткие числа (от нуля до единицы). Например, эксперт оценивает глубину научной проработки проведенного исследования и ставит оценку 0,3 со степенью уверенности 0,9, что она недостаточная. В этом случае формализацией является нечеткое число первого типа. Если эксперт ставит оценку 0,3, а степень его уверенности где-то около 0.8, то формализацией является нечеткое число второго типа. Если эксперт ставит оценку 0,3, а степень его уверенности от 0,7 до 0,9, то формализацией является интервальное нечеткое число второго типа.
Рассмотрим параметры функций принадлежности k экспертных критериев of,«2 Для каждого из параметров
у нас есть выборка, состоящая из k элементов:
al\, a211, .. ., ak\
a112, a212, .. ., ak1 2
a1m1, yy2m U 2 . km u 1
2m 2 km 2
Кроме этого
к ___ к _
а\ = = \т,а\ = = Ъ
;=i i-i
Вычислим
т.
и 4=-гЦ-2Хо?-‘,0 > l = Um.
к —к ,=1
Построим доверительные интервалы для параметров обобщенного экспертного критерия а[, al2Jl=l,m, используя распределение Стьюдента
/ P*ia1 ^j-j^ —а\ — / f&ia1 + ,
i=1
il S2l^k-\,a ^ "I ДХ\^ il ,S2l^k-\,a 71 / COjCl2 r— —Q? — / ,(0jCl7 + r— J—\,ni.
;=i v к ,=i v к
где Ak a находится из таблицы для вероятностей P(|tk-1| > Ak1 a) = a распределения Стьюдента tk1.
k . s A _ k .
Если У со.af + 11 kl’a > до получаем
/=i v к i=i
e>rfi=Un,
i=1 V« j=l
Я 7 il,S2Ak-\,a 71
/ p)ja? j— —a7 — / + I— J—ljn .
i=l V л I=i v ft
Если У'ща?—21 Д~1,а <»^ , то получаем
м V ^ i=l
V1^ Я Sll^k-l,a ^ ~/ДХА^ Я , 7 1
/ ГГ- —а\ — / + /— J—ljn,
i=1 V Л г=1 V ft
___Я^-/^Х'1____Я , J2/^*-l,a ,_7
®ia2 ^a2~2j°ia2 + ГГ i=1 г=1 V ft
.■7 iSo/AtJ ™ „ "
=l,/w,
Если >ХЮ^2 >
г=1 Vft г=1
;/ -^2/А^. | а ■!
а / ю-а2--------1— ’ </ !®iai > то получаем
г=1 V £ г=1
fc Р Д к ___
г=1 Vft г=1
г=1 г=1 Vft
Исходя из этого, обобщенный критерий группы экспертов мы представляем в виде лингвистической переменной, значениями которой являются IT2 FSs (интервальные нечеткие множества второго типа), верхние fi(x) и нижние fi(x) функции принадлежности которых, соответственно задаются параметрами
172
ЛЕСНОЙ ВЕСТНИК 4/2014
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Vz-Л ~il Sy^k-l,a ^ il
2^iai ^ ’2^Ща2+
fl(x)=
i=1
, SlAk-1,а к
fl(X)=
^к-l,a V,, Jl V,, _i/ /7 ®iaZ ’^®г'а7<
V л i=l i=l
X-1____/7,51/^Л-1,а X1______il
+ ■’2-F)ia2
i=l
52/^*-l,a V.. Л V.. Л
ГГ ’/ f°iaL ’2j°iaR
V Л t=l i=l
si Sm&i
Если Yj*iai+ U rr'a >Z®»g2 > i=1 V * j=l
TO
X______il SlAk-lja X_____il
2A^iai FT ,^J£>ia2
//(X)=
+
i=l
, S2Ak-l,a k
//(X)=
^£щ4£ч4
V* i=l i=l ,
^J°i4 ^J°ia2 -
i=l i=l
^2/^-1,a ^ »7 Х/л „г7
ГГ ’/ ’/ f^iaR
V К i=1 /=1 J
Если £Ю,а;'-^р<£<о,а|'
г=1 V & i=1
/ fc с Л it Л
___а Л1/^-1,а X__I/ ,
®ial ’2^®1а2+
,1=\,т.
, то
//(х>
м
52/^*-1,а к
к-\,а X,, „й X,-. А'
ГГ >/ f^iai, >/
>/л ,=1 г=1
}=\,т,
( к
//(Х)=
Е„ „// , 51/А*-1,а 1 +__,
Y^i4^i4^i4
V 7=1 (=1 г=1 у
Если £со,УЧ%^>£<о,а:
г=1 V * г=1
£ о А к
il S2llXk-\,a
и
2 >
г=1
2—<2>^7’ТО
//(х)=
/" £ с л it '
®га1 /7 ’^_,®га2 + 1=1 V л г=1
t Л £ £
Л2/А£-1,<х X
71-Ч-1>а Х,л ~г7 X,, Лг7
ГГ ; / /А*7/,,/ <0,Дд
Vft j=l (=1
//(*)= ’Zroia2 »Z®/a? ’Z“<a
v Л/П- ;=1 г=1 у
У к к к к \
И R
V i=l /=1 г=1 г=1 У
/=1уи.
Для верхней функции принадлежности первого терма первый параметр полагается равным нулю, для верхней функции принадлежности последнего терма второй параметр полагается равным единице.
Рассмотрим нечеткую линейную регрессионную модель
f=a0+^X!+...+aMXm,
где aj=(bJ,b?J>Aj=Ojn - неизвестные коэффициенты в виде треугольных чисел (не обязательно симметричные).
Yt, i=l/i - выходные IT2 FSs, определенные LMF \H=^f,y2iyfiyf)i=^ и UMF Hjr^i ,y2 >У/ >Уг )y -У1 ^0*=1л X‘j,j=\,m i=lji - входные IT2 FSs, определенные LMF ^=(^>*2,Lj!‘lJJrL<) и _um^ ^^{‘иМ‘и^ГА‘иУи-^‘ищ
J=l,m, i=\,n.
Недостатком большинства моделей нечеткого регрессионного анализа является необходимость знать аналитический вид функций принадлежности выходной переменной [7, 9]. Это не всегда выполнимо, наверное, поэтому разработанные модели имеют ограниченный спектр функций принадлежности исходной информации (в основном треугольные числа).
С целью ликвидации образовавшегося пробела авторы разработали интервальные агрегирующие показатели для нечетких множеств первого и второго типа, которые опираются на определение а-уровневых множеств и не требуют определения аналитического вида функций принадлежности [10, 11]. Эта идея легла в основу единого подхода к построению регрессионных моделей в условиях групповой экспертной информации, которая может быть формализована в рамках нечетких множеств первого или второго типов.
Взвешенным отрезком T-числа Г = (a a2, a, ar) является отрезок [A1,A2], Ax = ax - 1/6a;, A2 = a2 + 1/6ar [11]. Для IT2 FSs определяются взвешенные отрезки для LMF and UMF. Для двух IT2 FSs А, В со взвешенными отрезками соответственно [AL AL2], [BL BL2] LMF и взвешенными отрезками соответственно [AUV Au2], [BUj, Bu2] UMF определим меру близости /(Ай)
ЛЕСНОЙ ВЕСТНИК 4/2014
173
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
Определим взвешенные отрезки [е£>0^]> для LMF и UMF исходных
выходных данных Yt i=l,n
alL_ iL 1 iL fi2Z_ iL 1 iL
-У -7У1 ’ °y -У +ТУг ’
‘O' 6
ef =f^-
Мера близости между исходными и модельными выходными данными определяется функционалом
г=1
+±[(er-0r^+(9r-erj]
Оптимизационная задача ставится следующим образом
р$нну£/%??у>ш“,
1=1
bj ^0,6/ >0,j-0,m.
Так как
e^WAO” e^'A'A')
являются кусочно-линейными функциями в области 6/>0,6/>0j=0,ffj, то F является кусочно-дифференцируемой функцией, и решения задач оптимизации находятся с помощью известных методов [12].
Заключение
Попытки сохранения индивидуального опыта и знаний экспертов в групповой модели оценивания качественных показателей различных систем привели к использованию интервальных нечетких множеств второго типа. Логика использования нечетких множеств второго типа состоит в том, что разные люди имеют разные представления об одном и том же понятии, а соответственно степени их уверенности (значения функций принадлежнос-
ти) будут различаться для одних и тех же значений универсального множества. Проблема использования интервальных нечетких множеств второго типа (как формализаций групповой экспертной информации) в качестве исходной информации регрессионных моделей (с целью прогноза и изучения зависимостей) состоит в отсутствии таких моделей. Поэтому авторы решают не только задачу сохранения индивидуального опыта и знаний каждого эксперта при формализации групповой экспертной информации на основе интервальных нечетких множеств второго типа, но и разрабатывают регрессионную модель, которая позволяет анализировать и прогнозировать такую информацию.
Библиографический список
1. Бешелев, С.Д. Математико-статистические методы экспертных оценок / С.Д. Бешелев, Ф.Г. Гур-вич. - 2-ое изд. - М.: Статистика, 1980. - 263 с.
2. Литвак, Б.Г. Экспертные оценки и принятие решений. - М.: Патент, 1996. - 271 с.
3. Полещук, О.М. Математическая модель обработки экспертных оценок // Вестник МГУЛ - Лесной вестник. - 2005. -№ 6 (42). - С. 161-164.
4. Домрачев, В.Г. Мониторинг функционирования объектов на основе нечеткого описания их состояний / В.Г. Домрачев, Е.Г. Комаров, О.М. Полещук // Информационные технологии.- 2007. - № 11.
- С. 46-52.
5. Заде, Л.А. Понятие лингвистической переменной и его применение к принятию приблизительных решений. - М.: Мир, 1976. - 165 с.
6. Полещук, О.М. Методы представления экспертной информации в виде совокупности терм-множеств полных ортогональных семантических пространств // Вестник МГУЛ - Лесной вестник.
- 2002. - № 5 (25). - С. 198 - 216.
7. Olga Poleshchuk and Evgeniy Komarov Expert Fuzzy Information Processing. - Springer-Verlag Berlin Heidelberg, 2011. - 237 pp.
8. Комаров, Е.Г. О подходах к построению нечетких регрессионных моделей в условиях групповой экспертной информации / Е.Г. Комаров, О.М. Полещук // Тр. XVI Междунар. конф. по мягким вычислениям и измерениям (SCM’2013). - 2013. - С. 11-14.
9. Chang Y-H. Hybrid fuzzy least- squares regression analysis and its reliability measures // Fuzzy Sets and Systems. - 2001. - № 119. - pp. 225-246.
10. O. M. Poleshuk, E. G. Komarov New defuzzification method based on weighted intervals // Proceedings of the 27th International Conference of the North
174
ЛЕСНОЙ ВЕСТНИК 4/2014
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
American Fuzzy Information Processing Society. Society. - NAFIPS’2012- Berkeley, California. -
- NAFIPS’2008, - New York, New York. - 2008. 2012.
11. O. Poleshchuk, E. Komarov A fuzzy linear 12. T .F. Coleman, Y. Li A reflective newton method for
regression model for interval type-2 fuzzy sets // minimizing a quadratic function subject to bounds on
Proceedings of the 29th International Conference of some of the variables, SIAM J. Optim. - 1996. - Vol.
the North American Fuzzy Information Processing 6. - P. 1040-1058.
THE CONSTRUCTION OF FUZZY REGRESSION MODELS BASED ON EXPERT GROUP INFORMATION
Poleshchuk O.M., Doctor of Technical Sciences, Professor, Professor of Higher Mathematics Department MSFU, Komarov E.G., Doctor of Technical Sciences, Associate Professor, Head of Department of information and measurement systems and instrument technology MSFU
[email protected], [email protected] Moscow State Forest University (MSFU) 1st Institutskaya st., 1, 141005, Mytischi, Moscow reg., Russia
This paper presents an approach to the construction of regression models based on a group of expert information, which can be formalized using interval type-2 fuzzy sets. The problem of aggregation of information obtained from a group of experts is not new, but the relevance to solve it is not lost, because along with the development of new and more complex systems in different fields of human activity, more complex procedures for their expertise and responsibility of the experts for their solutions and approaches. It is necessary not only to obtain information from experts, but also to process it keeping unique individual experience and knowledge maximally. Methods of the theory of expert evaluation have begun to fail, since procedures of evaluation complicated considerably, increased the cost of failure and accordingly responsibility of expert for evaluation individually as well as in cooperative decision making. Interval type-2 fuzzy sets have enough degrees of freedom to save individual expert information and to obtain a group expert model. In order to include interval type-2 fuzzy sets into a regression model, a need for developing a new method exists. Unknown coefficients are assumed to be triangular fuzzy numbers. The basic idea is to determine weighted intervals for low membership functions and upper membership functions of interval type-2 fuzzy sets. The weighted intervals are suggested to be used in situations where it is necessary to accumulate more information about fuzzy sets than aggregative point crisp indexes contain when there is no requirement to get only aggregative numbers.
Key words: expert group information, interval type-2 fuzzy set, fuzzy regression model.
References
1. Beshelev S.D., Gurvich F.G. Matematiko-statisticheskie metody ekspertnykh otsenok [Mathematical and statistical methods of expert assessments]. Moscow, Statistika, 1980. 263 p.
2. Litvak B.G. Ekspertnye otsenki iprinyatie resheniy [Expert evaluation and decision-making]. Moscow, Patent, 1996. 27 p.
3. Poleshchuk O.M. Matematicheskaya model’ obrabotki ekspertnykh otsenok [Mathematical model of processing expert assessments]. Moscow State Forest University Bulletin - Lesnoi Vestnik. 2005. № 6 (42). pp. 161-164.
4. Domrachev V.G., Komarov E.G., Poleshchuk O.M. Monitoring funktsionirovaniya ob»ektov na osnove nechetkogo opisaniya ikh sostoyaniy [Performance monitoring objects based on fuzzy descriptions of their states] // Informatsionnye tekhnologii. 2007. № 11. pp. 46-52.
5. Zadeh L.A. Ponjatie lingvisticheskoj peremennoj i ego primenenie kprinjatiju priblizitel’nyh reshenij [Concept of a linguistic variable and its application to adoption of approximate decisions]. Moscow, Mir, 1976. 165 p.
6. Poleshchuk O.M. Metody predstavleniya ekspertnoy informatsii v vide sovokupnosti term-mnozhestv polnykh ortogonal’nykh semanticheskikh prostranstv [Methods of presentation of expert information as a set of term-sets of complete orthogonal semantic spaces] Moscow State Forest University Bulletin - Lesnoi Vestnik. 2002. № 5 (25). pp. 198-216.
7. Olga Poleshchuk and Evgeniy Komarov Expert Fuzzy Information Processing. Springer-Verlag Berlin Heidelberg, 2011.237 p.
8. Komarov E.G., Poleshchuk O.M. O podkhodakh k postroeniyu nechetkikh regressionnykh modeley v usloviyakh gruppovoy ekspertnoy informatsii [On the approaches to the construction of the fuzzy regression models in terms of group of expert information]. TrudyXVI Mezhdunarodnoy konferentsiipo myagkim vychisleniyam i izmereniyam (SCM’2013). 2013. pp. 11-14.
9. Chang Y.-H. Hybrid fuzzy least- squares regression analysis and its reliability measures. Fuzzy Sets and Systems. 2001. № 119. pp. 225-246.
10. Poleshuk O.M., Komarov E.G. New defuzzification method based on weighted intervals. Proceedings of the 27th International Conference of the North American Fuzzy Information Processing Society. NAFIPS’2008, New York, New York. 2008.
11. O. Poleshchuk, E. Komarov A fuzzy linear regression model for interval type-2 fuzzy sets. Proceedings of the 29th International Conference of the North American Fuzzy Information Processing Society. NAFIPS’2012. Berkeley, California. 2012.
12. Coleman T.F., Li Y. A reflective newton method for minimizing a quadratic function subject to bounds on some of the variables, SIAM J. Optim. 1996. Vol. 6. pp. 1040-1058.
ЛЕСНОЙ ВЕСТНИК 4/2014
175