Машиностроение к компьютерные технологии
Сетевое научное издание
http://www.technomagelpub.ru
Ссылка на статью:
// Машиностроение и компьютерные технологии. 2017. № 11. С. . 64-74.
Представлена в редакцию: 07.10.2017
© НП «НЭИКОН»
УДК 519.6
Поддержка принятия многокритериальных решений на основе многоиндикаторной оценки качества Парето-аппроксимации
Карпенко А.П. , Грошев С.В.
1,*
1МГТУ им. Н.Э. Баумана, Москва, Россия
В представленной работе рассматривается задача многокритериальной оптимизации (МКО-задача). Из большого числа известных алгоритмов решения этой задачи выделяем алгоритмы, основанные на предварительном построении аппроксимации ее фронта (множества) Парето и называемые П-алгоритмами. П-алгоритмы могут быть построены на основе эволюционных и, прежде всего, на основе генетических алгоритмов, а также на основе роевых алгоритмов глобальной оптимизации, таких как алгоритмы роя частиц, колонии муравьев, медоносных пчел и т.д.
Ввиду наличия большого числа П-алгоритмов возникает проблема выбора «наилучшего» алгоритма для данной МКО-задачи (и/или данного класса этих задач) проблема метаоптимизации. В этой связи разработано значительное число индикаторов эффективности П-алгоритмов (П-индикаторов), которые основаны, прежде всего, на оценке качества полученной аппроксимации фронта (множества) Парето (П-аппроксимации). Таким образом, задача оценки качества П-алгоритма сама становится многокритериальной, точнее говоря, многоиндикаторной.
В первом разделе работы приводятся постановки исходной (базовой) МКО-задачи и используемые П-индикаторы. Во втором и третьем разделах представляем предлагаемые алгоритмы решения задач, соответственно.
Ключевые слова: многокритериальная оптимизация, множество Парето, индикаторы качества, Парето-аппроксимация
Введение
Рассматриваем задачу многокритериальной оптимизации (МКО-задачу). Из большого числа известных алгоритмов решения этой задачи выделяем алгоритмы, основанные на предварительном построении аппроксимации ее фронта (множества) Парето [1] и называемые П-алгоритмами. П-алгоритмы могут быть построены на основе эволюционных и, прежде всего, на основе генетических алгоритмов, а также на основе роевых алгоритмов глобальной оптимизации, таких как алгоритмы роя частиц, колонии муравьев, медоносных пчел и т.д. [2].
Ввиду наличия большого числа П-алгоритмов возникает проблема выбора «наилучшего» алгоритма для данной МКО-задачи (и/или данного класса этих задач) - проблема метаоптимизации [2]. В этой связи разработано значительное число индикаторов эффективности П-алгоритмов (П-индикаторов), которые основаны, прежде всего, на оценке качества полученной аппроксимации фронта (множества) Парето (П-аппроксимации) [3]. Таким образом, задача оценки качества П-алгоритма сама становится многокритериальной, точнее говоря, многоиндикаторной [4].
Работа выполнена в контексте разработки авторами WEB-ориентированной программной системы PARETO-Q, предназначенной для удаленного решения МКО-задач на основе предварительного построения их П-аппроксимации [5]. Система призвана решать два вложенных класса задач многокритериального принятия решений:
• задача A - выбор среди имеющихся в базе данных системы П-алгоритма, являющегося «наилучшим» для данной МКО-задачи;
• задача B - выбор решения исходной МКО-задачи из числа решений, содержащихся в П-аппроксимации, построенной с помощью выбранного П-алгоритма.
Известно большое число подходов к решению задачи многокритериального принятия решений [6]. Для решения задач А, B используем детерминированный подход на основе выявления функции предпочтений лица, принимающего решения (ЛПР) [7]. Новизна работы заключается в следующем: 1) разработка этого подхода применительно к задаче А; 2) разработка того же подхода к удаленному решению задачи B. Статистические алгоритмы сравнения П-алгоритмов, основанные на использовании ранговых статистических критериев Манна-Уитни и Крускала-Уоллиса, рассмотрены, например, в [8].
В первом разделе работы приводим постановки исходной (базовой) МКО-задачи и используемые П-индикаторы. Во втором и третьем разделах представляем предлагаемые алгоритмы решения задач А, B соответственно.
Если X есть вектор, то запись вида \X\ означает размерность этого вектора. Аналогично запись |Q| означает мощность счетного множества Q.
1. Постановка базовой МКО-задачи и используемые индикаторы качества
П-аппроксимации
Полагаем, что критериальная вектор-функция F(X) = (/|(X),f(X),..., fF|(X))
со значениями в |F| -мерном пространстве критериев {F} = R^F' определена в ограниченном и замкнутом множестве
Dx = {X | G(X) >0} с {X} = RX1
пространства варьируемых параметров {X} , где G(X) = (gi(X), g2(X),...) - ограничивающая вектор-функция; неравенство G(X) > 0 понимается покомпоненто. ЛПР
стремится минимизировать в области D каждый из частных критериев оптимальности
fi( X ), f2( X ),..., f F | ( X ), что условно записываем в виде
* *
min F(X) = F(X ) = F , (1)
XeDx
* *
где векторы X ,F - искомое решение МКО-задачи.
*
Фронт Парето задачи (1) обозначаем D* C Df , а соответствующее множество Па*
рето - Dx ^ Dx . Здесь Dp - множество достижимости задачи (1). Множество решений задачи (1), недоминируемых в пространстве {F}, обозначаем ©х, а соответствующее множество значений критериальной вектор-функции - ©F [1]. Таким образом, множества © , © представляют собой дискретные аппроксимации множеств D , D соответственно, то есть, П-аппроксимации.
Для построения множеств ©^, ©F в системе PARETO-Q реализованы широко известные П-алгоритмы NSGA-II, SPEA-2, IBEA, FEMO, SIBEA, ECEA, EPSMOEA и другие [9], а также авторские П-алгоритмы, основанные на модификации эволюционных операторов и/или итерационной формулы базового П-алгоритма с использованием П-индикатора или индикаторов так, чтобы повысить качество получаемой П-аппроксимации с точки зрения данного индикатора (индикаторов) [10].
Системы PARETO-Q использует такие унарные индикаторы качества П-аппроксимации, как среднее расстояние до точного фронта Парето (Generalization Distance, GD) / (© ) ; среднее рассеяние (Spacing, S) / (© ) ; максимальное рассеяние
(Maximum Spread, MS) / (© ) ; отклонение от равномерного распределения (Deviation from Uniform distribution, DU) /DU (©F) [4]. В системе используется также ряд бинарных индикаторов: /e(©F*, ©F) - мера близости множеств ©p, ©F* ; /с(©F*, ©F) - покрытие (Coverage); ô(©F*, ©F ) - разность покрытий (coverage differences); /HV (©F*, ©F )
- гиперобъем разности покрытий (Hyper Volume of coverage difference). Здесь ©F* - эталонное множество недоминируемых решений в пространстве DF [4].
Введем следующие обозначения:
A = {Ai} = {Ai, A2,..., A a }, I = {/j } = {/1, /2,..., / i| }
- наборы П-алгоритмов и индикаторов их качества, используемые ЛПР при решении данной МКО-задачи, соответственно. Подчеркнем, что эти алгоритмы и индикаторы, вообще говоря, представляют собой некоторые подмножества всех реализованных в программной системе PARETO-Q алгоритмов и индикаторов соответственно. Лучшими, полагаем, яв-
ляются меньшие значения всех рассматриваемых индикаторов. Множество допустимых значений индикаторов I обозначаем D .
2. Метод выбора «наилучшего» П-алгоритма на основе многоиндикаторной оценки качества П-аппроксимации
Система PARETO-Q предоставляет ЛПР три метода выбора «наилучшего» П-алгоритма:
1) метод, основанный на использовании того или иного способа визуализации многоиндикаторных оценок качества П-аппроксимации;
2) метод на основе скалярной свертки выбранных ЛПР индикаторов качества П-аппроксимации;
3) авторский автоматизированный метод, предполагающий предварительную аппроксимацию функции предпочтений ЛПР.
1) Метод на основе визуализации многоиндикаторных оценок качества П-аппроксимации. Для визуализации индикаторов оценки качества П-аппроксимации может быть использовано большое число методов визуализации П-аппроксимации [11]. В системе PARETO-Q с этой целью используется модифицированный метод HSDC (Hyperspace
diagonal counting) [11].
2) Метод скалярной свертки индикаторов качества П-аппроксимации включает в себя следующие основные шаги.
а) ЛПР выбирает из числа поддерживаемых системой PARETO-Q алгоритмы П-
аппроксимации A = (Д} и индикаторы качества П-аппроксимации I = (I ■} ; i е [1: |A|];
J е [1: |I|].
б) Система PARETO-Q для данной МКО-задачи с помощью алгоритмов Д,ДДа| строит П-аппроксимации 0j,02,...,0|А| соответственно.
в) Система PARETO-Q для каждой из П-аппроксимаций 0. вычисляет значения индикаторов качества П-аппроксимации Ii = (Ii j } ; i е [1: |A|]; J е [1: |l|].
г) Из числа реализованных в системе PARETO-Q скалярных сверток ЛПР выбирает, например, аддитивную свертку вида
|I|
C (A) = Z*jIj (A,
J=1
где Xj - «вес» индикатора I j .
д) Система PARETO-Q вычисляет значения сверток C(Д) = C(In, Ii2,...,I |Т|),
i е [1: |A|].
е) В качестве «наилучшего» алгоритма Д система предлагает ЛПР алгоритм, доставляющий минимальное значение свертки C(Д ) :
min C(Д ) = C(Д), i e [1: |A|].
i
3) Метод PREF-I на основе аппроксимации функции предпочтений ЛПР. Предлагаемый метод выбора «наилучшего» П-алгоритма основан на предложенном в работе [7] интерактивном методе PREF решения МКО-задачи (1). Метод PREF использует предположение, что на множестве Dx существует (неизвестная) функция предпочтений ЛПР у(X), которая отображает это множество во множество действительных значений, то
есть Ц : X ^ R1. Программный модуль, реализующий метод PREF, преобразует введенные ЛПР значения лингвистической переменной у( X) в действительные числа, принадлежащие диапазону [1..9]. В результате решение МКО-задачи (1) сводится к задаче поиска вектораX, который максимизирует функцию предпочтений ЛПР:
max у(X) = у(X*) = у*.
X eDX
Метод PREF-I основан на предположении, что априори неизвестная функция предпочтений ЛПР у(1) определена на множестве Dj и отображает это множество во множество действительных значений, то есть y(I) : I ^ R1.
Введем следующие обозначения: T = [Tk} = {T1, T2,...|} - набор МКО-задач (1),
решеных в системе данным пользователем; у(1) - функция предпочтений этого пользователя (ЛПР) на множестве значений индикаторов качества П-алгоритмов. Этап обучения метода PREF-I.
1) ЛПР решает набор {Tk } МКО-задач вида (1) каждым из П-алгоритмов Д e A и получает в итоге набор [Ik i j } значений индикаторов качества этих алгоритмов и набор оценок своей функции предпочтений i. Здесь Ik i j - значение индикатора Ij , полученное при решении задачи Тк алгоритмом Д ; ук i - оценка функции предпочтений ЛПР для П-аппроксимации задачи T , полученной П-алгоритмом A
; i e [1: |A|], j e [1: |l|], к e [1: |T|].
2) На основе всех имеющихся в системе PARETO-Q значений индикаторов качеств {Ik i j} и соответствующих значений функции предпочтений ЛПР Цк i система
строит функцию у (I), представляющую собой аппроксимирующую функцию (суррогатную модель) функции предпочтений ЛПР.
В качестве суррогатных моделей функции предпочтений ЛПР в системе PARETO-Q используются нейросетевые модели [7].
Этап эксплуатации метода PREF-I.
Пусть ЛПР U решает в системе PARETO-Q МКО-задачу T £ T вида (1).
1) Система PARETO-Q для этой задачи каждым из алгоритмов Д е A строит П-аппроксимацию 0г, а также вычисляет значения всех индикаторов качества /г ■;
i е [1: |A|], j е [1: |l|].
2) В качестве лучшего алгоритма A е A и соответствующей лучшей П-аппроксимации 0* система предлагает ЛПР алгоритм, вектор индикаторов которого доставляет максимум функции Щ (I) :
max ^(Ii), i е [1: |A|].
i
Первым очевидным недостатком метода PREF-I является необходимость наличия у
каждого из пользователей достаточно большой обучающей выборки (Tk , (I^}}, где (I^}
- набор значений индикаторов I , полученных при решении задачи T всеми алгоритмами
A; к е [1: |т|]. Частично преодолеть указанный недостаток метода PREF-I можно путем
использования по рассмотренной схеме функции предпочтений обобщенного ЛПР, который представляет собой объединение всех пользователей системы, и его обобщенной функции предпочтений ^(I).
Второй недостаток метода PREF-I состоит в высоких вычислительных затратах, обусловленных необходимостью решения данной МКО-задачи всеми П-алгоритмами A. Для преодоления этого недостатка можно использовать предварительную кластеризацию множества значений характерных признаков МКО-задачи, в качестве которых могут быть использованы оценка констант Липшица критериальных функций, признак дифференци-руемости этих функций, признак их мультимодальности и т.д. Большое число характерных признаков можно получить путем ландшафтного анализа критериальных функций [12]. По аналогии с предыдущим методом для сокращения мощности обучающей выборки в данном подходе также может быть использована обобщенная выборка, объединяющая выборки всех пользователей системы.
3. Метод выбора решения исходной МКО-задачи из П-аппроксимации
Положим, что одним из методов, представленных в п.2, пользователь определил «наилучший» алгоритм A е A для решения его данной задачи T вида (1). Пусть далее с помощью алгоритма Д получены П-аппроксимации 0Х, 0F этой задачи. Система
PARETO-Q предоставляет ЛПР три метода выбора приближения к решению X , F :
- метод, основанный на использовании того или иного способа визуализации множеств 0Х, ®р [13];
- метод на основе скалярной свертки критериев качества /¡(X), /2(X),...,|(X) [1];
- интерактивный метод, использующий аппроксимацию функции предпочтений ЛПР
X), определенную на множестве .
В последнем случае система PARETO-Q использует программную реализацию модифицированного метода PREF решения МКО-задачи (1). Поскольку система ориентирована на удаленную работу ЛПР, эта модификация заключается в том, что ЛПР предлагается устанавливать предпочтения сразу для некоторого набора решений из множеств
© X, ©.
Заключение
В контексте разрабатываемой авторами WEB-ориентированной программной системы PARETO-Q в работе рассмотрена проблема многоиндикаторного выбора «наилучшего» алгоритма для решения данной МКО-задачи. Основной научный результат работы заключается в разработке оригинального метода PREF-I решения этой задачи на основе выявления так называемой функции предпочтений ЛПР. Этот метод можно считать развитием метода PREF [7], ориентированного на решение исходной МКО-задачи.
В развитие работы авторы планируют реализацию широкого вычислительного эксперимента по исследованию эффективности предложенных метода, алгоритма и соответствующего программного обеспечения.
Работа поддержана РФФИ (проект 16-07-00287).
Список литературы
1. Подиновский В.В., Ногин В.Д. Парето-оптимальные решения многокритериальных задач. 2-е изд. М.: Физматлит, 2007. 256 с.
2. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой: учеб. пособие. М.: Изд-во МГТУ им. Н.Э. Баумана, 2014. 446 с.
3. Knowles J., Corne D. On metrics for comparing nondominated sets // Evolutionary computation 2002: Congress on evolutionary computing: CEC '02 (Honolulu, Hawaii, USA, May 12-17, 2002): Proc. Vol. 1. N.Y.: IEEE, 2002. Pp. 711-716.
DOI: 10.1109/CEC.2002.1007013
4. Zitzler E., Thiele L., Laumanns M., Fonseca C.M., da Fonseca V.G. Performance assessment of multiobjective optimizers: An analysis and review // IEEE Trans. on Evolutionary Computation. 2003. Vol. 7. No. 2. Pp. 117-132. DOI: 10.1109/TEVC.2003.810758
5. Белоус В.В., Грошев С.В., Карпенко А.П. ВЕБ-ориентированная среда визуализации многомерного фронта Парето // Информационные и математические технологии в науке и управлении. 2017. № 1(5). C. 94-101.
6. Ларичев О.И. Теория и методы принятия решений: учебник. 3-е изд. М.: Физматкнига; Логос, 2006. 392 с.
7. Karpenko A.P., Mukhlisullina D.T., Ovchinnikov V.A. Multicriteria optimization based on neural network approximation of decision maker's utility function // Optical Memory and Neural Networks (Information Optics). 2010. Vol. 19. No. 3. Pp. 227-236.
DOI: 10.3103/S1060992X10030045
rd
8. Conover W.J. Practical nonparametric statistics. 3 ed. N.Y.: Wiley, 1999. 584 p.
9. Deb K. Multi-objective optimization using evolutionary algorithms. Chichester; N.Y.: Wiley, 2001. 497 p.
10. Грошев С.В., Карпенко А.П. Мета-оптимизация популяционных алгоритмов многоцелевой оптимизации // Интернет-журнал «Науковедение». 2016. Т. 8. № 6(37). С. 52. DOI: 10.15862/52TVN616
11. Грошев С.В., Карпенко А.П., Остроушко В.А. Комбинированный метод визуализации фронта Парето в задаче многокритериальной оптимизации, основанный на диагональном пересчете гиперпространства // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2016. № 8. С. 150-164. DOI: 10.7463/0816.0844030
12. Mersmann O., Bischl B., Trautmann H., Preuss M., Weihs C., Rudolph G. Exploratory landscape analysis // 13th annual conf. on evolutionary computation: GECCO'11 (Dublin, Ireland, July 12-16, 2011): Proc. N.Y.: ACM, 2011. Pp. 829-836.
DOI: 10.1145/2001576.2001690
13. Грошев С.В., Карпенко А.П., Сабитов Д.Р., Шибитов И.А. Программная система PARETO RATING для оценки качества Парето-аппроксимации в задаче многокритериальной оптимизации // Наука и образование. МГТУ им. Н.Э. Баумана. Электрон. журн. 2014. № 7. С. 193-214. DOI: 10.7463/0714.0720253
Mechanical Engineering & Computer Science
Electronic journal
http://www.technomagelpub.ru
Mechanical Engineering and Computer Science, 2017, no. 11, pp. 64-74.
Received: © NP "NEICON"
07.10.2017
Multiple-criteria Decision-making Support Based on the Multi-Indicator Evaluation of the Pareto-Approximation Quality
A.P. Karpenko1, S.V. Groshev1*
groshev^eraeyigmailju 1Bauman Moscow State Technical University, Moscow, Russia
Keywords: multicriteria optimization, Pareto set, quality indicators, Pareto approximation
The paper considers a problem, which is defined as multi-indicator finding the "best" algorithm to solve a multiple-criteria optimization (MCO) problem. Of a large number of known algorithms for solving the MCO, we deal with the algorithms based on the preliminary construction of its Pareto front (set) approximation and called P-algorithms.
Because of a large number of P-algorithms, a problem of choosing the "best" algorithm for the given MCO problem (and / or this class of these problems) arises, i.e. a meta-optimization problem. We pose the problem of structural meta-optimization of P-algorithms, which suggests a simultaneous P-approximation construction and optimization of this approximation according to one or several P-indicators.
The paper presents basic MCO-problem formulation and describes used P-approximation quality indicators. Considers several methods to choose the "best" P-algorithm such as a method based on using one or another method to visualize multi-indicator estimates of P-approximation quality, a method based on the scalar convolution of P-approximation quality indicators, chosen by a decision-maker (DM), and an author's automated method that supposes a preliminary approximation of the function of preference. Provides mathematical description, considers advantages and disadvantages, as well as shows the ways to overcome these shortcomings.
The main research result involves a development of the original PREF-I method to solve the MCO problem based on identification of so-called DM's function of preference. This method may be thought as evolution of the PREF method aimed at solving the initial MCO problem.
References
1. Podinovskij V.V., Nogin V.D. Pareto-optimal'nye resheniia mnogokriterial'nykh zadach [Pareto-optimal solutions of multicriteria problems]. 2nd ed. Moscow: Fizmatlit Publ., 2007. 256 p (in Russian).
2. Karpenko A.P. Sovremennye algoritmy poiskovoj optimizatsii. Algoritmy vdohnovlennye prirodoj [Modern algorithms of search engine optimization. Algorithms inspired by nature]: a textbook. Moscow: Bauman MSTU Publ., 2014. 446 p. (in Russian).
3. Knowles J., Corne D. On metrics for comparing nondominated sets. Evolutionary Computation 2002: Congress on evolutionary computing: CEC '02 (Honolulu, Hawaii, USA, May 12-17, 2002): Proc. Vol. 1. N.Y.: IEEE, 2002. Pp. 711-716.
DOI: 10.1109/CEC.2002.1007013
4. Zitzler E., Thiele L., Laumanns M., Fonseca C.M., da Fonseca V.G. Performance assessment of multiobjective optimizers: An analysis and review. IEEE Trans. of Evolutionary Computation, 2003, vol. 7, no. 2, pp. 117-132. DOI: 10.1109/TEVC.2003.810758
5. Belous V.V., Groshev S.V., Karpenko A.P. WEB-based visualization of the multidimensional Pareto frontier. Informatsionnye i matematicheskie tekhnologii v nauke i upravlenii [Informationa and Mathematical Technologies in Science and Management], 2017, no. 1(5), pp. 94-101 (in Russian).
6. Larichev O.I. Teoriia i metodypriniatiia reshenij [Theory and methods of decision-making]:
rd
a textbook. 3 ed. Moscow: Fizmatkniga Publ.; Logos Publ., 2006. 392 p. (in Russian).
7. Karpenko A.P., Mukhlisullina D.T., Ovchinnikov V.A. Multicriteria optimization based on neural network approximation of decision maker's utility function. Optical Memory and Neural Networks (Information Optics), 2010, vol. 19, no. 3, pp. 227-236.
DOI: 10.3103/S1060992X10030045
rd
8. Conover W.J. Practical nonparametric statistics. 3 ed. N.Y.: Wiley, 1999. 584 p.
9. Deb K. Multi-objective optimization using evolutionary algorithms. Chichester; N.Y.: Wiley, 2001. 497 p.
10. Groshev S.V., Karpenko A.P. Meta-optimization of populations algorithms in multipurpose optimization. Internet-zhurnal «Naukovedenie» [Scientific open access J. "Naukovedenie"], 2016, vol. 8, no. 6(37). P. 52. DOI: 10.15862/52TVN616 (in Russian)
11. Groshev S.V., Karpenko A.P., Ostroushko V.A. Combined Pareto front visualization method in multi-criteria optimization based on hyperspace diagonal counting. Nauka i obrazovanie MGTU im. N.E. Baumana [Science and Education of the Bauman MSTU], 2016, no. 8, pp. 150-164. DOI: 10.7463/0816.0844030 (in Russian)
12. Mersmann O., Bischl B., Trautmann H., Preuss M., Weihs C., Rudolph G. Exploratory landscape analysis. 13th annual conf. on evolutionary computation: GECCO'11 (Dublin, Ireland, July 12-16, 2011): Proc. N.Y.: ACM, 2011. Pp. 829-836. DOI: 10.1145/2001576.2001690
13. Groshev S.V., Karpenko A.P., Sabitov D.R., Shibitov I.A. The PARETO RATING software system for the Pareto-approximation quality assessment in multi-criteria optimization problem. Nauka i obrazovanie MGTU im. N.E. Baumana [Science and Education of the Bauman MSTU], 2014, no. 7, pp. 193-214. DOI: 10.7463/0714.0720253 (in Russian)