УДК.517.977.8
ОПТИМАЛЬНОСТЬ ПО ШТАКЕЛЬБЕРГУ В МНОГОКРИТЕРИАЛЬНОЙ ИЕРАРХИЧЕСКОЙ ДРЕВОВИДНОЙ ИГРЕ
Валентина Анатольевна Еськова, к.ф.-м.н., доцент кафедра высшей математики Тел.:8 905 073 0405, e-mail: [email protected] Кемеровский государственный университет http://kvsm.kemsu.ru
Рассматривается двухуровневая дифференциальная игра, в которой на первом уровне иерархии находится управляющий центр A 0, на втором - игроки B],...,Bm.
Строится оптимальное по Штакельбергу решение данной игры. Показано, что оно не является динамически устойчивым.
Ключевые слова: некооперативные дифференциальные игры, иерархические дифференциальные игры, оптимальность по Штакельбергу.
Основными принципами оптимальности в некооперативной теории дифференциальных игр является равновесие по Нэшу, s - равновесие, оптимальность по Парето, оптимальность по Штакельбергу. К сожалению, многие из принципов оптимальности формально переносились из статической теории некооперативных игр и не проводился необходимый анализ их динамической устойчивости в смысле, введенном в [1]. Автором ранее была показана сильная динамическая устойчивость К-равновесия [2] и Ks -равновесия [3] .
В ряде экономических приложений некооперативных дифференциальных игр, в частности, при олигополистической кон-fe. куренции с доминирующей фирмой, возникает несимметричное распределение информации, т.е. ситуация типа лидер-ведомый. Поведение лидера-ведомого было впервые рассмотрено экономистом Г. Штакельбергом в начале 20 века при описании стратегий фирм, конкурирующих на одном и том же рынке (в условиях олигополии). В таких ситуациях нередко одна из фирм оказывается сильнее остальных и навязывает им свою цену. Концепция j^fT равновесия по Штакельбергу используется для анализа иерархи-
В.А. Еськова ческих систем.
Рассматривается двухуровневая дифференциальная игра, в которой на первом уровне иерархии находится управляющий центр A о, на втором -игроки Bi,..., Bm.
Динамика игры описывается системой дифференциальных уравнений
x = f(X u, vb..., vm ) , x(t0) = x0 (1)
x e Rn, u ecompU, Vi ecomp Vj, V =Vi x ... xVm ,
где u(t) - управление центра, v = (v1,... , vm)- вектор управлений игроков нижнего уровня.
Функционалы выигрышей игроков имеют вид:
m
Iо (Щ vi (uX vm (u)) = Z Hi 0 [vi(u)],
i=1
Ii(u,vi(u), ...,vm(u)) = Hi [Vi(u)] = (H]\vi(u)J ... ,Hk [Vi(u)]).
Центр, используя кусочно-программное управление и(1), сообщает его игрокам нижнего уровня, а те выбирают вектор V (и (V))- кусочно-программные управления, образующие ситуацию равновесия по Нэшу, из множества оптимальных управлений (реакций) Я (и) с V. Центр, зная множество оптимальных управлений (реакций) игроков нижнего уровня, определяет множество оптимальных управлений Р (Я), Р (Я) с и .
R(u) =<{ v:(u, v(u)) >It (u, v(u)
vi (u)), Vvi(u)eVi, i = 1,...,m
p(R)=1 и:ueu,min1 о(u'v(u)) > minIo(uv(uVu'eUf'
[ v(u)eR(u) veR(u') )
Оптимальным по Штакельбергу решением M (to, xo) иерархической дифференциальной игры будем называть множество пар управлений (u, v) таких, что u e P(R), v e R(u), т.е.
M(t0,xo) = {(u,v) :u e P(R), v eR(u)}.
Пусть (u,v) eM(to,xo), а x(t)- траектория системы (1) при управлениях (u' ,vi , ... ,vm ). Обозначим через й1,v1 сужение управлений на интервал (t,T], й1 e Ut, v1 eVt. Решение текущей игры, начинающейся из положения x(t) в момент времени t, обозначим M (t, x (t)).
Решение M ( to , xo ) иерархической дифференциальной игры будем считать динамически устойчивым [1], если для любой пары оптимальных управлений (u,v) eM(to,xo) и любого te [to,T] выполнено условие (u ,v ) e M(t, x(t)).
Покажем, что оптимальность по Штакельбергу не является динамически устойчивым принципом оптимальности.
Для динамической устойчивости решения, оптимального по Штакельбергу, необходимо, чтобы сужение управлений, оптимальных в игре из начальных условий, должно быть оптимальным в текущей игре. Пусть (u,v) eM(to,xo), а x(t)-оптимальная траектория системы (1) при управлениях (u,vi, ...,vm)в игре из начальных условий (to,xo) , ведущая в точку x* (xo,T - to), т.е. x(t) = xo при t = to, x(t) = x* (xo,T -1o) при t = T и
1 o(u, v)=max min 1 o(u v). (2)
ueU veR(u)
Рассмотрим текущую игру, начинающуюся из позиции x(t), te [to,T]. Предположим, что в момент t мы решили проверить, удовлетворяет ли выбранная точка x * (xo, T -1o) условию (2) для текущей задачи
Io(üt,v') = max min Io(u ,v)'
— t -t\ ■ T /..t ..t\ . (3)
Пусть максимум в (3) достигается в точке x* ( x(t), T -1). Условие совпадения текущих точек, оптимальных по Штакельбергу, дает
x* (xo, T - to) = x* (x (1), T -1), t e [ to, T ]. (4)
Очевидно, что (4) имеет место крайне редко, т.к. множества R (u1) убывают по включению при te [to,T] и min Io(u',v'), вообще говоря, убывает. А это означает, что
v1 eR (u1)
выбор оптимальной по Штакельбергу точки из условия (2) не является динамически устойчивым.
Динамическая устойчивость и сильная динамическая устойчивость являются важными свойствами решений некооперативных дифференциальных игр и задач много-
u1 eU1 v1 eR (u1)
критериального управления, поэтому оптимальность по Штакельбергу является неприемлемой в процессах, развивающихся во времени.
Литература
1. Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками / Л.А. Петросян // Вестник Ленинградского университета. 1977. № 19. С. 46-52.
2. Еськова В.А. Сильная динамическая устойчивость ситуации Ä-равновесия в многошаговой неантагонистической игре на древовидном графе / В.А. Еськова // Вестник Кемеровского Государственного университета (серия математика). 2000. № 4. С. 260-266.
3. Еськова В.А. Сильная динамическая устойчивость Ks -равновесия в некооперативных дифференциальных играх / В.А. Еськова // Инновационные недра Кузбасса. IT-техно-логии: сб. трудов VI Всероссийской научно-практической конференции. 2007. С. 298-301.
Stackelberg'soptimuminmulticriterialhierarchicaltreegame
Valentina Anatolyevna Es'kova, Candidate of Physics and Mathematics, Kemerovo State University, chair of higher mathematics
Two-level differential game is studied, where A 0 control centre is located at the first hierarchy level and BjBmplayers are at the second one. The optimal game solution according to Stackelberg is constructed. And it is shown that it is not dynamically stable.
Keywords: Stackelderg's optimum, non-cooperative differential game, hierarchical differential games.
ПРИМЕНЕНИЕ МЕТОДА РАНЖИРОВАНИЯ МНОГОКРИТЕРИАЛЬНЫХ АЛЬТЕРНАТИВ (ELECTRE) К ЗАДАЧЕ ВЫБОРА СТАРОСТЫ УЧЕБНОЙ ГРУППЫ
Гузель Шарипжановна Шкаберина, ст. преподаватель Тел.: 266 0603, e-mail: [email protected], Елена Михайловна Товбис, к.т.н., доцент Тел.: 265 3001, e-mail: [email protected] Сибирский государственный технологический университет
www.kit-sibstu.ru
В статье рассматривается задача выбора старосты студенческой группы с точки зрения теории принятия решений. Предложен метод ранжирования многокритериальных альтернатив для ее решения. Рассмотрены и обобщены результаты применения метода на нескольких группах.
Ключевые слова: выбор, теория принятия решений, метод аналитической иерархии, обоснование, многокритериальность.
Введение
Устав высшего учебного заведения предусматривает назначение старосты в каждой учебной группе, включая как очную, так и заочную форму обучения. Выбор старосты группы - задача с первого взгляда простая. Однако неверное назначение может иметь плачевные для группы последствия - межличностные конфликты, снижение успеваемо-
сти, отстранение студентов от общественной жизни вуза и т.д. Таким образом, выбор старосты - задача ответственная, и такой А выбор должен быть обоснованным.
С другой стороны выбор старосты - задача многокритериальная и слабоструктурированная, следовательно, для ее решения могут быть применены некоторые методы теории принятия решений.
В качестве обоснования выбора при принятии решения о назначении старосты в '
данной статье предлагается использовать метод ранжирования многокритериальных альтернатив (ELECTRE) [1].
1. Описание метода
Товбис
Для применения данного метода необходимы следующие данные:
• перечень критериев С1...С„
• перечень альтернатив А1...Ат
количественные оценки альтернатив по критериям Яу, представленные в таблице 1.
Таблица 1
Критерии Альтернативы
Ai Am
Ci a îi a 1m
Cn a ni a nm
Основная цель метода - упорядочить альтернативы по степени их предпочтения.
1) Для каждого критерия эксперт устанавливает его вес
2) Выдвигается гипотеза о превосходстве альтернативы А1 над А2. Множество критериев разбивается на три подмножества, представленное на рисунке 1:
• 1+ - критерии, по которым А1 предпочтительнее А2,
• I- - критерии, по которым А2 предпочтительнее А1,
• 1= - критерии, по которым альтернативы А1 и А2 равнозначны.
3) Формируется таблица индексов согласия с выдвинутой гипотезой (таблица 2). Индекс согласия Ър^ра. определяет степень превосходства альтернативы А1 над А2:
I- 1
Множество I
Таблица 2
Индексы согласия
Рис. 1. Множество критериев
Аi А2 А m
Аi * Zl2 z1m
Z21 * z2m
А zm1 zm2 *
I
При этом индекс согласия находится в пределах 0 < 2А1А2 < 1, либо 2А1А2= 1, если пустое множество.
Формируется таблица индексов несогласия, определяющая степень отрицания гипотезы о превосходстве альтернативы А1 над А2:
и
'А1А2 ■:. с _:■
-J Е Г
(2)
где Ь - длина шкалы /-го критерия из множества I-, заданная первоначально, либо определяется как разница между максимальной и минимальной количественной оцен-
кой каждого критерия. Окончательно индекс несогласия выбирается как максимальный из возможных и заносится в таблицу 3:
Цлиг = Ч*1А2(;о (3)
Таблица 3
Индексы несогласия
Ai A2 A s*m
Ai * Ul2 u1m
А2 U21 * u2m
А umi um2 *
4) Экспертом устанавливаются предельные значения индексов согласия и несогласия z(1) и п(1). Для каждой пары альтернатив проводится сравнение индексов с их предельными значениями: если zA1A2 > z(1) и uA1A2 < u(1), то альтернатива А1 доминирует над А2.
5) Доминируемая альтернатива А2 удаляется из рассматриваемых. Оставшиеся альтернативы образуют первое ядро недоминируемых альтернатив. Если же условие не выполняется, альтернативы объявляются несравнимыми либо эквивалентными. Ход формирования ядра представлен на рисунке 2.
6) Ослабляются требования к предпочтению альтернатив - уменьшается предельное значение индекса согласия до величины z(2) и увеличивается предельное значение индекса несогласия до величины u(2). В результате второй итерации формируется второе ядро недоминируемых альтернатив. Окончательное количество итераций определяется аналитиком. В последнее ядро входят наилучшие альтернативы, а последовательность ядер соответствует упорядочению альтернатив по предпочтению.
2. Описание эксперимента.
Для участия в эксперименте привлечены студенты 2-4 курсов. Перед студентами поставлена цель - с помощью метода ELECTRE упорядочить студентов группы по степени их предпочтения на должность старосты группы. Критериями отбора и сравнения альтернатив каждого старосты были предложены следующие (посещаемость и желание не оговариваем):
• С1 - успеваемость (учеба на «хорошо» и «отлично» по итогам сессии, текущая успеваемость);
• С2 - коммуникабельность (умение находить общий язык с одногруппниками и преподавателями);
• С3 - инициативность (активное участие в общественной жизни группы, факультета, университета);
• С4 - организационная работа (информирование студентов и преподавателей, организация и проведение собраний, контроль за исполнением поручений, выданных группе).
Как в качестве экспертов, так и в качестве альтернатив выступали сами студенты. Список альтернатив для каждого эксперта формируется из списка студентов группы путём вычёркивания фамилии самого эксперта, таким образом, сами себя испытуемые оценивать не могли. Также студентам группы было предложено расставить веса по каждому критерию.
На примере одной из групп, обучающихся по сокращённой очной форме обучения, рассмотрим полученные расчёты. В качестве альтернатив предложено 17 фамилий
zAU2 > z(l) ^
\ Альтернатива А1 Il {¿îi(l) ^^г (доминирующая)
Ж.
Альтернативы эквивалентны
/
Îк л ьтеркй^в а А 2
(доминируемая!
Рис.
2. Формирование ядра
(ФИО 1.. ФИО 17). Экспертами выступало 16 студентов, в ходе работы каждый студент заполнил одну таблицу вида № 1 и установил вес каждому критерию.
7--
ФИ016
6---
ФИ015
5--- ФИ014
ФИ013
4-----
■ ФИ012
3--^^Н---^- ШФИОН
2____■■_
■ ФИ09
1 ^^Н ^^И^^В ^^Н ■
о ]_^Н_т_^Н_т_^Н_т_^Н_1 ш
/р ■ ФИОб
/
^ ^ ^ «¡Г "ФИ04
Л'' Ш ФИОЗ
О
Рисунок 3 - Показатели экспертов по критериям Рис.4. Приоритеты критериев учебной группы
Таблица 4
_Количественные оценки экспертов_
ФИО1 ФИО2 ФИО13 ФИО3 ФИО4 ФИО5 ФИО15 ФИО6 ФИО17
успеваемость 0,029262 0,089396 0,020543 0,032839 0,198307 0,033277 0,012535 0,053577 0,165862
коммуникабельность 0,048337 0,103369 0,060026 0,029694 0,154467 0,04244 0,040138 0,079491 0,067514
инициативность 0,055994 0,045197 0,045036 0,03261 0,103151 0,054186 0,036895 0,050079 0,059555
организационная работа 0,057493 0,046166 0,035762 0,034764 0,105718 0,047543 0,04741 0,070287 0,058689
ФИО16 ФИО8 ФИО9 ФИО10 ФИО11 ФИО12 ФИО7 ФИО14
успеваемость 0,011458 0,077162 0,059448 0,130234 0,05585 0,147958 0,059174 0,059174
коммуникабельность 0,017554 0,057345 0,017222 0,094441 0,094572 0,018882 0,051237 0,051237
инициативность 0,017525 0,087784 0,019015 0,068785 0,114969 0,065602 0,067652 0,067652
организационная работа 0,024153 0,075667 0,022657 0,075882 0,112283 0,046003 0,070169 0,070169
В итоге по данной группе заполнено 16 таблиц вида № 1 и расставлены общие веса критериев учебной группы. Из рисунка 3 видно, что студенты данной группы выделяют в первую очередь коммуникабельность, для них очень важно налаживать контакты, быть способными к конструктивному и доброжелательному общению с другими людьми. И лишь на последнее место поставлена успеваемость. Таким образом вес критерия «Успеваемость» -1, «Коммуникабельность» - 4, «Инициативность» - 2, «Организационная работа» - 3. В таблице 4 и рисунке 3 представлены общие данные экспертов при заполнении количественных оценок альтернатив по критериям.
Первоначально старостой группы был человек под фамилией ФИО14. Применение метода показало, что наилучшие альтернативы - это два человека под фамилиями ФИО4 и ФИО11. На втором месте один человек ФИО7. На третьем месте все оставшиеся фамилии, включая студента под фамилией ФИО14.
По данному методу выполнена программная реализация, пошаговое выполнение представлено на рисунках 5-8. Вводимыми параметрами является количество критериев и альтернатив. От эксперта требуется заполнить таблицу количественными оценками, веса и длину шкал критериев. Таблицы индексов согласия и несогласия заполняются автоматически. Далее, изменяя предельные значения индексов согласия и несогласия, формируются ядра. Альтернативы, которые формируют ядро, выделяются черным цветом.
Выводы
Метод ранжирования многокритериальных альтернатив с помощью автоматизированных средств применён в 7 групп ах среди 60 студентов и показал следующее:
1. В одной из групп староста, назначенный деканатом, не соответствует оптимальной альтернативе группы, в связи с чем, он был заменён на выбранную альтернативу.
2. Приоритетным критерием для опрошенных студентов является коммуникабельность, успеваемость же находится на втором месте, что показано на рисунке 4.
Литература
1. Черноморов Г.А. Теория принятия решений / Г.А. Черноморов. - Новочеркасск: Юж.-Рос. гос. Техн. ун-т, 2002. - 276 с.
2. Шкаберина Г.Ш. Теория принятия решений: учебное пособие / Е.М. Товбис, Г.Ш. Шкаберина. - Красноярск: СибГТУ, 2013. - 73 с.
ELECTRE technique of ranking multicriteria alternatives application to the problem of selecting elders training group
Guzel' Sharipjanovna Shkaberina, teacher, Siberian state technological university Elena Mihaylovna Tovbis, ph.d., docent, Siberian state technological university
The article deals with the problem of choosing student group elders from the decision theory point of view. We propose an ELECTRE technique for solving this problem. Results of the application ELECTRE method on several groups reviewed and summarized.
Keywords: choice, decision theory, technique of ranking multicriteria alternatives, justification, multi-criteriality.