Научная статья на тему 'Игровая задача с векторными выигрышами: среднеквадратичное равновесие'

Игровая задача с векторными выигрышами: среднеквадратичное равновесие Текст научной статьи по специальности «Математика»

CC BY
118
37
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Матвеев В. А.

Рассматривается игровая задача для N лиц с векторными выигрышами. Обычно в такой задаче в качестве решения используется равновесие по Парето. Как правило, таких решений бесконечно много. С целью уточнения равновесия по Парето предлагается концепция среднеквадратичного равновесия. Представлены условия существования такого решения, приводится модельный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Игровая задача с векторными выигрышами: среднеквадратичное равновесие»

УДК 519. 833

В.А.Матвеев

ИГРОВАЯ ЗАДАЧА С ВЕКТОРНЫМИ ВЫИГРЫШАМИ: СРЕДНЕКВАДРАТИЧНОЕ РАВНОВЕСИЕ

Псковский государственный университет

The game problem for N persons with vector payoffs is considered. Usually for such a problem the Pareto equilibrium is used as a solution. As a rule, there are infinitely many solutions like this. In order to specify the Pareto equilibrium the conception of mean-square equilibrium is introduced. The conditions of existence of such solution are presented and a model example is considered.

1. Введение

При изучении сложных социально-экономических явлений большое значение имеет математическое моделирование. Обычно в таких моделях представлено взаимодействие нескольких сторон. Каждая из них оказывает воздействие на функционирование системы. Стороны имеют свои интересы, которые могут различаться или совпадать, полностью или частично. Удобным подходом к изучению таких явлений является теоретико-игровое моделирование [1, 2].

Определенный интерес представляют модели, учитывающие помехи, возмущения, ошибки измерений и другие неопределенности, которые существенно влияют на исход. Выделим одну сторону моделирования, в которой неопределенности связаны с неточностями формализации цели управляемого процесса. В классификации неопределенностей [3] это «неопределенности, отражающие нечеткость знаний игроками своих целей».

Обычно при описании сложного социально-экономического явления имеется целый ряд показателей, оптимизация которых несомненна, но часто эти показатели противоречивы. В такой задаче неизвестен единый критерий, показатель качества функционирования системы. В то же время имеются отдельные желательные свойства, представленные частными критериями. Можно сказать, что в этом случае имеется неопределенность в функции цели. В первом приближении такую проблему можно изучать, применяя методы многокритериальной оптимизации.

Более точную модель взаимодействия нескольких сторон, учитывающую неопределенности в целях, представляет игровая задача с векторными выигрышами. В такой модели выделены несколько сторон (п игроков) и их возможные действия (множества стратегий). Функции выигрыша неизвестны, но приводятся наборы показателей, которые представляют оценки отдельных сторон сделанного игроками выбора. Фактически вместе с каждым игроком рассматривается набор его критериев. На содержательном уровне игрок стремится выбрать свою стратегию так, чтобы все компоненты векторной функции выигрыша достигали возможно больших значений.

Изучение игровых задач с векторными выигрышами началось достаточно давно [4]. Современное состояние теории представлено в [5,6]. В качестве решения игровой задачи с векторными выигрышами обычно рассматривается равновесная по Парето ситуация [4-6]. В общем случае в игровой задаче имеется бесконечное множество оптимальных по Парето решений. Сокращение множества «претендентов» на оптимальное решение, тем более выбор единственного наилучшего решения, является важной задачей. Проблеме уточнения равновесия и посвящена данная статья.

2. Математическая постановка задачи Рассматривается бескоалиционная игра N лиц с векторными выигрышами

(N, {X1 }1£n , if' (x)}ifN )■ (1)

Здесь N = {1,..., n} — конечное множество номеров игроков. Множество X1 с Rk состоит из стратегий x1 = (х1,..., х’к,) игрока i е N. Набор стратегий всех игроков называется сиП

туацией и множество всех ситуаций X = | | X1 . Заданы векторные функции f1 : X ^ Rli,

'=1

которые каждой ситуации ставят в соответствие вектор f (х) = (f (х),..., f (х)) выигрышей игрока i е N .

Партия игры развивается следующим образом: каждый из игроков i е N выбирает свою стратегию х1 е X1, в результате чего складывается ситуация х е X . После этого игроки получают свои выигрыши f1 (х) = (f/ (х),..., f/ (х)), равные значению своей векторной

функции в сложившейся ситуации х е X . Цель игрока i е N состоит в выборе такой своей стратегии, чтобы получить возможно большие значения каждой компоненте своей векторной функции выигрыша f (х) = (f/ (х),..., f' (х)). При выборе стратегии игрок должен учитывать выборы остальных игроков.

В качестве решения задачи обычно используется равновесная по Парето ситуация [4-6]. Определение 1. Ситуация х* е X игры (1) называется равновесием по Парето, если

Vi е N, хг е X1 выполнено равенство fl (х—*, х1) = fl (х*) или 3/ е N , что

fi (х-'*, х1) < fi (х*).

Равновесие по Парето в игровой задаче с векторными выигрышами (1) является первым шагом в процессе выбора решения. Как правило, таких решений достаточно много. Причина состоит в несравнимости исходов. В этом проявляется неопределенность в цели. «Выбор между несравнимыми исходами является сложной концептуальной проблемой и составляет основное содержание многокритериальной оптимизации» [7]. В то же время решение, не являющееся равновесием по Парето, не может претендовать на роль единственного решения задачи (1). Таким образом, для выбора единственного решения требуется уточнение концепции равновесия по Парето.

3. Среднеквадратичное равновесие

В проблеме уточнения решения для задачи векторной оптимизации (1) один из путей состоит в использовании такой ситуации, что в критериальном пространстве доставляет минимальное отклонение от некоторого «идеального» состояния [8]. Рассмотрим аналогичный подход к игровой задаче с векторными выигрышами (1).

Для каждого игрока i е N и набора стратегий остальных игроков х ~г еП X 3

Х ^3еN, 3^г

рассмотрим множество в пространстве критериев R l1

фг (х-г) = {f1 (х-, х') | х' е X1}. (2)

Для этого множества определим числа

fj*( х-) = max ^ifj (х-, хг), j = 1,..., ^ (3)

и набор таких чисел

f* = Г*(х-) = (/1*(х-),..., f *(х-)) е Rli (4)

назовем точкой утопии в пространстве критериев игрока i е N.

Рассмотрим параметрическое семейство задач векторной оптимизации (максимизации) относительно игрока i е N

V (х-) = (X1, / (х-, х1)}. (5)

В этой задаче параметром является набор стратегий х 1 е II X1, составленный из

± ±]'еМ, 1

стратегий всех игроков, кроме I-лидово расстояние V /', g1 е Я11

L^■еN, ] й

стратегий всех игроков, кроме 1-го. В пространстве критериев Я1 будем использовать евк-

( 1‘

л (Г, gг) =

£ (Г - ^ )2

V 1=1

Определение 2. Стратегия х1* е X1 игрока I е N называется среднеквадратичным решением в задаче векторной оптимизации V1 (х-1) из (5), если

х1* е а^штх1еХ1 Л (/'*(х-1), /' (х-1, х )). (6)

Ситуация х* = (х1 ,...,хп ) е X называется среднеквадратичным равновесием в игровой задаче с векторным выигрышами (1), если VI е N, х1 е X1 выполнено неравенство

Л(Г*(х-*), Г (х-*,х1*)) < Л(Г*(х-*), Г (х-*,х1)). (7)

В условиях (6) и (7) точка утопии Г' (х— ) определена, если в (4) положить

—I —I* / 1* '—1* 1+1* п*\ /-ч ^ —I* I* \ .1.

х = х = (х ,...,х ,х ,...,х ). Отметим, что ситуация (х ,х ) = х *.

Это определение является достаточно полным. Во-первых оно включают как частный случай определение равновесия для игры (1) при 11 = 1, I е N. Действительно, в этом случае

у _

(Г (х ), Г (х , х )) = 0, и неравенство (7) верно VI е N, х е X . Во-вторых, оно сводится к среднеквадратичному решению в задаче векторной оптимизации. Пусть в игре (1) имеется один игрок, т.е. N = 1. В этом случае в (5) представлена задача векторной оптимизации V1 = (X1, Г 1(х1)}. Тогда согласно определению 2, стратегия х1* из (6) является среднеквадратичным решением задачи векторной оптимизации.

Содержательно среднеквадратичное равновесие означает, что игрок I е N, уклонившись в одностороннем порядке от этой ситуации, не может в «своем» критериальном пространстве перейти в такое новое состояние, что в евклидовой метрике будет располагаться ближе к точке утопии. В частности отсюда получаем, что если игрок I е N, уклонившись в одностороннем порядке от равновесной ситуации, улучшит какую-либо компоненту «своей» векторной функции выигрыша, то обязательно найдется другая компонента, результат по которой ухудшится. Из последнего следует

Утверждение 1. В игровой задаче с векторными выигрышами (1) каждое среднеквадратичное равновесие является равновесием по Парето.

Для доказательства теоремы существования среднеквадратичного равновесия используем вспомогательный результат, имеющий и самостоятельное значение.

Лемма. Пусть функции g1(x),....,gk (х) определены, неотрицательны и выпуклы на

выпуклом множестве X с Яп. Тогда функция к(х) = ^2(х) +... + gk2(x))0,5 выпукла наX.

Доказательство следует из определения выпуклой функции и неравенства Коши — Буняковского [9].

Утверждение 2. Пусть в игре (1) для любого игрока I е N выполнены условия:

а) множество стратегий X1 с Я^ непустой выпуклый компакт;

б) векторная функция Г (х) непрерывна на X;

л0,5

в) векторная функция Г (х 1, х') вогнута на X1 для любого набора стратегий х—1 е П XI

Тогда в игре существует среднеквадратичное равновесие.

Отметим, что векторная функция Г (х—1, х') вогнута на X1, если на этом множестве вогнута каждая его компонента (х—, х1), у = 1,..., 11.

Доказательство основано на применении теоремы Какутани о неподвижной точке [10]. Согласно этой теореме многозначное отображение непустого, компактного и выпуклого множества X с Яр в себя с непустыми, компактными и выпуклыми значениями и полунепрерывное сверху по включению должно иметь хотя бы одну неподвижную точку. В рассматриваемом случае условия теоремы выполнены, и неподвижная точка соответствующего многозначного отображения является среднеквадратичным равновесием в задаче (1).

По аналогичной схеме доказывается

Утверждение 3. Пусть в игре (1) для любого игрока 1 е N выполнены условия:

а) множество стратегий X1 с Як‘ непустой выпуклый компакт;

б) векторная функция Г (х) непрерывна на X;

в) для любого набора стратегий х—1 е П X функция Л (Г*(х-1'), Г (х-, х1)) =

Х ^]еN,]Ф1

= (((Г11*(х—) — Г(х-,х1 ))2 +... + (Г*(х—1) — Д (х-,х1 ))2)0,5 выпукла на X1.

Тогда в игре существует среднеквадратичное равновесие.

Пример. Рассмотрим конечную бескоалиционную игру двух лиц с векторными двухкритериальными выигрышами из [6]. Такая игра определяется аналогично биматричной игре [1,2]. Отличие состоит в том, что выигрыши игроков представлены векторами размерности два.

(9,0) (9,0) (1,4) (10,9)

(10,9) (1,4) (4,1) (4,1)

В этой игре два игрока (п = 2). В таблице первый игрок выбирает строки (первая, вторая строка), а второй игрок — столбцы (первый, второй столбец). Каждая клетка таблицы соответствует ситуации игры. В клетках представлены векторы выигрышей: в верхнем левом углу выигрыш первого игрока, в нижнем правом углу — второго игрока. Векторы выигрышей являются двухкомпонентными (11 = 12 = 2). Смешанные стратегии — это векторы, составляющие фундаментальный симплекс в евклидовом пространстве Я2. Выигрыши игроков при использовании смешанных стратегий стандартным образом определяются как математическое ожидание, вычисленное для каждой компоненты векторного выигрыша отдельно.

В [6] показано, что в этой игре множество всех равновесных по Парето ситуаций в смешанных стратегиях Р равно

{((а,1 — а); (в,1 — Р))|0 < а < 0,25;0 < в < 0,25^{((а,1 — а)|0,25 < а < 1}^ {0; (в,1 — в)0,25 < в < 1}.

Множество таких решений бесконечно, более того, его мощность — континуум. Выделим из этого множества одно решение, которое является среднеквадратичным равновесием.

Проведем рассуждения для первого игрока. Определим множество Ф1(х-1) из (2). В

нашем случае Ф1(х 1) = Ф1 (в) и представляет собой отрезок АВ в пространстве Я2, где точки А(1 + 2в, 4 — 4в) и В(4 + 6в, 1 + 8в).. Так как согласно утверждению 1 среднеквадратичные равновесия находятся среди равновесий по Парето, то ограничимся рассмотрением стратегий второго игрока с условием 0 < в < 0 ,25. Отметим, что и для первого игрока будем также учитывать только стратегии, у которых 0< а < 0,25. Согласно (4) определим точку

1*

утопии для первого игрока: Г = (4 + 6в, 4 — 4в), а по (5) — параметрическое семейство задач векторной оптимизации:

V 1(в) = (X1 = [0, 0,25], /(а, в) = (4 — 3а + 6в + 2оф, 1 + 3а + 8в — 12ав)}. (8)

Здесь а = [0, 0,25] определяет стратегию первого игрока и выбирается им из условия минимизации среднеквадратичного отклонения, как это представлено в (6). В данных условиях для каждого в = [0, 0,25] найдется единственное значение а = а(в) е [0, 0,25], что является решением включения (6).

Для нахождения этой функции найдем точку на отрезке АВ в пространстве Я2, где А(1 + 8в, 4 — 4в) и В(4 + 6в, 1 + 8в),, ближайшую к соответствующей точке утопии 1*

Г = (4 + 6в, 4 - 4в). Используя полученные значения и учитывая векторную функцию выигрыша из (8), получаем систему для определения функции а = а(в):

4 - 3а +6в + 2ав = 0,5 (1176в3 - 488в2 + 6в + 45)/(9 - 42в + 74в2);

1 + 3а + 8в - 12ав = 0,5-(-544в3 + 722в2 - 264в + 45)/(9 - 42в + 74в2).

Эта нелинейная система совместна и неопределенна. Ее общее решение имеет вид

а = 2,25 • (16в2 — 8в +1)/(9 — 42в + 74в 2 ).

Полученная функция предписывает первому игрока его наилучший ответ относительно критерия (6) на любой выбор второго игрока в е [0, 0,25]. По аналогичной схеме определяется функция в = 2,25 • (16а2 — 8ва +1)/(9 — 42а + 74а2) — наилучший ответ второго игрока.

Согласно определению 2, среднеквадратичное равновесие определяется как решение системы уравнений

а = 2,25 • (16в 2 — 8в +1)/(9 — 42в + 74в 2); в = 2,25 • (16а2 — 8ва +1)/(9 — 42а + 74а2 ).

Численное решение этой системы (с точностью до четырех знаков после запятой) имеет вид а = в = 0,1542. Итак, рассматриваемая игровая задача имеет единственное среднеквадратичное равновесие

х* = (х1*,х2*) где х1*= (0,1542, 0,8458) и х2*= (0,1542, 0,8458).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В этом случае игроки получают равные векторные выигрыши

Г1 (х1*, х 2*) = Г 2 (х1*, х 2*) = (4,5103, 2,4110).

4. Заключение

В работе рассмотрена игровая задача N лиц с векторным выигрышем у каждого игрока (1). Для такой задачи имеются общепринятые подходы к определению решения. Они реализованы в концепции равновесной ситуации по Нэшу — Парето [4-6].

Но, как правило, в игровой задаче с векторными выигрышами существует бесконечное множество решений. Все они равноправны относительно определения векторного равновесия. Возникает проблема уточнения решения.

В данной работе определяется ситуация в игре (1), равновесная в игровом смысле относительно минимизации расстояния до соответствующей точки утопии. Такое решение называется среднеквадратичным равновесием и является уточнением равновесия Нэша — Парето. Свойствам такого решения, в частности условиям существования, и посвящена работа.

Предложенный метод позволяет улучшить качество решения в сложных случаях. Во-первых, среднеквадратичное равновесие существует для достаточно широкого класса задач. Во-вторых, такое решение исключает заведомо неудачные, неравновесные ситуации из числа «претендентов» на оптимальный выбор. В-третьих, метод позволяет в некоторых случаях выделить единственное решение. Такую возможность демонстрирует приведенный пример.

1. Fudenberg D., Tirole J. Game Theory. Cambridge: MIT Press, 1993. 579 p.

2. Петросян Л.А., Зенкевич Н.А., Семина Е.А. Теория игр. М.: Высшая школа, 1998. 304 с.

3. Жуковский В.И. Кооперативные игры при неопределенности и приложения. М.: УРСС, 1999. С.17.

4. Shaplay L.S. // Naval Research Logistics Quarterly. 1959. Vol.6. P.57-61.

5. Van Megen F., Borm P., Tijs S. // Math. Methods of OR. 1999. Vol.49. № 3. P.401-412.

6. Матвеев В.А. // Изв. Ин-та математики и информатики УдГУ. Ижевск, 2001. Вып.1 (21). С.67-82.

7. Розен В.В. Математические модели принятия решений в экономике. М.: Высшая школа, 2002. С.55.

8. Zhukovskii V.I., Salukvadze M.E. The Vector-Valued Maximin. Boston, San Diego, N.Y., L.: Academic Press, 1994. 480 p.

9. Канторович Л.В., Акилов Г.Г. Функциональный анализ. М.: Наука, 1972. С.134.

10. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. М.: Мир, 1988. 512 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.