Научная статья на тему 'Среднеквадратичное равновесное решение в игровой задаче'

Среднеквадратичное равновесное решение в игровой задаче Текст научной статьи по специальности «Математика»

CC BY
146
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Arctic Environmental Research
Область наук
Ключевые слова
БЕСКОАЛИЦИОННАЯ ИГРА / ВЕКТОРНЫЙ ВЫИГРЫШ / СРЕДНЕКВАДРАТИЧНОЕ РАВНОВЕСИЕ

Аннотация научной статьи по математике, автор научной работы — Матвеев Владимир Александрович

В работе рассматривается математическая модель: игровая задача для N лиц с векторными выигрышами. Обычно в таких случаях в качестве решения используется равновесие Нэша-Парето. Как правило, таких решений бесконечно много. Возникает проблема уточнения равновесия. Предлагается концепция среднеквадратичного равновесия. В работе представлены условия существования такого решения и приводится модельный пример.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ROOT-MEAN-SQUARE EQUILIBRIUM IN GAME PROBLEM

The paper considers the following mathematical model: a game problem for n persons with vector payoffs. The Nash-Pareto equilibrium is usually used as a solution in this case. As a rule, there is an infinite set of such solutions, so a refinement problem arises. The root-mean-square equilibrium is suggested. The paper presents the existence conditions of this solution and adduces a model example.

Текст научной работы на тему «Среднеквадратичное равновесное решение в игровой задаче»

УДК 519.83

МАТВЕЕВ Владимир Александрович, кандидат физико-математических наук, доцент кафедры алгебры и геометрии Псковского государственного педагогического университета. Автор 80 научных публикаций, в т.ч. трех учебно-методических пособий

СРЕДНЕКВАДРАТИЧНОЕ РАВНОВЕСНОЕ РЕШЕНИЕ

В ИГРОВОЙ ЗАДАЧЕ

В работе рассматривается математическая модель: игровая задача для N лиц с векторными выигрышами. Обычно в таких случаях в качестве решения используется равновесие Нэша-Парето. Как правило, таких решений бесконечно много. Возникает проблема уточнения равновесия. Предлагается концепция среднеквадратичного равновесия. В работе представлены условия существования такого решения и приводится модельный пример.

Бескоалиционная игра, векторный выигрыш, среднеквадратичное равновесие

Рассматривается бескоалиционная игра п лиц с векторными выигрышами

( N. {X , {/«Ми )• (1)

Здесь N = {1,2,..., п} - конечное множество номеров игроков. Множество X(г> ^ Rfa состо-

о. (() / (() (() (()\

ит из стратегий х = (X ,х2 ,..., хк ) игрока ( е N. Стратегия отождествляется с точкой ki - мерного евклидового пространства. Набор стратегий всех игроков называется ситуацией и

множество всех ситуаций X = П= 1X((). Заданы векторные функции /(() : X ^ RIг, которые каждой ситуации ставят в соответствие

вектор /г (х) = (// (x), У2( (x>,..., / (х)) выигрышей игрока г е N.

Партия игры развивается следующим образом: каждый из игроков г е N выбирает свою

(г) ^(г)

стратегию х е X , в результате чего складывается общая ситуация х е X. После этого игроки получают свои выигрыши

/(х) = (/1()(x), /2((Ч^... Л(0(х)) , равные

значению своей векторной функции в сложившейся ситуации х е X. Цель игрока г е N состоит в выборе такой своей стратегии, которая позволит достичь возможно большего значения каждой компоненты векторной функции выигрыша.

В последние годы игровые задачи с векторными выигрышами активно изучаются [1-3]. Ранее в России начались исследования по антагонистическим игровым задачам с векторными выигрышами. В этом направлении результаты связаны с именем профессора В.И. Жуковского и его учеников [4, 5].

Рассмотрим задачу (1 ) при условии ^ = 1, г е N. В таком случае наиболее часто используется концепция равновесия по Нэшу. «Так как в такой игре [бескоалиционная игра N лиц] переговоры невозможны, то ее решение должно быть устойчивым, то есть равновесием по Нэшу» [6]. Применим концепцию равновесия по Нэшу к задаче (1) с векторными выигрышами у игроков.

Определение 1. Ситуация х* е X игры (1) называется равновесием Нэша-Парето, если

3/ е N, х(г) е X(0, k е {1,2,..., I г}, что

/к}(х* | х(г}) > /к \х*), то следует

3 е {1,2,..., ,} и /;Г)(х*\хт) < /;Г)( х*), причем (х* | х(,)) = (х(1) ,х(2)*,...,х(,-1)*,х(,),х(,+1)*,...,х(и)*).

Это определение является достаточно общим. Оно включает как частный случай определение равновесия по Нэшу для игры (1) при

I. = 1, / е N и максимума по Парето при

N = {1}.

Содержательно ситуация Нэша-Парето означает, что если игрок / е N, уклонившись от нее в одностороннем порядке, улучшит свой результат по какой-либо компоненте векторной функции выигрыша, то найдется другая компонента этой функции, результат по которой ухуц-шится.

Равновесие по Нэшу-Парето в игровой задаче с векторными выигрышами (1) является первым шагом в процессе выбора решения. Как правило, таких решений достаточно много. Для выбора единственного решения требуется уточнение концепции равновесия.

В проблеме уточнения решения для задачи векторной оптимизации один из путей состоит в использовании такой ситуации, что в критериальном пространстве доставляет минимальное отклонение от некоторого «идеального» состояния [4]. Рассмотрим аналогичный подход к игровой задаче с векторными выигрышами (1). Для каждого игрока г е N и набора страте-

о. (—г) л/г(~/)

гий остальных игроков х е X ^

^ П^ ,& X(1) рассмотрим множество в пространстве критериев Яг‘

Ф«(х(—г)) = {/(г)(х(—°, х(0) | х(0 е X(г)}. (2)

Для этого множества определим числа

/,(г)*(х(—)) = тах /,(г)( х(_г), х(г)),

1 = 1,2,... ,1 г (3)

и набор таких чисел

/ (1)* = / (г)*( х (—г)) =

=(/,»’•(х<-',...,х'4')) е Е'г (4)

назовем точкой утопии в пространстве критериев игрока г е N.

Рассмотрим параметрическое семейство задач векторной оптимизации (максимизации) относительно игрока г е N

V(г) (х(—г)) = {X(г), /(г) (х(—г), х(г))}. (5)

В этой задаче параметром является набор стратегий х(—г) е П,& X(1) . Этот набор составляют стратегии всех игроков, кроме / — го.

В пространстве критериев Яг‘ будем использовать евклидово расстояние, т. е. V/(г), g(г) е Я1‘

<] (1g (г)> = (^ (1(г)—g ,г))2),,!.

Определение 2. Стратегия х(г)* е X(г) игрока г е N называется среднеквадратичным решением в задаче векторной оптимизации

V (г)( х(—г)) из (5), если

х(г)* е а^тт^еX(,) ё(/(г)*(х(—г)),/(г)(х(—г),х(г))

(6)

где точка утопии /(г)* = /(г)(х(—г)) е Я1‘ определена в (3), (4).

Отметим, что среднеквадратическое решение в задаче векторной оптимизации (5) зависит от параметра - набора стратегий х(—г) всех игроков кроме г — го.

Определение 3. Ситуация х = = (х(1)*,...,х(и)*) е Xназывается среднеквадратичным равновесием в игровой задаче с векторным выигрышами (1), если V; е N

(г) л/" (г)

х е X выполнено неравенство

ё(/{г)\х(—)*), /(г) (х(—)*, х(г)*)) <

< ё (/ (г)*( х(—)*), /(г) (х Н)*, х(г))). (7)

Здесь точка утопии / (г)*( х(-г)*) определена в (3) и (4), если в последнем положить х(—г) = (х(1)*,..., х(г—1)*, х(г—1)*,..., х(и)*). Отметим, что ситуация (х(-1)*, х(г)*) = х *.

Это определение является достаточно полным. Во-первых, оно включает как частный случай определение равновесия по Нэшу для игры (1) при ,г= 1, г е N. Действительно,

в этом случае (f (г)*( x( г)*), f (г)(х( г)*, x(г)*)) = 0 и неравенство (7) верно Vi е N Х(i) е X(i).

Во-вторых, оно сводится к среднеквадратичному решению в задаче векторной оптимизации. Пусть в игре (1) имеется один игрок, т.е. N = {1} . В этом случае в (5) представлена задача векторной оптимизации

V(1) = {X(1), f (1)( x(1))}. Тогда, согласно определению 2, стратегия x(1)* из (6) является среднеквадратичным решением задачи векторной оптимизации.

Содержательно среднеквадратичное равновесие означает, что игрок i е N, уклонившись в одностороннем порядке от этой ситуации, не может в «своем» критериальном пространстве перейти в такое новое состояние, что в евклидовой метрике будет располагаться ближе к точке утопии. В частности, отсюда следует, что, если игрок i е N, уклонившись в одностороннем порядке от равновесной ситуации, улучшит какую-либо компоненту «своей» векторной функции выигрыша, то, обязательно, найдется другая компонента, результат по которой ухудшится. Из последнего, с учетом содержательного смысла равновесия Нэша-Парето в игровой задаче (1), следует

Утверждение 1. В игровой задаче (1) каждое среднеквадратичное равновесие является равновесием Нэша-Парето.

Обратное утверждение неверно, что демонстрирует пример 1.

Для доказательства теоремы существования установим вспомогательный результат, имеющий и самостоятельное значение.

Лемма. Пусть функции g1(x),...,gk(x) определены, неотрицательны и выпуклы на выпуклом множестве X œ Rn. Тогда функция h(x) = (g2(x) +... + g2k(x))1/2 выпукла на X.

Доказательство. По условию функции g1( x),..., gk ( x) выпуклы. Это означает, что

Vx, y е X,a е [0,1] выполнены неравенства

0 < g, (ax +(1 - a)y) < agi(x) +(1 - a)g, (y), i = 1,...,k.

После возведения в квадрат и группировки получаем

0 < g2(ш• + (1 — а)у) +... +

+ g2k(ах +(1 — а)У) < а2(gl2(х) + ..

... + ^к( х)) +(1 — а)2 (^( у) +... +

+ gl(У)) + 2а(1 — а)( gl(х) gl(У) + ..

... + gk(х) gk(у)). (8)

Используем неравенство Коши-Буняковско-го для векторов g(х) = (gl(х),...,gk(х)) и

g(у) = (^(УХ...,gk(у)) получаем:

(gl(х)gl(У) +... + gk(х)gk(У)) <

< (gl2 (х) +... + g¡ (х))( g2 (У) +... + g¡ (У)). Усилим неравенство (8)

0 < gl2(aх + (1 — а)у) +... +

+ g2k (ах + (1 — а)У) < а"^2(х) + ..

... + ^к( х)) + (1 — а )2( ^( у) +... +

+ g2k(У)) + 2а(1 — а)( g2 (х) + ..

+ gk2( х))( g2( У) +...

... + gk2( У)).

Правая часть последнего неравенства есть полный квадрат. Таким образом, имеем

0 < gl2(aх + (1 — а)у) +... +

+ g2k (ах + (1 — а)У) < (а(^2 (х) + ..

... + g2( х))1/2 + (1 — а)(( g2( у) +... + g2( у))1/2)2

Перепишем последнее неравенство, используя обозначения функции

И( х) = (g2( х) +... + g2( х))1/2,

0 < И2 (ах + (1 — а)у) < (аИ(х) + (1 — а)И(у))2.

Извлекая квадратные корни, получаем 0 < И(ах + (1 — а)у) < (аИ(х) + (1 — а)И(у)). Это есть определение выпуклости функции И(х) на множестве X, что и требовалось доказать.

Условия существования среднеквадратичного равновесия представлены в

Утверждение 2. Пусть в игре (1) для любого игрока г е N выполнены условия:

а) множество стратегий X(г) с Я ‘ - непустой выпуклый компакт;

б) векторная функция / (г)( х) непрерывна на X;

в) векторная функция / (г)( х(—г), х(г)) вогнута на X(г) для любого набора стратегий

/,1)*(х( г))— /(г)(х( г),х(г)), 1 = 1,...,^ выпуклы

<гу(—г) (г)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

х(—г) е X(—г) с

П

X(1). Тогда в игре существует среднеквадратичное равновесие.

Отметим, что векторная функция /(г)(х(—г), х(г)) вогнута на X(г), если на этом множестве вогнута каждая его компонента

/“(х("°, х <■>), 1 = 1,2,..., ,г

Доказательство основано на применении теоремы Какутани о неподвижной точке [7, 8]. Согласно этой теореме многозначное отображение непустого, компактного и выпуклого множества X с Яр в себя с непустыми, компактными и выпуклыми значениями и полунепрерывное сверху по включению должно иметь хотя бы одну неподвижную точку. Покажем выполнение условий этой теоремы.

Так как множество стратегий X(г) с Як‘ есть непустой и выпуклый компакт, то таким же будет и множество всех ситуаций

X = ПгеNX(г) С ЯР , Р = ^ + - + kn . Определим непрерывное отображение р : X ^ X . Каждой ситуации х е X и игроку г е N поставим в соответствие точку утопии / (г)*из (4) в пространстве его критериев Я1. Компоненты этой точки определяются по правилу (3) и непрерывно зависят от параметра х(—г) и, значит, от ситуации х. Зная точку утопии /(г) , рассмотрим задачу минимизации (6) для функции ё(/(г)*(х(—)),/(г)(х(—г),х(г)) на множестве

X(г).

По условию функции /1(г)(х( г), х(г)), г = 1,2,...,^ вогнуты на X(г) при любом

X

(—г)

с

П

на X(г). Кроме того, эти функции являются неотрицательными на X(г), что следует из условия (3). Для набора функций

(г)

/Г(х(—))—/Ч^,х()), 1 = 1,...,,, на X выполнены условия леммы. Итак, получаем, что функция

ё (/(г)*, / (г)( х(—), х(г))) =

= (((П"(. х /Г( х'—), хт))2 + ...

... + </,")V-’)-/¡"(х'-", х |,|))2)|/! (9)

непрерывна на X и выпукла на множестве стратегий X(г). Для нахождения среднеквадратичного равновесия рассмотрим множество тех х(г)* е X(г), что выполнено условие (7). Множество этих х(г)* составляют все решения задачи минимизации (6). Обозначим это множество

X (г)*( х Н)) =

= argmlnх^„ ё(/(г)*(х(—г),/(г)(х(—г),х(г)). (10)

Отметим, что функция ё (/ (г)*( х(—г)), /(г)(х(—г), х(г))) непрерывна по совокупности аргументов и выпукла на X(г), а множество X (г)*( х(—) ) из (6) непусто, замкнуто (компактно) и выпукло. Кроме того, это множество, которое зависит от набора стратегий х( г) е X( г) с П1 & X(г), является полунепрерывным сверху по включению [9].

Таким образом, для любой ситуации х е X и игрока г е N однозначно определяется множество X(г)*(х(—)) с X(г) с Як‘. Определим отображение р : X ^ X следующим образом: р(х) = (X(1)*(х(-1}),...,X(п)*(х(-п))) с X =

П X(г) с Яр,р =k 1+... + kn.

± ±геN 1 п

(11)

jеN, ] &

X(1). Тогда функции

Из свойств множества X (г)*( х( г)), г = 1,2,..., п, определенного в (8), следует, что многозначное отображение р имеет непустые компактные и выпуклые значения и является

полунепрерывным сверху по включению. Тогда по теореме Какутани существует ситуация х* е X, что р(х*) = х * .

Покажем, что эта ситуация является среднеквадратичным равновесием в игровой задаче с векторными выигрышами (1). Действительно, если игрок г е N в одностороннем порядке уклонится от своей стратегии х(г) е X(г), входящей в среднеквадратичное равновесие

* / (1)* (г)* (п)*\

х = (х '' ,..., хК) ,..., х ; ), то это не изменит его точку утопии /(г) (х( г)) из (4). Тогда, учитывая условие (10), получаем

ё(/(г)*(хН)*),/(г)(х(г)*,х(г)*)) <

< ё(/(г)*(х(—)*),/(г)(х(г)*,х(г))).

Последнее неравенство есть определение среднеквадратичного равновесия (7) в игровой задаче (1). Теорема доказана.

Представленная выше теорема показывает, что среднеквадратичное равновесие в задаче (1) является неподвижной точкой многозначного отображения (11), компоненты которого определены в (10). Эти условия в некоторых случаях позволяют вычислить среднеквадратичное равновесие.

Анализируя доказательство утверждения 1, следует выделить основной пункт. Это доказательство выпуклости функции ё(/(г)*(х(—г)), / (г)( х(г), х(г))) из (9) на множестве стратегий X(г). Условия теоремы можно усилить, потребовав в условии выпуклость соответствующей функции. На этом пути получаем

Утверждение 3. Пусть в игре (1) для любого игрока г е N выполнены условия:

а) множество стратегий X(г) с Як‘ непустой выпуклый компакт;

б) векторная функция / (г)( х) непрерывна на X;

в) для любого набора стратегий

х(—г) е X(—г) с ПlеN, 1&г X(1) функдия ё ( / (г)*( х(—г)), / (г)( х(—г), х(г))) =

= ((^.1l(г)*( х Н)) — /1(г)( х(—г), х(г)))2 + ...

... + (/,(°*( х(—г)) — /,(г)( х(—г), х (г)))2)1/2

из (9) выпукла на X(г). Тогда в игре существует среднеквадратичное равновесие.

Доказательство в основном повторяет доказательство утверждения 1. Выпуклость функции ё (/ (г)*( х(-г)), / (г)( х(—г), х(г))) из (9) на X(г) гарантирует нужные свойства многозначному отображению (11), что и доказывает утверждение.

Пример 1. В качестве примера рассмотрим конечную бескоалиционную игру двух лиц с векторными двухкритериальными выигрышами из [3]. Такая игра определяется аналогично биматричной игре из [10]. Отличие состоит в том, что выигрыши игроков представлены векторами, размерности два.

(9,0) (9,0) (1,4) (10,9)

(10,9) (1,4) (4,1) (4,1)

Рис. 1. Биматричная игра двух лиц с двухкритериальным выигрышем у каждого игрока

В этой игре два игрока, т.е. N = {1,2}. Первый игрок выбирает строки (первая, вторая строка), а второй игрок - столбцы (первый, второй столбец). Каждая клетка таблицы соответствует ситуации игры. В клетках представлены векторы выигрышей: в верхнем левом углу выигрыш первого игрока, в нижнем правом углу - второго игрока. Векторы выигрыш е й я вл я ют с я д вух комп он ен т н ыми , т. е. К, = , = 2. Смешанные стратегии - это векторы, составляющие фундаментальный симплекс в евклидовом пространстве Я2. Стандартным образом определяются выигрыши игроков при использовании смешанных стратегий как математическое ожидание, вычисленное для каждой компоненты векторного выигрыша отдельно.

В [3 ] показано, что в этой игре множество всех равновесных по Нэшу-Парето ситуаций в смешанных стратегиях

Р = {((а, 1 — а);(Р, 1 — Р)|0 < а < 0,25;

0 < Р < 0,25} и {((а, 1 — а); 0) | 0,25 < а < 1} и

{(0; (р, 1 — Р)) | 0,25 < р < 1}. (12)

Выделим из этого множества одно решение, которое является среднеквадратичным равновесием. Проведем рассуждения для первого игрока. В силу симметрии матрицы выигрышей, рассуждения для второго будут аналогичны. Напомним, что множество смешанных стратегий первого (второго) игрока составляют фундаментальный симплекс в евклидовом пространстве Я2 и обозначаются X(1) = {х(1) = (а, 1 — а) | 0 < а < 1}

X(2) = {х(2) = (Р, 1 — Р) | 0 < р < 1}). Определим множество Ф (1)( х(-1)) из (2). В нашем случае Ф (1)( х(-1)) = Ф (1)(Р) и представляет собой отрезок АВ в пространстве Я2, где А(1 + 8р, 4 —4Р) и В(4 + 6р, 1 + 8Р). Поскольку, согласно утверждению 1, среднеквадратичные равновесия находятся среди равновесий по Нэшу-Парето, то, учитывая (10), ограничимся рассмотрением стратегий второго игрока с условием 0 < Р < 0,25 . Отметим, что и для первого игрока будем также учитывать только стратегии, у которых 0 < а < 0,25.

Определим точку утопии для первого игрока /(1)* = /(1)*(Р) из (4). Из рис. 2 следует, что /(1)* = (4 + 6Р, 4 —4Р). Рассмотрим параметрическое семейство задач векторной оптимизации (5) для первого игрока

V (1)(Р) = {X(1) = [0,0,25], / (1)(а, Р) =

= (4 — 3а + 6Р + 2аР, 1 + 3а + 8Р — 12аР)}.(13) В данных условиях для каждого Р е [0,0,25] найдется единственное значение а = а(Р) е [0,0,25], что является решением включения (6). Эта функция а = а(Р) будет непрерывной при Р е [0,0,25] .

Получаем, что функция а = 2,25(16Р2 — — 8Р +1) /(9 — 42 Р + 74Р2) предписывает пер-

вому игроку его наилучший ответ относительно критерия (6) на любой выбор второго игрока Р = [0,0,25].

Как было сказано выше, по аналогичной схеме определяется функция Р = Р(а), которая для каждого выбора первого игрока а е [0,

0,25] указывает наилучший относительно критерия (6) ответ второго. Получаем, что Р = 2,25(16а2 —8а +1)/(9 — 42а + 74а2).

«утопии» и(4 + 6Р,4 — 4Р)

Согласно определению 3, среднеквадратичное равновесие в рассматриваемой задаче составляют пара стратегий первого и второго игроков, каждая из которых является наилучшей реакцией игрока на действие партнера. Эта ситуация определяется как решение системы уравнений

а = 2,25(16Р2 — 8Р +1)/(9 —42Р + 74Р2),

Р = 2,25(16а2 —8а +1)/(9 — 42а + 74а2).

Численное решение этой системы (с точностью до четырех знаков после запятой) имеет вид а = Р = 0,1542. Итак, рассматриваемая игровая задача имеет единственное среднеквадратичное равновесие

х * = (х (1)\ х(2)*),

где х(1)* = (0,1542, 0,8458)

и х (2)* = (0,1542, 0,8458). = / (2)(х(1)*, х (2)*) = (4,5103, 2,4110).

В этом случае игроки получают равные Таким образом, предлагаемое среднеквад-векторные выигрыши ратичное равновесие является строгим уточне-

/(1)(х(1)* х(2)*) = нием равновесия Нэша-Парето.

Список литературы

1. VanMegen F., Borm P., TijsS. A Preference Concept for Multicriteria Game // Mathematical Methods of OR. 1999. Vol. 49. J№. 3. P 401-412.

2. Wang S. Existence of a Pareto Equilibrium // J. of Optimization Theory and Applications. 1993. Vol. 3. P. 61-63.

3. Матвеев В.А. Игровая задача с векторным выигрышем // Изв. Ин-та математики и информатики Удмурт. гос. ун-та. Ижевск, 2001. Вып. 1(21). С. 67-82.

4. Zhukovskii VI., SalukvadzeM.E. The Vector-Valued Maximin. Boston, San Diego, New-York, London, 1994.

5. Многокритериальные модели при неопределенности и их приложения: межвуз. сб. науч. тр. Челябинск, 1988.

6. Damme Eric van. Refinement of the Nash Equilibrium Concept. Springer - Verlag, 1983.

7. КанторовичЛ.В., АкиловГ.Г. Функциональный анализ. М., 1972.

8. FudenbergD., Tirole J. Game Theory. Cambridge, 1993.

9. ОбенЖ.-П., ЭкландИ. Прикладной нелинейный анализ. М., 1988.

10. Петросян Л.А., Зенкевич Н.А., СеминаЕ.А. Теория игр. М., 1998.

Matveev Vladimir

ROOT-MEAN-SQUARE EQUILIBRIUM IN GAME PROBLEM

The paper considers the following mathematical model: a game problem for n persons with vector payoffs. The Nash-Pareto equilibrium is usually used as a solution in this case. As a rule, there is an infinite set of such solutions, so a refinement problem arises. The root-mean-square equilibrium is suggested. The paper presents the existence conditions of this solution and adduces a model example.

Контактная информация: e-mail: [email protected]

Рецензент - ПатроноваН.Н., кандидат педагогических наук, доцент кафедры прикладной математики Поморского государственного университета имени М.В. Ломоносова

i Надоели баннеры? Вы всегда можете отключить рекламу.