Научная статья на тему 'Метод реализации принципа оптимальности в матричных играх без седловой точки'

Метод реализации принципа оптимальности в матричных играх без седловой точки Текст научной статьи по специальности «Математика»

CC BY
114
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТРИЧНА ГРА / ОПТИМАЛЬНА ЗМіШАНА СТРАТЕГіЯ / СПЕКТР СТРАТЕГії / іМОВіРНіСТЬ / МАТРИЧНАЯ ИГРА / ОПТИМАЛЬНАЯ СМЕШАННАЯ СТРАТЕГИЯ / СПЕКТР СТРАТЕГИИ / ВЕРОЯТНОСТЬ / MATRIX GAME / OPTIMAL MIXED STRATEGY / STRATEGY SPECTRUM / PROBABILITY

Аннотация научной статьи по математике, автор научной работы — Романюк В. В.

Разработан метод реализации оптимальных смешанных стратегий в произвольной матричной игре с неизвестным количеством партий игры. Основой разработанного метода является разыгрывание игроком равномерно распределённых на единичном полусегменте случайных величин, причём вероятности их разыгрывания привязаны к вероятностям избирания чистых стратегий из спектра оптимальной смешанной стратегии. Библиогр.: 8 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of realizing the optimality principle in matrix games without the saddle point

There has been developed the method of realizing the optimal mixed strategies in an undefined matrix game with unknown quantity of the game plays. The ground of the developed method is the player raffling the uniformly distributed on the unit semisegment variates, when the probabilities of their raffle are linked to the probabilities of the pure strategies selection from the optimal mixed strategy spectrum. Refs: 8 titles.

Текст научной работы на тему «Метод реализации принципа оптимальности в матричных играх без седловой точки»

УДК 519.832.3

В. В. РОМАНЮК, канд. техн. наук, ХНУ (м. Хмельницький)

МЕТОД РЕАЛІЗАЦІЇ ПРИНЦИПУ ОПТИМАЛЬНОСТІ У

МАТРИЧНИХ ІГРАХ БЕЗ СІДЛОВОЇ ТОЧКИ

Розроблено метод реалізації оптимальних змішаних стратегій у довільній матричній грі з невідомою кількістю партій гри. Основою розробленого методу є розігрування гравцем рівномірно розподілених на одиничному напівсегменті випадкових величин, причому імовірності їх розігрування прив’язані до імовірностей обирання чистих стратегій зі спектру оптимальної змішаної стратегії.

Ключові слова: матрична гра, оптимальна змішана стратегія, спектр стратегії, імовірність.

Постановка проблеми. Одним з найбільш простих способів дослідження та прогнозування конфліктно-керованих процесів є застосування ігрового математичного моделювання, де основою є теорія антагоністичних ігор. Матричні антагоністичні ігри є досить гнучкою та зручною моделлю для швидкого вирішення практичних задач, пов’язаних з прийняттям оптимальних рішень в умовах конфліктних ситуацій [1, 2]. Відомі методи розв’язування матричної гри без сідлової точки дозволяють знайти її розв’язки у змішаних стратегіях, де довільна пара оптимальних стратегій гравців складає ситуацію рівноваги і, таким чином, задовольняє принципу оптимальності. Проте практична реалізація принципу оптимальності, тобто практична реалізація кожним гравцем його змішаних стратегій у реальних процесах, розроблена та досліджена досить поверхнево [3, 4].

Аналіз літератури. У роботі [5] показано як реалізувати оптимальні змішані стратегії у довільній матричній 2 х 2 -грі з кінцевим числом партій гри, де за основу взято розігрування гравцями у кожній партії гри двох незалежних рівномірно розподілених на напівсегменті [0; і) випадкових

величин та визначення за певними співвідношеннями тих чистих стратегій гравців, які у даній партії гри необхідно обирати. Це дає можливість досягти тотожності між математичним сподіванням виграшу першого гравця та значенням гри. Але необхідно знайти спосіб вирішення розглянутої проблеми для довільного числа чистих стратегій кожного з гравців, що з практичної точки зору може бути використано для оптимізації конфліктно-керованих систем, функціонування яких обмежено у часі [6, 7].

Мета роботи - узагальнити розроблений у [5] спосіб реалізації оптимальних змішаних стратегій для довільної матричної М х N -гри, де елементи множини натуральних чисел М є N \ {і}, N є N {і}, і, таким чином, розробити метод реалізації принципу оптимальності у матричних іграх без

сідлової точки.

Метод реалізації змішаних стратегій. Відомо, що коли у матричній 2 х 2 -грі з платіжною матрицею

P

(1)

a b c d

a є R, b є R, c є R, d є R, (2)

не виконується рівність

max{min{{a, b}, {c, d}}} = min{max{{a, c}, {b, d}}}, (3)

то у цій 2 x 2 -грі множина сідлових точок у чистих стратегіях є пустою,

причому

max {min {{a, b}, {c, d}}} < min {max {{a, c}, {b, d}}}, (4)

a + d Ф c + b , (5)

і така гра розв’язується в оптимальних змішаних стратегіях [1, 3, 5] першого

Х = [£ 1 ~р\ (6)

та другого гравців

Y = [q 1 -q], (7)

де р є (0; і), q є (0; і) і значення гри

Vovt=V(p,q) = XP(\)T. (8)

Тоді перший гравець розігрує рівномірно розподілену на напівсегменті [G; і)

випадкову величину © зі значенням 9 і знаходить число

sign(/7-0) + l І .

-• si

gn(^-9)|, (9)

яке, як видно, дорівнює 0 або 1. Паралельно другий гравець розігрує рівномірно розподілену на напівсегменті [0; 1) випадкову величину S зі значенням ^ і знаходить число

r _ siffl^) + 1.|sign(g_^|; (10)

2

а Ь г

1 1 1 - г

V (s, г) = 1 -

= арц + єц (1 - р) + Ьр (1 - цй (1 - р) (1 - ц), (11)

що є значенням випадкової величини, математичне сподівання якої дорівнює [5] значенню гри (8).

Тепер розглянемо довільну матричну М х N -гру з пустою множиною

сідлових точок у чистих стратегіях, де перший гравець володіє множиною

X = {хі чистих стратегій, а другий - множиною У = {у} ^ чистих

стратегій. Нехай оптимальною змішаною стратегією першого гравця буде вектор

Х = [Д р2 ••• рм_г Рм], (12)

а оптимальною змішаною стратегією другого гравця - вектор

У = [^і д2 ... дм_г дм]. (13)

Ці вектори, звісно, задовольняють очевидним вимогам:

X є Ям, рі є [0; 1] V і = 1, М, X Рі = 1, (14)

і=1

- Ат- г п ----- N

У є ЯN, є [0; 1] V і = 1, N, X = 1. (15)

і=1

За спектром

вирр X = {х, є X : рі > 0} = {х,к Ук=1 (16)

оптимальної стратегії (12) першого гравця сформуємо вектор відповідних імовірностей

*0 = [Р1 Рі2 ••• Рік-1 Рк Ь (17)

де К < М, ік < 4+і V к = 1, К -1 та 4 є{}М V к = 1, К. Аналогічно за спектром

supp у = {Уі є У : д} > °}= {ул \і=і (18)

оптимальної стратегії (13) другого гравця сформуємо вектор відповідних імовірностей

^ = [ЧЛ Чп - Ч]ь_х Ч]ь ], (19)

де ь ^ N, іі < У/+1 V І =1 Ь-1 та і ^і'}^ V І =1, ь.

Отож, у матричній 2 х 2 -грі з пустою множиною сідлових точок у чистих стратегіях кожен з гравців для визначення тієї чистої стратегії, яку у даній партії гри необхідно обирати, розігрує по одній рівномірно розподіленій на напівсегменті [0; 1) випадковій величині. Як узагальнення, у матричній М х N -грі з пустою множиною сідлових точок у чистих стратегіях, де гравці мають спектри (16) та (18) своїх оптимальних змішаних стратегій, перший гравець має розігрувати К -1 рівномірно розподілену на напівсегменті [0; 1)

випадкову величину {©^ І^1 зі значеннями {0* }К 1, а другий гравець -

розігруватиме Ь -1 рівномірно розподілену на напівсегменті [0; 1) випадкову

величину {Н; 1 зі значеннями {§, . Ясно, що у кожній парі

\Ь-1

{{©, Е1 }К- } ці випадкові величини мають бути незалежними.

— }К-

>і=

Нехай спочатку розігруються © та ^. Якщо 0 < р , то перший гравець обирає чисту стратегію ; інакше, якщо 01 > , то перший гравець

має обирати одну з решти К -1 чистих стратегій {ггі} . Тому далі він розігрує випадкову величину © . Зрозуміло, що імовірність її розігрування дорівнює 1 - рі . Якщо

02 < рпт^~, (20)

2 1 - Рч

то перший гравець обирає чисту стратегію х^ ; інакше, якщо

02 > Р^-1- , (21)

2 1 - Рч

то перший гравець має обирати одну з решти К - 2 чистих стратегій {х^ . І

далі перший гравець розігрує випадкову величину ©. Імовірність її

розігрування дорівнює 1 - (р, + р, ). Якщо

0 3 < рьл ,- 1 - Л , (22)

3 1-(рп + рь )

0з > р, 1 , , (23)

3 1 - (Рп + Р,2)

то перший гравець має обирати одну з решти К - 3 чистих стратегій \хік ^ .

Процес такого пошуку може тривати до тих пір, поки не залишиться дві чисті

стратегії хг- і та хік , серед яких першому гравцю необхідно вибрати одну.

Тоді він розігрує випадкову величину 1, де імовірність її розігрування

К-2 _

дорівнює 1 - £ ри . Якщо

к=1

0К-1 < рік-1 К-2 • (24)

1 - £рік

к=1

то перший гравець обирає чисту стратегію х ; інакше, якщо

0К-1 > рік-1 1К-2 • (25)

1 - £ рк

к=1

то перший гравець має обирати чисту стратегію х^ . Аналогічно повинен діяти і другий гравець. Якщо ^ , то другий гравець обирає чисту

стратегію у;і ; інакше, якщо ^ , то другий гравець має обирати одну з

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

решти Ь -1 чистих стратегій {у. ) . Тому далі він розігрує випадкову

V =2

величину Н2. Зрозуміло, що імовірність її розігрування дорівнює 1 - .

Якщо

^2 < • (26)

1 - дл

то другий гравець обирає чисту стратегію у]2 ; інакше, якщо

^2 > Цу2Т-^ • (27)

1 - дл

то другий гравець має обирати одну з решти Ь - 2 чистих стратегій \yjl . І далі другий гравець розігрує випадкову величину Н3. Імовірність її

розігрування дорівнює 1 - (д + д^ ). Якщо

£ з < Чпл ,- \ - , > (28)

л1 - (дл + чп)

то другий гравець обирає чисту стратегію у- ; інакше, якщо

£ з > ЧПл - 1 - л , (29)

31 - (дл +

то другий гравець має обирати одну з решти Ь - 3 чистих стратегій {у. ) .

І = 4

Очевидно, що і тут процес такого пошуку може тривати до тих пір, поки не залишиться дві чисті стратегії у^ і та ум- , серед яких другому гравцю

необхідно вибрати одну. Тоді він розігрує випадкову величину , де

Ь-2 _

імовірність її розігрування дорівнює 1 - ^ д м . Якщо

і=і 1

іь-і < д^і-к- • <31»

1 - £дл

і=і

то другий гравець обирає чисту стратегію у мьх ; інакше, якщо

іь-і * • <31)

1 - ,=-»

то він має обирати чисту стратегію у м .

Таким чином, перший гравець розігрує випадкову величину &к завжди перед випадковою величиною ©і+1 V к = 1, К - 2, причому якщо значення

9 < Я-ТГ- <32)

1 -£ Рік

к=1

випадкової величини ©, то перший гравець обирає чисту стратегію хг

V и = 1, К -1; інакше, якщо

9. * Р.-тт- • <33)

1 -^Ь

к=1

то перший гравець має розігрувати випадкову величину ©и+1 V u = 1, K - 2 та має обирати чисту стратегію х,. при и = К -1. Другий гравець розігрує випадкову величину 2, завжди перед випадковою величиною Е/+1

V І = 1, Ь - 2, причому якщо значення

1

^ V-1

1 -1?"

(34)

випадкової величини 2, то другий гравець обирає чисту стратегію у,-

V V = 1, Ь -1; інакше, якщо

1

^ * дМу V-1

1 -£дмі

(35)

і =1

то другий гравець має розігрувати випадкову величину

V V = 1, Ь - 2 та

має обирати чисту стратегію у при V = Ь -1. При цьому кожен з гравців

обирає чисті стратегії зі спектрів (16) і (18) з відповідними імовірностями (17) і (19), реалізуючи таким способом оптимальні змішані стратегії (12) і (13). Зокрема, у грі з матрицею

Р

31 44 52 28

(36)

яка відповідає умовам (1) - (5), реалізація оптимальної змішаної стратегії (6) першого гравця

X =

24 13

37 37

(37)

та оптимальної змішаної стратегії (7) другого гравця

У =

16 21

37 37

(38)

V

стратегію х ; інакше він обирає чисту стратегію х2. За умови ^ < 16 другий

гравець обирає свою першу чисту стратегію у, а в протилежному випадку він використовує чисту стратегію у. На цій основі, як показують розрахунки, уже за 10 партій гри відносна відстань усередненого виграшу першого гравця від значення цієї гри

V* =

" 16"

"24 13" 1 4 4 3 1 37 1420

_37 37_ 52 28 21 37

_ 37 _

(39)

складає декілька сотих, при сотнях і тисячах партій гри відносна різниця між реальним середнім виграшем першого гравця та математичним сподіванням

(11) його виграшу зменшується до тисячних, а з подальшим зростанням кількості партій гри усереднений виграш першого гравця прямує до числа (39). Таким чином і відбувається практична реалізація принципу оптимальності у грі з матрицею (36) та розв’язком (37) - (39), де, у загальному випадку, замість знаходження чисел (9) і (10) необхідно проводити обчислення та перевірку умов (20) - (35).

Висновки та перспектива подальшого дослідження. У матричній М х N -грі з пустою множиною сідлових точок у чистих стратегіях кожен гравець, послідовно розігруючи рівномірно розподілені на напівсегменті [0; і)

випадкові величини, кількість яких не перевищує Н - і, де Н дорівнює потужності спектра оптимальної змішаної стратегії гравця, реалізує таким чином цю стратегію. Цей метод реалізації принципу оптимальності у матричних іграх без сідлової точки можна застосовувати, що очевидно, тільки при невідомій наперед кількості партій гри, тобто там, де невідомо, коли гра зупиниться. Питання про те, як діяти гравцям у реалізації їх оптимальних змішаних стратегій з відомим наперед числом партій гри, розробленим у представленій роботі методом з обчисленнями (20) — (35) вирішується лише частково. Це пов’язано з тим, що розігрування відповідних випадкових

величин {©^ }^ 1 та {2, 1 забезпечує реалізацію лише векторів імовірностей

(12) і (13) за умов (14) та (15), а ймовірність у даному сенсі математично і практично реалізується при нескінченній кількості випробувань, тобто при нескінченній кількості партій гри. А при відомій кількості партій гри гравець намагатиметься розробити власну тактику перебору чистих стратегій [8] для

забезпечення свого якомога більшого середнього виграшу. Тому предметом подальшого дослідження, що пов’язане з представленою роботою, є розробка методу реалізації оптимальних змішаних стратегій для довільної матричної M x N -гри з фіксованим і наперед відомим числом партій гри.

Список літератури: 1. ВоробьёвН. Н. Теория игр для экономистов-кибернетиков. - М.: Наука, Гл. ред. физ.-мат. лит., 1985. - 272 с. 2. Оуэн Г. Теория игр. - М.: Едиториал УРСС, 2004. - 216 с. З. Романюк В. В. Про порядок перебору чистих стратегій в одній матричній грі без сідлової точки для реалізації оптимальних змішаних стратегій / Материалы II Международной научнопрактической конференции "Ключевые аспекты научной деятельности - 2007". - Том 7. -Естественные пауки. - Днепропетровск: Наука и образование, 2007. - С. 12 - 14. 4. Romanuke V. V. The principle of optimality problem in the elementary matrix game with the finite number of plays // Вісник Хмельницького національного університету. Технічні пауки. - 2007. - № 1. - С. 226 -230. 5. РоманюкВ. В. Моделювання реалізації оптимальних змішаних стратегій в антагоністичній грі з двома чистими стратегіями в кожного з гравців // Наукові вісті НТУУ "КПІ". - 2007. - N° 3. -С. 74 - 77. 6. Романюк В. В. Формулювання одного з принципів оптимальності в елементарній антагоністичній грі без сідлової точки при неповній реалізації оптимальних змішаних стратегій // Вісник Хмельницького національного університету. Технічні науки. - 2007. - Х 2. - Т. 2. -С. 218 - 222. 7. Мушик Э., Мюллер П. Методы принятия технических решений: - М.: Мир, 1990. -208 с. 8. Романюк В. В. Тактика перебору чистих стратегій як теоретичне підґрунтя для дослідження ефективності різних способів реалізації оптимальних змішаних стратегій // Наукові вісті НТУУ "КПІ". - 2008. - № 3. - С. 61 - 68.

УДК 519.832.3

Метод реализации принципа оптимальности в матричных играх без седловой точки / Романюк В. В. // Вестпик НТУ "ХПИ". Тематический выпуск: Информатика и моделирование. -Харьков: НТУ "ХПИ". - 2008. - № 49. - С. 146 - 154.

Разработан метод реализации оптимальных смешанных стратегий в произвольной матричной игре с неизвестным количеством партий игры. Основой разработанного метода является разыгрывание игроком равномерно распределённых на единичном полусегменте случайных величин, причём вероятности их разыгрывания привязаны к вероятностям избирания чистых стратегий из спектра оптимальной смешанной стратегии. Библиогр.: 8 пазв.

Ключевые слова: матричная игра, оптимальная смешанная стратегия, спектр стратегии, вероятность.

UDC 519.832.3

Method of realizing the optimality principle in matrix games without the saddle point / Romanuke V. V. // Herald of the National Technical University "KhPI". Subject issue: Information Science and Modelling. - Kharkiv: NTU "KhPI". - 2008. - № 49. - P. 146 - 154.

There has been developed the method of realizing the optimal mixed strategies in an undefined matrix game with unknown quantity of the game plays. The ground of the developed method is the player raffling the uniformly distributed on the unit semisegment variates, when the probabilities of their raffle are linked to the probabilities of the pure strategies selection from the optimal mixed strategy spectrum. Refs: 8 titles.

Key words: matrix game, optimal mixed strategy, strategy spectrum, probability.

Поступила в редакцию 10.10.2008

i Надоели баннеры? Вы всегда можете отключить рекламу.