Научная статья на тему 'Дискретно-выпуклая матричная игра'

Дискретно-выпуклая матричная игра Текст научной статьи по специальности «Математика»

CC BY
133
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ДИСКРЕТНАЯ ИГРА / ВЫПУКЛАЯ ИГРА / ОПТИМАЛЬНЫЕ СТРАТЕГИИ ИГРОКОВ / ДИСКРЕТНО-ВЫПУКЛАЯ ИГРА / MATRIX GAMES / CONVEX GAMES / STRATEGY / VALUE

Аннотация научной статьи по математике, автор научной работы — Ушакова Е. В.

Вводится понятие дискретно-выпуклой матричной игры. Описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Этот процесс позволяет использовать Основную теорему теории непрерывных выпуклых игр для нахождения оптимальных стратегий исходной дискретно-выпуклой матричной игры. Доказывается совпадение цены дискретно-выпуклой матричной игры и цены соответствующей непрерывной выпуклой игры.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Discrete convex matrix games

A notion of discrete convex matrix game is introduced. A process of transformation of its To a continuous convex game is described. It is proved that the values of corresponding games are equal. The optimal strategies are obtained.

Текст научной работы на тему «Дискретно-выпуклая матричная игра»

МАТЕМАТИКА

Вестн. Ом. ун-та. 2010. № 4. С. 42-44.

УДК 510 Е.В. Ушакова

Омский государственный университет им. Ф. М. Достоевского

ДИСКРЕТНО-ВЫПУКЛАЯ МАТРИЧНАЯ ИГРА

Вводится понятие дискретно-выпуклой матричной игры. Описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Этот процесс позволяет использовать Основную теорему теории непрерывных выпуклых игр для нахождения оптимальных стратегий исходной дискретно-выпуклой матричной игры. Доказывается совпадение цены дискретновыпуклой матричной игры и цены соответствующей непрерывной выпуклой игры.

Ключевые слова: дискретная игра, выпуклая игра, оптимальные стратегии игроков, дискретно-выпуклая игра.

Введение

В данной работе даётся понятие дискретно-выпуклой матричной игры. Это понятие является естественным дискретным аналогом непрерывной выпуклой игры на квадрате. Более того, устанавливается связь между дискретно-выпуклой матричной игрой и непрерывными выпуклыми играми на квадрате. А именно, описывается процесс трансформации произвольной дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Основная теорема о непрерывных выпуклых играх на квадрате находит своё отражение для дискретно-выпуклых матричных игр.

В работе устанавливается совпадение цен дискретно-выпуклой матричной игры и соответствующей непрерывной выпуклой игры на квадрате.

Известный способ нахождения оптимальных стратегий игроков в непрерывной выпуклой игре на квадрате позволяет дать способ определения оптимальных стратегий в исходной дискретно-выпуклой матричной игре. В качестве следствия доказывается, что произвольная дискретно-выпуклая матричная игра эквивалентна дискретновыпуклой матричной игре с матрицей размера щх 2. Это позволяет находить её решение графическим методом.

В разделе 1 даются необходимые определения, описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Раздел 2 содержит Основную теорему теории дискретно-выпуклых матричных игр и её доказательство.

1. Определение дискретно-выпуклой игры и трансформация её до непрерывной выпуклой игры на квадрате

Определение 1. Набор вещественных чисел ах,а2,...,ак называется дискретно-выпуклым, если кусочно-линейная функция / , для ко-

© Е.В. Ушакова, 2010

Дискретно-выпуклая матричная игра

43

которой вершинами звеньев служат точки графика: / (хг) = ai для i = 1,..., к при

некотором выборе точек

О = хг <х2 <... < хк =1 является выпуклой.

Легко видеть, что определение не зависит от выбора точек

О = х1 <х2 < ... <хк = 1. Аналитически данное свойство означает, что для любого О < Л < 1, для любых 1 < / < / < 11 выполнены неравенства:

/(О - Л)х, +Лх.)<(\- л)/(х1) + Л/'{х.).

Определение 2. Матричная игра с матрицей платежей (выигрышей первого игрока) А = (а у ), / = 1,..., да, 7 = 1,..., п

называется дискретно-выпуклой, если любая её строка ап,а12,...,аы (/' = 1,...,тп)

является дискретно-выпуклой.

Опишем процесс трансформации произвольной дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Для этого мы преобразуем матрицу А = (с/ ,) в единичный

квадрат К = {(х, у): 0 < х < 1,0 < у < 1}. Определим на К функцию выигрышей первого игрока н( X, у) таким образом, что н( х,у) будет при любом фиксированном у выпуклой по х, то есть Н(х,у) будет являться функцией выигрышей непрерывной выпуклой игры на квадрате. При этом удобно считать, что строки матрицы А = (а ) пронумерованы снизу вверх. Нижнее ребро квадрата соответствует первой строке матрицы А = {а:, ),

верхнее ребро - последней строке. Рёбра, соответствующие остальным строкам, располагаются по квадрату с одинаковым

интервалом 8 —--------. На каждом та-

(,т -1)

ком ребре определяем функцию Н(х,у) (у фиксировано) как кусочно-линейную функцию, отвечающую строке матрицы А = (аг]):

Н{х1,8-^-\)) = а]1, Н{хп^\]-1)) = а]п, 7 = 1,...,т.

Если х - х,

*,-+і - *,■

X, < X < X,

определяем

то,

полагая

Н(х, 5-(/-1)) = (1-.

7 = 1

Таким образом, мы задаём т кусочнолинейных выпуклых по условию функций Н(хг,8 определённых на интер-

вале 0 < х < 1, 7 = 1 ,-.-,т ■

Лемма 1. Пусть заданы функции /Х{х), /2(х) в интервале 0 < х < 1, которые непрерывны и выпуклы по X. Тогда функция #(х, //) = ///, (х) + о - //)/2 (х) непрерывна и выпукла по X на квадрате К = {(х, >>) : 0 < х < 1,0 < >> < 1}.

Доказательство. Непрерывность функции g{x,ju) очевидна. Докажем её выпуклость. По условию, для любых

7 1 1 х-а

0 < а < х < о <\ при Л =------ выполне-

Ъ- а

ны неравенства:

1х(х)<(\. - Х)}Аа

)+л/М

Л (х) ^ - 'ОЛ (а) + Л?'-1 (ь) •

Умножим первое из неравенств на //, второе - на (1 — //), считая, что 0 < /и < 1, и сложим полученные выражения. Получим требуемое неравенство:

g(x,^i) < //(1 - Х)/х (а) + /Л/х (Ь) +

+ (1-ц)(\-Л)/2(а) + (\-ц)Л/2(Ъ) =

= (1-1)[/г/1(а) + (1-/г)/2(а)] + +Я[///(6) + (1-//)/2(6)] =

= (1- /1)^(а,/г) + Лg{b,/uY

Лемма доказана.

Считая, что 8(/ -1) < /и < 8] , мы строим по Лемме 1 для каждой пары функций/ (х) = Н(х,3(] -1)) , /2 (х) =Н (х,ду),

7 = 1,..., т — 1, выпуклые по х функции и значения Н (х, /и), объединяя области значений которых, получаем выпуклую по х функцию Н (х, //) на

К = {(х, >>) : 0 < х < 1,0 < >> < 1}.

Далее мы сопоставляем исходной дискретно-выпуклой матричной игре с

44______________________________________________________________________________Е.В. Ушакова

матрицей А = (с/(, ] непрерывную выпуклую игру на квадрате

К = {(х, >>) : 0 < х < 1,0 < >> < 1} с платёжной функцией Н{х,у).

Непрерывные выпуклые игры на квадрате допускают эффективное нахождение оптимальных стратегий игроков (см. например [1], [2]).

Для нахождения оптимальной стратегии первого игрока вычисляется функция

шахН (х,у) = к(х), а затем вычисляется

гшп И(х) = С , что является ценой игры.

Существует оптимальная чистая стратегия первого игрока х ,, для которой

тахН(х (,у) = С . Оптимальной стратеги-

у

ей второго игрока служит вероятностная смесь двух чистых стратегий хорП и X п , которые берутся с вероятностями р и 1 — р соответственно.

2. Основная теорема теории дискретно-выпуклых матричных игр.

Теорема (Основная теорема теории дискретно-выпуклых игр). Цена дискретно-выпуклой матричной игры с матрицей А = (а ] равна цене соответствующей непрерывной выпуклой игры на квадрате К = {(х,^) : 0 < х < 1,0 < у < 1} с платёжной функцией Н(х,у), построенной в разделе 1. Первый игрок имеет либо оптимальную чистую стратегию х ,, либо

смесь двух чистых стратегий хорП и X п , которые берутся с вероятностями р и 1 — р соответственно. В частности, дискретно-выпуклая матричная игра эквивалентна игре с подматрицей матрицы А = (ру) размера ш><2. Оптимальная смешанная стратегия первого игрока, сво-

дящаяся к вычислению р и 1 — р , может быть найдена графическим методом.

Доказательство. Очевидно, что максимальное и минимальное значения произвольной кусочно-линейной функции на конечном замкнутом интервале достигаются в одной из вершин звеньев. При любом фиксированном у функция

Н(х, у) по построению также кусочнолинейна, поэтому её экстремальные точки соответствуют тем рёбрам К, которые отвечают строкам матрицы А = (а ). Иначе говоря,

h(x) = шах Я(х, у) = max Я(х, б>(/ - 1)).

У J

7 = 1,..., т.

Функция h{x) выпукла и кусочнолинейна. Её минимум достигается либо в точке xopt = Х!., и тогда первый игрок имеет оптимальную чистую стратегию xopt, либо в точке пересечения двух

функций вида Н (x,S{j — 1)),

Н(х,5(1 -1)), и тогда оптимальной для

первого игрока будет смешанная стратегия, отвечающая выбору стратегий / и / с некоторыми вероятностями р и 1 — р соответственно. И в том и в другом случае мы видим, что цена игры непрерывной выпуклой игры совпадает с ценой игры исходной дискретно-выпуклой игры. Теорема доказана.

ЛИТЕРАТУРА

[1] Печёрский С. П., Беляева А. А. Теория игр для экономистов. Вводный курс. Редакция европейского университета в Санкт-Петербурге, 2001. 236 с.

[2] Воробьёв Н. Н. Теория игр для экономистов-кибернетиков. Наука: Гл. ред. физ.-мат. литры. М., 1985. 272 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.