МАТЕМАТИКА
Вестн. Ом. ун-та. 2010. № 4. С. 42-44.
УДК 510 Е.В. Ушакова
Омский государственный университет им. Ф. М. Достоевского
ДИСКРЕТНО-ВЫПУКЛАЯ МАТРИЧНАЯ ИГРА
Вводится понятие дискретно-выпуклой матричной игры. Описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Этот процесс позволяет использовать Основную теорему теории непрерывных выпуклых игр для нахождения оптимальных стратегий исходной дискретно-выпуклой матричной игры. Доказывается совпадение цены дискретновыпуклой матричной игры и цены соответствующей непрерывной выпуклой игры.
Ключевые слова: дискретная игра, выпуклая игра, оптимальные стратегии игроков, дискретно-выпуклая игра.
Введение
В данной работе даётся понятие дискретно-выпуклой матричной игры. Это понятие является естественным дискретным аналогом непрерывной выпуклой игры на квадрате. Более того, устанавливается связь между дискретно-выпуклой матричной игрой и непрерывными выпуклыми играми на квадрате. А именно, описывается процесс трансформации произвольной дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Основная теорема о непрерывных выпуклых играх на квадрате находит своё отражение для дискретно-выпуклых матричных игр.
В работе устанавливается совпадение цен дискретно-выпуклой матричной игры и соответствующей непрерывной выпуклой игры на квадрате.
Известный способ нахождения оптимальных стратегий игроков в непрерывной выпуклой игре на квадрате позволяет дать способ определения оптимальных стратегий в исходной дискретно-выпуклой матричной игре. В качестве следствия доказывается, что произвольная дискретно-выпуклая матричная игра эквивалентна дискретновыпуклой матричной игре с матрицей размера щх 2. Это позволяет находить её решение графическим методом.
В разделе 1 даются необходимые определения, описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Раздел 2 содержит Основную теорему теории дискретно-выпуклых матричных игр и её доказательство.
1. Определение дискретно-выпуклой игры и трансформация её до непрерывной выпуклой игры на квадрате
Определение 1. Набор вещественных чисел ах,а2,...,ак называется дискретно-выпуклым, если кусочно-линейная функция / , для ко-
© Е.В. Ушакова, 2010
Дискретно-выпуклая матричная игра
43
которой вершинами звеньев служат точки графика: / (хг) = ai для i = 1,..., к при
некотором выборе точек
О = хг <х2 <... < хк =1 является выпуклой.
Легко видеть, что определение не зависит от выбора точек
О = х1 <х2 < ... <хк = 1. Аналитически данное свойство означает, что для любого О < Л < 1, для любых 1 < / < / < 11 выполнены неравенства:
/(О - Л)х, +Лх.)<(\- л)/(х1) + Л/'{х.).
Определение 2. Матричная игра с матрицей платежей (выигрышей первого игрока) А = (а у ), / = 1,..., да, 7 = 1,..., п
называется дискретно-выпуклой, если любая её строка ап,а12,...,аы (/' = 1,...,тп)
является дискретно-выпуклой.
Опишем процесс трансформации произвольной дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Для этого мы преобразуем матрицу А = (с/ ,) в единичный
квадрат К = {(х, у): 0 < х < 1,0 < у < 1}. Определим на К функцию выигрышей первого игрока н( X, у) таким образом, что н( х,у) будет при любом фиксированном у выпуклой по х, то есть Н(х,у) будет являться функцией выигрышей непрерывной выпуклой игры на квадрате. При этом удобно считать, что строки матрицы А = (а ) пронумерованы снизу вверх. Нижнее ребро квадрата соответствует первой строке матрицы А = {а:, ),
верхнее ребро - последней строке. Рёбра, соответствующие остальным строкам, располагаются по квадрату с одинаковым
интервалом 8 —--------. На каждом та-
(,т -1)
ком ребре определяем функцию Н(х,у) (у фиксировано) как кусочно-линейную функцию, отвечающую строке матрицы А = (аг]):
Н{х1,8-^-\)) = а]1, Н{хп^\]-1)) = а]п, 7 = 1,...,т.
Если х - х,
*,-+і - *,■
X, < X < X,
определяем
то,
полагая
Н(х, 5-(/-1)) = (1-.
7 = 1
Таким образом, мы задаём т кусочнолинейных выпуклых по условию функций Н(хг,8 определённых на интер-
вале 0 < х < 1, 7 = 1 ,-.-,т ■
Лемма 1. Пусть заданы функции /Х{х), /2(х) в интервале 0 < х < 1, которые непрерывны и выпуклы по X. Тогда функция #(х, //) = ///, (х) + о - //)/2 (х) непрерывна и выпукла по X на квадрате К = {(х, >>) : 0 < х < 1,0 < >> < 1}.
Доказательство. Непрерывность функции g{x,ju) очевидна. Докажем её выпуклость. По условию, для любых
7 1 1 х-а
0 < а < х < о <\ при Л =------ выполне-
Ъ- а
ны неравенства:
1х(х)<(\. - Х)}Аа
)+л/М
Л (х) ^ - 'ОЛ (а) + Л?'-1 (ь) •
Умножим первое из неравенств на //, второе - на (1 — //), считая, что 0 < /и < 1, и сложим полученные выражения. Получим требуемое неравенство:
g(x,^i) < //(1 - Х)/х (а) + /Л/х (Ь) +
+ (1-ц)(\-Л)/2(а) + (\-ц)Л/2(Ъ) =
= (1-1)[/г/1(а) + (1-/г)/2(а)] + +Я[///(6) + (1-//)/2(6)] =
= (1- /1)^(а,/г) + Лg{b,/uY
Лемма доказана.
Считая, что 8(/ -1) < /и < 8] , мы строим по Лемме 1 для каждой пары функций/ (х) = Н(х,3(] -1)) , /2 (х) =Н (х,ду),
7 = 1,..., т — 1, выпуклые по х функции и значения Н (х, /и), объединяя области значений которых, получаем выпуклую по х функцию Н (х, //) на
К = {(х, >>) : 0 < х < 1,0 < >> < 1}.
Далее мы сопоставляем исходной дискретно-выпуклой матричной игре с
44______________________________________________________________________________Е.В. Ушакова
матрицей А = (с/(, ] непрерывную выпуклую игру на квадрате
К = {(х, >>) : 0 < х < 1,0 < >> < 1} с платёжной функцией Н{х,у).
Непрерывные выпуклые игры на квадрате допускают эффективное нахождение оптимальных стратегий игроков (см. например [1], [2]).
Для нахождения оптимальной стратегии первого игрока вычисляется функция
шахН (х,у) = к(х), а затем вычисляется
гшп И(х) = С , что является ценой игры.
Существует оптимальная чистая стратегия первого игрока х ,, для которой
тахН(х (,у) = С . Оптимальной стратеги-
у
ей второго игрока служит вероятностная смесь двух чистых стратегий хорП и X п , которые берутся с вероятностями р и 1 — р соответственно.
2. Основная теорема теории дискретно-выпуклых матричных игр.
Теорема (Основная теорема теории дискретно-выпуклых игр). Цена дискретно-выпуклой матричной игры с матрицей А = (а ] равна цене соответствующей непрерывной выпуклой игры на квадрате К = {(х,^) : 0 < х < 1,0 < у < 1} с платёжной функцией Н(х,у), построенной в разделе 1. Первый игрок имеет либо оптимальную чистую стратегию х ,, либо
смесь двух чистых стратегий хорП и X п , которые берутся с вероятностями р и 1 — р соответственно. В частности, дискретно-выпуклая матричная игра эквивалентна игре с подматрицей матрицы А = (ру) размера ш><2. Оптимальная смешанная стратегия первого игрока, сво-
дящаяся к вычислению р и 1 — р , может быть найдена графическим методом.
Доказательство. Очевидно, что максимальное и минимальное значения произвольной кусочно-линейной функции на конечном замкнутом интервале достигаются в одной из вершин звеньев. При любом фиксированном у функция
Н(х, у) по построению также кусочнолинейна, поэтому её экстремальные точки соответствуют тем рёбрам К, которые отвечают строкам матрицы А = (а ). Иначе говоря,
h(x) = шах Я(х, у) = max Я(х, б>(/ - 1)).
У J
7 = 1,..., т.
Функция h{x) выпукла и кусочнолинейна. Её минимум достигается либо в точке xopt = Х!., и тогда первый игрок имеет оптимальную чистую стратегию xopt, либо в точке пересечения двух
функций вида Н (x,S{j — 1)),
Н(х,5(1 -1)), и тогда оптимальной для
первого игрока будет смешанная стратегия, отвечающая выбору стратегий / и / с некоторыми вероятностями р и 1 — р соответственно. И в том и в другом случае мы видим, что цена игры непрерывной выпуклой игры совпадает с ценой игры исходной дискретно-выпуклой игры. Теорема доказана.
ЛИТЕРАТУРА
[1] Печёрский С. П., Беляева А. А. Теория игр для экономистов. Вводный курс. Редакция европейского университета в Санкт-Петербурге, 2001. 236 с.
[2] Воробьёв Н. Н. Теория игр для экономистов-кибернетиков. Наука: Гл. ред. физ.-мат. литры. М., 1985. 272 с.