МАТЕМАТИКА
Вестн. Ом. ун-та. 2013. № 4. С. 57-59.
УДК 519.83 Е.В. Ушакова
ДИСКРЕТНО-ВЫПУКЛАЯ МАТРИЧНАЯ ИГРА
Вводится понятие дискретно-выпуклой матричной игры. Описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Этот процесс позволяет использовать основную теорему теории непрерывных выпуклых игр для нахождения оптимальных стратегий исходной дискретно-выпуклой матричной игры.
Ключевые слова: выпуклая игра, непрерывная игра на квадрате.
Введение
В теории дискретных игр наилучшим образом исследованы матричные игры. Классические понятия максиминной и минимаксной чистых стратегий, понятие смешанной стратегии и знаменитая теорема Неймана - Нэша позволяют находить оптимальные решения для любой матричной игры при использовании обычных методов линейного программирования. С другой стороны, в теории непрерывных игр получили эффективное решение непрерывные выпуклые игры. Основная теорема теории выпуклых игр позволяет не только говорить о существовании оптимальных стратегий игроков, но также указывает, как находить эти стратегии. Целью данной работы было определить класс таких матричных игр, для которых применимы методы теории непрерывных выпуклых игр. В качестве такого класса предлагается рассмотреть класс дискретно-выпуклых игр. Это новое понятие представляется довольно естественным, поскольку класс дискретно-выпуклых игр достаточно широк. С одной стороны, любая сетка на квадрате непрерывной выпуклой игры дает аппроксимацию этой игры дискретно-выпуклой матричной игрой. Однако более важным является возможность противоположного перехода от дискретно-выпуклой матричной игры к непрерывной выпуклой игре на квадрате. Такой переход описывается в данной работе.
Итак, в данной работе даётся понятие дискретно-выпуклой матричной игры. Это понятие является естественным дискретным аналогом непрерывной выпуклой игры на квадрате. Более того, устанавливается связь между дискретно-выпуклой матричной игрой и соответствующей непрерывной выпуклой игрой на квадрате. В работе устанавливается совпадение цен дискретно-выпуклой матричной игры и соответствующей непрерывной выпуклой игры на квадрате.
Известный способ нахождения оптимальных стратегий игроков в непрерывной выпуклой игре на квадрате позволяет дать способ определения оптимальных стратегий в исходной дискретно-выпуклой матричной игре. В качестве следствия доказывается, что произвольная дискретновыпуклая матричная игра эквивалентна дискретно-выпуклой матричной игре с матрицей размера т х 2. Это позволяет находить её решение графическим методом.
1. Определение дискретно-выпуклой игры и трансформация её до непрерывной выпуклой игры на квадрате
Определение 1. Набор вещественных чисел а1,а2,...,ак называется дискретно-выпуклым, если кусочно-линейная функция /, для которой вершинами звеньев служат точки графика /(х1 ) = а1 для / = 1,к при некотором выборе точек 0 = х1 < х2 <... < хк = 1, является выпуклой.
Легко видеть, что определение не зависит от выбора точек 0 = х1 < х2 <... < хк = 1 . Аналитически данное свойство означает, что для
© Е.В Ушакова, 2013
58
Е.В. Ушакова
любого 0 < 2 < 1, для любых 1 < г < у < п выполнены неравенства
/ (I1 - 2 х + Л*у ) < I1 - 2 / (хг) + Л/ (ху ) .
Определение 2. Матричная игра с матрицей платежей (выигрышей первого игрока) А = (ау), г = 1,...,т , у = 1,...,п называется
дискретно-выпуклой, если любая её строка ап,а !2,...,а п (г = 1,...,т) является дискретновыпуклой.
Опишем процесс трансформации произвольной дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Для этого мы преобразуем матрицу А = (а^.) в единичный квадрат
К = {(х, у ):0 < х < 1,0 < у < 1}. Определим на К функцию выигрышей первого игрока Н (х, у) таким образом, что Н (х, у) будет при любом фиксированном у выпуклой по х, то есть Н (х, у) будет являться функцией
выигрышей непрерывной выпуклой игры на квадрате. При этом удобно считать, что
строки матрицы А = (агу) пронумерованы снизу вверх. Нижнее ребро квадрата соответствует первой строке матрицы А = (агу) ,
верхнее ребро - последней строке. Рёбра, соответствующие остальным строкам, располагаются по квадрату с одинаковым интервалом 3 = -----— . На каждом таком реб-
ре определяем функцию Н (х, у) (у фиксировано) как кусочно-линейную функцию, отвечающую строке матрицы А = (а у ) :
Н (х1,3'(У - 1)) = ау1 , -,
Н (хп ,3-( - 1)) = ауп ,
j = 1,...,m .
Если xi < x < x i+i, то, полагая Я =
x - x,
определяем
Н {х,3( - 1)) = (1 -Л)ау г +Лал+1, У = 1,•••, т .
Таким образом, мы задаём т кусочнолинейных выпуклых по условию функций Н (х1,5-(] -1)) , определённых на интервале 0<х< 1, у = 1,...,т .
Лемма 1. Пусть заданы функции /1 (х) , / (х) на интервале 0 < х < 1, которые непрерывны и выпуклы по х. Тогда функция § (х, л) = ц/х (х) + (1 - л) /2 (х) непрерывна и выпукла по х на квадрате К = {(х,у): 0 < х < 1,0 < у < 1}.
Доказательство. Непрерывность функции g (x,/u) очевидна. Докажем её выпуклость. По условию для любых 0 < a < x < b < 1
0 x - a
при Я =------ выполнены неравенства
b - a
fi (x) < (1 -X)fi (a) + Xfi (b),
/2 (x) < (1 - Я) f (a) + Xf2 (b) .
Умножим первое из неравенств на /л,
второе на (1 - л) , считая, что 0 < л < 1, и
сложим полученные выражения. Получим требуемое неравенство
g(x, л)<л(1 -Я)/ О + Я/у (b) +
+ (1 - л)(1 - Я/2 (a) + (1 - л) Я/2 (b) =
= (1 - Я) [л/1 (a) + (1 - л) /2 (a)] +
+Я[л/ (b) + (1 -л)/2 (b)] =
= (1 -Я) g (a,л) + Яg (ь,л).
Лемма доказана.
Считая, что £( j -1) < л<8j , мы строим по лемме 1 для каждой пары функций
/1 (x) = H(x,S( j -1)) , /2 (x) = H (xSj) ,
j = 1,...,m -1, выпуклые по x функции, и значения H (x, л) , объединяя области значений которых получаем выпуклую по x функцию H (x,^) на
K = {(x,у) : 0 < x < 1,0 < у < 1}.
Далее мы сопоставляем исходной дискретно-выпуклой матричной игре с матрицей A = (a,j) непрерывную выпуклую игру
на квадрате K = {(x,у) :0 < x < 1,0 < у < 1} с
платёжной функцией H (x, у) .
Непрерывные выпуклые игры на квадрате допускают эффективное нахождение оптимальных стратегий игроков (см., например, [1; 2]).
Для нахождения оптимальной стратегии второго игрока вычисляется функция max H (x, у) = h (x) , а затем вычисляется
minh (x) = C , что является ценой игры. Существует оптимальная чистая стратегия первого игрока xopt, для которой
max H ( xopt, у) = C . Оптимальной стратегией
второго игрока служит вероятностная смесь двух чистых стратегий xopt1 и xopt2, которые
берутся с вероятностями p и 1 - p соответственно.
2. Основная теорема теории дискретно-выпуклых матричных игр
Теорема. Цена дискретно-выпуклой матричной игры с матрицей A = (a.) равна цене соответствующей непрерывной выпуклой иг-
x.^, - x.
I+1 I
Дискретно-выпуклая матричная игра
59
ры на квадрате K = {(x, у ):0 < x < 1,0 < у < 1} с
платёжной функцией H (x, у) , построенной в разделе 1. Первый игрок имеет либо оптимальную чистую стратегию xopt, либо смесь
двух чистых стратегий xopt1 и xopt2 , которые берутся с вероятностями p и 1 - p соответственно.
В частности, дискретно-выпуклая матричная игра эквивалентна игре с подматрицей
матрицы A = (a.) размера m*2. Оптимальная смешанная стратегия первого игрока, сводящаяся к вычислению p и 1 - p , может быть найдена графическим методом.
Доказательство. Очевидно, что максимальное и минимальное значения произвольной кусочно-линейной функции на конечном замкнутом интервале достигаются в одной из вершин звеньев. При любом фиксированном у функция H (x, у) по построению также кусочно-линейна, поэтому её экстремальные точки соответствуют тем рёбрам K , которые отвечают строкам матрицы A = (a^ ) . Иначе говоря,
h (x) = max H (x, у) = max H (x,S (j -1)) ,
У = 1,•••,т .
Функция Ъ (х) выпукла и кусочно-линейна. Её минимум достигается либо в точке хр = х 1, и тогда первый игрок имеет оптимальную чистую стратегию хр, либо в точке пересечения двух функций вида Н (х,3(у -1)) , Н (х,3(I -1)) , и тогда оптимальной для первого игрока будет смешанная стратегия, отвечающая выбору стратегий у и I с некоторыми вероятностями р и
1 - р соответственно. И в том, и в другом случае мы видим, что цена игры непрерывной выпуклой игры совпадает с ценой игры исходной дискретно-выпуклой игры.
Теорема доказана.
ЛИТЕРАТУРА
[1] Печёрский С. Л., Беляева А. А. Теория игр для экономистов. Вводный курс : учеб. пособие. СПб. : Изд-во Европейского университета в Санкт-Петербурге, 2001. 236 с.
[2] Воробьёв Н. Н. Теория игр для экономистов-
кибернетиков. М. : Наука, Главная редакция физико-математической литературы, 1985.
272 с.