Научная статья на тему 'Дискретно-выпуклая матричная игра'

Дискретно-выпуклая матричная игра Текст научной статьи по специальности «Математика»

CC BY
93
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ВЫПУКЛАЯ ИГРА / НЕПРЕРЫВНАЯ ИГРА НА КВАДРАТЕ / DISCRETE GAME / CONVEX GAME / MATRIX GAME / OPTIMUM STRATEGY / DISCRETE-CONVEX GAME

Аннотация научной статьи по математике, автор научной работы — Ушакова Е. В.

Вводится понятие дискретно-выпуклой матричной игры. Описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Этот процесс позволяет использовать основную теорему теории непрерывных выпуклых игр для нахождения оптимальных стратегий исходной дискретно-выпуклой матричной игры

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Discrete-convex game

This article is devoted to introduction of concept of discrete-convex games, development of process of expansion discrete-convex game before continuous convex game, definition of optimum strategy of the players. The fundamental result is the theorem of existence of optimum strategy of the players in discrete-convex game, and also of equality of the price of discrete-convex game and price of the appropriate continuous game

Текст научной работы на тему «Дискретно-выпуклая матричная игра»

МАТЕМАТИКА

Вестн. Ом. ун-та. 2013. № 4. С. 57-59.

УДК 519.83 Е.В. Ушакова

ДИСКРЕТНО-ВЫПУКЛАЯ МАТРИЧНАЯ ИГРА

Вводится понятие дискретно-выпуклой матричной игры. Описывается процесс трансформации дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Этот процесс позволяет использовать основную теорему теории непрерывных выпуклых игр для нахождения оптимальных стратегий исходной дискретно-выпуклой матричной игры.

Ключевые слова: выпуклая игра, непрерывная игра на квадрате.

Введение

В теории дискретных игр наилучшим образом исследованы матричные игры. Классические понятия максиминной и минимаксной чистых стратегий, понятие смешанной стратегии и знаменитая теорема Неймана - Нэша позволяют находить оптимальные решения для любой матричной игры при использовании обычных методов линейного программирования. С другой стороны, в теории непрерывных игр получили эффективное решение непрерывные выпуклые игры. Основная теорема теории выпуклых игр позволяет не только говорить о существовании оптимальных стратегий игроков, но также указывает, как находить эти стратегии. Целью данной работы было определить класс таких матричных игр, для которых применимы методы теории непрерывных выпуклых игр. В качестве такого класса предлагается рассмотреть класс дискретно-выпуклых игр. Это новое понятие представляется довольно естественным, поскольку класс дискретно-выпуклых игр достаточно широк. С одной стороны, любая сетка на квадрате непрерывной выпуклой игры дает аппроксимацию этой игры дискретно-выпуклой матричной игрой. Однако более важным является возможность противоположного перехода от дискретно-выпуклой матричной игры к непрерывной выпуклой игре на квадрате. Такой переход описывается в данной работе.

Итак, в данной работе даётся понятие дискретно-выпуклой матричной игры. Это понятие является естественным дискретным аналогом непрерывной выпуклой игры на квадрате. Более того, устанавливается связь между дискретно-выпуклой матричной игрой и соответствующей непрерывной выпуклой игрой на квадрате. В работе устанавливается совпадение цен дискретно-выпуклой матричной игры и соответствующей непрерывной выпуклой игры на квадрате.

Известный способ нахождения оптимальных стратегий игроков в непрерывной выпуклой игре на квадрате позволяет дать способ определения оптимальных стратегий в исходной дискретно-выпуклой матричной игре. В качестве следствия доказывается, что произвольная дискретновыпуклая матричная игра эквивалентна дискретно-выпуклой матричной игре с матрицей размера т х 2. Это позволяет находить её решение графическим методом.

1. Определение дискретно-выпуклой игры и трансформация её до непрерывной выпуклой игры на квадрате

Определение 1. Набор вещественных чисел а1,а2,...,ак называется дискретно-выпуклым, если кусочно-линейная функция /, для которой вершинами звеньев служат точки графика /(х1 ) = а1 для / = 1,к при некотором выборе точек 0 = х1 < х2 <... < хк = 1, является выпуклой.

Легко видеть, что определение не зависит от выбора точек 0 = х1 < х2 <... < хк = 1 . Аналитически данное свойство означает, что для

© Е.В Ушакова, 2013

58

Е.В. Ушакова

любого 0 < 2 < 1, для любых 1 < г < у < п выполнены неравенства

/ (I1 - 2 х + Л*у ) < I1 - 2 / (хг) + Л/ (ху ) .

Определение 2. Матричная игра с матрицей платежей (выигрышей первого игрока) А = (ау), г = 1,...,т , у = 1,...,п называется

дискретно-выпуклой, если любая её строка ап,а !2,...,а п (г = 1,...,т) является дискретновыпуклой.

Опишем процесс трансформации произвольной дискретно-выпуклой матричной игры до непрерывной выпуклой игры на квадрате. Для этого мы преобразуем матрицу А = (а^.) в единичный квадрат

К = {(х, у ):0 < х < 1,0 < у < 1}. Определим на К функцию выигрышей первого игрока Н (х, у) таким образом, что Н (х, у) будет при любом фиксированном у выпуклой по х, то есть Н (х, у) будет являться функцией

выигрышей непрерывной выпуклой игры на квадрате. При этом удобно считать, что

строки матрицы А = (агу) пронумерованы снизу вверх. Нижнее ребро квадрата соответствует первой строке матрицы А = (агу) ,

верхнее ребро - последней строке. Рёбра, соответствующие остальным строкам, располагаются по квадрату с одинаковым интервалом 3 = -----— . На каждом таком реб-

ре определяем функцию Н (х, у) (у фиксировано) как кусочно-линейную функцию, отвечающую строке матрицы А = (а у ) :

Н (х1,3'(У - 1)) = ау1 , -,

Н (хп ,3-( - 1)) = ауп ,

j = 1,...,m .

Если xi < x < x i+i, то, полагая Я =

x - x,

определяем

Н {х,3( - 1)) = (1 -Л)ау г +Лал+1, У = 1,•••, т .

Таким образом, мы задаём т кусочнолинейных выпуклых по условию функций Н (х1,5-(] -1)) , определённых на интервале 0<х< 1, у = 1,...,т .

Лемма 1. Пусть заданы функции /1 (х) , / (х) на интервале 0 < х < 1, которые непрерывны и выпуклы по х. Тогда функция § (х, л) = ц/х (х) + (1 - л) /2 (х) непрерывна и выпукла по х на квадрате К = {(х,у): 0 < х < 1,0 < у < 1}.

Доказательство. Непрерывность функции g (x,/u) очевидна. Докажем её выпуклость. По условию для любых 0 < a < x < b < 1

0 x - a

при Я =------ выполнены неравенства

b - a

fi (x) < (1 -X)fi (a) + Xfi (b),

/2 (x) < (1 - Я) f (a) + Xf2 (b) .

Умножим первое из неравенств на /л,

второе на (1 - л) , считая, что 0 < л < 1, и

сложим полученные выражения. Получим требуемое неравенство

g(x, л)<л(1 -Я)/ О + Я/у (b) +

+ (1 - л)(1 - Я/2 (a) + (1 - л) Я/2 (b) =

= (1 - Я) [л/1 (a) + (1 - л) /2 (a)] +

+Я[л/ (b) + (1 -л)/2 (b)] =

= (1 -Я) g (a,л) + Яg (ь,л).

Лемма доказана.

Считая, что £( j -1) < л<8j , мы строим по лемме 1 для каждой пары функций

/1 (x) = H(x,S( j -1)) , /2 (x) = H (xSj) ,

j = 1,...,m -1, выпуклые по x функции, и значения H (x, л) , объединяя области значений которых получаем выпуклую по x функцию H (x,^) на

K = {(x,у) : 0 < x < 1,0 < у < 1}.

Далее мы сопоставляем исходной дискретно-выпуклой матричной игре с матрицей A = (a,j) непрерывную выпуклую игру

на квадрате K = {(x,у) :0 < x < 1,0 < у < 1} с

платёжной функцией H (x, у) .

Непрерывные выпуклые игры на квадрате допускают эффективное нахождение оптимальных стратегий игроков (см., например, [1; 2]).

Для нахождения оптимальной стратегии второго игрока вычисляется функция max H (x, у) = h (x) , а затем вычисляется

minh (x) = C , что является ценой игры. Существует оптимальная чистая стратегия первого игрока xopt, для которой

max H ( xopt, у) = C . Оптимальной стратегией

второго игрока служит вероятностная смесь двух чистых стратегий xopt1 и xopt2, которые

берутся с вероятностями p и 1 - p соответственно.

2. Основная теорема теории дискретно-выпуклых матричных игр

Теорема. Цена дискретно-выпуклой матричной игры с матрицей A = (a.) равна цене соответствующей непрерывной выпуклой иг-

x.^, - x.

I+1 I

Дискретно-выпуклая матричная игра

59

ры на квадрате K = {(x, у ):0 < x < 1,0 < у < 1} с

платёжной функцией H (x, у) , построенной в разделе 1. Первый игрок имеет либо оптимальную чистую стратегию xopt, либо смесь

двух чистых стратегий xopt1 и xopt2 , которые берутся с вероятностями p и 1 - p соответственно.

В частности, дискретно-выпуклая матричная игра эквивалентна игре с подматрицей

матрицы A = (a.) размера m*2. Оптимальная смешанная стратегия первого игрока, сводящаяся к вычислению p и 1 - p , может быть найдена графическим методом.

Доказательство. Очевидно, что максимальное и минимальное значения произвольной кусочно-линейной функции на конечном замкнутом интервале достигаются в одной из вершин звеньев. При любом фиксированном у функция H (x, у) по построению также кусочно-линейна, поэтому её экстремальные точки соответствуют тем рёбрам K , которые отвечают строкам матрицы A = (a^ ) . Иначе говоря,

h (x) = max H (x, у) = max H (x,S (j -1)) ,

У = 1,•••,т .

Функция Ъ (х) выпукла и кусочно-линейна. Её минимум достигается либо в точке хр = х 1, и тогда первый игрок имеет оптимальную чистую стратегию хр, либо в точке пересечения двух функций вида Н (х,3(у -1)) , Н (х,3(I -1)) , и тогда оптимальной для первого игрока будет смешанная стратегия, отвечающая выбору стратегий у и I с некоторыми вероятностями р и

1 - р соответственно. И в том, и в другом случае мы видим, что цена игры непрерывной выпуклой игры совпадает с ценой игры исходной дискретно-выпуклой игры.

Теорема доказана.

ЛИТЕРАТУРА

[1] Печёрский С. Л., Беляева А. А. Теория игр для экономистов. Вводный курс : учеб. пособие. СПб. : Изд-во Европейского университета в Санкт-Петербурге, 2001. 236 с.

[2] Воробьёв Н. Н. Теория игр для экономистов-

кибернетиков. М. : Наука, Главная редакция физико-математической литературы, 1985.

272 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.