Научная статья на тему 'Элементы теории матричных игр в курсе математики'

Элементы теории матричных игр в курсе математики Текст научной статьи по специальности «Математика»

CC BY
146
22
Читать
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
Предварительный просмотр
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Элементы теории матричных игр в курсе математики»

В заключение приведем одну задачу на доказательство, которая требует от учащихся достаточно высокой логической культуры.

Задача 8. Докажите, что треугольник является равнобедренным в том и только в том случае, когда равны биссектрисы двух внутренних углов.

Если в треугольнике ABC (рис.6) АВ=ВС, то углы А и С равны и равны треугольники ВАЕ

и BCD, так как ¿B -общий и ZBAE=-=ZBCD, следовательно, AE=CD. Докажем справедливость обратного утверждения. Пусть биссектрисы АЕ и CD углов А и С треугольника ABC равны. Докажем, что

/А-/.С. =>

- ABACsiriA- - ABAEsin — + - AEACsin — 2 2 2 2 2

=> 2ABACcos — ~(AB+AC)AE =>

2AB-AC cos-_2_

AB + AC

Разделив числитель и знаменатель дроби на произведение ABAC и обозначив

АВ=с, АС=Ь, ВС=а, получим

о А 2-cos -

АЕ - ——--, аналогично, биссектриса

+ _

Ъ с

С

2-cos—

CD - ——. Если допустить, что ZA*Z.C, Ъ а

А С

например, Z.A<Z.C, то cos — >cos — и а<с =>

— >— => AE>CD, получили противоречие. а с

Приведенные в статье задачи предлагались на вступительных экзаменах в различных вузах России, в том числе и в Ярославском госуниверситете.

Литература

1. Пойа Д. Как решать задачу. М.: Учпедгиз,

1961.207 с.

2. Смирнов Е.И. Технология наглядно-модельного обучения математике. Ярославль, 1997. 323с.

3. Чаплыгин В.Ф., Чаплыгина Н.Б. Задачи вступительных экзаменов по математике. Ярославль, 1991. 140с.

4. Чаплыгин В.Ф. Чаплыгина Н.Б. Задачи вступительных экзаменов по алгебре и геометрии. Ярославль, 1999. 112с.

5. Сборник задач по математике для поступающих в вузы / Под ред. А. И. Прилепко. М.: Высшая школа, 1989. 271с.

6. Зафиевский A.B.. Вступительные экзамены по математике в 1998 году. Ярославль, 1999. 36с.

7. Лидский В.Б., Овсянников Л.В., Тулайков А.Н., Шабунин М.Н. Задачи по элементарной математике. М.: Физматгиз, 1960. 463с.

В. В. Секацкий, Г. И. Худякова

Элементы теории матричных игр в курсе математики

Теория игр - это раздел математики, изучающий математические модели принятия оптимальных решений в условиях неопределенности.

Истоки ее можно найти еще в работах Б.Паскаля. В 1921 году Э.Борель изучал матричные игры. Начало современной теории игр относят к 1928 году, когда была опубликована работа Дж. Неймана «К теории стратегических игр». Помимо разнообразных связей внутри математики, теория игр получила многообразные приложения в других отраслях знаний, особенно в военном деле и капиталистической экономике. При переходе к рынку в нашей стране элементы теории игр стали в обязательном порядке входить в учебные планы подготовки специалистов финансово-экономического профиля.

Несмотря на обширную научную литературу по теории игр, доступные учебные пособия для студентов (курсантов) экономических вузов явно редки.

В данной работе авторы пытаются в какой-то мере восполнить этот пробел, главным образом рассчитывая на внимание преподавателей и курсантов ЯВВФЭУ и студентов естественно-научных специальностей педвузов.

Для простоты мы не будем использовать

В

Рис.8

Smbc~S&bae+Saeac

понятия супремум (Sup) и инфимум (Inf) функции, заменяя их соответственно максимумом (max) и минимумом (min), тем более, что в рассматриваемых нами конкретных моделях функции будут заданы либо на конечном множестве, либо определены и непрерывны на ограниченных замкнутых множествах. Так что максимумы и минимумы существуют.

§1. Модель антагонистической игры

Конфликтные ситуации возникают не только в быту, но и в производственных, экономических, военных отношениях. Участники конфликта называются сторонами или игроками. Мы рассмотрим случай двух игроков. У каждого игрока имеется набор допустимых стратегий, то есть планов поведения.

Обозначим стратегию, выбранную первым игроком, символом х, а множество всех его возможных стратегий X. Для второго игрока выбранную стратегию обозначим у, а множество стратегий У. Пару (х, у) называют ситуацией. Степень удовлетворенности игрока этой ситуацией выражается функцией выигрыша: для первого игрока Hi(x, у), а для второго -//¿/Ос,рассмотрим простейший случай, когда Н)(х, у)+Н2(х, у)=0, так называемую антагонистическую игру с нулевой суммой. В таком случае выигрыш первого игрока можно обозначить Н(х, у), а второго -Н (х, у), то есть выигрыш одного игрока равен проигрышу другого.

Итак, для задания модели такой игры необходимо и достаточно иметь множество X допустимых стратегий первого игрока, множество У допустимых стратегий второго игрока и действительную функцию Н(х,у), где (х, у) - любая пара допустимых стратегий.

Что значит решить игру? Это зависит от выбора критерия оценки своей стратегии каждым игроком и степени информированности о поведении противника.

Примем следующую схему поведения и информированности игроков:

Каждому игроку известны множества X, У и функция Н.

Если первый игрок выбрал стратегию х е X и второму это известно, то второй будет стремиться к выбору стратегии у(х), минимизирующей функцию Н(х, у) (свой проигрыш), то есть

vl(x) = minH(x,y) = H(x,y(x)), (1)

yeY

где Vj (х) - минимальный проигрыш второго игрока при выборе первым стратегии х. Этот проигрыш (наиболее благоприятный) для второго игрока обеспечивает ему стратегия

у(х), зависящая от х.

Для первого игрока vj(x) есть гарантированный выигрыш при выборе им стратегии х. Теперь, естественно, он будет стремиться к выбору стратегии х0, при которой Vj(x) будет максимальным:

vo = vi(xo) = max v/xj =

xeX (2)

= max H(x,y(x)) = max min H(x,y)

хеХ дгеХ уеГ

Стратегия x0 называется максиминной, а v0(x) - нижней ценой игры.

Аналогичные рассуждения проводятся для второго игрока. Если он выбрал стратегию у, то первый выберет х(у), чтобы получить максимум Н(х, у):

v2(y) = maxH(x,y) = H(x(y),y) (3)

xsX

v?(y)- это максимально возможный проигрыш второго игрока при выборе им стратегии у. Естественно, он будет искать стратегию у0, доставляющую минимум функции v2(y):

=v2(/) = minv2(j;) =

(4)

= min Н{х(у), у) = min max Щх,у)

ysY уеУ хеХ

Стратегия у0 называется минимаксной, а \>° - верхней ценой игры.

Стратегии х , у* называются оптимальными, если

Н(х,у)<Н{х,у)<Н{х\у)

при Vx е X и Vy е У,

Н{х* ,y*) = v называют ценой игры, а па-РУ (**> У*) ~ седловой точкой.

Решить игру - значит найти ее оптимальные стратегии х*, у* и цену v.

Если оптимальные стратегии существуют, игра называется разрешимой, в противном случае - неразрешимой.

Соотношение (5) показывает, что уклоняться от оптимальных стратегий невыгодно каждому игроку: у первого может уменьшиться выигрыш, а у второго - увеличиться проигрыш.

Теперь естественно поставить вопрос о разрешимости игры в указанной схеме.

§ 2. Условия разрешимости игры

Теорема 1. Нижняя цена игры не превосходит верхнюю, то есть v0 = v°.

Доказательство. Из (1) следует

v, = min Н(х,у)<Н(х,у) npu\/y е Y

уеГ

(б)

Неравенство сохраняется, если взять от каждой части максимум по хеХ. Учтем также (2)и(3).

v0 = v, (х0) = max v, (х) < шах Н(х, у) =

хеХ хеХ

= v2 (у) при VyeY

Положим в последнем у=уО и учтем (4) v0<v2(/)=v°.

v,(x*)<v0 = v,(x0).

Из (11), (12), (13) следует

v°=v2(/)<v2(/)<v<v,(x*)<

^V,(JC0) = V0

(13)

Доказательство закончено. Теорема 2. Цена игры V (если она существует) удовлетворяет неравенству;

Vn < V < V

Доказательство. По определению #(х,/)<у = я(х*,/)<я(х>) (Vx е X,Vye У) => v, (х) = min Н(х,у)<

(14)

С учетом теоремы 1 из последнего соотношения получаем

у0 = =У2(/) =

= у2(у*)=у1(х0) = у,(х*) Доказательство закончено. Замечание 1. В равенстве (14) (х0, у°) и (х , у ) образуют пары оптимальных стратегий, <я(х, у')<у<н(х',у)<т21хн(х,у) = у2(у) но эти пары не обязательно совпадают.

Замечание 2. Из доказательства теоремы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

уеГ

Подставим х=хО, у=уО:

^о =^(х0)<у<у2(у°)=у°. Теорема 3. Для того, чтобы игра была разреи-.мой, необходимо и достаточно, чтобы у0=У0.

Доказательство достаточности. Обозначим у=у0=у0.

Поставим в (6) х=х0

у = ух(х0)<Н(х0,у),Ууе¥ (7)

Взяв в последнем у=у0, получим у<я(х0/) (8)

Аналогично из (3) следует Н{х,у)^2(у)(ЧхеХУуе7) Положив в последнем сначала у=у0, а затем х=х0, получим

Н(х,у°)<у2(у°)=у, (9)

Я(х0,/)<у. (10)

Из(7)-(10)следует н(х,у0)<у = н(хй,у°)<н(х0,у), то есть игра разрешима и (х\/)=(х0,/)

Доказательство необходимости. По условию оптимальное решение существует:

3 следует необходимое и достаточное условие оптимальности максиминной и минимаксной стратегий. Это условие заключается в том, чтобы выполнялось равенство v0=v0.

§ 3. Модель матричной игры в чистых стратегиях

Пусть множества стратегий обоих игроков конечны: X состоит из т стратегий, а У ш п. Эти стратегии называются чистыми. Обозначим их порядковыми номерами: Х~{\, 2, .... г, ..., т), У={1, 2, ..., и"}.

Ситуация задается парой (г, у), а функция выигрыша Я описывается матрицей А с эле-

ментами а,

■H(iJ):

А=(аи), 2=1, 2, ..., т; j= 1, 2, ..., п.

v,(/) = min а,у • • ••" минимальный элемент в j

i -и строке матрицы.

V0 = maxViO')

максимальный элемент

среди минимальных в каждой строке.

Номер ¿о строки, на которой достигается этот максимум, будет максиминной стратегией.

Аналогично v2(y) = гпах<з,; - максималь-i

ный элемент в j-м столбце, а v°= min v2 О) -

я(х,/)< V = я(х\/)< Н(х\у) минимальный среди них. Соответствующий

Ых е ХУу £ У)=> уХ*)= тахЯ (*,/)= столбец^ определяет минимаксную стратегию.

По теореме 3 игра в чистых стратегиях = н(х(у"),у)<у< тт я(х*,у) = разрешима тогда и только тогда, когда

= я(х*, у(х')) = V, (х*) => у2 (у'') < V < V, (х*) Так как ° =у2(у0) = гшпу2(у),

vn = V = V = а, , .

ü 't>Jo

(г0, jo) - седловая точка, ain - элемент

v то

v°=v2(y°)<v2(y'). Аналогично показывается, что

(12)

ЮЛ)

матрицы, минимальный в своей строке и максимальный в своем столбце. Элемент с таким свойством называется седловым элементом матрицы. Так что для данной модели теорему 3 можно перефразировать так:

Теорема 3 . Для того, чтобы матричная игра была разрешима в чистых стратегиях, необходимо и достаточно, чтобы в матрице А существовал седловой элемент.

Пример. г% 7 1 л

А =

8 6 4 4 0 2

v0=max{l, 4, 0} = 4, i0= 2;

v° =min{8, 7, 4} = 4, ¿,=3;

v = a23 =4.

Контрпример.

'l 7 5 2 3 4 .7 1 6

> ко

v0 =max{l,2,l} = 2, i0= 2;

v° = min {7,7,6} = 6, ;0 = 3;

Стратегии г0, jo нельзя считать оптимальными, так как первый игрок может рассчитывать на выигрыш больший, чем v0, а второй на проигрыш меньший, чем v°.

Выбор конкретных фиксированных чистых стратегий не удовлетворит игроков. Действительно, если первый зафиксирует стратегию i0 - 2, то второй откажется от j0 — 3 и выберет j = 1. Такое же поведение будет характерно и для другого игрока. Следовательно, чистые стратегии будут избираться неким случайным образом.

§4. Матричные игры в смешанных стратегиях

Расширим понятие стратегии, данное в предыдущей модели.

Чистые стратегии 1, 2, ..., т первого игрока будем рассматривать как значения некоторой случайной величины, принимаемые с вероятностями соответственно х]г х2, ..., хт, где xi > 0, хх + х2 +... + хт = 1.

Вероятностный вектор х = (xh х2, ..., хт) будем называть смешанной стратегией первого игрока. Таким образом, выбор смешанной стратегии при осуществлении игры означает, что реализоваться может любая чистая стратегия, но с заданной вероятностью. Выбор другой смешанной стратегии означает лишь, что распределение вероятностей будет другим. Чистую стратегию i можно рассматривать как частный случай смешанной, для которой x, = 1 и

хк= 0 при к ^ г.

Множество всех смешанных стратегий первого игрока обозначим X, то есть

X ~ {Х = С*1) Х2 >• • ■' Хт )

т

Х,.>0, £*, =1}

г= 1

Аналогично для второго игрока смешанная стратегия - это п- мерный вероятностный вектор у=(у/, у2, ..., уп), а множество всех смешанных стратегий У:

У = {У = (У1, У2>--;У„) |

Пара (х, у) образует игровую ситуацию, при которой пара (г, у) чистых стратегий может реализоваться с вероятностью = хсуГ

Такую же вероятность, следовательно, будет иметь и значение у выигрыша. «Средним значением» выигрыша будет математическое ожидание значений а^ , то есть

п т

м /=1

Функцию Н(х, у) примем за функцию выигрыша первого игрока.

Модель построена. Для решения игры надо найти оптимальные стратегии у' и цену игры у=Н(х*,у*).

Примем пока без доказательства

Теорему Неймана. Всякая матричная игра имеет решение в смешанных стратегиях.

Как и прежде, через А обозначим матрицу

/

А =

ап ап... а,

ат, ат1 ... ат„

\ т 1 trt 2. т п j

\ач\

I = 1, т, У = 1, п. Стратегию х будем представлять вектором (матрицей) строкой, а у- столбцом. Тогда Н(х,у) = (х1,х2,...,хт)х

Ч п

у ml т z т п

\ / \

Ух

У 2 (15)

н х Ч:

§ 5. Упрощение матричной игры

Из двух чистых стратегий 5 и г для перво-

го игрока 5 называется доминирующей, а г доминируемой, если

Стратегия 5 всегда обеспечивает выигрыш не меньший, чем стратегия г, и, следовательно, г-ю стратегию можно исключить вместе с соответствующей строкой матрицы Л.

Из двух стратегий р ид второго игрока р называется доминирующей, q доминируемой, если

геостратегия # не будет использоваться игроком, так как она обеспечивает проигрыш не меньший, чем при стратегии р. Стратегия д исключается вместе с соответствующим столбцом матрицы А.

Теорема 4. Если х, у - оптимальные смешанные стратегии для игры с матрицей А и ценой V, то они также будут оптимальными для игры с матрицей В = а-А + рЕ (а > 0) и ценой V = а-у + Д где Е матрица размером т х п, все элементы хоторой равны 1.

Доказательство. Заметим прежде, что

(11...Г 11...1

х - Е — (л*! , х2,..., хт) ■

= (1,1,... ,1) е К", т к. х, + х, +... + хт = 1. Следовательно,

х-Е-у = 1, \/хеХ,\/уеУ. (16)

По условию

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

#(х,/)<#(/,/) = V < Я(х» или

х ■ А ■ у* < х* ■ А ■ у* = V < х* ■ А ■ у. Умножим последнее на а > О х ■ а ■ А ■ у* < х" • а ■ А ■ у' = а ■ V < х' ■ а ■ А ■ у.

(17)

Из (16) получим

х-р-Е-у =х -р-Е-у =р =

= х'-р-Е-у.

Складываем почленно последнее с (17) х-(а-А + р-Е)-у' < <х'-(а-А + р-Е)-у =

= а • V + Р <х* -(а- А + Р-Е)- у, или

х-В ■ у* < х* • В • у' = = + р <х* В-у,

что и требовалось доказать.

Следствие. При желании элементы матрицы А всегда можно заменить на положительные:

А А + р ■ Е, где Р>\а0|

для всех неположительных элементов аи.

Теорема 5. Если матрица А положительна (все ее элементы положительны), то для любых смешанных стратегий игроков выполняются неравенства

О < 8Х < а^х, + аух2 + ... + ат]хт<32, у -1 ,п; О << апу, +апу2 + ... + а,„у„ <д2, \ =1,т,

где 5,

1 ~ шш <у

'■У

~ тах а<) ■

Доказательство очевидно вытекает из свойств вероятностного вектора.

§6. Решение матричной игры в смешанных стратегиях

Рассмотрим две задачи I и И, считая матрицу А положительной.

Задача I.

Найти вероятностный вектор х = (х;, я-; • хт), удовлетворяющий системе

'аих,+а21х2+... + ат1хт>у, аих\ +а22х2 + ... + ат2хт >у,

(18)

ахпхх+а2пх2+... + атпхт >v.

тах.

и максимизирующии значение у: у

В силу теоремы 5 система (18) совместна

и 5Х < V < <5,.. Обозначая и учитывая,

V

что х, + х2 +....+ хт = 1, задачу I можно привести к виду

"(V, +а21/2 +... + ат/т > 1, аи*\+а2212+... + ат21т>\,

(I)

Е = 11+(2+... + (т = -->тт.

V

Задача II.

Найти вероятностный вектор у = (у/, у?,

.... у„), удовлетворяющий системе

^пУ1+а2Ху2+.. . + aXnxn <v,

апУ1+а22У2+-- < . + a2nxn <v,

ат1У1+ат2У2 + ■■ + атпУп ^

(19)

и минимизирующии значение v : v —> min. Заметим, что v в задачах I и II совершенно самостоятельные величины, хотя и удовлетворяют одинаковым ограничениям Sx <v<S2.

yj

Вводя обозначения s,

аналогич-

ным образом задачу II приведем к виду + ai2s2 +... + а1п£„ < 1,

a2Xsx + a22s2+... + a2nsn< 1,

+ an, + ■ ■ ■ + Om „S„ < 1, /л i 1 m & l m n n '

Sj,S2,.. ,,Sn — 0,

V

(П)

• max.

Задачи I и II - это взаимодвойственные задачи линейного программирования. Причем легко видно, что области допустимых значений у них не пусты, целевые функции ограничены. Следовательно, задачи I и II имеют оптимальные решения I* tm*) и

=(5,*, 52*,..., 5'п*), на которых целевые функции имеют одинаковые значения

V

Решениям I и 5 соответствуют вероятностные векторы х = (х], х2', ..., хт*) и у*= (у/, » *

У2,-,Уп )•

Поставим у* и х в (18) ахххх*+а2хх2* +... + атХхт' >у, ах2х" + а22х2 +...+ ат2хт* >V*,

а.„х, + а,„л:, +... + ат„хт >у .

!К 1 ¿П £ т П т

Умножая первое неравенство на у]9 второе на у2 и т. д., последнее на у„ и почленно складывая, получим

Н(х*,у) = х' -А-у>уух +

+ уу2+... + у'уп=\>' короче

H(x',y)>v.

Аналогичным образом из системы (19) получим

#(*,/)< V*.

Объединим последние неравенства H(x,y')<v<H(x,y). (20)

Поставим в (20) х=х", у=у* H(x',y*)<v* <Н(х*,у') => => v=H(x\y)

Таким образом, (20) принимает вид H(x,y)<H(x',y') = v<H(x,y).

Тем самым не только доказана теорема Неймана о том, что всякая матричная игра имеет решение в смешанных стратегиях, но и указан метод нахождения оптимальных стратегий путем решения взаимнодвойственных задач I и II линейного программирования.

Литература

1. Кузнецов A.B., Сакович В.А., Холод Н.И. Высшая математика. Математическое программирование. Минск: Высшая школа, 1994.

2. Кузнецов Ю.Н., Кузубов В.И., Волощенко А.Б. Математическое программирование. М.: Высшая школа, 1980.

3. Секацкий В.В. Об одном геометрическом аспекте теории линейного программирования // Математические методы в экономике. Межвузовский сборник статей. Ярославль: ЯВВФУ, 1997. С. 42-44.

А. Ю. Мазилова

Сочинение как вступительный экзамен по русскому языку и литературе

Кто не знает, что такое школьное сочинение? Всем когда-то приходилось писать его -легко и с удовольствием или с мучительными попытками угадать, что же ей (учительнице) надо. Сколько недоразумений, споров, разочарований возникает ежегодно во время работы медальных комиссий и вступительных экзаме-

i Надоели баннеры? Вы всегда можете отключить рекламу.