Научная статья на тему 'О функциональных уравнениях одной игры с переменной задержкой информации'

О функциональных уравнениях одной игры с переменной задержкой информации Текст научной статьи по специальности «Математика»

CC BY
85
33
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Слобожанин Н. М.

Получены функциональные уравнения одной антагонистической многошаговой игры с переменной задержкой информации у максимизирующего игрока. Показана разрешимость этих функциональных уравнений. Обоснована применимость метода рекурсивных стратегий поведения, полученного автором ранее, к данной игре. На основании метода рекурсивных стратегий поведения приведено полное решение игры для конкретно заданной функции выигрыша. Виблиогр. 6 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On functional equations of a game with variable information delay

Functional equations of a multistep antagonistic game when the maximizing player has variable information delay are founded. It is shown that the method of recursive behavior strategies, obtained by the author earlier, can be applied to solve the given game.

Текст научной работы на тему «О функциональных уравнениях одной игры с переменной задержкой информации»

УДК 518.9

Вестник СПбГУ. Сер. 10, 2006, вып. 2

Н. М. Слобожанин

О ФУНКЦИОНАЛЬНЫХ УРАВНЕНИЯХ ОДНОЙ ИГРЫ С ПЕРЕМЕННОЙ ЗАДЕРЖКОЙ ИНФОРМАЦИИ

1. Введение. При построении моделей конфликтных процессов основной сложностью является строгое и адекватное действительности определение информационной структуры процесса. Первоначально информационная структура моделировалась с помощью разбиения множества фазовых состояний процесса на информационные множества игроков [1] или с помощью постоянной задержки информации у игроков для антагонистических игр [2, 3]. В монографии [4] впервые для описания информированности игрока вводится информационное вектор-отображение этого игрока. Конкретная компонента значения данного вектор-отображения есть подмножество номеров ходов конкретного игрока, которые (ходы) необходимо и достаточно знать данному игроку для совершения очередного хода. Частным случаем такого моделирования является определение игр с переменными задержками информации у игроков, которые могут принимать отрицательные значения [5, б]. В настоящей работе рассматривается многошаговая антагонистическая игра конечной продолжительности с переменной задержкой информации у максимизирующего игрока.

Моделирование информационной структуры антагонистических игр с независимыми динамиками посредством информационных вектор-отображений обладает тем преимуществом, что позволяет получить функциональные уравнения, связывающие значения подыгр соседних уравнений [4]. Впервые такие уравнения для многошаговых антагонистических игр бесконечной продолжительности, с конечными альтернативными множествами, с непрерывной функцией выигрыша, с постоянной задержкой информации у игроков были получены X. Э. Скарфом, Л. С. Шепли [3]. Для дифференциальных игр преследования конечной продолжительности с постоянной задержкой информации у преследователя функциональные интегральные уравнения были получены Л. А. Петросяном [2]. Для многошаговых антагонистических игр произвольной продолжительности, с альтернативными множествами произвольной мощности, с переменными задержками информации у игроков, функциональные интегральные уравнения были получены автором настоящей работы [5, 6]. В дальнейшем эти уравнения были обобщены для антагонистических игр с произвольными независимыми динамиками, с произвольной информационной структурой [4].

2. Постановка задачи. В настоящей работе на основе изложенного в [4] метода, базирующегося на функциональных уравнениях, приведено решение конечношаговой антагонистической игры с переменной задержкой информации у максимизирующего игрока. Данная игра не может быть решена методом X. Э. Скарфа, Л. С. Шепли [3] по причине его применимости только к играм с постоянной задержкой информации. В работе используются обозначения и номера соответствующих утверждений из монографии [4].

Рассмотрим следующую игру Г'. Пусть игроки Е и Р движутся по плоскости из начала координат (0,0) с единичной скоростью. При этом они могут двигаться только в двух направлениях: строго в северо-западном и строго в северо-восточном. Игрокам разрешается менять направление движения в моменты времени ¿о < < •■• < ¿к <

© Н. М. Слобожанин, 2006

< ..., которые повторяются через единицу времени. В момент времени ¿о игроки находятся в начале координат (0,0). Игра Г' конечна и продолжается Т единиц времени, Т е N. Информированность игроков в процессе игры следующая. В момент времени игроки знают начальное положение друг друга. Игрок Е в момент времени ¿А:, /с ^ 1, знает свой путь на отрезке времени [¿о,£/с] и путь игрока Р на отрезке времени [¿0,^-1.]. Игрок Р в моменты времени ¿2*:+2, к ^ 0, знает путь следования игрока Е на отрезке времени [¿о^г-н-г] (т- е- в момент времени ¿2£+1 игрок Е дискриминирован) и свой путь на отрезках времени [¿о^2-м-1]> [¿о, йг-м-г] соответственно. К концу игры каждый из игроков опишет ломаную, состоящую из Т единичных направленных отрезков. Пусть это (ах,...,ат)', (Ь1,...,Ьт)' соответственно для игроков Р и Е. Считаем, что всякой паре ломаных з' = ((а!, ...,ат)', (£>1, •.., Ьт)') сопоставлен выигрыш Ф'(з') игрока Р у игрока Е. Игрок Е посредством выбора направлений движения стремится минимизировать функцию Ф', игрок Р - максимизировать.

3. Функциональные уравнения для игры в общем случае. Используя результаты глав 3-5 монографии [4], выпишем функциональные уравнения для определения рекурсивных стратегий игроков Е и Р и значения V(Г') игры Г' для функции выигрыша Ф' в общем случае.

Сопоставим выбору игрока северо-западного направления число 0, выбору северовосточного направления - число 1. Тогда игра Г' эквивалентна многошаговой антагонистической игре (МАИ) Г = (Вк)^+1 ,¡1,12, Ф), в которой игроку 1 соответствует игрок Р, игроку 2 - игрок Е игры Г'. При этом А\ = В\ = {1}. А2 = ... = Лг+1 = В2 = ... = Вт+1 = {0,1}; Ь(1) = ¿2(1) - 1, 1г(Т + 1) = 12{Т + 1) = Т + 1, /1(2 • к) = ¿1 (2 ■ к+1) = 2 ■ к + 1 при Т ^ к ^ 1, 12{к) = к- 1 при Т ^ к ^ 2; Ф(о1,..., ат+ъ Ьь ..., Ьт+1) = $'((«2,от+1)', (¿2, Ьт+1)')-где (02,..., ат+1)', (Ь2,-.., Ьт+1)' ~ ломаные, соответствующие наборам направлений (а2,...,ат+1), (Ь2,...,Ьт+1).

В силу определения информационных функций 12 МАИ Г - игра с полной памятью. Тогда, поскольку альтернативные множества игроков конечны, продолжительность игры Г конечна, в игре Г существуют оптимальные стратегии поведения игроков. Отметим также, что всякая рекурсивная стратегия игрока в игре Г является его оптимальной стратегией, так как продолжительность игры конечна (см. утверждение 5.2.3 [4]).

Обозначим нормальную форму МАИ Г - Z2,H).

Прежде чем говорить о рекурсивных стратегиях, следует выяснить вопрос: справедливо ли п-е рекурсивное функциональное уравнение для подыгр игры Г. Да, справедливо. Так как игра Г = (£1 , £2,Я) конечна, то она - стандартна Z2 - множества измеримых стратегий поведения) и всякая ее подыгра Г = (^(ж,/?^ )).

к<п

^2 - стандартна, в силу леммы 5.1.1 [4], и имеет значение, по следст-

к<гп

вию 3 из теоремы 4.3.2 [4]. Тогда, по теореме 4.2.2 [4], п-е рекурсивное функциональное уравнение справедливо и разрешимо для каждого из игроков соответственно.

Рассмотрим п-е рекурсивное уравнение первого игрока. Пусть п - четное натуральное число. Тогда ¿1(71) = /х(п + 1) = п + 1, ¿2(МП)) = п. Таким образом, имеем случай 1а) из [4] для п-го рекурсивного уравнения:

У(п,п + 1,г2(п+1)) = У(п,п+ 1,г1п) = шах У(п + 1,п + 1,Чп), (1

,01(5с1(г1„ ,п))

где ¿2(n+i) = Чп, V(n,n + l,ti„) - значение подыгры (Zx (iln, ß{( )), Z2(î2(n+1)), Я) =

к<тг

(Zi(iin), Z2(i2(n+i)),H), т. е. подыгры, hç зависящей от (n — 1) первых рекурсивных компонент стратегии первого игрока. Отметим, что 5c1(iin,n) = iin. Обозначим /3i(ün,0) = х, что содержательно для подыгры Г' означает вероятность движения игрока Р в северо-западном направлении после прохождения пути (а2,...,ап)' при состоянии информации iin — (о2, •••, «n, b2,..., bn+i). Тогда уравнение (1) перепишется в виде

V(n,n + l,ti„) = тахУ(п + l,n + l,iin) = maxV(x), (2)

X X

здесь V(n +1, n +1,iin) = V(z) -значение подыгры Г = (Zi(iln,ßi(I?)), Z2(i2{n+i)),H), причем компонента стратегии ßi(Ii) такая, что ßiiiimfy = х.

Рассмотрим (п + 1)-е рекурсивное уравнение за первого игрока для подыгры Г. Так как h(n + 1) = п + 1, li(n + 2) = п + 3, l2(h(n + 1)) = п, то имеем случай 26) для рекурсивного уравнения. Поэтому

= в ^^ ,™[пУ2р(<1)у(п + 2,п + 2ЛЧп,д,Ьп+2)), (3)

^l(Sc1(Ur,,n+l)) Ъгг + 2 ^

где

1'2{п+1)

Q = П Ак = An+i,

k>h(h(n+l))

так как l'2(n + 1) = min (n + 1, l2{h{n + 1) + 1)) = n + 1.

Заметим, что Scl(ixn,ri + 1) = {^цп+1)Ацп+1)} = {(»in, 0), (iin, 1)}. Обозначим /?i((^in,0),0) = y, ßi((iin,l),0) = z. Содержательно у для игры Г' означает вероятность движения игрока Р в северо-западном направлении после прохождения пути (а2,..., ап, 0) при состоянии информации z - в северо-западном направ-

лении после прохождения пути (а2,..., ап, 1) при состоянии информации г'Дп+1) = (а2,..., ап, 1, Ъ2, 6n+i). При введенных выше обозначениях уравнение (3) перепишется так:

. I V(n + 2,0,0) ■ х + V(n + 2,1,0) • (1 — х) V(х) - maxmm < ч , ч , ч , (4)

W im I V{n + 1,0,1) • a; + У (n + 2,1,1) • (1 — x)

где V(n + 2,an+i,bn+2) = V(n + 2,n + 2, (¿in,an+1,bn+2)).

Рассмотрим четверку натуральных чисел (n -(- 2, n + 3, n + 2, n 4- 3). Она совместна, поскольку li{n + 2) = n + 3, l2(n + 3) = n + 2 и игра Г с полной памятью. Рассмотрим подыгру (Zi((iin,an+i,bn+2), ßi{I?+1)), Z2(i2(^n+i),an+i,bn+2),H), где ii /M(îin,0),0) — У; ßi((hn, l)j 0) = Значение приведенной игры есть V(n + 2, an+i,bn+2). Запишем для четверки чисел (п 4- 2,п + 3,n + 2,n + 3) основное функциональное уравнение с учетом леммы 3.3.2 [4]

V(n + 2, an+i, bn+2) =

= max min

/3i (Sc1 ((»In , an + 1), n+l)) /32(Sc2((i2{„ + 1), a„ + 1, bn+2), n+2))

y^ p(an+2,bn+3)V(n + 2,n + 3,(iin,an+i,an+2,bn+2,bn+3)) - (5)

On +2 ) Ьп + 3

= min У p(5„+3) Vp(an+2)V(n + 2,n + 3, (•)),

/Ы*2(п+2)) f-^ "

bn-(-3 a„+2

где г2(п+2) = Sc2((i2(n+i),an+i,bn+2),n + 2) = (i2(n+1), ап+1, bn+2). В последнем равенстве max «уходит», поскольку 5c1((iin,an+i),n + 1) = (iin,an+i), двойную сумму можно заменить повторной, в силу следствия 1 из теоремы 3.2.4 [4] и поскольку пара чисел (п + 1,п + 3) совместна. Так как

min Vp(6n+3) ]Г ...

= min

Ьп+з ^ ал+2

то

= min

(6)

V(n + 2,an+1,bn+2) = ' V(n + 2, п + 3, (h„, ап+1,0, bn+2,0)) • ßi((г1п,a„+i), 0) + + V{n + 2, n + 3, (¿in, an+i, 1, bn+2,0)) ■ ßi ((ün, «n+i), 1) V(n + 2, n + 3, (¿in, an+i, 0,6n+2,1)) ■ ßi((iin, an+i), 0) + k + V(n + 2, n + 3, (ùn, an+1,1, bn+2,1)) • ßi{(iln, an+1), 1)

Обозначим У(гг+2,п+3, (iln,an+i,an+2,bn+2,bn+3)) = V(an+1,an+2,bn+2,bn+3). Далее -

Cl = У (0,0,0,0), C2 = У (0,0,0,1), сз = ПО, 1,0,0), c4 = V(0,1,0,1), c6 = F(l, 0,0,0), ce = V(l, 0,0,1), c7 = У (1,1,0,0), c8 = V(l, 1,0,1),

Cg = V(0,0,1,0), C10 = V(0,0,1,1), cn=V(0,1,1,0), ci2 = V( 0,1,1,1), da = V(l,0,1,0), C14 = V(1, 0,1,1),

eis = V(l, 1,1,0), c16 = V(l, 1,1,1).

(7)

Собирая вместе уравнения (2), (4), (6) и учитывая обозначения (7), получим уравнение

V(n,n + 1,пп) = maxmin

x min<

x mm<

ycx + (1 - y)c3 . \ zcs + (1 - z)c7

+ (1 - x) min< yc2 + (1 - y)C4 { zc6 + (1 - Z)C8

yCg + (1 - y)cu . . f ZC13 + (1 - Z)C 15

+ (1 — x) min< УС10 + (1 - T/)Cl2 ZCu + (1 - Z)Ci6

(8)

При этом тройка (x,y,z) является решением уравнения (8) тогда и только тогда, когда (y,z) является решением уравнения (4) при фиксированном х = х.

Решая уравнение (8) для всевозможных состояний информации ¿in, мы найдем тг-ю и (п + 1)-ю рекурсивную компоненты стратегии первого игрока /?*(/{*), в силу

утверждения 5.1.1, и значения V(n,n + l,iin).

Обратим внимание, что V(n + 2, п + 3, (iin, an+i, «n+2, bn+2, bn+3)) — V{n + 2, п + 3,îi(n+2))j где гцп+2) = (г1п,ап+1,ап+2,Ьп+2,Ьп+3), и V(n + 2,n+3,i1(n+2-)) есть значение подыгры (Zi(îi(n+2)), Z2(i2(n+3j),H), где гцп+2) = 4(n+z)- Таким образом, для нахождения значений V(n, n+1, iin) и компонент стратегии /3î(/f ), Pi (^i'+1) достаточно знать значения V(n + 2, п + 3, H(n+2)). Поэтому если бы нам каким-то образом удалось найти

значения У(п,п + 1,г1П), то мы бы нашли все значения У(п — 2 • к, п + 1 — 2 • к,гцп^2-к)) и все рекурсивные компоненты /3*(/{1-2 'г+1), где п - 2 ■ к ^ 2, проводя

рассуждения, аналогичные предыдущим, несколько раз.

Рекурсивная компонента /^(1°) известна: /?*(п0,1) — 1) — 1. Найдем рекурсивную компоненту стратегии РЦ1\) и значение У (Г) игры Г, если известно значение V(2,3,112) для всякого состояния информации ¿12.

/1(1) = 1, /а(2) = 3, ¿2(1) = Ь(2) = 1. То есть имеем случай 26) (замечание 5.3.2 [4]). Поэтому

т/т т/п 1 п ' • /П2,2,((1,1),0))

Г (9)

2, ((1,1), 0))

= тахгаш

У(2,2,((1,1),1))'

где /5х(гц,0) = /?х((1,1),0) = ж, гп = (1,1). Четверки чисел (2,3,2,3) и (1,3,1,3) совместны по МАИ Г, поэтому рассуждениями, аналогичными рассуждениям при получении уравнения (6), можно показать, что

У(2,3,((1,1),0,Ь2,0))-/?1(П1,0) + Т/Л? 9 /тип " > +П2,3,((1,1),1,62,0))-А(П1,1) пт

+ У(2,3,((1,1),1,Ь2,1))-/51(гц,1) Собирая вместе уравнения (9), (10), получим

У (Г) — тахгшп <

тт

тт

У(0,0,0) ■ а; + У (1,0,0) • (1 — х) У(0,0,1) • ж + У(1,0,1) • (1 — х)

У(0,1,0) • ж 4- У(1,1,0) • (1 — ж) У(0,1,1)-ж + У(1,1,1)-(1-ж)

(П)

где У(а2,Ь2,Ъ3) = У(2,3, ((1,1), а2, Ъ2,Ъ3)).

Решая уравнение (11), найдем значение игры У(Г) и рекурсивную компоненту стратегии Р1(1\).

Пусть Т - четное натуральное число. Найдем значение У(Т, Т + 1,г1т)- Так как /Х(Г) = 1г(Т + 1) = Т + 1, 12ЫТ)) = Т + 1, то имеем случай 2а) [4]. Поэтому

Г У(Т + 1,Т+ 1,(г1Т>0)) Но У(Т+1,Г+1,(г1т,от+1)) = ...,ат+1,Ьь ...,Ът+1), гдепт = (ах, ...,ат,Ьи ...,ЬТ+1).

Потому найти значения У(Т,Т + 1, ¿1 т) и рекурсивную компоненту стратегии (ЗЦчт) не составляет труда.

Пусть Т нечетно. Тогда 1\(Т — 1) = 1\{Т) = Т, 12(Т) — Т — 1. То есть мы имеем дело со случаем 1а). Поэтому

У(Т-1,Т,г1(т_1)) =тахУ(Т,Г,«1(т_1)), (13)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где У(Г,Т,11(т_1)) -значение подыгры (Zi^r-i^/Mif 1)), Z2(h(T_i)), Я), при этом

0i(ti(T-i),O) = ж.

Далее рассуждениями, аналогичными рассуждениям при выводе уравнения (4), получаем

VÎTT- ï . ¡VM-x + V(l,0).(l-x)

V(Г,= maxmin < , , , (14,

' ( }) у V(0,1) • х + V(l, 1) • (1 — х) V ;

где V(aT,bT+1) = V(T, Т + 1, (¿i(T-i), «т, Ьт+i)), причем У(Т,Г + 1, (г1(т_1),аг,Ьт+1)) есть значение подыгры (Z1((i1(T_i),aT,bT+1), ßi(lf)), ^(¿i(t-i), «t, Ьт+i), Я), A№i(T-i),0),0) = у, ßi{(ii(T-1); 1),0) = z. Поскольку пара (Г + 1,Г4-1) совместна по игре Г, то

V(T,T 4-1, (¿i(t-i),öt, Ьт+i)) = = V(Г + 1, Г 4- 1, (гцг-!), ат, 0, Ьт+i)) х ßx((¿i(T-i), ат), 0) + (15)

+ У(Г + 1, Т + 1, (¿цт-!), ат, 1, Ьг+i)) х ^((¿i(T-i), от), 1).

Но У(ТЧ 1,Т4-1, (¿i(T-i),aT,aT+i,6T+i)) = Ф(а1,..., aT+i, h,..., Ьт+i), где ¿цт-i) = (ai, ...,ат~î, b\,...,Ьт)• Поэтому по формулам (13)—(15) можно найти значения V(T — 1. T,t1(T_u) Для всякого состояния информации ¿цт-i) и рекурсивные компоненты стратегии первого игрока ßl(lj~l), ß{(lT).

Обобщим предыдущие рассуждения. В зависимости от того, четное или нечетное Г, решая уравнения (12) или (13)—(15), мы найдем старшие по номеру рекурсивные компоненты стратегии и значения V(n,n + 1, ¿in), где п - максимальное четное число, не превосходящее Т 4- 1. Затем, так как п - четное число, решая уравнения типа (8' (последовательно «опускаясь вниз» до п — 4), найдем все значения V(n—2, п— 1, ¿i(n—2)) и рекурсивные компоненты стратегии ßl(I™~2), И, наконец, решая уравнение

типа (11), найдем рекурсивную компоненту стратегии ß{(7*) и значение V(Г) игры Г.

Таким образом, сделав рассуждения, приведенные выше, получим стратегию первого игрока, которая будет оптимальной, и значение игры Г.

Перейдем к отысканию оптимальной стратегии второго игрока в игре Г. Для этого воспользуемся утверждениями, двойственными утверждениям главы 5 монографии [4 .

Пусть п - нечетное натуральное число, п > 1. Тогда ¿2(п) = п — 1, /2(п 4- 1) = п. li(n — 1) = h{n) — п. То есть имеем случай 26) (замечание 5.3.2 [4]). Запишем п-е рекурсивное уравнение за второго игрока

лп 1 • \ /У(п + 1,п,^2п,0))

У (n, п — 1, г2п) = min тах < (16

х V(n + 1,п,(г2п,1))

где V(n + 1 ,n, (¿2n,an)) есть значение подыгры (Zi(i2n,an), Z2(i2n, an),/?2(/2 ),#), при этом /^(¿2п, 0) = х, V(n,n - 1,г2п) есть значение подыгры (Zi(î2n), ^2(г2п), Я).

Рассмотрим (п 4- 1)-е рекурсивное уравнение для подыгры (Zi(î2n, an), ¿^(¿2n,an), /?2(/2п),Я), i2'(n 4- 1) = п, /2(п 4- 2) = п 4-1, h(l2(n + 1)) = n, Zi(Z2(n + 1) + 1) = п + 2. То есть имеем случай 26) из [4]. Пусть ап — 0, тогда

V{n 4- 1,п, (¿2п, 0)) =

min тах V" p(bn+i, Ьп+2)У(п 4- 2, n + 1, (¿2п, 0, an+i, bn+i, Ьп+2)), (1<

Ä(Sc2((i2ni0),n+l)) o„ + i ^

Оп + 1, Рп+2

где в силу обозначений для случая 26) p(bn+1, bn+2) = рХх (bn+1, bn+2) = ß2(i2n, bn+l) х ß2{(i2n,0,bn+i),bn+2), Xi = Вп+1 х ßn+2, V(n + 2,n+ l,(í2n,0,an+i,bn+i,bn+2)) есть значение нодыгры (Z^^), Z2(¿2(n+2)),#), ¿2(n+2) = (г2п, 0, ап+1, 6n+i, bn+2).

Отметим, что Sc2((i2n,0),n + 1) = {(г2п, 0,0), (¿2n, 0,1)}. Обозначим ß2({i2n, 0,0),0) = у, ß2((i2m 0,1), 0) = z. Содержательно для игры Г' у означает вероятность движения игрока Е в северо-западном направлении после прохождения пути (b2, ...,Ьп,0)' при состоянии информации (а2,..., an_i, 0, b2,..., bn, 0), z означает вероятность движения игрока Е в северо-западном направлении после прохождения пути (Ь2,..., bn, 1) при состоянии информации (а2,..., an_i, 0, b2,..., 1). При введенных обозначениях уравнение (17) перепишется в виде

7(тг + 1,тг, (г2п,0)) =

7(0,0,0,0)ху + 7(0,0,0,1)ж(1 - у) +

+ 7(0,0,1,0)(1 - x)z + 7(0,0,1,1)(1 - ж)(1 - z) (18)

= min max < , ч , ч ,

у,- I V(0,1,0,0)ху + 7(0,1,0,1)а;(1 - у) +

+ 7(0,1,1,0)(1 - x)z + 7(0,1,1,1)(1 - х)(1 - z)

Для ап = 1 уравнение аналогично. Собирая воедино уравнения (16), (18) и используя обозначения (7), (п —> п — 1), получим

7(n, п — 1, г2п) — min max

X

{Cixy + с2я(1 - у) + с9(1 - x)z + Сю(1 - х){1 - z) с3ху + с4х( 1 - у) + Сц(1 - x)z + С\2(1 - ж)(1 - Z) (19)

Í с5ху + с6х( 1 - у) + С1з(1 - x)z + с14( 1 - ж)(1 - г) mm max <

[ с7ху + с8ж(1 - у) + Сх5(1 - X)Z + Ci6(l - х)(\ - Z)

Таким образом, зная все значения 7(n + 2,п + 1,г2(п+2)), решая уравнение (19), найдем все значения 7(п, тг — 1,г2п) и рекурсивные компоненты стратегии второго игрока 02 > ß2^2+1)- Далее можно рассмотреть число п — 2. Сделав для него рассуждения, аналогичные предыдущим, получим все значения 7(n — 2,п — 3,г2(п_2)) и рекурсивные компоненты стратегии второго игрока ß2(I2~2), ß2(I2~l) и т. д. до п — 3.

Пусть мы нашли все рекурсивные значения 7(3,2,г2з). Рассмотрим п = 1. По определению, /2(1) = 1, /2(2) = 1, ¿i(l) = 1. Таким образом, имеем случай 1а). Поэтому

7(Г) = 7(1,1, (1,1)) - min V(2,1, (1,1)), (20)

X

где V(2,1, (1,1)) - значение подыгры (Zi, Z2(ß2{I2)), Н), ß2(i2i,0) — х. Содержательно для игры Г' х означает вероятность движения игрока Е в северо-западном направлении из начального положения (0,0).

Рассмотрим71 ■= 2.По определению, /2(2) = 1, 12(3) = 2, 1\{12(2)) = 1, 1\{12(2) + 1) = 3. То есть имеем случай 26). Тогда

7(2,1,(1,1)) =

min max Т p(b2, 63)7(3,2, ((1,1), а2, Ь2, Ъ3)), (21)

Ä(Sc2((l,l),2)) а2 ^ (02,Ьз)

где р(Ъ2, Ь3) = /Ш,1), Ъ2) ■ &((( 1,1), Ь2), Ь3).

Положим /?2(((1,1),0),0) = у, /?2(((1,1), 1),0) = г. При введенных обозначениях уравнение (21) перепишется в виде

7(2,1,(1,1)) - min шах

У, г

f У(0,0,0)-х-г/ + У(0,0,1)-х-(1-2,)+

+ У (О,1,0)(1 - х) ■ z + У(0,1,1)(1 - х) • (1 - z) У(150,0) • х ■ у + У(1,0,1) • ж • (1 — у)+

+ У(1, 1,0)(1 - х) ■ z + У(1, 1,1)(1 - х) ■ (1 - z)

где V(a2,b2, b3) — У(3,2, ((1,1),а2, Ь2,Ьз)).

Собирая вместе уравнения (20), (22), получим

У (Г) — min тах

X,y,z

У(0,0,0) • х • у + У(0,0,1) • х • (1 — у) +

+ У(0,1,0)(1 - х) • z + У(0,1,1)(1 - х) ■ (1 - z) У(1) 0,0) ■ х ■ у + У (1,0,1) ■ х • (1 — у) +

+ У(1,1,0)(1 - х) ■ z + У(1,1,1)(1 - х) ■ (1 - z)

(22)

(23)

Пусть Т - четное натуральное число. Тогда, как уже отмечалось, У(Т + 1, Г, г2(т+1)) = тах

У(Т + 1,Т+1,(г2{г+1),0)) У(Т + 1,Т+1,(г2(т+1),1))

(24)

и найти значения У(Т + 1,Т, г2(т+1)) не составляет труда.

Пусть Т - нечетное натуральное число, тогда, как и при выводе уравнения (16). получаем

' У(Т + 1, Т, (г2х, 0))

У(Т, Т - 1,г2Т) = min max

У(Г + 1,Г,(г2Т,1))

(25)

где У(Г + 1 ,т,{г2т,ат)) - значение подыгры (г1(({2Т, ат)), £2((г2Т, ат),/32{1^)), Н), /32(«2Т,0) = х. Пары чисел (Г + 1,Г), (Т + 1,Т + 1) совместны. Используя это, нетрудно показать, что

тах <

У(Г+1,Г, (г2Т,аТ)) =

( У(Т + 1,Т+1,(г2т,ат,0,0))-х +

+ У (Т +1, Т + 1, (г2Т, ат, 0,1)) • (1 - х) У(Г + 1,Т + 1,(г2Т,ат,1,0))-х +

+ У(Т + 1, Т + 1, (í2t, ат, 1,1)) • (1 - х)

(26;

Обобщим проведенные рассуждения за второго игрока. В зависимости от того, четное или нечетное число Т, решая соответственно уравнения (24) или (25) и (26), мы получим значения У(п, п — 1,г2п), где п - максимальное нечетное число, не превосходящее Т + 1, и старшую по номеру рекурсивную компоненту стратегии второго игрока в случае, если Т - нечетное. Затем, решая последовательно уравнения типа (19) до

п = 3 и, наконец, уравнения типа (23), найдем рекурсивную стратегию второго игрока, которая будет оптимальной, и значение игры Г.

Отметим, что при решении игры Г за первого и второго игроков должно получиться одно и то же значение 7(Г). Это обстоятельство может служить проверкой правильности решения.

Укажем также, что во всех полученных уравнениях рассматриваются переменные х, у, г из отрезка [0,1], в силу их определения. Для сокращения записи это обстоятельство не выделяется.

4. Нахождение оптимальных стратегий игроков в игре с конкретной функцией выигрыша. Перейдем к решению игры Г' с конкретной функцией выигрыша Ф'. Положим выигрыш игрока Р у игрока Е равным 1, если:

1) проекция точки положения игрока Е в момент времени Т на прямую, соединяющую возможные точки положения игроков в момент времени (Т — 1), лежит левее (западнее) точки положения игрока Р в момент (Т — 1), но на расстоянии не более

2 х ^2;

2) точка положения игрока Р в момент времени Т — 1 и точка положения игрока Е в момент времени Т лежат на прямой, проведенной из начала координат параллельно северо-восточному направлению.

В остальных случаях полагаем выигрыш игрока Р равным 0.

В связи с определением функции Ф' функция Ф МАИ Г определяется так:

Т Т+1

Ф(ох,..., ат+1, Ъ\,..., Ьт+1) = 1 тогда и только тогда, когда О^^а,— X} Ь* ^ 1 или

11

йг = 1 при г ^ Т, Ьг = 1 при г ^ Т + 1.

Применим полученные в п. 3 уравнения к решению конкретной игры Г', определенной выше. Возможны два случая: продолжительность Т игры Г' - четное натуральное число, Т - нечетное натуральное число.

Пусть Т четно. Найдем рекурсивную стратегию первого игрока.

В силу уравнения (12) и определения функции Ф, У(Т, Т+ 1,ит) = 1 тогда и только Т Т+1

тогда, когда 0 ^ ^ °г ~ £ ^ 1, или — 1 ПРИ г ^Т, Ьг — 1 при г ^ Т + 1. При этом 1 1

частичная рекурсивная компонента стратегии ¡ЗЩх) - произвольная.

Так как п — Т — 2 - четное натуральное число, то для нахождения рекурсивных компонент стратегии /З^/^-1), /3*(1^~2) возможно использование уравнения (8), коль скоро известны значения У(Т,Т + 1, -¿хт). Пусть ¿1П = (а\,..., ап, Ъ±,..., Ьп+х). Рассмотрим следующие 5 случаев:

п П + 1 Т1 71+1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11 11

п п+1 п п+1 п п+1

11 11 11

5) а, = 1 при г ^ п, = 1 при г ^ п + 1. 1) Посчитаем коэффициенты С1,...,С16, которые входят в уравнение (8). Получаем С\ - 1, с2 = о, Сз = 1, с4 = 1, с5 = 1, Се - 1, С7 = 0, с8 = 1, с9 = 0, с10 - 0, сп = 1,

Ci2 = O, ci3 = 1, Ci4 = 0, eis = 1, ci6 = 1. Подставим их в уравнение (8), умножив каждый коэффициент c¿ на q, где q - вещественное число, q > 0. Получим

т// , • ч . j q-x-(l-y)+q-(l-x)-z

V{n,n + l,ti„) = maxmuW

x,y,z l q ■ (1 — X) • (1 — z)

где x, y,z из [0,1]. Решая последнее уравнение, находим

q -1 1 — 2 ■ х

V(n,n + l,iin) = х ^ -, у = 0, z =

2' ^ 2' у ' 2 • (1 — х)

Таким образом,

ß!(im,0) = /?Г((пп,0),0) = у = 0,

ßl((im,l),0)= l~2'X =z.

2 • (1 - х)

2) Посчитаем коэффициенты ci,...,ci6 для этого случая. Получаем ci = 1, с2 = 0,

С3 = 0, С4 = 1, С5 = 0, С6 = 1, Су = 0, С8 = 0, С9 = 1, Сю = 0, Сц - 1, С\2 = 1, C13 = 1, Ci4 = 1, eis = 0, Ci6 = 1. Подставим их в уравнение (8), умножив каждый на вещественное число q > 0. Получим

{q ■ х • у

(л \ , (л ^

q • х ■ (1 — у) + q ■ (1 — X) ■ z где x,y,z из [0,1]. Решая последнее уравнение, получим

V(n,n + l,»ln) = ßl(iln,0) = х ^ /?Г((гщ,0),0) = у = ^((г1п,1),0) = z = 1.

Z ' X

5) В этом случае ci = 0, с2 = 0, сз = 1, с4 = 0, С5 = 1, се = 0, = 1, с8 = 1, с9 — 0. сю — 0, сц = 0, ci2 = 0, ci3 = 0, Ci4 = 0, eis = 1, Ci6 = 1. Подставим их в уравнение (8), умножив каждый на вещественное число q > 0. Получим

( q- (1 -х) • (1 -z) V(n,n + l,íin) = maxmm <

x,y,z \q-(l—x)-(l—z)

где x,y,z из [0,1]. Отсюда V(n,n + 1 ,hn) = q,ßl(iin, 0) = x = 0,^((г1п,0),0) =y,y -любое из [0,1],/?í((ñ„,l),0) = г = 0.

Замечание 1. Для случая 5) проделаем еще и следующее. Умножим коэффициент Сю на q, q - вещественное число, q > 0, а все остальные коэффициенты умножим на q/2. Подставим домноженные коэффициенты в уравнение (8). Получим

|(1-®)(1 -*) V(n,n + l,¿ir») — maxmin ¿ Í ,

I mp- <2

где х,у,г из [0,1]. Откуда У(п,п + 1,г1п) = ^(чп,0) = х = 0, #((»!„, 0), 0) = у,

у е[0,1],#((*ш,1),0) = * = ().

3) В этом случае сх = 0, с2 = 0 или с2 = 1, с3 = 0, с4 = 0, с5 = 0, с6 = 0, с7 = 0, се = 0. Подставим их в уравнение (8). Получим

У(п,п + 1,Чп) =

— max min <

х, у ,z

j 0 ■ у + 0(1 — у) х ■ min < + (1 — х) ■ 0

------ -0.

При этом ßi(iin, 0) = х, х - любое из [0,1], ßl((i\n, 0), 0) = у, у - любое из [0,1], ßi((hn, 1),0) — z, z — любое из [0,1].

4) В этом случае сд = 0, сц = 0, с14 — 0, ci6 — 0. Подставляя коэффициенты в уравнение (8), получим

V(n,n + 1,г1п) = max min

Г 0 • у + 0(1 — у) .

х • min < + (1 — х) min

0 • z + 0 ■ (1 — z),

где х,у,г из [0,1]. Откуда У(п,п + 1,г1п) - 0, /5?(гщ,0) — х, х - любое из [0,1], #((*1П,0),0) = у, у - любое из [0,1], /^((г1п, 1),0) = г, г - любое из [0,1].

Рассмотренные пять случаев показывают, что У(п,п + 1,йп) = | тогда и только

п п+1

тогда, когда г1п = (сц,..., ап, Ьх,...,Ьп+1) и 0 ^ ^а, ~ £ Ь* ^ 1, У(п,п + 1,г1п) = <7,

1 1

если г\п — 1,..., 1,1,..., 1), У(п, п + 1,гхп) = 0 в остальных случаях.

п п+1

Рассмотрим число п' = п — 2. Оно четно, так как п четно. Положим </' = q¡2. Сделав рассуждения для п1 — п — 2 для случаев 1)-5), аналогичные рассуждениям для п, и учитывая замечание 1, получим (у(п',п' + 1,гхп) = д'/2 тогда и только тогда,

п' п' +1

когда г 1П/ = (ах,..., ап/, Ьх,..., Ьп/+х) и 0 ^ - X] Ь» ^ 1 или ах = ... = ап> - Ь\ =

1 1

... = Ьп'+х = 1. Частичные рекурсивные компоненты Р{(чп'), Р{(Чп', 0), /?*(г1п', 1) аналогичны таковым из предыдущих рассуждений соответственно случаям 1)-5).

Проведем описанные выше рассуждения раза, выделив из коэффициентов

сх,...,схб Для первого шага сомножитель q — 1, для второго шага д = 1/2 и т. д.

Получим У(2,3,г2з) = —т=т тогда и только тогда, когда г'х2 = (ах, а2, Ьх, Ь2, Ьз) и

2 2

0 ^ а2 — (Ь2 + Ьз) ^ 1 или а2 = Ь2 = Ь3 = 1; У(-) = 0 в остальных случаях. При этом найдем рекурсивные компоненты стратегии Р1(1[~1), Щ)•

Для определения значения игры V(Г) и рекурсивной компоненты стратегии ¡3{(1\) воспользуемся уравнением (11). В силу вышесказанного, коэффициенты, входяхцие в

уравнение, следующие:

7(0,0,0) =-¿г, 7(1,0,0) = ¿г, У (0,0,1) — О, 2 2 2 2

7(1,0,1) = ^, 7(0,1,0) = 0, 7(1,1,0)= 1

„ Т—2 5 2~

„ Т-2 5 2~

7(0,1,1) = 0, 7(1,1,1)

Т-2

2т-

при Т ^ 6 или Т = 2, 7(1,1,1) = 1 при Т — 4. Тогда уравнение (11) перепишется следующим образом:

Ж • ^т-2 + (1 х) • т_2

х ■ 0 + (1 - х) 1

7 (Г) = тахтт *

х ■ 0 + (1 - х)

Т-2 2~

1

„ Т-2 2 —

кяг-0 + (1- х) -7(1,1,1)

где ж е [0,1]. Откуда 7(Г) = -^Ьг, А(»11,0) = х = 0.

2 2

Пусть продолжительность Т игры Г' - нечетное натуральное число. По формулам (13)—(15) найдем значения 7(Г — 1, Т, гцт-1))- В силу определения игры Г', последний ход игрока 1 не влияет на его выигрыш. Поэтому всякий коэффициент У(ат,Ьт+1) = 7(Т, Т + 1, (гцт-1), «т, &Г4-1)) в формуле (14) не зависит от (у,г) и равен Ф(ах,..., от, «т+1, Ь±, ...,Ьт+1), где (сц,..., ат, £>ъ..., Ьт+1) - (гцт-1), от, Ьт+1), °т+1 -любое. Соединяя формулы (13), (14) воедино, получим

7 (Г — 1,Т, гцт-1)) = тахтт

7(0,0) - ж+ 7(1,0) • (1 -х) 7(0,1)-ж+ 7(1,1)-(1-х) '

где ж е [0,1].

Для «1(7-—!) = (си.,..., от-1, Ьу,..., Ьт) рассмотрим следующие пять случаев:

Т-1

Т-1

!) Х>-Еь< = 0'2) =

11 11

Т-1 т

3) ]Г а, - ^ Ъ{ > 1, 5) г1(т-1) - (1,-, 1,1),

1

Т-1

—v"

2-Т-1

Т-1

4) Е^-Е^2^-1)-

1) В этом случае, в силу вышесказанного, 7(0,0) = 1, 7(1,0) = 1, 7(0,1) = 0, 7(1,1) = 1. Тогда

7(Т — 1, Т,гцт-1)) = тахтт

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1,.

(1-х)

, же [0,1].

Откуда V(T - 1,Т,г1(Г_1}) = 1, 0Í(¿i(t-i),O) = х = 0.

2) Здесь 7(0,0) = 1, 7(1, 0) = 0, 7(0,1) = 1, 7(1,1) = 1. Тогда 7(T-l,T,ii(T_i)) = max(z) - 1, Ä(tx(r_i),0) = х = 1.

3) В этом случае У (0,0) = 0, V(1,0) = 0. Тогда 7 (Г - - 0, ßl (^1(Т—1), 0) = х, х - любое из [0,1].

4) Здесь 7(0,1) = О, 7(1,1) = 0. Тогда 7(Т - l,T,i1(T_1))= 0,#(ti(T-i),0) = х, х -любое из промежутка [0,1].

5) В этом случае 7(0,0) = 0, 7(1,0) = 1, 7(0,1) = 0, 7(1,1) = 1. Тогда 7(Т-1 ,Г,г1(т_1)) = max(l - х) = 1, РЦгцт-1),0) = х = 0.

Таким образом, мы определили рекурсивные компоненты стратегии ßi(I\) (ßi(lT) ~ произвольная) и все значения 7(Т— 1,Т, Щт-1))- При этом показано: 7(Т — 1,Г,¿i(t—i)) — 1 тогда и только тогда, когда гцт-i) — (аъ ат-ъ bi,...,br) и

0 < Е>< - ЕЬ < 1 или ai = ... = aT-i = h = ... = br = 1; 7(T - 1,T,h(t_i)) = 0

i i

в других случаях. То есть мы находимся в условиях после решения первого этапа,

после решения уравнений (12) игры Г* продолжительностью Т* = Т — 1, при этом

Т* - четное. Тогда можно воспользоваться решением, проведенным для игры четной

продолжительности Т*. В результате получим рекурсивные компоненты стратегии

ßl(Il),...,ßl(I^2) и значение 7(Г') = 7(Г*) = =

2 2 2 2

Найдем рекурсивную стратегию второго игрока в игре Г. Еще раз оговоримся, что переменные x,y,z, рассматриваемые здесь, принадлежат отрезку [0,1].

Пусть Т - четное натуральное число. В силу определения функции выигрыша Ф и уравнения (24) получаем 7(Г + l,T,H(T+i)) = 1 тогда и только тогда, когда г2(т+1) =

т Т+1

(ai, ...,ат, bi, ...,br+i) и 0 ^ Е а% ~ Е ^ 1 или ai = ... = ат - h - ... = bT+i = 1,

i i

7(Т + 1,Т,¿2(t+i)) = 0 в остальных случаях. Поскольку Т + 1 - нечетное число, то можно воспользоваться уравнением (19) для отыскания рекурсивных значений 7(Т —

1 ,Т — 2,г2(т-1)) и компонент рекурсивной стратегии (Ij), ßli^'1)-

Пусть гцт-i) = (ai,..., ат-2, &i, •••, Ьт-i)- Рассмотрим следующие пять случаев:

Т—2 Т-1 Т-2 Т—1

!) Е«<-£* = 0, 2) ]>>-£> = 1,

Ii Ii

Т-2 Т-1 Т-2 Т-1

3) £а<-5><0, $>-$><2.(Т-3),

Ii Ii

Т-2 Т-1

4) £ - £ b» > 1, 5) ai = ... = аТ-2 = bi = ...• = bT-i - 1.

i i

1) В этом случае сх — 1, C2 = 0, сз = 1, = 1, es = 1, Сб = 1, c-¡ = 0, с$ — 1, сд = 0, Сю = 0, Си = 1, С12 =0, Ci3 = 1, Си = 0, eis = 1, cíe = 1. Подставим коэффициенты в

уравнение (19), каждый умножив на вещественное число q > 0. Получим

V(T — 1, Г — 2, ¿2(T—i)) = g min max

min max <

у,^ 1 х + (1 — х) • z

{ж + (1 — ж) ■ z

V

ж • (1 - у) + (1 - ж)

откуда V(T - 1,Т - Ъщт.ц) = §, #(»2(t-i),0) = х = §, /?2*((г2(т-1), 0,0), 0) = у, у - любое из [0,1], /32*((г2(т-1),0,1),0) = г = 0, Ж(»2(т-1),1,0),0) = а = 1, /?2*((г2(г-1),1,1),0) = Ь = 0.

2) Здесь С\ = 1, с2 = 1, с3 = 0, с4 = 1, с5 = 0, с6 = 1, с7 = 0, с8 = 0, с9 = 1, d0 = 0, сц = 1, Ci2 — 1, Ci3 = 1, Ci4 = 1, eis = 0, Ci6 = 1- Подставим коэффициенты e¿, каждый умножив на вещественное число q > 0, в уравнение (19). Получим

V(T - 1 ,Т- 2,t2(t-i)) = gminmax

{X + (1 — х) • Z X • (1 — у) + (1 — х) • Z

( X ■ (1 - у) + (1 - х) min max < ,

V,z l(l-s)(l-z)

откуда V(T — l,T — 2,г2(т-1)) = §, $(»2(т-1),0) = ж = /32*((г2(Т-1),0,0),0) = у, у -любое из [0,1], Ж(»2(г-1),0,1),0) — z — 0, ß*2((i2(T-i), 1,0),0) = а = 1, $((¿2(t-i), 1,1), 0) = b, b - любое из [0,1].

5) В этом случае ci = 0, С2 = 0, сз = 1, с4 = 0, С5 = 1, с6 = 0, с7 = 1, es = 1, Cg -- 0, сю = 0, сц = 0, Ci2 = 0, С13 = 0, ci4 = 0, С15 = 1, c\q — 1. Подставим коэффициенты с, в уравнение (19), каждый умножив на вещественное число q > 0. Получим

V(T - 1,Т — 2,г2(т-1)) = g min max <

min max

x-y

I X-y

mm max <

y,z I 1

откуда У(Т - 1 ,Т - 2,г2(т-1)) = <?, £2 (¿2(7-1), 0) = х, х - любое из [0,1], Ж(*2(т-1),0,0),0) = у = 0, /^2((»2(Т—1),0,1),0) = г, г - любое из [0,1], Р2 ((¿2(Т—1), 1,0), 0) = а, а - любое из [0,1], /32((г2(т-1), 1,1), 0) - Ь, Ь - любое из [0,1].

Замечание 2. Умножим коэффициенты С1,...,С15 случая 5) на вещественное число | > 0, С16 - на д и подставим их в уравнение (19). Получим

У(Т — 1 ,Т — 2,г2(т-1)) - дгшптах

шт тах

у,*

гат тах <

у, г

0

х • у 2

Г х • У 2

1 + 1(1-*)(!-г)

\ 2 2

откуда У(Г- 1,Г- 2,г2(Т-1)) = §, £2(^-1), 0) = ж, х - любое из [0,1], (3%((г2(т-1),0, 0),0) = у = 0, /?2*((-,0,1),0) - любое из [0,1].

3) Используя уравнение (19), нетрудно показать: У(Т — 1,Т — 2, г2(х—1)) = 0, частичные компоненты стратегии /3%(г2(т-1),0) = 0, /32((г2(т-1),С1т-1,Ьт),0) = 0 будут рекурсивными (хотя последнее нетрудно показать и без уравнения (19), используя определение функции выигрыша).

4) В этом случае, решая уравнение (19), нетрудно показать: У(Т — 1,Т — 2, г2(т-1)) = 0, частичные компоненты стратегии /32(г2^т- 1),0) = 1, ¡32((г2(т-1),ат-1, &т),0) = 1 будут рекурсивными (хотя последнее нетрудно показать и без уравнения (19), используя определение функции выигрыша).

Таким образом, найдены компоненты рекурсивной стратегии /3^ Р{(12) и

все значения У(Т — 1 ,Т — 2,1))- Обозначим д' = где q -вещественное число из предыдущих рассуждений. Тогда У(Т— 1,7'—2, г2(т-1)) = <?' тогда и только тогда, когда

Т-2 Т-1

«2(т-1) = (а1,...,аТ-2,Ьх,...,6Г-1) и 0 ^ £ а< - Е < 1; У(Т - 1, Т - 2, ¿2(т-1)) =

1 1

2 • д', когда г2(х_1) = (1,..., 1,1,..., 1); У(Т — 1, Т — 2, г2(т-1)) — 0 в остальных случаях.

(Т-2) (Т-1)

Проводя рассуждения для п — Т — 3, аналогичные предыдущим, с учетом замечания 2 получим компоненты рекурсивной стратегии ¡32(12~г), /?2(-^2 ~2) и все значения У(Т — 3,Т — 4,г2(Т_3)). При этом У(Т — 3, Г — 4,г2(Т_3)) = | тогда и только тогда, когда 0 ^ Т—4 Т-3

Е Щ - Е Ь» = 1 или а! = ... = ат_4 = ¿>1 = ... = Ьт—з = 1; У(Т - 3, Т - 4, г2(т-з)) = 0 1 1 в остальных случаях.

Учитывая, что для игры Г д = 1, через (^р) повторений проведенных рассуждений будут найдены компоненты рекурсивной стратегии /32(12), ...,/32(12) и значения У(3,2,г23). При этом У (3, 2,г23) = г_2 тогда и только тогда, когда 0 ^ а2 —(&2 + &з) ^ 1

если

или а2 = Ъ2 = Ь3 = 1, Г ^ 6 или Т = 2, и У(3,2, ((1,1), (1,1,1))) = —

2 2

Т — 4; У(3,2, г2з) = 0 в остальных случаях. Напишем уравнение (23) с учетом полученных значений У(3, 2,12з)\

У (Г) — min тах <

х, У, -г

х ■ у

•Х-У+ -¿г - х- (1 -у)+ 2—

Н—5гг5" • (1 — х) ■ г + 2~

+ У(1,1,1)(1-*)(!-*)

Т-2 2 —

Г-2 2~

Т-2 2"

При этом ß2{i21,0) = х, х - любое из [0,1], ß2{(i21,0),0) = у, у - любое из [0,1],

ß2 ((¿21,1), 0) = г = 1.

Таким образом, найдены рекурсивная стратегия игрока 2 в игре Г (а значит, и

игрока Е в игре Г') и значение У (Г') = тх_2 . Последнее совпадает со значением, по-

2 2

считанным при поиске рекурсивной стратегии за игрока 1 (Р). Поэтому можно думать, что ошибки в вычислениях нет.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть продолжительность Т игры Г' - нечетное натуральное число. Тогда решение игры за игрока 2 принципиально не отличается от предыдущего случая. Достаточно посчитать значения V(T,T — l,i2r) по формуле (25). В результате получим: V(T,T— Мгт) = 1 тогда и только тогда, когда г2Т = (аь..., aT_i, h,..., Ьт) и Т-1 т

0 ^ S аг ~ ^ 1 или ai = ... = ат-i = bi — ... = Ьт — 1. Поэтому значение 1 1

рассматриваемой игры совпадает со значением игры продолжительностью Т' — Т — 1, где Т" - четное число и равно тх_3 . Последнее совпадает со значением, посчитанным

при решении игры Г за игрока 1 в нечетном случае, что и должно быть. Summary

Slobozhanin N. М. On functional equations of a game with variable information delay.

Functional equations of a multistep antagonistic game when the maximizing player has variable information delay are founded. It is shown that the method of recursive behavior strategies, obtained by the author earlier, can be applied to solve the given game.

Литература

1. Von Neuman J., Morgenstern О. Theory of games and economic behavior. Princeton: Princeton University Press, 1944. 625 p.

2. Петросян JI. А., Томский Г. В. Дифференциальные игры с неполной информацией. Иркутск: Изд-во Иркутск, ун-та, 1984. 188 с.

3. Скарф X. Э., Шепли Л. С. Игры с неполной информацией // Применение теории игр в военном деле / Пер. с англ.; Под ред. А. В. Ашкенази. М.: Сов. радио, 1961. С. 256-274.

4. Слобожанин Н. М. Информация и управление в динамических играх. СПб.: Изд-во С.-Петерб. ун-та, 2002. 308 с.

5. Слобожанин Н. М. Многошаговые игры с задержкой информации // Зап. науч. семинаров Ленингр. отд. Матем. ин-та. Сер. Проблемы теории вероятностных распределений. 1985. Т. 142, вып. 9. С. 86-93.

6. Слобожанин Н. М. Управление в многошаговых играх. СПб.: Изд-во С.-Петерб. ун-та, 1996. 96 с.

Статья поступила в редакцию 11 декабря 2005 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.