Научная статья на тему 'Обобщение игры поиска на прямой с "бункером"'

Обобщение игры поиска на прямой с "бункером" Текст научной статьи по специальности «Математика»

CC BY
61
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Егорова Алена Андреевна, Александрова М. Г.

Рассмотрены антагонистические игры поиска с "бункером". Под "бункером" понимается область необнаружения игрока H игроком S. Антагонистическую игру можно интрпретировать следующим образом. Игроки одновременно выбирают стратегии x,y. После этого игрок S (игрок H) получает выигрыш K (-K), а игрок H (игрок S) соотвественно -K (K). Каждый из игроков стремится максимизировать свой выигрыш, а слежовательно, минимизировать выигрыш противника. Доказаны теорема о значении и об оптимальных стратегиях данной игры и свойства рекуррентного уравнения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Обобщение игры поиска на прямой с "бункером"»

УДК 519.833.3

ОБОБЩЕНИЕ ИГРЫ ПОИСКА НА ПРЯМОЙ С «БУНКЕРОМ»

А. А. Егорова, М, Г, Александрова

Теория игр занимается изучением математических моделей принятия оптимальных решений в условиях конфликтов. Для построения формальной математической модели принятия решений в условиях конфликта необходимо математически описать все возможные действия участников конфликта и результаты этих действий [1].

В данной работе рассмотрены антагонистические игры поиска с «бункером». Под «бункером» понимается область необнаружения игрока Н игроком Б. Антагонистическую игру можно интерпретировать следующим образом. Игроки одновременно выбирают стратегии х, у. После этого игрок Б (игрок Н) получает выигрыш К ( —К), а игрок Н (игрок Б) — выигрыш —К (К). Каждый из игроков стремится максимизировать свой выигрыш, а следовательно, минимизировать выигрыш противника [2].

1. Игры на прямой с «бункером»

Исследована следующая антагонистическая игра поиска. Имеют-Б Н Н

0,1,...,г,... оси Ох Если в некоторый момент времени игрок Н находится в точке г, то через единицу времени он может перейти в точку г — 1 либо в точку г +1, либо остаться на месте в точке г. Игрок Б может произвести к попыток поиска игрока Н. За каждую свою попытку он

Ох О

Н

@ 2007 Егорова А. А., Александрова М. Г.

игрока й. Игрок й обладает полной информацией о местоположении игрока Н с запаздыванием та единицу времени, т. е. игрок й знает, где находиться игрок Н, то та знает, куда он пошел. Игрок Н знает, сколько неиспользованных попыток поиска осталось у игрока й, но не знает, в каких точках игрок й ведет поиск. Если игрок й производит поиск

Н

равна ст, где 0 < ст < 1. В противном случае она равна нулю. Целью йН до того, как он достигнет «бункера». Символом Г(г, к) обозначим ис-

Н

точке г, а игрок й имел к неиспользованных попыток поиска. Символом у(%, к) обозначим значение игры Г(г, к). Из определения Г(г,к) имеем у(г, 0) = 0, г € N у(1, к) = 0, к € N На первом шаге игры Г(г, к) игрок Н имеет три чистые стратегии: перейти в точку г — 1, остаться в точке г, перейти в точку г = 1. Игрок й имеет четыре чистые стратегии (на самом деле больше, но остальные стратегии неэффективны): осу-

г — г г й г, к

" ст + ( 1— стУи(г — 1, к — 1) у(г,к — 1) у(г+1,к — 1)

у(г — 1, к — 1) ст+( 1— ст)гу(г, к — 1) у(г+1,к — 1) у(г — 1, к — 1) у (г, к — 1) ст + ( 1— а)у(г + 1,к — 1) '

у(г — 1,к) у{г,к) у(г+1,к)

Символами ц = (^1,^2,^3,^4)) V = обозначим вероят-

ностные векторы. Тогда

4 з

= 1, ^ > о, 3 е 1,4; ^гл,- = у0 ^ °> з 6

3=1 3=1

2. Обобщение игры поиска на прямой с «бункером»

Рассмотрим обобщение антагонистической игры с «бункером».

Нй

к

игроков обладает полной информацией о противнике с запаздыванием

Нг ницу времени перейдет в точку £(г) (останется та месте в точке г), а игрок Б будет производить поиск в точке £(г) (соответственно г), то вероятность обнаружения игрока Н считается равной а^ (а^), где £ € 1,3, \(г) = г — 1, 2(г) = г, 3(г) = г + 1.

Символами Г(г;к), у(г;к) обозначим исследуемую игру и ее зна-

Нг игрок Б имел к неиспользованных попыток поиска. Игроки Б и Н

гк

Б

игры Г((г,^;к) имеет вид

<71 + (1— <1)у(г — 1, к — 1) у(г,к — 1) у(г + 1,к — 1)

у(г — 1, к — 1) 72 + (1— <2)го{г,к — 1) у(г + 1,к — 1) у(г — 1, к — 1) у(г, к — 1) <3 + (1— а3)у(г+1,к — 1)

у (г — 1,к) у{г,к) у{г + \,к)

т. е. {а5л(г;к)}5е1д1?)е1^, где ап„(цк) = ап + (1 - ап)у(г](г),к - 1), Г] е 1,3, а^(цк) = у(£(г),к - 1) € 1,3, а4?(г;к) = у(£,к),

£ € 1,3. Символами /х = V = (г/1, г/2, г/3) обозначим веро-

ятностные векторы. Тогда необходимым и достаточным условием того, что вероятностные векторы ц(г\к), ^(цк) являются оптимальными па первом шаге стратегиями игроков Б и Н, а, у (г; к) — значением игры гк

4

^^ к)хп(г; к) ^ у{г\к), £е1,3,

'Т _ (1.1)

^а^5(г;к)у5(г;к) < у(цк), г] е 1,4.

«=1

Введем обозначения:

= 1-ТПЛ' -/ТТТТТ' £еТД

1— у(г,к) !— у{£{1),к)

Тогда г;(г, к) = 1 — -щщ и в Н0ВЬ1Х обозначениях неравенства (4.1) примут вид

4 I _

£ € 1,3, (1.2)

3 ! _

пе 1,4, (1.3)

где к) ^-^Ш^-Ч-^МЛ^^) = V Ф £> чЛ € 1,3, Ь^(цк) = 1/У(£(г),к), £ € 1,3. Заметим, что в новых обозначениях граничные условия

«(г; 0) = 0, г е М, ф; к) = 0, к е М,

примут вид

У(г; 0) = 1, г € М, У(1; к) = 1, к е N. (1.4)

Символами итп, 7 € 1,С™, то € 1,3, обозначим такие подмножества множества 1,3, что

а) если 7 ^ то ит,7 ф

б) для любых т, 7 множество ит,7 является выборкой т элемен-

,

Теорема 1.1. (а) Значение игры у(цк) определяется формулой V(г, к) = 1 — у^-щ, где У(ц к) является решением рекуррентного уравнения

Е --1

1 I ееЬ:

= шах Д : .... : 7 € 1, С?, то € 1,3 } (1.5)

У(г,к) ) у- УШЛ-,к-1)

I П С

пс

с граничными условиями (1.4).

(б) Предположим, что тп* € 1, 3, 7* € 1, С™ такие, что

Е --1

Пс

У(г,к) | у-

I П с

(1.6)

Тогда

Г j_fl _ n№));fc-m есди£€и .k)=\ ^ h есдп^еи^^, (L7)

[О, если С & Umt ,

(_vm*-р/ч__, v

vi\Цк)= < (1.8)

I 0, если С & ■

Ниже приводится лемма, в которой сформулированы некоторые свойства двойной последовательности V(i; к).

Лемма 1.1. Предположим, что V(i;k) определяется рекуррентным уравнением (1.5) с граничными условиями (1.4). Тогда для любых i & N k & Z+ справедливы соотношения

V{v,k) < V(i;k+1), (1.9)

V{v, k + 1) < V{v, k + 1) < 9V(i; k), (1.10)

где

0= 1

1 -

Е

£=1

УШ;к -1) > У(цк), если£ е ит,а,, г,к е N (1.11)

УШ;к -1) < У(цк), если£ е ^, г,к е М, (1.12)

У(цк) = 0к, еслн'г > к+\,г е М, к е Z+. (1.13)

Доказательство. Первоначально заметим, что из рекуррентного уравнения (1.5) и граничных условий (1.4) имеем

Е

1 I

1 *

v(i 1) = max i —J2—~ : 7 6 т 6 3

Е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ = 1 (1-14)

V — 3 6

(Те 1

teu3,i

здесь учитывается, что функция ^у- возрастает при £ > 0, поэтому для любых 7 € 1, С™, то € 1,2, справедливо неравенство

Докажем неравенство (1.9) методом математической индукции по к. База индукции при к = 0 следует из граничных условий (1.4) и равенства (1.15). Предположим, что неравенство (1.9) справедливо при некотором к = K. Докажем, что тогда неравенство (1.9) остается справедливым и при к = K+1. Действительно, из рекуррентного уравнения (1.5) и индукционного предположения имеем

Следовательно, V((i,j)\ K + 1) < V((i,j)\K + 2), что завершает доказательство неравенства (1.9).

Докажем неравенство (1-Ю) методом математической индукции по кк

равенства (1.15). Предположим, что неравенство (1-Ю) справедливо при некотором к = K. Докажем, что тогда неравенство (1-Ю) остается справедливым и при к = K + 1. Действительно, из рекуррентного

Тогда

если i > 1, если i = 1.

(1.15)

уравнения (1.5) и индукционного предположения следует

1 íeu,

Е --i

= тах Л ^ vw.-vir-m : 7 е 1, С3"\ те 1,3

V((i,j),K+ 2) ) у- v(ttihK+1)

I ^ a с

Е --i

> тах < ' : 7 € 1, С™, то G 1, 3 > =

в Т ШИШ. ' ' ' 3 ' ' [ 0У(г;К+1)'

a? I

Следовательно, V(i; K + 2) < 0V(i; K + 1), что завершает доказательство неравенства (1.10).

Докажем неравенство (1.11) методом от противного. Предположим, что неравенство (1.11) неверно. Тогда существует такое £ $ Um*,Y*i чт0 V(i; к) > V(£(i); к — 1) или, что равносильно,

1 1 V(m;k- i)) > У(Щ-

Из последнего неравенства и условия (1.6) имеем

Е - -i

1 сТТ an

1 __1fi4

> ^ T/ííníilVfc-11 • (Д.-IOJ

У((е(г)); к - I) У У((г1а));к-1) ■

С другой стороны, из условия £ $ следует, что ф Щд, т. е. ш* < 3. Поэтому из рекуррентного уравнения (1.5) и условия (1.6) имеем

Е —" 1 £ — " 1

> ""__(1 17)

^ ^ У11г,И))-к-1) ' К1-11)

у- У((ф))-к-1) -- у- У((ф))-к-1)

neu™*,j* neum*+ i,y*

где 7* такое, что Umt+1л * = Um* U {£}.

Неравенство (1.17) равносильно последовательности неравенств

1 an an

(х- 1 ^ 1 Л v^ ПШ);к-1)

n s t^-1 S

\eum*,Y* n « 7 neum

a

n

Е - -1

^ ill— (у т . —,.

1 '—' a

1 „ veumt

V((£(i)y,k - 1) ^ у- УЩгЩ-1) '

rr an

что противоречит неравенству (1.16). Полученное противоречие доказывает неравенство (1.11).

Докажем неравенство (1-12) методом от противного. Предположим, что неравенство (1-12) неверно. Тогда существует такое £ G Um*,7* j что У{ц к) < V(£(i); к — 1) или, что равносильно,

1 1 , < ... (1.18)

— i) v&ky

Рассмотрим два случая: m* = 1 и m* > 1. Пусть m* = 1. Тогда

из условия (1.6) и неравенства (1.18) имеем

>_1_

V(rn);k — 1 V(rn);k -1)

или, что равносильно, 1 — a^ > 1. Но то условию а^ > 0. Полученное

m*

m* >

Е - -1

neumt:Jt 1

У^ У(Щ);к-1) - V(JFUX)- h - 1)

или, что равносильно,

( Е f-iW(0);A-D> Е (1.19)

С другой стороны, из рекуррентного уравнения (1.5) и условия (1.6) имеем

V J- -1 Е — -1

У((ф))'к-1) -- у^ у((ф))-к-1)

1 ^тт ai

J2 у ((ri(l))-,K-L) J2

neUm*,Y* neu _

где 7" такое, что ит^= ит^_1и {£}. Последнее неравенство равносильно последовательности неравенств

что противоречит неравенству (1.19). Полученное противоречие завершает доказательство неравенства (1.12).

Докажем неравенство (1-13) методом математической индукции по к. База индукции при к = О следует из граничных условий (1.4). Предположим, что неравенство (1-13) справедливо при некотором к = К. Докажем, что тогда неравенство (1.13) остается справедливым и при кК

положения имеем

Следовательно, V(i; K + 1) = 0K+1, что завершает доказательство равенства (1.13) и леммы 1.1.

Доказательство теоремы 1.1. Первоначально докажем, что векторы n(i;k), v(i;k), определенные в (1.7), (1.8), являются вероятностными. Вероятностность вектора v(i; k) непосредственно следует

0K+i-

1

из (1.8). Из (1.6), (1.7) вытекает, что

Н у{цк) ) у{цк)

х{у(г;А0+( ]Г 1-Лу(цк)

v У(т);к- 1)| = У(цк) =

Неотрицательность £-й компоненты вектора /л(ц к) при £ € 1,4 \ ит*,7* следует из (1.7), а при £ € ит*,7* — из (1.7) и (1.12).

Докажем неравенство (1.2). Рассмотрим два случая: £ € ит*, и £ € ит* г/*- Пусть £ € ит*г/*. Тогда из (1.6) и (1.7) имеем

п=1

^ )_/_У('П-к- 1)

У(£;к -1) ^ аЛ УН; к) 1 ^ ^_Г_У(тк-1)\ 1

У£к -1) ^^ ап\ У (ц к) ) У£к -1)

Е

У(г);к-1)

а

V

* >7*

У (г, к) У(цк) У£к -1)

/ Е N

-I

" 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ У(гПк-1) У(цк- 1) \пеит*п* а" )

У(цк)'

что и доказывает (1.2) при £ € ит*г7*. Докажем (1.2) при £ € и„

Из (1.6), (1.7) и (1.11) следует, что

п=1 пеит *,

^ У(тк- 1)= 1 ^ 1

Пеит*„* ап -1) У(ц к)'

что и завершает доказательство неравенства (1.2). Заметим, что

и^! ¿г1 с-»'

Неравенство (1.20) вытекает из следующей последовательности неравенств:

3 1 1

— ^ 0 (в силу того, что <Т£ ^ 1) ^ 1 — ^^ —,

«=1 ае ееит*„* а«

Е --1

Е Е "

■г * *

5=1 ^

Е -

^ ае

> V 1-1.

1 - 1/ Е £

Докажем неравенство (1.3). Рассмотрим два случая: ц = 6 и ц < 6.

Пусть п = 6. Из (1.6), (1.8) и (1.10) имеем

з УЩк-1)

1 ^ 1 1)

2

> ^ Кил-г А Е > (в силу (1.20))

эеит*„*

Е --1

¿—¡ас

_ 1

у- У(г;Л)'

ас

что и доказывает (1.3) при п = 6.

Рассмотрим случай п < 6. Исследуем отдельно два подслучая: п € итИ п & ит *,7*' ПуСТЬ п € ит*

*■ Тогда из (1.6) и (1.8)

получим

с 1\ с 1\ 1 1 У{'П'1к~ 1)

а=1

+ Е

У(г]; к - 1) ап £ У(з,к-1) *,у * а

1 1 У(е,к -1)

к — 1) у-

*п*

1

Е --1

¿—'ас Л

у- ПЫ*-1) У(цкУ

ас

что и доказывает (1.3) при п € ит*п*. Рассмотрим подслучай п €

Um*,Из (1.6), (1.8) находим

1 1 V(e,k -1)

1*, "J* '

з

цк)= Y^

i

У — У —-1

' ас ас

^ v(ftfc-i) - £ V(ftfc-I) У(г;Л)'

«eUm* ас eeum*Y* ас

что и завершает доказательство как неравенства (1.3), так и теоремы 1.1.

Заключение

В данной работе рассмотрено обобщение антагонистической игры поиска на прямой с «бункером». Доказаны теорема о значении и об оптимальных стратегиях данной игры, и в лемме доказываются свойства рекуррентного уравнения.

ЛИТЕРАТУРА

1. Петросян Л. А., Зенкевич П. А., Семина, Е. А. Теория игр. М.: Высш. школа, 1998.

2. Петросян Л. А., Гарнаев А. Ю. Игры поиска. СПб.: Изд-во СПбГУ, 1992.

3. Петросян Л. А., Томский Г. В. Дифференциальные игры с неполной информацией. Иркутск: Изд-во Иркутск, ун-та, 1984.

4. Егорова А. А., Жукова И. Е. Одновременные биматричные игры поиска второго и третьего видов // Вести. ЯГУ. 2005. Т. 2, вып. 2. С. 70-77.

5. Serov V. P. Optimal feedback strategy in the game variant of generalized travelling salesman problem // Zakharov V. Control applications of optimization (Оптимизация в задачах управления). Saint-Petersburg, 2000. V. 2. С. 183-185.

6. Sbagalova L. G., Ushacov V. N. On the problem of an approach to a non-cylindrical target // Zakharov V. Control applications of optimization (Оптимизация в задачах управления). Saint-Petersburg, 2000. V. 2. С. 189-193.

г. Мирный

27 февраля 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.