Научная статья на тему 'Оптимальные стратегии в игре патрулирования на графе'

Оптимальные стратегии в игре патрулирования на графе Текст научной статьи по специальности «Математика»

CC BY
294
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИГРА ПОИСКА / SEARCH GAME / ГРАФ / GRAPH / ПАТРУЛИРОВАНИЕ / PATROL / АТАКУЮЩИЙ / ОПТИМАЛЬНЫЕ СТРАТЕГИИ / OPTIMAL STRATEGIES / ATTACKER

Аннотация научной статьи по математике, автор научной работы — Гусев Василийвасильевич, Мазалов Владимир Викторович

Рассматривается теоретико-игровая модельпатрулирования на графе, в которой атакующий имеет m единиц времени для атаки некоторой вершины графа, а стратегией патрулирующего является выбор пути в графе. Найдены равновесие в игре с нулевой суммой и средняя длина патрулирования для различных графов. Библиогр. 7 назв. Ил. 1. Табл. 13.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMAL STRATEGIES IN THE GAME OF PATROL ON A GRAPH

We consider the game-theoretic model of patrolling on a graph in which an attacker has m time units to attack a node of the graph and the strategy of patroller is a selection of a path in the graph. The equilibrium in the zero-sum game and the mean length of the patrolling path are derived for different graphs. Bibliogr. 7. Il. 1. Table 13.

Текст научной работы на тему «Оптимальные стратегии в игре патрулирования на графе»

УДК 519.8

В. В. Гусев, В. В. Мазалов

Вестник СПбГУ. Сер. 10. 2015. Вып. 2

ОПТИМАЛЬНЫЕ СТРАТЕГИИ В ИГРЕ ПАТРУЛИРОВАНИЯ НА ГРАФЕ*)

Институт прикладных математических исследований Карельского научного центра РАН, Российская Федерация, 185000, Петрозаводск, ул. Пушкинская, 11

Рассматривается теоретико-игровая модель патрулирования на графе, в которой атакующий имеет m единиц времени для атаки некоторой вершины графа, а стратегией патрулирующего является выбор пути в графе. Найдены равновесие в игре с нулевой суммой и средняя длина патрулирования для различных графов. Библиогр. 7 назв. Ил. 1. Табл. 13.

Ключевые слова: игра поиска, граф, патрулирование, атакующий, оптимальные стратегии.

V. V. Gusev, V. V. Mazalov

OPTIMAL STRATEGIES IN THE GAME OF PATROL ON A GRAPH

Institute of Applied Mathematical Research of the Karelian Research Centre RAS, 11, Pushkinskaya street, Petrozavodsk, 185000, Russian Federation

We consider the game-theoretic model of patrolling on a graph in which an attacker has m time units to attack a node of the graph and the strategy of patroller is a selection of a path in the graph. The equilibrium in the zero-sum game and the mean length of the patrolling path are derived for different graphs. Bibliogr. 7. Il. 1. Table 13.

Keywords: search game, graph, patrol, attacker, optimal strategies.

1. Введение. Игры поиска представляют собой современное направление теории игр. Они возникают в военных приложениях, задачах распределениях ресурсов, охраны объектов и др. Им посвящено большое количество работ (см., например, [1, 2]). Такие игры рассматриваются как в статической (задача с неподвижным прячущимся), так и в динамической (задача с подвижным прячущимся) постановках. Классической задачей теории поиска является задача, в которой один участник прячет объект, а другой распределяет ресуpсы так, чтобы его обнаружить. Ищущий заинтересован в минимизации времени обнаружения объекта, а прячущий старается это время максимизировать. Потому задачу поиска можно изучать как игру с нулевой суммой, в которой под значением игры понимается вероятность, с которой ищущий найдет спрятанный объект. Значительно меньшее число работ посвящено задачам патрулирования, которые актуальны при охране ценных коллекций музеев, художественных галлерей, банков и других объектов. Владельцы недвижимого имущества заинтересованы в том, чтобы маршруты охранников были оптимальны. Под охранником понимается ищущий игрок или патрулирующий, а прячущий выступает в роли

Гусев Василий Васильевич — аспирант; e-mail: gusev@krc.karelia.ru

Мазалов Владимир Викторович — доктор физико-математических наук, профессор, директор; e-mail: vmazalov@krc.karelia.ru

Gusev Vasily Vasilyevich — post-graduate student; e-mail: gusev@krc.karelia.ru

Mazalov Vladimir Viktorovich — doctor of physics and mathematics sciences, professor, director; e-mail: vmazalov@krc.karelia.ru

*) Работа частично поддержана РГНФ (проект № 15-02-00352) и Отделением математических наук РАН.

атакующего, который пытается причинить ущерб охраняемому объекту. В зависимости от действий и возможностей игроков можно получать различные вариации игры и отвечать на следующие вопросы:

1. При каком минимальном количестве патрулирующих выигрыш в игре равен 1?

2. Как изменятся маршруты патрулирующих, если на местности будут установлены камеры слежения, добавлены новые пути, расширены или уменьшены допустимые стратегии игроков (т. е. появление в игре дополнительных параметров)?

3. Как изменится выигрыш патрулирующего, если атакующий перестанет быть пассивным и окажет сопротивление?

Для решения таких задач удобно использовать методы теории игр. Наиболее близкой к данной работе является [3]. В ней найдено значение игры поиска для графа цикла, звезды, описаны частные случаи линейного графа. В статье [4] дается определение средней длины пути, а в [5] - некоторые ее оценки.

В настоящей работе получены точные выражения для стратегий игроков, которые не были найдены в [3], расширен класс решений игр патрулирования на линейном графе, установлено значение игры для графа, который является моделью жилого дома. Определена средняя длина пути патрулирующего игрока и доказана теорема, при помощи которой можно найти среднюю длину пути патрулирующего для некоторых видов графов.

2. Постановка задачи. Рассмотрим игру патрулирования О =< Р, А; Q; Ь1, Ь2; Н >, в которой Р - патрулирующий; А - атакующий; Q =<У,Е> - неориентированный связный граф, где V - множество вершин, E - множество ребер, п = \У\ -количество вершин в графе. Вершины графа Q будем обозначать ,] = 1, ...,п, запись = 0 означает, что не является вершиной. Две разные вершины графа могут соединяться только одним ребром, может существовать ребро вида (ок, ок). Заметим, что граф Q может быть несвязным. В примерах вершины графа обозначаются натуральными числами.

Множество стратегий патрулирующего Ь представляет пути патрулирования и = - - ... - окт, где Ш] = 1, ...,Т : е V, 1 < к < п,Т > 1; Ш = 1, ...,Т -1 : ,'кг+1) е Е. Элементы множества Ь2 стратегии атакующего, которые будем называть атаками, представим в виде 0 - ... - 0 - о - ... - о - 0 - ... - 0 Ь = 0, ...,Т - т,

Ь т

или более кратко л = (Ь, о), где Ь момент посещения вершины о.

Функцией выигрыша Н(и,л),и е Ь1,л е Ь2, является вероятность поимки атакующего игрока патрулирующим:

н м = (0, Ш3 = ],...,т: ок+ =о;

Если Н(и, л) = 1, то будем говорить, что путь и ловит атаку л.

Игру О =< Р, А; Q; ^1,^2; Н > для краткости запишем как О (^, Т, т), где т -время, которое необходимо атакующему для проведения атаки; Т - длина пути (т ^ Т). Нас будут интересовать в данной игре ситуация равновесия и значение игры.

Лемма 2.1. Путь и е Ь1 ловит не более т (Т - т +1) атак атакующего.

Доказательство. Рассмотрим путь и = ок1 -ок2 - ...-окТ. В первый момент времени патрулирующий находится в вершине ок1. В этом случае ловится одна атака ок1 - окг - ... - ок1 -0- ...-0. Затем патрулирующий переходит в вершину ок2. Теперь

ловятся две атаки ^ — ^ — ... — ^ — 0 — ... — 0, 0 — ^ — ^ — ... — ^ — 0 — ... — 0.

> ^ >

т т

Пусть патрулирующий находится в вершине ^ (£ < т или t > Т — т). Тогда ловятся I атак атакующего. Путь и ловит не более 1 + 2 + ... + (т — 1) + га + т + ... + т +

Т-2(т-1)

(т — 1) + ... + 2+1 атак, что равно т (Т — т +1). Когда Т = 2(т — 1), то и ловит не более 1 + 2+ ... + (т — 1) + (т — 1) + ... + 2 + 1 = 2(1 + 2 +... + (т — 1)) = т(т — 1) = т(Т — Т+т — 1) = т(Т — 2т + 2 + т — 1) = т(Т — т +1) атак. Когда Т < 2(т — 1), то и ловит не более 2(1 + 2+...+ (Т—т+1)) + (Т — т +1) + ... + (Т — т +1) = т(Т — т+1)

4-V-'

Т-2(Т-т+1)

атак. Во всех случаях получаем т(Т — т +1) пойманных атак, что и требовалось доказать.

Введем в рассмотрение смешанные стратегии игроков. Обозначим х = (х1, ...,Ж|^1|) и у = (у1, ...,у\$2\) - смешанные стратегии игроков Р и А соответственно, где х1 ^ 0, Е1=1 х1 = 1, уj ^ 0, ЕУ] = 1. Обозначим Н(и, у) = Е1=21 У] Н (u, ), H(x, = Е 1=1 х1Н (ui, w), H(x, У) = Е 1=1 Е ]=1 ХгУ] Н (и1, ).

Следствие 2.1. Пусть у - стратегия атакующего, при которой игрок выбирает атаки из множества ¿>2 с одинаковой вероятностью ах - стратегия патрулирующего, при которой игрок равновероятно выбирает пути из множества

— Ък2 — ... — Vкт № = 1,...,Т — т +1; У1, ] = Ь,...,Ь + т — 1; ук1 = , I = ]}. Тогда Н(и,у) < Н(х,у).

Доказательство. Стратегии игроков х, у подобраны так, что Н (х, у) = . Путь и ловит не более т{Т — т+1) атак (лемма 2.1), значит, Н(и,у) ^ = Н(х, у), что и требовалось доказать.

Обозначим А = шах Е 1=1 Н(и, и' - точка максимума. Чтобы оценить выигрыш игры сверху, докажем следующую лемму.

Лемма 2.2. Значение игры Н* ^

Доказательство. Пусть атакующий выбирает стратегии из 52 с вероятностью ущ. Обозначим эту стратегию как у. Тогда Н(и',у) = ущ. Поскольку и' - точка максимума, то Уи € ¿?1 Н(и,у) ^ Н(и',у) = ущ, т. е. тахН(х,у) = -^щ', Н* = тттахН(х,у) ^ т4-т.

У X |Л2\

3. Значение игры О^,Т, 1).

Теорема 3.1. В игре С(д,Т, 1) Н* = ± [7].

Доказательство. Пусть х - стратегия патрулирующего, при которой игрок выбирает пути из множества {ук — г^ — ... — Ук\к = 1,...,«.}, с вероятностью и у - стратегия атакующего, при которой игрок выбирает атаки из 52 с вероятностью -¿тр. Поскольку Н(х,т) = Н(и,у) = Н(х,у) = ^ для Уи € и) € 52, то стратегии х,у образуют ситуацию равновесия со значением игры Н(х,у) =

Пример 3.1. Пусть дан несвязный граф, который представлен в виде цикла из трех вершин и одной отдельной вершины. Рассмотрим игру О3,1). Составим платежную матрицу для путей и атак, которые выбираются с положительными вероятностями (табл. 1).

Патрулирующий выбирает свои пути с вероятностью ^ = 4, а атакующий -стратегии с вероятностью ^ = ¿ - Значение игры Н(х, у) = =

Таблица 1. Платежная матрица для путей и атак в игре 3,1),

которые выбираются с положительной вероятностью

о о о о CS о о СО о о Tf

о ^ о о CS о о СО о о Tf о

^ о о CS о о СО о о Tf о о

1 - 1 - 1 1 1 1 0 0 0 0 0 0 0 0 0

2 - 2 - 2 0 0 0 1 1 1 0 0 0 0 0 0

3 - 3 - 3 0 0 0 0 0 0 1 1 1 0 0 0

4 - 4 - 4 0 0 0 0 0 0 0 0 0 1 1 1

4. Значение игры G(Q,T,m) для цикла. Рассмотрим игру G(Cn,T,m), где Cn - цикл из n вершин.

Теорема 4.1. Обозначим = (k + 1,k + 2,..., n, 1, 2,..., k), k = 0,..., n — 1, -перестановку чисел 1, 2, 3,..., n; ak (j) - j-й элемент набора ak ■ Введем ak>, где k' > n — 1, ak> (j) = &k>moA n(j)■ Если патрулирующей выбирает пути из множества

Si = {vao{j) -vai(j) -va2{j) - - - Vr_l(j-)|3 = !> •••>«},

с вероятностью а атакующий - все стратегии из S2 с вероятностью n(--r_1m+1), то такой набор стратегий будет ситуацией равновесия со значением игры H* = min{f ,1}.

Доказательство. Пусть x - стратегия патрулирующего, при которой игрок выбирает пути из Si с вероятностью а у - стратегия атакующего, при которой игрок выбирает атаки из S2 с вероятностью п(т-т+1) • Для того чтобы х, у были ситуацией равновесия, достаточно доказать, что H(u, y) ^ H(x, y) ^ H(x, w) для Уп G Si, w G S2 (теорема 1.3 из [6]). Стратегии х, у подобраны так, что Н(х, у) = min{^, 1}. Если патрулирующий выберет путь u G Si, то по лемме 2.1 такой путь ловит не более т(Т — то + 1) атак. Тогда Н(и, у) ^ min{m(T — то + 1) • n(--r_1m+i), 1} = min{^S 1} =

H(x,y). Значит, неравенство H(u,y) ^ H(x,y) выполняется. Пути из Si подобраны так, что произвольная атака из S2 ловится то раз. Тогда H(x,w) = min{m • 1} = min{ —, 1} = H(x,y). Значит, неравенство Н{х,у) ^ H{x,w) выполняется.

Следствие 4.1. Для любого графа с гамильтоновым циклом, ситуация равновесия будет иметь вид, как для цикла■

Доказательство. Несмотря на то, что в цикле появились новые ребра, отклоняться от стратегий x, y из доказательства теоремы 4.1 игрокам не выгодно.

Пример 4.1. Рассмотрим игру G(Cq, 5, 3). Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 2).

Таблица 2. Платежная матрица для путей и атак в игре 0(06, 5, 3), которые выбираются с положительной вероятностью

о о о о CS о о СО о о Tf о о ю о о ю

о о CS CS о СО СО о Tf Tf о ю ю о ю ю

CS CS CS СО СО СО Tf Tf Tf ю ю ю ю ю ю

о CS CS о СО СО о Tf Tf О ю ю о ю ю о

^ о о CS о о СО о о Tf о О ю о о ю о о

1 - 2 - 3 - 4 - 5 1 0 0 1 1 0 1 1 1 0 1 1 0 0 1 0 0 0

2 - 3 -4- 5 - 6 0 0 0 1 0 0 1 1 0 1 1 1 0 1 1 0 0 1

3 - 4 -5- 6 - 1 0 0 1 0 0 0 1 0 0 1 1 0 1 1 1 0 1 1

4 - 5 -6- 1 - 2 0 1 1 0 0 1 0 0 0 1 0 0 1 1 0 1 1 1

5 - 6 - 1 - 2 - 3 1 1 1 0 1 1 0 0 1 0 0 0 1 0 0 1 1 0

6 - 1 -2- 3 - 4 1 1 0 1 1 1 0 1 1 0 0 1 0 0 0 1 0 0

Патрулирующий выбирает пути с вероятностью ^ = ■g, а атакующий - атаки с вероятностью n(-T_1m+1-) = ^ . Значение игры Н(х,у) = ^ = \ =

Если в графе Сб провести несколько ребер, соединяющих несоседние вершины, то полученный граф CQ содержит гамильтонов цикл. Для этого графа с новыми ребрами ситуация равновесия в игре G(CQ, 5, 3) будет такая же, что и для игры G(Cq, 5, 3).

5. Значение игры G(Q,T,m) для звезд. Рассмотрим игру G(Sn,T,m), где Sn - звезда, состоящая из n вершин, vi - внутренняя вершина.

Теорема 5.1. Пусть T ^ m + 1; ст0 = (1, 2,1, 3,..., 1,n) - упорядоченный набор чисел 2, 3,...,n и единиц. Пусть стк при 0 < k ^ 2(n — 1) — 1 получается из ст0 путем перемещения последних k чисел с конца в начало. Если k > 2(n — 1) — 1, то стк = CTk mod 2(n-i). Если патрулирующей выбирает пути из множества

Si = "Ко(j) — vvi(j) — v°2(j) — ... — v«t-i(j)\j = 1..., 2(n — , с вероятностью 2(n-i), а атакующий - атаки из множества

S2 = \vk — ... — vk — 0 — ... — 0,0 — vk — ... — vk — 0... — 0\k = 2, ...,i

с вероятностью 2(n-i) > mo maK°u набор стратегий будет ситуацией равновесия со значением игры Н* = min{ 2(n-i)>

Доказательство. Пусть x - стратегия патрулирующего, при которой игрок выбирает пути из Si с вероятностью 2(n-i) > а У ~ стратегия атакующего, при которой игрок выбирает атаки из S2 с вероятностью 2(h-i). Для того чтобы х, у были ситуацией равновесия, достаточно доказать, что H(u, y) ^ H(x, y) ^ H(x, w) для Vw G Si, w S2. Стратегии ж, у подобраны так, что Н(х, у) = min{ , 1} - Каждый

путь и* G Si ловит то атак из S2. Тогда Н(х, w) = min{то- 2{п-\), 1} = H(x, у). Значит, неравенство H(x, y) ^ H(x, w) выполняется. Пусть атакующий выбирает стратегию у. Если в пути u € Si патрулирующий не возвращается в крайние вершины, в которых он уже был, то H(и, у) = H(u*,y). Если в пути u патрулирующий посещает крайние вершины несколько раз, то H(u,y) ^ H(u*,y), потому что путь u ловит одинаковые атаки. Таким образом, Vu € Si H(u,y) ^ H(x,y). Патрулирующий всегда будет выбирать пути из Si только в том случае, когда количество атак атакующего будет не меньше количества путей патрулирующего, т. е. когда (n — 1)(T — m +1) ^ 2(n — 1). Слева в неравенстве от n отняли единицу, потому что на первую вершину атакующему нападать не выгодно. Получаем, что представленные стратегии игроков будут ситуацией равновесия только в случае, когда T ^ m +1.

Теорема 5.2. Пусть T = m. Обозначим ст0 = (2, 3, ...,n), ст0(j) - число, которое стоит на j -м месте. Введем ст'к, где 0 < k ^ n — 2, которая получается из ст0 путем перемещения k последних чисел с конца в начало. При k > n — 2 : ст'к = ст'кmod(n-1). Введем стк следующим образом: если k - нечетное, то стк(j) = 1 Vj; если k - четное,

то <Jk{j) = о~'к (j)Vj. Если патрулирующей выбирает пути из множества

2

S1 = Ko(j) — v^l(j) — v&2 (j) — ... — —v*T-l(j) \j = 1,...,n — ^ ,

с вероятностью а атакующий - атаки из множества = S2 \ уо\ — ... — v\

с вероятностью то такой набор стратегий будет ситуацией равновесия

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

["+11

со значением игры Н* = min{ > !}■

Доказательство. Пусть x - стратегия патрулирующего, при которой игрок выбирает пути из Si с вероятностью ^rj, а у - стратегия атакующего, при которой игрок выбирает атаки из S2 с вероятностью . Для того чтобы х, у были ситуацией равновесия, достаточно доказать, что H(u, y) ^ H(x,y) ^ H(x,w) Уп G Si, Уw G S2. Пусть атакующий выбирает стратегию у. Тогда патрулирующему нужно посетить как можно больше разных вершин. Чтобы этого достичь, сначала ему нужно начать патрулирование с вершины = vi, потом идти в vi, затем в другую вершину и т. д. Таким способом патрулирующий сможет поймать наибольшее количество атак атакующего. Следовательно, если он будет выбирать пути, получаемые другим способом, его выигрыш не увеличится, т. е. H(п,у) ^ H(x,y) для Уп G Si. В зависимости от четности Т пути патрулирующего будут ловить либо у атак при четном Т, либо + 1 атак при нечетном. Заменяем Гнати получаем, что патрулирующий ловит атак. Каждую атаку атакующий выбирает с вероятностью ^zj, тогда значение

игры Н(х,у) = min{ ^ п2_-}, 1}. Таким образом, для любой чистой стратегии атакую-

[m+lj

щего H(x,w) = ; значит, Н(х,у) ^ H(x,w). Следовательно, х,у — это ситуация

равновесия.

Заметим, что в работе [3] значение игры G(Sn,T,m) при T = m отличается от значения игры, найденного в теореме 5.2.

Пример 5.1. Пусть n = 5, m = 3, T = 5. Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 3).

Таблица 3. Платежная матрица для путей и атак в игре G(S5, 5, 3), которые выбираются с положительной вероятностью

о о о о о 0 0 0

о CS о СО о Tf 0 ю

CS CS СО СО Tf Tf Ю ю

CS CS СО СО Tf Tf ю ю

CS о СО о Tf 0 ю 0

1 - 5 - 1 - 4 - 1 0 0 0 0 0 1 1 1

2 - 1 - 5 - 1 - 4 1 0 0 0 0 0 1 1

1 - 2 - 1 - 5 - 1 1 1 0 0 0 0 0 1

3 - 1 - 2 - 1 - 5 1 1 1 0 0 0 0 0

1 - 3 - 1 - 2 - 1 0 1 1 1 0 0 0 0

4 - 1 - 3 - 1 - 2 0 0 1 1 1 0 0 0

1 - 4 - 1 - 3 - 1 0 0 0 1 1 1 0 0

5 - 1 - 4 - 1 - 3 0 0 0 0 1 1 1 0

Каждый столбец атакующий выбирает с вероятностью g, аналогично поступает патрулирующий. Значение игры будет составлять

Пример 5.2. Пусть T = m = 5, n = 5. Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 4).

Игроки выбирают свои стратегии с вероятностью j. Значение игры Н(х,у) =

[-тг]+(т mod 2) 3 n-i = 4'

Таблица 4■ Платежная матрица для путей и атак в игре 5, 5),

которые выбираются с положительной вероятностью

2-2-2-2-2 3-3-3-3-3 4-4-4-4-4 5-5-5-5-5

2-1-5-1-4 1 0 1 1

3-1-2-1-5 1 1 0 1

4-1-3-1-2 1 1 1 0

5-1-4-1-3 0 1 1 1

6. Значение игры СТ, т) для линейного графа. Рассмотрим линейный граф Ьп, состоящий из п вершин.

Теорема 6.1. Пусть то = 2, п - четное. Если патрулирующий выбирает пути из множества = {1—2 — 1— 2 — ..., 3 — 4 — 3 — 4 — ...,..., (п — 1) — п — (п — 1) — п— ...} с вероятностью а атакующий - все стратегии из Б2 с вероятностью та(г_1) г то выбранные стратегии будут ситуацией равновесия со значением игры Н* =

п

Доказательство. Пусть х - стратегия патрулирующего, при которой игрок выбирает пути из ¿>1 с вероятностью а у - стратегия атакующего, при которой игрок выбирает атаки из Б2 с вероятностью щ^-Ц- Для того чтобы х, у были ситуацией равновесия, достаточно доказать, что Н (и, у) ^ Н (х,у) ^ Н (х, ад) У и € Б\, ад € 52, где Н(х, у) = Для Уии € 52 Н(х, го) = 1 • т. е. неравенство Н(х, у) ^ Н(х, го) выполняется. Стратегии х,у удовлетворяют условиям следствия 2.1, значит, Н(и, у) ^ Н(х, у).

Пример 6.1. Рассмотрим игру С(Ьц, 5, 2). Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 5).

Таблица 5■ Платежная матрица для путей и атак в игре 0(Ь6, 5, 2), которые выбираются с положительной вероятностью

о о о о о о о о о СО о о о о о о ю о о о со

о о ^ о о (М о о СО СО о о о о ю ю о о со со

о 1-н ■-и о о (М (М о о СО СО о о о о ю ю о о СО со о

^ ^ О о (М (М о о СО СО о о тг о о ю ю о о СО со о о

^ О О о (М о о о СО о о о о о о ю о о о СО о о о

1 - 2 - 1 - 2 - 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

3 - 4 - 3 - 4 - 3 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0

5 - 6 - 5 - 6 - 5 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1

Патрулирующий выбирает пути с вероятностью ^ = ^, атакующий - свои стратегии с вероятностью п(-т_1т+1-) = Значение игры Н(х,у) = ^ =

Теорема 6.2. Пусть п - нечетное и т = 22. Если патрулирующий выбирает пути из множества

Ж = {1 -2 -3-2 -1 -..., 3 -2-1 -2-3-..., 4-5-4-5-..., (п-1) -п- (п-1) -п-...}

2

с вероятностью ^—, а атакующий - атаки из множества

чением игры Н(х,у) =

52 = {ги - г и - 0 - ... - 0\к =1, 3, 5,...,п} ,

п+1'

с вероятностью тггг, то выбранные стратегии будут ситуацией равновесия со зна-

Доказательство. Отметим, что в стратегии патрулирующего первые два пути содержат три вершины, а во всех остальных по две вершины. Пусть х - стратегия патрулирующего, при которой игрок выбирает пути из ¿>1 с вероятностью а у - стратегия атакующего, при которой игрок выбирает атаки из Я2 с вероятностью • В этом случае Н(х, у) = • Для того чтобы ж, у были ситуацией равновесия, достаточно доказать, что Н (и, у) ^ Н (х,у) ^ Н (х, л) У и € $1, У л € $2. Любая атака из в2 ловится минимум один раз путями из множества . Значит, для У и) € ¿?2 Н(х,т) ^ 1 • = Н(х,у). Пусть атакующий выбирает атаки из Б2 равновероятно. Предположим, что патрулирующий выбирает путь, на котором он ловит не менее двух атак. Такое может быть только в случае, если существует путь вида ъ2к+1 — — 0 — ... — 0, к = 0,..., что невозможно. Значит, Н(и,у) ^ Н(х,у).

Пример 6.2. Рассмотрим игру 0(Ь7, 5, 2). Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 6).

Таблица 6. Платежная матрица для путей и атак в игре 0(Ь7, 5, 2), которые выбираются с положительной вероятностью

1-1-0-0-0 3-3-0-0-0 5-5-0-0-0 7-7-0-0-0

1-2-3-2-1 1 0 0 0

3-2-1-2-3 0 1 0 0

4-5-4-5-4 0 0 1 0

6-7-6-7-6 0 0 0 1

Игроки выбирают свои стратегии с вероятностями = ^ . Значение игры будет равно Н(х,у) = =

Теорема 6.3. Если Т + п < 2т, то Н* = 1.

Доказательство. Для того чтобы получить такой выигрыш, рассмотрим стратегию патрулирующего следующего вида:

1) выписывается маршрут, который проходит по всем вершинам графа от первой до последней 1 — 2 — ... — п;

2) если длина такого маршрута меньше, чем Т, то поочередно с обеих сторон маршрута добавляем соседние вершины. Продолжаем до тех пор, пока длина пути не станет равна Т.

Патрулирующий всегда будет ловить атакующего, если в пути патрулирующего содержится маршрут 1 — 2 — ... — п. Это возможно, если длина атаки будет не меньше, чем п + • Получаем неравенство то ^ п + • Если Т — п - четное, то

[т~2+1] = Х^2п-, гп > п + т + п < 2т. Если Т -п - нечетное, то [Т~2+1] =

нечетное, то

, ТП ТЪ 2 ~' I ' ^ I -1- / | ^ ^мк.

Например, для игры 0(Ьц, 9, 8) будем иметь

1) 1 — 2 — 3 — 4 — 5 — 6;

2) 2 — 1 — 2 — 3 — 4 — 5 — 6, 2 — 1 — 2 — 3 — 4 — 5 — 6 — 5; и* = 3 — 2 — 1 — 2 — 3 — 4 — 5 — 6 — 5.

Для пути и* Н (и*, л) = 1 У л € $2.

Теорема 6.4. Пусть т = п — 1, Т < т + п — 2. Патрулирующей выбирает пути из множества ¿>1 = {(п — 1) — (п — 2) — 2 — 1 — 2 — ..., 2 — 3 — ... — (п — 1) — п— (п — 1)} с вероятностью ^ каждый путь, атакующий - атаки из множества

$2 = {1 —... — 1 — о — ... — 0,..., 0 — ... — 0 — 1 — ... — 1,

п — ... — п — 0 — ... — 0,.... 0 — ... — 0 — п — ... — п}

' у ' >

т т

с вероятностью 2(т-т+1) ■ Выбранные стратегии являются ситуацией равновесия со значением игры Н(х, у) =

Доказательство. Пусть х - стратегия патрулирующего, при которой игрок выбирает пути из ^ с вероятностью а у - стратегия атакующего, при которой игрок выбирает атаки из Б2 с вероятностью 2(т-т+1) • Для Т0Г0 чтобы х,у были ситуацией равновесия, достаточно доказать, что Н(и, у) ^ Н(х,у) ^ Н(х, ад), где Н(х,у) = Пути патрулирующего подобраны так, что любую атаку из Б2 ловит либо первый путь, либо второй, значит, Н(х,т) = ^ = Н(х,у). Любой путь из ¿>1 ловит Т — то+1 атак из множества в2. Поскольку атакующий выбирает свои стратегии равновероятно, то патрулирующий будет отклоняться только тогда, когда существует путь, который ловит не менее Т — тп + 2 атак из в2. Покажем, что такого пути нет. Чтобы поймать все атаки атакующего на первую вершину, патрулирующий должен в Т —т +1 момент времени находиться в первой вершине и тогда он поймает Т — то + 1 атак из в2. Чтобы поймать еще хотя бы одну атаку на последнюю вершину, ему нужно еще пройти п — 1 вершин. И тогда общая длина пройденного пути будет составлять Т — т + 1 + п — 1 = Т +1. Но длина пути не может превышать Т. Если патрулирующий выбирает идти в первую вершину в момент времени (Т — т +1) — 1, то будут ловиться Т — т атак. Патрулирующему еще нужно поймать две атаки. Чтобы дойти до крайней вершины, нужно еще пройти п — 1 вершин и тогда патрулирующий будет находиться в момент времени (Т — т +1) — 1 + п — 1 = Т. Но в момент времени Т патрулирующий может поймать только одну атаку вида 0 — ... — 0 — п — ... — п, но ни как не две. Если патрулирующий будет находиться в первой вершине в момент времени (Т — т +1) — к, то ему надо будет поймать еще к атак, но ловится только к — 1. Следовательно, патрулирующий никак не может поймать Т — т + 1 атак, значит, отклоняться от х не выгодно, т. е. Н(и, у) ^ Н(х,у).

Пример 6.3. Рассмотрим игру 0(Ьц, 8, 5). Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 7).

Таблица 7. Платежная матрица для путей и атак в игре 0(Ь6, 8, 5), которые выбираются с положительной вероятностью

о о о о о о СО

о о о о СО СО

о 1-н ■-и ■-и о со СО СО

^ СО СО СО СО

^ ^ со СО СО СО

г-Ч г-Ч г-Ч О со СО СО О

1-н 1-н О О СО СО О О

^ О О о СО О О О

5 - 4 - 3 - 2 - 1 - 2 - 3 - 4 1 1 1 1 0 0 0 0

2 - 3 - 4 - 5 - 6 - 5 - 4 - 3 0 0 0 0 1 1 1 1

Патрулирующий выбирает свои пути с вероятностью ^, а атакующий - свои стратегии с вероятностью ^ . Значение игры Н(х,у) = ^.

Пусть < множества путей, которые выбирает патрулирующий в игре &(С2(п-1), Т, т). Перенумеруем пути из этого множества <5 = {и>1,и2, ...,41*}.

Теорема 6.5. Пусть т = п, Т < т + п — 2. Если патрулирующей выбирает

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

пути из .множества Б1 = {п1,п2,..., пт—т+1,пп,ип+1, ...,ип+т—т} с вероятностью 2(т-т+1) > а атакующий - атаки из множества

3?2 = {1 -... - 1 - о - ... - о, ...,о- ... - о - 1 -... -1,

4-V-' 4-V-'

тт

п — ... — п — 0 — ... — 0,..., 0 — ... — 0 — п — ... — пТ

тт

с вероятностью 2(т-т+1)' то выбранные стратегии являются ситуацией равновесия со значением игры Н* = 1) ■

Доказательство. Поскольку патрулирующий выбирает пути из условия теоремы равновероятно, то атакующий будет отклоняться только в том случае, если существует такая атака, которая ловится меньше раз, чем атаки на крайние вершины. Но поскольку пути из условия теоремы записываются по циклу, т. е. сначала путь идет из некоторой вершины, потом до крайней вершины графа, а затем до другой крайней и т. д., то наименьшее количество пойманных атак будет только в крайних вершинах, потому что патрулирующий проходит внутренние вершины минимум 1 раз. Получаем, что если атакующий выбирает атаковать не крайние вершины, то он проигрывает больше. Поскольку атакующий выбирает свои стратегии равновероятно, то патрулирующий будет отклоняться только в том случае, если существует путь, который ловит больше, чем Т — т + 2 атак. Покажем, что такого пути нет. Чтобы поймать все атаки атакующего на первую вершину, патрулирующий должен в Т — т +1 момент времени находиться в первой вершине. Чтобы поймать еще хотя бы одну атаку на последнюю вершину, ему нужно еще пройти п — 1 вершину. И тогда общая длина пути будет составлять Т — т +1 + п — 1 = Т. Но в момент времени Т патрулирующий может поймать только одну атаку вида 0 — ... — 0 — п — ... — п, и тогда общее количество пойманных атак будет равно Т — т + 2, но никак не больше. Если патрулирующий будет находиться в первой вершине в момент времени (Т — т + 1) — к, то ему надо будет поймать еще к атак, но ловится всегда лишь только к — 1. Следовательно, патрулирующий ни как не может поймать более Т — т + 2 атак, а значит, отклоняться от выбранных путей не выгодно.

Пример 6.4. Рассмотрим игру С(Ь6, 7, 6). Запишем оптимальные пути для цикла, которые получаются из линейного графа (табл. 8).

Оставляем первые Т — т +1 от начала и от середины. Получим решение игры (табл. 9).

Патрулирующий и атакующий выбирают свои стратегии с вероятностью ^ , а значение игры составляет Н(х, у) = 2(^-^1+1) = I-

Теорема 6.6. Пусть Т ^ т + п — 2 (т = 2). Обозначим сто = (1, 2,...,п,п — 1,п — 2,..., 2) - упорядоченный набор чисел 1, 2, 3,..., п. Введем сти, которое получается из ст0 путем перемещения к последних чисел с конца вперед; сти(з) - з-й элемент к-го набора. Если к > 2(п — 1) — 1, то сти(з) = стк той 2(п—1)(з). Если патрулирующей выбирает пути из множества Б\ = {г^оу) — ^у) — ••• — ъ<тТ-1{з)\з = 1' •••,«-} , с вероятностью 2(п-1)> а атакующий - атаки с вероятностью 2(п-1) из множества Бкоторое состоит из первых п — 1 атак на крайние вершины, то такой набор стратегий будет ситуацией равновесия со значением игры Н* = ■

Доказательство. Пусть х,у - стратегии игроков, когда патрулирующий и атакующий выбирают пути и атаки из множеств Б\, Б2 с вероятностью 2(п-1)

Таблица 8. Вспомогательная платежная матрица для решения игры 0(Ь6,7, 6)

о о со

СО со

г-Ч Г-Ч со со

^ ^ со со

г-Ч Г-Ч со со

^ со со

^ о со о

1 - 2 - 3 - 4 - 5 - 6 - 5 1 0 1 1

2 - 1 - 2 - 3 - 4 - 5 - 6 1 1 0 1

3 - 2 - 1 - 2 - 3 - 4 - 5 1 1 0 0

4 - 3 - 2 - 1 - 2 - 3 - 4 1 1 0 0

5 -4- 3 - 2 - 1 - 2 - 3 1 1 0 0

6 -5- 4 - 3 - 2 - 1 - 2 1 1 1 0

5 -6- 5 - 4 - 3 - 2 - 1 0 1 1 1

4 -5- 6 - 5 - 4 - 3 - 2 0 0 1 1

3 -4- 5 - 6 - 5 - 4 - 3 0 0 1 1

2 - 3 - 4 - 5 - 6 - 5 - 4 0 0 1 1

Таблица 9. Платежная матрица для путей и атак в игре 0(Ь6, 7, 6), которые выбираются с положительной вероятностью

о о СО

СО СО

г-Ч г-Ч СО СО

^ ^ СО СО

г-Ч г-Ч СО СО

^ СО СО

^ О СО О

1 - 2 - 3 -4- 5 - 6 - 5 1 0 1 1

2 - 1 - 2 - 3 - 4 - 5 - 6 1 1 0 1

6 - 5 - 4 - 3 - 2 - 1 - 2 1 1 1 0

5 - 6 - 5 -4- 3 - 2 - 1 0 1 1 1

соответственно. Тогда Н{х,у) = 2{™-\) • Поскольку патрулирующий выбирает свои пути равновероятно, то атакующий будет отклоняться только в том случае, если существует такая атака, которая ловится меньше раз, чем атаки на крайние вершины. Но поскольку пути патрулирующего подобраны так, что он бывает в промежуточных вершинах чаще, чем в крайних, то атак на некрайние вершины ловится больше, чем на крайние. Следовательно, если атакующий отклоняется от у, то его проигрыш увеличивается. Поскольку атакующий выбирает свои атаки равновероятно, то патрулирующий будет отклоняться от х в пользу такого пути, который ловит больше атак, чем т. Чтобы поймать наибольшее количество атак, патрулирующему нужно начать движение с какой-либо вершины, дойти сначала до крайней вершины, потом до другой и т. д. В путях из патрулирующий так поступает и ловит только т атак. Следовательно, если он будет отклоняться, то пойманное количество атак не увеличится, а значит, отклоняться от стратегии х не выгодно.

Заметим, что область значений, в которой теорема 6.6 верна (Т ^ т + п — 2), отличается от области значений, найденных в [3] (п ^ т + 1).

Пример 6.5. Рассмотрим игру 0(Ь%, 7, 3). Составим платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 10).

Патрулирующий и атакующий будут соответственно выбирать строки и столбцы с вероятностью ^. Выигрыш патрулирующего составит Н* = |.

Когда находим значение игры в линейном графе, то не всегда игроки выбирают свои стратегии соответственно равновероятно. Рассмотрим игру 0(Ь%, 5, 3). Запишем платежную матрицу для путей и атак, которые выбираются с положительной вероятностью (табл. 11). Значение игры в таком случае составит Н(х,у) =

7. Игра Т, т) для модели жилого дома. Рассмотрим игру на графе, который является моделью жилого дома. Пусть имеется к этажей и 21 квартир на каждом этаже. Лестница, соединяющая этажи, проходит по середине дома. Слева и справа от нее по I квартир. Дом имеет один подъезд. Патрулирующий входит в дом и может начать патрулирование с любой квартиры, которая ближе всего к лестнице. При к = 3, I = 4 будем иметь граф, изображенный на рисунке.

Патрулирующий может начать свой маршрут с 4, 5,12,13, 20, 21 вершины. Будем считать, что по лестнице патрулирующий перемещается быстро.

Таблица 10. Платежная матрица для путей и атак в игре 0(Ь5, 7, 3), которые выбираются с положительной вероятностью

о о о о о о о о

о о о о о о ю

о о 1-н о о ю ю

о ^ ^ ^ о ю ю ю

1-н 1-н О ю ю ю о

^ О О ю ю о о

^ О О О ю о о о

1 - 2 - 3 - 4 - 5 - 4 - 3 1 0 0 0 0 0 1 1

2 - 1 - 2 - 3 - 4 - 5 - 4 1 1 0 0 0 0 0 1

3 - 2 - 1 - 2 - 3 - 4 - 5 1 1 1 0 0 0 0 0

4 - 3 - 2 - 1 - 2 - 3 - 4 0 1 1 1 0 0 0 0

5 - 4 - 3 - 2 - 1 - 2 - 3 0 0 1 1 1 0 0 0

4 - 5 - 4 - 3 - 2 - 1 - 2 0 0 0 1 1 1 0 0

3 - 4 - 5 - 4 - 3 - 2 - 1 0 0 0 0 1 1 1 0

2 - 3 - 4 - 5 - 4 - 3 - 2 0 0 0 0 0 1 1 1

Таблица 11. Платежная матрица для путей и атак в игре 0(Ь5, 5, 3), которые выбираются с положительной вероятностью

о о о о о ю

о ^ СО о ю ю

гН гН гН СО ю ю ю X

1-н 1-н О СО ю ю о

^ О о о ю о о

1 -2- 3 - 4 - 5 1 0 0 1 0 0 1 1/7

3 -2- 1 - 2 - 3 1 1 1 0 0 0 0 2/7

4 - 3 - 2 - 1 - 2 0 1 1 1 0 0 0 1/7

4 - 5 - 4 - 3 - 2 0 0 0 1 1 1 0 1/7

3 - 4 - 5 - 4 - 3 0 0 0 0 1 1 1 2/7

У 1/7 1/7 1/7 1/7 1/7 1/7 1/7

стюсю&о"

Граф ( при к = 3, I =4

Посчитаем Н(х,у) в зависимости от к,1,т,Т. Рассмотрим следующие случаи:

1) Ук, УТ, т < / или Т < / : Н* = 0. Когда атакующий выберет атаку на любую крайнюю вершину, начиная с первого момента времени, то патрулирующему не хватит времени, чтобы дойти до крайней вершины, поэтому Н(х, у) = 0;

2) т = Т = / + (2к — 1)(2/ — 1) : Н* = 1. Патрулирующий обходит все вершины графа за указанное время и обязательно поймает атакующего, потому что Т = т;

3) то = Т = I : Н* = Патрулирующий выбирает путь, который начинается в вершине, которая ближе всего к лестнице и идет в ближайшую крайнюю вершину. Каждый путь выбирается с вероятностью тщ • Атакующий выбирает атаки на крайние вершины с вероятностью

4) оценим выигрыш, когда т = / - четное, Т = 2к/ + (2к — 1)(/ — 1),к ^ 1. Чтобы сделать оценку, воспользуемся леммой 2.2. Для этого посчитаем количество атак А, которые ловит один из наилучших путей патрулирующего. Чтобы составить наилучший путь патрулирулирующего, надо не возвращаться в вершины, в которых уже были. Тогда

А={2к — 1)(/ + (/ - 1) + ... + (/ - 1- + 1) + (/ - 1- + 1) + ... + / + I2) = (2к — 1)(7/2 + 2/) (2к — 1)(7/ + 2)

Н * <

4п(Т — т + 1) 16к(2к/ — к — / +1)'

8. Средняя длина пути патрулирующего. Длина пути патрулирующего определяется моментом поимки атакующего либо равна Т, если поимки не произошло. Среднюю длину пути будем обозначать ц:

I 1^2 |

м = х уз,

г=1 з = 1

где |51|, |52| - количество путей и атак в ситуации равновесия для игры 0^,Т,т) соответственно; Т - сумма длин ребер, по которым прошел патрулирующий до встречи с атакующим, 0 ^ Т ^ Т — 1; хг - вероятность выбора г-го пути; у^ - вероятность выбора '-й атаки.

Пример 8.1. Запишем ситуацию равновесия в игре С(С4, 4,1) (табл. 12). Каждый путь выбирается с вероятностью ^ = |, а атака - ^ = ^ .

Таблица 12. Длина пути патрулирующего в игре 0(С4,4,1)

о о о ^ о о о о о о СО о о о ^

о о 1-н о о о о о о СО о о о ^ о

о ^ О о о (М о о о СО о о о ^ о о

^ о о о (М о о о СО о о о ^ о о о

1 - 1 - 1 - 1 0 1 2 3 3 3 3 3 3 3 3 3 3 3 3 3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 - 2 - 2 - 2 3 3 3 3 0 1 2 3 3 3 3 3 3 3 3 3

3 - 3 - 3 - 3 3 3 3 3 3 3 3 3 0 1 2 3 3 3 3 3

4 - 4 - 4 - 4 3 3 3 3 3 3 3 3 3 3 3 3 3 0 1 2

Посчитаем /х, /х = 3(3 - 3- 4+1+2 + 3) • | • ^ = 2.625. В общем виде будем иметь м = п{Т . (п _ 1) . (Т _ 1) + 1 + 2 + ... + Т - 1) - 1 - ^ = (Т - 1)(1 - X).

Пусть Сп - цикл из п вершин. Поскольку в ситуации равновесия патрулирующий и атакующий выбирают свои стратегии с одинаковыми вероятностями соответственно, то можно посчитать общую длину пути, которая получается в строке. Общее количество атак, которые выбирает атакующий, равно п(Т — т +1), а ловится патрулирующим т(Т — т + 1) атак. Значит, количество непойманных атак равно (п — т)(Т — т + 1). Длина пути для непойманных атак равна Т — 1, тогда

патрулирующий пройдет расстояние (п — т)(Т — т + 1)(Т — 1). Посчитаем сумму длин для пойманных атак. Это есть сумма произведений количества атак на длину пути, который прошел патрулирующий до встречи с атакующим. Обозначим это количество буквой А = 1 • 2 + 2 • 3 + ... + (т — 2)(т — 1) + 1(Т — 1) + 2(Т — 2) + ... +(т — 1)(Т — (т — 1)) + т((т — 1) + ... + т — 1 + Т — 2(т — 1) — 1); А = 1-) (Т — то + 1). Теперь можно подсчитать значение ц = ■ п(т-т+1) ' п х

Пример 8.2. Запишем ситуацию равновесия для игры С(С5, 5, 3) (табл. 13). На пересечении строк и столбцов приведем длину пройденного пути патрулирующего до встречи с атакующим. Тогда

(Г - 1)(2п - щ) = (5 - 1)(2 • 5 - 3) = М 2п 2-5

Несмотря на то, что длина пути патрулирующего равна 5, в среднем он проходит 2.8. Таблица 13. Длина пути патрулирующего в игре 0{С5, 5, 3)

о о о о о о СО о о о о ю

о о о СО СО о тг тг о ю ю

.-и .-и 1-н СО СО СО ТГ тг тг ю ю ю

О о СО СО о тг о ю ю о

^ О О о о СО о о ТГ о о ю о о

1 - 2 - 3 - 4 - 5 0 4 4 1 1 4 2 2 2 4 3 3 4 4 4

2 - 3 - 4 - 5 - 1 4 4 4 0 4 4 1 1 4 2 2 2 4 3 3

3 -4- 5 - 1 - 2 4 3 3 4 4 4 0 4 4 1 1 4 2 2 2

4 -5- 1 - 2 - 3 2 2 2 4 3 3 4 4 4 0 4 4 1 1 4

5 - 1 - 2 - 3 - 4 1 1 4 2 2 2 4 3 3 4 4 4 0 4 4

Как можно заметить, для игр С((, Т, 1) и 0(Сп, Т, т) средняя длина пути равна ¡л = (Т — 1) (1 — у) , где V - значение игры С.

Теорема 8.1. Пусть в ситуации равновесия в игре С((,Т,т) атакующей выбирает всевозможные атаки, а в оптимальных путях патрулирующего в каждый момент времени £ каждая вершина встречается один раз. В таком случае М=(Т- 1)(1-£).

Доказательство. Покажем, что при условиях теоремы игроки в ситуации равновесия для игры 0(,Т, т) будут выбирать свои стратегии равновероятно. Поскольку в равновесии в путях патрулирующего каждая вершина встречается один раз, то количество единиц в каждом столбце одинаковое. Поскольку атакующий перебирает всевозможные атаки, а в путях патрулирующего в каждый момент времени присутствует каждая вершина из N, то количество единиц в строке для каждого пути одинаковое. Следовательно, игроки для любой своей чистой стратегии имеют одинаковый выигрыш и проигрыш соответственно, таким образом, атакующий и патрулирующий выбирают свои стратегии равновероятно. Тогда это означает, что значение игры

1^2 | 1'

где А - количество единиц в строке платежной матрицы из ситуации равновесия игры 0(,Т, т); В - количество единиц в столбце платежной матрицы из ситуации равновесия игры С((, Т, т).

Количество единиц в каждом столбце равно т, т. е. В = т. Тогда упрощается формула для нахождения м

I £11 I £21 1 1 I £1 I £21

г=13=1 г=1з=1

Значение м запишем по формуле

1 1 | £1 | | £2 | 1 1 |

11 т-т ( \ 1 1 = _._.„. ^ ^+(<.+ 1) + .„ + (д+В-^ + _._.<Г_1)(|в1|-В)|в,|.

Первое слагаемое - это среднее значение для пойманных атак, а второе - для непойманных. Упрощая, получаем, что

1 1 Т-т / В - 1 \

»=ЪЛ-ЪЛ-п-У, [аВ+—-В)+(Т-1)(1-У) =

=0

_ п ■ f • (Т - то + 1 ){Т - то + В - 1)

= +

+ (т - l)(V - 1) = |(Т - 1) + (Т - 1)(1 -V) = (T- 1) (1 - |

9. Заключение. Большая часть статьи посвящена нахождению ситуации равновесия. Рассмотрены основные виды графов: цикл, звезда и линейный граф. Сложность нахождения равновесия в рассматриваемой игре заключается в том, что для разных видов графов получаются разные решения, которые не всегда удается записать аналитически в общем виде. Число путей патрулирующего при большом количестве вершин графа велико, что также затрудняет нахождение оптимальных стратегий игроков. Однако, используя доказанные в статье утверждения, можно оценивать вероятность поимки атакующего, что может быть полезно в практических задачах.

Литература

1. Garnaev A. Search games and other applications of game theory. Lecture Notes in Economics and Mathematical Systems. Budapest: Springer, 2000. Vol. 485. 153 p.

2. Alpern S., Gal S. The theory of search games and rendezvous. Boston: Kluwer Academic Publ., 2003. 319 p.

3. Alpern S., Morton A., Papadaki K. Optimizing randomized patrols // Operational Research Group. 2009. P. 392-419.

4. Gal S. On the Optimality of a Simple Strategy for Searching Graphs // Intern. Jornal of Game Theory. 2001. Vol. 29. P. 533-542.

5. Alpern S., Baston V., Gal S. Network Search Games With Immobile Hider, Without a Designated Searcher Starting Point. London: Centre for Discrete and Applicable Mathematics, 2006-03. 16 p.

6. Мазалов В. В. Математическая теория игр и приложения: учеб. пособие. СПб.: Изд-во «Лань», 2010. 448 с.

7. Воробьев Н. Н. Теория игр для экономистов-кибернетиков. Л.: Изд-во Ленингр. ун-та, 1974. 160 с.

References

1. Garnaev A. Search games and other applications of game theory. Lecture Notes in Economics and Mathematical Systems. Budapest, Springer Publ., 2000, vol. 485, 153 p.

2. Alpern S., Gal S. The theory of search games and rendezvous. Boston, Kluwer Academic Publ., 2003, 319 p.

3. Alpern S., Morton A., Papadaki K. Optimizing randomized patrols. Operational Research Group, 2009, pp. 392-419.

4. Gal S. On the Optimality of a Simple Strategy for Searching Graphs. Intern. Journal of Game Theory, 2001, vol. 29, pp. 533-542.

5. Alpern S., Baston V., Gal S. Network Search Games With Immobile Hider, Without a Designated Searcher Starting Point. London, Centre for Discrete and Applicable Mathematics, 2006-03, 16 p.

6. Mazalov V. V. Matematicheskaja teorija igr i prilozhenija: ucheb. posobie [Mathematical theory of games and applications: a tutorial]. St. Petersdurg, "Lan" Publ., 2010, 448 p. (in Russ.)

7. Vorobjov N. N. Teorija igr dlja jekonomistov-kibernetikov [Theory of games for economists-cyberneticists]. Leningrad, Leningr. State University Press, 1974, 160 p. (in Russ.)

Статья рекомендована к печати проф. Л. А. Петросяном. Статья поступила в редакцию 17 февраля 2015 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.