Научная статья на тему 'Зоны безопасности в играх с линией жизни'

Зоны безопасности в играх с линией жизни Текст научной статьи по специальности «Математика»

CC BY
75
33
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Михеев С. Е.

Два игрока-точки E и P в конечномерном нормированном пространстве B с выпуклыми вектограммами V ⊂ U ⊂ B имеют антагонистические цели: E стремится достичь произвольной точки некоторого множества l, называемого линией жизни, до момента поимки, а P — не допустить этого. Поимка — это E(t)= P (t). Значений целевой функции у каждого из игроков всего два: проигрыш и выигрыш. Ключевой в анализе игры является зона безопасности A(t). Для произвольных начальных позиций P (t) и E(t) она определяется как множество точек, прямолинейно достижимых игроком E ранее игрока P. Когда l ∩ A(0) = ∅, игрок E всегда имеет выигрыш на некоторой прямолинейной стратегии. В противном случае принципиально сжатие зон безопасности t2 > t1 ⇒ A(t2 ) ⊂ A(t1 ). Показано, что стратегия игрока P, обеспечивающая при любом поведении игрока E сжатие зон безопасности, гарантирует поимку в замыкании A(0). В случае строгой выпуклости вектограммы U этой сжимающей стратегий (когда она существует) может быть только перехват. Когда зона безопасности невыпукла, U строго выпукла, существуют такие линии жизни l ∩ A(0) = ∅, которые достижимы игроком E обманным маневром. Существуют невыпуклые зоны безопасности. В случае нестрогой выпуклости U игрок P может иметь отличную от перехвата сжимающую стратегию, перехват при этом может и не обеспечить сжатия. В общем случае вектограмм U, V игрок E в некоторых позициях может выбирать движение, нарушающее сжимаемость при любых стратегиях игрока P.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Safety Zones in Differential Games

Two player-points P and E in the normed space B with convex vectogrammes V ⊂ U ⊂ B haveantogonistic goals: E to reach a point of some set l named ‘life line’ before capture, P to prevent it.Capture is P (t) = E(t). Each goal function for the players has only two values ‘winning’ and ‘loss’.The key for game analysis is safety zone A(t). For arbitrary initial positions P (t), E(t) it is the pointset reached rectilinearly by E earlier than P. When l ∩ A(0) = ∅, player E has always winning using some rectilinear strategy. Otherwise the shrinkage of safety zones t2 > t1 ⇒ A(t2 ) ⊂ A(t1 ) is of principal importance. It is shown that P ’s stategy providing the shrinkage for every E’s strategy alsoprovides the capture in closure of A(0). When the vectogramme U is strictly convex the shrinking strategy may be, if exists, only intercept. When A(0) is not convex and U is strictly convex there are life lines l ∩ A(0) = ∅, which can be reached by E fraudulently. Non convex safety zones exist. If U is non-strictly convex, P may have different from intercept shrinking strategy and the intercept in the case may not shrink. In the general case of U, V player E in some positions can choose movement violating the shrinkage under every strategy of P.

Текст научной работы на тему «Зоны безопасности в играх с линией жизни»

УДК 518.9 С. Е. Михеев

Вестник СПбГУ. Сер. 1, 2003, вып. 3 (№17)

ЗОНЫ БЕЗОПАСНОСТИ В ИГРАХ С ЛИНИЕЙ ЖИЗНИ

В статье будут рассмотрены следующие дифференциальные игры. В нормированном конечномерном пространстве В два игрока-точки Преследователь Р и Убегающий Е вольны выбирать в каждый момент времени £ > 0 направление и скорость своего движения:

такими, чтобы получаемые вектор-функции были измеримы по Лебегу. Конец игры — поимка (захват) — это совпадение в некоторый момент T > 0 игроков-точек: P(T) = E(T). Множества U, V, именуемые обычно вектограммами, замкнуты, ограничены, выпуклы.

Вектограмма V в общем случае может принадлежать некоторым линейным многообразиям M = B. Их пересечение Me называется аффинной оболочкой множества V. Вырожденный случай, когда размерность m = dim Me равна нулю, не представляет интереса, а если m > 1, то в V есть внутренние относительно Me точки. Для удобства изложения примем 0-соглашение: поместим нулевой вектор в одну такую внутреннюю точку vo, т. е. U := U — vo, V := V — vo. (Это соответствует «параллельной» игре в движущемся пространстве, элементы которого x' связаны с элементами x неподвижного пространства формулой x' = x — vot, t > 0.) Если после такого преобразования найдется линейное подпространство L С B, L DU и L = B, то мы будем рассматривать игру в L с теми же вектограммами.

В частном случае вV = U (в > 1) игроков предложено называть однотипными объектами [5]. Когда вектограммы V, U у однотипных объектов еще и центрально симметричны относительно нуля, они могут быть описаны с помощью некоторой нормы, которую будем полагать совпадающей с исходной. Тогда вектограммы можно описать так:

Выигрыш в игре определим следующим образом. Если игрок Е успевает до поимки достичь множества, называемого линией жизни I, то он выигрывает, Р — проигрывает. Если Р успевает осуществить поимку до того как Е достигнет I, то выигрывает Р, Е — проигрывает. Одновременный выход на линию жизни Р и Е будем считать выигрышем для Р и проигрышем для Е. (Можно было бы ввести «ничью», но никакой особой глубины в таком расширении нет, а выкладки становятся более громоздкими.) Время поимки в игре с линией жизни не имеет никакого значения, функция выигрыша имеет всего лишь два значения: «выигрыш Е — проигрыш Р», «выигрыш Р — проигрыш Е». Игра является антагонистической.

Как и в играх с линией жизни в евклидовых пространствах (||ж|| = а/ж • ж), в нормированных (с неевклидовыми нормами) пространствах ключевой для анализа является зона безопасности. В [1] под ней понимается «множество точек А-±, которых Е может достичь, не будучи пойманным Р, независимо от действий последнего».

© С. Е. Михеев, 2003

P eU, E eV, VcUc B, dU^V =

E (0) = Eo, P (0) = Po

(1)

U = {x\\\x\\<U}, V = {x\\\x\\<V} U = V.

(2)

Ясно, что граница так определенного множества есть множество точек поимки, в которые P движется наискорейшим образом. Такое движение в силу замкнутости U существует. Поэтому зона безопасности открыта.

Очевидно, что если зона безопасности имеет непустое пересечение с l, то E в игре с линией жизни гарантирован выигрыш независимо от действий P. Когда пересечение пусто, Убегающий может попытаться обмануть Преследователя, меняя направление своего движения в ходе игры. Известно, что в играх (1)-(2) с евклидовыми нормами Преследователю достаточно применить стратегию перехвата [2, 3], чтобы независимо от стратегии Убегающего гарантировать сжатие зон безопасности:

t2 >ti A(t2) С A(tt). (3)

Вместо того, чтобы выбирать в каждый момент скорость своего движения так, чтобы в результате получилась интегрируемая по Лебегу функция времени v(t) G V, игрок может выбрать такую функцию a priori, добавив в состав аргументов некоторые параметры. В работе используются позиционные стратегии игроков, например, в рамках формализации Н. Н. Красовского [6]. Эти априорно выбранные функции будем называть стратегиями, а множество из которого они выбираются — множеством допустимых стратегий. Будем считать, что оно всегда содержит все прямолинейные стратегии: v(-) = const(t) G V.

Здесь будут доказаны следующие утверждения.*

I. Стратегия игрока P, обеспечивающая независимо от стратегии игрока E сжатие (3) строго описанных в определении 2 зон безопасности A, гарантирует поимку в замыкании A(0).

II. В случае строгой выпуклости вектограммы U этой сжимающей стратегией может быть только перехват (см. определение 1).

III. Когда зона безопасности невыпукла и U строго выпукла, существуют такие линии жизни l С A, которые достижимы игроком E обманным маневром. (E, ориентируясь на перемещение P, гарантированно достигает какую-то, но не конкретную точку из l).

IV. Существуют невыпуклые зоны безопасности.

V. В случае нестрогой выпуклости U игрок P может иметь отличную от перехвата сжимающую стратегию.

VI. Перехват при этом может и не обеспечить сжатия.

VII. В общем случае вектограмм U, V игрок E в некоторых позициях может выбирать движение, нарушающее сжимаемость при любых стратегиях игрока P.

Заметим сразу, что утверждение I для зон безопасности по [1] очевидно.

Пусть E движется в одном направлении с максимально возможной в этом направлении скоростью, т.е. применяет прямолинейную стратегию. Игрок P знает это и минимизирует время поимки, выбирая свою стратегию как некоторую интегрируемую по Лебегу функцию времени u(t) G U, t > 0. В евклидовом пространстве такая стратегия обязательно приведет к его прямолинейному движению с наибольшей возможной скоростью.

Несложен в доказательстве следующий результат.

* Этот термин используется вместо термина «теоремы» по двум соображениям. С одной стороны, эти утверждения всего лишь простые следствия доказываемых здесь теорем и их ранг как бы ниже, но с другой стороны, они являются сводкой результатов.

Теорема 1. Прямолинейная стратегия игрока P, переводящая его из точки Pi в точку P-2, всегда .минимальна по времени. Если вектограмма U строго выпукла, прямолинейная стратегия является единственной минимизирующей. Когда U определена согласно (2), минимальное время перехода есть ||Pi — P2I/U.

(Единственность стратегии можно доказать с помощью принципа максимума Понт-рягина.)

Определение 1. Пусть в каждый момент времени t Преследователь имеет доступ к информации о скорости Убегающего в этот момент и о позициях P(t), E(t) и выбирает свою скорость так, что при сохранении ее и скорости игрока E по направлению и величине (т. е. (Ут > t) Е(т) = E(t) А Р(т) = P(t)) происходит поимка за минимальное время. Такую стратегию выбора скорости Преследователем назовем перехватом.

Примечательно, что перехвату можно дать другую математическую интерпретацию: игрок P часть своих скоростных ресурсов расходует на сохранение параллельности векторов a(t) = E(t) — P(t), а оставшуюся часть тратит на движение вдоль вектора a(t). Предложено было назвать это стратегией параллельного сближения (ПС) [4].

Элементарно доказывается, что описанный в определении 1 перехват существует (поскольку V С U А V р| dU = 0) и единствен как функция трех аргументов P = u(P, E, E), и что справедлива

Теорема 2. Если стратегия E прямолинейная, то перехват приводит к прямолинейному движению игрока P и минимизирует время поимки.

Теперь определим зону безопасности более удобным для ее построения способом.

Определение 2. Пусть у E прямолинейная стратегия: E(t) = const(t) = v, v G dV, t > 0. Игрок P, применяя перехват, ловит E в момент T(Po,Eo,v) — граничное время. Назовем множество

A(P0, Eo) = {x|x G EoY \ {Y} А v G dV А Y = E(T(P0, E0, v), v) } (4)

зоной безопасности.

В [2] оно именуется attainability domain, в [3] — область достижимости. Далее (теоремы 3, 7) будет доказано совпадение этого множества с тем, что описано в [1].

Из теоремы 2 следует

Теорема 3. Игрок E может достичь любой точки зоны безопасности, используя, в частности, прямолинейную стратегию, ранее момента поимки независимо от стратегии игрока P.

Не представляет трудностей в доказательстве

Лемма 1. Игрок P может достичь любой точки x на луче из Eo в направлении v, удаленной от Eo более, чем точка E(T(Po, Eo, v), v), где T — граничное время, раньше игрока E.

Остается, однако, открытым вопрос: может ли E обманным маневром вынудить P двигаться так, чтобы текущая зона безопасности не содержалась в начальной, т. е. после маневра попасть прямолинейной стратегией в некоторую точку x G A(Po, Eo) до поимки уже независимо от стратегии Преследователя? Для понимания ситуации будет полезен еще ряд дополнительных результатов общего характера.

Лемма 2. Преследователь может двигаться в любом направлении со скоростью не менее и>0, и

и = min |Ы|. (5)

- хЕди

Доказательство. По 0-соглашению 0 € dU, поэтому в силу замкнутости dU расстояние между ним и нулем (определяемое формулой (5)) положительно. С другой стороны, по О-соглашению Преследователь может двигаться в любом направлении. ■

Несложна в доказательстве

Теорема 4. Для прямолинейной стратегии игрока E время его поимки T(Po,Eo,vo) перехватом непрерывно по всем аргументам, что верно, в частности, и при v = 0.

Простым следствием из теоремы 4 будет

Теорема 5. Минимальное время перехода из любой позиции игрока P в любую точку у € Bn непрерывно по у. Если игрок E может перейти в у, то его минимальное время перехода также непрерывно по у (в том подпространстве, в котором он может перемещаться).

Теорема 6. Граница зоны безопасности состоит из множества точек поимки перехватом при прямолинейных стратегиях Убегающего:

dA = {E(t, v) | t = T(P0, E0, v) Л v € dV} = Z.

Доказательство. Согласно лемме 1 и теореме 3 все точки поимки — граничные, т.е. Z С dA.

Обратно, пусть у € dA Л у = Z. Положим v € dV сонаправленным с вектором у - Eo. Обозначим Tv = T(Po,Eo,v). Тогда точки у, Eo, E(Tv) лежат на одной прямой.

Пусть у € E(Tv )Eo. По определению граничной точки существует последовательность {ук j^0 С A такая, что lim ук = у (у не обязательно содержится в A!). Игроки E и P, двигаясь только прямолинейно, могут достичь точку ук за время TE и Tp, соответственно, и TE < Tp Ук. В силу непрерывности времени перехода (теорема 5) существуют пределы TE = lim TE и TP = lim Tp, причем TP > TE, и TE, TP суть моменты достижения точки у игроками E и P, соответственно. Но по лемме 1 игрок P может достичь у ранее E. Следовательно, у € E(Tv)Eo.

Тогда если у = E(Tv), то, согласно определению 2, у € A. По определению граничной точки (3{у кЦ0 С A) lim ук = у. Наименьшее время достижения Tp точки ук игроком P согласно определению зоны безопасности менее времени достижения T E ее игроком E. Переходя, как и выше, к пределу при к ^ ж видим, что TP < TE. Это противоречит теореме 3, так как у € A, и должно быть TP > TE.

Коллизия исчезает, когда у = E(TV), т.е. у G Z. Ш

Итак, множество точек поимки для прямолинейных стратегий, называемое поверхностью жизни, есть гиперповерхность, ограничивающая зону безопасности A.

Теорема 7. В любую точку вне зоны безопасности Преследователь может попасть не позднее Убегающего.

Доказательство. Для того, чтобы покинуть зону безопасности A, где игрок E находится первоначально, он должен в какое-то время t оказаться в точке X на dA. По прямой же попасть в X он может не позднее момента t (теорема 1). Но и P в силу теоремы 6 (X € Z) способен прибыть туда не позднее. Далее принимаем по внимание, что U D V. ■

Следствие 1. Из теорем 3 и 7 вытекает, что зона безопасности по определению 2 и по процитированному выше определению из [1] совпадают. Таким образом утверждение I справедливо.

Следствие 2. Пусть U строго выпукла. Фактически, в первой части доказательства теоремы 6 показано несколько больше, чем требовалось. А именно, на луче из Eo в

направлении V дальше от Ео, чем X = Е(Ту, Ео, V), нет точек из А — замыкания зоны безопасности. Согласно теореме 1 единственная возможность для игрока Р попасть в X ко времени Т'и двигаться туда по прямой. Если он прибудет в X позднее, то Е, после достижения точки X двигаясь со скоростью V, окажется уже вне А. Движение же Р в X по прямой, покуда Е туда движется, и есть перехват. Этим доказывается утверждение II. Отметим, что если под сжатием вместо (3) понимать более широкое условие Ь > 0 ^ А(Ь) С А(0), то это сжатие можно обеспечить иными стратегиями, но, разумеется, не любыми.

Пример. Рассмотрим простейшую игру (1) с условием (2), в котором норма евклидова. Тогда и строго выпукла, и зона безопасности А есть круг Аполлония. Согласно стратегии экстремального прицеливания [5] Преследователь должен двигаться по направлению к Е. Если хоть одна точка X линии жизни лежит на дА и не принадлежит прямой, проходящей через Р и Е, то экстремальное прицеливание приводит к немедленному проигрышу Преследователя, когда Е с предельной скоростью движется по прямой в X. Более того, сколь угодно короткое экстремальное прицеливание делает доступными для Е некоторые точки вне замыкания А. То есть для выигрыша Е достаточно, чтобы линия жизни была относительно близка к А и чтобы Р экстремально прицеливался. Как известно (см. например [2]), перехват в этой игре обеспечивает поимку в А. Ш

Пусть Е движется прямолинейно, а Р — наперехват. В каждый момент времени Ь можно построить текущую зону безопасности А(Ь, V). Их совокупность обладает интересным свойством.

Теорема 8. Текущие зоны безопасности А(Ь, V) для прямолинейной стратегии игрока Е и стратегии перехвата игрока Р подобны с центром подобия в точке поимки

X е дА,

X = Е(Т„, Ео, V) = Р(Т„, Ро, Ео, V).

Доказательство. Пусть У еще одна точка из дА, поимка в которой происходит в момент Т¥. Покажем, что в момент Ь во множестве дА(Ь, V) находится подобная ей точка У' = X + (У - X)(Т„ - Ь)/Ту.

Рассмотрим треугольник PоXУ. В момент Ь игрок Р, двигаясь наперехват, должен находиться в точке Р1 = X + (Ро — X)(ТУ — Ь)/Ту. Поэтому отношение длин сторон РIX к Р^ есть к = Т — г)/Ту.

Выпустим из Р1 луч в направлении вектора У — Ро. Будучи параллельным стороне РоУ, он должен пересечь сторону XУ в некоторой точке Ур, причем

Ур — X = (У — X )к, Р1 — Ур = (Ро — У )к. (6)

Проведем аналогичные рассуждения для треугольника EоXУ:

УЕ — X = (У — X )к, Е1 — УЕ = (Ео — У )к. (7)

Первые равенства в (6) и (7) свидетельствуют о том, что УЕ = Ур = У'. По отрезку Р{У' игрок Р может двигаться с той же скоростью, что и по отрезку РоУ, поэтому он сможет пройти его за время Т¥к (см. второе равенство из (6)). Аналогично, игрок Е проходит отрезок Е1У' за то же время. Следовательно, У' е дА(Ь^). Еще раз обращаясь к первому равенству из (6), видим, что каждой точке У е дА соответствует ей подобная в дА(Т, V) относительно центра подобия X с коэффициентом подобия к. Ш

Следствие. (Обоснование утверждения III.) Когда для каких-то начальных позиций игроков формируется невыпуклая зона безопасности и и строго выпукла, можно построить линию жизни / С Л, которая достижима до поимки игроком Е при помощи стратегии зависимой от позиций игрока Р следующим образом. Пусть Х,У С дЛ и ХУ С -Л. Положим ХУ р| дЛ = /' С /. Тогда, используя теорему 8, легко показать, что при движении Е в X достаточно движения Р туда же сколь угодно малое время, чтобы стали достижимыми некоторые другие точки из /'. Если же Р движется в иную точку из /', то становится достижимой точка X.

В общем случае в конечномерных нормированных пространствах при стратегии перехвата сжимаемости зон безопасности нет. Чтобы это обосновать потребуется дополнительный инструментарий.

Для доказательства утверждений используем норму У • ||то. Напомним, что

||х||то = \хг\, где хг — компоненты вектора х, и неравенство ||Р|| < и тогда

означает, что вектограмма игрока Р есть многомерный куб с длиной ребра 2и, гранями, ортогональными координатным осям, и центром в начале координат. Вектограмма для Е подобна таковой для Р с коэффициентом подобия V/ и.

Таким образом, в игре (1)—(2) игровое пространство анизотропно. Предлагаемую игру можно рассматривать как идеализацию следующей жизненной ситуации. В большом городе с прямоугольной сетью улиц полицейский гонится за преступником, который желает достичь убежища в криминальном районе, где преследование прекращается. Когда шаг уличной сети стремится к нулю, в пределе получается предлагаемая игра. (Размерность п пространства равна 2, координатные оси повернуты под 45° к направлению улиц, если скорости полицейского и преступника IIо и Уо, то II = 11о/л/2, V = Т^о/л/2-) Крупнейший город прямоугольной планировки, видимо, Чикаго. Это дает некоторые основания назвать эту игру «Гонки в Чикаго» (ГЧ). Заметим, что Гонки в Чикаго можно снабдить и другим описанием:

ЦР||1 < ио, ЦЕ||! < Vo, ||х||1 = £ \хн\.

г

В случае п = 2 неравенство ||Р ||1 < и о означает, что Р может выбирать скорость в квадрате со сторонами, повернутыми на 45° к осям координат. Когда п = 3, вектограмма скоростей — октаэдр. (Не куб!)

Назовем множество Ег = {у | Цу — Ео|| = \уг — Ег(0)\} зоной ¿-достижимости. Здесь и далее нижний индекс г €{1, ...,п} с символом вектора означают соответствующую координату этого вектора. Таким образом, зона Ег-достижимости является множеством точек, удаление которых по г-й координате не менее, чем по другим. Аналогично определим зоны Рг-достижимости.

Каждая из зон состоит из двух секторов. Когда г-е координаты начальных позиций Ро и Ео совпадают, через ег- и рг- обозначим секторы, в которых г-я координата уходит на —то; через ег и рг обозначим секторы, в которых г-я координата уходит на

В противном случае обозначим через ег сектор из зоны Ег-достижимости, все точки которого удалены по г-й координате от Ро не менее, чем от Ео; ег- — противоположный сектор. Обозначим через рг- сектор из зоны Рг-достижимости, все точки которого удалены по г-й координате от Ео не менее, чем от Ро; рг — противоположный сектор.

Теорема 9. В ГЧ .зона безопасности Л не имеет общих точек ни с одним из секторов рг~\ -ргр|А = 0, г = 1,п.

Доказательство. Расстояние по г-й координате от Ео до любой точки х € рг-не менее, чем \хг — Рг(0)\ = Цх — Ро||. Поэтому и Цх — Ео|| > Цх — Ро||, а поскольку

и > V, время достижения точки х игроком Р меньше, чем игроком Е. Из теоремы 3 следует доказываемое. ■

Теорема 10. Пусть г = Ео — Ро. Если г' = 0, то зона безопасности А в ГЧ не имеет общих точек с .зоной Р'1-достижимости.

Доказательство. Сектор рг в этом случае равноправен с сектором рг-, а Рг = рг\^}рг^. Ш

Секторы из зон достижимости для Р и Е могут пересекаться. Используем для этих пересечений естественные обозначения: в]рг и = 1, п.

Лемма 3. Множества ГГ. = дА(^\е]~р1 и Г^- = дА(^\е]р1; г,^ = 1,п, являются частями гиперплоскостей, а при п = 2 — отрезками. Нормали п этих множеств таковы: если г = ), то П = ±Ь', если г = ), то

УЬг , УЬд

п=----± , -, (8

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^У1 + и2 л/^2 + и2 у 7

где Ьх, ..., Ьп — базисные векторы.

Доказательство. Утверждение очевидно, когда г = Тогда Г^. есть часть гиперплоскости, параллельной г-й координатной гиперплоскости. Если начало координат расположить в Ро и г = Ео — Ро > 0 (векторное неравенство понимается покомпонентно, следовательно каждая компонента вектора г неотрицательна), то

г ■ ии г' и

хеТ±^Хг= V хеГГ^Хг= игу (9)

Когда г ф тогда время поимки есть = Т(Ро, Ео,у) = щ^т- Поэтому в момент поимки

иг' ±Vг 0

' о

и Т V'' 0 и т V'

+ г-, (10)

Объединяя, имеем хс. = г- ± Х'У/и. (11)

Для прочих координат: равенства х к = г к + х' V ¡./и и V к | < V дают

—Ух' + гк < хк < Ух' + гк, к = г,). (12)

То есть множества в^рг и в]-р% описываются лишь одной линейной связью (11) и линейным ограничением (12), являясь, таким образом, частью гиперплоскости, задаваемой уравнением (11). Ее нормаль, очевидно, соответствует (8). ■

Теорема 11. (Утверждение IV.) Существуют начальные позиции Ро и Ео, при которых зона безопасности А в ГЧ невыпукла.

Доказательство. Достаточно ограничиться контрпримером в пространстве размерности п = 2. В пространствах большей размерности возможность невыпуклости будет следовать из невыпуклости двумерного сечения.

Пусть, как и ранее, Ро = 0, г > 0. Если г^/гх достаточно мало, то (Ух € А) х2 < х\. (Из (11) это верно когда + Г2 < х\, что равносильно

( V\ (Ю) и — V гхи и — V

г2 и — V

То есть достаточно мало значит неравенство отношений — < -.) Тогда А принад-

гх и + V

лежит р1 и является равнобочной трапецией. (Лемма 3, формулы (9), (10). См. рис. 1 для г2 = 0.)

х

Рис. 1

Рис.2

Рис.3

В случае когда

Г2 U-V > и > U + V'

(13)

у трапеции вырастает "рог". Он состоит из p2 р| el- и p2 р| e2. В местах стыковки рога с остальной частью трапеции внутренние углы образовавшегося многоугольника больше 180°. Зона безопасности невыпукла (рис. 2). (В предельном случае, когда r2 = ri, зона безопасности опять выпукла (см. рис. 3).) ■

Следствием теорем 8 и 11 является нарушение сжимаемости при перехвате.

Контрпример 1. Пусть имеет место (13). Продолжение одного из отрезков F5F6, образующих границу рога, прямой внутрь зоны безопасности разобьет ее согласно теореме 11 на две части, не включающие само продолжение. Ту из них, на границе которой нет внутренних точек этого отрезка, назовем зоной обмана M. Двигаясь туда некоторое малое время, Убегающий потом сможет направиться прямолинейно в любую точку выбранного отрезка из границы рога и достичь ее гарантировано (теорема 8) раньше Преследователя, получив, таким образом, возможность перехода границы зоны безопасности до поимки. Отрезок F^Fq будет зоной прорыва для соответствующей зоны обмана.

Напротив, если Убегающий двинется вначале в отрезок F^Fq, а затем во множество M, то отрезок станет зоной обмана, а множество dM р| дА — зоной прорыва. Можно привести еще несколько парных зон прорыва и обмана для этого же начального расположения игроков. ■

Итак, в играх с линией жизни в нормированных пространствах несложная стратегия перехвата может давать сбой. Но оказывается, Преследователь может вести себя и еще проще и гарантировано ловить Убегающего в зоне безопасности.

Простая стратегия. В каждый .момент времени игрок P выбирает скорость и направление своего движения так:

U sign п А п ф 0, . _ -—

A ri = 0,

1, n

(14)

Вообще говоря, эту идею можно распространить и на более общий случай нестрого выпуклых вектограмм и, но здесь простая стратегия будет применяться только в ГЧ.

Формулы для перехвата (они здесь не потребовались) сложнее и содержат дискриминацию игрока Е по выбору скорости на все время игры. Здесь дискриминация проявляется в особых случаях и не для всех компонент скорости (лишь когда т = 0).

u

v

Впрочем, от приоритета в выборе скорости игроком P легко уйти рутинным путем, введя дискретизацию по времени либо запаздывание в получении информации. Результаты, получаемые всеми тремя подходами, взаимно переносимы, но проще и нагляднее рассматриваемая непрерывная модель без запаздывания с дискриминацией.

В рамках формализации Н. Н. Красовского простую стратегию можно еще упростить: щ = и signrj, i= 1, п. Расширенное толкование им решения системы дифференциальных уравнений P = u позволяет говорить о существовании решения и в этом случае.

Теорема 12. При прямолинейной стратегии Убегающего Преследователь ловит его, руководствуясь простой стратегией, за то же время, что и перехватом, т. е. за минимальное.

Доказательство. Пусть E устремился в точку x G A. На критических координатах i, таких, что \\x — P(t)\\ = \xi — Pi(t)\ = di, скорости игрока P равны в обеих стратегиях. При перехвате компоненты dj пропорционально убывают с ходом времени, j = 1, п. При простой стратегии некритические компоненты убывают не медленнее и могут обнулиться еще раньше, чем критические. Поэтому состав критических компонент di не меняется в ходе игры с простой стратегией, а так как они убывают с той же скоростью, что и при перехвате, их обнуление произойдет в то же время. ■

Отсюда немедленно следует

Теорема 13. Зона безопасности A по определению 2 совпадает с ззоной безопасности B для простой стратегии игрока P и, по-прежнему, прямолинейной стратегии игрока E.

Теорема 14. Скорость сближения использующего простую стратегию Преследователя со всеми точками зоны безопасности A(t) равна U в течении некоторого времени S после момента t:

(Vt G [0,T))(3S > 0)(Vx G A(t))(Vr G [0, S])(\\x — P(t + t)\\); = —U.

Доказательство. Согласно теоремам 9 и 10 зона безопасности может иметь общие точки лишь с I = Уr =0pi. Но, согласно определению простой стратегии, если ri = 0, то (\\x — P(t)\\)i = —U в момент t и после некоторое время Si. Если же ri = 0, то по теореме 8 pi(t)f|A(t) = 0, что влечет (Vx G A(t))\\x — P(t)\\ > \xi — Pi(t)\. В силу замкнутости множеств pi(t) и A(t) и непрерывности P(t) еще некоторое время Si > 0 будет верно (Vt G [0, Si)) Pi(t + t) p| A(t) = 0. Следовательно, скорость Преследователя по i-й координате не сказывается на величине (\\x — P(t)\\)j. Положим <5 = min Si. Я

Теорема 15. Независимо от стратегии игрока E простая стратегия гарантирует сжатие зон безопасности: (Vt' > t) A(t') С A(t).

Доказательство. Пусть S выбрано согласно теореме 14 для момента t, и пусть игрок E в течении [t, t''], t'' = t + S/2 маневрировал, а игрок P применял простую стратегию. Где расположена зона безопасности A(t'')?

Исследуем границу dA(t''). Пусть луч, выходящий из E(t'') и проходящий через некоторую точку y G dA(t''), пересекает границу dA(t) в ближайшей к E(t'') точке x. Существование этого пересечения следует из того, что E(t'') — внутренняя точка для A(t). (Построения в теореме 14 лишь утверждают E(t + S) G A(t) и допускают выход точки E(t + S) на dA(t). На самом деле это невозможно, однако, доказывается громоздко, и поэтому здесь просто взято меньшее время t''.)

Скорость сближения игрока E с любой точкой из A(t) никогда не больше V. Поэтому время достижения им точки x после применения обманного маневра может только увеличиться. Следовательно, если с момента t" игрок E начнет прямолинейное движение в x, он не сможет попасть туда раньше игрока P в силу теоремы 14. Поэтому x G E(t")y и, следовательно, y G E(t")x. Отрезок E(t")x лежит в A(t), что влечет y G A(t), откуда dA(t") С A(t). Поскольку A(t") и A(t) односвязные ограниченные множества (как "звездные"), это означает, что A(t") С A(t) и A(r) С A(t), Ут G [t,t"].

A(t) непрерывно зависит от т. Предположим, что (3t' > t)A(t') С A(t). Тогда должен существовать момент to G (t,t') такой, что B(to) G B(t), но (Уе > 0)(3т G (to,to + е)) A(t) С A(to), а согласно теореме 14 и предыдущей части доказательства существует S(to), такое, что если е < S(to)/2, то имеет место включение. Противоречие отвергает предположение. ■

Следствие. Обосновано утверждение V, а привлекая приведенный выше контрпример, и утверждение VI.

Для обоснования утверждения VII, имея утверждение III, достаточно показать существование невыпуклых зон безопасности при строго выпуклых U.

Контрпример 2. Рассмотрим ||x||p = (J^i \xi\p)1/p. Известно, что вектограм-ма Up = {x|||x||p < U} строго выпукла. Легко показать, что ||x||p —> ||x| при p —> ж равномерно по x. Поэтому очевидно, что время поимки перехватом T(Eo,Po,v,p) —> T(Eo,Po,v, ж) при p —> ж. Следовательно, для достаточно больших p зона безопасности в игре с нормой || • || будет невыпукла, если она была невыпукла в игре с нормой || • ||то.

Summary

Miheev S. E. Safety Zones in Differential Games.

Two player-points P and E in the normed space B with convex vectogrammes V CU С B have antogonistic goals: E to reach a point of some set l named 'life line' before capture, P to prevent it. Capture is P(t) = E(t). Each goal function for the players has only two values 'winning' and 'loss'. The key for game analysis is safety zone A(t). For arbitrary initial positions P(t), E(t) it is the point set reached rectilinearly by E earlier than P. When l П A(0) = 0, player E has always winning using some rectilinear strategy. Otherwise the shrinkage of safety zones t2 > ti ^ A(t2) С A(ti) is of principal importance. It is shown that P's stategy providing the shrinkage for every E's strategy also provides the capture in closure of A(0). When the vectogramme U is strictly convex the shrinking strategy may be, if exists, only intercept. When A(0) is not convex and U is strictly convex there are life lines l П A(0) = 0, which can be reached by E fraudulently. Non convex safety zones exist. If U is non-strictly convex, P may have different from intercept shrinking strategy and the intercept in the case may not shrink. In the general case of U, V player E in some positions can choose movement violating the shrinkage under every strategy of P.

Литература

1. Айзекс Р. Дифференциальные игры. М., 1967.

2. Miheev S. E. Contraction of Attainability Domains in a Game of Pursuit // Nova Journal of Mathematics, Game Theory and Algebra. New York, 1997. Vol. 6, N 2/3. P. 147-161.

3. Михеев С.Е. Релаксационное ускорение на основе областей достижимости // Вестник СПбГУ. 1999. Сер. 1, №3(15). С. 29-35.

4. Петросян Л. А. Об одном семействе дифференциальных игр на выживание в пространстве Rn. ДАН. 1965. Т. 161, №17. С. 52-54.

5. Красовский Н. Н. Игровые задачи о встрече. М., 1970.

6. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. 1974. Статья поступила в редакцию 4 декабря 2001 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.