УДК 518.9
ГРУППОВОЕ ПРЕСЛЕДОВАНИЕ ОДНИМ
ПРЕСЛЕДОВАТЕЛЕМ НЕСКОЛЬКИХ ПРЕСЛЕДУЕМЫХ В ПРОСТРАНСТВЕ М3
А. Г, Варламова
В работе рассмотрен случай группового преследования игры в трех-М
Р и преследуемыми Е, Е, которые перемещаются в прострапстве М3 с постоянными скоростями, имея возможность в каждой момент времени изменять направление своего движения. Преследуемый Ег (г = 1,2) считается пойманным, если местоположения Р и Ег (г = 1, 2) в некоторый момент совпадают.
Будем предполагать, что в каждый момент времени преследова-Р
Ег (г = 1, 2) и о направлении скоростей игроков Ег (г = 1,2). Каждый из преследуемых Ег (г = 1,2) имеет информацию о своем местоположении, местоположении преследуемого Е—г (г = 1,2) и местоположении Р
В каждый момент времени игроки могут выбирать направление своего движения или направление вектора скорости (величина скорости постоянна и равна и для Р и для Ег (г = 1,2)). Скорости игроков произвольны, и существенно лишь то, что и > тах{^,^}. НаР
тором ^ = (<^1, <^2, <^з)> где (<^1)2 + (^г)2 + (*^з)2 = и2. Аналогично направление скорости Ег (г = 1,2) однозначно определяется вектором
= (фз ,ФЗ, Фз), где (ф{)2 + + {ф\)2 =
Будем отмечать верхними индексами положения игроков в соот-
© 2006 Варламова А. Г.
ветствующие моменты времени.
В игре со многими убегающими геометрическим местом точек поимки первого убегающего на плоскости М2 является окружность Аполлония (Л), которая определяется формулой
р(Р°,М) = р(Е1М)
и V '
где Р°, Е — начальные местоположения точек преследователя и убегающего, N — точка поимки убегающего, р(х, у) — евклидово расстояние между точками х и у. В трехмерном пространстве окружность Аполлония превращается в сферу (С).
Определение [1]. Стратегия уп игрока Р называется П-стратегией, если в любой ситуации (уи,ф) — отрезок прямой, соединяющей точки Р0 и Е0, и расстояние между точками Р4 и Е4 — р(Р4, Е4) строго убывает со временем.
Также будем предполагать, что у®'3-® — стратегия преследователя
Р
ва к Е®, а затем к Е-и Т® — момент встречи Р с Е®, Т®^ -® — время преследования игрока Епосле ветречи с Е®.
Е Е Е
{Е, Е })• Выигрыш убегающей коалиции определим как время встречи Р с последним из убегающих игроков (Ке = К (у, {ф\,фъ,фъ }))• Р
игрыша Е (Кр = —Ке).
Р
момент г = 0 выбирает один из двух способов поведения: 1) использует правило параллельного преследования (П-стратегию), преследуя спер-ЕЕ
ЕЕ
В этих предположениях ищется наилучший ответ убегающей коалиции Е = {Е, Е} в смысле максимизации времени преследования. Предположим, что в момент £ = 0 игрок Р принимает решение
ЕЕ К(<^12, {Фь ф, Фз}) = Т2 = Т + Т2.
Е
полупрямые, выходящие из Е®, а Е движется по прямой от Рт (стратегия ф2), где N = Рт = Ет) — точка встречи Р с Е1.
РЕ
движении по прямым со скоростями и и «1 (граница зоны безопасности Е1) в случае, когда захват определен как совпадение точек Р и Е±, есть сфера (ш = и/«1 ф 1). Так как ш > 1, то Е± находится внутри Р вне 66. Уравнение этой сферы в декартовой системе координат имеет вид
и2хЕо-у1хР о\2 / и2уЕо-у1уРо
Х 9 9, ) \ У 9 9
U Z_gO — Vf ZpO Z--b-ö-
U1
2
—
Определим, к какой точке (N) сферы (C) должен двигаться Ei, чтобы T2 было максимальным.
Предположим, что точки Р°, E®, E2 не лежат на одной прямой. Очевидно (рис. 1), что
T2 = T2 Р, E, Ef) = T (Р0, E?) + T12 (РT, eT )
= Т2(Р,0,Е°) = Р{Р'°>Е2\ (1)
U — V2
где
|рОрT | _ |р/орT |
Следовательно, задача нахождения максимального T2 эквивалентна задаче нахождения
max (|P0NК |NE|)• (2)
Ne (C) 11-1/
Более того, достаточно найти (см. рис. 1)
max (|P°N |+|NE90|). (3)
Рис. 1.
где ^ M1M2 — дуга сферы (С) (указанный максимум существует в силу непрерывности функции /(N) = |P0N| + |NE®| на замкнутом промежутке).
Известно [3], что для любых двух точек и любого числа a, большего половины расстояния между этими точками, существует (единственный) эллипс, фокусами которого являются данные точки, а большая полуось равна а. Тогда геометрическая точка N определяется как точка касания сферы с эллипсом с фокусами в точках Р0 и Щ, содержащим эту сферу.
Согласно оптическому свойству эллипсоида Za.\ = Za2. Следовательно, равны и углы ZP°NO и ZONE%, ZP°NO = ZÖNE% = ß. Тогда Z~NE^M2 = ß, ZNOM2 = ZNP°M2 + ß. В системе координат XYZ, связанной с начальным положением Р° и осью OX, направлен-
ной по P0E?,
Хдг = \ОР°\ (l + — sina) , Yw = - — IOP01 cosa, \ u / u
^7= -— \OP°\sma, N u
где угол a определяется (см. рис. 1) из уравнения
р(Р°,Е%) [sin S +— cos(a — (5)1 = 2\ОЕ%\ (— + sin a) cos(0 - a).
uu
Итак, Ei должен двигаться в направлении точки N (стратегия ф\). Докажем, что любая стратегия игрока Е{ф\,фъ} домипируется при П-стратегии игрока Р стратегией {ф1у ф2}.
ф Е
{фъф2}) > {фъ ф2}).
фЕ
К(у12,{фъф2}) ^К(ср12,{фъф2}).
Е
n-вершинная ломаная, то тахТ2 при этом уменьшается.
Доказательство проведем для случая, когда n = 1, а вершина ломаной находится на прямой E^N. При этом воспользуемся известным утверждением [2].
Утверждение. Если P и Е движутся прямолинейно к точке U сферы, то новая такая сфера, соответствующая какой-либо паре про-
P Е U
Следовательно, если Е в точке Ef (О < Т) делает разворот, то границей зоны безопасности Е го начальньж положений Pf, Ef будет сфера (О (рис. 2). Задача сводится к нахождению (см. рис. 2)
max (|P0Pf| + |PfK| + |КЕ°|) = |P0Pf| + max (|PfK| + |KE°|). ке( Ci)V..........к e [M{,M2*]V 1 '''
(4)
Рис. 2.
Покажем, что максимум достигается в точке N. Прежде чем найти максимум (4), приведем без доказательства следующее
Замечание 1. При гомотетии эллипсоид (Г) с центром гомотетии в точке N £ (Г) переходит в эллипсоид (Fi), причем (Г) и (Fi) касаются в точке N £ (Г). Если коэффициент гомотетии k < 1, то выпуклая область G, ограниченная (Г), содержит (Fi), если же k > 1, то (Fi) лежит вне G.
Из замечания непосредственно следует, что эллипсы с фокусами в точках Р0, Щ и P\ E' || P4E') и с большими осями, соответ-
ственно |Р°ЛГ| + (WEfl и IP'A^I + \NE2\, гомотетичны, причем центр гомотетии находится в точке N. Следовательно,
max (|P4K| + |KE'|) ке (Ci)
N
\рЩ + \ne'2\ > \р*к\ + \ке'2\, к g [Mi,M^\.
Тогда (рис. 2)
\Р*М\ + \NE% \ = \Р*Щ + \NE'2\ + \E'2El\
> |P4KК |KE'К IEЩ| > |P4KК |КЩK £ [M1i,M2i],
N
Таким образом, мы доказали справедливость неравенства К{фъ ф2}) > К{^12, {Фъ ф2}). Аналогично решается задача для случая
K«1, }) = Т =Т2+Т21.
P
условия
mm{K(ip12, {фг,ф2}), К{ф, ф})}. Итак, мы доказали следующую теорему.
Теорема. В рассмотренной игре существует ситуация равновесия, которая строится следующим образом:
а) оптимальная стратегия P(<j'3_j) определяется из условия
{фъф3^}) = mm{K(ip12, {фиф2}), К{^2\ (ф, ф2))}-
б) оптимальная стратегия Ej(ф) — движение по прямой к точке N (N = PTi = ЕТ*), где N — точка касания сферы (границы зоны безопасности Ej) с эллипсоидом с фокусами в точках P и E_it содержащим эту сферу;
в) оптимальная стратегия ^-¿(Фз-г) — движение по прямой от PTi.
Замечание 2. В случае, когда точки Р°, Е® и Е§ расположены па одной прямой, порядок преследования определяется из условий:
Е Е Р
Е Е Р
ЛИТЕРАТУРА
1. Петросян Л. А. Игры преследования с «линией жизни» // Вестн. Ленингр. ун-та. 1987, № 13. С. 76-85.
2. Петросян Л. А. Об одном семействе дифференциальных игр на выживание в пространстве // Докл. АН СССР. 1965. Т. 161, № 1. С. 52-54.
3. Постников М. М. Аналитическая геометрия. М.: Наука, 1973.
г. Якутск
30 января 2006 г.