УДК 519.837.4 + 517.977.8 ББК 22.18
СТРАТЕГИИ ПАРАЛЛЕЛЬНОГО СБЛИЖЕНИЯ В ИГРЕ ПРОСТОГО ПРЕСЛЕДОВАНИЯ НА СФЕРЕ. ГЕОДЕЗИЧЕСКОЕ СБЛИЖЕНИЕ 1
Ковшов А.М.2
(Санкт-Петербургский государственный университет, Санкт-Петербург)
Рассматривается дифференциальная игра простого преследования на сфере двух лиц с нулевой суммой. Вводится стратегия геодезического сближения, обладающая некоторыми свойствами стратегии параллельного сближения на плоскости, доказывается её существование и единственность в общем случае, рассматриваются все особые случаи. Доказывается наискорейшее свойство этой стратегии.
Ключевые слова: дифференциальные игры, простое движение, преследование на сфере.
Введение
Дифференциальные игры преследования с простым движением достаточно хорошо исследованы для плоскости и пространств больших размерностей с нулевой гауссовой кривизной. В данной работе делается попытка исследовать некоторые свойства подобных игр на сфере, обладающей иными геометрическими и топологическими свойствами.
Среди множества стратегий преследования значимое место занимает стратегия параллельного преследования (П-стратегия),
1 Текст приводится в соответствии с изданием «Математическая теория игр и ее приложения. - 2009. - Т. 1. № 4. - С. 41-62».
2 Ковшов Александр Михайлович, кандидат физико-математических наук ([email protected]).
являющаяся наилучшей стратегией для широкого класса дифференциальных игр преследования. В работах Л. А. Петросяна впервые показана оптимальность П-стратегии для игр простого преследования с линией жизни [2], в игре с двумя преследователями и одним убегающим [1] и в игре простого преследования в полуплоскости Петросян (1969).
Однако, как правило, исследования ограничивались играми на линейных многообразиях, либо на многообразиях, имеющих нулевую гауссову кривизну. Было бы интересно попробовать распространить результаты, полученные для игр на линейных многообразиях, на многообразие, имеющее ненулевую кривизну, в частности, на сферу. В данной работе описывается попытка построить стратегию сближения на сфере, обладающей некоторыми свойствами П-стратегии на плоскости. Так П-стратегия, при движении убегающего по прямолинейной траектории, предписывает преследователю двигаться тоже по некоторой прямой линии. На сфере отрезки прямых заменяются геодезическими отрезками, которыми являются дуги больших окружностей. Будет построена геодезическая стратегия сближения на сфере (Пг-стратегия), доказаны её существование и единственность для общего случая, а также рассмотрены особые случаи и доказано наискорейшее свойство.
1. Стратегия геодезического сближения (Пг-стратегия)
1.1. ИГРА ПРОСТОГО ПРЕСЛЕДОВАНИЯ НА СФЕРЕ
Пусть на сфере единичного радиуса находятся две подвижные точки Е и Р. Точка Е — убегающий, точка Р — догоняющий. Будем называть Р и Е игроками. Оба игрока могут двигаться по сфере в любом направлении и мгновенно менять направление движения, при этом убегающий двигается со скоростью а, а догоняющий — со скоростью р, причем а < р. Будем рассматривать игру, в которой целью догоняющего является поимка убегающего, а целью убегающего является избежание его поимки догоняющим. При этом будем считать, что догоняющий поймал 94
убегающего в момент времени Ь, если в этот момент времени координаты догоняющего совпали с координатами убегающего.
Во время игры и догоняющий, и убегающий знают координаты друг друга в каждый текущий момент времени, то есть, можно сказать, что игроки видят друг друга, кроме того, догоняющему всегда известна скорость его противника в текущий момент времени. Другими словами — это игра с дискриминацией по отношению к убегающему. В дальнейших рассуждениях мы не будем упоминать о том, что игра происходит на сфере именно единичного радиуса, однако это всегда будет подразумеваться.
Обозначим вектор скорости убегающего за не, а догоняющего — за Нр. Очевидно, что эти векторы являются касательными к сфере в точках Е и Р соответственно. Поставим в соответствие каждому вектору скорости по большой окружности Се и Ср (радиус большой окружности совпадает с радиусом сферы), таким образом, чтобы большие окружности проходили соответственно через точки Е и Р, а векторы Не и Нр были бы, соответственно, касательными векторами этих окружностей в этих точках. Еще одну большую окружность С ре проведем через две точки Р и Е. Эта большая окружность является пересечением сферы с плоскостью, проведенной через три точки Р, Е и центр сферы О.
Се
Ст>
Рис. 1. Положение игроков на сфере
Эту плоскость можно однозначно построить, только если точки Р, Е и О не лежат на одной прямой, то есть, в тех случаях, когда точки Р и Е не совпадают или не являются диаметрально противоположными точками на сфере. Если хотя бы одна из больших окружностей Се и Ср не совпадает с большой окружностью С ре , то Се и Ср пересекаются ровно в двух точках на сфере (рис. 1).
Как известно, большие окружности на сфере являются геодезическими линиями. Будем называть геодезической дугой любую дугу большой окружности, длина которой не превосходит п. Понятно, что такая дуга является кратчайшей линией на сфере, соединяющей свои крайние точки, и длина этой дуги равна геодезическому расстоянию между этими точками.
1.2. СУЩЕСТВОВАНИЕ И ЕДИНСТВЕННОСТЬ ЦЕНТРА
ПРЕСЛЕДОВАНИЯ
Пусть убегающий и догоняющий движутся соответственно вдоль Се и Ср, причем Се не совпадает с Сре. И пусть в некоторый момент времени Ь они оба окажутся в одной из двух точек пересечения больших окружностей Се и Ср. Обозначим эту точку за М. Докажем следующее предложение.
Предложение 1. (Существование). При любом расположении игроков на сфере в разных точках, не являющихся диаметрально противоположными, и при любом направлении движения убегающего вдоль произвольной большой окружности Се, не совпадающей с большой окружностью Сре, существует такая большая окружность Ср, что двигаясь вдоль нее в определенном направлении, догоняющий окажется одновременно с убегающим в точке М, являющейся одной из двух точек пересечения больших окружностей Се и Ср, причем дуги РЕ, ЕМ и РМ образуют сферический треугольник, то есть длины этих дуг и углы между ними не превосходят п.
Доказательство. Для доказательства рассмотрим некоторый сферический треугольник, изображенный на рис. 2, с боковыми сторонами ЕМ и РМ, длины которых соотносятся как а : р. Обозначим длину основания РЕ за Л, а длины боковых сторон 96
ЕМ и РМ выразим в виде ат и рт соответственно, где т — время движения игроков до точки встречи. Углы при вершинах Р, Е и М обозначим соответственно за ф, ф и д. Мы покажем, что сферический треугольник существует для любых Л и ф, принадлежащих открытому отрезку вещественной оси ]0, п[, то есть, что существует т, такое что рт ^ п.
Воспользуемся известной формулой косинусов для сторон сферического треугольника:
(1) cos рт = cos Л cos ат + sin Л sin ат cos ф, и перепишем ее в виде:
cos рт — cos Л cos ат
(2) cos ф =------------------------.
sin Л sin ат
Определим, для каких ф и Л из ]0,п[ уравнение (1) разрешимо относительно т. Рассмотрим знаменатель правой части уравнения (2). Поскольку а < р и рт ^ п, как сторона сферического треугольника, то ат < п. С другой стороны, из (1) видно, что т, а вместе с ним и ат могут равняться нулю лишь при Л = 0. Следовательно, знаменатель правой части уравнения (2) в нуль не обращается.
Поскольку | cos ф| < 1, из (2) получим неравенства:
cos рт cos Л cos ат
(3) 1 > -----рт —^------------ ,
sin Л sin ат
cos рт — cos Л cos ат
(4) —1 <--- ■ х ■-----------.
sin Л sin ат
Из (3), умножая обе части на знаменатель и перенося члены, не содержащие рт, в правую часть, получим:
cos рт < cos Л cos ат + sin Л sin ат,
а после свертки правой части в косинус разности:
cos рт < cos^ — ат),
откуда в силу рт ^ п и Л — ат < п следует рт > Л — ат, то есть
(5) т > .
р + а
Точно так же из (4) будем иметь:
cos рт > cos^ + ат).
Это неравенство имеет два решения: одно — при Л + ат ^ п,
другое — при Л + ат ^ п.
Для Л + ат ^ п, то есть т ^ (п — Л)/а, получим рт < Л + ат,
откуда
(6) т < —^.
р—а
Очевидно, что такая запись решения имеет смысл при таких Л, что выполняется неравенство Л/(р — а) ^ (п — Л)/а, то есть Л ^ п(р — а)/р. Если же Л > п(р — а)/р, то решением будет весь рассматриваемый промежуток и оно запишется в виде:
пЛ
(7) т <-.
а
Для Л + ат ^ п, то есть т ^ (п — Л)/а, получим 2п — рт > Л + ат, откуда
п — Л 2п — Л
(8) -----< т<—-—.
а р + а
Ясно, что это решение имеет место только при таких Л, которые удовлетворяют неравенству (2п — Л)/(р + а) > (п — Л)/а, то есть Л > п(р — а)/р, ибо в противном случае это решение (8) не пересекается с рассматриваемым промежутком.
Объединяя решения (6)-(8) неравенства (4), и пересекая их с решением (5) неравенства (3), получим область допустимых значений для т в уравнении (2):
А Л р — а
(9) ------ < т <---------, при 0 < Л ^---------------п,
р + а р — а р
_ Л 2п — Л р — а
(10) ------ < т < --------, при -------------п < Л < п.
р + а р + а р
В (9) и (10) к своей нижней границе величина т стремится при cos ф ^ 1, а к своей верхней границе величина т стремится при
cos ф ^ —1.
Заметим, что при Л = (р—а)п/р области допустимых значений т, задаваемые неравенствами (9) и (10), совпадают, поскольку равны друг другу верхние границы т. Действительно
Л
р — а
п 2п — Л
р—а р р + а
Л= -----П
р—а
л=------П
рр
Поэтому, если рассматривать верхнюю границу т, как функцию от Л, то верхняя граница будет непрерывна по Л на промежутке ]0, п[, что, несомненно, относится и к нижней границе.
Кроме того, очевидно, что на промежутке от 0 до п(р — а)/р верхняя граница т возрастает, а от п(р — а)/р до п — убывает, откуда следует что при всех Л выполняется неравенство:
п
т < —, что эквивалентно рт < п.
р
В неравенствах (9)-(10) нижняя граница области изменения т получена из неравенства (3), а верхняя — из неравенства (4). Поскольку правая часть уравнения (2) непрерывна относительно т, то при пробегании т всех значений из открытого промежутка (9)-
(10) правая часть уравнения (2) пробегает все значения из открытого промежутка ] — 1,1[. Находящаяся в левой части уравнения (2) функция косинуса монотонна на промежутке ]0,п[, следовательно для любого ф Є ]0, п[ существует такое т из (9) или (10), что правая часть уравнения (2) при этом значении т равна cos ф.
99
При этом 0 < стт < рт < п, то есть геодезические дуги длинами Л, стт и рт образуют сферический треугольник с углом ф между первыми двумя сторонами. Другие два угла а и ф при вершинах M и P соответственно выражаются по формуле косинусов через стороны следующим образом:
, cos стт — cos Л cos рт
(11) cos ф = ----------------------,
sin Л sin рт
cos Л — cos рт cos стт
(12) cos а =-----------------------.
sin рт sin стт
Знаменатели правых частей уравнений (11) и (12) в нуль не обращаются, поскольку 0 < стт < рт < п и 0 < Л < п, поэтому уравнения (11) и (12) справедливы при всех т. А так как уравнения
(11) и (12) задают не углы, а их косинусы, то нужно определить промежутки, из которых берутся углы, удовлетворяющие этим уравнениям. Будем считать, что углы ф и а берутся из промежутка [0, п]. Очевидно, что угол ф является углом между плоскостью большой окружности Cpe и вектором скорости догоняющего vp так же, как угол ф является углом между той же плоскостью и вектором скорости убегающего Ve .
Мы рассматриваем углы ф, ф и а из промежутка [0,п]. Но убегающий может выбирать любое направление движения, а промежуток [0, п] охватывает лишь половину возможных направлений. Дело в том, что сферический треугольник всегда целиком лежит только в одной полусфере, определяемой большой окружностью, которая содержит любую из сторон этого сферического треугольника. В частности, сферический треугольник PEM всегда целиком помещается в одной из полусфер, на которые делит сферу большая окружность Cpe. Поэтому мы можем считать, что положительные значения углов ф и ф задают сферический треугольник в «правой» полусфере, а отрицательные — в «левой». При этом очевидно, что углы ф и ф имеют всегда один и тот же знак. Следовательно, достаточно рассматривать только неотрицательные значения углов, считая при этом, что при отрицательных значениях углов получается такой же результат, как и при равных им по абсолютной величине положительных значени-
ях, с точностью до зеркального отражения от плоскости большой окружности С РЕ.
Поскольку геодезическое расстояние между двумя точками на единичной сфере не превосходит п, причем равенство п достигается только при диаметрально противоположном расположении точек, то можно говорить, что каково бы ни было геодезическое расстояние Л € ]0,п[ между игроками и при любом выборе убегающим вектора скорости уе, не являющегося касательным вектором в точке Е к большой окружности С РЕ, догоняющий может выбрать такое направления вектора скорости ур, что соответствующие большие окружности СЕ, СР и СРЕ составят сферический треугольник с отношением боковых сторон а : р. Предложение доказано.
Предложение 2. (Единственность). Уравнение (2) задает взаимнооднозначное соответствие между ф из ]0,п[ и т из (9)-
Доказательство. В предыдущем предложении мы доказали, что каждому ф соответствует свое т. Докажем, что каждому ф соответствует единственное т.
Поскольку cos ф непрерывная ограниченная монотонная на ]0, п[ функция, и правая часть уравнения (2) ограничена и непрерывна по т на ограниченном промежутке (9)-(10), то для доказательства достаточно показать монотонность правой части уравнения (2) на промежутке (9)-(10). Возьмем производную от правой части уравнения (2) по т и, приравняв ее к нулю, попробуем найти корни.
(10).
sin Л sin ат sin Л sin ат (—р sin рт + а cos Л sin ат)
d ( cos рт — cos Л cos ат
sin2 Л sin2 ат а (cos рт — cos Л cos ат) sin Л cos ат
0,
—р sin Л sin ат sin рт + а sin Л sin2 ат cos Л —
a cos Л sin Л — sin Л(а cos рт cos ат + р sin рт sin ат) = 0,
Последнее выражение содержит противоречие, ибо р > а > 0 и значит, р/а > 1, а косинус не может превосходить единицу.
Таким образом, производная корней не имеет, что доказывает монотонность правой части уравнения (2), а, следовательно, и все предложение.
Замечание 1. Доказаны существование и единственность ур, однозначно определяемого углом ф, зависящим от расстояния Л и угла ф, а угол ф задается вектором скорости убегающего уе, то есть можно ввести в рассмотрение функцию Щ: Ур = П1(уе, Л; р, а).
Определение 1. Выбор догоняющим скорости ур по функции П1 мы будем называть параллельной геодезической стратегией преследования на сфере или просто — П1-стратегией.
2. Наискорейшее свойство П1-стратегии
Мы доказали, что для каждого выбранного направления движения убегающего, определяемого углом ф, П1-стратегия однозначно задает величину т, являющуюся временем движения игроков от начального положения до точки встречи М, при условии,
a cos Л — a cos рт cos ат — р sin рт sin ат = 0, cos Л — cos рт cos ат
р \ sin рт sin стт откуда в силу (12) следует
что убегающий будет все время двигаться вдоль одной и той же большой окружности. Эта точка М будет являться центром преследования П1-стратегии. Докажем одно важное свойство П1 -стратегии, заключающееся в том, что не существует стратегии для догоняющего, позволяющей настигнуть убегающего раньше, чем тот достигнет центра преследования, двигаясь по кратчайшему пути.
Предложение 3. (Наискорейшее свойство П1 -стратегии).
Если убегающий движется вдоль одной и той же большой окружности с постоянной скоростью а, то догоняющий не сможет догнать его раньше момента времени £ = т, определяемого П1 -стратегией.
Доказательство. Предположим противное. Пусть существует некоторый другой путь, по которому догоняющий настигает убегающего в некоторой точке М1 в момент времени Т1: Т1 < т (рис. 3). Этот путь отличен от геодезической дуги в силу единственности, доказанной в предложении 2. Очевидно, что точка М1 лежит внутри дуги ЕМ. Соединим точки Р и М1 геодезической дугой. Поскольку геодезическая дуга короче любой другой линии, соединяющей те же точки, то, двигаясь по этой дуге, догоняющий окажется в точке М1 в момент времени т1 < т1 .В
этот момент убегающий будет находиться в некоторой точке Е внутри геодезической дуги ЕМ1. Если далее догоняющий двинется вдоль дуги ЕМ1 в сторону точки Е1, то он встретится с убегающим в некоторой точке М2, лежащей внутри дуги Е1М1, в момент времени т2. Так как точка М2 лежит внутри дуги ЕМ1, то ат2 < ат1, откуда т2 < т1. Точно так же, как из т1 получили т2, мы можем из т2 получить тз и так далее. Получится убывающая ограниченная последовательность {тп}, заданная на замкнутом отрезке [0,т]. Она имеет предел т* внутри этого отрезка. В момент времени т* убегающий окажется в такой точке М* на геодезической дуге ЕМ, что длина дуги ЕМ* равна ат*. Соответственно длина геодезической дуги РМ* равна рт*. Следовательно, получили, что и т, и т* удовлетворяют уравнению (2) при одном и том же ф. Это противоречит предложению 2, что и доказывает наше предложение.
Следствие 1. Если убегающий движется вдоль геодезической дуги ЕМь а догоняющий вдоль геодезической дуги РМ1 и догоняющий попадает в точку М1 раньше убегающего, то центр преследования М* лежит внутри геодезической дуги ЕМ1.
3. Вырожденные случаи
Теперь рассмотрим вырожденные случаи, которые мы не рассматривали в разделе 1, и для которых П1-стратегия еще не определена. Это те случаи, когда угол ф принимает крайние значения, равные 0 и п, то есть когда убегающий выбирает направление движения вдоль большой окружности С РЕ (рис. 4). С другой стороны, вырожденные случаи возникают при крайних значениях Л, которые тоже равны 0 и п, то есть когда игроки располагаются соответственно в одной и той же общей точке либо в диаметрально противоположных точках. Впрочем случай Л = 0 мы рассматривать не будем, ибо при нулевом расстоянии между игроками игра не может состояться.
Угол ф = 0 соответствует движению убегающего навстречу догоняющему, а угол ф = п соответствует движению убегающе-
^ = ° -----V> = 7r
А <<Р^Л
Р Р
Рис. 4. Вырожденные случаи при ф = 0 и ф = п,
го прочь от догоняющего. При таких углах ф сферический треугольник вырождается, хотя из общих соображений понятно, что догоняющий должен тоже двигаться вдоль большой окружности Cpe . Подтвердим эти соображения точными выкладками.
3.1. КРАЙНИЕ ЗНАЧЕНИЯ УГЛА УБЕГАНИЯ
Мы можем легко получить значения т при ф = 0 и ф = п. Действительно, подставив эти крайние значения ф в уравнение
(2), мы получим два уравнения, правые и левые части которых совпадают с правыми и левыми частями неравенств (3) и (4), только связаны эти части уже отношениями точного равенства:
cos рт — cos Л cos ат cos рт — cos Л cos ат
sin Л sin ат sin Л sin ат
Из этих уравнений можно получить, действуя подобно как
при доказательстве предложения 1, что если ф = 0, то
Л
р + а
а если ф = п, то
т =
Л р — а
------, при 0 < Л ^----------п,
р — а р
2п — Л р — а ---------, при----------п ^ Л ^ п.
р — а р
Подставляя найденные т в уравнение (11), получим, что
ф = 0, когда ф = 0, и
0, при 0 < Л ^ р—ап, р
р—а
п, при------п ^ Л ^ п,
когда ф = п.
р
При этом заметим, что в крайних значениях ф сохраняется непрерывность зависимостей т(ф) и ф(т). В этом просто убедиться, проверив легко вычисляемые пределы ф и ф при стремлении т к Л/(р + а), Л/(р — а) и (2п — Л)/(р + а). Для поиска предела cos ф воспользуемся формулой (11).
аЛ рЛ
cos---------cos Л cos
lim cos ф =----------------р + а
р + а
р+ст
sin Л sin
рЛ
р + а
аЛ 1/ /Л — рЛ\ /Л + рЛ
cos--------------cos ------------- + cos --------
р + а 2 \ У р + а J____________У р + а
1 / / Л — рЛ \ / Л + рЛ
- cos ------------- — cos --------
2 V ур + а/ ур + а
Т—>
стА 1 стА 1 /А + рА
cos------------------- cos--------------------- cos
р+ст 2 р+ст 2 \Р+ст/ 1
1 стА 1 /А + рА
- cos----------- cos
2 р + ст 2 \р + ст
Точно так же можно найти предел cos ф, хотя и так очевидно, что
lim cos ф = 1, л
Т—> —:--
р+а
потому как крайние значения т в промежутках (9)-(10) получены из уравнения (2) путем подстановки крайних значений ф. Мы доказали, что уравнение (2) задает взаимно-однозначное непрерывное соответствие между ф и т, поэтому мы имеем право написать
lim т А
а, следовательно, и
^0 р + ст
lim ф = 0.
■ф^-0
Теперь рассмотрим предел ф, когда ф стремится к п. Здесь нужно рассмотреть два случая. Первый случай, когда А < (р — ст)п/р, и второй случай, когда А > (р — ст)п/р. Возможен еще и третий случай, когда А = (р — ст)п/р, но он является особым случаем, который мы рассмотрим отдельно.
В первом случае нетрудно убедиться, приводя те же доводы, что и при нахождении предела т при ф ^ 0, что при ф, стремящемся к п, время т стремится к А/(р — ст). Найдем предел cos ф при т ^ А/(р — ст).
lim cos ф = л
Т—> ---
р-а
стА рА
cos-----------cos А cos--------
р — ст р — ст
рА
sin А sin-------------
р—ст
стА 1 / /А — рА\ /А + рА
cos------------------- cos -------------------- + cos
р — ст 2 \ \р — ст / \р — ст
1 / / А — рА \ / А + рА
- cos ---------------------- — cos
2 у \р — ст / \р — ст
стА 1 —стА 1 /А + рА
cos-------------- cos-------------- cos
р — а 2 р — а 2 \ Р — а 7 i
1 —аА 1 /А + рА
- cos----------cos -----------
2 р — а 2 \р — а
Отсюда можно заключить, что ф ^ 0 при ф ^ п, когда выполнено неравенство А < (р — а)п/р.
Во втором случае из тех же соображений, что и в первом, мы имеем, что при ф, стремящемся к п, т стремится к (2п — А)/(р — а). Прежде, чем искать предел cos ф приведем числитель правой части уравнения (11) к более удобному виду.
cos ат — cos А cos рт = cos ат — 1 cos^ — рт) — 1 cos^ + рт) =
= 1 ( cos ат — cos^ — рт) j ^ cos ат — cos^ + рт) j =
' ат + А — рт \ / ат — А + рт
= — sin I -------------- sin
2
стт + А + рт \ ( стт — А — рт
— sin I ----------;---------- I sin I ---------------------
'А + т(ст — р)\ . (т(ст + р) — А = - sin I ------------- -------— sin ' v '
'А + т(ст + р)\ . /т(ст — р) — А
- sin і ---------^---------— sin '
2 / V 2
Теперь отыщем предел cos ф, воспользовавшись только что преобразованным выражением (11).
lim cos ф =
2п—А Т ^ р+ст
— sin
Ар + Act + 2пст — 2пр — Act + Ар 2(р + ст)
sin
2п - 2А
sin А sin
=0
sin
А + 2п — А 2
sin
2пр — Ар р + ст
(2п — А)(ст — р) А
2(р + ст) 2
sin А sin
2пр — Ар р + ст
Ар + пст — пр .
— sin I ----------------------------------------- I sin А
р + ст
sin А sin
2пр — Ар р + ст
Сократив sin Л, заметим, что сумма углов, являющихся аргументами функции синуса в числителе и знаменателе, равна п:
Ар + пст — пр^ ^ 2пр — Ар
пр + пст
: -------- = п.
р + ст ) \ р + ст ) р + ст
А если сумма двух углов равна п, то их синусы равны:
sin^ — а) = sin п cos а — cos п sin а = sin а, откуда заключаем,
что
lim cos ф = —1.
2п—А
Т ^ Р+о
Это означает, что ф стремится к п при 0, стремящемся к п, когда А > (р — ст)п/р.
3.2. СЛУЧАЙ, КОГДА ПУТЬ ПРЕСЛЕДОВАНИЯ РАВЕН п
Особым случаем является случай, когда А = (р — ст)п/р. При 0, стремящемся к п, т будет стремиться к п/р. Это было отмечено, в частности, в замечании к (9) и (10). Если мы попытаемся найти предел cos ф, подставляя это значение т в выражение (11), то получим неопределенность вида 0/0. Этого следовало ожидать, поскольку при таких значениях А и 0 точка встречи M будет диаметрально противоположна точке P, и длина пути, пройденного
догоняющим до точки встречи, будет равна п при любом значении угла f. Тем не менее этот предел существует, и его можно найти воспользуемся правилом Лопиталя.
d ( р — а
— ( cos ат — cos---------п cos рт
lim cos ф = lim —т -------------------------Р-----------
Г Т_П d / . р — а .
‘ р ‘ р — sin-------п sin рт
dT V р
=0
а р — ар а
—a sin — п + р cos-п sin -п —а sin — п
Р________Р_____Р ______Р_
а
. / а \ р . а р-
р sin п-----п cos — п —р sin — п р
V р У р р
=-1
3.3. НАИСКОРЕЙШЕЕ СВОЙСТВО ПРИ КРАЙНИХ ЗНАЧЕНИЯХ УГЛА УБЕГАНИЯ Обсудим полученные результаты.
При ф = 0, то есть, когда убегающий движется в сторону догоняющего по кратчайшей дуге, угол ф равен 0, то есть догоняющему следует двигаться навстречу убегающему по той же дуге, являющейся частью большой окружности Cpe . Наискорейшее свойство в этом случае несомненно выполняется. Более того, в этом случае догоняющий поймает убегающего за время, равное А/(р + а), являющимся наименьшим возможным временем игры. Другими словами, даже если и убегающий, и догоняющий стремились бы встретиться как можно раньше, все равно они не смогли бы уменьшить это время, поскольку невозможно достичь большей скорости сближения игроков, чем р + а. А именно такая скорость сближения наблюдается в нашем случае при движении игроков навстречу друг другу по кратчайшему пути.
При ф = п, то есть, когда убегающий движется от догоняющего вдоль большой окружности Cpe возможны три случая.
Если догоняющий может настигнуть убегающего, двигаясь ему вслед так, чтобы расстояние, пройденное догоняющим от начальной точки P до точки встречи M с убегающим, было меньше 110
п, то, очевидно, это возможно при Л/(р — ст) < п/р, где в левой части стоит отношение расстояния между игроками в начальный момент времени к скорости их сближения, что равно времени преследования, а в правой — время прохождения догоняющим дуги, длина которой равна п.
Понятно, что в этом случае при таком пути преследования наискорейшее свойство выполняется, поскольку догоняющий движется из точки Р в точку М по геодезической дуге и нет других геодезических дуг, соединяющих эти две точки. Таким образом, при Л < п(р — ст)/р и ф = п наискорейшее свойство обеспечивается углом ф = 0, что равно полученному пределу угла ф при ф ^ п.
Если же догоняющий, двигаясь вслед убегающему, настигает его в некоторой точке М1, пройдя путь, длина которого больше п, то очевидно, что, двигаясь в противоположную сторону по той же большой окружности, он встретится с убегающим раньше. В самом деле, при движении догоняющего вслед убегающему скорость их сближения равна р — ст, и следовательно время движения игроков до встречи равно Л/(р — ст), которое больше п/р. При движении догоняющего в обратную сторону, то есть прочь от убегающего, скорость сближения игроков равна р + ст, а расстояние, которое они вместе должны преодолеть равно 2п — Л, значит, время их движения до встречи равно (2п — Л)/(р + ст). Из неравенства Л/(р — ст) > п/р следует, что Л > п(р — ст)/р, откуда получим неравенство для времени движения игроков до встречи при обратном движении догоняющего
Таким образом, из тех же соображений, что и в предыдущем случае, при Л > п(р — ст)/р и ф = п наискорейшее свойство обеспечивается углом ф = п, что также равно полученному пределу угла ф при ф ^ п.
То есть, первые два случая, хотя и являются вырожденными, не имеют никаких особенностей, поскольку наискорейшее свой-
2п — Л р + ст
<
п
р + ст
р + ст
р ’
ство в этих случаях обеспечивается значениями угла ф, совпадающими с пределами угла ф при стремлении угла ф к значениям 0 или п, при которых происходит вырождение
Особым случаем является случай, когда Л = п(р — ст)/р, то есть когда догоняющий, двигаясь вслед убегающему, настигнет его за время, в точности равное п/р, пройдя при этом путь, длина которого равна п. В этом случае точка М, в которой происходит встреча игроков, является диаметрально противоположной точкой относительно точки Р, где находится догоняющий в начальный момент времени. Поскольку через диаметрально противоположные точки на сфере можно провести сколь угодно много больших окружностей, то двигаясь по любой из них из точки Р в точку М, догоняющий пройдет путь одной и той же длины п за одно и то же время, равное п/р, подобно тому, как при путешествии из Северного полюса в Южный полюс вдоль меридиана, преодолевается всегда одно и то же расстояние вне зависимости от того, по какому меридиану проходит путешествие. Таким образом, при Л = п(р — ст)/р и ф = п любое значение угла ф обеспечивает поимку убегающего за время п/р, которое не может быть уменьшено. Тем не менее, существует предел угла ф при ф ^ п, когда Л = п(р—ст)/р, и этот предел равен arccos(ст/р). Можно показать, что при изменении угла ф от 0 до п угол ф монотонно возрастает от 0 до arccos(ст/р).
На основании сделанных выводов строгие неравенства (9) и
(10) можно записать в виде нестрогих неравенств:
„ч Л Л р — ст
(13) ----- ^ т ^--------, при 0 < Л ^-------------п,
р + ст р — ст р
Л 2п — Л р — ст^.
(14) ----- ^ т ^ -------, при ------------п ^ Л < п.
р + ст р + ст р
3.4. КРАЙНЕЕ ЗНАЧЕНИЕ РАССТОЯНИЯ Л МЕЖДУ ИГРОКАМИ
Мы рассмотрели случаи, когда крайние значения принимает угол ф. Теперь рассмотрим случай, когда крайнее значение принимает Л — геодезическое расстояние между игроками в начальный момент времени. Как мы знаем, наибольшее значение, 112
которое может принимать Л, равно п, что соответствует такому положению игроков в начальный момент времени, при котором они находятся в точках Р и Е, являющихся диаметрально противоположными друг другу точками. В этом случае нельзя однозначно определить большую окружность С РЕ, поскольку через диаметрально противоположные точки Р и Е можно провести сколь угодно много больших окружностей. Однако ничто не мешает произвольно выбрать одну из них в качестве базовой, от которой мы будем отсчитывать углы ф и ф.
Вычислим предел области допустимых значений т при стремлении Л к п. Для этого достаточно подставить в двойное неравенство (14) значение Л = п, после подстановки получим, что
пп
^ т ^
р + а р + а
откуда следует, что т при любом значении угла ф принимает одно и то же единственное значение, равное п/(р + а). Отсюда можно сделать вывод, что выбор базовой большой окружности не влияет на результат игры.
При Л = п нельзя получить значения косинусов углов ф и ф из уравнений (11) и (2), поскольку в этом случае в знаменателях правых частей этих уравнений будет стоять 0. Это и понятно, поскольку, в частности, уравнение (2) получено из уравнения (1) в предположении, что сомножители у cos ф в уравнении (1) отличны от нуля, в противном случае любые значения угла ф будут удовлетворять уравнению (1). Именно этим обусловлен произвол в выборе базовой большой окружности Cpe . Однако мы можем рассмотреть предел отношения косинусов углов ф и ф при стремлении Л к п.
Из (2) и (11) получим, что
cos ф cos ат — cos Л cos рт sin ат
cos ф cos рт — cos Л cos ат sin рт ’
Подставляя в полученное равенство Л = п, увидим, что числитель и знаменатель первой дроби в правой части совпадают. Вторая
дробь представляет отношение синусов двух углов, сумма которых при т = п/(р+а) представляет собой па/(р+а)+пр/(р+а), что равно п. А мы знаем, что если сумма двух углов равна п, то их синусы равны, откуда следует, что отношение косинусов углов ф и ф равно 1, а это значит, что равны сами углы ф и ф, поскольку оба они изменяются на промежутке [0, п]. Вычислим также и угол ^, воспользовавшись уравнением (12):
cos Л — cos рт cos ат
sin рт sin ат
2 cos Л — cos(p — а)т — cos(p + а)т
cos(p — а)т — cos(p + а)т
Л=п
п
Т = Р+ст
р + а
откуда заключаем, что ^ = п. На основании полученных результатов можно сделать вывод, что когда игроки в начальный момент времени располагаются в диаметрально противоположных точках, то при любом направлении движения убегающего догоняющему следует двигаться навстречу убегающему по той же большой окружности, по которой движется убегающий. Очевидно, что наискорейшее свойство в этом случае выполняется.
Теперь мы можем сказать, что Щ-стратегия определена для всех возможных положений игроков на сфере и для всех возможных направлений движения убегающего. При этом основным свойством П1-стратегии является наискорейшее свойство.
Литература
1. ПЕТРОСЯН Л.А. Дифференциальные игры преследования.
- Л.: Изд-во Ленингр. ун-та, 1997.
2. ПЕТРОСЯН Л.А. Дифференциальные игры на выживание со многими участниками // Доклады АН СССР. - 1965. -Т. 161, № 2. - С. 285-287.
PARALLEL PURSUIT STRATEGIES IN A SIMPLE MOTION GAME ON THE SPHERE. GEODESIC PURSUIT.
Alexander M. Kovshov, Saint-Petersburg State University, Saint-Petersburg, Cand.Sc. ([email protected]).
Abstract: The two-person zero-sum differential simple pursuit game on the sphere is considered. The strategy of geodesic pursuit, having some properties of parallel pursuit strategy on the plane, is defined, the existence and uniqueness in general are proved. All special cases are considered. The fastest property of the geodesic pursuit strategy is proved.
Keywords: differential games, simple motion, pursuit on the sphere.
Статья представлена к публикации членом редакционной коллегии Л. А. Петросяном