ИГРОВАЯ ЗАДАЧА ПАТРУЛИРОВАНИЯ ЯХТОЙ ЗАДАННОГО РАЙОНА
Рассматривается задача об управлении яхтой с переменным ветром. Цель управления — удержать яхту на заданном промежутке времени в фиксированной области. Задача рассматривается в виде дифференциальной игры. Второй игрок управляет ветром.
Ключевые слова: управление, дифференциальная игра, стратегия.
1. Постановка задачи
В задаче выбора наилучшего курса яхты скорость яхты зависит от угла, который образует курс яхты и направление ветра. При постоянной по направлению и по величине скорости ветра в [1] рассмотрена конкретная модель такой зависимости. Исследуется задача, когда выгоднее идти галсами, чем прямо по заданному курсу.
Если рассматривать случай, когда вектор скорости V ветра может меняться, находясь в некотором множестве V, то вектор скорости и яхты будет находиться в некотором множестве и(V), зависящем от скорости ветра. Цель управления яхтой заключается в том, чтобы удержать ее в заданном множестве Z (например, вблизи острова) на заданном промежутке времени. В каждый момент времени скорость ветра считается известной.
Рассмотренный пример является частным случаем игровой задачи управления:
г = -и, г е Яп, V е V, и е и(V) С Кп. (1.1)
Здесь V — множество произвольной природы; при каждом V е V множество и(V) является непустым компактом. Считаем, что ограниченным является множество
К = У и(V). (1.2)
Заданы число р > 0 и замкнутое множество Z С Кп. Первый игрок, выбирая управление и е и(V), стремится осуществить удержание
г(Ь) е Z, 0 < Ь < р. (1.3)
Второй игрок, выбирая управление V е V, стремится нарушить включение (1.3) в какой-то момент времени Ь е [0,р].
Рассмотрим игру, когда управление первого игрока строится в зависимости от реализовавшегося в момент времени Ь состояния г(Ь) и от значения в этот момент времени управления v(t) второго игрока. Предположим, что изменение управления v(t) с течением времени меняется не очень сильно. Чтобы строго сформулировать это допущение, введем в рассмотрение евклидов шар 5' в Кп
единичного радиуса и с центром в начале координат. Требование на у(1) запишем в следующем виде: существует число Ь > 0 такое, что
и (у(£)) С и (у(т)) + Ь(т — Ь)Б при 0 < Ь<т < р. (1.4)
Под управлением (и, X) первого игрока понимаем [2] правило, которое каждому состоянию Ь > 0, г Е Яп и любому V Е V ставит в соответствие конечный набор
и8 = и8(Ь,г^) Е и(V), в =1,...,к = к(Ь,г,ь), Х3 = Х8(Ь,г,ь) > 0,
Х1 + Х2 + • • • + Хк = 1. (1.5)
Движение системы (1.1) будем определять с помощью ломаных. Пусть задано начальное состояние Ь0 > 0, г0 = г(Ь0) Е Кп. Возьмем разбиение
ш : ¿о <Ь < ••• <и < ¿¿+1 < • • • < ¿1+1 = р (1.6)
с диаметром ¿(ш) = шах0<г<г (¿¿+1 — Ьг). Построим ломаную
(Ь) = гш(и) — ( и*(г)¿г, Ьг <Ь < ¿¿+1, I = 0,1. (1.7)
Здесь обозначено
и*(г) = щ(и,гш(и)^(и)) при Ь(з-1) < г < Ь(8\ в = 1,...,к(и,гш(и)^(и)),
8
и(0) = Ьг, Ь8 = Ьг + (Ьг+1 — ¿г) ^ Хд. (1.8)
9=1
Содержательный смысл управлений (1.8) следующий. С помощью чисел Х8 первый игрок разбивает отрезок [¿¿,¿1+1] точками Ьг = Ь(0) < Ь(1) < ••• < Ь(8) <
■ х ( к) х (х (8 1) X ( 8) 1
< ••• < Ц = ¿¿+1 и на каждом отрезке из промежутков (ц ,ц ] движется с постоянной скоростью и8(Ьг,гш(Ьг)^(Ьг)). Управление второго игрока постоянно на промежутке (Ь(8 1),4+)1] и равно v(ti).
Из ограниченности множества (1.2) следует, что все ломаные (1.7) удовлетворяют условию Липшица с одной и той же константой. Следовательно, семейство ломаных (1.7) удовлетворяет условию теоремы Арцела [3]. Под движением
системы (1.1) с управлением (1.5) и с начальным условием г(Ь0) = г0 понимаем
любую функцию г : [Ь0,р] ^ Яп, которая является пределом равномерно сходящейся на отрезке [Ь0,р] последовательности ломаных (1.7), у которых диаметр разбиения стремится к нулю.
Отметим, что
гь(т) т
и*(г)ё.г = (Ьг+1 — и)^2 Х8 щ(и, гш (и)^(и)), в = 1,к. (1.9)
¿4 8=1
2. Оператор программного удержания и его свойства
Следуя [4; 5], введем для игры (1.1) оператор программного удержания Б,. Пусть X С Яп, о > 0. Точка г Е Б,(X) тогда и только тогда, когда для любого V Е V найдется измеримое управление и : [0,о] — и(V) такое, что
г — и(г)йг Е X при всех 0 < Ь < о.
0
Для любого компакта Г С Яп и для любого отрезка [а,Ь] С Я имеет место формула [6]
^ /(г^г | / :[а,Ь] -— Г измерима |> = (Ь — а)соГ.
Здесь посредством со Г обозначена выпуклая оболочка множества Г.
Используем операции сложения множеств X и У из Яп и умножение множества X на число а:
X + У = {г = х + у : х Е X,y Е У} , aX = {г = ах : х Е X} .
Тогда для любого числа о > 0 и множества X С Яп верна формула
б, (X )=П и (X + отели (V)), Б, (0) = 0. (2.1)
veV0<т<1
Этот оператор обладает следующими свойствами.
Свойство 2.1. ) = X.
Свойство 2.2. Если 0 < 6 < о и X С У, то Б^(X) С Б,(У).
Свойство 2.3. Б,(X + У) Э Б,(X) + У.
Свойство 2.4. Б^(Б,(X)) С Б$+,(X).
Свойство 2.5. Б,(оX) = оБ1(X).
Свойство 2.6. Если X — замкнутое множество, то множество Б,(X) является замкнутым (пустое множество считаем замкнутым).
Свойство 2.7. Если X — выпуклое множество и Б,(X) = 0, то множество Б, (X) является выпуклым.
Эти свойства непосредственно следуют из формулы (2.1).
Свойство 2.8. Если X — выпуклое множество, то Б^(Б,(X)) = Б$+,(X).
Доказательство этого свойства проводится так же, как доказательство свойства 2.7 в работе [2].
Утверждение 1. Пусть начальное состояние г(0) = г0 Е Бр(%). Тогда существует точка V* Е V такая, что постоянное управление v(t) = V* при всех Ь < р, г Е Яп обеспечивает для любого управления (1.5) первого игрока и для любого движения г(Ь) выполнение условия
г(Ь*) Е % при некотором 0 < Ь* < р. (2.2)
Доказательство. Поскольку г0 Е Бр(%), то из формулы (2.1) следует, что найдутся точки V* Е V и Ь* Е [0, р], для которых
г0 — Ь*и Е X для любого и Е сои(V*). (2.3)
Из формул (1.7) и (1.8) следует, что при v(t) = V* каждая ломаная удовлетворяет равенству
гш(Ь*) = го — Ь*иш(Ь*) при некотором иш(Ь*) Е и(V*).
Следовательно, аналогичному равенству удовлетворяет и любое движение г(Ь). Отсюда и из (2.3) получим (2.2). □
3. Построение управления первого игрока
При построении управления первого игрока, обеспечивающего удержание (1.3), воспользуемся схемой из работы [2].
Утверждение 2. Пусть множество % является выпуклым и замкнутым. Тогда существует управление (1.5) такое, что для любого управления v(t) Е V и для любого начального состояния г(0) = г0 Е Бр(%) выполнено удержание (1.3).
Доказательство. Обозначим
и0(V) = {г = и — и* : и Е сои(V),и* Е сои(V)} . (3.1)
При каждых г Е Яп, V Е V, 0 < Ь < р, Бр-г(%) = 0 положим
е(Ь,г^) = шт е, е > 0, г Е Бр—(%) + еЩ^) + еБ. (3.2)
Множество Бр-1 (%) является замкнутым, а множества и0(V) и Б — компакты. Поэтому включение (3.2) выполнено при е = е(Ь,г^). Из определения множества (3.1) следует, что
г + е(Ь, г, v)(u*(t, г, V) — и(Ь, г, V)) Е Бр^(%) + е(Ь, г, v)Б (3.3)
при некоторых и*(Ь,г^) Е сои(V) и и(Ь,г^) Е сои(V).
По теореме Каратеодори [7, теорема 1.1.1]
к
и(Ь,г^) = \3(Ь, г^)и3(Ь, г^), \3(Ь,г^) > 0,
3=1
к
'£\,{1,г^) = 1, и3(Ь,г^) Еи(V). (3.4)
3=1
Здесь к = к(Ь,г^) < п + 1.Эти функции берем в качестве управления (1.5) первого игрока.
Пусть в процессе игры реализуется управление v(t) Е V второго игрока, удовлетворяющее условию (1.4). Тогда из формулы (3.1) следует, что
и0^(Ь)) С и0^(т)) + Ь(т — Ь)Б при 0 < Ь < т < р. (3.5)
Возьмем разбиение ш (1.6) и построим ломаную (1.7) с функциями (3.4). Обозначим
г1 = гш (и), VI = v(ti), и(г) = u(ti,гi,Vi), и*) = и*(и,гг ^^, ег = е(и,гг^г). Тогда из (3.3) следует, что при г = 0 выполнено включение
^ ^и*^ — еiu(i) Е Бр-г1 (%) + еiБ, (3.6)
причем е0 = 0. Предположим, что в момент времени ti, г < I + 1 выполнено включение (3.6). Тогда из утверждения 2 следует, что Бр-^+1 (%) = 0. Используя формулу (2.2) и свойство 8, найдем точку и Е соиV) такую, что
^ + еи* — — (ti+1 — ti)u Е Бр-и+1 (%) + ^Б. (3.7)
Из формулы (1.9) получим, что
^+1 = г — (и+1 — и)и{г).
Отсюда и из (3.7) будем иметь, что
^+1 + (ti+1 — ti — + еи*^ — (ti+1 — ti)u Е Бр-^+1 (%) + ЦБ. (3.8)
Пусть ti+l — и > еi. Тогда
(ti+1 — ti — еi)u(i) + еи*^ Е (ti+1 — и)сои(vi).
Отсюда и из (3.8) следует, что
^+1 Е Бр-г1+1 (%) + (ti+l — ti)Uо(vi) + е^Б.
Из этого включения, используя (3.5), получим
^+1 Е Бр-и+1 (%) + (ti+1 — ti)U0(vi+1) + (^ + \ti+1 — и\2)Б.
Отсюда и из (3.2) следует, что
и+1 < (ti+l — и)(1 + L(ti+l — ti)).
Пусть ti+l — и < еi. Тогда
(еi — ^+1 + ti)u(i) + (ti+l — и)и Е е^оиV) и, как следует из (3.8) и (3.5),
^+1 Е Бр-и+1 (%) + еiU0 (vi) + еБ С Бр-и+1 (%) + еiU0(vi+1) + (еi + L(ti+l — ti)еi)Б. Отсюда и из (3.2) получим, что
еi+l < ^(1 + L(ti+l — ti)).
Объединяя оба случая, будем иметь, что включение (3.6) выполнено при
i + 1, причем
Q+1 < max{ti+i — ti; ti)(1 + L{ti+i — ti)). (3-9)
Поскольку б0 = 0, то из неравенства (3.9) следует, что
6i+1 < d(u)eLp. (3.10)
Обозначим
Uo = co У Uo(v).
veV
Из ограниченности множества (1.2) следует ограниченность множества U0. Из формул (3.6), (3.10), используя включение Dp-ti(Z) С Z, получим, что
(ti) G Z + d(u)eLp(U0 + S), i = 0,1,... ,l + 1. (3.11)
Пусть последовательность ломаных гШк (t) с диаметром разбиения d(uk), стремящемся к нулю, равномерно на отрезке [0,_р] сходится к движению z(t). Все эти ломаные удовлетворяют условию Липшица с одной и той же константой N. Тогда
z^k(t) G zш(ti) + Nd(uk)S при ti < t < ti+1.
Отсюда и из (3.11) получим, что
Zwk(t) G Z + d(uk)eLpUo + d(uk)(eLp + N)S, 0 < t < p.
Устремляя d(uk) к нулю и используя замкнутость множества Z, получим требуемое включение (1.3). □
Список литературы
1. Крэггс, Дж. У. Задачи управления движением / Дж. У. Крэгсс // Математическое моделирование. — М., 1979. — С. 24-26.
2. Ухоботов, В. И. Игровая задача выбора наилучшего курса яхты / В. И. Ухобо-тов, И. В. Цеунова // Вестн. Юж.-Урал. гос. ун-та. — Сер. Мат. моделирование и программирование. — 2009. — Вып. 3. — С. 114-120.
3. Колмогоров, А. Н. Элементы теории функций и функционального анализа / А. Н. Колмогоров, С. В. Фомин. — М., 1972. — 496 с.
4. Пшеничный, Б. Н. Игра с простым движением и выпуклым терминальным множеством / Б. Н. Пшеничный // Теория оптимальных решений : тр. семинара. — Киев, 1969. — Вып. 3. — С. 3-16.
5. Ухоботов, В. И. Дифференциальная игра удержания / В. И. Ухоботов // Техн. кибернетика. — 1984. — № 2. — С. 70-76.
6. Hermes, H. The Generalized Differential Equation x G R(t, x) / H. Hermes // Advances in Mathematics. — 1970. — № 4. — P. 149-169.
7. Пшеничный, Б. Н. Выпуклый анализ и экстремальные задачи / Б. Н. Пшеничный. — М. : Наука, 1980. — 320 с.