Научная статья на тему 'Игровая задача патрулирования яхтой заданного района'

Игровая задача патрулирования яхтой заданного района Текст научной статьи по специальности «Математика»

CC BY
96
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЕНИЕ / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / СТРАТЕГИЯ

Аннотация научной статьи по математике, автор научной работы — Ухоботов Виктор Иванович, Цеунова Ирина Владимировна

Рассматривается задача об управлении яхтой с переменным ветром. Цель управления удержать яхту на заданном промежутке времени в фиксированной области. Задача рассматривается в виде дифференциальной игры. Второй игрок управляет ветром.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Игровая задача патрулирования яхтой заданного района»

ИГРОВАЯ ЗАДАЧА ПАТРУЛИРОВАНИЯ ЯХТОЙ ЗАДАННОГО РАЙОНА

Рассматривается задача об управлении яхтой с переменным ветром. Цель управления — удержать яхту на заданном промежутке времени в фиксированной области. Задача рассматривается в виде дифференциальной игры. Второй игрок управляет ветром.

Ключевые слова: управление, дифференциальная игра, стратегия.

1. Постановка задачи

В задаче выбора наилучшего курса яхты скорость яхты зависит от угла, который образует курс яхты и направление ветра. При постоянной по направлению и по величине скорости ветра в [1] рассмотрена конкретная модель такой зависимости. Исследуется задача, когда выгоднее идти галсами, чем прямо по заданному курсу.

Если рассматривать случай, когда вектор скорости V ветра может меняться, находясь в некотором множестве V, то вектор скорости и яхты будет находиться в некотором множестве и(V), зависящем от скорости ветра. Цель управления яхтой заключается в том, чтобы удержать ее в заданном множестве Z (например, вблизи острова) на заданном промежутке времени. В каждый момент времени скорость ветра считается известной.

Рассмотренный пример является частным случаем игровой задачи управления:

г = -и, г е Яп, V е V, и е и(V) С Кп. (1.1)

Здесь V — множество произвольной природы; при каждом V е V множество и(V) является непустым компактом. Считаем, что ограниченным является множество

К = У и(V). (1.2)

Заданы число р > 0 и замкнутое множество Z С Кп. Первый игрок, выбирая управление и е и(V), стремится осуществить удержание

г(Ь) е Z, 0 < Ь < р. (1.3)

Второй игрок, выбирая управление V е V, стремится нарушить включение (1.3) в какой-то момент времени Ь е [0,р].

Рассмотрим игру, когда управление первого игрока строится в зависимости от реализовавшегося в момент времени Ь состояния г(Ь) и от значения в этот момент времени управления v(t) второго игрока. Предположим, что изменение управления v(t) с течением времени меняется не очень сильно. Чтобы строго сформулировать это допущение, введем в рассмотрение евклидов шар 5' в Кп

единичного радиуса и с центром в начале координат. Требование на у(1) запишем в следующем виде: существует число Ь > 0 такое, что

и (у(£)) С и (у(т)) + Ь(т — Ь)Б при 0 < Ь<т < р. (1.4)

Под управлением (и, X) первого игрока понимаем [2] правило, которое каждому состоянию Ь > 0, г Е Яп и любому V Е V ставит в соответствие конечный набор

и8 = и8(Ь,г^) Е и(V), в =1,...,к = к(Ь,г,ь), Х3 = Х8(Ь,г,ь) > 0,

Х1 + Х2 + • • • + Хк = 1. (1.5)

Движение системы (1.1) будем определять с помощью ломаных. Пусть задано начальное состояние Ь0 > 0, г0 = г(Ь0) Е Кп. Возьмем разбиение

ш : ¿о <Ь < ••• <и < ¿¿+1 < • • • < ¿1+1 = р (1.6)

с диаметром ¿(ш) = шах0<г<г (¿¿+1 — Ьг). Построим ломаную

(Ь) = гш(и) — ( и*(г)¿г, Ьг <Ь < ¿¿+1, I = 0,1. (1.7)

Здесь обозначено

и*(г) = щ(и,гш(и)^(и)) при Ь(з-1) < г < Ь(8\ в = 1,...,к(и,гш(и)^(и)),

8

и(0) = Ьг, Ь8 = Ьг + (Ьг+1 — ¿г) ^ Хд. (1.8)

9=1

Содержательный смысл управлений (1.8) следующий. С помощью чисел Х8 первый игрок разбивает отрезок [¿¿,¿1+1] точками Ьг = Ь(0) < Ь(1) < ••• < Ь(8) <

■ х ( к) х (х (8 1) X ( 8) 1

< ••• < Ц = ¿¿+1 и на каждом отрезке из промежутков (ц ,ц ] движется с постоянной скоростью и8(Ьг,гш(Ьг)^(Ьг)). Управление второго игрока постоянно на промежутке (Ь(8 1),4+)1] и равно v(ti).

Из ограниченности множества (1.2) следует, что все ломаные (1.7) удовлетворяют условию Липшица с одной и той же константой. Следовательно, семейство ломаных (1.7) удовлетворяет условию теоремы Арцела [3]. Под движением

системы (1.1) с управлением (1.5) и с начальным условием г(Ь0) = г0 понимаем

любую функцию г : [Ь0,р] ^ Яп, которая является пределом равномерно сходящейся на отрезке [Ь0,р] последовательности ломаных (1.7), у которых диаметр разбиения стремится к нулю.

Отметим, что

гь(т) т

и*(г)ё.г = (Ьг+1 — и)^2 Х8 щ(и, гш (и)^(и)), в = 1,к. (1.9)

¿4 8=1

2. Оператор программного удержания и его свойства

Следуя [4; 5], введем для игры (1.1) оператор программного удержания Б,. Пусть X С Яп, о > 0. Точка г Е Б,(X) тогда и только тогда, когда для любого V Е V найдется измеримое управление и : [0,о] — и(V) такое, что

г — и(г)йг Е X при всех 0 < Ь < о.

0

Для любого компакта Г С Яп и для любого отрезка [а,Ь] С Я имеет место формула [6]

^ /(г^г | / :[а,Ь] -— Г измерима |> = (Ь — а)соГ.

Здесь посредством со Г обозначена выпуклая оболочка множества Г.

Используем операции сложения множеств X и У из Яп и умножение множества X на число а:

X + У = {г = х + у : х Е X,y Е У} , aX = {г = ах : х Е X} .

Тогда для любого числа о > 0 и множества X С Яп верна формула

б, (X )=П и (X + отели (V)), Б, (0) = 0. (2.1)

veV0<т<1

Этот оператор обладает следующими свойствами.

Свойство 2.1. ) = X.

Свойство 2.2. Если 0 < 6 < о и X С У, то Б^(X) С Б,(У).

Свойство 2.3. Б,(X + У) Э Б,(X) + У.

Свойство 2.4. Б^(Б,(X)) С Б$+,(X).

Свойство 2.5. Б,(оX) = оБ1(X).

Свойство 2.6. Если X — замкнутое множество, то множество Б,(X) является замкнутым (пустое множество считаем замкнутым).

Свойство 2.7. Если X — выпуклое множество и Б,(X) = 0, то множество Б, (X) является выпуклым.

Эти свойства непосредственно следуют из формулы (2.1).

Свойство 2.8. Если X — выпуклое множество, то Б^(Б,(X)) = Б$+,(X).

Доказательство этого свойства проводится так же, как доказательство свойства 2.7 в работе [2].

Утверждение 1. Пусть начальное состояние г(0) = г0 Е Бр(%). Тогда существует точка V* Е V такая, что постоянное управление v(t) = V* при всех Ь < р, г Е Яп обеспечивает для любого управления (1.5) первого игрока и для любого движения г(Ь) выполнение условия

г(Ь*) Е % при некотором 0 < Ь* < р. (2.2)

Доказательство. Поскольку г0 Е Бр(%), то из формулы (2.1) следует, что найдутся точки V* Е V и Ь* Е [0, р], для которых

г0 — Ь*и Е X для любого и Е сои(V*). (2.3)

Из формул (1.7) и (1.8) следует, что при v(t) = V* каждая ломаная удовлетворяет равенству

гш(Ь*) = го — Ь*иш(Ь*) при некотором иш(Ь*) Е и(V*).

Следовательно, аналогичному равенству удовлетворяет и любое движение г(Ь). Отсюда и из (2.3) получим (2.2). □

3. Построение управления первого игрока

При построении управления первого игрока, обеспечивающего удержание (1.3), воспользуемся схемой из работы [2].

Утверждение 2. Пусть множество % является выпуклым и замкнутым. Тогда существует управление (1.5) такое, что для любого управления v(t) Е V и для любого начального состояния г(0) = г0 Е Бр(%) выполнено удержание (1.3).

Доказательство. Обозначим

и0(V) = {г = и — и* : и Е сои(V),и* Е сои(V)} . (3.1)

При каждых г Е Яп, V Е V, 0 < Ь < р, Бр-г(%) = 0 положим

е(Ь,г^) = шт е, е > 0, г Е Бр—(%) + еЩ^) + еБ. (3.2)

Множество Бр-1 (%) является замкнутым, а множества и0(V) и Б — компакты. Поэтому включение (3.2) выполнено при е = е(Ь,г^). Из определения множества (3.1) следует, что

г + е(Ь, г, v)(u*(t, г, V) — и(Ь, г, V)) Е Бр^(%) + е(Ь, г, v)Б (3.3)

при некоторых и*(Ь,г^) Е сои(V) и и(Ь,г^) Е сои(V).

По теореме Каратеодори [7, теорема 1.1.1]

к

и(Ь,г^) = \3(Ь, г^)и3(Ь, г^), \3(Ь,г^) > 0,

3=1

к

'£\,{1,г^) = 1, и3(Ь,г^) Еи(V). (3.4)

3=1

Здесь к = к(Ь,г^) < п + 1.Эти функции берем в качестве управления (1.5) первого игрока.

Пусть в процессе игры реализуется управление v(t) Е V второго игрока, удовлетворяющее условию (1.4). Тогда из формулы (3.1) следует, что

и0^(Ь)) С и0^(т)) + Ь(т — Ь)Б при 0 < Ь < т < р. (3.5)

Возьмем разбиение ш (1.6) и построим ломаную (1.7) с функциями (3.4). Обозначим

г1 = гш (и), VI = v(ti), и(г) = u(ti,гi,Vi), и*) = и*(и,гг ^^, ег = е(и,гг^г). Тогда из (3.3) следует, что при г = 0 выполнено включение

^ ^и*^ — еiu(i) Е Бр-г1 (%) + еiБ, (3.6)

причем е0 = 0. Предположим, что в момент времени ti, г < I + 1 выполнено включение (3.6). Тогда из утверждения 2 следует, что Бр-^+1 (%) = 0. Используя формулу (2.2) и свойство 8, найдем точку и Е соиV) такую, что

^ + еи* — — (ti+1 — ti)u Е Бр-и+1 (%) + ^Б. (3.7)

Из формулы (1.9) получим, что

^+1 = г — (и+1 — и)и{г).

Отсюда и из (3.7) будем иметь, что

^+1 + (ti+1 — ti — + еи*^ — (ti+1 — ti)u Е Бр-^+1 (%) + ЦБ. (3.8)

Пусть ti+l — и > еi. Тогда

(ti+1 — ti — еi)u(i) + еи*^ Е (ti+1 — и)сои(vi).

Отсюда и из (3.8) следует, что

^+1 Е Бр-г1+1 (%) + (ti+l — ti)Uо(vi) + е^Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из этого включения, используя (3.5), получим

^+1 Е Бр-и+1 (%) + (ti+1 — ti)U0(vi+1) + (^ + \ti+1 — и\2)Б.

Отсюда и из (3.2) следует, что

и+1 < (ti+l — и)(1 + L(ti+l — ti)).

Пусть ti+l — и < еi. Тогда

(еi — ^+1 + ti)u(i) + (ti+l — и)и Е е^оиV) и, как следует из (3.8) и (3.5),

^+1 Е Бр-и+1 (%) + еiU0 (vi) + еБ С Бр-и+1 (%) + еiU0(vi+1) + (еi + L(ti+l — ti)еi)Б. Отсюда и из (3.2) получим, что

еi+l < ^(1 + L(ti+l — ti)).

Объединяя оба случая, будем иметь, что включение (3.6) выполнено при

i + 1, причем

Q+1 < max{ti+i — ti; ti)(1 + L{ti+i — ti)). (3-9)

Поскольку б0 = 0, то из неравенства (3.9) следует, что

6i+1 < d(u)eLp. (3.10)

Обозначим

Uo = co У Uo(v).

veV

Из ограниченности множества (1.2) следует ограниченность множества U0. Из формул (3.6), (3.10), используя включение Dp-ti(Z) С Z, получим, что

(ti) G Z + d(u)eLp(U0 + S), i = 0,1,... ,l + 1. (3.11)

Пусть последовательность ломаных гШк (t) с диаметром разбиения d(uk), стремящемся к нулю, равномерно на отрезке [0,_р] сходится к движению z(t). Все эти ломаные удовлетворяют условию Липшица с одной и той же константой N. Тогда

z^k(t) G zш(ti) + Nd(uk)S при ti < t < ti+1.

Отсюда и из (3.11) получим, что

Zwk(t) G Z + d(uk)eLpUo + d(uk)(eLp + N)S, 0 < t < p.

Устремляя d(uk) к нулю и используя замкнутость множества Z, получим требуемое включение (1.3). □

Список литературы

1. Крэггс, Дж. У. Задачи управления движением / Дж. У. Крэгсс // Математическое моделирование. — М., 1979. — С. 24-26.

2. Ухоботов, В. И. Игровая задача выбора наилучшего курса яхты / В. И. Ухобо-тов, И. В. Цеунова // Вестн. Юж.-Урал. гос. ун-та. — Сер. Мат. моделирование и программирование. — 2009. — Вып. 3. — С. 114-120.

3. Колмогоров, А. Н. Элементы теории функций и функционального анализа / А. Н. Колмогоров, С. В. Фомин. — М., 1972. — 496 с.

4. Пшеничный, Б. Н. Игра с простым движением и выпуклым терминальным множеством / Б. Н. Пшеничный // Теория оптимальных решений : тр. семинара. — Киев, 1969. — Вып. 3. — С. 3-16.

5. Ухоботов, В. И. Дифференциальная игра удержания / В. И. Ухоботов // Техн. кибернетика. — 1984. — № 2. — С. 70-76.

6. Hermes, H. The Generalized Differential Equation x G R(t, x) / H. Hermes // Advances in Mathematics. — 1970. — № 4. — P. 149-169.

7. Пшеничный, Б. Н. Выпуклый анализ и экстремальные задачи / Б. Н. Пшеничный. — М. : Наука, 1980. — 320 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.