УДК 517.977
ИГРОВАЯ ЗАДАЧА ВЫБОРА НАИЛУЧШЕГО КУРСА ЯХТЫ
В.И. Ухоботов, И.В. Цеунова
GAME PROBLEM OF THE BEST YACHT COURSE CHOICE
V.I. Ukhobotov, I.V. Tseunova
Рассматривается задача об управлении яхты с переменным ветром. Задача рассматривается в виде дифференциальной игры. Второй игрок управляет ветром.
Ключевые слова: управление, дифференциальная игра, игрок
The authors handle a problem of controlling a yacht in the baffling wind conditions. The problem is analyzed in the form of differential game. The second player controls the wind.
Keywords: management, differential game, player
1. Постановка задачи
В известной задаче выбора наилучшего курса яхты скорость яхты зависит от угла, который образует курс яхты и направление ветра. При постоянной по направлению и по величине скорости ветра в [1] рассмотрена конкретная модель такой зависимости. Исследуется задача, когда выгоднее идти галсами, чем прямо по заданному курсу.
Если рассматривать случай, когда вектор скорости V ветра может меняться, находясь в некотором множестве У, то вектор скорости и яхты можно выбирать из некоторого множества и (у), зависящего от скорости ветра. Цель управления яхтой заключается в том, чтобы
побыстрее вывести ее на заданное множество Z (например, причалить к острову). В каждый момент времени скорость ветра считается известной.
Рассмотренный пример является частным случаем задачи управления с помехой
г = -и, геЯ71, и Е и(у) С Дп, УвУ. (1.1)
Здесь К-множество произвольной природы; при каждом V Е V множество и {у) является непустым компактом в Яп. Считаем, что ограниченным является множество
к = и Щь). (1.2)
у£У
Первый игрок, выбирая управление и € и(у), стремится побыстрее осуществить встречу
*(*) Е (1.3)
где Е является выпуклым и замкнутым множеством в Яп. Второй игрок, выбирая управление V Е V, стремится сделать время встречи (1.3) как можно дольше.
Будем рассматривать игру, когда управление первого игрока строится в зависимости от реализовавшегося в момент времени I состояния z(t) и от значения в этот момент времени
управления г;(£) второго игрока. Будем строить управление первого игрока так, чтобы они допускали движение галсами [1].
Будем предполагать, что изменение управления ?;(£) с течением времени меняется не очень сильно. Чтобы строго сформулировать это допущение введем, в рассмотрение евклидов шар 5 в Яп единичного радиуса и с центром в начале координат. Требование на г>(£)
запишем в следующем виде: для любого отрезка [0,р] существует число £ > О такое, что
С и^(т)) + Ь(т — £)5 при 0<£<т<р. (1.4)
Под управлением (и, А) первого игрока понимаем правило, которое каждому состоянию £ > 0, £ Е Я71 и любому V Е V ставит в соответствие конечный набор
и8 = и8(1,я, V) Е и(у), 5 = 1,..., к = &(£, г,у), А5 = А5(£, г, у) > 0, Ах + .-. + А*; = 1. (1.5)
Движение системы (1.1) будем определять с помощью ломаных. Пусть заданы начальное состояние £о > 0, го = £(%) Е Яп и конечный момент времени р > *о- Возьмем разбиение
о;: <0 < *1 < — < *» < ^г+1 < — < £/+1 = Р (1-6)
с диаметром
с1(ио) = шах(^_|_х - и). (1.7)
0<г<£
Построим ломаную
и*(г)<1г, и<г<и+1, г = 0,1. (1.8)
Здесь обозначено и\(г) = и3(и,ги1(г1),ь(Ьг)) при < г < ^8\з =
в
40) = 4^=и+(**+1 - и) ^2 А«-
я=1
Содержательный смысл управлений (1.9) следующий. С помощью чисел А5 первый игрок разбивает отрезок [^,^+1] точками и = ^ < ... < ^ < ... < = ^+1 и на каждом
из промежутков (^5~1\ £^] движется с постоянной скоростью и8{1г, у(и)). Управление
второго игрока постоянно на промежутке (45_1\4+х] и равно у(и).
Из ограниченности множества (1.2) следует, что все ломаные (1.8) удовлетворяют условию Липшица с одной и той же константой. Следовательно, семейство ломаных (1.8) удовлетворяет условию теоремы Арцела[2]. Под движением системы (1.1) с управлением (1.5) и с начальным условием г(£о) = %о понимаем любую функцию г : [£о,р] Яп, которая является пределом равномерно сходящейся на отрезке [£о?р] последовательности ломаных (1.8), у которых диаметр разбиения стремится к нулю.
Отметим, что
/
ли
и+г
и*(г)(1г = (<г+1 -и)2^\8и8(и,гш(и),у(и)). (1.10)
5=1
2. Оператор программного поглощения и его свойства
Следуя [3], введем для игры (1.1) оператор программного поглощения Ва. Пусть X С Дп, а > 0. Точка 2 Е Аг(Х) тогда и только тогда, когда для любого V Е V найдется измеримое управление и : [0, а] -» II(г;) такое, что 2 — и(г)4г Е X при некотором 0 < £ < ст.
Для любого ограниченного множества Р С Яп и для любого отрезка [а, Ь] С й имеет место формула [4]
гЬ
/{г)йг\ / : [а, 6] —>• 2*1 - измерима ^ = (6 — а)соР. (2.1)
'а J
Здесь посредством соР обозначена выпуклая оболочка множества 2^.
Будем использовать операции сложения множеств X и У из Яп и умножение множества X на число а
и:
X+ У = {г = х + у : х £ X,у ЕУ} , а X = {г = ах : х Е X} .
С учетом этих формул, а так же формулы (2.1), оператор программного поглощения принимает вид
*м*) = П и (X+ атсои(у)). (2.2)
г;ЕУ0<т<1
Этот оператор обладает следующими свойствами.
Свойство 2. 1. Во(Х) = X.
Свойство 2. 2. Если 0 < 6 < о, X С У, то Д*(Х) С £>а(У).
Свойство 2. 3. Па{Х + У) Э Ва{Х) + У.
Свойство 2. 4. Д*(Дт(Х)) С Д*+0-(Х).
Свойство 2. 5. Д г(аХ) = <т£>1р0-
Свойство 2. 6. Если X - выпуклое множество, то множество Ва(Х) является выпук-
лым.
Свойство 2. 7. Еслг/ X - выпуклое множество, то Ю§(Ва(Х)) = 1?£+СГ(Х).
Свойство 2. 8. Если X - замкнутое множество, то множество Оа(Х) является замкнутым.
Свойство 2. 9. Пусть X - замкнутое множество, последовательность 0 < (?к+1 < аь сг и точка г Е Вак(Х). Тогда г Е Ва(Х).
Свойства 2.1 - 2.6 непосредственно следуют из формулы (2.2). При доказательстве свойства 2.7 применим схему доказательства из работы [5]. В силу свойства 2.1 нужно рассмотреть случай 6 > 0 и а > 0. Обозначим X* = (5 + а)~~1Х. Тогда из выпуклости множества X следует равенство 5Х* + аХ* = X. Отсюда, используя свойства 2.2, 2.3 и 2.5, получим
В6{ра{Х)) = дкдда* + аХ*)) э В6(Ва(аХ*) + 6Х*) Э Э Д*(<ОД + Оа(аХ*) = 50г(Х*) + аБ^Х*) Э
Э (« + ст)А(Х,) = £>*+„((* + а)Х*) = В5+а(Х):
Обратное включение следует из свойства 2.4.
При доказательстве свойств 2.8 и 2.9 используется тот факт, что выпуклая оболочка компакта в Яп является компактом [6, теорема 1.1.7].
3. Оптимальное время встречи
Для каждой точки z Е Rn положим T(z) = +00, если zEDa(Z) при всех а > 0. В противном случае
T(z) = 'mia, о > 0, z Е Da(Z). (3.1)
Эта функция обладает следующими свойствами.
Свойство 3. 1. Если а = T(z) < +оо; то z Е Da(Z).
Свойство 3. 2. T(z) > 0 при любом z Е Rn; T(z) = 0 тогда и только тогда, когда z Е Z.
Свойство 3. 3. Функция T(z) является выпуклой.
Доказательство свойства 3.1 следует из замкнутости множества Z и из свойства 2.9 оператора D.
Первая часть свойства 3.2 следует из формулы (3.1). Если T(z) = 0, то из свойства 3.1 следует, что 2 Е Dq(Z) = Z. Если же z £ Z, то равенство T(z) = 0 очевидно.
Докажем свойство 3.3. Возьмем точки z% Е i?n, г = 1,2, у которых ai = T(zt) < +00.
Тогда из свойства 3.1 и из формулы (2.2) следует, что для любой точки v Е V найдутся числа 0 < т\ < 1, i = 1,2, такие, что z% Е Z + (JiTiCoU{v), г = 1,2. Возьмем числа Хг > 0, Ai + А2 = 1. Тогда из предыдущего включения, используя выпуклость множеств Z и coU(v), получим
Aizi + A2z2 Е Z + (Aicri + А2a2)TCoU{v), т = -—-------тг + -—---------r2 G [0,1].
Л1&1 + Л2&2 Л1<71+Л2СГ2
Отсюда и из формулы (3.1) получим, что T(\\zi + X2Z2) < XiT(zi) + АгЗР^).
Утверждение 3. 1. Пусть начальное состояние ^г(О) = zo€Z. Тогда для любого числа 0 < р < T(zq) существует точка v Е V такая, что постоянное управление второго игрока v(t) = v при всех 0 < t < р обеспечивает для любого управления (1.5) первого игрока выполнение условия
z(t)£Z при всех 0 < t < р. (3.2)
Доказательство. Поскольку zoEDp(Z\, то из формулы (2.2) следует, что найдется точка v Е V, для которой
zoEZ + tcoU(v) при всех 0 < t < р. (3.3)
Из формул (1.8) и (1.9) следует, что при v(t) = v каждая ломаная удовлетворяет равенству
Zu(t) = Zo — tu(t) при некотором u(t) Е coU(v).
Следовательно, аналогичному равенству удовлетворяет и любое движение z(t). Отсюда и из (3.3) получим (3.2). □
4. Построение управления первого игрока
При построении управления первого игрока, обеспечивающего встречу (1.3) из начального состояния z(0) = zq к моменту Т(^о), воспользуемся схемой из работы [7].
Лемма 4. 1. Пусть z Е D$+a(Z) при 6 > 0 и а > 0. Тогда для любой точки v Е V
существует точка и Е со11(у) такая, что либо
*-ЛхЕ Д г(Я), (4.1)
либо при некотором 0 < £ < 6
z — tu£Z. (4.2)
Доказательство. Из формулы (2.2) и из свойства 2.7 отображения В следует, что для точки У Е V непустым является множество чисел
О < £ < <5, г е Дт(^) + £соЕ/(г>). (4.3)
Обозначим через £о верхнюю грань таких чисел £. Из замкнутости множества Дг(^) и из
компактности множества сои (у) следует, что включение (4.3) выполнено при £ = £о- Если £о = <5, то из (4.3) следует (4.1)
Пусть 0 < £о < 8. Возьмем число 0 < 7 < 5 — £о, чтобы ^7 = сг при некотором целом
7 > 1. Тогда из включения (4.3) при £ = £о получим, что
я — £0^1 £ = ^7(^0—1)7^))
при некотором г/х Е соСГ(у). Отсюда следует, что найдется число 0 < £1 < 7 такое, что
г — £0^1 € £>(7_1)7(-2у) + 1\сои{у).
Отсюда, используя свойство 2.2 отображения I), получим, что при £ = £о + £1 выполнено включение (4.3). Поскольку число £о является верхней гранью чисел £, удовлетворяющих (4.3), то £1 = 0. Продолжая этот процесс дальше, найдем точку и Е со17(у) такую, что при £ = £о будет выполнено включение (4.2). □
Теорема 4. 1. Пусть начальное состояние го такое, что р = Т(го) < +оо. Тогда существует управление (1-4) первого игрока такое, что для любого управления г?(£) второго игрока будет выполнено включение (1.3) при некотором £ < р.
Доказательство. Обозначим
ио(и) = {г = и — и* : и Е со{7(г?},^* Е со11(у)} . (4.4)
При каждых £Е-йп,0<£<р, у еУ положим
е(£^^)=1шп£, е > 0, г Е Вр-^) + е11о(у) + ев. (4.5)
Множество Вр-1^) является замкнутым, а множества 11о(у) и 5 - компакты. Поэтому включение (4.5) выполнено при е = б(£, г, у). Из определения множества (4.4) следует, что
г + г(£,г,^)(г1*(£,я,г;) - и(£,г,г;)) Е 2)р_*(£) + е(£,г, у)в (4.6)
при некоторых гц(£, г>) Е со11(у) и га(£, г, г;) Е со11{у).
По теореме Каратеодори [6, теорема 1.1.1]
к
и(г,г,у) = АД*,г,г>)гх4(*,г,и), Лв(£,г,и) > 0,
5=1
к
^Ав(*,г,«) = 1, и,(<,г,«)еУ(«). (4.7)
Здесь к = к(1,г,у) < п + 1.Эти функции берем в качестве управления (1.5) первого игрока.
Пусть в процессе игры реализуется управление г;(£) Е V второго игрока, удовлетворяющее условию (1.4). Тогда из формулы (4.4) следует, что включению (1.4) удовлетворяет и многозначная функция Е/о(г;(£)). Отсюда получим, что
ио(у(Ъ)) С ио(у(г)) + Ь(т — £)5 при 0 < £ < т < р. (4.8)
Возьмем разбиение ш (1.6) и построим ломаную (1.8) с функциями (4.7). Обозначим
= гш{и), VI = ь(и), = и(гг,гг,Ьг),и^ = и*(и,гг,Уг), £г = е(<г, «*).
Тогда из (4.6) следует, что при % — 0 выполнено включение
Х% + £{У$ — £гП^ £ £)р_^г(^) + £г$? (4*9)
причем £о =: 0. Предположим, ЧТО В момент времени <4,. г < I +1 выполнено включение (4.9).
Тогда, используя лемму 4.1, найдем точку и Е соС/(^) такую, что либо
+ £{и^) — £{П^ — (£г+1 “ и)и £ (£Г) + 6^5, (4.10)
либо при некотором £ Е [^,^+1]
— (* — и)и Е Z + £г5. (4.11)
Рассмотрим случай (4.10). Из формулы (1.10) получим, что гъ+\ = — (^+1 — и)ь№.
Отсюда и из (4.10) будем иметь, что
^г+1 + (^Н-1 ~~ и ~~ £г)и® + £{У$ — (^г_|_1 — £г)гА Е Х)р_£г+1(^) + £{Б. (4-12)
Пусть *,+1 — и > £ъ. Тогда (£г+х — и - £{)и^ + Е ('*,+1 — и)со11(у^. Отсюда и из
(4.12) получим, что
гг+1 Е Вр-11+1^) + (и+1— и)ио(у{)+£гЗ С Пр-1г+1^) + {и+1—и)Щ(у{+1) + {£г+Ь\Ь1+1 ~и\2)5. Здесь было использовано включение (4.8). Отсюда и из (4.5) следует, что
£г+1 ^ (^г+1 ^г)(1 Н~ -^(^г+1 ^г))*
Пусть ^+1 — и < £%. Тогда
(ег - <г+1 + и)и№ + (*г+1 - и)и е £1СОи{Уг) и, как следует из (4.12) и (4.8),
^г+1 Е 2?р_^г+1(^) + 6г?7о(^г) + С
С 1>р_^г+1(^) + £г?7о(^г+1) + (вг + ^(^+1 ” И)£{)3.
Отсюда и из (4.5) следует неравенство
£г+1 < ^г(1 + ^/(^_|_1 — <*)).
Объединяя оба случая, будем иметь, что включение (4.9) выполнено при г + 1, причем
£г+1 < тах(^+х - г*)(1 + Ь(Ц+1 - £*)). (4.13)
Поскольку го = 0, то из этого неравенства следует, что для всех <г, для которых выпол-
няется включение (4.10), будет выполнено
£г+1 < (1(и)еЫг. (4.14)
Обозначим
Щ = со У и0(ь).
уеУ
Из ограниченности множества (1.2) следует ограниченность множества ?7о*
Пусть включение (4.10) выполнено для всех г <1. Тогда из (4.5) и (4.14) следует, что
гш(р) EZ + 6(ш)(и0 + 5), = й{и)#ь. (4.15)
Рассмотрим случай, когда для какого-то г < I выполнено включение (4.11). На отрезке реализуется управление и*(г) £ С/(г?г), которое определяется формулами (1.9). Из (4.11) и (1.8) следует, что
С1
^(^) + / и*(г)йг + - (£ - и)и £ Z + £*5.
Поскольку
rt
u*(r)dr £ (t — ti)coU(vi),
пг
то из предыдущего включения получим, что
/‘
Ju
^ш(^) Е % (£ “ + £г^)(С/о-Н" <?) С 2 + с£(^)(1 + ерЬ)(£/о + 5). (4.16)
Отсюда и из (4.15) следует, что для каждой ломаной (1.8) найдется число 0 < <(а;) < р такое, что при £ = выполнено включение (4.16).
Пусть последовательность ломаных гШк (£) с диаметром разбиения —ь 0 равномерно
на отрезке [0,_р]сходится к движению г{Ь). Для каждой ломаной в точке t = £(с^) выполнено включение (4.16). Можно считать, что Ь{и)к) (иначе перейдем к последовательности). Из равномерной сходимости ломаных следует, что (£(и;/с)) г(£*). Отсюда и из включения
(4.16) получим, что г(£*) £ Z. □
Литература
1. Крэггс, Дж.У. Задачи управления движением. Математическое моделирование / Дж.У. Крэггс. - М., 1979. - С. 21 - 34.
2. Колмогоров, А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М., 1972. - 496 с.
3. Пшеничный, Б.Н. Структура дифференциальных игр / Б.Н. Пшеничный // Докл. АН СССР. - 1969. - Т. Ж, /2 - С. 285 - 287.
4. Hermes, Н. The Generalized Differential Equation x £ R(t, x) / H. Hermes // Advances in Mathematics. - 1970. - № 4. - P. 149 - 169.
5. Ухоботов, В.И. К вопросу об окончании за первый момент поглощения / В.И. Ухоботов // Прикл. матем. и мех. - 1984. - Т. 48, № 6. - С. 892 - 897.
6. Пшеничный, В.Н. Выпуклый анализ и экстремальные задачи / Б.Н. Пшеничный. - М., 1980. - 320 с.
7. Ухоботов, В.И. Непрерывная игра в пространстве с неполной линейной структурой / В.И. Ухоботов // Теория и системы управления. - 1997. - № 2. - С. 107 - 109.
Кафедра теории управлении и оптимизации Челябинский государственный университет [email protected], [email protected]
Поступила в редакцию 13 февраля 2009 г.
ПРАВИЛА ДЛЯ АВТОРОВ
1. В редакцию предоставляется печатная (2 экз.) и электронная (в формате ТЕХ) версии работы (при этом должно быть строго выдержано соответствие между файлом и твердой копией), экспертное заключение о возможности опубликования работы в открытой печати, сведения об авторах (Ф. И. О., место работы, звание и должность, контактная информация). Подпись авторов и дата ставятся в левом нижнем углу на всех экземплярах.
2. Структура статьи: УДК, название (не более 10 - 12 слов), список авторов, аннотация, список ключевых слов на русском языке, далее следует название, список авторов, аннотация, список ключевых слов на английском языке, текст работы, литература (в порядке цитирования, ГОСТ 7.1 - 2003).
3. Параметры набора. Страницы рукописи должны быть пронумерованы. Шрифт -12 р^ Поля: зеркальные, верхнее - 30, нижнее - 30, внутри - 25, снаружи - 25 мм. Отступ красной строки 0,7 см, межстрочный интервал - одинарный. В статье нумеруются лишь те формулы, на которые по тексту есть ссылки.
4. Рисунки все черно-белые. Необходимо предоставить рисунки в виде отдельных фай-лов(в формате *.ерз).
5. Адрес редакции Вестника ЮУрГУ, серия «Математическое моделирование и программирование»
Россия 454080, г. Челябинск, пр. им. В.И. Ленина, 76, Южно-Уральский государственный университет, механико-математический факультет, кафедра УМФ, ответственному редактору проф. Свиридюку Георгию Анатольевичу.
6. Адрес электронной почты: [email protected]
7. Полную версию правил подготовки рукописей и пример оформления статей можно загрузить с сайта ЮУрГУ (http://www.susu.ac.ru) следуя ссылкам: «Научные исследования», «Издательская деятельность», «Вестник ЮУрГУ», «Серии».
8. Плата с аспирантов за публикацию рукописей не взимается.
9. Подписной индекс Вестника ЮУрГУ, серия «Математическое моделирование и программирование»: 29126, каталог «Пресса России». Периодичность выхода - 2 номера в год (май и ноябрь).
Издательский центр Южно-Уральского государственного университета
Подписано в печать 07.04.2009. Формат 60x84 1/8. Печать трафаретная. Уел. печ. л. 14,41. Уч.-изд. л. 11. Тираж 500 экз. Заказ 143/188.
Отпечатано в типографии Издательского центра ЮУрГУ. 454080, г. Челябинск, пр. им. В.И. Ленина, 76.