Научная статья на тему 'Игровая задача выбора наилучшего курса яхты'

Игровая задача выбора наилучшего курса яхты Текст научной статьи по специальности «Математика»

CC BY
91
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЕНИЕ / ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / ИГРОК / MANAGEMENT / DIFFERENTIAL GAME / PLAYER

Аннотация научной статьи по математике, автор научной работы — Ухоботов В. И., Цеунова И. В.

Рассматривается задача об управлении яхты с переменным ветром. Задача рассматривается в виде дифференциальной игры. Второй игрок управляет ветром.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GAME PROBLEM OF THE BEST YACHT COURSE CHOICE

The authors handle a problem of controlling a yacht in the baffling wind conditions. The problem is analyzed in the form of differential game. The second player controls the wind.

Текст научной работы на тему «Игровая задача выбора наилучшего курса яхты»

УДК 517.977

ИГРОВАЯ ЗАДАЧА ВЫБОРА НАИЛУЧШЕГО КУРСА ЯХТЫ

В.И. Ухоботов, И.В. Цеунова

GAME PROBLEM OF THE BEST YACHT COURSE CHOICE

V.I. Ukhobotov, I.V. Tseunova

Рассматривается задача об управлении яхты с переменным ветром. Задача рассматривается в виде дифференциальной игры. Второй игрок управляет ветром.

Ключевые слова: управление, дифференциальная игра, игрок

The authors handle a problem of controlling a yacht in the baffling wind conditions. The problem is analyzed in the form of differential game. The second player controls the wind.

Keywords: management, differential game, player

1. Постановка задачи

В известной задаче выбора наилучшего курса яхты скорость яхты зависит от угла, который образует курс яхты и направление ветра. При постоянной по направлению и по величине скорости ветра в [1] рассмотрена конкретная модель такой зависимости. Исследуется задача, когда выгоднее идти галсами, чем прямо по заданному курсу.

Если рассматривать случай, когда вектор скорости V ветра может меняться, находясь в некотором множестве У, то вектор скорости и яхты можно выбирать из некоторого множества и (у), зависящего от скорости ветра. Цель управления яхтой заключается в том, чтобы

побыстрее вывести ее на заданное множество Z (например, причалить к острову). В каждый момент времени скорость ветра считается известной.

Рассмотренный пример является частным случаем задачи управления с помехой

г = -и, геЯ71, и Е и(у) С Дп, УвУ. (1.1)

Здесь К-множество произвольной природы; при каждом V Е V множество и {у) является непустым компактом в Яп. Считаем, что ограниченным является множество

к = и Щь). (1.2)

у£У

Первый игрок, выбирая управление и € и(у), стремится побыстрее осуществить встречу

*(*) Е (1.3)

где Е является выпуклым и замкнутым множеством в Яп. Второй игрок, выбирая управление V Е V, стремится сделать время встречи (1.3) как можно дольше.

Будем рассматривать игру, когда управление первого игрока строится в зависимости от реализовавшегося в момент времени I состояния z(t) и от значения в этот момент времени

управления г;(£) второго игрока. Будем строить управление первого игрока так, чтобы они допускали движение галсами [1].

Будем предполагать, что изменение управления ?;(£) с течением времени меняется не очень сильно. Чтобы строго сформулировать это допущение введем, в рассмотрение евклидов шар 5 в Яп единичного радиуса и с центром в начале координат. Требование на г>(£)

запишем в следующем виде: для любого отрезка [0,р] существует число £ > О такое, что

С и^(т)) + Ь(т — £)5 при 0<£<т<р. (1.4)

Под управлением (и, А) первого игрока понимаем правило, которое каждому состоянию £ > 0, £ Е Я71 и любому V Е V ставит в соответствие конечный набор

и8 = и8(1,я, V) Е и(у), 5 = 1,..., к = &(£, г,у), А5 = А5(£, г, у) > 0, Ах + .-. + А*; = 1. (1.5)

Движение системы (1.1) будем определять с помощью ломаных. Пусть заданы начальное состояние £о > 0, го = £(%) Е Яп и конечный момент времени р > *о- Возьмем разбиение

о;: <0 < *1 < — < *» < ^г+1 < — < £/+1 = Р (1-6)

с диаметром

с1(ио) = шах(^_|_х - и). (1.7)

0<г<£

Построим ломаную

и*(г)<1г, и<г<и+1, г = 0,1. (1.8)

Здесь обозначено и\(г) = и3(и,ги1(г1),ь(Ьг)) при < г < ^8\з =

в

40) = 4^=и+(**+1 - и) ^2 А«-

я=1

Содержательный смысл управлений (1.9) следующий. С помощью чисел А5 первый игрок разбивает отрезок [^,^+1] точками и = ^ < ... < ^ < ... < = ^+1 и на каждом

из промежутков (^5~1\ £^] движется с постоянной скоростью и8{1г, у(и)). Управление

второго игрока постоянно на промежутке (45_1\4+х] и равно у(и).

Из ограниченности множества (1.2) следует, что все ломаные (1.8) удовлетворяют условию Липшица с одной и той же константой. Следовательно, семейство ломаных (1.8) удовлетворяет условию теоремы Арцела[2]. Под движением системы (1.1) с управлением (1.5) и с начальным условием г(£о) = %о понимаем любую функцию г : [£о,р] Яп, которая является пределом равномерно сходящейся на отрезке [£о?р] последовательности ломаных (1.8), у которых диаметр разбиения стремится к нулю.

Отметим, что

/

ли

и+г

и*(г)(1г = (<г+1 -и)2^\8и8(и,гш(и),у(и)). (1.10)

5=1

2. Оператор программного поглощения и его свойства

Следуя [3], введем для игры (1.1) оператор программного поглощения Ва. Пусть X С Дп, а > 0. Точка 2 Е Аг(Х) тогда и только тогда, когда для любого V Е V найдется измеримое управление и : [0, а] -» II(г;) такое, что 2 — и(г)4г Е X при некотором 0 < £ < ст.

Для любого ограниченного множества Р С Яп и для любого отрезка [а, Ь] С й имеет место формула [4]

гЬ

/{г)йг\ / : [а, 6] —>• 2*1 - измерима ^ = (6 — а)соР. (2.1)

'а J

Здесь посредством соР обозначена выпуклая оболочка множества 2^.

Будем использовать операции сложения множеств X и У из Яп и умножение множества X на число а

и:

X+ У = {г = х + у : х £ X,у ЕУ} , а X = {г = ах : х Е X} .

С учетом этих формул, а так же формулы (2.1), оператор программного поглощения принимает вид

*м*) = П и (X+ атсои(у)). (2.2)

г;ЕУ0<т<1

Этот оператор обладает следующими свойствами.

Свойство 2. 1. Во(Х) = X.

Свойство 2. 2. Если 0 < 6 < о, X С У, то Д*(Х) С £>а(У).

Свойство 2. 3. Па{Х + У) Э Ва{Х) + У.

Свойство 2. 4. Д*(Дт(Х)) С Д*+0-(Х).

Свойство 2. 5. Д г(аХ) = <т£>1р0-

Свойство 2. 6. Если X - выпуклое множество, то множество Ва(Х) является выпук-

лым.

Свойство 2. 7. Еслг/ X - выпуклое множество, то Ю§(Ва(Х)) = 1?£+СГ(Х).

Свойство 2. 8. Если X - замкнутое множество, то множество Оа(Х) является замкнутым.

Свойство 2. 9. Пусть X - замкнутое множество, последовательность 0 < (?к+1 < аь сг и точка г Е Вак(Х). Тогда г Е Ва(Х).

Свойства 2.1 - 2.6 непосредственно следуют из формулы (2.2). При доказательстве свойства 2.7 применим схему доказательства из работы [5]. В силу свойства 2.1 нужно рассмотреть случай 6 > 0 и а > 0. Обозначим X* = (5 + а)~~1Х. Тогда из выпуклости множества X следует равенство 5Х* + аХ* = X. Отсюда, используя свойства 2.2, 2.3 и 2.5, получим

В6{ра{Х)) = дкдда* + аХ*)) э В6(Ва(аХ*) + 6Х*) Э Э Д*(<ОД + Оа(аХ*) = 50г(Х*) + аБ^Х*) Э

Э (« + ст)А(Х,) = £>*+„((* + а)Х*) = В5+а(Х):

Обратное включение следует из свойства 2.4.

При доказательстве свойств 2.8 и 2.9 используется тот факт, что выпуклая оболочка компакта в Яп является компактом [6, теорема 1.1.7].

3. Оптимальное время встречи

Для каждой точки z Е Rn положим T(z) = +00, если zEDa(Z) при всех а > 0. В противном случае

T(z) = 'mia, о > 0, z Е Da(Z). (3.1)

Эта функция обладает следующими свойствами.

Свойство 3. 1. Если а = T(z) < +оо; то z Е Da(Z).

Свойство 3. 2. T(z) > 0 при любом z Е Rn; T(z) = 0 тогда и только тогда, когда z Е Z.

Свойство 3. 3. Функция T(z) является выпуклой.

Доказательство свойства 3.1 следует из замкнутости множества Z и из свойства 2.9 оператора D.

Первая часть свойства 3.2 следует из формулы (3.1). Если T(z) = 0, то из свойства 3.1 следует, что 2 Е Dq(Z) = Z. Если же z £ Z, то равенство T(z) = 0 очевидно.

Докажем свойство 3.3. Возьмем точки z% Е i?n, г = 1,2, у которых ai = T(zt) < +00.

Тогда из свойства 3.1 и из формулы (2.2) следует, что для любой точки v Е V найдутся числа 0 < т\ < 1, i = 1,2, такие, что z% Е Z + (JiTiCoU{v), г = 1,2. Возьмем числа Хг > 0, Ai + А2 = 1. Тогда из предыдущего включения, используя выпуклость множеств Z и coU(v), получим

Aizi + A2z2 Е Z + (Aicri + А2a2)TCoU{v), т = -—-------тг + -—---------r2 G [0,1].

Л1&1 + Л2&2 Л1<71+Л2СГ2

Отсюда и из формулы (3.1) получим, что T(\\zi + X2Z2) < XiT(zi) + АгЗР^).

Утверждение 3. 1. Пусть начальное состояние ^г(О) = zo€Z. Тогда для любого числа 0 < р < T(zq) существует точка v Е V такая, что постоянное управление второго игрока v(t) = v при всех 0 < t < р обеспечивает для любого управления (1.5) первого игрока выполнение условия

z(t)£Z при всех 0 < t < р. (3.2)

Доказательство. Поскольку zoEDp(Z\, то из формулы (2.2) следует, что найдется точка v Е V, для которой

zoEZ + tcoU(v) при всех 0 < t < р. (3.3)

Из формул (1.8) и (1.9) следует, что при v(t) = v каждая ломаная удовлетворяет равенству

Zu(t) = Zo — tu(t) при некотором u(t) Е coU(v).

Следовательно, аналогичному равенству удовлетворяет и любое движение z(t). Отсюда и из (3.3) получим (3.2). □

4. Построение управления первого игрока

При построении управления первого игрока, обеспечивающего встречу (1.3) из начального состояния z(0) = zq к моменту Т(^о), воспользуемся схемой из работы [7].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лемма 4. 1. Пусть z Е D$+a(Z) при 6 > 0 и а > 0. Тогда для любой точки v Е V

существует точка и Е со11(у) такая, что либо

*-ЛхЕ Д г(Я), (4.1)

либо при некотором 0 < £ < 6

z — tu£Z. (4.2)

Доказательство. Из формулы (2.2) и из свойства 2.7 отображения В следует, что для точки У Е V непустым является множество чисел

О < £ < <5, г е Дт(^) + £соЕ/(г>). (4.3)

Обозначим через £о верхнюю грань таких чисел £. Из замкнутости множества Дг(^) и из

компактности множества сои (у) следует, что включение (4.3) выполнено при £ = £о- Если £о = <5, то из (4.3) следует (4.1)

Пусть 0 < £о < 8. Возьмем число 0 < 7 < 5 — £о, чтобы ^7 = сг при некотором целом

7 > 1. Тогда из включения (4.3) при £ = £о получим, что

я — £0^1 £ = ^7(^0—1)7^))

при некотором г/х Е соСГ(у). Отсюда следует, что найдется число 0 < £1 < 7 такое, что

г — £0^1 € £>(7_1)7(-2у) + 1\сои{у).

Отсюда, используя свойство 2.2 отображения I), получим, что при £ = £о + £1 выполнено включение (4.3). Поскольку число £о является верхней гранью чисел £, удовлетворяющих (4.3), то £1 = 0. Продолжая этот процесс дальше, найдем точку и Е со17(у) такую, что при £ = £о будет выполнено включение (4.2). □

Теорема 4. 1. Пусть начальное состояние го такое, что р = Т(го) < +оо. Тогда существует управление (1-4) первого игрока такое, что для любого управления г?(£) второго игрока будет выполнено включение (1.3) при некотором £ < р.

Доказательство. Обозначим

ио(и) = {г = и — и* : и Е со{7(г?},^* Е со11(у)} . (4.4)

При каждых £Е-йп,0<£<р, у еУ положим

е(£^^)=1шп£, е > 0, г Е Вр-^) + е11о(у) + ев. (4.5)

Множество Вр-1^) является замкнутым, а множества 11о(у) и 5 - компакты. Поэтому включение (4.5) выполнено при е = б(£, г, у). Из определения множества (4.4) следует, что

г + г(£,г,^)(г1*(£,я,г;) - и(£,г,г;)) Е 2)р_*(£) + е(£,г, у)в (4.6)

при некоторых гц(£, г>) Е со11(у) и га(£, г, г;) Е со11{у).

По теореме Каратеодори [6, теорема 1.1.1]

к

и(г,г,у) = АД*,г,г>)гх4(*,г,и), Лв(£,г,и) > 0,

5=1

к

^Ав(*,г,«) = 1, и,(<,г,«)еУ(«). (4.7)

Здесь к = к(1,г,у) < п + 1.Эти функции берем в качестве управления (1.5) первого игрока.

Пусть в процессе игры реализуется управление г;(£) Е V второго игрока, удовлетворяющее условию (1.4). Тогда из формулы (4.4) следует, что включению (1.4) удовлетворяет и многозначная функция Е/о(г;(£)). Отсюда получим, что

ио(у(Ъ)) С ио(у(г)) + Ь(т — £)5 при 0 < £ < т < р. (4.8)

Возьмем разбиение ш (1.6) и построим ломаную (1.8) с функциями (4.7). Обозначим

= гш{и), VI = ь(и), = и(гг,гг,Ьг),и^ = и*(и,гг,Уг), £г = е(<г, «*).

Тогда из (4.6) следует, что при % — 0 выполнено включение

Х% + £{У$ — £гП^ £ £)р_^г(^) + £г$? (4*9)

причем £о =: 0. Предположим, ЧТО В момент времени <4,. г < I +1 выполнено включение (4.9).

Тогда, используя лемму 4.1, найдем точку и Е соС/(^) такую, что либо

+ £{и^) — £{П^ — (£г+1 “ и)и £ (£Г) + 6^5, (4.10)

либо при некотором £ Е [^,^+1]

— (* — и)и Е Z + £г5. (4.11)

Рассмотрим случай (4.10). Из формулы (1.10) получим, что гъ+\ = — (^+1 — и)ь№.

Отсюда и из (4.10) будем иметь, что

^г+1 + (^Н-1 ~~ и ~~ £г)и® + £{У$ — (^г_|_1 — £г)гА Е Х)р_£г+1(^) + £{Б. (4-12)

Пусть *,+1 — и > £ъ. Тогда (£г+х — и - £{)и^ + Е ('*,+1 — и)со11(у^. Отсюда и из

(4.12) получим, что

гг+1 Е Вр-11+1^) + (и+1— и)ио(у{)+£гЗ С Пр-1г+1^) + {и+1—и)Щ(у{+1) + {£г+Ь\Ь1+1 ~и\2)5. Здесь было использовано включение (4.8). Отсюда и из (4.5) следует, что

£г+1 ^ (^г+1 ^г)(1 Н~ -^(^г+1 ^г))*

Пусть ^+1 — и < £%. Тогда

(ег - <г+1 + и)и№ + (*г+1 - и)и е £1СОи{Уг) и, как следует из (4.12) и (4.8),

^г+1 Е 2?р_^г+1(^) + 6г?7о(^г) + С

С 1>р_^г+1(^) + £г?7о(^г+1) + (вг + ^(^+1 ” И)£{)3.

Отсюда и из (4.5) следует неравенство

£г+1 < ^г(1 + ^/(^_|_1 — <*)).

Объединяя оба случая, будем иметь, что включение (4.9) выполнено при г + 1, причем

£г+1 < тах(^+х - г*)(1 + Ь(Ц+1 - £*)). (4.13)

Поскольку го = 0, то из этого неравенства следует, что для всех <г, для которых выпол-

няется включение (4.10), будет выполнено

£г+1 < (1(и)еЫг. (4.14)

Обозначим

Щ = со У и0(ь).

уеУ

Из ограниченности множества (1.2) следует ограниченность множества ?7о*

Пусть включение (4.10) выполнено для всех г <1. Тогда из (4.5) и (4.14) следует, что

гш(р) EZ + 6(ш)(и0 + 5), = й{и)#ь. (4.15)

Рассмотрим случай, когда для какого-то г < I выполнено включение (4.11). На отрезке реализуется управление и*(г) £ С/(г?г), которое определяется формулами (1.9). Из (4.11) и (1.8) следует, что

С1

^(^) + / и*(г)йг + - (£ - и)и £ Z + £*5.

Поскольку

rt

u*(r)dr £ (t — ti)coU(vi),

пг

то из предыдущего включения получим, что

/‘

Ju

^ш(^) Е % (£ “ + £г^)(С/о-Н" <?) С 2 + с£(^)(1 + ерЬ)(£/о + 5). (4.16)

Отсюда и из (4.15) следует, что для каждой ломаной (1.8) найдется число 0 < <(а;) < р такое, что при £ = выполнено включение (4.16).

Пусть последовательность ломаных гШк (£) с диаметром разбиения —ь 0 равномерно

на отрезке [0,_р]сходится к движению г{Ь). Для каждой ломаной в точке t = £(с^) выполнено включение (4.16). Можно считать, что Ь{и)к) (иначе перейдем к последовательности). Из равномерной сходимости ломаных следует, что (£(и;/с)) г(£*). Отсюда и из включения

(4.16) получим, что г(£*) £ Z. □

Литература

1. Крэггс, Дж.У. Задачи управления движением. Математическое моделирование / Дж.У. Крэггс. - М., 1979. - С. 21 - 34.

2. Колмогоров, А.Н. Элементы теории функций и функционального анализа / А.Н. Колмогоров, С.В. Фомин. - М., 1972. - 496 с.

3. Пшеничный, Б.Н. Структура дифференциальных игр / Б.Н. Пшеничный // Докл. АН СССР. - 1969. - Т. Ж, /2 - С. 285 - 287.

4. Hermes, Н. The Generalized Differential Equation x £ R(t, x) / H. Hermes // Advances in Mathematics. - 1970. - № 4. - P. 149 - 169.

5. Ухоботов, В.И. К вопросу об окончании за первый момент поглощения / В.И. Ухоботов // Прикл. матем. и мех. - 1984. - Т. 48, № 6. - С. 892 - 897.

6. Пшеничный, В.Н. Выпуклый анализ и экстремальные задачи / Б.Н. Пшеничный. - М., 1980. - 320 с.

7. Ухоботов, В.И. Непрерывная игра в пространстве с неполной линейной структурой / В.И. Ухоботов // Теория и системы управления. - 1997. - № 2. - С. 107 - 109.

Кафедра теории управлении и оптимизации Челябинский государственный университет [email protected], [email protected]

Поступила в редакцию 13 февраля 2009 г.

ПРАВИЛА ДЛЯ АВТОРОВ

1. В редакцию предоставляется печатная (2 экз.) и электронная (в формате ТЕХ) версии работы (при этом должно быть строго выдержано соответствие между файлом и твердой копией), экспертное заключение о возможности опубликования работы в открытой печати, сведения об авторах (Ф. И. О., место работы, звание и должность, контактная информация). Подпись авторов и дата ставятся в левом нижнем углу на всех экземплярах.

2. Структура статьи: УДК, название (не более 10 - 12 слов), список авторов, аннотация, список ключевых слов на русском языке, далее следует название, список авторов, аннотация, список ключевых слов на английском языке, текст работы, литература (в порядке цитирования, ГОСТ 7.1 - 2003).

3. Параметры набора. Страницы рукописи должны быть пронумерованы. Шрифт -12 р^ Поля: зеркальные, верхнее - 30, нижнее - 30, внутри - 25, снаружи - 25 мм. Отступ красной строки 0,7 см, межстрочный интервал - одинарный. В статье нумеруются лишь те формулы, на которые по тексту есть ссылки.

4. Рисунки все черно-белые. Необходимо предоставить рисунки в виде отдельных фай-лов(в формате *.ерз).

5. Адрес редакции Вестника ЮУрГУ, серия «Математическое моделирование и программирование»

Россия 454080, г. Челябинск, пр. им. В.И. Ленина, 76, Южно-Уральский государственный университет, механико-математический факультет, кафедра УМФ, ответственному редактору проф. Свиридюку Георгию Анатольевичу.

6. Адрес электронной почты: [email protected]

7. Полную версию правил подготовки рукописей и пример оформления статей можно загрузить с сайта ЮУрГУ (http://www.susu.ac.ru) следуя ссылкам: «Научные исследования», «Издательская деятельность», «Вестник ЮУрГУ», «Серии».

8. Плата с аспирантов за публикацию рукописей не взимается.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Подписной индекс Вестника ЮУрГУ, серия «Математическое моделирование и программирование»: 29126, каталог «Пресса России». Периодичность выхода - 2 номера в год (май и ноябрь).

Издательский центр Южно-Уральского государственного университета

Подписано в печать 07.04.2009. Формат 60x84 1/8. Печать трафаретная. Уел. печ. л. 14,41. Уч.-изд. л. 11. Тираж 500 экз. Заказ 143/188.

Отпечатано в типографии Издательского центра ЮУрГУ. 454080, г. Челябинск, пр. им. В.И. Ленина, 76.

i Надоели баннеры? Вы всегда можете отключить рекламу.