Научная статья на тему 'Об одном подходе к построению управления первого игрока в однотипной дифференциальной игре с терминальным множеством в форме кольца'

Об одном подходе к построению управления первого игрока в однотипной дифференциальной игре с терминальным множеством в форме кольца Текст научной статьи по специальности «Математика»

CC BY
66
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНАЯ ИГРА / DIFFERENTIAL GAME / УПРАВЛЕНИЕ / CONTROL / НЕВЫПУКЛОЕ ТЕРМИНАЛЬНОЕ МНОЖЕСТВО / NON-CONVEX TERMINAL SET

Аннотация научной статьи по математике, автор научной работы — Изместьев Игорь Вячеславович, Ухоботов Виктор Иванович

В конечномерном нормированном пространстве рассматривается однотипная дифференциальная игра. Вектограммы игроков описываются одним и тем же шаром с разными радиусами, зависящими от времени. Движение строится с помощью ломаных. Терминальное множество определяется условием принадлежности нормы фазового вектора отрезку с положительными концами. Множество, определяемое данным условием, названо в работе кольцом. Цель первого игрока заключается в том, чтобы в заданный момент времени привести фазовый вектор на терминальное множество. Цель второго игрока противоположна. В данной работе предложен новый подход к построению управления первого игрока. В отличие от ранее полученных результатов построение такого управления не требует вычисления внешнего радиуса максимального стабильного моста в каждый момент времени, что является несомненным преимуществом предложенного подхода с точки зрения создания вычислительных процедур.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On an approach to constructing the control of the first player in a single-type differential game with a ring-shaped terminal set

In a normed space of finite dimension we consider a single-type differential game. The vectograms of the players are described by the same ball with different time-dependent radii. The motion is constructed using polygonal lines. The terminal set is determined by the condition that the norm of the phase vector belongs to a segment with positive ends. In this paper, a set defined by this condition is called a ring. The aim of the first player is to lead a phase vector to the terminal set at fixed time. The aim of the second player is the opposite. In this paper, a new approach to constructing of the first player control is proposed. Unlike the previously obtained results, the construction of such a control does not require the calculating of the outer radius of the maximal stable bridge at each time moment, which is an undoubted advantage of the proposed approach from the point of view of computational procedures creating.

Текст научной работы на тему «Об одном подходе к построению управления первого игрока в однотипной дифференциальной игре с терминальным множеством в форме кольца»

Челябинский физико-математический журнал. 2018. Т. 3, вып. 2. С. 144-152.

УДК 517.977

ОБ ОДНОМ ПОДХОДЕ К ПОСТРОЕНИЮ УПРАВЛЕНИЯ ПЕРВОГО ИГРОКА В ОДНОТИПНОЙ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЕ С ТЕРМИНАЛЬНЫМ МНОЖЕСТВОМ В ФОРМЕ КОЛЬЦА

И. В. Изместьев", В. И. Ухоботов6

Челябинский государственный университет, Челябинск, Россия "[email protected], [email protected]

В конечномерном нормированном пространстве рассматривается однотипная дифференциальная игра. Вектограммы игроков описываются одним и тем же шаром с разными радиусами, зависящими от времени. Движение строится с помощью ломаных. Терминальное множество определяется условием принадлежности нормы фазового вектора отрезку с положительными концами. Множество, определяемое данным условием, названо в работе кольцом. Цель первого игрока заключается в том, чтобы в заданный момент времени привести фазовый вектор на терминальное множество. Цель второго игрока противоположна. В данной работе предложен новый подход к построению управления первого игрока. В отличие от ранее полученных результатов построение такого управления не требует вычисления внешнего радиуса максимального стабильного моста в каждый момент времени, что является несомненным преимуществом предложенного подхода с точки зрения создания вычислительных процедур.

Ключевые слова: дифференциальная игра, управление, невыпуклое терминальное множество.

Введение

Линейные дифференциальные игры с фиксированным моментом окончания с помощью линейной замены переменных [1, с. 160] можно привести к виду, когда в правой части новых уравнений стоит только сумма управлений первого и второго игроков, значения которых принадлежат заданным множествам, зависящим от времени.

К таким играм сводится произвольная линейная дифференциальная игра, в которой платой является модуль линейной функции.

В дифференциальной игре «изотропные ракеты» [2, с. 139], в её варианте при отсутствии трения — игре «мальчик и крокодил» [3] и в контрольном примере Л. С. Понтрягина [3] множества значений управлений являются шарами, радиусы которых зависят от времени. Для таких игр в случае, если терминальное множество является шаром заданного радиуса, в [3] построен альтернированный интеграл. В работе [4] построены оптимальные позиционные стратегии игроков.

В работе [5] построены альтернированный интеграл и соответствующие оптимальные позиционные управления игроков для однотипных игр с произвольным

Работа выполнена при поддержке гранта РФФИ (проект 18-01-00264_а) и гранта Фонда поддержки молодых учёных Челябинского государственного университета (2018 г.).

выпуклым замкнутым терминальным множеством. В этой статье термин «однотипная игра» применяется к дифференциальным играм, в которых области достижимости игроков гомеоморфны одному и тому же выпуклому компакту.

Актуальными также являются задачи преследования, когда преследователь стремится сделать в заданный момент времени относительное расстояние не больше одного заданного числа, но не меньше другого заданного числа. В работах [6; 7] множество векторов, определяемое таким условием, названо кольцом. В [6] был построен максимальный стабильный мост для однотипной дифференциальной игры с геометрическими ограничениями на управления игроков, в которой терминальным множеством является кольцо. В работе [7] были построены соответствующие оптимальные управления игроков. В данной статье будет описан новый подход к построению управления первого игрока в этой задаче, являющийся более предпочтительным с точки зрения использования в вычислительных процедурах.

1. Постановка задачи

В линейном нормированном конечномерном пространстве Е с нормой || • || движение вектора происходит по правилу

¿ = —а(г)и + б(г)а, ||и|| < 1, |М| < 1, г < р. (1)

Здесь функции а(г) > 0 и Ь(г) > 0 являются суммируемыми на каждом отрезке из полуоси (—то,р].

Заданы числа 0 < £1 < £2. Цель первого игрока, который выбирает управление и, заключается в выводе вектора г(р) на терминальное множество, определяемое неравенствами

£1 < ||ф)|| < £2. (2)

Цель второго игрока, который выбирает управление V, противоположна. Отметим, что случай £1 = 0 рассмотрен в работе [4].

Допустимыми управлениями игроков являются произвольные функции, удовлетворяющие неравенствам

||и(г,г)||< 1, |Нг,г)||< 1, г < р, г е Е. (3)

Зафиксируем начальное состояние ¿о < Р, г (¿о) е Е и момент ¿о < < р. Возьмём разбиение

ш : ¿о < ¿1 < ... < и < и+1 < ... < < гй+1 = г* (4)

с диаметром ^(ш) = шах(г^+1 — ¿¿), г = 0,1,... , к. Построим ломаную для уравнения (1):

(г) = (¿¿) — ^ а(г)а!г^ и^,^(¿¿)) + ^ Ь(г)<^ (¿¿)) (5)

при и < г < ¿¿+1. Здесь (¿0) = г(г0). Можно показать, что

||гш(т) — (¿)|| < £ (а(г) + 6(г))^г при ¿о < г < т < г*.

Из этого неравенства и из теоремы об абсолютной непрерывности интеграла Лебега [8, с. 282] следует, что семейство ломаных (5) на отрезке [¿о, ¿*] является равностепенно непрерывным и равномерно ограниченным. По теореме Арцела

[8, с. 104] можно выделить подпоследовательность ломаных (5) гШт (t) с диаметром ^ 0, которая равномерно на отрезке [t0,t.] сходится к некоторой функции

z(t). ..

Под движением z(t) на отрезке [t0, t.], порождённым управлениями (3), с заданным начальным условием z(t0) понимаем равномерный предел последовательности ломаных (5), у которых диаметр разбиения стремится к нулю.

2. Максимальный стабильный мост

и оптимальное управление первого игрока

Обозначим

(a(r) — b(r))dr, t < p. Положим t(ei) = — то, если £i > g(t) при всех t < p. Иначе

t(ei) = inf{t < p : e1 > g(r) при всех t < т < p}. (6)

Обозначим также

,Ш = + g(t) при t < p; fi(t) = { 01 — g(t) при * (7)

Положим t(e1,e2) = — то, если /1(t) < /2(t) при всех t < p. Иначе

t(e1,e2) = inf{t < p : /1(т) < /2(т) при всех t < т < p}. (8)

В работе [6] для рассматриваемой задачи был построен максимальный стабильный мост [1]

W(t) = {z G : /1 (t) ^ ||zM ^ /2(t)} при t(eb£2) ^ t ^ p, W(t) = 0 при t < t(eb£2).

В работе [7] была доказана следующая теорема, которая определяет вид оптимального управления первого игрока.

Теорема 1. Пусть начальное состояние t0, z(t0) таково, что

Ф1 ,£2) < t0 < p, /1(t0) <|z(t0)|< /2(t0). (9)

Тогда управление первого игрока

u(t,z) = 0(z) при ||z|| > /2(t) и u(t,z) = —0(z) при ||z|| < /2(t) (10)

при любом допустимом управлении второго игрока обеспечивает для любого реализовавшегося движения z(t) выполнение неравенств (2).

Здесь

z

0(z) = ц—ц- при z = 0 и ф(0) — любое с ограничением ||ф(0)|| = 1. (11)

Как видно из (10), при вычислении вектора управления u(t,z) необходимо в каждый момент времени вычислять значение функции /2 (t). Для конкретных примеров эта функция может иметь достаточно сложную структуру, что существенно замедлит вычислительные процедуры, в которых будет использовано управление (10). В управлении первого игрока, предложенном в следующем параграфе, этот недостаток устранён.

3. Основной результат

Основным результатом данной статьи является теорема 2, которая будет сформулирована в данном параграфе. Для того чтобы доказать теорему 2, нам понадобится следующая лемма.

Лемма 1. Пусть выполнены неравенства max(t(ei), t(£b£2)) < t < p. Тогда

/l(t) < ^^ < /2 (t).

Доказательство. Вначале отметим, что

fi(t) < /2(t) при t(ei,£2) < t < p. (12)

Это неравенство следует из формулы (8). Из формул (7) следует, что при t(e1) < t < p

fi(t) = £i - g(t) и /2(t) = £2 + g(t). (13)

Предположим противное утверждению леммы, а именно, пусть

/2(t)= £2 + g(t) .

Тогда

g(t) < . (14)

С другой стороны, учитывая (13) и (14), имеем систему неравенств

/> £i + £2 £i — £2 /> /2(t) < = £i--< £i - g(t) = fi(t).

Таким образом, пришли к противоречию c (12). Предположим, что

</i(t)= £i - g(t).

Отсюда получим (14). С другой стороны, учитывая (13) и (14), имеем систему неравенств

/i(t) > = £2 + > £2 + g(t) = /2(t).

Пришли к противоречию c (12). □

Теорема 2. Пусть начальное состояние t0, z(t0) таково, что выполнены неравенства (9). Тогда управление первого игрока

( £1 + £2 \

u(t, z) = sig^ i ||z||---- j 0(z) при t(£i) < t < p и u(t, z) = 0(z) при t < t(£i)

(15)

при любом допустимом управлении второго игрока обеспечивает для любого реализовавшегося движения z(t) выполнение неравенств (2).

Здесь обозначено sign x =1 при x > 0 и sign x = —1 при x < 0.

Доказательство. Сначала отметим, что выполнено (12).

Случай 1. Пусть t(£i) < t0 < p, а следовательно, верны равенства (13).

Пусть второй игрок выбрал произвольное допустимое управление ^(£, г), а г(£) — реализовавшееся движение при выбранных управлениях с начальным условием ¿(¿о). Существует последовательность разбиений (4)

л Лт) ^ Лт) ^ Лт) ^ Лт) шт : ¿о = ¿0 ) < ) < ... < £кт) < £кт+1 = р

с диаметрами разбиения ^ 0, для которых последовательность (£) ло-

маных (5) сходится равномерно на отрезке [£0,р] к г(£). Далее будем обозначать (£) = ¿т(£) и £(т) = £*.

Допустим, что ||г(р)|| > е2. Тогда из второго неравенства (9) и вида функции /2(£) в (13) следует, что ||г(р)|| — /2(р) > 0, ||г(£0)|| — /2(£0) < 0. Отсюда и из непрерывности функций 11г(¿) | и /2 (£) следует, что существует число £0 < т < р, такое, что

||г(т)|| = /2(т), ||г(£)|| > /2(£) при т < £ < р. (16)

Зафиксируем произвольное число т < в < р. Тогда из (16) следует, что существует число а > 0, при котором ||г(£)|| > /2(£) + 2а для всех в < £ < р. Из этого неравенства, используя равномерную сходимость последовательности гт(£) к реализации г(£), можно получить, что для всех разбиений шт с достаточно малыми диаметрами выполнено неравенство

||*т(£)|| > /2(£) + а при всех в < £ < р. (17)

Из теоремы об абсолютной непрерывности интеграла Лебега следует, что для всех разбиений шт с достаточно малыми диаметрами выполнены неравенства

^а(г)^г<а, в < £ < I < £ + I < р. (18)

Рассматриваем далее разбиения, для которых выполнены (17) и (18). Пусть число ¿¿_1 < в < ¿¿. Покажем, что

Г Ь8 + 1

||*т(£в+1)|| < Н^^Н — (а(г) — 6(г))^г, в = г, г + 1,...,к. (19)

Проверку случая в = г и индукционного шага проведём одновременно. Для ломаной (5) справедливо неравенство

| гт

Г-Ь.

5 + 1

(ts) — / а(г)^г и(£

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(£-))

¿8+1

+ / 6(г)^г.

Из неравенства (17), леммы 1 и формулы (15) следует, что и(£8, гт(£8)) = ф(гт(£8)). Подставим это значение в предыдущую формулу. Тогда, используя формулу (11) и неравенства (17) и (18), получим неравенство (19). Из неравенства (19) следует, что

г р

|Ыр)|| < ||*т(£*)|| — / (а(г) — 6(г))^г.

¿ч

Перейдём в этом неравенстве к пределу при ^(шт) ^ 0, а затем устремим в ^ т. Получим

р

||г(р)|| < ||г(т)|| — / (а(г) — 6(г))^г.

Отсюда и из первого равенства в (16) следует, что ||г(р)|| < £2. Получили противоречие с допущением ||г(р)|| > £2.

Допустим теперь, что ||г(р) || < Тогда из второго неравенства (9) и вида функции /*!(¿) в (13) получим, что ||г(р)|| — /1(р) < 0, ||г(Ьо)|| — /1(^о) > 0. Следовательно, существует число Ьо < т < р, такое, что

||*(т )|| = /1(т), ||г(Ь)|| <Л(Ь) при всех т<Ь < р. (20)

Возьмём произвольное число т < в < р. Тогда из (20) следует, что существует такое число а > 0, что ||г(Ь)|| < Л(Ь) — 2а при всех в < Ь < р. Отсюда и из равномерной сходимости гт(Ь) к следует, что

||гт(Ь)|| < /1(Ь) — а при всех в < Ь < р (21)

и для всех разбиений шт с достаточно малыми диаметрами. Пусть число < в < Покажем, что

Г ¿5 + 1

|Ы^+1)|| > |Ы^)|| +/ (а(г) — Ь(г))^г, в = г,г + 1,...,к. (22)

Проверку случая в = г и индукционного шага проведём одновременно. Для ломаной (5) справедливо неравенство

| ^т

5 + 1

(О)

5 + 1

Из неравенства (21), леммы 1 и формулы (15) следует, что гт(^)) = —ф(гт(^)). Подставим это управление в предыдущее неравенство и учтём формулу (11). Получим неравенство (22).

Из неравенства (22) следует, что

Г Р

|Ыр)|| > ||^т(*г)| + (а(г) — 6(г))^г.

Зц

Перейдём в этом неравенстве к пределу при ^(шт) ^ 0, а затем устремим в ^ т. Получим

(а(г) — 6(г))^г = /1(т)+ £(т). (23)

Из второго неравенства (20) следует, что /1(Ь) > 0 при т < Ь < р. Поэтому /1(Ь) = £1 — #(Ь) при всех т < Ь < р. Следовательно, этой формулой задаётся и /1(т). Подставим её в (23), получим ||г(р)|| > £1. Это неравенство противоречит допущению ||г(р)|| < £1.

Случай 2. Пусть Ь0 < ¿(е1). Согласно (15), ) = ф(г). Покажем, что это управление первого игрока при любом допустимом управлении второго игрока обеспечивает для любого реализовавшегося движения г (Ь) выполнение неравенств

Л(ф1)) <||г(Ь(£1))| < /2(Ь(£1)). (24)

Из формул (7) следует, что /1 (Ь) = 0 при Ьо < Ь < ¿(е1). Отсюда, из (9) и (12) имеем следующие неравенства:

И*о)||< /2(Ьо) и 0 < /2(Ь) при Ьо < Ь < Ь(£1).

В работе [5] показано, что при выполнении этих неравенств управление первого игрока u(t,z) = гарантирует в момент времени t(ei) выполнение неравенства ||z(t(ei))|| < /2(t(e1)) при любом допустимом управлении второго игрока и для любого реализовавшегося движения z(t).

Таким образом, неравенства (24) выполнены. Приняв t(e1) за начальный момент времени, попадаем в условие случая 1. □

Список литературы

1. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский,

A. И. Субботин. — М.: Наука, 1974. — 456 с.

2. Айзекс, Р. Дифференциальные игры / Р. Айзекс. — М.: Наука, 1967. — 479 с.

3. Понтрягин, Л. С. Линейные дифференциальные игры преследования / Л. С. Понтрягин // Мат. сб. — 1980. — Т. 112, № 3. — С. 307-330.

4. Ухоботов, В. И. Синтез управления в однотипных дифференциальных играх с фиксированным временем / В. И. Ухоботов // Вестн. Челяб. ун-та. — 1996. — № 1 (3). Сер. 3. Математика. Механика. — С. 178-184.

5. Ухоботов, В. И. Однотипные дифференциальные игры с выпуклой целью /

B. И. Ухоботов // Тр. Ин-та математики и механики УрО РАН. — 2010. — Т. 16, № 5. — С. 196-204.

6. Ухоботов, В. И. Однотипная дифференциальная игра с терминальным множеством в форме кольца / В. И. Ухоботов // Некоторые задачи динамики и управления : сб. науч. тр. / под ред. В. Д. Батухтина. — Челябинск : Челяб. гос. ун-т, 2005. — С. 108-123.

7. Ухоботов, В. И. Однотипные дифференциальные игры с терминальным множеством в форме кольца / В. И. Ухоботов, И. В. Изместьев // Динамика систем и процессы управления : тр. междунар. конф., посвящ. 90-летию со дня рождения акад. Н. Н. Красовского, Екатеринбург, 15-20 сент. 2014 г. — Екатеринбург : Изд-во УМЦ УПИ, 2015. — С. 325-332.

8. Колмогоров, А. Н. Элементы теории функций и функционального анализа / А. Н. Колмогоров, С. В. Фомин. — М.: Наука, 1972. — 496 с.

Поступила в 'редакцию 09.03.2018 После переработки 05.05.2018

Сведения об авторах

Изместьев Игорь Вячеславович, кандидат физико-математических наук, младший научный сотрудник кафедры теории управления и оптимизации, Челябинский государственный университет, Челябинск, Россия; e-mail: [email protected].

Ухоботов Виктор Иванович, доктор физико-математических наук, профессор, заведующий кафедрой теории управления и оптимизации, Челябинский государственный университет, Челябинск, Россия; e-mail: [email protected].

Chelyabinsk Physical and Mathematical Journal. 2018. Vol. 3, iss. 2. P. 144-152.

ON AN APPROACH TO CONSTRUCTING THE CONTROL

OF THE FIRST PLAYER IN A SINGLE-TYPE DIFFERENTIAL GAME

WITH A RING-SHAPED TERMINAL SET

I.V. Izmest'eva, V.I. Ukhobotovb

Chelyabinsk State University, Chelyabinsk, Russia [email protected], [email protected]

In a normed space of finite dimension we consider a single-type differential game. The vectograms of the players are described by the same ball with different time-dependent radii. The motion is constructed using polygonal lines. The terminal set is determined by the condition that the norm of the phase vector belongs to a segment with positive ends. In this paper, a set defined by this condition is called a ring. The aim of the first player is to lead a phase vector to the terminal set at fixed time. The aim of the second player is the opposite. In this paper, a new approach to constructing of the first player control is proposed. Unlike the previously obtained results, the construction of such a control does not require the calculating of the outer radius of the maximal stable bridge at each time moment, which is an undoubted advantage of the proposed approach from the point of view of computational procedures creating.

Keywords: differential game, control, non-convex terminal set.

References

1. Krasovskiy N.N., SubbotinA.I. Pozitsionnye differentsial'nye igry [Positional differential games]. Moscow, Nauka Publ., 1974. 456 p. (In Russ.).

2. Isaacs R. Differential games. New York, John Wiley and Sons Publ., 1965. xxvii+384 p.

3. PontryaginL.S. Linear differential games of pursuit. Mathematics of the USSR — Sbornik, 1981, vol. 40, iss. 3, pp. 285-303.

4. Ukhobotov V.I. Sintez upravleniya v odnotipnykh differentsial'nykh igrakh c fiksirovannym vremenem [Synthesis of control in single-type differential games with fixed time]. Vestnik Chelyabinskogo universiteta [Bulletin of Chelyabinsk University], 1996, no. 1, pp. 178-184. (In Russ.).

5. Ukhobotov V.I. Odnotipnye differentsial'nye igry s vypukloy tsel'yu [One type differential games with a convex goal]. Trudy Instituta matematiki i mekhaniki UrO RAN [Proceedings of the Institute of Mathematics and Mechanics of UB RAS], 2010, vol. 16, no. 5, pp. 196-204. (In Russ.).

6. Ukhobotov V.I. Odnotipnaya differentsial'naya igra s terminal'nym mnozhestvom v forme kol'tsa [Single-type differential game with a terminal set in the form of a ring]. Nekotorye zadachi dinamiki i upravleniya [Some problems of dynamics and control], collection of scientific papers, ed. V.D. Batukhtin. Chelyabinsk, Chelyabinsk State University, 2005. Pp. 108-123. (In Russ.).

7. Ukhobotov V.I., Izmest'ev I.V. Odnotipnye differentsial'nye igry s terminal'nym mnozhestvom v forme kol'tsa [Single-type differential games with a terminal set in the form of a ring]. Dinamika sistem i protsessy upravleniya [Systems dynamics and control processes], proceedings of the International Conference, dedicated to the 90th anniversary of Acad. N.N. Krasovskiy, Ekaterinburg, September 15-20, 2014. Ekaterinburg, Publishing House of the UMC UPI, 2015. Pp. 325-332. (In Russ.).

The work was supported by the Russian Foundation for Basic Research (grant 18-01-00264_а) and by Young Researchers Support Foundation of Chelyabinsk State University (2018).

8. Kolmogorov A.N., FominS.V. Elementy teorii funktsiy i funktsional'nogo analiza [Elements of the theory of functions and functional analysis]. Moscow, Nauka Publ., 1972. 496 p. (In Russ.).

Accepted article received 09.03.2018 Corrections received 05.05.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.