Научная статья на тему 'Гарантированный результат в задаче минимизации расстояния с интегральным ограничением'

Гарантированный результат в задаче минимизации расстояния с интегральным ограничением Текст научной статьи по специальности «Математика»

CC BY
116
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / ИНТЕГРАЛЬНОЕ ОГРАНИЧЕНИЕ / ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ / DIFFERENTIAL GAMES / INTEGRAL CONSTRAINT ON THE CONTROL OF THE PLAYER / GUARANTEED RESULT

Аннотация научной статьи по математике, автор научной работы — Алеева Сюзанна Рифхатовна

Рассматривается однотипная игра, в которой первый игрок имеет интегральное ограничение на управление, а второй — геометрическое. Цель первого игрока состоит в минимизации расстояния между игроками в фиксированный момент времени p при ограниченном запасе ресурса, цель второго противоположна. Строятся управления игроков, гарантирующие выполнение цели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The same game in which the first player has integral constraint on control, and the second one has geometrical constraint, is considered. The purpose of the first player is to minimize the distance between the players at a fixed time p with a limited stock of the resource, the goal of the second one is opposite. The players' controls to guarantee the fulfillment of purpose are constructed.

Текст научной работы на тему «Гарантированный результат в задаче минимизации расстояния с интегральным ограничением»

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

С. Р. АЛЕЕВА

ГАРАНТИРОВАННЫЙ РЕЗУЛЬТАТ В ЗАДАЧЕ МИНИМИЗАЦИИ РАССТОЯНИЯ С ИНТЕГРАЛЬНЫМ ОГРАНИЧЕНИЕМ

Рассматривается однотипная игра, в которой первый игрок имеет интегральное ограничение на управление, а второй — геометрическое. Цель первого игрока состоит в минимизации расстояния между игроками в фиксированный момент времени р при ограниченном запасе ресурса, цель второго противоположна. Строятся управления игроков, гарантирующие выполнение цели.

Ключевые слова: дифференциальные игры, интегральное ограничение, гарантированный результат.

Введение

Из [1] известно, что линейные задачи управления с фиксированным моментом окончания можно с помощью линейной замены переменных свести к задаче с простым движением. При такой замене переменных дифференциальная игра сводится к виду, когда вектограммы игроков в каждый момент времени гомотетичны одному и тому же выпуклому симметрическому компакту. Такой класс игр называется классом однотипных игр. Решение однотипной задачи с интегральными ограничениями сводится к экстремальной задаче. Область достижимости при интегральных ограничениях нелинейно зависит от потраченного запаса ресурсов. Это обстоятельство может приводить к дополнительным трудностям при построении оптимальных стратегий. В теории позиционных игр реализовавшееся движение понимается как пучок функций, каждая из которых является равномерным пределом некоторой последовательности ломаных при диаметре разбиения, стремящемся к нулю. В данной работе используется это определение реализовавшегося движения. Предлагается алгоритм построения гарантирующих стратегий игроков при начальном положении £0, ^0 и ресурсе, ограниченном величиной ^0. Придерживаясь такой стратегии, первый игрок может сделать расстояние между игроками в конечный момент времени не больше чем цена игры, а второй игрок не меньше чем цена игры. Теоретическое обоснование результата приведено в [2; 3], также для разного вида однотипных игр в [4; 5] решалась задача о минимизации запаса ресурса.

1. Постановка задачи

Игра «мальчик и крокодил» может быть сведена к однотипной игре с фиксированным временем окончания р [1]:

г = —(р — *)и + Ьу; Ь > 0, г,и, V € Ега; ||у|| ^ 1,

/л = — ||и(^)|2, ^ ^ 0. (1)

Стратегией первого игрока является функция вида

и = ^(*)и>(*, г),

здесь эд(*, г) любая функция, удовлетворяющая равенству

||эд(£, г) || = 1.

Функция ^ € Ь2[*,р] неотрицательна, строится в зависимости от начального состояния *0, г0, и удовлетворяет неравенству

Г Р

/ ^2(*)^ ^ ^0-Ло

Стратегия второго игрока — любая функция у(*, г), удовлетворяющая неравенству

1Н*,г)|1 ^ 1-

Рассмотрим задачу, когда цель первого игрока заключается в минимизации расстояния между игроками в конечный момент времени р:

|г(р)|| ^ тт, (2)

при условии осуществления неравенства

Г Р

/ ^2(*) № ^ ^0-Л0

То есть первый игрок минимизирует расстояние между игроками, используя для этого ограниченный ресурс.

2. Аналитическое решение задачи

В гл. 1 [3] в общем виде было доказано, что существует решение ^0(*) задачи

Г Р

С(^0,г0,^0) = 1п£ С*(^0,г0,^(-)), <^(*) ^ 0, / ^2(*)^ ^ ^0, (3)

^(•) Ло

где для нашей задачи (1)

С*(*0,20, ^(-)) = шах{^(*0,^(-)); 1Ы| + /(*0,^(-))},

(ь — (р — г)^(г)) ^

^(*0,^(-)) = тек /Сг^О^

при этом С(*о, 2о, ^о) является ценой игры (1) с целью (2), а функция <^о(£) используется в построении управления, гарантирующего результат. Перейдем к непосредственному построению цены в зависимости от начальных условий £о, 2о, ^0 и времени окончания р.

2.1. Построение цены игры

Ценой игры является минимальное значение следующей величины

С*(^о, 20, <£(•)) = шах< тах ( Ь(р — т) — / (р — г)^(г) I;

<р^ ^ у

Г Р

Н^оН + Ь(р — *о) — (р — г)^(г) ^г

Л0

поэтому от ее вида зависит значение цены при фиксированных начальных условиях.

2.1.1. Случай 1

Пусть

112о | + Ь(р — £о) — / (р — г)^(г) ^г ^ шах ( Ь(р — т) — / (р — г)^(г) ^г ) . (4)

Jto ^т<р V Л /

Тогда задача (3) принимает вид

/*Р ГР

112о| + Ь(р — £о) — / (р — г)^(г) ^г ^ шт, <^(£) ^ 0, / ^2(£) ^ ^ ^о.

•^0 <^о

Решением этой задачи является функция

^ ^(р — (). (5)

Теперь выясним, какие начальные условия характеризуют (4). Предположим,

что максимум в правой части достигается в точке т* € [£о,р], тогда условие (4)

примет вид

/> т *

||2о|| + Ь(р — £о) — / (р — г)^(г) ^г ^ 0. (6)

Возможны следующие случаи.

(р — г)^о(г) ^г имеем

ь2 —Ь + (р — £о)<^о(£о) ^ 0 и при любом 2о и 0 < р — £о ^ 3^о

С(^0,20,^0) = Ц20ІІ + Ь(р - Іо) - ^/у(р - ^о)3. (7)

2. т* = р, так как в противном случае — Ь + (р — £)<^0(£) ^ 0 при любом £ € [£0,р], но Ь > 0.

3. Пусть т* € (£0,р), тогда —Ь + (р — т)<^0(т) = 0 и —Ь + (р — £0)<^0(£0) ^ 0, из данных условий и вида (5) получаем ограничение для начальных значений

Ь2

р — £0 ^ ---. Остается предъявить ограничение для г0. Предположим, что

3^0

2Ь3 , . . 3я0

9^0 — Ь(Р — *>) + Ж

1^01| ^ т;-------Ь(р — £0) + “тз0(р — £0)3- (8)

Ь2

Покажем, что при р — £0 ^ -------- выполнено

3^0

9^- — Ь(р — *0) + 3р0(р — £0)3 > (9)

В самом деле, рассмотрим функцию

3^0 3 г, , 2Ь- ^ 9^0 2 ^

"-(ж) = -т^-х — Ьж +-------, п (ж) = —х — Ь

Ь3 9^0 Ь3

, / Ь2 \ 3^0 Ь6 , Ь2 2Ь3

и п — = -Ьт ■ -тт^ — Ь------------+-----= 0.

\3^0/ Ь3 27^0 3^0 9^0

Следовательно, П(р — £0) > 0 и условие (9) выполнено.

Из (6) следует, что

» Ь(р — т-) — Ь(р — *0) — ./ ^3- (р — т*)3 — (р — £0)3. (10)

(р — *0)

Сделаем замену р — т* = £, при £ € (0,р — £0) введем функцию

91(() = Ь* — Ь(р — *0) — ' 3р0 *3 — (р — *0)3

(р — *0)3 3

д1(£) = Ь — а/т ^^3 ■ *2 = 0-

(р — *0)

С учетом рассматриваемого интервала едиственная точка экстремума удовлетворяет соотношению

*

р — т

\

^ ,(р— *0)3 * „

Ь'/ -Э^Т" ■ т =р

,1„

Так как д1(0) > 0, а д1(р — £0) < 0, то при т* из (11) достигается максимум и

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

( -*\ - и -*\ и Ь (р— т *)3 — (р— *0)3 _

д1(р — т ) = Ь(р — т ) — Ь(р — *0) — (р — т*)2 ■ 3 =

_ 2и -*\ и 4. ^ , Ь(р— *0)3 _

= 3Ь(р — т ) — Ь(р — *0) + (р — т*)2 =

= 2Ь(р - т•) - Ь(Р - ^О^..

Теперь

2Ь3

2

\3

тах д1(£) = д1 (р — т*) ^ ----------Ь(р — *0) + ~пг(р — *0)

(0,р-*0) 9^0 Ь3

Ь2

для р — *0 > -------- и при выполнении условия (8) будет выполнено (10).

3^0

Поэтому окончательно имеем при

и и 2Ь3 3я2 3 Ь2

|ы| й 9^0— Ь(р — *°) + "ъ3"(р — *0) ■ р — *0 > э^0'

как и в (7),

^0,^0) = ||^0| + Ь(р — *0) — ~(р — *0)3•

2.1.2. Случай 2

Пусть теперь

/*р / /*р

||г0|| + Ь(р — *0) — / (р — г)^(г) ^ тах ( Ь(р — т) — / (р — г)^(г)

Ло *0^т^ V Л

или

II ~ II I

^0

£0|| + Ь(т* — і0) — / (р — г)^(г) ^ 0. (12)

Ло

У нас есть следующие ограничения:

Найдем точку 5 Є

Ь2

р — *0 > о—, (13)

3^0

11^01 < 9^ Ь(р — *0) + -Ь3°(р — *0)3. (14)

Ь2 \

*0, р--------из уравнения

3^0/

Ь

ко || = Ь(р — 5) — Ь(р — ^ + з(р — 5)2 ((р — іо)3 — (р — з)3) • (15)

*

Т

Изучим вопрос о существовании решения уравнения (15) при условиях

Ь2 / Ь2 ]

-— < р — 5 ^ р — *0. Обозначим р — ^ = х € -— ,р — *0

3^0 V 3^0

и рассмотрим функцию

д2(х) = Ьх — Ь(р — *0) + ^ ((р — *0)3 — х3) •

Тогда (15) имеет вид

1Ы1 = д2(х), (16)

//\7 2Ь , 3 Ь 2Ь х3 — (р — *0)3

д2(х) =Ь — ^ (р — *0)3 — 3 = -з------------------

поэтому на рассматриваемом промежутке

( ) ^ 2Ь3 Ь( * ) + 3^2(р — *0)3

д2(х) ^ --------Ь(р — *0) +

9^0 Ь3

эи эт

так как д2(х) убывает

Рассматриваем только Ц20Ц, удовлетворяющие (14), при этом ограничении урав-

/ Ь2

нение (16) имеет единственный корень х € ----,р — *0

\3^0

2Ь3 ) , 3^0(р— *0)3 ( , 0 ,, ,,

от-------Ь(р — *0) +----------------—-до д2(р — *0) = 0, а 11г0|1 находится на этом про-

9^0 Ь3

межутке в силу (14). Следовательно, в = р — х удовлетворяет условиям

Ь2

*0 ^ в<р — — • (17)

3^0

Замечание 1. При г0 = 0 значение в = *0.

Будем искать решение ^0(*) в следующем виде:

(Р—^(р — ^ *0 ^ ^ т*;

^0(*) = { (фщ, 5 < * < т*; (18)

(Р—_ (р — *), т* ^ ^ р.

Замечание 2. При таком выборе <£0(*) выполняется условие (12),

||г0|| + Ь(в — *0) — / (р — г)^(г) ^г = 0.

Ло

Осталось проверить условие (3). Подставим (18) в это ограничение:

Ь2 Г Л* г]г Ь2 ГР

^ / (р — г)2 * + Ь21 (р—^ +(р^ /. (р — г)2 * =

Получаем условие для определения т*:

4Ь2 , 4Ь2 Ь2(р — *0)3 (19)

^0 + г------. (19)

3(р — т *) 3(р — в) 3(р — в)4

4Ь2

Так как в ^ т*, то правая часть в (19) должна быть не меньше чем

3(р — в)

Имеем условие существования ^о(^) в виде (18):

3Мр — в)4 — &2(р — ^о)3 ^ 0. (20)

Замечание 3. При в = £0 и выполнении (13) условие (20) выполняется строго,

Ь2

поэтому (20) выполняется и при других значениях в € ^0,р-------------

|_ 3^о

тт и и 2Ь3 3я2 3 Ь2

Цена игры при Ц^оУ < -------Ь(р — £о) + ~гг(р — £о) и р — ^ > -—:

9^0 о3 3^о

С(^о,2о,^о) = 2 Ь(р — т *). (21)

Таким образом, цена игры вычисляется в зависимости от начальных значений £0,

го, ^о, времени окончания р и имеет либо вид (7), либо (21).

2.2. Гарантирующие стратегии игроков

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При условии, что есть начальные условия из областей, запишем полученные решения.

о2

I. Пусть 0 < р — £0 ^ ---, любое го. Тогда

3^о

2о,^о) = ||^о| + Ь(р — ^ — у ^3” (р — ^о)3-

Ь2 2Ь3 3^0

II. При р — *о >^—, 1Ы| -------Ь(р — ^о) + ~гг(Р — *о) имеем

3^0 9^0 Ь3

С(^о,2о,^о) = ||го|| + 6(р - іо) - у/у (р - і0)3.

ттт п Ь2 263 3^о, ч3

III. Если р - іо > о—, 1Ы1 < 9--------------6(р - іо) + -гг(р - іо) , то

3^о 9^о 63

(Р-^2 (р - і) , іо ^ ^ ^ т*;

<^о(і) = { (р-) , 5 < ^ < т*;

(р - і) , г * ^ і ^ р;

2

С(^о,^о,^о) = з6(р - т*),

где т* удовлетворяет условию (19).

Стратегией первого игрока, гарантирующей выполнение цели, является и = <£0(£)эд(г), стратегией второго игрока будет V = и>(г), где

эд(г) = г/||г|| при ||г|| = 0;

эд(г) = в,Ув : ||в|| = 1, при ||г| = 0.

Список литературы

1. Красовский, Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин. — М. : Наука, 1974.

2. Алеева, С. Р. Однотипная игра с интегральным ограничением первого игрока / С. Р. Алеева, В. И. Ухоботов // Вестн. Челяб. гос. ун-та. — 1999. — № 1 (4). — Математика. Механика. Информатика. — С. 16-29.

3. Алеева, С. Р. Моделирование гарантированного результата в задачах управления движением с интегральными ограничениями в условиях воздействия помех : дис. ... канд. физ.-мат. наук / С. Р. Алеева. — Челябинск, 2002. — 145 с.

4. Алеева, С. Р. Дифференциальная игра «мальчик и крокодил» с интегральным ограничением преследователя / С. Р. Алеева ; Челяб. гос. ун-т. — Челябинск, 1999. — 10 с. — Деп. в ВИНИТИ 04.10.99, № 2985-В99.

5. Алеева, С. Р. Об одной дифференциальной игре с интегральным ограничением / С. Р. Алеева // Математика. Механика. Информатика : материалы Всерос. науч. конф., Челябинск, 19-22 сент. 2006 г. / отв. ред. С. В. Матвеев. — Челябинск : Челяб. гос. ун-т, 2007. — С. 7-13.

i Надоели баннеры? Вы всегда можете отключить рекламу.