ISSN 1810-0198. Вестник Тамбовского университета. Серия: естественные и технические науки
Том 23, № 124
2018
DOI: 10.20310/1810-0198-2018-23-124-877-890 УДК 517.977.8
ФУНКЦИЯ ЦЕНЫ ДИФФЕРЕНЦИАЛЬНОЙ ИГРЫ С ПРОСТЫМИ ДВИЖЕНИЯМИ И ИНТЕГРАЛЬНО-ТЕРМИНАЛЬНОЙ ПЛАТОЙ
< Л. Г. Шагалова
ФГБУН «Институт математики и механики им. Н. Н. Крас овс кого» Уральского отделения Российской академии наук 620990. Российская Федерация, г. Екатеринбург, ул. С. Ковалевской. 16 Е-таП: [email protected]
Аннотация. Рассматривается антагонистическая дифференциальная игра двух лиц. Динамика системы описывается дифференциальным уравнением с простыми движениями, а функционал платы является интегрально-терминальным. Для случая, когда терминальная функция и гамильтониан кусочно-линейны, а размерность фазового пространства равна двум, предлагается конечный алгоритм точного построения функции цены.
Ключевые слова: дифференциальная игра; простые движения; функция цены; уравнение Гамильтон а-Якоб и; минимаксное решение; алгоритм
Введение
Дифференциальные игры с простыми движениями представляют собой простые модели конфликтно управляемых систем. Динамика системы в таких играх зависит только от управлений игроков. Решения таких игр, представляющие и самостоятельный интерес, часто используются в численных алгоритмах для решения дифференциальных игр общего вида. Несмотря на простоту динамики, решения таких игр известны лишь в некоторых частных случаях, а в общем случае нахождение решений является нелегкой задачей.
Дифференциальные игры с простыми движениями исследовались многими авторами, в частности [1-3]. В данной работе антагонистическая дифференциальная игра с фиксированным моментом окончания рассматривается в контексте позиционной формализации, разработанной в [4,5].
Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект № 17-01-00074) и УрО РАН (Комплексная программа № 18-1-10).
В рассматриваемой игре задан интегрально-терминальный функционал платы. Из заданной начальной позиции первый игрок стремится минимизировать плату, второй игрок - максимизировать. Управления обоих игроков формируются по принципу обратной связи. Для заданной начальной позиции цена определяет оптимальный гарантированный результат обоих игроков. Функция цены определяет оптимальный результат для всех начальных позиций игры.
Знание функции цены дает возможность построить оптимальные позиционные стратегии игроков, поэтому разработка методов нахождения функции цены является важным направлением в теории дифференциальных игр.
Известно [6,7], что функция цены является минимаксным решением уравнения Га-мильтона-Якоби-Беллмана-Айзекса, соответствующего рассматриваемой дифференциальной игре. При этом понятие минимаксного решения эквивалентно понятию вязкостного решения, введенного в [8].
В настоящей работе представлен конечный алгоритм построения точного минимаксного решения уравнения Гамильтона Якоби, соответствующего дифференциальной игре с простыми движениями и интегралы ю-терминальной платой, в случае двумерного фазового пространства и кусочно-линейных входных данных. Представленные результаты обобщают результаты, полученные в [9-11].
1. Постановка задачи
Рассматривается следующая антагонистическая позиционная дифференциальная игра на конечном отрезке времени. Движение управляемой системы описывается уравнением
:а[ и)Ш * /]М', ж / Я", Р э Я", <? Э Яп. (1.1)
Здесь £— время, •д — заданный момент окончания игры, х- фазовый вектор, и) хЗ- и у) формируемые по принципу обратной связи управления первого и второго игроков соответственно. Предполагается, что множества Р и Ц- компакты, а функция / 1 Р 0<2 00 непрерывна.
Пусть )£0] .г'о+/ ] 1. "д СЙ" ~~ начальная позиция. На движениях управляемой системы (1.1), соответствующих начальной позиции, задан интегрально-терминальный функционал платы
1[ С7)ж)1?+Ю { д)и)т^)т-М1т, (1.2)
¿0
где функция а ; Д™ оо К предполагается липшицевой, а функция д ; Р непре-
рывна. Первый игрок выбором своего управления стремится минимизировать плату, второй игрок - максимизировать.
Предположим, что для рассматриваемой дифференциальной игры выполнено следующее условие
п1хпОЯ)«0 у\0 д)и,у+[ пГпЫКиО 0 д)и,у+[ Н)зв / И"1, (1.3)
ш| Р тг| С} V] и\ Р
где )s, Л обозначает скалярное произведение векторов s и /. Функцию опре-
деленную равенством (1.3), будем называть гамильтонианом дифференциальной игры (1.1), (1.2).
В [1,2] доказано, что при выполнении условия (1.3) для любой начальной позиции )t,0,x0+/ ОRn существует цена игры u)t0: ж0+ Таким образом, существует функция цены ш ; ]1, {)' QR" оо R. Однако, нахождение функции цены - весьма нелегкая задача, для решения которой не существует универсального метода. Отметим, что в случае, когда подынтегральная функция д) ^-тождественно равна нулю, то есть функция платы является терминальной, задача существенно упрощается. В частности, если одна из функций ii) х^или сг) хН является выпуклой или вогнутой, для функции цены можно, используя известные формулы Хопфа-Лакса |12-14], выписать явные формулы. Также в случае не обязательно выпуклых кусочно линейных и <т) х^ когда раз-
мерность п фазового пространства равна двум, а терминальная плата положительно однородна, то есть функция а) ^-удовлетворяет условию
сг)Лж+[ \сг)х-Ь х / Я", Л / R, X > 1, (1.4)
для построения функции цены можно использовать конечный алгоритм [9-11]. Целью настоящей работы является обобщение этого алгоритма на случай ненулевой подынтегральной функции д)
2. Функция цены как минимаксное решение уравнения Гамильтона—Якоби
В этом разделе приведены сведения из [6,7] и факты, которые несложно получить из этих сведений, используемые далее для разработки алгоритма построения функции цены дифференциальной игры (1.1)—(1.3).
Функция цены и ; ]1, Q)Rn оо R совпадает с минимаксным решением следующей задачи Коши.
9ш)тХ+0 н)дШдхХ+([ 1 X/Rn (2.5)
ш)д,хЛ{ а)х^ x/Rn. (2.G)
Минимаксное решение задачи (2.5), (2.6) существует и единственно. Далее будем предполагать, что терминальная функция с) >4-является положительно однородной, то есть удовлетворяет условию (1.4). Гамильтониан Н) >4- определен равенством (1.3) и, как нетрудно заметить, не является положительно однородным.
Определим функции
/ УУЩ+ при г у 1, г+1 \ in гИУ-+ при Р [ 1, >>*+/ ОR: (2.7)
reo г
о*)х,у+\ а)х-ш у, X /R>\ у / R. (2.8)
Предполагаем, что предел в (2.7) существует.
Рассмотрим задачу Коши для уравнения Гамильтона-Якоби с положительно однородным относительно переменной s [ )s,r+ гамильтонианом
dt 0H ) dx > dy \[ h oR (2.9)
u)d,x,y+[ o*)x,y+ x/Rn,y/R. (2.10)
Справедливо следующее утверждение.
Теорема 2.1. Функция и;)£, х+является минимаксным решением задачи (2.5), (2.6) тогда и только тогда, когда функция u)t,x,y+\ ш)£,х-Ю у является минимаксным решением задачи (2.9), (2.10).
Итак, задача нахождения функции цены с интегрально-терминальным функционалом платы сводится к решению уравнения Гамильтона-Якоби с положительно однородным гамильтонианом. При этом размерность фазового пространства увеличивается на единицу.
Если гамильтонан Н^) >4- удовлетворяет условию Липшица, для минимаксного решения u)t,x, справедливо соотношение
u)t,x,y+[ )•& x/Rniy/R. (2.11)
Используя соотношение (2.11), можно заменить задачу (2.9), (2.10) редуцированной задачей нахождения функции
<р)х,уЦ и)1,х,у+ x/Rn,y/R. (2.12)
Функция (р) ^-является минимаксным решением следующего уравнения в частных производных первого порядка
^ (2.13)
которое рассматривается наряду с предельным соотношением
*П<*<р)-Л([ "^Иг x/R\y/R (2.14)
neo Ja а l
Минимаксное решение уравнения (2.13) - непрерывная функция, удовлетворяющая парс дифференциальных неравенств. Эти неравенства можно записать различными по форме, по эквивалентными по существу способами. Здесь удобно выписать эти неравенства в следующем виде.
Rl)l7m-\Q )1,х\ 0 т ху > <р)х,х / Rn, у / R, )1,тп+/ D <р)х,у^ (2.15)
Hl)l,m-№ )1,х| 0 m уу с <р)х, х / Rn7 у / R, )/,т+/ D+<p)x,y^ (2.16)
где множества D <р)х, у+и D+(p)x,y-\— соответственно субдифференциал и супердиф-ферсициал функции tp) >4- в точке )х,у-\т
3. Алгоритм построения функции цены
В случае, когда размерность фазового пространства равна двум, а терминальная функция а)XI-и подынтегральная функция д)хНкусочно-линейны, функция ш)хЗ-цсиы дифференциальной игры (1.1)-(1.3) является кусочно-линейной и может быть построена точно. Опишем здесь алгоритм построения функции ф) х^ зная которую, с помощью соотношения (2.11) и теоремы 2.1 можно получить функцию ш) >4г
3.1. Представление предельной функции
Пусть
У+ [ П1~}1=У<> У [ п1х}1=у{, у/Я
(7+)х+[ II1 , а )ж+[ п 1 ~}1=0-)х-({, х / Яп
о\)х,у+[ сг+)ж-Ю у+, сг" Ку+[ а )ж+0 у , х / Яп, у / Я.
Нетрудно заметить, что предельная функция ст") А- (2.8) может быть представлена в виде
4КУ+0 ^Кгн х/яп,у/я. (3.1)
При этом для решения задачи (2.13), (2.14) справедливо представление
<р)х,уЦ <р+)х,у^) <р )х,у\ х/Яп,у/Я, (3.2)
где ) >4-и <р ) х}— решения задачи (2.13), (2.14), соответствующие предельным функциям х^и ст" ) ^-соответственно. При описанных ниже предположениях построения функций ) х)- и [р ) И-не отличаются по существу.
3.2. Предположения
Алгоритм разработан при следующих предположениях. А1. Подынтегральная функция д)А-имеет вид
д)и,у-К 51)«-К> 52М и/Я2,ь/Я\ (3.1)
где дг ; Я2 оо Я и д2 ; Я2 оо Я- непрерывные кусочно-линейные функции, склеенные из конечного числа линейных функций. Таким образом, их сумма д) тоже является непрерывной кусочно-линейной функцией. А2. Множества Р и <3- многогранники.
Из (1.3) следует, что гамильтониан Н)>4гдифференциальной игры (1.1)—(1.3) также кусочно-линеен и склеивается из конечного числа линейных функций
Я>+[ <к\з>Ор\ г /2^7, й1 /Я2,р1 /Я, з /Я2. (3.2)
АЗ. Функция о) хНположительно однородна (удовлетворяет условию (1-4)) и кусочно-линейна, то есть сформирована с помощью склейки конечной совокупности линейных функций
а1)х+[ < в\х >, % / 2, По-, в* / Я2, х / Я2.
Обозначим
(3.3)
Кроме того, в силу представлений (3.1), (3.2), без ограничения общности можно считать, что функция а) ^-неотрицательна
ст)х+С 1, х / Я2, (3.4)
и рассмотреть алгоритм построения функции <р) соответствующей предельной фупк-
п*)х,у+[ а)х+0 у+, X /В2, у / Я. (3.5)
3.3. Простые кусочно-линейные функции
Для разработки алгоритма полезным является использованное в [9,10] понятие простой кусочно-линейной функции (ПКЛФ). Основное свойство ПКЛФ заключается в следующем. Если функция ф ; В2 —У И оо Я является ПКЛФ, тогда для любой точки существует окрестность 0£)х^ в которой ф) >4- имеет одно из трех возможных представлений:
ф)х+[ 0 /ц,
ф)х-Ь[ 0 0
ф)х+[ п1х})51,ж| 0 /г^, О
Здесь вг и 3] - векторы из Я2. а }ц и - числа. Таким образом, область определения ПКЛФ не содержит точек, в малой окрестности которых склеиваются три или более линейных функций.
Для формального определения ПКЛФ используются структурные матрицы. В данной работе не будем приводить строгое определение, отметим лишь, что структурная матрица содержит информацию обо всех линейных функциях, формирующих соответствующую ПКЛФ. Зная структурную матрицу, можно вычислить значение ПКЛФ в каждой точке ее области определения.
Замечание 3.1. Если выполнено условие АЗ, неотрицательная функция а ; Я2 оо Я является ПКЛФ в области Я2 1, где символом 1 обозначен нулевой вектор.
3.4. Элементарные задачи
Алгоритм построения функции ф) ^-заключается, по существу, в последовательном решении элементарных задач, которые возникают в определенном порядке.
Пусть
п1~})а,аг| 0 у,)Ъ,х\ 0 у{, )ж,у+[ п1х})а,ж| 0 у,)Ь,х\ 0 у{,
где а, 6, х — векторы из Я2, у / Я.
Задачи 1 и 2. Пусть заданы некоторые линейно независимые векторы а и Ь. В задаче 1 (задаче 2) требуется построить минимаксное решение задачи (2.13), (2.14), (3.2) при (71 [ (при сг" [ )■
Поскольку функция выпукла, а функция ^ вогнута, можно получить явные формулы для решений задач 1 и 2. Можно показать, что решениями этих задач являются функции
ф+)х,у+[ пГДКй ф )х,у+[ пЬс ф^х, уЧг (| |а,Ь| ¡| |а,Ь|
]а7Ь' [ }Аа 0 )2 АнЦА /]1,2"{, ф1)х, у+[ 0 у О Я)И
Первый этап алгоритма построения решения <р) ^-задачи (2.13), (2.14), (3.5) заключается в последовательном решении задач 1 и 2 и склейке из этих решений простой кусочно-линейной функции. Конкретные задачи, которые необходимо решить, определяются функцией а)
Дальнейшее построение решения заключается в решении элементарных задач другого типа.
Пусть ^ [ )зх, з2, 53+/ Я3. Обозначим
<Рш)х, у+[ )з, х\ 0 5з уу О X / В2, у / Я,
где вектор з / Я2 образован из первых двух компонент вектора з [
Отметим, что если з3 [ 2, тогда Н)в+ап6 <рв)х7у-\-\ ф$)х,у-\г
Для заданного множества М обозначим его замыкание символом с1М, а границу - символом дМ.
Задачи 3 и 4. Пусть заданы линейно независимые векторы ф [ )а1, «л, «з+/ Я3 и Ь [ )&1, Ьо, ¿з+/ Я3 и число г > 1. Пусть
(р1)х7у+[ п У+1
СМ })х,у+/1?\*)х,ул<г{, })х,у+/
В задаче 3 требуется построить непрерывную функцию <р° ; сЮ^ сю Я, являющуюся в области Ст^ минимаксным решением уравнения в частных производных (УЧП) первого порядка (2.13) и удовлетворяющую соотношениям
<р°)х,у+< г, и)х,у+/&= <р°)х,уЦ г, и¡)х,У+/дС*>.
В задаче 4 требуется построить непрерывную функцию (р0 ; сЮ^ оо Я7 являющуюся в области С^ минимаксным решением уравнения (2.13) и удовлетворяющую соотношениям
(ро)х,у-Ь<г, и)х,у+/ (ро)х,уЛ{ г, и)х,у+/
Решением задачи 3 является функция
<{Р)х,у-\-[ при ^ / ЯЖ Н
где
/соп)4,Ц< > О Н1)§+[ г{, /^ДХ с С 1{, а точка ъи0 / В2- решение системы двух линейных уравнений
>а,иь| О г, 1 О Н±)Ь+[ г.
Компоненты векторов а / В2 и Ь / В2 совпадают с первыми двумя компонентами векторов 4 и » соответственно.
Решением задачи 4 в случаях, возникающих при построении решения задачи (2.13), (2.14), (3.5), является функция
<ро)х,у+[ п1х(/?5)х,у+ при 4 /
4. Основной результат
Обозначим символом ~ множество точек из
В3.
в которых гамильтониан Н^ ; В3 оо В недифференцируем. Пусть 1— нулевой вектор в В3. По множеству Ъ Э В2 (3.3) векторов, формирующих функцию а, определим множество Г) В3.
Ш [ 2{.
Следующее утверждение содержит основной результат работы.
Теорема 4.1. Пусть выполнены условия А2-АЗ. Тогда
A) Решение <£>) >4-задачи (2.13), (2.14), (3.5) - неотрицательная кусочно-линейная функция, образованная с помощью склейки линейных функций
<Рв)х,У+[ )з,х\0 з3>уО к /Ь, (4.1)
где множество Ь состоит из конечного числа элементов, и
2» э Ь, )Ь )" { 1 +
B) Для любого ух / В функция <р)х, в области }ж / В2\р)х,у^+> 1( образована с помощью склейки конечного числа простых кусочно линейных функций.
Доказательство теоремы следует из описанного выше алгоритма. Неотрицательность функции ф) >4 обусловлена неотрицательностью функции а)>% вид (4.1) линейных функций, формирующих решение, обусловлен конкретными элементарными задачами, возникающими в ходе его построения.
Для доказательства того, что построенная в результате алгоритма функция ф) >4-являстся минимаксным решением уравнения (2.13), необходимо проверить выполнение
неравенств (2.15), (2.16). В точках, где (р) ^-совпадает с решением какой-то из рассмотренных выше элементарных задач, эти неравенства выполнены. Таким образом, следует проверить выполнение неравенств (2.15), (2.16) на поверхностях склейки решений различных элементарных задач, формирующих функцию ср) При этом если поверхность склейки не принадлежит никакой из областей определения решений элементарных задач, существует число г С 1 такое, что D })аг, у-\~/ R2 QR\p)x, У+[ г{ ■
Пусть . Если существует окрестность в которой функция р
линейна, неравенства (2.15), (2.16) выполняются. Действительно, в этом случае существует вектор $ [ S3{, s^ / Д2, S3 / R такой, что
tp)x,y+[ срг [ 0 4 )х±,у±+/ 0£)xhy±+
Функция ip дифференцируема в Ое)х±, у^ и D <р)х^у^+[ D+p)xi,yi+[ и в точке )аф 24+выполняются неравенства (2.15), (2.16).
Рассмотрим случай, когда в точке / происходит склейка двух линей-
ных функций. Из алгоритма следует, что в этом случае возможны две ситуации. В первой для любого £ > 1 в окрестности 0£)х^, можно указать точку )x£ly£-\^ в которой функция <р склеивается из тех же линейных функций и является решением какой-то элементарной задачи, причем <р)хЕ, уЕ+> г. Очевидно, что в этой ситуации D <р)х^у^[ D <р)х£,у£+ и В+ч>)х±,у±+ [ D+<p)xE,yE-\r Поскольку в точке )х£,у£+ неравенства (2.15), (2.16) выполняются, в силу непрерывности получим, что они выполнены и в точке
Во второй ситуации в некоторой окрестности точки функция р
имеет вид
<р)х,у+[ ni ~}<ра)х,у-^<р-ь)х,у-{(,
где векторы (i, Ь из R3 связаны равенством Ь [ fi(i, /1 > 1, причем вектор (i -ненулевой. Имеем D"1"^)^,
D <р)х±,у±+[ Аф, А /]1,2'{ { }( / R3\t [ А&, А / ]1,2'(.
Так как функции (ра и щ положительно однородны, и
¥>К|;У1+[ <Pa.)xUUl+[ Ч>ъ)хЬУ*г+[ г С 1,
получаем, что и в этой ситуации неравенства (2.15), (2.16) выполняются.
Рассмотрим, наконец, случай, когда точка Jxj., является узловой, то есть в ней происходит склейка п (п С : ) линейных функций
<рйР)х,у+[ )d?,x\ 0 4 хуО р[ 2,...,п. (4.2)
Функция <р недифференцируема в точке у^ поэтому одно из множеств D <р)х±,
пусто. Примем для определенности, что D+<p)x±, 0. Если при этом
D 0, неравенства (2.15), (2.16), очевидно, выполняются.
Предположим, что D щ+f/ 0. Символом <рЕ) >4- обозначим сужение функции
<р на некоторую достаточно малую выпуклую окрестность 0Е)х±, такую, что в этой окрестности функция р склеивается только из функций (4.2). Можно показать, что
D D (рЕ)хиyrf
где tpe) выпуклая оболочка функции сре. Таким образом, D <р)х±, является ограниченным замкнутым выпуклым множеством. При этом если & / D (^)зф уу^ существуют векторы £ / R3, Ь / Д3, такие, что
[ })2 А^О \i>\\ / ]1,2"{)
и для любого п [ 2,3,... существует точка )х„, уп+/ 0Еп, у такая, что D ip)xn,yn-\-= ]а,Ь*. Здесь £п [ е/п. Точки )хп, у„+не являются узловыми, поэтому в них выполнено неравенство (2.15). В частности,
tf^-K) )l,xnI 0 k ууп > <р)хп,уп+ (4.3)
Переходя в (4.3) к пределу при п оо € , получим
0 )/,0 13 уу^ > <p)xhy^
что доказывает выполнение неравенства (2.15). Неравенство (2.16) выполнено в силу пустоты супердифференциала.
Случай, когда D+<p)x^ У4.+У 0, D+<p)x±, у.;+[ 0, рассматривается аналогично. Таким образом, построенная в результате алгоритма функция ф) >4- является минимаксным решением уравнения (2.13).
Покажем, что построенная в результате реализации алгоритма функция (р удовлетворяет соотношению (2.14). Рассмотрим произвольную точку у\г^х± / R2, щ. / Д, VI С 1.
Если х± - нулевой вектор, тогда для любого а > 1 вектор ^ также является нулевым. В случае [ 1 имеем
rin а<р )-,-([ lin aip)l, 1+[ 1[ сг")1,1+
QÔ) /а а \ аео
В случае у^У 1 из алгоритма следует, что существуют число сц > 1 и вектор s / R2 такие, что для всех 1 < а < справедливо соотношение
<р) lAf [ -0 Н)в-Ь
) а I а
из которого получаем
lin аир ] — 1 — ( [ У], [ neo J а а \
Пусть теперь — ненулевой вектор. Если при этом существует окрестность 0)х^+ точки х± на плоскости R2. в которой функция а) >4-линейна
а)х+[ )а,х\ , х / 0)х^
тогда из алгоритма построения функции (р следует, что существует число сц, > 1 такое, что для всех 1 < et < о^ справедливо
<р)хЛ([ )а,-Р0Я)а+
/ а \ / al а
Таким образом,
ой) /а а I
Осталось рассмотреть случай, когда в окрестности 0)х^г точки на плоскости R2 функция <т) склеивается из двух линейных функций. Пусть, для определенности, линейные функции склеиваются с помощью операции максимума
ст)х+[ 11 i ~ })а,ж| ,)Ь,х\ { , х / 0)xi~\r
Тогда существует число > 1 такое, что для всех 1 < « < сц точка находится
в области, в которой функция <р совпадает с решением первой элементарной задачи, определяемой векторами а и Ь, и
<р)—, — ([ ni~ IWo )2 Л-&, — /Ь — 0 Н)ХаО )2 Л4+ .
/ a a I А| [o,i] ) / a J а
Получаем
iin сир ^ —, — ( [ п i~ }}а,ж| ,)6,а;|{ 0 у [ у^
ad) / а а I
что завершает проверку выполнения предельного соотношения (2.14). Доказательство части В) опускаем.
СПИСОК ЛИТЕРАТУРЫ
1. Pachter М., Yavin Y. Simple-motion pursuitevasion differential games, part 1: Stroboscopic strategies in collision-course guidance and proportional navigation 11 Journal of Optimization Theory and Applications. 1986. Vol. 51. № 1. P. 95-127.
2. Petrosjan L.A. Differential games of pursuit (Series on Optimization. Vol. 2). Singapore: World Scientific Publ., 1993.
3. Камнева Л.В., Пацко B.C. Построение максимального стабильного моста в играх с простыми движениями на плоскости // Труды Института математики и механики Уральского отделения РАН. 2014. Т. 20. № 4. С. 128-142.
4. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
5. Krasovskii N.N., Subbotin A.I. Game-Theoretical Control Problems. N. Y.: Springer-Verlag, Inc., 1988. 517 p.
6. Субботин А.И. Минимаксные неравенства и уравнения Гамильтон а-Я коби. М_: Наука, 1991. 216 с.
7. Subbotin A.I. Generalized Solutions of First Order PDEs. The Dynamical Optimization Perspective. Boston: Birkhauser, 1995. 312 p.
8. Crandall M. G., Lions P.-L. Viscosity solutions of Hamilton-Jacobi equations // Transactions of the American Mathematical Society. 1983. Vol. 377. № 1. P. 1-42.
9. Субботин А.И., Шагалова JI.Г. Кусочно-линейное решение задачи Коти для уравнения Гамильтон а-Я коби // Доклады Академии наук. 1992. Т. 325. Вып. 5. С. 144-148.
10. Shagalova L.G. A piecewise linear minimax solution of the Hamilton-Jacobi equation // IFAC Proceedings Volumes. 1998. Vol. 31. № 13. P. 193-197.
11. Шагалова Л.Г. Кусочно-линейная функция цены дифференциальной игры с простыми движениями // Вестник Тамбовского университета. Серия Естественные и технические науки. Тамбов, 2007. Т. 12. Вып. 4. С. 564-565.
12. Hopf E. Generalized Solutions of non-linear Equations of First Order // Journal of Mathematics and Mechanics. 1965. Vol. 14. № 6. P. 951-973.
13. Пшеничный Б.Н., Сагайдак М.И. О дифференциальных играх с фиксированным временем // Кибернетика. 1970. № 2. C. 54-63.
14. Bardi M., Evans L. On Hopf's formulas for solutions of Hamilton-Jacobi equations // Nonlinear Analysis: Theory, Methods & Applications. 1984. Vol. 8. № 11. P. 1373-1381.
Поступила в редакцию 17 апреля 2018 г.
Прошла рецензирование 21 мая 2018 г.
Принята в печать 26 июня 2018 г.
Шагалова Любовь Геннадьевна, Институт математики и механики им. Н. Н. Красовского Уральского отделения Российской академии наук, г. Екатеринбург, Российская Федерация, кандидат физико-математических наук, старший научный сотрудник отдела динамических систем, e-mail: [email protected]
Для цитирования: Шагалова Л.Г. Функция цены дифференциальной игры с простыми движениями и интегрально-терминальной платой // Вестник Тамбовского университета. Серия: естественные и технические науки. Тамбов, 2018. Т. 23. № 124. С. 877-890. БОТ: 10.20310/1810-0198-2018-23-124-877-890
DOI: 10.20310/1810-0198-2018-23-124-877-890
THE VALUE FUNCTION OF A DIFFERENTIAL GAME WITH SIMPLE MOTIONS AND AN INTEGRO-TERMINAL COST
L. G. Shagalova
Institute of Mathematics and Mechanics named after N.N. Krasovskii 16 S. Kovalevskaya St., Yekaterinburg 620990, Russian Federation El-mail: [email protected]
Abstract. An antagonistic positional differential game of two persons is considered. The dynamics of the system is described by a differential equation with simple motions, and the payoff functional is integro-terminal. For the case when the terminal function and the Hamiltonian are piecewise linear, and the dimension of the state space is two, a finite algorithm for the exact construction of the value function is proposed.
Keywords: differential game; simple motions; value function; Hamilton-Jacobi equation; algorithm
REFERENCES
1. Pachter M., Yavin Y. Simple-motion pursuit evasion differential games, part 1: Stroboscopic strategies in col lis ion-course guidance and proportional navigation. Journal of Optimization Theory and Applications, 1986, vol. 51, no. 1, pp. 95-127.
2. Petrosjan L.A. Differential Games of Pursuit (Series on Optimization, Vol. 2). Singapore, World Scientific Publ., 1993.
3. Kamneva L.V., Patsko V.S. Construction of a maximal stable bridge in games with simple motions on the plane. Proceedings of the Steklov Institute of Mathematics, 2016, vol. 292, suppl. 1, pp. 125-139.
4. Krasovskiy N.N., Subbotin A.I. Pozitsionnyye differentsial'nyye igry [Positional Differential Games]. Moscow, Nauka Publ., 1974, 456 p. (In Russian).
5. Krasovskii N.N., Subbotin A.I. Game-Theoretical Control Problems. New York, SpringerVerlag, Inc., 1988, 517 p.
6. Subbotin A.I. Minimaksnyye neravenstva i uravneniya Gamil'tona-Yakobi [Minimax Inequalities and Hamilton-Jacobi Equations]. Moscow. Nauka Publ., 1991, 216 p. (In Russian).
7. Subbotin A.I. Generalized Solutions of First Order PDEs. The Dynamical Optimization Perspective. Boston. Birkhauser, 1995, 312 p.
8. Crandall M.G., Lions P.-L. Viscosity solutions of Hamilton-Jacobi equations. Transactions of the American Mathematical Society, 1983, vol. 377, no. 1. pp. 1-42.
9. Subbotin A.I., Shagalova L.G. A piecewise linear solution of the Cauchy problem for the Hamilton-Jacobi equation. Russian Academy of Sciences. Doklady. Mathematics, 1993, vol. 46, pp. 144-148.
The work is partially supported by the Russian Fund for Basic Research (project № 17-01-00074) and by the Ural Branch of the Russian Academy of Sciences (comprehensive program № 18-1-10).
10. Shagalova L.G. A piecewise linear minimax solution of the Hamilton-Jacobi equation. IFAC Proceedings Volumes, 1998, vol. 31, no. 13, pp. 193-197.
11. Shagalova L.G. Kusochno-lineynaya funktsiya tseny differentsial'noy igry s prostymi dvi-zheniyami [A piecewise linear value function of a differential game with simple motions]. Vestnik Tambovskogo universiteta. Seriya: Estestvennye i tekhnicheskie nauki - Tambov University Reports. Series: Natural and Technical Sciences, 2007, vol. 12, no. 4, pp. 564-565. (In Russian).
12. Hopf E. Generalized Solutions of non-linear Equations of First Order. Journal of Mathematics and Mechanics, 1965, vol. 14, no. 6, pp. 951-973.
13. Pshenichnyi B.N., Sagaidak M.I. Differential games of prescribed duration. Cybernetics, 1970, no. 6, pp. 72-83.
14. Bardi M., Evans L. On Hopf's formulas for solutions of Hamilton-Jacobi equations. Nonlinear Analysis: Theory, Methods & Applications, 1984, vol. 8, no. 11, pp. 1373-1381.
Received 17 April 2018 Reviewed 21 May 2018 Accepted for press 26 June 2018
Shagalova Lyubov Gennad'evna, Institute of Mathematics and Mechanics named after N.N. Kra-sovskii, Yekaterinburg, the Russian Federation, Candidate of Physics and Mathematics, Senior Researcher of the Dynamical Systems Department, e-mail: [email protected]
For citation: Shagalova L.G. Funktsiya tseny differentsialnoi igry s prostymi dvizheniyami i integralno-terminalnoi platoi [The value function of a differential game with simple motions and an integro-terminal cost]. Vestnik Tambovskogo universiteta,. Seriya: estestvennye i tekhnicheskie nauki - Tambov University Reports. Series: Natural and Technical Sciences, 2018, vol. 23, no. 124, pp. 877-890. DOI: 10.20310/1810-0198-2018-23-124-877-890 (In Russian, Abstr. in Engl.).