Известия Института математики и информатики Удмуртского государственного университета
2024. Том 64. С. 119-130
УДК 517.977 © К. А. Щелчков
УПРАВЛЕНИЕ НЕЛИНЕЙНОЙ СИСТЕМОЙ ВДОЛЬ ТРАЕКТОРИИ В УСЛОВИЯХ ВОЗДЕЙСТВИЯ ПОМЕХИ
Рассматриваются две задачи управления вдоль заданной траектории с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй — нелинейной системой дифференциальных уравнений второго порядка. Управление осуществляется посредством кусочно-постоянной функции, множество значений которой является конечным. Целью управления является движение сколь угодно близко к некоторой конечной траектории при любых действиях помехи. В первой задаче траектория определяется решением вспомогательной системы с простым движением. Во второй задаче траектория определяется решением вспомогательной управляемой системы дифференциальных уравнений второго порядка. В первой задаче показано, что для любой окрестности указанной траектории существует кусочно-постоянное управление преследователя, гарантирующее движение в этой окрестности, при любых действиях помехи, от начальной точки траектории до окрестности конечной точки траектории. Во второй задаче так же обеспечивается движение сколь угодно близко к произвольной конечной траектории вспомогательной системы, как фазовой траектории исходной системы, так и траектории скорости. Отсюда, во второй задаче доказана мягкая поимка, в которой помимо приведения фазовых координат в любую наперед заданную окрестность нуля, приводится еще и скорость в эту же наперед заданную окрестность нуля.
Ключевые слова: дифференциальная игра, нелинейные динамические системы, управление, помеха. 001: 10.35634/2226-3594-2024-64-08
Введение
Теория дифференциальных игр — раздел математической теории управления, который занимается изучением управления объектами в конфликтных ситуациях, описываемых дифференциальными уравнениями. В настоящее время теория имеет содержательный вид и представляет широкое поле для исследований [1-7]. Были исследованы различные классы игровых задачи и разработаны методы их решения: метод Айзекса, метод экстремального прицеливания Красовского, метод Понтрягина и другие. Построение стратегий для дифференциальных игр с нелинейной динамикой представляет особую трудность. Н. Н. Красов-ским и представителями его научной школы создана теория позиционных игр, в основе которой лежит понятие максимального стабильного моста и правило экстремального прицеливания. Однако эффективное построение таких мостов для нелинейных дифференциальных игр весьма затруднительно или даже невозможно. Удобнее строить мосты, не являющиеся максимальными, но обладающие свойством стабильности и дающие эффективно реализуемые процедуры управления для отдельных классов игр, обладающих дополнительными свойствами. Построение приближений стабильных мостов в нелинейных дифференциальных играх, в том числе численно, рассматривается, в частности в работах [8, 9]. В работе [10] рассматривается нелинейная дифференциальная игра о сближении с целевым множеством в фиксированный момент времени, с использованием позиционных стратегий и понятия стабильности. В [11] рассматривается задача о сближении группы преследователей с одним убегающим на конечном интервале времени, с использованием преследователями контрстратегий и интегральными ограничениями на управления.
Достаточные условия разрешимости задачи преследования в нелинейном примере Л. С. Понтрягина получены в [12]. В работе [13] представлены достаточные условия разрешимости задачи преследования в нелинейной дифференциальной игре при некоторых дополнительных условиях на множество значений правой части системы дифференциальных уравнений и терминальное множество. В работе [14] получены достаточные условия поимки в нелинейной игре, описываемой стационарной нелинейной системой, исследуется оптимальность времени поимки для некоторого случая на плоскости, при этом преследователь использует контрстратегию. В работе [15] с использованием формализации дифференциальной игры рассматривается нелинейная задача управления с помехой. Получены достаточные условия существования выигрышной стратегии. В работе [16] рассматривается нелинейная дифференциальная игра двух лиц с интегральным критерием качества. Игроки используют кусочно программные управления специального вида, причем временной интервал делится на две части. Получены необходимые и достаточные условия существования седловой точки для рассматриваемой игры. В работе [17] рассматривается дифференциальная игра преследования на плоскости, динамика которой описывается нелинейной системой дифференциальных уравнений определенного вида. Целевым множеством является начало координат. Получены условия осуществления поимки посредством позиционной контрстратегии и характеристики игры в явном виде, приведены примеры.
В настоящей работе рассматривается задача управления нелинейной автономной системой дифференциальных уравнений с помехой в терминах дифференциальной игры преследования. Управлением убегающего (помехи) является измеримая функция на полубесконечном вправо интервале со значениями на некотором компакте. Управление преследователя задается на конечном отрезке времени, кусочно постоянное и имеет конечное число переключений. Для построения управления в момент переключения преследователю известны сам момент и фазовые координаты системы в этот момент, но не известен выбор управления убегающего. Таким образом, задача приведения траектории точно на заданное множество не разрешима в общем случае. Более того, в задаче ставится условие движения в любой наперед заданной окрестности некоторой конечной кривой, то есть должна быть осуществлена стабилизация вдоль некоторой заданной траектории, что и является целью преследователя. В такой задаче производится поиск условий, накладываемых на систему и конечную кривую, которые обеспечивают существование стратегии преследователя, обеспечивающей движение в любой наперед заданной окрестности этой кривой вне зависимости от действий помехи.
В работах [18] и [19] рассматривалась задача поимки в нелинейной дифференциальной игре аналогичной дифференциальной игре настоящей работы. В них получены достаточные условия на параметры игры для существования окрестности нуля, из которой происходит поимка.
Настоящая работа является продолжением исследований [18,19]. Рассматриваются две задачи управления вдоль кривой с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика первой задачи описывается нелинейной системой дифференциальных уравнений первого порядка, динамика второй — нелинейной системой дифференциальных уравнений второго порядка. Получены условия, при которых возможно удерживать траекторию исходной системы вблизи произвольной конечной кривой, которая удовлетворяет некоторым ограничениям. Кроме того доказана и мягкая поимка во второй задаче, то есть приведение в окрестность нуля и скорости вместе с фазовыми координатами.
§ 1. Система с производной первого порядка
В пространстве , к ^ 2, рассматривается дифференциальная игра Г(х0) двух лиц: преследователя Р и убегающего Е. Динамика игры описывается системой дифференциальных
уравнении
x = f (x, u,v), u G U, v G V, x(0) = x0, (1-1)
где x G Rk — фазовый вектор, u и v — управляющие воздействия; U = {ui,...,um}, Uj G R1, i = 1,..., m- Множество V С Rs — компакт. Функция f : Rk x U x V — Rk — для каждого u G U непрерывна по совокупности переменных x, v и удовлетворяет по x условию Липшица с постоянной L, не зависящей от v, то есть
||f(x1,uj,v) — f(x2, uj,v)|| ^ L||x — x2II, x1, x2 G Rk, v G V, i =1,...,m.
Здесь и всюду далее норма считается евклидовой.
Под разбиением а промежутка [0,T] будем понимать конечное разбиение {rq}П=0, где
0 = To < Ti < Т2 < ■ ■ ■ < Тп = T -
Определение 1.1. Кусочно-постоянной стратегией W преследователя P на промежутке [0,T] называется пара (а, WCT), где а — разбиение промежутка [0,T], а W^ — семейство отображений dr, r = 0,1,...,n — 1, ставящих в соответствие величинам (тг,х(тг)) постоянное управление Hr(t) = йг Е U, t Е [тг, тг+1).
Под управлением убегающего будем понимать произвольную измеримую функцию v: [0, то) — V. Кроме того, игрокам известна динамика системы, то есть функция f, множества U, V и константа Липшица L.
Определение 1.2. В игре Г(х0) происходит е-поимка, если существует T > 0 такое, что для любого е > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0,T] такая, что для любого допустимого управления убегающего v(-) выполнено неравенство ||х(т)|| < е для некоторого т G [0,Т].
Обозначим D£(x) — замкнутый шар радиуса е с центром в точке x; O£(x) — открытый шар радиуса е с центром в точке x; (а, 6) — скалярное произведение векторов а, 6; S(/, T) = = {l(t) | t G [0,T]}.
Справедлива следующая теорема о поимке [18].
Теорема 1.1 (см. [18]). Пусть
min maxmin (f(0,u,v),p) > 0.
peRM|p||=i «eu vev
Тогда существует е0 > 0 такое, что для любой точки x0 G D£0(0) в игре Г(ж0) происходит е-поимка. Кроме того, преследователю для построении стратегии достаточно использовать разбиение временного интервала с фиксированным шагом.
Следствие 1.1 (см. [18]). Пусть выполнены условия теоремы 1.1 и x0 G D£0(0). Тогда е-поимка происходит за время T(x0) = ||x0||/a(||x0||), где
a(||x0||) = min min maxmin (f (x, u,v),p) > 0.
xeD||x0n(0)peRM|p||=i «eu vev
Замечание 1. В силу пункта 20 доказательства теоремы 1.1, при достижении целевой окрестности нуля радиуса ö преследователь может обеспечить сколь угодно долгое дальнейшее нахождение траектории системы внутри этой окрестности вне зависимости от действий помехи [18].
Замечание 2. Отметим, что если для некоторой точки X G Rk справедливо неравенство
min maxmin (f (X,u,v),p) > 0, peRk,||p||=i ueu vev
то при введении замены z = x — x получаем систему Z = f (z + X, u, v), u € U, v € V, z(0) = x0 — x, которая удовлетворяет условию теоремы 1.1. То есть происходит е-поимка в точку X из некоторой окрестности этой точки, причем x(t) € Dyx0-xy(X), t € [0, T]. Назовем X целевой точкой.
Введем вспомогательную управляемую систему
y = w, ||w|| ^ р, y(0) = Хо, (1.2)
где w,y € Rk. Допустимыми управлениями данной системы считаем измеримые функции.
Теорема 1.2. Пусть заданы T > 0, р > 0, x0 € Rk и допустимое управление w: [0,T] ^ Dp(0) системы (1.2). Если
min ( min maxmin (f(f.u,v).»H > P,
?eS(y,T) \рекк,||p||=i «eu vev /
то для любого 5 > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0, T] такая, что для любого допустимого управления убегающего v(-) выполнено неравенство ||x(t) — y(t)|| < 5 для всех t € [0,T], где x(-) —решение системы (1.1), y(■) —решение системы (1.2).
Доказательство. В силу непрерывности функции f по аргументам x, v, найдется 5о > 0 такое, что
min ( min maxmin (f (£,u,v),p) I ^ р.
i&S(y,T)+DSo (O^peRfc,||p|| = i ueU veV 7
Без ограничения общности считаем, что 5 ^ 50.
Пусть n € N и T/n ^ 5/(3р). Обозначим t0 = 0, t1 = T/n, t2 = 2T/n, ..., tn = T. Тогда ||y(t) — y(tj+i)| ^ 5/3 для всех t € [tj,tj+i], j = 0,... ,n — 1.
Пусть на отрезке [t0 ,t1] целевая точка x1 = y(t1). Отметим, что
min ( min maxmin (f (£,u,v),p) I ^ р, ?eDÄ/3(xi^peRk,||p||=1 «eu vev 7
так как Д$/3(x1) = D^/3(y(t1)) С S(y,T) + Ds0(0). Тогда в силу следствия 1.1 и замечаний 1, 2 возможно приведение траектории x(-) в D^/(3n)(x1) к моменту t1, то есть ||x(t1) — x1| ^ 5/(3n), для любого допустимого управления убегающего v(-). При этом
||x(t) — x1| ^ 5/3, следовательно
||x(t) — y(t)|| ^ ||x(t) — x11| + ||x1 — y(t1)| + ||y(t1) — y(t)|| ^ 5 для всех t € [t0, t1 ].
Далее, на отрезке [t1;t2] выберем такую целевую точку x2, на которой достигается следующий минимум:
min{||£ — x(t1 )|| | С € D^/(3n)(y(t2))} = ||x2 — x(t1 )||.
Следовательно ||x2 — x(t1)| ^ 5/3. Аналогично возможно приведение траектории x(-) в D^/(3n)(x2) к моменту t2, то есть ||x(t2) — x2|| ^ 5/(3n). При этом ||x(t) — x2|| ^ 5/3, следовательно ||x(t) — y(t)|| ^ 5 для всех t € [t1, t2]. Отметим, что ||x(t2) — y(t2)|| ^ 25/(3n).
Далее, на отрезке [t2,t3] выберем такую целевую точку x3, на которой достигается следующий минимум:
min{||£ — x(t2)|| | С € D2^/(3n) (y(t3))} = |jxa — x(t2)||.
Аналогично, траектория я(-) приводится в ^д3га)(ж3) к моменту ¿3. И так далее.
На отрезке [¿п-1,£п] траектория я(-) приводится в ^¿/(3га) (хп) к моменту ¿п = Т. При этом ||хп — у(£п)|| ^ (п — 1)£/(3п), следовательно ||х(Т) — у(Т)|| ^ £/3, ||я(£) — у(£)|| ^ ^ для всех* е [О,Т]. □
Замечание 3. В формулировке теоремы 1.2 достаточно использовать нестрогое неравенство, то есть
min min max min (f (£,u, v),p) ^ p.
?eS(y,T)\PeRk,||p||=i «eu »ev
Действительно, пусть e € (0,1), üJ(i) = «;(t)(l — e),t€ [0, T], y(-) — решение системы (1.2) соответствующее w(-). Тогда ||w(i)|| < p и IIy(t) — y(t)|| ^ ерТ для всех t € [0,Т]. Следовательно, можем провести доказательство теоремы 1.2 для у( ) и Тг( ■), то есть для любого д > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0, T] такая, что для любого допустимого управления убегающего v(-) выполнено неравенство |.г(7) — у(1)\\ < ö для всех / € |0. 7"|. Следовательно, ||xc(t) — уу(/ ) || < ö + ерТ для всех / € [0, Т]. Таким образом, для любого д > 0 найдутся такие 6 > 0 и е € (0,1), что 5 + ерТ < 6.
Приведем пример нелинейной системы, удовлетворяющей условиям теоремы 1.2. Пример 1.1. Рассмотрим динамику в R2 следующего вида:
x = (1 + |xi| + |x2|)A(v)u,
»=га-ста-су}- v='-«"■
где 0 < ß < —. Здесь А(-) — матрица поворота на угол v.
Тогда для каждого x G R2 справедливо следующее равенство:
min maxmin ((1 + |x1 | + |x2|)A(v)u,p) = (1 + |x1| + |x2|) cos(n/4 + ß). peRfc,||p||=i «eu vev
Следовательно, если положить p = cos(n/4 + ß), то условия теоремы 1.2 будут выполнены для любых T > 0, xo G R2 и допустимого управления w(-).
§ 2. Система с производной второго порядка
В пространстве Rk, k ^ 2, рассматривается дифференциальная игра r(x0 , x0) двух лиц: преследователя P и убегающего E. Динамика игры описывается системой дифференциальных уравнений
x = f (x , x, u, v) , u G U, v G V, x(0) = x0 , x(0) = x0 , (2.1)
где x , x G Rk, x — фазовый вектор, x — вектор скорости, u и v — управляющие воздействия; U = {u1;..., um}, Uj G R1, i = 1,..., m. Множество V С Rs — компакт. Функция f: Rk x x Rk x U x V ^ Rk — для каждого u G U непрерывна по совокупности переменных x, x, v и удовлетворяет по x, x условию Липшица с постоянной, не зависящей от v. То есть существует положительное число L такое, что
llf (xi,xi,ui,v) - f (x2,xx2,uj, v)|| ^ L(||xi - x2Ц + ||xi - ¡¿2!),
x1;x2,x 1, x2 G Rk, v G V, i =1,...,m.
Определение 2.1. Кусочно-постоянной стратегией W преследователя P на промежутке [0, T] называется пара (a, W^), где а — разбиение промежутка [0, T], а W^ — семейство отображений dr, r = 0,1,..., n —1, ставящих в соответствие величинам (тг, x(rr), x(rr)) постоянное управление llr(t) =йг G U, t G [тг, тг+\).
Под управлением убегающего будем понимать произвольную измеримую функцию v: [0, то) ^ V. Кроме того, игрокам известна динамика системы, то есть функция f, множества U, V и константа Липшица L.
Определение 2.2. В игре r(x0,x0) происходит е-поимка, если существует T > 0 такое, что для любого е > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0,T] такая, что для любого допустимого управления убегающего v(-) выполнено неравенство ||x(t)|| < е для некоторого т € [0,T].
В [19] доказана следующая теорема о поимке.
Теорема 2.1 (см. [19]). Пусть
min max min (f (0, 0,u,v),p) > 0.
peRk,||p||=1 «eu vev
Тогда существуют е0 > 0, 0 > 0 и T> 0 такие, что для любых начальных положений x0,x0 таких, что ||x0|| + 0||x01| < е0, в игре r(x0,x0) происходит е-поимка за время T. Кроме того, преследователю для построении стратегии достаточно использовать разбиение временного интервала с фиксированным шагом.
Следствие 2.1 (см. [19]). Пусть выполнены условия теоремы 2.1, x0, x 0, С € Oeo (0) и ||С — x0||/а(е0) < (е0 — ||x0||)/e0, где
a(r) = min min maxmin (f (x, x, u,v),p).
x,xeDr(0) peRk,||p||=1 «eu vev
Тогда для любого 5 > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0,Tg] такая, что для любого допустимого управления убегающего v(-) выполнено неравенство ||С — x(t)|| < 5 для некоторого т € [0,Tg], где Tg = ||С — x0||/а(е0).
Замечание 4. Аналогично замечанию 2, если условие теоремы 2.1 выполнено для некоторой пары точек x, x € Rk, то происходит е-поимка в точку x из некоторой окрестности точек x, x. Введем вспомогательную управляемую систему
y = w, ||w|| ^ р, y(0) = x0, y(0) = xx0, (2.2)
где w,y € Rk. Допустимыми управлениями данной системы считаем измеримые функции. Справедлива следующая теорема.
Теорема 2.2. Пусть заданы T > 0, р > 0, x0, x0 € Rk и допустимое управление w: [0,T] ^ Dp(0) системы (2.2). Если
min ( min maxmin/f(С,С,u,v),p) I > р, geS(y,T),ges(y,T) \peRk,||p||=1 «eU veV \ /у
то для любого 5 > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0,T] такая, что для любого допустимого управления убегающего v(-) выполнены неравенства ||x(t) — y(t) || < 5, ||x(t) — y(t) || < 5 для для всех t € [0, T], где x(-) — решение системы (2.1), y(-) —решение системы (2.2).
Доказательство. В силу непрерывности функции f по аргументам x,x,v, найдется $0 > 0 такое, что
min ( min maxmin/f(£,u,v),p) ) ^ p.
?eS(y,T)+Dá0(0)><ieS(j/>T)+DÄ0(0) \peRfc,yPy=i «e» veV \ I)
Без ограничения общности считаем, что $ ^ $0.
Пусть $i = min{$, $/T}. Тогда, если ||x(t) — y(t)|| ^ $i для всех t G [0,T], то ||x(t) — yy(t) | ^ $ и ||x(t) — y(t)|| ^ t$i ^ $ для всех t G [o,T].
Аналогично доказательству теоремы 1.2, в силу теоремы 2.1, замечания 4 и следствия 2.1 можем реализовать движение скорости X(-) исходной системы (2.1) вдоль траектории скорости yy(-) вспомогательной системы (2.2) на расстоянии не более $1.
Пусть n G N и T/n ^ $i/(4p). Обозначим to = 0, ti = T/n, t2 = 2T/n, ..., tra = T. Тогда ||y(t) — y/(tj+i)| ^ $i/4, ||y(t) — y(tj+i)| ^ $/4 для всех t G [tj,tj+i], j = 0,... ,n — 1. Пусть на отрезке [t0,ti] целевая точка для функции скорости Xi = yy(ti). Отметим, что
min ( min maxmi^f(£,u,v),p) I ^ p,
feflí(y(ti)),¿eDál/4(xi ,||P||=i «eU ^ev \ ¡ )
так как D^Л(Хi) = D^(yy(ti)) С S(y,T) + (0), D¿(y(ti)) С S(y,T) + Dk,(0). Тогда в силу следствия 2.1 и замечания 4 возможно приведение траектории Х(-) в D¿1 /(4n)(xi) к моменту ti, то есть 11XX(ti) — xi || ^ $i/(4n), для любого допустимого управления убегающего v(^). Действительно, конструкция выигрышного управления в доказательстве теоремы 2.1 гарантирует выполнение неравенства ||X(t) — xXi| ^ $i/4 для всех t G [t0,ti]. То есть
3$
\\x(t) - y(t)\\ ^ \\x(t) - Хг\\ + \\хг - yi^ll + Mh) - y(t)\\ ^
для всех t G [t0,ti]. Поэтому ||x(t) — y(t)|| ^ 3$i(ti — t0)/4 ^ 3$/4 и ||x(t) — y(ti)| ^ $ для всех t G [t0, ti].
Далее, на отрезке [ti,t2] выберем такую целевую точку x2, на которой достигается следующий минимум:
min{||£ — x(ti)|| | £ G D¿1 /(4n) (yy(t2))} = |x¿ 2 — xx(ti) |.
Следовательно ||x2 — xx(ti)| ^ $i/4. Аналогично возможно приведение траектории x(-)
в D¿1 /(4n)(x2) к моменту t2, то есть ||xx(t2) — x21| ^ $/(4n). При этом 11xx(t) — x21| ^ $/4, следовательно ||x(t) — y(t)|| ^ 3$i/4 для всех t G [ti;t2]. Отметим, что 11xx(t2) — y(t2)|| ^ 2$i/(4n).
Далее, на отрезке [t2,t3] выберем такую целевую точку x3, на которой достигается следующий минимум:
min{||£ — x(t2)| 1 £ G D2¿i/(4n) (y(t3))} = ||x 3 — xx(t2)|.
Аналогично, траектория xc(^) приводится в D¿/(4n) (x3) к моменту t3. И так далее.
На отрезке [tn-i,tn] траектория xc(^) приводится в D¿/(4n)(xn) к моменту tn = T. При этом ||xn—y(tn)|| ^ (n— 1)$i/(4n), следовательно ||xx(T)— y(T)|| ^ $i/4, ||xx(t)—yy(t)| ^ 3$i/4 для всех t G [0,T], □
Определение 2.3. В игре r(x0, x0) происходит мягкая е-поимка, если существует T > 0 такое, что для любого е > 0 существует кусочно-постоянная стратегия W преследователя P на промежутке [0,T] такая, что для любого допустимого управления v(-) убегающего E выполнены неравенства ||x(t)|| < е и ||x(t)|| < е для некоторого т G [0,T].
Справедливо следующее следствие.
Следствие 2.2. Пусть выполнены условия теоремы 2.2 и в игре Г(х0, хо) происходит мягкая е-поимка.
+ 9||х0|| < е0. Тогда
Доказательство. В доказательстве теоремы 2.1 достаточно наложить дополнительное ограничение на управление эд(-) вспомогательной системы (2.2): у(Т) = 0 и у(Т) = 0. Кроме того считаем, что р = а(е0), где а(е0) из следствия 2.1. Отметим, что в данном случае всегда существует такое Т ^ 0 и управление вспомогательной системы (2.2). Действительно, полученное значение 9 гарантирует выполнение включения у(Ь) € О£0(0) для всех Ь € [0,^], где ¿1 = ||у(0)||/р, ЦЬ) = —ру(0)/||у(0)||, Ь € [0,^). Отметим, что у (¿а) = 0.
Далее выбираем ги{г) = при г € ги(г) = ру{Ь)/\\у{Ь) || при
г е [г2,г3]. Здесь ¿2 = ¿1 + у/\\у(й)\\/р, ¿3 = ¿2 + л/ЫЬ)\\/р.
Тогда
»(« = »(*.)+ Г»(.)Л = »(*,) + 0+ Г
о tl о tl
2
Следовательно
/•tз
у(^3) = у (Ь2) + / /у(5) ^
у(ь) | Г3 ( - ру{11) щи) II | (8 - ¿2)РУ(¿1) ] ^ = у(¿1) у(¿1) = 0
2 л^ ||?/(0)^^ V р
При этом /(¿з) = 0 и у(¿), //(¿) € О£0(0) для всех Ь € [0, ¿з].
2
2
□
Замечание 5. Пусть условия теоремы 2.1 выполнены во всех точках Мк для некоторого а0 > 0, то есть для всех € Мк справедливо следующее неравенство:
шт шахшт/ f (£,£,п,ь),р) ^ а0 > 0.
рекк ,МРМ=1 и
Тогда е-поимка и мягкая е-поимка происходят из любых начальных положений. В этом случае в качестве решения вспомогательной системы можно выбрать оптимальное по быстродействию решение, где р = од, таким образом улучшая оценку времени осуществления е-поимки. В случае е-поимки конечное условие имеет вид у(Т) = 0. В случае мягкой е-поимки конечное условие имеет вид
у(Т) = 0, у(Т) = 0.
Заключение
Рассмотрены две задачи управления вдоль траектории с помехой, в качестве которой выступает второй игрок в дифференциальной игре. Динамика в первой задаче описывается системой вида х = f Показано, что для любой конечной абсолютно непрерывной кривой в фазовом пространстве, являющейся решением вспомогательной системы с простым движением, и любого 6 > 0 существует кусочно-постоянное управление преследователя, гарантирующее движение в 6-окрестности этой кривой, при любых действиях помехи, от начальной точки кривой до 6-окрестности конечной точки кривой. Динамика во второй задаче описывается системой вида х = f (х, х, и, V). Показано, что, если решение вспомогательной системы у = и>, ||и>|| ^ р, ограничено некоторым образом, то для любого 6 > 0 существует такая допустимая стратегия игрока, что при любых действиях помехи ||х(Ь) — у(Ь) | ^ 6 и ||х(Ь) — у(Ь)|| ^ 6 для всех Ь € [0,Т]. То есть обеспечивается движение
сколь угодно близко к произвольной конечной траектории вспомогательной системы, обладающей некоторыми ограничениями. Отсюда, во второй задаче доказана мягкая е-поимка, в которой помимо приведения фазовых координат в любую наперед заданную окрестность нуля, приводится еще и скорость в эту же наперед заданную окрестность нуля. Таким образом, с учетом полученных ограничений, выбирая управление вспомогательной системы оптимальным в каком-либо смысле, можно осуществить сколь угодно близкое движение исходной системы к такому решению вспомогательной системы, при любых действиях помехи.
Финансирование. Исследование выполнено за счет гранта Российского научного фонда № 23-71-01032.
СПИСОК ЛИТЕРАТУРЫ
1. Isaacs R. Differential games. New York: John Wiley and Sons, 1965. https://zbmath.org/0125.38001
2. Blaquiere A., Gerard F., Leitmann G. Quantitative and qualitative differential games. New York: Academic Press, 1969.
3. Красовский Н.Н. Игровые задачи о встречe движений. М.: Наука, 1970. https://www.elibrary.ru/item.asp?id=29140877
4. Friedman A. Differential games. New York: Wiley-Interscience, 1971. https://zbmath.org/0229.90060
5. Hajek O. Pursuit games. New York: Academic Press, 1975. https://zbmath.org/0361.90084
6. Leitmann G. Cooperative and non-cooperative many player differential games. Vienna: Springer, 1974. https://doi.org/10.1007/978-3-7091-2914-2
7. Красовский Н.Н., Субботин А. И. Позиционные дифференциальные игры. М.: Наука, 1974.
8. Двуреченский П. Е., Иванов Г. Е. Алгоритмы вычисления операторов Минковского и их применение в дифференциальных играх // Журнал вычислительной математики и математической физики. 2014. Т. 54. № 2. С. 224-255. https://doi.org/10.7868/S0044466914020057
9. Ушаков В.Н., Ершов А. А. К решению задач управления с фиксированным моментом окончания // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2016. Т. 26. Вып. 4. С. 543-564. https://doi.org/10.20537/vm160409
10. Ушаков В.Н., Ершов А. А., Ушаков А. В., Матвийчук А. Р. Некоторые задачи сближения нелинейных управляемых систем в фиксированный момент времени // Известия Института математики и информатики Удмуртского государственного университета. 2023. Т. 62. С. 125-155. https://doi.org/10.35634/2226-3594-2023-62-09
11. Salimi M., Ferrara M. Differential game of optimal pursuit of one evader by many pursuers // International Journal of Game Theory. 2019. Vol. 48. Issue 2. P. 481-490. https://doi.org/10.1007/s00182-018-0638-6
12. Никольский М. С. Одна нелинейная задача преследования // Кибернетика. 1973. № 2. С. 92-94. https://zbmath.org/0263.90049
13. Пшеничный Б. Н., Шишкина Н. Б. Достаточные условия конечности времени преследования // Прикладная математика и механика. 1985. Т. 49. Вып. 4. С. 517-523.
14. Сатимов Н. К задаче преследования в нелинейных дифференциальных играх // Кибернетика. 1973. № 3. С. 88-93. https://zbmath.org/0325.90065
15. Pierpaolo S. control of nonlinear systems: differential games and viscosity solutions // SIAM Journal on Control and Optimization. 1996. Vol. 34. Issue 3. P. 1071-1097. https://doi.org/10.1137/S0363012994266413
16. Natarajan T., Pierre D. A., Naadimuthu G., Lee E. S. Piecewise suboptimal control laws for differential games // Journal of Mathematical Analysis and Applications. 1984. Vol. 104. Issue 1. P. 189-211. https://doi.org/10.1016/0022-247X(84)90042-8
17. Азамов А. А. Об одном классе нелинейных дифференциальных игр // Математические заметки. 1981. Т. 30. Вып. 4. С. 619-625. https://www.mathnet.ru/rus/mzm6186
18. Щелчков К. А. О задаче управления нелинейной системой посредством дискретного управления в условиях воздействия помехи // Дифференциальные уравнения. 2024. Т. 60. № 1. С. 126-134. https://doi.org/10.31857/S0374064124010106
19. Shchelchkov K. A. On the problem of controlling a second-order nonlinear system by means of discrete control under disturbance // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2024. Т. 34. Вып. 3. С. 435-448. https://doi.org/10.35634/vm240308
Поступила в редакцию 30.09.2024
Принята к публикации 02.11.2024
Щелчков Кирилл Александрович, к. ф.-м. н., доцент, научный сотрудник, кафедра дифференциальных уравнений, лаборатория математической теории управления, Удмуртский государственный университет, 426034, Россия, г. Ижевск, ул. Университетская, 1. ORCID: https://orcid.org/0000-0001-6811-2728 E-mail: [email protected]
Цитирование: К. А. Щелчков. Управление нелинейной системой вдоль траектории в условиях воздействия помехи // Известия Института математики и информатики Удмуртского государственного университета. 2024. Т. 64. С. 119-130.
K.A. Shchelchkov
Control of a nonlinear system along a trajectory under disturbance conditions
Keywords: differential game, nonlinear dynamic systems, control, disturbance.
MSC2020: 49N70, 49N75
DOI: 10.35634/2226-3594-2024-64-08
We consider two control problems along a given trajectory with a disturbance, which is the second player in a differential game. The dynamics of the first problem are described by a nonlinear system of first-order differential equations, and the dynamics of the second problem are described by a nonlinear system of second-order differential equations. Control is performed by means of a piecewise constant controller, the set of values of which is finite. The goal of control is to move as close as possible to a finite trajectory under any disturbance action. In the first problem, the trajectory is determined by the solution of an auxiliary system with simple motion. In the second problem, the trajectory is determined by the solution of an auxiliary controlled system of second-order differential equations. In the first problem, it is shown that, for any neighborhood of the specified trajectory, there exists a piecewise constant pursuer control that guarantees motion in this neighborhood under any disturbance actions, from the initial point of the trajectory to the neighborhood of the final point of the trajectory. In the second problem, the motion is also ensured as close as possible to an arbitrary finite trajectory of the auxiliary system, both the phase trajectory of the original system and the velocity trajectory. Hence, in the second problem, we prove soft capture, in which, in addition to bringing the phase coordinates to any pre-defined neighborhood of zero, the velocity is also brought to the same pre-defined neighborhood of zero.
Funding. The research was funded by the Russian Science Foundation No. 23-71-01032.
REFERENCES
1. Isaacs R. Differential games, New York: John Wiley and Sons, 1965. https://zbmath.org/0125.38001
2. Blaquiere A., Gerard F., Leitmann G. Quantitative and qualitative differential games, New York: Academic Press, 1969.
3. Krasovskii N.N. Igrovye zadachi o vstreche dvizhenii (Game problems on the encounter of motions), Moscow: Nauka, 1970. https://zbmath.org/0246.90060
4. Friedman A. Differential games, New York: Wiley-Interscience, 1971. https://zbmath.org/0229.90060
5. Hajek O. Pursuit games, New York: Academic Press, 1975. https://zbmath.org/0361.90084
6. Leitmann G. Cooperative and non-cooperative many player differential games, Vienna: Springer, 1974. https://doi.org/10.1007/978-3-7091-2914-2
7. Krasovskii N.N., Subbotin A.I. Game-theoretical control problems, New York: Springer, 1988. https://www.springer.com/gp/book/9781461283188
8. Dvurechensky P. E., Ivanov G. E. Algorithms for computing Minkowski operators and their application in differential games, Computational Mathematics and Mathematical Physics, 2014, vol. 54, issue 2, pp. 235-264. https://doi.org/10.1134/S0965542514020055
9. Ushakov V. N., Ershov A. A. On the solution of control problems with fixed terminal time, Vestnik Udmurtskogo Universiteta. Matematika. Mekhanika. Komp'yuternye Nauki, 2016, vol. 26, issue 4, pp. 543-564 (in Russian). https://doi.org/10.20537/vm160409
10. Ushakov V. N., Ershov A. A., Ushakov A. V., Matviychuk A. R. Some problems of target approach for nonlinear control system at a fixed time moment, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2023, vol. 62, pp. 125-155 (in Russian). https://doi.org/10.35634/2226-3594-2023-62-09
11. Salimi M., Ferrara M. Differential game of optimal pursuit of one evader by many pursuers, International Journal of Game Theory, 2019, vol. 48, issue 2, pp. 481-490. https://doi.org/10.1007/s00182-018-0638-6
12. Nikol'skii M. S. A nonlinear tracking problem, Cybernetics, 1973, vol. 9, issue 2, pp. 293-296. https://doi.org/10.1007/BF01069085
13. Pshenichnyi B.N., Shishkina N.B. Sufficient conditions of finiteness of the pursuit time, Journal of Applied Mathematics and Mechanics, 1985, vol. 49, issue 4, pp. 399-404. https://doi.org/10.1016/0021-8928(85)90043-7
14. Satimov N. Pursuit problems in nonlinear differential games, Cybernetics, 1973, vol. 9, issue 3, pp. 469-475. https://doi.org/10.1007/BF01069203
15. Pierpaolo S. control of nonlinear systems: differential games and viscosity solutions, SIAM Journal on Control and Optimization, 1996, vol. 34, issue 3, pp. 1071-1097. https://doi.org/10.1137/S0363012994266413
16. Natarajan T., Pierre D. A., Naadimuthu G., Lee E. S. Piecewise suboptimal control laws for differential games, Journal of Mathematical Analysis and Applications, 1984, vol. 104, issue 1, pp. 189-211. https://doi.org/10.1016/0022-247X(84)90042-8
17. Azamov A. A class of nonlinear differential games, Mathematical notes of the Academy of Sciences of the USSR, 1981, vol. 30, issue 4, pp. 805-808. https://doi.org/10.1007/BF01137812
18. Shchelchkov K. A. On the problem of controlling a nonlinear system by a discrete control under disturbance, Differential Equations, 2024, vol. 60, issue 1, pp. 127-135. https://doi.org/10.1134/S0012266124010105
19. Shchelchkov K. A. On the problem of controlling a second-order nonlinear system by discrete control under disturbance, Vestnik Udmurtskogo Universiteta. Matematika. Mekhanika. Komp'yuternye Nauki, 2024, vol. 34, issue 3, pp. 435-448. https://doi.org/10.35634/vm240308
Received 30.09.2024 Accepted 02.11.2024
Kirill Aleksandrovich Shchelchkov, Candidate of Physics and Mathematics, Associate Professor, Researcher, Department of Differential Equations, Laboratory of Mathematical Control Theory, Udmurt State University, ul. Universitetskaya, 1, Izhevsk, 426034, Russia. ORCID: https://orcid.org/0000-0001-6811-2728 E-mail: [email protected]
Citation: K. A. Shchelchkov. Control of a nonlinear system along a trajectory under disturbance conditions, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2024, vol. 64, pp. 119-130.