Известия Института математики и информатики УдГУ
2017. Том 49
УДК 517.929, 517.977.8 © М. И. Гомоюнов, А. Р. Плаксин
КОНЕЧНОМЕРНЫЕ АППРОКСИМАЦИИ КОНФЛИКТНО-УПРАВЛЯЕМЫХ СИСТЕМ НЕЙТРАЛЬНОГО ТИПА1
В статье рассматривается конфликтно-управляемая динамическая система, движение которой описывается функционально-дифференциальными уравнениями нейтрального типа в форме Дж. Хейла. Исследуются аппроксимации этой системы при помощи управляемых систем обыкновенных дифференциальных уравнений высокой размерности. Предлагается процедура взаимного прицеливания между исходной системой и ее конечномерной аппроксимацией, обеспечивающая близость их движений. Устанавливается свойство устойчивости этой процедуры по отношению к погрешностям измерений, приводится иллюстрирующий пример. Дается приложение процедуры к решению задачи оптимизации гарантированного результата, в которой движение динамической системы описывается линейными функционально-дифференциальными уравнениями нейтрального типа в форме Дж. Хейла, а показатель качества оценивает историю движения системы и реализации воздействий управления и помехи. Для этого формулируется вспомогательная задача об управлении аппроксимирующей системой, и при помощи метода выпуклых сверху оболочек находится ее решение. Устанавливается, что величина оптимального гарантированного результата во вспомогательной задаче аппроксимирует величину оптимального гарантированного результата в исходной задаче, при этом оптимальный закон управления строится с использованием в качестве поводырей оптимальных во вспомогательной задаче движений аппроксимирующей системы. Рассматривается иллюстрирующий пример, приводятся результаты численного моделирования.
Ключевые слова: теория управления, дифференциальные игры, системы нейтрального типа.
Б01: 10.20537/2226-3594-2017-49-05 Введение
Исследования аппроксимаций функционально-дифференциальных уравнений с запаздыванием при помощи систем обыкновенных дифференциальных уравнений имеют обширную историю. Сходимость таких аппроксимаций для линейных систем с постоянным сосредоточенным запаздыванием была доказана в работе [1]. В работе [2] этот результат был распространен на нелинейные системы, а в работе [3] — на случай переменных запаздываний. Позднее, подобные аппроксимации, их обобщения и приложения к различным задачам развивались в работах [4-8]. В том числе, в работах [7, 8] рассматривались аппроксимации различных функционально-дифференциальных уравнений нейтрального типа. В работе [9] было предложено использовать аппроксимирующие системы обыкновенных дифференциальных уравнений в качестве поводырей для динамических систем с запаздыванием, управляемых в условиях помех или противодействий. При этом возникает вспомогательная задача взаимного прицеливания между движением исходной конфликтно-управляемой системы и движением аппроксимирующей системы. Решение этой задачи для динамических систем, описываемых функционально- дифференциальными уравнениям запаздывающего типа, было дано в работе [10], для систем, описываемых линейными уравнениями нейтрального типа, — в работе [11], и для нелинейных систем нейтрального типа в форме Дж. Хейла [12] — в работе [13]. Настоящая работа продолжает эти исследования.
Статья устроена следующим образом. В § 1 рассматривается конфликтно-управляемая динамическая система, описываемая функционально-дифференциальными уравнениями нейтрального типа в форме Дж. Хейла. В § 2 строится аппроксимирующая система, описываемая обыкновенными дифференциальными уравнениями, устанавливаются некоторые ее свойства. Для того, чтобы обеспечить близость движений исходной и аппроксимирующей систем, в § 3 предлагается устойчивая по отношению к погрешностям измерений процедура взаимного прицеливания. Работоспособность этой процедуры иллюстрируется на примере. Далее в статье дается приложение предложенной процедуры взаимного прицеливания к решению следующей
1 Работа выполнена при финансовой поддержке гранта Президента Российской Федерации для государственной поддержки молодых российских ученых МК-3047.2017.1.
задачи конфликтного управления, которая подробно описывается в § 4. Рассматривается линейная динамическая система нейтрального типа в форме Дж. Хейла, управляемая в условиях помех или противодействий. Цель управления состоит в минимизации показателя качества, который оценивает историю движения системы и реализации воздействий управления и помехи. В рамках теоретико-игрового подхода [14-16] ставится задача о вычислении величины оптимального гарантированного результата управления и построении оптимального закона управления, обеспечивающего этот результат. Для решения этой задачи в § 5 рассматривается вспомогательная задача об управлении движением аппроксимирующей системы. Устанавливается, что оптимальный гарантированный результат управления во вспомогательной задаче аппроксимирует оптимальный гарантированный результат в исходной задаче, при этом оптимальный закон управления строится с использованием в качестве поводырей оптимальных во вспомогательной задаче движений аппроксимирующей системы. В § 6 приводится пример, описываются результаты численного моделирования.
Полученные в работе результаты будут представлены на Всемирном конгрессе Международной федерации по автоматическому управлению (IFAC 2017 World Congress).
§ 1. Конфликтно-управляемая система
Рассматривается конфликтно-управляемая динамическая система, описываемая функционально-дифференциальным уравнением нейтрального типа в форме Дж. Хейла
^{x[t]-g(t,xt[-])) = f(t,xt[-],u[t],v[i\), t € [to,Я
€ Rn, u[t] € U, v[t] € V,
(1.1)
с начальным условием
xto[Z] = x[to + Z] = z[Z], Z € [—h, 0], z[-] € Z. (1.2)
Здесь t — переменная времени; x[t] — вектор состояния в момент времени t; xt[■] — история движения (элемент запаздывания) на отрезке [t — h, t], причем xt[Z] = x[t + ZЬ Z € [—h, 0]; h = const > 0 — величина запаздывания; u[t] — текущее управляющее воздействие; v[t] —
UV
конечномерных пространств; Z — множество абсолютно непрерывных функций z[-], удовлетворяющих неравенствам
||z[£]|| < Ro, С € [—h,0], ||z[£]|| < Ro при п.В. £ € [—h,0], Ro = const > 0. (1.3)
Здесь и далее двойные скобки || ■ || используются для обозначения евклидовой нормы. Пусть C = C ([—h, 0], Мга) — пространство непрерывных функций, действующих из [—h, 0] в Rn, оснащенное равномерной нормой || ■ ||с.
Полагаем, что для системы (1.1) выполнены следующие условия:
(C.1) Отображение [t0,$] х C х U х V Э (t, w[-],u, v) ^ f = f (t, w[-],u, v) € Rn непрерывно.
(C.2) Существует такая константа af > 0, что
||f (t,w[-],u,v) || < af (1 + ||w[-]||C), t € [to,tf], w[-] € C, u € U, v € V.
(C.3) Для любого ком пакта D С C существует такое число Af (D) > 0, что
|f(t,w[-],u,v) — f(t,r[-],u,v) || < Af(D)||w[-] — r[-] t € [to,tf], u € U, v € V, w[-],r[-] € D.
IC'
(С.4) Существуют такие числа \д > 0 и Л^, г = 1, /г (О < < Лг < ■ ■ ■ < Л& = Л), что
о к
||5(*, Ц-]) - <?(*, г[-]) || < Лд(/] - г[£] ||ё£ + Л»] - г[-Л»] ||) ,
-л »=1
£ е [¿0,0], Ц-],г[-] е С. (С.5) Существует такая константа ад > 0, что
||0(*,Ч-]) -£(С,Ч])|| < + ||Ч]||С)-£|, е [¿0,Ц-] е С.
Допустимыми реализациями управления и[£] и помехи считаем измеримые функции и : [¿0, $) — и и V : [¿0, $) — V, которые обозначаем далее через и[£0[-]$) и [•]$) соответственно. С. 1 С. 5
реализаций и[^[' ]$) и v[tо[■ ]$) и любой начальной функции ¿[-] е Z существует единственное решение х[^ - Л, $] задачи (1.1), (1.2) — абсолютно непрерывная функция х : [¿0 - Л, $] — Мга, которая удовлетворяет начальному условию (1.2) и вместе с и[£] и v[í] удовлетворяет уравнению (1.1) почти всюду.
§ 2. Аппроксимирующая система
Пусть т е М, т ^ 2, и АЛ = Л/т. Следуя [13], на основе системы (1.1), (1.2) определим аппроксимирующую систему обыкновенных дифференциальных уравнений
у И [¿] = / (¿,5 (У [*])[•],
У[1]М = (Л] +<7М(Г[*])[.]) -у[1]И)/л/>,
2/ИМ = (у^И -у[%])/ДЛ, г = (2Л)
* € [¿о, , У1*1 И е Мга, г = 0, т, рЩ <Е и, ф] € V, с фазовым вектором У[¿] = (у[0][£],у[1][£],... , у[т][¿]) и начальным условием
у И [¿о] = у? € г = 0~т, Г0 = (у?], у?],..., уГ1) € М(т+1)га (2.2)
Здесь 5(У[£])[•] обозначает линейный сплайн на отрезке [-Л, 0] с узлами в точках -¿АЛ, г = 0,т, определяемый по правилу
В силу условий (С.1)-(С.5) для любых допустимых реализаций ]$) и ^[¿0[']$) и любого значения У0 е М(т+1)га существует единственное решение У[¿0[-]$] задачи (2.1), (2.2) — абсолютно непрерывная на [¿0, $] функция, которая удовлетворяет начальному условию (2.2) и вместе с р[£] и д[£] удовлетворяет системе уравнений (2.1) почти всюду.
По решению У[¿0[-]$] задачи (2.1), (2.2) определим функцию у^ - Л[-]$] согласно следующему правилу:
У0][*] + <7 (¿,5 (У[*])[•]), Í е М,
у[М + (у[^0] - у[1][¿0])(* - ¿0)/АЛ, í е [¿0 - АЛ, ¿0), (2.3)
ч5(У[¿0])- ¿0], * е [¿0 - Л, ¿0 - АЛ).
Полагаем, что начальная функция ¿[-] из (1.2) и начальный вектор
У0 е М(т+1)га из (2.2)
связаны условием
(C.6) Справедливы неравенства
\\y[Q] - z[0] + g(t0,z[-}) I) ^ R*Ah, — z[—iAh}\\ ^ R*Ah, г = l~m, R* = const > 0.
Следующие две леммы устанавливают аппроксимирующие свойства системы (2.1), (2.2). Подробные доказательства этих лемм приведены в работе [13].
Лемма2.1. Существует такой компакт Dy С C, что, каковы бы ни были натуральное число m ^ 2, начальные значения z[-] € Z, Yo € R(m+1)n и допустимые реализации p [to [•]$), q[to[-]0), при выполнении условий {C.1)-{C.6) дм решения Y[to[-]0] задачи (2.1), (2.2) и соответствующей функции y[to — h[-]0] (2.3) справедливы, включения
Ы-] € Dy, S(Y[t])[-] € Dy, t € [to,0].
Л e m m a 2.2. Существует такое число K > 0, чт,о, каковы бы ни были натуральное число m ^ 2, начальные значения z[-] € Z, Yo € R(m+1)n « допустимые реализации p [to [•]$), q [to [•]$), при выполнении условий (C.1)-(C.6) решение Y[to[-]0] задачи (2.1), (2.2) и соответствующая функция y[to — h[-]0] (2.3) удовлетворяют неравенству
\\yti-] - S{Y[t])[-]\\c ^ К^/Ш, t € [to,^].
§ 3. Процедура прицеливания
Полагаем, что выполняется условие седловой точки для маленькой игры [14, с. 79] (или, в другой терминологии, условие Айзекса [17]):
(C.7) Имеет место равенство
min max (/(t, w[-], u, v), s) = max min (/(t, w[-], u, v),s),
t € [to,0], 4] € C, s € Rn.
Здесь и далее угловые скобки (•, •) используются для обозначения скалярного произведения векторов.
Опишем процедуру взаимного прицеливания между движениями систем (1.1), (1.2) и (2.1), (2.2). Предположим, что вместо точных значений x[t] и Y[t] = (y[o][t],... , y[m] [t]) известны приближенные значения x* [t] и Y*[t] = (y*°][t],... , y*m] [t]), которые для некоторого числа п > 0 удовлетворяют неравенствам
||жМ -ж*М|| ^г/, \\уЩ -уГМИ V, г = 0,т, (3.1)
Пусть кусочно-постоянные реализации в системе (1.1) и д[£о[-]$) в системе (2.1) фор-
мируются по принципу обратной связи на базе разбиения
Ай = {г^ : 0 < tj+1 - ^ ] = 0,7-1, Ь = 'д} (3.2)
промежутка времени управления [¿о, $] согласно следующему правилу:
u[t] = и°, q[t} = q°, t € [tj,tj+i), j = 0, J - 1,
где
u° € argminmax (/(j , x * ц [-],u,v), s * [j ])
u€u vev
q° € argmaxmin (/(j,S(Y*[j])[-],p,q), s *[j]), (3.3)
qgV P€U
s * [t] = X* [t] — g(t,X*t[-]) — yio][t].
Теорема 3.1. Для любого числа Z > 0 существуют такие числа, M > 0, á > 0м п > 0, что, каковы бы ни были натуральное число m ^ M, начальные значения z[-] € Z, Y0 € R(m+1)ra и допустимые реализации v[t0[•]$), p[t0[■], если реализации u[í0[-]^), q[t0[-]$) формируются согласно процедуре прицеливания (3.1)-(3.3); то при выполнении условий (C.l)-(C.7) для решения, x[t0 — h[-]$] задачи (1.1), (1.2) м функции y[t0 — h[-]$] (2.3), построенной по решению Y[t0[•]$] задачи (2.1), (2.2), справедливо неравенство
||x[t] — y[t]|| < Z, t € [t0,0].
Доказательство теоремы проводится по схеме из [13, Теорема 3].
Замечание 3.1. Отметим, что теорема 3.1 останется справедливой и без требования (C.7), если изменить процедуру прицеливания (3.1)-(3.3) следующим образом:
u[t] = q[t] = q°(p[t}), t G [tj,tj+1), J = 0, J - 1,
где
u° € argminmax(/(t¿,x*t,.[-],м, v), s*[tj]),
«eü veV
qj(p) € argmax(/(íj,S(Y*[tj])[-],p,q), s*[t¿]).
qev
Проиллюстрируем работоспособность процедуры (3.1)—(3.3) на примере.
Пример 3.1. Рассмотрим динамическую систему, описываемую функционально-дифференциальным уравнением нейтрального типа в форме Дж. Хейла
t
—- (x[t] — sin {x[t — 1])) = — 2 / ж[£]е~ ' 3|x[?]|de+u[t] + v[t]x[t — l], t € [0, 5],
t-1
x[t] € R, |u[t]| < l, |v[t]| < l,
с начальным условием
ж[£] = еcos(6e), е € [-1,0].
Для этой системы в согласии с (2.1), (2.2) построим аппроксимирующую систему и осуществим процедуру взаимного прицеливания (3.1)-(3.3). При этом реализации v[Í0[-]$) и p[Í0[-]$) будем формировать наихудшим для указанной процедуры способом с точки зрения близости функций x[t0 — h[-]$] и y[t0 — h[-]$].
Результаты численных экспериментов приведены на рис. 1 и 2.
l
— x
А V / У
V. \\ /
l
0
l
2
4
l
x
Г\ У
V /v
l
0
l
2
4
Рис. 1. Результаты моделирования при m = 50, á = 0.001 П = 0.1.
Рис. 2. Результаты моделирования при m = 500, á = 0.001 П = 0.1.
l
0
0
t
t
§ 4. Приложение к решению задачи управления
Действуя по схеме из работы [18], применим процедуру прицеливания (3.1)-(3.3) для решения следующей задачи конфликтного управления. Пусть движение динамической системы описывается линейным функционально-дифференциальным уравнением нейтрального типа в форме Дж. Хейла
^-(хЩ - АЛЫ - т]) = АЩхЩ + АМхН-Ы + ВЩиЩ +С[Щй, Ь € ^ ) (4.1)
х[г] е мп, и[г] е М"1, Цг] е М"2,
с начальным условием
хг0[■] = *[•] е 2. (4.2)
Здесь т, Н = сопвt > 0 и т ^ Н; матрица-функция Ат [¿] удовлетворяет условию Липшица и выполняется неравенство ||Ат [¿]|| < 1, г е [¿0, $]; матрицы-функции А[^], А^ [¿], В [¿] и С [¿] непрерывны; множество 2 определяется согласно (1.3).
Предположим, что допустимые значения воздействий управления и [г] и помехи стеснены включениями
и[г] е и = {и е М"1 : ||и|| < Е}, е V = {V е М"2 : |М| < Е},
где константа Е > 0 является достаточно большой для того, чтобы были применимы результаты [16, с. 179] (см. также [19]).
Отметим, что система (4.1) удовлетворяет условиям (С.1)-(С.5). Следовательно, каковы бы ни были начальная функция ¿[-] е 2 и допустимые реализации и[£о[-]$) и существует
единственное решение х[г0 — Н[-]$] задачи (4.1), (4.2). Тройку {х[г0 — Н[-]$], и [¿0 [■]$),-и[£0[■]$)} назовем реализацией процесса управления.
Качество этой реализации оценивается показателем ■& 1/2 ■&
7 = (I ||х[е]||2ае) +1 [не],ФШ£]> — мекФ[еме])]ае. (4.з>
Здесь Ф£]и Ф[е] — симметричные непрерывные матрицы-функции, такие, что квадратичные формы (и, Ф[е]и) и (V, Ф[еМ положительно определены при всех е е [¿0,$].
Цель управления заключается в минимизации показателя качества (4.3). Отметим, что так как действия помехи неизвестны, то в самом неблагоприятном случае они могут максимизировать показатель (4.3).
Согласно [20] (см. также [14]) задачу управления (4.1)-(4.3) формализуем следующем образом. Под стратегия управления и(-) понимаем произвольную функцию
и(г,Ц-],е) е и, г е [¿0,$], Ц-] е С, е> о,
где е > 0 — параметр точности [14, с. 68]. Пусть выбраны число е > 0 и разбиение Дг (3.2). Тройка {и(-),е, Дг} определяет закон управления, который формирует кусочно-постоянную реализацию и[г0[-]$) согласно следующему пошаговому правилу:
и
Обозначим через О = О(и(-),е, Дг) множество таких реализаций процесса управления {ж[г0 — Н[-]$], и[г0[■]$), -и[£0[■]$)}, что ^[г0[-]$) — произвольная допустимая реализация помехи; и[г0[-]$) — реализация управления, формируемая согласно закону {и(-),е, Дг}; х[г0 — Н[-]$] — решение задачи (4.1), (4.2), определяемое реализациями и[г0[-]$), -и[г0[']$). Положим
Г = 8пр{7 : {х[г0 — Н[-]$],и[«0[•]$),^0[•]$)} е о).
Тогда оптимальным гарантированным результатом управления будет
Г° = inf lim sup lim sup Г.
О £¿0 As
Г°
качества (4.3), которые могут быть гарантированы при использовании указанной схемы формирования управляющих воздействий.
В следующем параграфе предлагается метод для приближенного вычисления величины
Г°
с наперед заданной точностью. § 5. Вспомогательная задача управления
Применяя описанную в §2 аппроксимацию к системе (4.1), (4.2), приходим к линейной системе обыкновенных дифференциальных уравнений
y[0][t] = A[t]yM[t] + Ah[i]yH[t - h] + B[t]p[t] + C[t]q[t],
Л] = (Л] +AT[t]y^ -yW[t])/Ah, y®[t} = (yW[t]-y®[t])/Ah, г = 2^,
(5.1)
t € [t0, 0], yw МеГ, i = 0, m, p[t} € U, q[t] € V, с начальным условием
Ло] = z[0] - Ar[to]z[-T], Ло] = z[-iAh], г = T^ü.
(5-2)
Здесь тт = т/ДЛ,, и для простоты предполагается, что тт € N.
Действуя по схеме из § 3, принимая во внимание вид показателя качества (4.3), рассмотрим следующую процедуру прицеливания между движениями систем (4.1), (4.2) и (5.1), (5.2). Пусть реализации [•]$) в исходной системе (4.1) и д[£о[-]$) в аппроксимирующей системе (5.1) формируются на базе разбиения Д^ (3.2) по правилу
u[t] = Uj € argmin (B[tj]u, s[tj]) + (u, Ф[tj]u)s[tj] «eU L
q[t] = qj € argmax (C[tj]q,s[tj]) - (q, Ф[^-]q)s[tj] qeV L
(5.3)
где
t£[tj,tj+1), j = 0,J-l,
S[t]= X[t] - Ar[t]x[t - T] - y[°][t],
¿м= / m $[e]u[e])-(v[e], Ф[е]^[е]) de - мя, фШЯ) - ш ФШс]) de.
to
10
По аналогии с теоремой 3.1 имеет место
Теорема 5.1. Для любого числа, £ > 0 существуют т,а,кие числа, М > 0 и 5 > 0, что, каковы, бы ни были натуральное число т ^ М, начальные значения ¿[-] € Уо € М(т+1)га и допустимые реализации р[£0[-]$), -и[£о[']$), если реализации и[£о[']$), 9[£о[']$) формируются согласно процедуре прицеливания (5.3), то для решения ж [¿о — Л,[-]$] задачи (4.1), (4.2) и функции у [¿о — Л,[-]$] (2.3), построенной по решению У [¿о[-]$] задачи (5.1), (5.2), справедливо неравенство
М-з/МИС, г = 1,т, Ж И С, С, t£[to,#].
Принимая во внимание этот результат, определим показатель качества
/ m \ 1/2 г г ,
Ym = 11у[%)1|2А^ +J [<р[£], Ф[«]> - Ф[«]>] de, (5.4)
i=1 to
который аппроксимирует исходный показатель (4.3).
Для системы (5.1), начального условия (5.2) и показателя качества (5.4) рассмотрим вспомогательную задачу конфликтного управления. В этой задаче p[t] и q[t] трактуются как воздействия управления и помехи соответственно.
В согласии с [14] стратегией управления рт() называется произвольная функция
Prn(i,Y,e) € U, t € [io,0], Y € М(т+1)га, e> 0.
Пусть выбраны число e > 0 и разбиение Аг (3.2). Тройка |pm(-),e,Аг} определяет закон управления, который формирует кусочно-постоянную реализацию p[to[']$) по правилу
P[t]=Pm{t3,Y[t3],e), t € [tj,tj+i), j = 0,J-l. (5.5)
Обозначим через Qm = Qm(pm(-),e,Аг) множество таких реализаций процесса управления {Y[io[']$],p[io[']$), q[to [•]$)}, что q[io[']^) — произвольная допустимая реализация помехи; p[to[-]$) ^ реадизация управления, формируемая согласно закону {рт(-),e, Аг}; Y[to[-]$] — решение задачи (5.1), (5.2), определяемое реализациями p[to[-]$) и q[to[-]$). Положим
Гт = sup{Y : {Y[to[-]^],p[to[-]^),q[to[•]#)} € и определим величину оптимального гарантированного результата
Гт = inf lim sup lim sup Гт. (5.6)
Pm(') e^o As
Известно (см, например, [14]), что точная нижняя грань в выражении (5.6) достигается на оптимальной стратегии рт('). Более того, вели чина Гт и стратегия рт(') М0ГУТ быть эффективно найдены при помощи метода выпуклых сверху оболочек (детали и результирующие формулы см., например, в [16,19]).
Теорема 5.1 с учетом результатов из [13,20] позволяет доказать следующую теорему.
Теорема 5.2. Для любого числа, Z > 0 существует такое число M > 0, что, каково бы ни было натуральное число m ^ M, справедливы следующие утверждения:
1. Имеет место неравенство |Г° — Гт| ^ С
2. Существуют тлкие число e * > 0 и функция ö*(e) > 0, e € (0, e *], что, каковы бы ни были число e € (0,e *] и разбиение Аг (3.2) при ö ^ ö *(e), схем,а, формирования управления (5.3), (5.5) при рт() = pm(') гарантирует неравенство
Y < Г° + Z (5.7)
для любой допустимой реализации помехи v[to[-]$).
Таким образом, для исходной задачи управления (4.1)-(4.3) получаем следующий алгоритм
m.
Применяя метод выпуклых сверху оболочек, найдем величину оптимального гарантированного результата Гт и оптимальную стратегию vnравления pm(') в0 вспомогательной задаче управления (5.1), (5.2), (5.4). Тогда величина Гт аппроксимирует оптимальный гарантированный результат Г° в исходной задаче, а схема управления (5.3), (5.5) при рт(-) = рт(■) обеспечивает
e > 0
§ 6. Пример
Проиллюстрируем предложенный в предыдущем параграфе алгоритм решения задачи конфликтного управления (4.1)-(4.3) на примере. Пусть движение динамической системы описывается линейным функционально-дифференциальным уравнением нейтрального типа в форме Дж. Хейла
' Н2
^(пИ -0.4г2[*-0.5]) = -2пМ -0.4Г1Й +0.02г2И -Г1[4-1]
d2
- 0.4ri [t - 1] + 0.4r2 [t - 1] - Г2 [t - 1] + (5 - t)ui[t] + 2vi[t], d 2-(r2[i] -0.5ri[i-0.5]) =0.01ri[i] -r2[t] -0.1r2[i] -0.3n[i-l]
+ 0.7ri[t - 1] - 0.4r2[t - 1] + 0.5r2[t - 1] + (4 - 0.5t)u2[t] + 3v2[t], t € [0, 4], x[t] = (ri[t],ri[t],r2[t],r2[t]) € R4, u[t] = (ui[t],U2[t]) € R2, v[t] = (vi[t],V2[t]) € R2,
с начальным условием
z[e] = (sin®,cos(e),cos(e),-sin(e^, e € [-1,0].
Показатель качества имеет вид
Y
r2[e] + r2[e] + r2[e] + rte] de
i/2
+
u2[e]+ u2[e] - v2[e] - v2[e] de
Применим к этой задаче управления описанный в § 5 метод решения при различных значениях т, £ и равномерных разбиениях Д^ (3.2) с диаметром
Для величины оптимального гарантированного результата Г° получаем следующие приближенные значения:
Г°о = 2.178, Г°о = 1.905, Г?оо = 1.872.
Для того, чтобы проиллюстрировать работоспособность предложенной схемы управления, воздействия помехи моделировались следующим образом. В рамках теоретико-игрового подхода [14-16] для системы (4.1), начального условия (4.2) и показателя качества (4.3), по аналогии с исходной задачей управления рассматривается задача о формировании воздействий помехи, которые нацелены на максимизацию показателя (4.3). Для этой задачи строится соответствующая схема формирования оптимальных воздействий помехи и устанавливаются результаты, аналогичные теоремам 5.1 и 5.2.
При использовании схемы управления (5.3), (5.5) при рт(') = * ), к0ГДа воздействия помехи выбираются указанным способом, получаем следующие значения показателя качества:
т е 5 Y
10 0.1 0.01 1.295
50 0.02 0.002 1.869
100 0.01 0.001 1.856
Результаты моделирования проиллюстрированы на рис. 3.
Список литературы
1. Красовский H.H. Об аппроксимации одной задачи аналитического конструирования регуляторов в системе с запаздыванием // Прикладная математика и механика. 1964. Т. 28. Вып. 4. С. 716-724.
2. Репин Ю.М. О приближенной замене систем с запаздыванием обыкновенными динамическими системами // Прикладная математика и механика. 1965. Т. 29. Вып. 2. С. 226-235.
3. Куржанский A.B. К аппроксимации линейных дифференциальных уравнений с запаздыванием // Дифференциальные уравнения. 1967. Т. 3. № 12. С. 2094-2107.
Рис. 3. Компоненты движения динамической системы и реализации воздействий управления и помехи, полученные при т = 100, е = 0.01, 5 = 0.001.
4. Кряжимский А.В., Максимов В.И. Аппроксимация линейных дифференциально-разностных игр // Прикладная математика и механика. 1978. Т. 42. Вып. 2. С. 202-209.
5. Banks Н.Т., Burns J.A. Hereditary control problems: numerical methods based on averaging approximations // SIAM J. Control Optim. 1978. Vol. 16. Issue 2. P. 169-208. DOI: 10.1137/0316013
6. Banks H.T., Kappel F. Spline approximations for functional differential equations //J. Differential Equations. 1979. Vol. 34. Issue 3. P. 496-522. DOI: 10.1016/0022-0396(79)90033-0
7. Kunisch K. Approximation schemes for nonlinear neutral optimal control systems //J. Math. Anal. Appl. 1981. Vol. 82. Issue 1. P. 112-143. DOI: 10.1016/0022-247X(81)90228-6
8. Fabiano R. A semidiscrete approximation scheme for neutral delay-differential equations // Int. J. Numer. Anal. Mod. 2013. Vol. 10. No. 3. P. 712-726.
9. Красовскпй H.H., Котельнпкова A.H. Стохастический поводырь для объекта с последействием в позиционной дифференциальной игре // Труды Института математики и механики УрО РАН. 2011. Т. 17. № 2. С. 97-104.
10. Lukoyanov N., Plaksin A. On approximations of time-delay control systems // IFAC-PapersOnLine. 2015. Vol. 48. Issue 25. P. 178-182. DOI: 10.1016/j.ifacol.2015.11.080
11. Плаксин A.P. Конечномерные поводыри для конфликтно управляемых линейных систем нейтрального типа // Дифференциальные уравнения. 2015. Т. 51. № 3. С. 402-412.
12. Hale J.К., Cruz М.А. Existence, uniqueness and continuous dependence for hereditary systems // Ann. Mat. Рига Appl. 1970. Vol. 85. Issue 1. P. 63-81. DOI: 10.1007/BF02413530
13. Лукоянов Н.Ю., Плаксин A.P. Об аппроксимации нелинейных конфликтно-управляемых систем нейтрального типа // Труды Института математики и механики УрО РАН. 2014. Т. 20. № 4. С. 204217.
14. Красовский Н.Н. Управление динамической системой. М.: Наука, 1985. 516 с.
15. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
16. Krasovskii A.N., Krasovskii N.N. Control under lack of information. Berlin etc.: Birkhauser, 1995. 322 p.
17. Айзеке P. Дифференциальные игры. M.: Мир, 1967. 479 с.
18. Gomoyunov М., Plaksin A. On a problem of guarantee optimization in time-delay systems // IFAC-PapersOnLine. 2015. Vol. 48. № 25. P. 172-177. DOI: 10.1016/j.ifacol.2015.11.079
19. Лукоянов Н.Ю. Об одной дифференциальной игре с интегральным критерием качества // Дифференциальные уравнения. 1994. Т. 30. № 11. С. 1905-1913.
20. Гомоюнов М.И., Лукоянов Н.Ю., Плаксин А.Р. Существование цены и седловой точки в позиционных дифференциальных играх для систем нейтрального типа / / Труды Института математики и механики УрО РАН. 2016. Т. 22. № 2. С. 101-112. DOI: 10.21538/0134-4889-2016-22-2-101-112
Поступила в редакцию 20.03.2017
Гомоюнов Михаил Игоревич, к. ф.-м. н., старший научный сотрудник, отдел динамических систем, Институт математики и механики им. П. П. Красовского УрО РАН, 620990, Россия, г. Екатеринбург,
ул. С. Ковалевской, 16;
доцент, кафедра вычислительной математики и компьютерных наук, Институт естественных наук и математики, Уральский федеральный университет, 620002, Россия, г. Екатеринбург, ул. Мира, 32.
E-mail: [email protected]
Плаксин Антон Романович, научный сотрудник, отдел динамических систем, Институт математики и механики им. И. И. Красовского УрО РАН, 620990, Россия, г. Екатеринбург, ул. С. Ковалевской, 16. E-mail: [email protected]
M.I. Gomoyunov, A.R. Plaksin
Finite-dimensional approximations of neutral-type conflict-controlled systems Citation: Izv. Inst. Mat. Inform. Udmurt. Gos. Univ., 2017, vol. 49, pp. 111-122 (in Russian).
Keywords: control theory, differential games, neutral-type systems.
MSC2010: 49N35, 49N70
DOI: 10.20537/2226-3594-2017-49-05
The paper deals with a conflict-controlled dynamical system which motion is described by neutral-type functional-differential equations in J. Hale's form. Approximations of this system by controlled high-dimensional systems of ordinary differential equations are investigated. A mutual aiming procedure between the initial system and its finite-dimensional approximation that guarantees proximity between their motions is elaborated. Stability properties of the procedure with respect to measurement errors are established, an illustrative example is considered. An application of the procedure is given for solving a guarantee optimization problem in which a motion of the dynamical system is described by linear functional-differential equations of neutral type in J. Hale's form and the quality index evaluates a motion history and realizations of control and disturbance actions. For this purpose an auxiliary control problem for the approximating system is formulated and its solution is constructed by the upper convex hulls method. It is shown that the optimal guaranteed result in the auxiliary problem approximates the optimal guaranteed result in the initial problem, and with the use of optimal in the auxiliary problem motions of the approximating system as guides an optimal control law is constructed. An illustrative example is considered, numerical simulation results are shown.
REFERENCES
1. Krasovskii N.N. The approximation of a problem of analytic design of controls in a system with time-lag, J. Appl. Math. Mech., 1964, vol. 28, issue 4, pp. 876-885. DOI: 10.1016/0021-8928(64)90073-5
2. Repin Yu.M. On the approximate replacement of systems with lag by ordinary dynamical systems, J. Appl. Math. Mech., 1965, vol. 29, issue 2, pp. 254-264. DOI: 10.1016/0021-8928(65)90029-8
3. Kurzhanskii A.B. On the approximation of linear differential equations with delay, Différents. Uravn., 1967, vol. 3, no. 12, pp. 2094-2107 (in Russian).
4. Kryazhimskii A.V., Maksimov V.I. Approximation in linear difference-differential games, J. Appl. Math. Mech., 1978, vol. 42, no. 2, pp. 212-219. DOI: 10.1016/0021-8928(78)90136-3
5. Banks H.T., Burns J.A. Hereditary control problems: numerical methods based on averaging approximations, SIAM J. Control Optim., 1978, vol. 16, issue 2, pp. 169-208. DOI: 10.1137/0316013
6. Banks H.T., Kappel F. Spline approximations for functional differential equations, J. Differential Equations, 1979, vol. 34, issue 3, pp. 496-522. DOI: 10.1016/0022-0396(79)90033-0
7. Kunisch K. Approximation schemes for nonlinear neutral optimal control systems, J. Math. Anal. Appl., 1981, vol. 82, issue 1, pp. 112-143. DOI: 10.1016/0022-247X(81)90228-6
8. Fabiano R. A semidiscrete approximation scheme for neutral delay-differential equations, Int. J. Numer. Anal. Mod., 2013, vol. 10, no. 3, pp. 712-726.
9. Krasovskii N.N., KotePnikova A.N. Stochastic guide for a time-delay object in a positional differential game, Proc. Steklov Inst. Ma,th., 2012, vol. 277, suppl. 1, pp. S145-S151. DOI: 10.1134/S0081543812050148
10. Lukoyanov N., Plaksin A. On approximations of time-delay control systems, IFAC-PapersOnline, 2015, vol. 48, issue 25, pp. 178-182. DOI: 10.1016/j.ifacol.2015.11.080
11. Plaksin A.R. Finite-dimensional guides for conflict-controlled linear systems of neutral type, Differential Equations, 2015, vol. 51, issue 3, pp. 406-416. DOI: 10.1134/S0012266115030118
12. Hale J.K., Cruz M.A. Existence, uniqueness and continuous dependence for hereditary systems, Ann. Mat. Рига Appl., 1970, vol. 85, issue 1, pp. 63-81. DOI: 10.1007/BF02413530
13. Lukoyanov N.Yu., Plaksin A.R. On the approximation of nonlinear conflict-controlled systems of neutral type, Proc. Steklov Inst. Math., 2016, vol. 292, suppl. 1, pp. S182-S196. DOI: 10.1134/S0081543816020152
14. Krasovskii N.N. Upravlenie dinamicheskoi sistemoi (Control of a dynamic system), Moscow: Nauka, 1985, 516 p.
15. Krasovskii N.N., Subbotin A.I. Game-theoretical control problems, New York: Springer, 1988, 517 p.
16. Krasovskii A.N., Krasovskii N.N. Control under lack of information, Berlin etc.: Birkhâuser, 1995, 322 p.
17. Isaacs R. Differential games, New York: John Wiley and Sons, Inc., 1965, 384 p. Translated under the title Differentsial'nye igry, Moscow: Mir, 1967, 479 p.
18. Gomoyunov M., Plaksin A. On a problem of guarantee optimization in time-delay systems, IFAC-PapersOnLine, 2015, vol. 48, issue 25, pp. 172-177. DOI: 10.1016/j.ifacol.2015.11.079
19. Lukoyanov N.Yu. A differential game with integral performance criterion, Differential Equations, 1994, vol. 30, no. 11, pp. 1759-1766.
20. Gomoyunov M.I., Lukoyanov N.Yu., Plaksin A.R. Existence of the value and saddle point in positional differential games for neutral-type systems, Trudy Inst. Mat. Mekh. Ural Otd. Ross. Akad. Nauk, 2016, vol. 22, no. 2, pp. 101-112 (in Russian). DOI: 10.21538/0134-4889-2016-22-2-101-112
Received 20.03.2017
Gomoyunov Mikhail Igorevich, Candidate of Physics and Mathematics, Senior Researcher, Department of
Dynamical Systems, N. N. Krasovskii Institute of Mathematics and Mechanics, Ural Branch of the Russian
Academy of Sciences, ul. S. Kovalevskoi, 16, Yekaterinburg, 620990, Russia;
Associate Professor, Institute of Natural Sciences and Mathematics, Ural Federal University, ul. Mira, 32,
Yekaterinburg, 620002, Russia.
E-mail: [email protected]
Plaksin Anton Romanovich, Researcher, Department of Dynamical Systems, N. N. Krasovskii Institute of
Mathematics and Mechanics, Ural Branch of the Russian Academy of Sciences, ul. S. Kovalevskoi, 16,
Yekaterinburg, 620990, Russia.
E-mail: [email protected]