ВЕСТН. МОСК. УН-ТА. СЕР. 15. ВЫЧИСЛ. МАТЕМ. И КИВЕРН. 2021. № 3. С. 26-30
УДК 517.977
М. С. Никольский1
ОБ ОДНОЙ ЗАДАЧЕ МИНИМИЗАЦИИ РАЗБРОСА ТРАЕКТОРИЙ УПРАВЛЯЕМОГО ОБЪЕКТА
В статье рассматривается одна минимаксная задача управления для квазилинейного управляемого объекта. В динамике управляемого объекта присутствуют два вида управлений. Одно из них моделирует переменное воздействие возмущений, действующих на управляемый объект. Второе управление используется для компенсации возмущающих факторов и является постоянным вектором, который выбирается из заданного компактного множества. Качество пары управлений оценивается с помощью непрерывной функции, определенной на фазовом пространстве. От этой функции берется максимум по множеству достижимости рассматриваемого управляемого объекта, которое характеризует разброс траекторий управляемой системы в заданный момент времени. Этот максимум зависит от постоянного управления из заданного компактного множества. Так полученную маргинальную функцию надо минимизировать по множеству постоянных управлений. В статье изучаются свойства этой маргинальной функции и обосновывается существование ее минимума на множестве постоянных управлений. Также найдены достаточные условия, при которых изучаемая маргинальная функция обладает свойством липшицевости.
Ключевые слова: управляемый объект, разброс траекторий, множество достижимости, формула Коши.
Рассматривается линейный управляемый объект вида (см. [1, 2])
где х € Яп, п ^ 1, и € Р —выпуклому компакту из Кр, р ^ 1, А(у) — п х п-матрица, определенная и непрерывная на компакте ^ из Яя, ц ^ 1, В — п х р-матрица, Ь € Д = [0, Т], Т > 0. Условимся символом К\ к ^ 1, обозначать й-мерное евклидово арифметическое пространство, элементами которого являются упорядоченные столбцы из к чисел со стандартными линейными операциями, скалярным произведением (•, •) и длиной вектора | ■
А
ной. Заметим также, что измеримые функции и(Ь) € Р, Ь € Д, в (1) будут моделировать возмущающие факторы, а вектор V € Q будет использоваться управляющим объектом (1), (2) для уменьшения воздействий возмущений на разброс траекторий управляемой системой (1), (2).
Д
воздействием пары (и,и(-)), где V € Q, и(-) — произвольное измеримое по Лебегу управление и(Ь) € Р на Д.
При фиксированном V € ^ ^^^^тм через ^(Т, v,xо) множество достижимости (см. [1, 2])
Т
где х(Ь, V, и(-), хо) означает при Ь € Д решение начальной задачи (1), (2) при произвольном измеримом управлении и(Ь) € Р, Ь € Д, а объединение берется по всем допустимым управлениям
1 Математический ин-т им. В. А. Стеклова РАН, вед. науч. сотр.; факультет ВМК МГУ, проф., д.ф.-м.н.; e-mail: mniQmi-ras.ru
x = A(v)x + Bu, ж(0) = xo,
(1) (2)
D(T,v,xo) = У x(T,v,u(-),xo) О
u(-).
Используя известную формулу Коши для решения начальной задачи (1), (2) при данной измеримой функции и(-), можно обосновать следующую формулу с помощью результатов [2] и известной леммы А.Ф. Филиппова из [3]:
т
) = еТА(^ жо + У егА(щ)ВР^г, (3)
о
где егА(и"> означает экспоненциал матрицы гА(ь), интеграл понимается в смысле теории многозначных отображений, а + означает алгебраическое сложение вектора и множества.
Обозначим:
т
^ (V) = У егА(^£Р^г. (4)
о
Из результатов [2] следует, что ^(-и) — выпуклый компакт Уь € Q.
По смыслу нашей модели множество ^(Т, ь, жо) характеризует возможный разброс концов решений ж(Т, ь, и(-), жо) уравнения (1) с тачальным условием ж(0) = жо при данном ь € Q. Множество ^(Т, ь, жо) таким образом является геометрической характеристикой возможных разбросов траекторий управляемого объекта (1), (2) при фиксированном ь € Q.
Введем числовую характеристику множества ^(Т, ь, жо) следующим образом. Фиксируем непрерывную функцию <^(ж) на Яп и положим
а(ь) = ^(ж)- (5)
Так как ^(Т, ь, жо) — компакт, то величина а(ь) при ь € Q определена корректно.
В дальнейшем мы будем изучать вопрос о минимизации функции а(ь) на компакте Q, так как мы хотим уменьшить влияние возмущений и(-) на управляемый объект (1), (2) с помощью вектора у. Отметим, что для приложений представляет интерес, например, функция <^(ж) = |ж — а|2, где а — фиксированный вектор из Кп. При такой функции <^(ж) минимизация функции а(ь) на Q означает стремление управляющего системой (1), (2) уменьшить разброс векторов ж(Т, ь, и(-), жо) относительно заданного вектора а € Яп.
Отметим, что изучаемая нами задача управления относится к широкому классу минимаксных задач. Задачи на минимакс (или на максимин) представляют большой интерес для теории игр и теории исследования операций (см., например, [4,5]), а также для современной теории управления (см., например, [6, 7]). Заметим, что изучаемая нами задача на минимакс носит качественный характер и посвящена установлению корректности определения изучаемого минимакса при широких предположениях относительно условий задачи. Такого рода исследование важно для приложений с целью дальнейшего применения необходимых условий нахождения минимума функции а(ь) на компакте Q.
Для дальнейшего будет полезна
Л е м ма1. При произвольных векторах ь2 из Q и г € А справедливо неравенство
цегАЫ) — егАЫц ^ ь||А(ы) — )||, (6)
где Ь > 0 — достаточно большая константа, матричная норма, ||С|| для произвольной п х п-матрицы С определяется формулой
||С || = тах |Сж|.
Доказательство. Отметим, что матричная функция е*А(^) удовлетворяет следующему равенству при £ € Я1:
е*АМ = е + I А(ь)е5А(^) ¿в,
о
Где е — единичная п х п-матрица. Поэтому при VI € ^ € ^ < € Л1 г
) _ егА{-о2) )е-А(^) - А^2)е-А(^2)} ^8 =
о
г
= У АС^Хе-^1) _ )) + (А(^1) _ А^2))е-А(ад) (7) о
В силу непрерывности матричной функции А(-и) на компакте Q имеем неравенство
|№)|| < в, (8)
где в > 0 — достаточно большая константа. Далее, при 8 € А и V € Q справедливо известное неравенство
||е-А(^) || ^ е-|АМ||. (9)
С помощью соотношений (7)-(9) получаем при Ь ^ 0 неравенство
г
¿(М1 ^2) ^ ! + ||А^1) _ АЫ||евв ¿8, (10)
о
где V!, V2) означает матричную норму левой части равенства (7). Применяя к интегральному неравенству (10) теорему сравнения 1.6.1 из [8], мы при Ь ^ 0 и Vl, V2 из Q приходим к неравенству
¿(М1^2) < ||А^1) _ АЫ||евгЬ. (11)
А Ь = евт Т.
Используя определение интеграла от многозначного отображения и лемму А. Ф. Филиппова [3], можно доказать для множества Р(V) (см. (4)) при каждом V € Q равенство
т
Р(V) = и / егАМ Ви(г) ¿г, (12)
и(0 о
где объединение берется по всевозможным измеримым управлениям щ(г) € Р г € А.
Обозначим через Р множество измеримых управлений щ(Ь) € Р, Ь € А. Так как Р — выпуклый компакт, то Р является слабым компактом относительно слабой сходимости в гильбертовом пространстве ^(А) (см. [1]). Рассмотрим оператор (см. (12))
т
К(V, щ(-)) = У егА(щ)В«(г) ¿г, (13)
о
который при каждом V € ^ ^^^^таует из Р в Лга.
Л е м м а 2. 1. Е'слм последовательность функций щ(•) € Р при г — то слабо сходит,ся к «*(•) ш Р, то последовательность векторов К^щД-)) сходится к вектору К^,щ*(')) при каждом V € 2. Функция К^,щ(-)) равномерно непрерывна по V € Q, причем равномерно по щ(-) € Р.
Доказательство. Утверждение первой части леммы следует из свойств слабой сходимости в (А) и формулы (13). Утверждение второй части леммы вытекает из формулы (13), непрерывности матричной функции А^) на ограниченности множества Р и леммы 1. Теперь мы рассмотрим функцию (см. (13))
ф, щ(0) = ^(етА(^ хо + К (V, щ(.))) (14)
при x € Q, u(-) € V. Используя слабую компактность множества V, лемму 2 и непрерывность функции с помощью формул (3), (5), (13) нетрудно обосновать, что функция l(v, u(-)) достигает максимума по u(-) € V для любого фиксированного v € Q и что
a(v) = max l(v, «(•)). (15)
Приступим к изучению свойств функции a(v) па компакте Q. Обозначим (см. (14)) при v € Q, u() € V :
m(v, u()) = eTA(v) xo + K (v, u(-)). (16)
Тогда (см. (14), (16))
l(v,u()) = p(m(v,u(-))) (17)
при v € Q, u( ■ ) € V. Фиксируем пару векторов vi, v2 из Q и рассмотрим разность a(vi) — a(v2). Из формулы (15) вытекает, что при некоторых u¿(• ) € V
a(v¿) = l(v¿,u¿ ( ■ )),
где i = 1, 2. Нетрудно видеть, что
a(vi) — a(v2) < l(vi, ui( ■ )) — l(v2, ui(■ )). (18)
В силу сделанных ранее предположений при достаточно большом ц > 0 для аргумента функции ^ в (14) при v € Q, u(• ) € V имеет место оценка
|eTA(v)xo + K(v,u(• ))| < ц. (19)
Так как <^(x) непрерывна на шаре S = {x: |x| ^ ц}, то она там и равномерно непрерывна. Нам будет полезно следующее
Определение. Модулем непрерывности непрерывной функции <^(x) на S мы будем называть скалярную функцию f (§), определенную при § ^ 0 как максимум функции |^>(vi) — — ^(v2)| для произвольных vi, v^ из S и таких, что |vi — v21 ^ §•
Нетрудно видеть, что f (0) = 0 и что функция f (§) непрерывна при § ^ 0.
f(§) vi
v2 Q
a(vi) — a(v2) < f(Y||A(vi) — АЫ||), (20)
где y > 0 — достаточно большая константа, не зависящая от выбopa пары векторов vi, v2 из
Q vi v2 Q неравенство вида
a(v2) — a(vi) < f(y||A(vi) — АЫ||). (21) vi v2 Q
|a(vi) — a(v2)| < f(Y|A(vi) — АЫ||). (22)
Из непрерывности функции f (§) при § ^ 0, условия f(0) = 0 и равномерной непрерывности матричной функции A(v) на компакте Q получаем следующее утверждение.
Теорема 1. При сделанных нам,и предположениях функция a(v) равномерно непрерывна Q
Из этой теоремы вытекает
Теорема 2. Функция a(v) (см. (5)) достигает минимума на компакте Q. При некотором усилении требований па функции A(v), <^(x) нетрудно с помощью теоремы 1 обосновать липшицевость функции a(v) на множестве Q. Имеет место утверждение.
Теорема 3. Пусть компоненты, матричной функции A(v) липшицевы на Q, а функция
^>(x) липшицева на шаре S с центром в 0 и радиуса, ц из неравенства (19).Тогда, функция a(v)
Q
Отметим, что липшицевость функции a(v) на Q можно использовать при приближенном вычислении минимального значения функции a(v) на компакте Q.
СПИСОК ЛИТЕРАТУРЫ
1. Ли Э. Б., Маркус Л. Основы теории оптимального управления. М.: Наука, 1972.
2. Б л а г о д а т с к и х В. И. Введение в оптимальное управление. Линейная теория. Высшая школа, 2001.
3. ФилипповА. Ф. О некоторых вопросах оптимального регулирования / / Вестн. Моск. ун-та. Сер. 1. Матем. и мех. 1959. № 2. С. 25-38.
4. Демьянов В. Ф., М а л о з е м о в В.И. Введение в минимакс. М.: Наука, 1972.
5. Федоров В. В. Численные методы максимина. М.: Наука, 1979.
6. К е й н В.М. Оптимизация систем управления по минимаксному критерию. М.: Наука, 1985.
7. Хлебников М. В., Поляк Б. Т., К у н ц е в и ч В. М. Оптимизация линейных систем при ограниченных внешних возмущениях (техника инвариантных эллипсоидов) // Автомат, и телемех. 2011. Вып. И. С. 9-59.
8. Лакшмикантам В., Лила С., Мартынюк А. А. Устойчивость движения: метод сравнения. Киев: Наукова Думка, 1991.
Поступила в редакцию 17.02.21 После доработки 11.05.21 Принята к публикации 11.05.21