ISSN 2074-1871 Уфимский математический журнал. Том 11. № 2 (2019). С. 83-98.
УДК 517.977
АСИМПТОТИЧЕСКОЕ РАЗЛОЖЕНИЕ РЕШЕНИЯ СИНГУЛЯРНО ВОЗМУЩЕННОЙ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ИНТЕГРАЛЬНЫМ ВЫПУКЛЫМ КРИТЕРИЕМ КАЧЕСТВА, ТЕРМИНАЛЬНАЯ ЧАСТЬ КОТОРОГО ЗАВИСИТ ОТ МЕДЛЕННЫХ И БЫСТРЫХ ПЕРЕМЕННЫХ
А.Р. ДАНИЛИН, A.A. ШАБУРОВ
Аннотация. Рассматривается задача оптимального управления с интегральным выпуклым критерием качества для одной линейной системы с быстрыми и медленными переменными в классе кусочно-непрерывных управлений с гладкими ограничениями на управление
СС£ = АцХе + АиУе + Вщ, t g [0,Т], ||и|| < 1, £Уе = А22Уе + B2U, Х£(0) = X0, Уе(0) = у0, v^(0) = 0,
J(и) := <pi (х£(Т)) + ^ (Уе(Т)) + / Hu(t) ||2 dt ^ min,
0
где х£ g Шп, у£ g Rm, и g Rr; Aij, Bi, i,j = 1, 2 — постоянные матрицы соответствующей размерности, а ipi(-),(ß2(') — непрерывно дифференцируемые на Rra, Rm строго выпуклые и кофинитные функции в смысле выпуклого анализа. В общем случае для такой задачи принцип максимума Понтрягина является необходимым и достаточным условием оптимальности и существуют единственные векторы 1£ и р£, определяющие оптимальное управление по формуле
_ . C*h£(t)l£ + C*2,e(t)P£
U£(T - t) :=
s{cie(t)ie + Cle{t)p£)
где
С*^) := В1еА*1г + е-1В*2С^) := е-1В*2
л +[ л л , {2, 0 < £ < 2,
№М):= еА 11 е-А 1ТМ2еАз2т/е йт, Б(й := I
) \ ^ 2. о ^
Основное отличие статьи от ранее опубликованных работ по данной тематике заключается в том, что терминальная часть функционала качества зависит не только от медленных переменных, но и от быстрых переменных, а сама управляемая система имеет более общий вид. Доказано, что в случае конечного числа точек смены вида управления, начинающихся с постоянного знаменателя, можно построить асимптотику начального вектора сопряженного состояния Ае = (I* р*)*, который определяет вид оптимального управления. Показано, что асимптотика имеет степенной характер.
A.R. Danilin, A.A. Shaburov, Asymptotic expansion of solution to singularly perturbed
optimal control problem with a convex quality criterion whose terminal part depends on slow and fast variables.
©Данилин A.P., Шабуров A.A. 2019.
Ключевые слова: оптимальное управление, сингулярно возмущенные задачи, асимптотическое разложение, малый параметр.
Mathematical Subject Classification: 49N05, 93С70
1. Введение
Статья посвящена исследованию асимптотики вектора сопряженного состояния в задаче оптимального управления [1, 2, 3] линейной системой с быстрыми и медленными переменными (см, обзор [4]), с интегральным выпуклым функционалом качества [3, Глава 3] и гладкими геометрическими ограничениями на управление,
В [5, 6] рассматривались проблемы, связанные с предельной задачей для задач оптимального управления линейной системой с быстрыми и медленными переменными, В других постановках асимптотика решений возмущенных задач управления рассматривалась в |7| |9|. Отметим, что данный вид управляемой системы, но с терминальным критерием качества, зависящим только от медленных переменных, был рассмотрен в [8].
В данной работе получено полное асимптотическое разложение вектора сопряженной системы, определяющего оптимальное управление. Главной отличительной особенностью задачи от рассмотренной в [10] является зависимость терминальной части критерия управления не только от медленных переменных, но и от быстрых,
2. Постановка задачи и основные соотношения
В классе кусочно-непрерывных управлений рассматривается следующая задача оптимального управления:
хе = Апхе + Al2ye + Вщ, t е [0,Т], IHI ^ 1,
£Уе = А22уе + В2и, же(0) = ж0, у£(0) = у0, (0) = 0
(1)
т
J (и) := (хе(Т)) + & (Уе(Т)) + / IIu(t) II2 dt ^ min,
0
где х£ € Кга, у£ € и € В^ г, ] = 1, 2 — постоянные матрицы соответствующей
размерности, а ^О, _ непрерывно дифференцируемые на Кга и Мт, соответственно, строго выпуклые и кофинитные функции в смысле выпуклого анализа [11, § 13]. Все пространства Кга, рассматриваются с евклидовой нормой, которая обозначается
одинаково: || • Ц.
Отметим, что терминальная часть функционала качества зависит от медленных и быстрых переменных.
При каждом фиксированном е > 0 управляемая система и функционал качества из задачи (1) имеют вид:
¿£ = Л£ Z£ + B£U, Ze(0) = Л
t е [0,Т],
М ^ 1,
т
J (и) := у (ze(T)) + / IIu(t) II2 dt ^ min,
где
ze(t) =
/ Xe(t) N V Ve(t) ) ,
ze(0):= z0 =
Л£
(
All 0
£
^12 -lA
22
v (z£(T)) :=^i (xe(T)) + ^2 (ye(T))
)■ B£ = ( A)
Отметим, что в рассматриваемом интегральном выпуклом критерии качества 3 терминальную часть можно интерпретировать как штраф за ошибку управления в конечный момент времени Т, а второе — как учет энергозатрат на реализацию управления.
Мы будем говорить, что пара матриц (А, В) вполне управляема, если вполне управляема система х = Ах + Ви.
Предположение 1. При всех достаточно малых £ > 0 пара (Л£, В£) вполне управляема, т.е. г а п к( В£, Л£В£,..., 1В£) = п + т.
Предположение 2. Все собственные значения матрицы А22 имеют отрицательные вещественные части.
При выполнении предположения 1 принцип максимума Понтрягина есть необходимое и достаточное условие оптимальности, которое дает единственное решение задачи (1) [3, п. 3,5, теорема 14],
Как доказано в [10, Утверждение 1 и формула (1.6)] функция ие(£) — единственное оптимальное управление в задаче (1), имеет вид:
В*еЛ*% 2, 0 > £ > 2,
и-(т — »•= даФ),5Н2,0 > 2, <2)
а вектор Л£ есть единственное (с учетом кофинитноети функции р — [11, Теорема 26,6]) решение уравнения
т
/п*Р А* т Л
о ^В* щВЫщ^ (3)
Здесь V р* — градиент функции р*, сопряженной к функции р в смысле выпуклого анализа (см, [11, § 12]),
Отметим, что в рассмотренном случае
р*(Л) = рК0 + р2(р) * ^2(0) = 0. (4)
Вектор Л£, определяющий оптимальное управление в задаче (1), будем рассматривать в виде Л£ = ( ^ V где I е Кга, р£ &
V Ре )
Непосредственным вычислением матричной экспоненты управляемой системы из задачи (1) получаем
е • = ^ 0 е^ ) , где П>£(г) = А11^£(г) + А12еА221/е и ПЦ0) = 0. Поэтому
Ж(*) • = еА11* У е "А11ТА12еА22Т/е ¿т. (6)
о
Интегрируя в правой части равенства (6) по частям один раз, получим Ж(*) = е[А12еА221/£ — е^А^А^ + еАцЖ^А^1, откуда, в силу ограниченности А12еА22*/е — еА11*А12 на [0,Т]
оо
щ(г) = £кАкп(уА12еА22'/е — еА11 <Аи) А^к+1). (7)
к=0
Будем использовать следующее обозначение:
с £Ц) \ ( еАЫв1 + £-1Ш^В2
Се®
е-1 еА22Ь/£В2
Согласно равенству (4) и обозначению (8) уравнение (3) переходит в систему уравнений
т
V 1е) - еА11Тх0 + же(т)У0 + С1,е(г)ие(т - г) м,
т
(9)
V '^2(-Ре)- еА22Т/е у0 + С2>е(1)ие(Т - 1)сИ,
где
и£(Т - I) :--
С*Ме + С1М р£ Б (\\с;те + С2М)р£
(10)
Определение 1. Предельной задачей для, задали (1) называется задача, Хо - Аохо + Вои, ге [0,Т], \\и\\ ^ 1,
Л :-Ап,
Во :-В1 -А12А-1В2, хо(0)-хо
т
■1о(и) :-(Р1(хо(Т)) + / \\и(Щ2(И ^ ш1п.
Предположение 3. Пары, матриц (Ао,Во), (А22,В2) вполне управляемы. В силу [5] выполнение предположений 2 и 3 являются достаточными условиями выпол-
11з формул (5), (7) и (8) следует, что справедливы асимптотические формулы
С\£(I) - Сг,о(Ь) + А12А-1 еА22*/еВ2 + О(е), £ ^ 0, С^):-еА°'Во, 8 Н
^-с^) - -С1,о(г) + £-1А12вА222/В2 оъ аъ
+ АпА12еА22*/£А-21В2 + О(е), 0
(П) (12)
равномерно на отрезке [0,Т],
Отметим известный факт, что при выполнении предположения 2 существуют ^ > 0 и
К > 0 такие, что
\\еА22*/е\\ ^ Ке
(13)
Если вектор-функция ¡е({) такова, ч то ¡£ (Ь) - О(еа) при е ^ 0 для любо го а > 0 равномерно по Ь е [а, Ь], то мест о ¡£ (Ь) будем пис ать О, В частности,
\\еА22ф\\ - О, е-1ф - О при Ье [£Р,Т], р е (0,1),
(14)
> 0.
К1 > 0 о > 0
при всех е е (0, ео) и Ь е [у/е,Т] справедливы неравенства
Вс:,(г) - с^МИ < к\е,
^ КХ£.
(15)
3. Некоторые вспомогательные утверждения о кофинитных функциях
Согласно [11, теорема 26,6], если / — дифференцируемая, строго выпуклая кофинитная функция на Д™, то V / : Яп ^ Яп — взаимно-однозначное отображение на Яп, а также /* — дифференцируемая, строго выпуклая кофинитная функция на Яп.
Яп, Ы — неотрицательный линейный оператор в Жп, т. е.
VI е Ега (Ы I, I) ^ 0.
Тогда, функция д(1) = /(/) + 2 (Ы, I) — дифференцируемая, строго выпуклая, кофинитная, функция на, Яп. При этом, Vд(/) = V/(/) + Ы.
( )
пуклая функция на Яп.
Вычислив производную по направлению А/ скалярного произведения 1 (Ы,/):
(Ь(1 + г А1),1 + гА1)
Ч1 (Ы •1)) (А)=I
(Ы, А I),
4=0
получим, что V (|(Ы, /)) = Ы. справедливо следующее соотношение:
V г = о Иш = +^. (16)
Покажем, что функция д(1) удовлетворяет условию (16), Для любого Л > 0 :
д( Л) = /( Л) + 1 (Ы( Л ),Л) = /(Л) + Л Л = Л +2 ■ Л = Л +2 '(Ы'0 /(Л/)
^ —---> при Л ^
Л
□
Следствие 1. Пусть функция / удовлетворяет условиям леммы 1, а /* — сопряженная функция к функции / в смысле выпуклого анализа. Тогда, уравнение V/* (/) + Ы = с1
Доказательство. Справедливость данного следствия вытекает из леммы 1 и теоремы 26,6 из [И].
4. Предельные значения векторов I£ и р£
Теорема 1. Пусть выполнены предположения 1 и 2 и вектор Л* = (I* р*) — единственное решение системы (9). Тогда, векторы 1£, ре ограничены и
1£ ^ 10 при £ ^ +0, (17)
0
т
0 = -V р\(-1) + + / С^) 8 ^^||} <к. (18)
Доказательство. Известно, что множество достижимости управляемой системы из задачи (1) к моменту времени Т равномерно ограничено при е € (0, во] (см., например, [6, теорема 3,1]), Таким образом, левая часть уравнения (3) ограничена. Поэтому при £ ^ 0 ограничена и величина V р*(—Л£), Поскольку функция р* кофипитпая, то согласно [11, лемма 26,7] вектор Л£ ограничен. Следовательно, векторы 1£, р£ ограничены.
Разобьем отрезок интегрирования в первом равенстве из (9) па два: \00,у/£]ъ [у/ё,Т], Учитывая равенство (6) и обозначение (8) — представление матриц и С£(Ь) из си-
стемы (9)—(10), первое равенство из (9) можно записать в виде
т
/С* (Ь)1
См(^ 8^^\\ Л при 0. (19)
V М £
Пусть 10 — произвольная предельная точка функции I£ при е ^ 0, В силу неравенств (15) переходя в равенстве (19) к пределу при е ^ 0, получается равенство
о)=+
о '
т.е. Iудовлетворяет уравнению (18), Это уравнение имеет вид
V ((- 1о)+ Ц-1 о) = еМ1Тх0
и I ^ 0, Поэтому, в силу следствия 1 из леммы 1, это уравнение имеет единственное решение.
Тем самым Iо — единственная предельная точка для I£, и поэтому Iе ^ Iо при е ^ 0 □
Теорема 2. Пусть выполнены условия теоремы, 1, а В2 есть отображ.ение Ег на все Ет (в частности и г ^ т). Тогда, р£ ^ 0, величи на {г£} (г£ := £-1 р£) ограничена при £ ^ +0
о
0= Г еа22ГВ Що + ЩеА*2Т(ГО + (А*22)-1А1 21О) 0 I 6 (\\В*о1о + В*еА22т(го + (А*22)-1А121о)^аТ.
Доказательство. В интеграле из второго равенства системы (9) сделаем замену переменной т := Ь/£. Возьмем произвольное 8 > 0, Учитывая оценку (13), перепишем данное равенство в виде
6
Vр*2-р£) = О + [ еА22^ ВТ-£)£ + В*^Г£ Л с1т + 0(е^),
(21)
£ + В2еА^т- 11 1
^(\\В( г, £)1 £ + В* еА22т Г£\\)
£ := £/
В(т, е) := ВоеА111£Т + В*еА22т(А*22)-1А12. (22)
Отметим, что В(т, е) 1£ ^ В(т, 0) 1о при е ^ 0 равномерно на [0, и В(т, 0) ограничена на [0, +гс>).
Пусть ро — произвольная предельная точка р£ при е ^ 0 т-е- существует {£к} такая, что ек ^ 0 и рк := р£к ^ ро-
Предположим, что гк := г£к неограничена. Не ограничивая общности можно считать, что
Гк
Гк ^^ ц^и ^ \\ Г \ \ = 1 ро = \\ро \ \ Г. (23)
Поскольку функция В*еА22Тг непрерывна в совокупности по переменной т и вектору г, а при г = 0 в силу ипъективноети В* выражение В*еЛ22Тг = 0, то найдется К° (8) > 0 такая, что
Vr Vт е [0, 5] : \\В**еА*22Тг|| ^ К°(6)\\г\\.
Поэтому в силу соотношений (23) при всех достаточно больших к будет справедливо неравенство
||С*>ек(ет)1 £к + В*еА22Тгк|| > 2,
(21)
8
йЪВ(г, ек)1 к + В**е^Лг
0
Vр*(-рк) = I е^В2 |Ы| 1 ' '-2-^ йт + О + 0(е-^). (24)
ш\В(-, )1 * + В**е А22Т Й
Переходя в равенстве (24) сначала к пределу по к, а затем к пределу по 6 ^ с учетом соотношений (23) получим равенство
/В* Р^22ТГ 02
Умножив последнее уравнение екалярно на г, получим
(V р*(-\\р°\\г), г) = ! ЦВ**еА22Тг|| йт. (25)
0
Правая часть равенства (25) в силу предположения 3 положительна, а левая часть в силу монотонности V р* и равенства V р*(0) = 0 неположительна, что противоречиво. Таким образом р£ ^ 0. При этом еели г£ неограничена, то, повторяя предыдущие выкладки, придем к противоречивому равенству, аналогичному (25)
0= У ||В*еа'22тг|| ¿т.
0
Наконец, если г° — предельная точка г£, то, переходя в (21) сначала к пределу по е ^ 0, а затем к пределу по 6 ^ с учетом обозначения (22) получим равенство (20), □
Теорема 3. Пусть выполнены условия теоремы, 2. Тогда уравнение (20) имеет единственное решение г° и г£ ^ г°.
Доказательство. Введем обозначения: /:=В° 1°, г := г° + (А*2)-1А121°. Тогда уравнение (20) примет вид
/1 + В* РА22ТГ
^ 5 (II = ™
°2
Если I = 0 то после умножения равенства (26) на г, получим
Г \\В*>еА22Тг II2 ,
1 \\ 2 \\ ¿т = 0.
У 5 (\\В2*еА'22^г °2
Поскольку подынтегральное выражение непрерывно и неотрицательно, то \\В*еЛ22Тг\\ = 0 и, тем самым, в силу предположения 3, г = 0, Пусть теперь 1 = 0.
Предположим, что существуют два различных решения г1 = г2 уравнения (26): Д(п) = Д(т2) = 0, Применим формулу конечных приращений Лагранжа:
0 = ( Д(г 1) - Д(Г2), Г1 - Г2) = ( ^(г)
<
д
(Г1 - Г2), Г1 - Г 2
)
(27)
где г' е [г 1, г2]. Покажем, что при г1 = г2 равенство (27) невозможно.
Перепишем интеграл из (26) в виде суммы двух интегралов по двум множествам
Е1(г) :={т е [0, : \\1 + В2*еА22тг\\ ^ 2}, Е2(Г) :={г е [0, : \\1 + В**еА22тг\\ ^ 2}. Тогда интеграл в правой части уравнения (26) разбивается на два интеграла:
Дм= / с1т + / еА'птВ2 ,; + ^ г„ ^
3 2 } \\/ + В** ел*2Тг \\
е1(г) е2 (г)
Учитывая, что В*еА22тг ^ 0 при т ^ множества Е^г) и Е2(г) состоят из конечного числа промежутков.
Найдем ИД(г')(Аг) — производную функции Д в точке г' по направлению Аг, используя представление (28) и известную формулу
( №) \ Ж
Г д/(г, Г)
(28)
В
/(г, г)сН
\а(г)
(А )
/
дг
-(Аг) (И +
а(г)
+ /(Р(г), г)^(Аг) - /(а(г), г)^(Аг).
Поскольку в общих точках из Е^г) и Е2(г) значения подынтегральных функций равны, то в итоговой формуле для ИД не будет внеинтегральных слагаемых. Так как
д_ дг
I + В* еА22тг
С *(т)Аг
^ ( е А22-(АГ) = С (тГ ^ , С (г) := еА22Г В2,
д_ / , I + В2^Л22ТГ \ дг\ 2 \\1 + В**еА222гг \\)
С*(т)Аг\\/ + С*(т)г\\2 - (С*(т)Аг, I + С*(т)г)(1 + С*(т)г)
С( )
то
С( )
е2(г')
\\/ + С *(т)г\\3 ВР (г')(Аг) = ОД( г')(Аг) + ОД( г')(Аг),
ОД(г')(Аг) = 1 J еА22ТВ2В**еА222тАгйт,
Е1(г')
ОД(г ')(Аг)
С*(г)Аг\\г + С*(т)г\\2 - (С*(т)Аг,1 + С*(т)г)(/ + С*(т)г)
\\1 + С *(т)г\\3
(29)
Если Е1(г') = 0, то в силу последнего равенства из соотношений (29) следует, что ОД (г') > 0.
В силу неравенства Коши-Буняковекого из соотношений (29) следует, что ВF2(г') ^ 0, Поэтому, если Е1(г') = 0, то ИД(г') > 0 и равенство (27) возможно лишь при Аг = г1 - г2 = 0,
г=г
а
Таким образом, поскольку Аг = 0, то из равенства (27) следует, что
Ех(г-') = 0
вектор I + В*еА22Тг' параллелен вектору В*еА22ТАг.
Равенство Е1(г') = 0 означает, что
Vт \\к + еА22тг'\\ ^ 2. (30)
В силу условий доказываемой теоремы В*еА22ТАг = 0, Тем самым существует такая функция 3 : К ^ К, что
V г 1 + В 2 е а22т г' = 3(г)В*2е А22т Аг.
При этом с необходимостью I имеет вид В^к. Тем самым, если I € 1т(В*), то равенство (27) невозможно,
В2
Vт к + еА*22Т г' = 3 (т) еА*22т Аг. (31)
Умножив тождество (31) на е-А*22-Т, получим, что
е А22^ 11 + г' = 3 (т)Аг (32)
3( )
-А22е-А22т к = 3'(т)Аг, (А*22)2е-А22Т к = 3 "(т)Аг.
что при т = 0 дает равенства
- А*22к = 3'(0)Ат, (А*22)% = 3''(0)Аг. (33)
Если 3'(0) = 0 или 3''(0) = 0 т0 и Ь = 0, что противоречит условию теоремы. Из равенства (33) следует, что 3"(0)Аг = (А*2)2к = —А*23'(0)Аг, т.е. вектор Аг — собственный вектор матрицы А*22. Тем самым
А*22Аг = -аАг, а > 0, (34)
где а = 3"(0)/3'(0) — собственное значение матрицы А22.
Опять, если у матрицы А22 нет вещественных собственных чисел, то равенство (27) невозможно,
1 А
равенства (32) и г' параллелен вектору к- В силу того, что г' = г1 — 3оАг при некотором 3 1 2 1 Итак, в этом случае
Г1 = 31к, Г2 = 3^2, г'= 3зк.
и равенство (26), справедливое при г^ г = 1, 2 после умножения екалярно па к, примет вид
Г (1+3ге-ат)е-ат¡В*2¿1\\2 , , ч
У ' -1-\\ 2 1\' с1т = 0, г=1,2. (35)
о ^\1 + 3ге-^\-\\В*11\) Равенство (35) невозможно, если 1 + 3^-ат не меняет знака на [0,
В силу того, что е-ат строго убывает и е-ат ^ 0 при т ^ получим, что 3г < —1, г = 1, 2. Отсюда в силу соотношения г' € [г 1, г2] следует, что и 3з < — 1- Но тогда существует то > 0 такое, что \1 + 33&-ато \ ■ \\\ = 0, а это противоречит неравенству (30), □2
В дальнейшем считаем, что
= т, А
22
, В2
.
(36)
Здесь I — тождественное отображение Кт на
Лемма 2. Пусть выполнены условия (36) и условия теоремы, 1. Тогда,
г£ ^ го = А*121о — 2Во1о при £ ^ 0. Доказательство. При выполнении (36) уравнение (20) примет вид
51
+ -:\\1 + е-Ч
= 0,
(37)
где I := В*о1о, г := Го + А2)-1 А^о-
(—2 )
= —2
(1 — 2е-Т)1
Б \1-2e-
= -
(1 — 2 )
|1 — 2£ М\/\\)
^1= V = 1 — 2^
1
= 0,
поскольку подынтегральная функция нечетна.
□
Л£
Отметим, что в силу условий (36)
Во = В1 + А12, о = А12 — 2 Во* о,
те
С1£(г) = В{е+ А*12(еА^ — е-1/£1) ^(—1)к£к(А*11)к
Из равенств (38) и (39) следует, что
к=о
С£ (г)Л£ = С*о ($1 о + С1оА1 — еА^еА*п1о —
— 2е-'/£В*1о — А*12е-*/£А1 + £А*12е-'/£А*111о + е-г/£Аг + Т2(£, А1, Аг).
(38)
(39)
(40)
Здесь А1 := 1£ — I о, А г := г£ — го, а Т2(£, А I, А г) — функция второго порядка малости по {£, АI, Аг}.
Сначала рассмотрим случай, когда у предельной задачи есть только одна точка смены вида оптимального управления.
1
1
Пусть для предельной задачи и начального состояния системы хо существует единственный момент времени £ = ¿о € (0,Т) такой, что:
V* < ¿0 НС* о(*)/о! < 2; \\С*о(*о)У = 2; V* > ^ НС*о(^)У > 2;
d
Jt ||С0оМо||2
= 0.
t=to
(41)
Лемма 3. выполнено условие
11ВД1 < 2, (42)
то
Vl£ ^ Iо Vr£ ^ - 2 во)/о 3 £о > 0 VeG (0, ео) Vt G [0, Vi] ПС(t) Ае|| < 2. (43)
Доказательство. Предположим противное. Тогда найдутся последовательности {tk} С [0, у/ё] и {£к} такие, что £к ^ +0 и
ЦС*£к (tk)А£к || ^ 2. (44)
Положим тк := tk/£к, h := hk, i"k := г£к и Ак := Аек, Тогда в силу равенства (40)
С*£к(tк)А£к = С*,о(£ктк)1 о - 2е-ТкБ*01о + Тх(ек, А/к, Arfc), (45)
А/fc := Iк - /о, Arfc := гк - Го и Ti(ek, А Iк, Arfc) ^ 0.
Пусть то — какая-нибудь предельная точка последовательности {тк} (для сокращения записи считаем, что тк ^ то). Если то = то, переходя в равенстве (45) к пределу
при к ^ то и учитывая, что Iк ^ 1о, rk ^ (А\2 - 2 во)Iо, получим С* (ектк)Ак ^ В*1о. Но ||Во/о|| < 2 в силу предположения (41), что противоречит условию (44), Таким образом, все предельные точки то конечны. Тогда ектп ^ 0 и поэтому С* (ектк)Ак ^ (1 - 2е-Т0)Во/о. Но
|(1 - 2е-Т0)В*/0| = |1 - 2е-Т0| ■ ||В0%| ^ ||В0*/0| < 2,
что противоречит условию (44), □
Теорема 4. При выполнении условия (42) существует £0 > 0 такое, что для, любого £ G (0, е0) существует единственная точка t£ смены вида оптимального управления в (1)
Vt < t£ ||С!(t)Ае| < 2; ||С(QKH =2; Vt > t£ ||С*(t) Ае| > 2. При этом, te ^ t0 при £ ^ 0.
(41) > 0
|
Vt G [to-¿o,to + ¿o] ^ПСо(^о||2
> 0.
¿=¿0
В силу (17) и (15) и того, что НС* о(£0 — 5о)1о\\ < 2 ж НС* о(£0 + 5о)1о\\ > 2 найдется е? > 0 такое, что при всех ее (0,е?) и Ь € [¿о — о + ^о] будут справедливы неравенства
8
НС(ь-бо)ХеН < 2, НС(ь + боЖН > 2, 801 с;(¿)А£\\2) >о.
Отсюда следует наличие единственной точки Ь£ € [¿о — ¿о + ^о] такой, что \\С(¿е)Ае\\ = 2, Покажем, что при всех достаточно малых е > 0 (0 < е < ^ £?) других точек ¿, удовлетворяющих равенству \\С (¿)Ае\\ = 2, не существует,
В силу условия (41) существует ^ > 0 такое, что при Ь : \Ъ — ¿о| ^ ^о выполняется оценка |\\С о(£)/о\\ — 2| ^ ^ > 0. Из оценки (11) и условия (17) следует, что при всех
достаточно малых е > 0,1 € [у/е, Т] и р — ¿о\\ ^ будет справедливо неравенство \\\С£(¿)Л£\\ — 2\ ^ 'у/2 > 0. Тем самым, \\С£(¿)Л£\\ = 2 при таких е и ¿. На оставшемся отрезке [0, ^/е] соотпошепие \\С£ (¿)Л£\\ = 2 выполняется в силу условия (43), □
Таким образом, в рассматриваемом случае интеграл из (3) тоже разбивается в сумму двух интегралов
т ъ т
/Жл+!сМ («>
о о и
Пусть А 1£ := 1£ — Iо, Аг£ := г£ — го, АЬ£ := Ь£ — го. Тогда
Л = ( е{о0++А1к) ) • А1 £ = 0(1)- Аг£ = 0(1)■ Аи = от
при е ^ 0, и в силу равенств (2), (3), (46) и теоремы 4 — тройка {А I£, Аг£ АЪ£} является
0 = Г^е, А1, Аг, Аг) := к) + Vр*1(—lo) +
^ т
+ Щ(Т)уо + и Сг,£ (1)С*£ (Ь)Л£<й + ! Сг,£(I)
о гЕ
0 = Р2(е, А1, Аг, Аг) := —Vр*2(—еге) + Vр*2(0) + (47)
^ т
+ Ц е-1С2,£^)С*£ + ! е-1С2,£(I)
[ 0 = С(е, А1, Аг, А1):= \\С£ (1 + Л^Г — \\С1о(10)1о\\2.
Отметим, что функции Р1, Р2 и С непрерывны, а С — бесконечно дифференцируемая функция,
А , А
А
В силу бесконечной дифференцируемости функций р\ъ р*2 с учетом равенства (2(0) = 0 получим
те
—V (—Iо — А1) + V р1(—10) - 02р1(—10)А1 + ^ Ф^(А1),
к=2
те 4 '
—V (2— Г£) + V (2(0) - 02(2(0)Г0£ + Е Ф2,к(е, Аг),
к=2
где 02р1(—1о) и И2(2(0) — дифференциалы второго порядка от и р*2 в точках (—1о) и 0 соответственно, а Ф\>к(А1) и Ф2,к(е, АI) — однородные степени к известные функции
А
В силу равенства (7)
те
Ж(Т)уо - ее А11ТА12Уо + ^ £кУк, (49)
к=2
к
Каждый интеграл в первом и втором равенстве из системы уравнений (47) разобъем на две части
+дг +Дг т т
1-1+1• / = I +1
о о 1,0 4о+Д4 4о+Д4 ¿о
и обозначим интегралы через 1?(е, А А), 12(е, А А), 1а(е, А А) и 14(е, А А), соответственно.
Отметим, что в силу равенства (7) асимптотика подынтегральных функций в 12 - 14 — степенная по е и компонентам вектора А А с коэффициентами, гладко зависящими от ¿.
Для разложения интегралов 12 и 1а по АЪ надо дополнительно разложить коэффициенты, зависящие от ¿, в ряд Тейлора в точке Ьо и затем проинтегрировать получившиеся разложения по указанным промежуткам.
Отметим, что слагаемое первого порядка малости по АЪ в 12 и 1а имеет вид
(* о) С* ,о(¿о)^ . С1,о (1о)С{Мо)1о Л ,
2 ^ НС^о^оН ^
соответственно. Так как
\\С*о(*о)У = 2, /2(е, А А) = 0(А*), ^е, АА) = 0(А*),
то в разложении суммы 12 +1а слагаемых первого порядка малости по А/, Аг, АЪ и е не будет,
[ о, Т]
те
С*£(^ = В*(г)е+ А12ел*1* 1) V(А??)
й=о
(50)
С*е(г) = О при £ ^ 0.
Тем самым,
т
Ц £-1С2' ®Аей + / е-1С2, £(1) =
о ге
= 1/ £-1С^Л)С*е (г)Ае^ + О =: 15(е, АА) + О, о
а степенная асимптотик интегралов г = 2, 3, 4 те содержит А г.
Введем обозначение ( 1^(е, А А)) 1 — линейная по А/, Аг, АЪ и е часть интеграла 1^(е, А А), В силу теоремы 4, равенств (50) и того факта, что
Ьо
I е-1/£!(1, 1е, ге)сИ = 0(е), о
если /(£, 1е, г£) равномерно ограничена на [0, ¿о], простым вычислением получим:
Ьо
(11(е, АА))1 = 2У С1,о(*)С*о(*)^А/ + е/1 =: БцЫ + е^, (51)
о
(1а(е, А А))1 =
т
[п ,^С1о(1)АЦ\С1о(1)1оН2 — (С*о(Ь)А1,С1о№)С1о®1 о _ (52)
= ] С1'о() ^ +
£• /а =: Я^А + е/а, (/5 (е, А А))1 = 1а г + 1 (2 Во — А^Д 1 + е Ь, (53)
к
где Д, fs и f5 однозначно вычисляются по Iо- При этом в силу предположения 36 и неравенства Коши - Буняковского
Dn > 0,
Du > 0.
(54)
Из равенства (50) находится асимптотика функции G(e, Al, At) при Al, At и e, стремя-0
G(e, Al, At) - 2{C¡o(to)lo, C**o(to)Al + (C¡o)'(to)Ш + eA*neA1it0lo)
d
+ Y¿Gk(e, Al, At), (Cío)'(to) := jC*^(t)
k=2
(55)
t=to
где С к (£, А1, Д£) — однородные степени !гпоеи компонентам векторов А1 и Аг известные функции.
Таким образом, в силу равенств (48), (49), (51)—(53) и (55) система первого приближения для (47) имеет вид
f egi = D2<i(—lo)Ali + DnAli + Dl2Ali e92 = ^Aп + 1 (2 Bo, -A!2)Ali
4
(56)
k egs = 2( elo(to)lo, C*lfl(to)Ali) + (C*lfl(to)lo, (C*lfi)'(to)lo)Ati. В силу выпуклости <i и неравенств (54) линейный оператор
(D2<\(—1o) + Dii + Di2) > 0,
поэтому из первого уравнения в системе уравнений (56) однозначно находится Ali = еlim После чего из второго уравнения в системе уравнений (56) однозначно находится A гi = £г^ Наконец, в силу условий (41) коэффициент при Ati отличен от нуля и, тем самым, из третьего уравнения в системе уравнений (56) однозначно находится Ati = £ti. Таким образом, линейный оператор первого приближения для системы уравнений (56), т.е. оператор
Al i V | Ari At i
( D2<\(-1 o)Al i + DnAl i + DuAl i \
i A г i + 4 (2 Boo — A*u)Al i \ 2(elo(to)lo,Clo(to)Ali) + (Clo(to)lo, (C*lfly(to)lo)Ah J
непрерывно обратим,
А , А А
стандартным образом. Пусть уже построены приближения А I, Аг и Аt до М-го порядка. Тогда величины
N
N
AlN+i :=Al — J2 £k¡к, ArN+i := Ar — J2 £kr'k, AtN+i :=At — ^ £^ к
N
k=i
k=i
k=i
по построению удовлетворяют соотношениям
А IN+1
V | АrN+l | =0(^+4 +0{е\|^+1||) + 0(II^+1||2),
(57)
А tN+1
А I N +1
ZN+1 := | А rN+1
А tN+1
В силу непрерывной обратимости оператора V из соотношений (57) получим, что
ZN+l = 0(^+1) + 0(е|| ZN+l ||) + 0(|| ZN+l||2). (58)
Как показано в [10, утверждение 2], из (58) следует, что zN+1 = 0(£N+1), Тем самым, доказана следующая теорема.
Теорема 5. Пусть выполнены предположения 2 и 3, а также условия (41) и (42). Тогда, вектора I£, г£ и момент времени Ь£ раскладываются в степенные асимптотические ряды,
те тете
I£ = /с + ^ £к1 к, Т£ ^ (А{2 - 2В*0 )/с + ^ £ктк, и ^ и + ^ £Нк, 0,
к=1 к=1 к=1 коэффициенты, которых находятся, рекуррентным, образом,.
Аналогичные результаты справедливы и в более общем случае, когда существует конечное число точек {Ъ 1, Ь2,..., ¿р} С (0, Т) таких, что
V* е [0, Т] \ {1г}рг=1 ||СС*(*)*с|| = 2; ||С*(¿с|2 = 4; - ||С&)*с||5
и выполнено условие (42).
В этом случае аналог теоремы 4 имеет следующий вид
= 0, (59)
л
Теорема 6. Пусть выполнены условия (36), (42) м (59).
Тогда, существует £0 > 0 та,кое, что для, любого £ е (0,е0) существуют точки {£ 1,£, ^2,£,..., ¿р,£} С (0,Т) смены вида оптимального управления в задаче (1). Других точек смены вида управления нет и Ьг,£ ^ Ьг при £ ^ 0 для любого г = 1,... ,р.
Доказательство этой теоремы аналогично доказательству теоремы 4. Отметим, что в этом случае система уравнений, аналогичная системе уравнений (47), будет содержать вместо одного скалярного уравнения 0 = С набор из р уравнений 0 = Ср.; соответствующий точкам 1г,£, и неизвестными величинами будут А I, А г и АЬг (г = 1,... ,р). Аналогично доказательству теоремы 5 доказывается следующая, итоговая теорема.
Теорема 7. Пусть выполнены предположения 2 и 3, а также условия (36), (42) м (59). Тогда, вектора 1£, г£ и моменты времени {Ъ 1,£, ¿2,£,..., 1Р,£} раскладываются в степенные асимптотические ряды
тете
1£ = /о + ^ек1 к, Г£ = (^12 - 2В*)/0 + ^£кТк, к=1 к=1
те
и,£ + £\к, г = 1,...,Р, 0, к=1
коэффициенты, которых находятся, рекуррентным, образом,.
СПИСОК ЛИТЕРАТУРЫ
1. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз. 1961. 391 с.
2. Красовский H.H. Теория управления движением,. Линейные системы. М.: Наука. 1968. 476 с.
3. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.: Наука. 1972. 576 с.
4. Васильева A.B., Дмитриев М.Г. Сингулярные возмущения в задачах оптимального управления II Сер. Мат. анализ. Итоги науки и техники. Т. 20. 1982. С. 3-77.
5. P.V. Kokotovic, А.Н. Haddad Controllability and time-optimal control of system,s with slow and fast modes 11 IEEE Trans. Automat. Control. Vol.20, No.l. 1975. P. 111-113. doi: 10.1109/TAC.1975.1100852.
6. Дончев А. Системы оптимального управления: Возмущения, приближения и анализ чувствительности. М.: Мир. 1987. 156 с.
7. Калинин А.И., Семенов К.В. Асимптотический метод оптимизации линейных сингулярно возмущенных систем с многомерными управлениями // Журн. вычисл. математики и мат. физики. Т. 44, выи 3. 2004. С. 432-443.
8. Данилин А.Р., Парышева Ю.В. Асимптотика оптимального значения, функционала, качества в линейной задаче оптимального управления в регулярном случае // Докл. АН. Т.427, вып 2. 2009. С. 151-154.
9. Данилин А.Р., Коврижных О.О. О задаче управления точкой малой массы в среде без сопротивления 11 Докл. РАН. Т.451, вып 6. 2013. С. 612-614. doi: 10.7868/S086956521325004X.
10. Шабуров A.A. Асимптотическое разложение решения сингулярно возмущенной задачи оптимального управления с интегральным, выпуклым, критерием качества, терминальная часть которого зависит только от, .медленных переменных // Тр. ИММ УрО РАН. Т.24, вып 2. 2018. С. 280-289.
11. Рокафеллар Р. Выпуклый анализ. М.: Мир. 1973. 471 с.
Алексей Руфимович Данилин,
Институт математики и механики УрО РАН,
ул. Софьи Ковалевской, 16,
620990, г. Екатеринбург, Россия
E-mail: [email protected]
Александр Александрович Шабуров, Уральский федеральный университет, ул. Мира, 19,
620002, г. Екатеринбург, Россия E-mail: [email protected]