Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2013, № 4 (1), с. 211-215
УДК 519.6
ПОРЯДКОВАЯ РЕГУЛЯРИЗАЦИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
© 2013 г. А.Л. Калашников
Нижегородский госуниверситет им. Н.И. Лобачевского
а11к123 @уа^ех. ги
Поступила в редакцию 25.04.2013
Рассматривается задача оптимального управления в КВ-линеале с единицей. На основе метода Тихонова строится регуляризирующая последовательность. Приводятся условия её порядковой сходимости к оптимальному множеству управлений в КВ-линеале ограниченных элементов.
Ключевые слова: оптимальное управление, КВ-линеал, регуляризация, порядковая сходимость.
Введение
В работе рассматривается задача минимизации функционала при операторном и функциональных ограничениях на состояние х и управление и . Пространство управлений и здесь -КВ-линеал с единицей е. Отметим, что к такой постановке приводят многие задачи оптимального управления, в которых банахово пространство управлений является и полуупорядоченным пространством, например, задача оптимального управления для динамической системы с интегральными ограничениями и интегральным целевым функционалом, в которой и = Щ^, Ч ], а за е берётся вектор-функция е(1) = (1,1,...,1)г . Как известно [1], в КВ-линеале с единицей можно ввести КВ-линеал е-ограниченных элементов и,. При этом из сходимости в и, следует сходимость в и к тому же пределу, что означает более сильную метрику в и,, чем в и. Если для оптимального множества и0 управлений исходной задачи будет Ц, П и0 Ф0 , то целесообразно строить минимизирующие последовательности, сходящиеся ко множеству и0 в метрике и,. В этом случае возможно сужение пространства управлений, например, до ие. Так, при и = Щ^, ^] подлинеал
и, = [^, tl], и сходимость в ие будет почти
всюду равномерная. Но при замене пространства и на и' возникает вопрос о корректности исходной задачи оптимизации в и,. Это связано с тем, что хотя в и корректность может быть, но в более «узком» пространстве и, она отсутствует [2]. Тем более подобное относится
к случаю, когда в U задача оптимизации некорректна. Для некорректных задач оптимизации разработаны методы регуляризации [2]. В настоящей работе на основе метода А.Н. Тихонова приведены условия порядковой сходимости в Ue регуляризирующей последовательности, а также е-ограниченности оптимальных управлений. Отметим, что такая усиленная (в порядковом смысле) регуляризация получена без стабилизатора.
Порядковая ограниченность оптимального множества
Рассматривается 0-задача: g0(x, u) ^ inf,
F(x, u) = 0, gj (x, u) < 0, x e X, u e U, j = 1, n. Здесь операция F: X x U ^ Z , где X, Z - банаховы пространства, а U является KB-линеалом с единицей е. Функционалы g0, gj и
операция F класса С1 определены на XxU . В дальнейшем будем называть U пространством управлений, а X - пространством состояний. Пусть для всех u e U уравнение F(x, u) = 0 имеет единственное решение x = x(u) класса
С1. Такое, в частности, будет при выполнении условий теоремы о существовании неявной функции в банаховом пространстве. Тогда 0-задача сводится к задаче минимизации функционала g0( x(u), u) с ограничениями
gj (x(u),u) < 0, j = 1, n, u eU . Очевидно, все функционалы gj (x(u), u) для j = 0, n непрерывны и принадлежат классу С1 на U. Предположим также, что D ^ 0, где D - допустимое множество управлений в 0-задаче, и суще-
ствует некоторое множество S с U, для которого D с S. Например, такое S может быть получено на основе одного из неравенств gj (x(u),u) < 0.
Обозначим U0 множество оптимальных управлений в 0-задаче, и пусть U0 ^ 0 . Достаточные условия этого имеются, например, в [2]. Очевидно, для оптимального управления u e U оптимальное состояние x0 = x(u0).
Исходная 0-задача может быть некорректна в пространстве U или в более «узком» подпространстве Ue при наличии дополнительной информации об оптимальном управлении, в частности, его ограниченности. Поэтому здесь применимы методы регуляризации, например, метод А.Н. Тихонова [2] с его функцией Tk (x(u), u) = = g 0( x(u), u) + a k ю^при u eU и k > 1, где функционал ra(u) > 0 и принадлежит классу С1 на U, а числовая последовательность ak ^ +0. Введём k -задачи: Tk (x(u), u) ^ inf ,
gj(x(u),u)< 0, j = 1,n,u eU.
Пусть, теперь, gj (x, u) = aj (u) + bj (x, u) для j = 0, n, где aj (u), bj (x, u) - некоторые функционалы класса С1 на XxU. Предположим также, что сопряженное пространство U * является KB-линеалом с единицей a. Введём Ua -KB-линеал a-ограниченных элементов в U*. Обозначим || • || норму в Ue, а || • || - норму в
Ua. Их определение имеется в [1], и по [1] из сходимости последовательности в Ue следует её сходимость в U к тому же пределу. Аналогичное же относится и к Ua. Поэтому функционалы gj(x(u),u), ra(u), при j = 0,n непрерывные в U, будут непрерывны и в Ue. Обозначим |u | модуль элемента u eU, а числом d0 - inf в 0-задаче и {v^ } - подпоследовательность последовательности {vk}. Введем для u eU„
существует {sk }, для которой limpe (sk, Q) =
m k
= limpе(sk ,Q). В силу компактности {sk} счи-
km m
таем для удобства обозначения {sk } сходящейся
к некоторой предельной точке v = lim sk в Ue.
km m
На основе условия леммы v e Q. Нетрудно уста-
новить
неравенство:
pe (Skm , Q) =
= ІПР и Не <11 -V.Но 1Іт|1 у Не=0-
иєО к Кт
^ т
ТогДа 1}т ре (Хкт , 0 = 0 , и поэтому 1Іт Ре (5к, О) =
кт к
= 1Іт Ре (5кт,О) = 0 • Поскольку 0 < 1ітре (5к, О) <
кт к
< 1іт ре (5к, О) = 0 , то получаем 1іт ре (5к, О) =
к к
= 1іт ре (5к,О) = 0 . Отсюда 1іт ре (5к,О) = 0.
к к
Лемма доказана.
Обозначим иае множество е-ограниченных оптимальных управлений и0 в 0-задаче.
Теорема 1. Пусть 1) существуют числа ц, у > 0, для которых при у = 0, п и всех и є £ модули | а',„ (0) |< ца и | Ь',и (х(и), и)|<уа ; 2) существует линейный оператор В > 0 : и * ^ и с
0 < Ва < Ре для некоторого числа Р > 0 и такой,
п
что при всех и, V є £ для чисел Ху > 0 с ^=1
у=0
будет | и - V |< В | Фи (и, X) -фи (V, X )|, где
п __
ф(и, X) = а у (и) и вектор X є Яп+1.
у=0
Тогда и° ^ 0 и | и0 |< (у + ц)Ре , а любое
и0 є ие •
Доказательство. Введём функцию Лагранжа
п
Ь(х(и),и, X) = ^Ху (ау (и) + Ьу (х(и),и)). Тогда по
у=0
[3] для любого и0 є и0 существуют множители
и множества
Ре 0=^ IIй - У ||е .
уеб
Лемма. Пусть последовательность {як} с ие и компактна в ие, а любая её предельная точка
V е ° с ие. Тогда НрРе^,0 = 0.
к
Доказательство. Так как ре ^к, 0 > 0 , то 0 < - ре ^к, 0 По определению верхнего предела
Q с Ue расстояние > 0 с ^X0°. = 1, для которых L'u (x(u0),u0,
j=0
_0 ______________________________0
X ) = 0 . Отсюда ФU К, X ) = -^XO^' u (x(u0), uo) .
j=0
Поскольку u0 є S , то по условию 1) Ъ'. (x(u0),
j,u V \ 0)
f n Л
u0) є Ua. Поэтому
,u (x(uoX u0)
j=0
eU *.
k
Тогда и ф«(u0,X )eU*. На основе условия 1) получаем неравенства
( n \
0
|Ф: (0, A,°)|<£x“ x | a'j u (0)|< Xх-Ц
j=0
V j=0
a = ца
и
Iф«(«0,X0)l <XX°j1 j(x(u0),u0)|<
j=0 ( n \
Z X0 t
j=0
a = ya.
Используя же условие 2) доказываемой теоремы, выводим неравенства
Iu0 |<В|ф«(u0,X0)-ф«(0,X0)|<
< ж|ф: («0, x0) i+1 ф« (0, x0) i) <
Xх0 (T + ц)
j=0
Ba.
Lk (x,« X) = X0 x Tk (x, u) + Xх jgj (x,u)
j=1
с X = (Xj )in=0 и
n
0k (u,X) = X0a0,k (u) + XXjaj (u) ,
j=1
линейный оператор С >0: и * ^ и с 0< Са <
< £,е для некоторого числа ^ > 0, такой, что при
всех u, v e S и X e Ли+1 с XX . =1 и X. > 0
jj
име-
j=0
ем неравенство
I u - v|< С I 0k,: («, X) - -0'k,: (v, X) I . Тогда I) u° e Ue, и модуль | u° |< (y + q^e ; II) limg0(x(«l),ul) = d0, и {u° } — минимизи-
Но так как 0 < Ва < Ре и I X". =1, то 1 и0 |-
.=0
< (у + ц)Ре. Отсюда и0 будет е-ограниченным. Таким образом, множество и ^ 0, и любое оптимальное и0 е и° . Теорема 1 доказана.
Замечание 1. В теореме 1 приводятся условия, когда и0 с и е и содержится в некотором порядковом отрезке, или е-ограниченность оптимальных управлений 0-задачи, а также условия локализации области поиска и0. Отсюда возможно построение минимизирующих последовательностей в более сильной метрике пространства ие .
Обозначим а0 к (и) = а0 (и) + ак ю(и). Тогда Тк (х(и), и) = а0 к (и) + Ь0 (х(и), и). Введём при к > 1 функции Лагранжа
рующая в 0-задаче; III) для всех k > 1 значение
ю(м°) < inf ю(«0).
«0eU0
Доказательство. Поскольку условия теоремы 2 аналогичны условиям теоремы 1, то доказательство I) проводится также аналогично. Докажем II). Имеем неравенства:
d0 < g0 (x(uk0 X «1 ) < g0 (x(uk0), «1) + ak®(uk°) =
= Tk (x(uk0), uk0) < Tk (x(u0), «0) = (2)
= g0 (x(u0),u0) + akю («0 ) = d0 + akю (u0).
Из (2) d0 < g0(x(u°),u°) < d0 + akю(«0). Тогда
lim g0(x(u°),u°) = d0 при ak ^ +0, и { «0 } будет
k
минимизирующей в 0-задаче. Из (2) получаем
g0(x(uk0), uk0) + ak®(uk0) < d0 + akю(«0). Но d0 < < go(x(uk0),uk0). Тогда ak®(uk0) <akю(«0) и
ю(«0) <ю(«0). Отсюда ю(«0) < infю(«0). Тем
«0eU0
самым установлена справедливость III), и теорема 2 доказана.
Теорема 3. Пусть выполнены условия теоремы 2, и для всякой {vk} с S и j = 0, n последовательность {bj« (x(vk),vk)} компактна в U*.
Тогда {«0} компактна в Ue, а любая её предельная точка v eUe .
Доказательство. Поскольку {«0} с S , то на основе условия теоремы 3 получаем компактность {bj« (x(«0),«0)} в U*. Согласно [3]
существуют
0<X0 с YX0.„=1.
для которых
р( х, и, X) = IX Ь. (х, и).
.=0
Очевидно,
Ьк (х, и, X) = 0к (и, X) + р(х, и, X). (1)
Теорема 2. Пусть выполнены условия теоремы 1 и 1) в любой к -задаче существует оптимальное управление и° ; 2) существует число "Л >0, для которого при . = 0,п и всех и е £ модули 1 а0,к „(0)1,1 (0)|<Ла; 3) существует
Xk с X X j,k
j=0
Lk,«(x(«k0),«k0, X) = 0. Отсюда 0;,«(«“, X) =
ик,и^\сгк^1Лк^^и ^ ^к,и\1г^/^к>
= -ри (х(и°), и°, XI). Так как 0 < X” к < 1, то нетрудно установить компактность {-р’и (х(и°), и°, )>.,0к)} в иа, а с ней и компактность {0'к,и(и0,X)} в и*. Обозначим и =0к,„(и°к,X). Тогда {ик} с и* и компактна в и*. На основе неравенства условия 3) теоремы 2 получаем | и°к - иат |< С | ик - ит |. Для компактности {и°}
в ие достаточно показать, что у всякой ее {и° } существует сходящаяся в Ц подпоследовательность. По компактности {ик} для {ик } существует {ик, }, сходящаяся в и*, которая, оче-
Зт
видно, будет фундаментальной в и*. Тогда для всякого числа е > 0 существует такой номер N что при всех к. к. > N получаем
I ик - и, |<е* . Следовательно, | и° - и° |<
.т1 .т2 .т1 .т2
< С | и, - и, |< еС* < е^е, так как 0 <
Jm1 .т2
< С* < Е,е для некоторого числа ^ > 0, что доказывает фундаментальность {и° }в Ц и, тем
Зт
самым, ее сходимость в ие . Таким образом, {и°} компактна в Ц, а все её предельные точки принадлежат Ц. Пусть V - любая предельная точка для {и°}. Тогда существует {и°т} с Нш и0к = V в ие. По непрерывности функцио-
кт
налов (и), Ь (х(и),и) в ие при 1 = 0,п полу-
чаем при кт ^ да сходимости
*1 (<) ^ *1(v),
Ь. (х(и1т ), и0т ) ^ Ь (X(V), V).
Так как я. (х, и) = (и) + Ь. (х,и), то я. (х(и^),
и°т) ^ Я. (x(v), V). Но поскольку верны неравенства gJ (х(и°т ), и° ) < 0 при 1 =1,п , то в пределе Я. (х(у), V) < 0 . Следовательно, любая предельная точка V - допустимое управление в 0-задаче.
По теореме 2 {и° } - минимизирующая в 0-задаче. Тогда {и° } - тоже минимизирующая. Из непрерывности функционала я0( х(и), и) и Нш и° =
кт т
= V в КВ-линеале Ц получаем Нш я 0(х(и° ),
кт т
и1т ) = Л0 . Но Я 0 (х(ик“т X ик°т ) = (x(v), v) .
кт
Отсюда я0(x(v),V) = d0. Так как предельная точка
V является е-ограниченным допустимым управлением в 0-задаче, то V будет оптимально в ней. Следовательно, V е Ц . Теорема 3 доказана.
Порядковая сходимость регуляризирующей последовательности
Теорема 4. Пусть 1) выполнены условия теоремы 3; 2) для всех к > 1 существует vк е D
при (у -и°к) е ие и IV -и°|| < 8к, где 8к ^ +0.
Тогда А) последовательность {vк} с Ц, компактна в ие , а любая её предельная точка
v еие0; В) Нш Ре (ик0,ие0)= Иш Ре (vк ,ие0) = 0;
С) ^шЯ0(x(vк),Vк ) = Л0 .
к
Доказательство. По теоремам 2, 3 и° е Ц и {и°} компактна в ие, а любая её предельная точка и еие ^0. Из условия 2) теоремы 4
(ук - и°к) е ие и IV - ик°[ <8к с 8к ^+0. Тогда
{vк} с ие и 1iш II vк - и°к ||е = 0 . Отсюда {vк} ком-
к
пактна в Ц, а все ее предельные точки V совпадают с предельными для {и°}. Тогда V еи°, и тем самым А) доказано.
Используя А) и применяя лемму для случа-
00 ев 5к = и и 5к = Vк для множества 0 = ие , получаем Ншре(ик’Ц0) = Нш.ре(vк,и°) = 0, что и & & доказывает В).
По доказанному в А) последовательность {V} с Ц и компактна в Ц, , а любая её предельная точка V е и, . Тогда для V существует
V}с \ у в ие, а по [1] Икш Уь = у и в
1 к. 1 к. 1
и. Из непрерывности функционала я0(х(и), и)
получаем Я0(x(v), у) = Нт Я0(х(Ук X ук,). Но так
к. 1 1
как по А) V еи°е, то я0(x(v),V) = Л0. Отсюда имеем компактность последовательности {Я0( x(vk), vк)} и, как нетрудно установить, число Л0 есть ее единственный частичный предел.
Следовательно, Нш я 0 (х(у ), vk) = Л0. Таким
к
образом, верно С), и теорема 4 доказана.
Замечание 2. Приближение V, можно получить каким-либо методом минимизации. Из теоремы 4 получаем усиленную регулярность в Ц минимизирующей {и°}. Тогда с учетом терминологии [2] такую регулярность в ие можно назвать е-регулярностью.
Рассмотрим минимизацию функционала ш(и) на и0. Введём число шп = inf ш(и). По-
иеи0
скольку ш(и) > 0, то существует шп > 0. Оп-
0
ределим ш -нормальное решение ип е и 0 как
ю(иП) = шп. Если же иап е и,, то иап назовем
т т0
©е -нормальным решением, а иеп - множеством ш -нормальн^1х решений.
Теорема 5. Пусть выполнены условия теоремы 4. Тогда U°n ^ 0, и любая предельная в
Ue точка последовательностей {u°}, {vk} принадлежит Uen, и
1ЙП pe (uk0,U"n ) = lim pe (vk Kn ) = 0.
kk
Доказательство. Согласно теоремам З, 4 {u° }, {vk} компактної в Ue, а любая их предельная точка принадлежит U°. Пусть up - любая предельная точка для {u°}. Тогда существует {u^ }, такая, что lim u I = u в U . Поскольку по [1] из
, km p е ^
km
сходимости в Ue следует сходимость в U, то существует lim u° = up в U. Из непрерывности
km m
функционала ra(u) в U получаем lim ra(u° ) =
km m
= ra(up). На основе заключения III) теоремы 2 ra(u° ) < inf ra(u0). Тогда в пределе ra(up) <
UqEUq
< inf ra(u0) = an. На основе теоремы З up є U°.
UqEUq
Отсюда ra(up) = ю„. Следовательно, любая для {u°} предельная точка up будет e-ограниченным ю-нормальным решением. Поэтому U°e„ ^0 , а up є U°en. По условию теоремы 4
u, - v.
< S, , где S, ^ +0. Тогда lim II u° -
-V, ||е =0. По заключению А) теоремы 4 {ук} с Ц и компактна в Ц. Тогда нетрудно показать, что {у } имеет такие же предельные точки, как и {и°} . Отсюда все предельные точки
для {у} принадлежат и°п. Применяя лемму для
00 случаев s'k = ик, s'k = Vк и множества 0 = иеп,
получаем НкП Ре (и° , ие0п ) = 0, НкП Ре (и° , и1п ) = °.
Теорема 5 доказана.
Вышеизложенная теория порядковой регуляризации применима к 0-задаче оптимального управления:
*1
g0( x, u) = J(a 0 (u, t) + b0 (x, t)) dt ^ inf,
*0
x = Л( x, t) + B(t )u, x(t0) = x0, t e[t0, tj], (3)
<1 __________________________________
gj (x, и ) = J (a^ (u, t) + bj (x, t)) dt < 0, j = 1, N,
t0
где состояние xe X = С([t0,t1],^m), управление u e U = Ln2[t0, t1], а все функции, входящие в задачу (3), достаточно гладкие. Здесь вектор-функция e(t) = (1,1,...,1)T является единицей е
в KB-линеале L2 [t0, tj. Функционал ю(«) мож-
II ||2
но взять, например, как ю(«) = « в L2 [t0, t1]. В работе [4] приведены условия на функции задачи (3), при которых применимы теоремы 1-5. В частности, это сведение дифференциальной задачи к интегральной форме, ограниченность по норме в Ln2[t0, t1] допустимого множества
управлений и непрерывная дифференцируе-
t1 t1
мость функционалов J ay (u, t)dt и J bj (x, t))dt
t0 t0
при j = 0,N. Для U = L2 [t0, t1] пространство Ue = L” [t0,t1]. Поэтому сходимость регуляризи-рующей последовательности будет в L”[t0, t1], то есть в более сильной метрике по сравнению с
Lb2[<0, a
Список литернтуры
1. Вулих Б.З. Введение в теорию полуупорядо-ченных пространств. М.: Физматгиз, 1961. 407 с.
2. Васильев Ф.П. Методы оптимизации. М.: Факториал пресс, 2002. 824 с.
3. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988. 280 с.
4. Калашников А.Л. Аппроксимация и ограниченность оптимального множества управлений для динамической системы // Вестник ННГУ. Математическое моделирование и оптимальное управление. 2003. Вып. 1(26). С. 138-141.
e
ORDINAL REGULARIZATION IN AN OPTIMAL CONTROL PROBLEM
A.L. Kalashnikov
An optimal control problem in a KB-lineal with unit e is considered. Based on the Tikhonov method, a regularizing sequence is built. The conditions of its order convergence to the set of optimal controls are given in the KB-lineal of e-limited elements.
Keywords: optimal control, KB-lineal, regularization, order convergence.