Научная статья на тему 'Порядковая регуляризация в задаче оптимального управления'

Порядковая регуляризация в задаче оптимального управления Текст научной статьи по специальности «Математика»

CC BY
91
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / KB-ЛИНЕАЛ / РЕГУЛЯРИЗАЦИЯ / ПОРЯДКОВАЯ СХОДИМОСТЬ

Аннотация научной статьи по математике, автор научной работы — Калашников Александр Львович

Рассматривается задача оптимального управления в KB-линеале с единицей. На основе метода Тихонова строится регуляризирующая последовательность. Приводятся условия её порядковой сходимости к оптимальному множеству управлений в KB-линеале ограниченных элементов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ORDINAL REGULARIZATION IN AN OPTIMAL CONTROL PROBLEM

An optimal control problem in a KB-lineal with unit e is considered. Based on the Tikhonov method, a regularizing sequence is built. The conditions of its order convergence to the set of optimal controls are given in the KB-lineal of elimited elements.

Текст научной работы на тему «Порядковая регуляризация в задаче оптимального управления»

Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2013, № 4 (1), с. 211-215

УДК 519.6

ПОРЯДКОВАЯ РЕГУЛЯРИЗАЦИЯ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

© 2013 г. А.Л. Калашников

Нижегородский госуниверситет им. Н.И. Лобачевского

а11к123 @уа^ех. ги

Поступила в редакцию 25.04.2013

Рассматривается задача оптимального управления в КВ-линеале с единицей. На основе метода Тихонова строится регуляризирующая последовательность. Приводятся условия её порядковой сходимости к оптимальному множеству управлений в КВ-линеале ограниченных элементов.

Ключевые слова: оптимальное управление, КВ-линеал, регуляризация, порядковая сходимость.

Введение

В работе рассматривается задача минимизации функционала при операторном и функциональных ограничениях на состояние х и управление и . Пространство управлений и здесь -КВ-линеал с единицей е. Отметим, что к такой постановке приводят многие задачи оптимального управления, в которых банахово пространство управлений является и полуупорядоченным пространством, например, задача оптимального управления для динамической системы с интегральными ограничениями и интегральным целевым функционалом, в которой и = Щ^, Ч ], а за е берётся вектор-функция е(1) = (1,1,...,1)г . Как известно [1], в КВ-линеале с единицей можно ввести КВ-линеал е-ограниченных элементов и,. При этом из сходимости в и, следует сходимость в и к тому же пределу, что означает более сильную метрику в и,, чем в и. Если для оптимального множества и0 управлений исходной задачи будет Ц, П и0 Ф0 , то целесообразно строить минимизирующие последовательности, сходящиеся ко множеству и0 в метрике и,. В этом случае возможно сужение пространства управлений, например, до ие. Так, при и = Щ^, ^] подлинеал

и, = [^, tl], и сходимость в ие будет почти

всюду равномерная. Но при замене пространства и на и' возникает вопрос о корректности исходной задачи оптимизации в и,. Это связано с тем, что хотя в и корректность может быть, но в более «узком» пространстве и, она отсутствует [2]. Тем более подобное относится

к случаю, когда в U задача оптимизации некорректна. Для некорректных задач оптимизации разработаны методы регуляризации [2]. В настоящей работе на основе метода А.Н. Тихонова приведены условия порядковой сходимости в Ue регуляризирующей последовательности, а также е-ограниченности оптимальных управлений. Отметим, что такая усиленная (в порядковом смысле) регуляризация получена без стабилизатора.

Порядковая ограниченность оптимального множества

Рассматривается 0-задача: g0(x, u) ^ inf,

F(x, u) = 0, gj (x, u) < 0, x e X, u e U, j = 1, n. Здесь операция F: X x U ^ Z , где X, Z - банаховы пространства, а U является KB-линеалом с единицей е. Функционалы g0, gj и

операция F класса С1 определены на XxU . В дальнейшем будем называть U пространством управлений, а X - пространством состояний. Пусть для всех u e U уравнение F(x, u) = 0 имеет единственное решение x = x(u) класса

С1. Такое, в частности, будет при выполнении условий теоремы о существовании неявной функции в банаховом пространстве. Тогда 0-задача сводится к задаче минимизации функционала g0( x(u), u) с ограничениями

gj (x(u),u) < 0, j = 1, n, u eU . Очевидно, все функционалы gj (x(u), u) для j = 0, n непрерывны и принадлежат классу С1 на U. Предположим также, что D ^ 0, где D - допустимое множество управлений в 0-задаче, и суще-

ствует некоторое множество S с U, для которого D с S. Например, такое S может быть получено на основе одного из неравенств gj (x(u),u) < 0.

Обозначим U0 множество оптимальных управлений в 0-задаче, и пусть U0 ^ 0 . Достаточные условия этого имеются, например, в [2]. Очевидно, для оптимального управления u e U оптимальное состояние x0 = x(u0).

Исходная 0-задача может быть некорректна в пространстве U или в более «узком» подпространстве Ue при наличии дополнительной информации об оптимальном управлении, в частности, его ограниченности. Поэтому здесь применимы методы регуляризации, например, метод А.Н. Тихонова [2] с его функцией Tk (x(u), u) = = g 0( x(u), u) + a k ю^при u eU и k > 1, где функционал ra(u) > 0 и принадлежит классу С1 на U, а числовая последовательность ak ^ +0. Введём k -задачи: Tk (x(u), u) ^ inf ,

gj(x(u),u)< 0, j = 1,n,u eU.

Пусть, теперь, gj (x, u) = aj (u) + bj (x, u) для j = 0, n, где aj (u), bj (x, u) - некоторые функционалы класса С1 на XxU. Предположим также, что сопряженное пространство U * является KB-линеалом с единицей a. Введём Ua -KB-линеал a-ограниченных элементов в U*. Обозначим || • || норму в Ue, а || • || - норму в

Ua. Их определение имеется в [1], и по [1] из сходимости последовательности в Ue следует её сходимость в U к тому же пределу. Аналогичное же относится и к Ua. Поэтому функционалы gj(x(u),u), ra(u), при j = 0,n непрерывные в U, будут непрерывны и в Ue. Обозначим |u | модуль элемента u eU, а числом d0 - inf в 0-задаче и {v^ } - подпоследовательность последовательности {vk}. Введем для u eU„

существует {sk }, для которой limpe (sk, Q) =

m k

= limpе(sk ,Q). В силу компактности {sk} счи-

km m

таем для удобства обозначения {sk } сходящейся

к некоторой предельной точке v = lim sk в Ue.

km m

На основе условия леммы v e Q. Нетрудно уста-

новить

неравенство:

pe (Skm , Q) =

= ІПР и Не <11 -V.Но 1Іт|1 у Не=0-

иєО к Кт

^ т

ТогДа 1}т ре (Хкт , 0 = 0 , и поэтому 1Іт Ре (5к, О) =

кт к

= 1Іт Ре (5кт,О) = 0 • Поскольку 0 < 1ітре (5к, О) <

кт к

< 1іт ре (5к, О) = 0 , то получаем 1іт ре (5к, О) =

к к

= 1іт ре (5к,О) = 0 . Отсюда 1іт ре (5к,О) = 0.

к к

Лемма доказана.

Обозначим иае множество е-ограниченных оптимальных управлений и0 в 0-задаче.

Теорема 1. Пусть 1) существуют числа ц, у > 0, для которых при у = 0, п и всех и є £ модули | а',„ (0) |< ца и | Ь',и (х(и), и)|<уа ; 2) существует линейный оператор В > 0 : и * ^ и с

0 < Ва < Ре для некоторого числа Р > 0 и такой,

п

что при всех и, V є £ для чисел Ху > 0 с ^=1

у=0

будет | и - V |< В | Фи (и, X) -фи (V, X )|, где

п __

ф(и, X) = а у (и) и вектор X є Яп+1.

у=0

Тогда и° ^ 0 и | и0 |< (у + ц)Ре , а любое

и0 є ие •

Доказательство. Введём функцию Лагранжа

п

Ь(х(и),и, X) = ^Ху (ау (и) + Ьу (х(и),и)). Тогда по

у=0

[3] для любого и0 є и0 существуют множители

и множества

Ре 0=^ IIй - У ||е .

уеб

Лемма. Пусть последовательность {як} с ие и компактна в ие, а любая её предельная точка

V е ° с ие. Тогда НрРе^,0 = 0.

к

Доказательство. Так как ре ^к, 0 > 0 , то 0 < - ре ^к, 0 По определению верхнего предела

Q с Ue расстояние > 0 с ^X0°. = 1, для которых L'u (x(u0),u0,

j=0

_0 ______________________________0

X ) = 0 . Отсюда ФU К, X ) = -^XO^' u (x(u0), uo) .

j=0

Поскольку u0 є S , то по условию 1) Ъ'. (x(u0),

j,u V \ 0)

f n Л

u0) є Ua. Поэтому

,u (x(uoX u0)

j=0

eU *.

k

Тогда и ф«(u0,X )eU*. На основе условия 1) получаем неравенства

( n \

0

|Ф: (0, A,°)|<£x“ x | a'j u (0)|< Xх-Ц

j=0

V j=0

a = ца

и

Iф«(«0,X0)l <XX°j1 j(x(u0),u0)|<

j=0 ( n \

Z X0 t

j=0

a = ya.

Используя же условие 2) доказываемой теоремы, выводим неравенства

Iu0 |<В|ф«(u0,X0)-ф«(0,X0)|<

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< ж|ф: («0, x0) i+1 ф« (0, x0) i) <

Xх0 (T + ц)

j=0

Ba.

Lk (x,« X) = X0 x Tk (x, u) + Xх jgj (x,u)

j=1

с X = (Xj )in=0 и

n

0k (u,X) = X0a0,k (u) + XXjaj (u) ,

j=1

линейный оператор С >0: и * ^ и с 0< Са <

< £,е для некоторого числа ^ > 0, такой, что при

всех u, v e S и X e Ли+1 с XX . =1 и X. > 0

jj

име-

j=0

ем неравенство

I u - v|< С I 0k,: («, X) - -0'k,: (v, X) I . Тогда I) u° e Ue, и модуль | u° |< (y + q^e ; II) limg0(x(«l),ul) = d0, и {u° } — минимизи-

Но так как 0 < Ва < Ре и I X". =1, то 1 и0 |-

.=0

< (у + ц)Ре. Отсюда и0 будет е-ограниченным. Таким образом, множество и ^ 0, и любое оптимальное и0 е и° . Теорема 1 доказана.

Замечание 1. В теореме 1 приводятся условия, когда и0 с и е и содержится в некотором порядковом отрезке, или е-ограниченность оптимальных управлений 0-задачи, а также условия локализации области поиска и0. Отсюда возможно построение минимизирующих последовательностей в более сильной метрике пространства ие .

Обозначим а0 к (и) = а0 (и) + ак ю(и). Тогда Тк (х(и), и) = а0 к (и) + Ь0 (х(и), и). Введём при к > 1 функции Лагранжа

рующая в 0-задаче; III) для всех k > 1 значение

ю(м°) < inf ю(«0).

«0eU0

Доказательство. Поскольку условия теоремы 2 аналогичны условиям теоремы 1, то доказательство I) проводится также аналогично. Докажем II). Имеем неравенства:

d0 < g0 (x(uk0 X «1 ) < g0 (x(uk0), «1) + ak®(uk°) =

= Tk (x(uk0), uk0) < Tk (x(u0), «0) = (2)

= g0 (x(u0),u0) + akю («0 ) = d0 + akю (u0).

Из (2) d0 < g0(x(u°),u°) < d0 + akю(«0). Тогда

lim g0(x(u°),u°) = d0 при ak ^ +0, и { «0 } будет

k

минимизирующей в 0-задаче. Из (2) получаем

g0(x(uk0), uk0) + ak®(uk0) < d0 + akю(«0). Но d0 < < go(x(uk0),uk0). Тогда ak®(uk0) <akю(«0) и

ю(«0) <ю(«0). Отсюда ю(«0) < infю(«0). Тем

«0eU0

самым установлена справедливость III), и теорема 2 доказана.

Теорема 3. Пусть выполнены условия теоремы 2, и для всякой {vk} с S и j = 0, n последовательность {bj« (x(vk),vk)} компактна в U*.

Тогда {«0} компактна в Ue, а любая её предельная точка v eUe .

Доказательство. Поскольку {«0} с S , то на основе условия теоремы 3 получаем компактность {bj« (x(«0),«0)} в U*. Согласно [3]

существуют

0<X0 с YX0.„=1.

для которых

р( х, и, X) = IX Ь. (х, и).

.=0

Очевидно,

Ьк (х, и, X) = 0к (и, X) + р(х, и, X). (1)

Теорема 2. Пусть выполнены условия теоремы 1 и 1) в любой к -задаче существует оптимальное управление и° ; 2) существует число "Л >0, для которого при . = 0,п и всех и е £ модули 1 а0,к „(0)1,1 (0)|<Ла; 3) существует

Xk с X X j,k

j=0

Lk,«(x(«k0),«k0, X) = 0. Отсюда 0;,«(«“, X) =

ик,и^\сгк^1Лк^^и ^ ^к,и\1г^/^к>

= -ри (х(и°), и°, XI). Так как 0 < X” к < 1, то нетрудно установить компактность {-р’и (х(и°), и°, )>.,0к)} в иа, а с ней и компактность {0'к,и(и0,X)} в и*. Обозначим и =0к,„(и°к,X). Тогда {ик} с и* и компактна в и*. На основе неравенства условия 3) теоремы 2 получаем | и°к - иат |< С | ик - ит |. Для компактности {и°}

в ие достаточно показать, что у всякой ее {и° } существует сходящаяся в Ц подпоследовательность. По компактности {ик} для {ик } существует {ик, }, сходящаяся в и*, которая, оче-

Зт

видно, будет фундаментальной в и*. Тогда для всякого числа е > 0 существует такой номер N что при всех к. к. > N получаем

I ик - и, |<е* . Следовательно, | и° - и° |<

.т1 .т2 .т1 .т2

< С | и, - и, |< еС* < е^е, так как 0 <

Jm1 .т2

< С* < Е,е для некоторого числа ^ > 0, что доказывает фундаментальность {и° }в Ц и, тем

Зт

самым, ее сходимость в ие . Таким образом, {и°} компактна в Ц, а все её предельные точки принадлежат Ц. Пусть V - любая предельная точка для {и°}. Тогда существует {и°т} с Нш и0к = V в ие. По непрерывности функцио-

кт

налов (и), Ь (х(и),и) в ие при 1 = 0,п полу-

чаем при кт ^ да сходимости

*1 (<) ^ *1(v),

Ь. (х(и1т ), и0т ) ^ Ь (X(V), V).

Так как я. (х, и) = (и) + Ь. (х,и), то я. (х(и^),

и°т) ^ Я. (x(v), V). Но поскольку верны неравенства gJ (х(и°т ), и° ) < 0 при 1 =1,п , то в пределе Я. (х(у), V) < 0 . Следовательно, любая предельная точка V - допустимое управление в 0-задаче.

По теореме 2 {и° } - минимизирующая в 0-задаче. Тогда {и° } - тоже минимизирующая. Из непрерывности функционала я0( х(и), и) и Нш и° =

кт т

= V в КВ-линеале Ц получаем Нш я 0(х(и° ),

кт т

и1т ) = Л0 . Но Я 0 (х(ик“т X ик°т ) = (x(v), v) .

кт

Отсюда я0(x(v),V) = d0. Так как предельная точка

V является е-ограниченным допустимым управлением в 0-задаче, то V будет оптимально в ней. Следовательно, V е Ц . Теорема 3 доказана.

Порядковая сходимость регуляризирующей последовательности

Теорема 4. Пусть 1) выполнены условия теоремы 3; 2) для всех к > 1 существует vк е D

при (у -и°к) е ие и IV -и°|| < 8к, где 8к ^ +0.

Тогда А) последовательность {vк} с Ц, компактна в ие , а любая её предельная точка

v еие0; В) Нш Ре (ик0,ие0)= Иш Ре (vк ,ие0) = 0;

С) ^шЯ0(x(vк),Vк ) = Л0 .

к

Доказательство. По теоремам 2, 3 и° е Ц и {и°} компактна в ие, а любая её предельная точка и еие ^0. Из условия 2) теоремы 4

(ук - и°к) е ие и IV - ик°[ <8к с 8к ^+0. Тогда

{vк} с ие и 1iш II vк - и°к ||е = 0 . Отсюда {vк} ком-

к

пактна в Ц, а все ее предельные точки V совпадают с предельными для {и°}. Тогда V еи°, и тем самым А) доказано.

Используя А) и применяя лемму для случа-

00 ев 5к = и и 5к = Vк для множества 0 = ие , получаем Ншре(ик’Ц0) = Нш.ре(vк,и°) = 0, что и & & доказывает В).

По доказанному в А) последовательность {V} с Ц и компактна в Ц, , а любая её предельная точка V е и, . Тогда для V существует

V}с \ у в ие, а по [1] Икш Уь = у и в

1 к. 1 к. 1

и. Из непрерывности функционала я0(х(и), и)

получаем Я0(x(v), у) = Нт Я0(х(Ук X ук,). Но так

к. 1 1

как по А) V еи°е, то я0(x(v),V) = Л0. Отсюда имеем компактность последовательности {Я0( x(vk), vк)} и, как нетрудно установить, число Л0 есть ее единственный частичный предел.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Следовательно, Нш я 0 (х(у ), vk) = Л0. Таким

к

образом, верно С), и теорема 4 доказана.

Замечание 2. Приближение V, можно получить каким-либо методом минимизации. Из теоремы 4 получаем усиленную регулярность в Ц минимизирующей {и°}. Тогда с учетом терминологии [2] такую регулярность в ие можно назвать е-регулярностью.

Рассмотрим минимизацию функционала ш(и) на и0. Введём число шп = inf ш(и). По-

иеи0

скольку ш(и) > 0, то существует шп > 0. Оп-

0

ределим ш -нормальное решение ип е и 0 как

ю(иП) = шп. Если же иап е и,, то иап назовем

т т0

©е -нормальным решением, а иеп - множеством ш -нормальн^1х решений.

Теорема 5. Пусть выполнены условия теоремы 4. Тогда U°n ^ 0, и любая предельная в

Ue точка последовательностей {u°}, {vk} принадлежит Uen, и

1ЙП pe (uk0,U"n ) = lim pe (vk Kn ) = 0.

kk

Доказательство. Согласно теоремам З, 4 {u° }, {vk} компактної в Ue, а любая их предельная точка принадлежит U°. Пусть up - любая предельная точка для {u°}. Тогда существует {u^ }, такая, что lim u I = u в U . Поскольку по [1] из

, km p е ^

km

сходимости в Ue следует сходимость в U, то существует lim u° = up в U. Из непрерывности

km m

функционала ra(u) в U получаем lim ra(u° ) =

km m

= ra(up). На основе заключения III) теоремы 2 ra(u° ) < inf ra(u0). Тогда в пределе ra(up) <

UqEUq

< inf ra(u0) = an. На основе теоремы З up є U°.

UqEUq

Отсюда ra(up) = ю„. Следовательно, любая для {u°} предельная точка up будет e-ограниченным ю-нормальным решением. Поэтому U°e„ ^0 , а up є U°en. По условию теоремы 4

u, - v.

< S, , где S, ^ +0. Тогда lim II u° -

-V, ||е =0. По заключению А) теоремы 4 {ук} с Ц и компактна в Ц. Тогда нетрудно показать, что {у } имеет такие же предельные точки, как и {и°} . Отсюда все предельные точки

для {у} принадлежат и°п. Применяя лемму для

00 случаев s'k = ик, s'k = Vк и множества 0 = иеп,

получаем НкП Ре (и° , ие0п ) = 0, НкП Ре (и° , и1п ) = °.

Теорема 5 доказана.

Вышеизложенная теория порядковой регуляризации применима к 0-задаче оптимального управления:

*1

g0( x, u) = J(a 0 (u, t) + b0 (x, t)) dt ^ inf,

*0

x = Л( x, t) + B(t )u, x(t0) = x0, t e[t0, tj], (3)

<1 __________________________________

gj (x, и ) = J (a^ (u, t) + bj (x, t)) dt < 0, j = 1, N,

t0

где состояние xe X = С([t0,t1],^m), управление u e U = Ln2[t0, t1], а все функции, входящие в задачу (3), достаточно гладкие. Здесь вектор-функция e(t) = (1,1,...,1)T является единицей е

в KB-линеале L2 [t0, tj. Функционал ю(«) мож-

II ||2

но взять, например, как ю(«) = « в L2 [t0, t1]. В работе [4] приведены условия на функции задачи (3), при которых применимы теоремы 1-5. В частности, это сведение дифференциальной задачи к интегральной форме, ограниченность по норме в Ln2[t0, t1] допустимого множества

управлений и непрерывная дифференцируе-

t1 t1

мость функционалов J ay (u, t)dt и J bj (x, t))dt

t0 t0

при j = 0,N. Для U = L2 [t0, t1] пространство Ue = L” [t0,t1]. Поэтому сходимость регуляризи-рующей последовательности будет в L”[t0, t1], то есть в более сильной метрике по сравнению с

Lb2[<0, a

Список литернтуры

1. Вулих Б.З. Введение в теорию полуупорядо-ченных пространств. М.: Физматгиз, 1961. 407 с.

2. Васильев Ф.П. Методы оптимизации. М.: Факториал пресс, 2002. 824 с.

3. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988. 280 с.

4. Калашников А.Л. Аппроксимация и ограниченность оптимального множества управлений для динамической системы // Вестник ННГУ. Математическое моделирование и оптимальное управление. 2003. Вып. 1(26). С. 138-141.

e

ORDINAL REGULARIZATION IN AN OPTIMAL CONTROL PROBLEM

A.L. Kalashnikov

An optimal control problem in a KB-lineal with unit e is considered. Based on the Tikhonov method, a regularizing sequence is built. The conditions of its order convergence to the set of optimal controls are given in the KB-lineal of e-limited elements.

Keywords: optimal control, KB-lineal, regularization, order convergence.

i Надоели баннеры? Вы всегда можете отключить рекламу.