Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, N9 3 (2!), с. 67-71
УДК 519.6
АППРОКСИМАЦИЯ И ОГРАНИЧЕННОСТЬ МНОЖЕСТВА ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ
© 2011 г. А.Л. Калашников
Нижегородский госуниверситет им. Н.И. Лобачевского
Поступила в редакцию 25.12.2010
Рассматривается задача оптимального управления в КВ-линеале. Для этой задачи имеется последовательность конечномерных аппроксимирующих £-задач. Приведены условия порядковой ограниченности оптимальных множеств исходной задачи и £-задач и усиленной сходимости оптимальных управлений £-задач к оптимальному множеству исходной задачи.
Ключевые слова: оптимальное управление, линеал, порядковая ограниченность, сходимость,
аппроксимация.
Введение
В статье рассматривается задача минимизации функционала при операторном и функциональных ограничениях. Пространство управлений U здесь - КВ-линеал с единицей e. Такая постановка имеет место, например, для задачи оптимального управления динамической системы с интегральными ограничениями и интегральным критерием качества в пространстве U = LP [a; b]. К исходной задаче имеется последовательность k-задач, полученных при аппроксимации пространства управлений подпространствами Uk с U. Приведены условия, когда оптимальное множество управлений исходной задачи будет e-ограничено (в смысле порядка), а оптимальные управления u0 для k-задач принадлежат Ue, являющимся КВ-линеалом e-ограниченных элементов. Установлена сходимость и0 в метрике Ue к оптимальному множеству управлений исходной задачи. Тем самым достигается регулярность в смысле работы [1] этой последовательности в более сильной метрике, чем в исходном пространстве управлений U, и она получена здесь без стабилизатора.
Порядковая ограниченность оптимального множества
Рассматривается 0-задача: g0 (x, u) ^ inf,
F(x,u) = 0, gj (x, u) < 0, x є X, u є U, j = 1, n.
Здесь операция F: X х и ^ Z, где X, Z - банаховы пространства, а пространство и является КВ-линеалом с единицей е. Функционалы g0, и операция Г класса С1 на X х и. Далее назовем и пространством управлений. Пусть в 0-задаче допустимое множество не пусто и существует оптимальная пара (х0, и0) - точка минимума, а для всех и в и уравнение ^(х, и) = 0 имеет единственное решение х = х(и) класса С1. Тогда х0 = х(и0). Предположим, что допустимые управления принадлежат некоторому множеству S с и, которое, например, может быть получено на основе одного из неравенств ^.(х, и) < 0 . Введем функцию Лагранжа
п
Ь(х, и, X) = ^ Xу.gj (х, и) с множителями X .,
} = 0
] = 0, п, и Х = (X0,Х1,...,Xп )т. На основе [2] суп
ществуют числа А,° > 0 с ^ X° = 1, такие, что
У=0
полная производная по и
К СФо)»«о>) = 0.
Пусть сопряженное пространство и * есть КВ-линеал с единицей а. Введем ие - КВ-линеал е-ограниченных элементов в и, а и* -
КВ-линеал а-ограниченных элементов в и *. Обозначим || • ||е норму в ие, а || • \\а - норму в
и*. По [3] получаем, что сходимость после до-вательности в ие влечет и сходимость в и. Да-
лее | • | - модуль элемента. Предположим теперь, что для всех у = 0, п функционалы
g . (х, и) = а .■ (и) + Ь . (х, и), (2)
с ^ Х j = 1 верно неравенство:
j=0
1 u - v ^ В 1 qU (u,І) - qU (v,І)|
j=0
том равенства (І) получаем
—0 n
qU (uo > ^ ) = -Z (x(uo )> uo),
j=o
n
где А0- > 0 и ^ Я® = 1. Полагая в (4) u = u0
J=°
v = 0, имеем неравенство
\ uo \< B \ qU (uo > A°) - qU(0, А)!.
где а] (и), Ъ] (х, и) - некоторые функционалы класса С1 на X хП. Введём функционал
q(u, X) = ^Xу.ау. (и) , и є и , X j є Л1, у = 0, п • (3)
Теорема 1. Пусть 1) для всех и є 5 функционалы Ъ)и (х(и ), и ) є и; и а),и (0) єи*а, где 7 = 0, п; 2) существует оператор В > 0: и * ^ и с Ва є и , такой, что при всех и,V є и и X . > 0
К(0,Х0)|<Xад*(0)|< £Х>. а. (8)
У=° V } =0 у
Тогда из (6), (7), (8) получаем оценку
!“о !<В( |?;(и0,^)\ + \д'и(0,Х°)| )<
( п Л
< 2 ^(^у+а >) Ва- (9)
V)=0 )
Но по условию 2) теоремы 1 Ва е ие. Тогда существует число 5 > 0, для которого 0 < Ва < < Ъе. Отсюда из неравенств (9) имеем оценку:
( п \
Z(и j+а j)
(Ю)
(4)
Тогда а) всякое оптимальное и0 в 0-задаче е-
ограничено. Если же выполнено дополнительное условие 3): существуют числа а, ^, Р> 0, такие, что 0 < Ва <ре, | и (х(и), и)\<^а,
| а ’ ] и (0) |< а а при у = 0, п и всех и е 5, то верно
б): | и0 |< (и + а)Ре.
Доказательство. С учетом (3) имеем
_ _ п
Ь(х, и, X) = д(и, X) + ^ XД. (х, и). Отсюда с уче-
Следовательно, и0 в 0-задаче е-ограничено и
утверждение а) доказано.
Докажем теперь б).
Пусть | й'. и (х(и),м)|<^а и | а'-м(0)| <аа для некоторых чисел а, ц > 0 и всех и є 5, а также
0 < Ва < р е для некоторого числа р > 0 • Тогда, полагая в (10) 6 = р, ^ ^, а] = а, получаем
П
| и0 |< р(ц + а)е, так как ^ = 1. Теорема 1 до-
Ыо
казана.
Последовательность k-задач
Но и0 е 5. Тогда по условию 1) теоремы 1 будет Ь ,и (х(и0), и0) ей*. По свойству а -
ограниченности существуют некоторые числа ^ . > 0, для которых | и (х(и0), и0 )|<^}а . Используя равенство (5), получаем с оценкой по модулю
—0 ” П
I ч'и(ио>^ ) 1^ XI Ъ’},и(х(и0),мо) 1^ (XV]>■ (7)
}=0 ]=0
Поскольку а^ и (0) еи*а, то по а-ограничен-ности существуют некоторые числа а. > 0, такие, что | а'],и (0) |< ау-а при у = 0, п. С учетом (3) имеем неравенства:
1. Пусть имеются некоторые банаховы под-
(5) пространства Uk е U при k = 1,2, с такой же
нормировкой, как и в U. Рассмотрим k-задачи: go (X, и) ^ inf
F(x, и) = 0 , g j (x, и) < 0 >
x e X, u eU t, j = 1, n. Предположим, что в каждой k-задаче допустимое множество не пусто и существует оптимальная пара (х0, и0) - точка минимума. Оче-
(6)
видно, х0 = х(м0) и все и\ є S. На основе [2]
существуют множители Я0. k > 0 с L ^ = 1,
j=о
для которых полная производная по u
■° )-■0^^) = О (ІІ)
К сx(«0), «0, ^0k) = О.
Здесь = (Х°од, Х°1ДХ°иД)Т . Далее ком-
пактность множества понимается на основе [4].
Теорема 2. Пусть выполнены условия 1), 2) теоремы 1. Тогда а) для всех к > 1 управления и 0 будут е-ограниченными, а при выполнении
e
о
n
n
условия 3) теоремы 1 для всех к > 1 будет выполнено неравенство |м0| < (ц + а)ве.
Доказательство аналогично доказательству в теореме 1 с учетом и\ е S .
Будем говорить, что k-задача аппроксимирует 0-задачу по функционалу, если существует
lim dk = d0, где dk есть inf в k-задаче при k > 0 .
k
Теорема 3. Пусть выполнены условия 1), 2) теоремы 1 и 1) для всех j = 0, n и любой последовательности управлений vk е S последовательность bj u (x(vk), vk) компактна в U* ; 2) k-задачи аппроксимируют 0-задачу по функционалу. Тогда последовательность u<0 е Ue и компактна в Ue, а ее предельные точки будут е-ограничены и оптимальны в 0-задаче.
Доказательство. По теореме 2 получаем, что и0 будет е-ограничено и, следовательно,
U . Из равенств (11) и (2), (3) выводим ра-
uk є ~ e
венство
qU (u0, 4) = -Х j b'jU (x(u0), u0), (12)
j=0
то
где > 0 и X Х°,к = 1. Поскольку е £ по условию (1) теоремы 3 имеем компактность
___ П
Ъ),и (х(м°),4) в и* при 7 = оТП. Но X7 =1 и
7=°
д > 0. Поэтому 0 < А°Лк < 1 и А°Лк будет для 7 = 0, п компактна в Я1. Отсюда получаем компактность А® д Ъ']>и (х(и0), и0) в и а, ас этим и компактность в и а суммы - правой части (12). По равенству (12) имеем компактность д, (и0, А0) в и*а. Используя условие 2) теоремы
1, нетрудно установить, переходя к сходящимся
.0 ->0
в U * подпоследовательностям qU (u^, Xukm),
о
компактность последовательности ик в ие.
Пусть теперь у0 - любая предельная точка для
и?. Тогда существует Нши0кт = у0 в ие. Следок кт
вательно, у0 е ие. Так как из сходимости в ие по теории полуупорядоченных пространств [3] следует и сходимость в и, то Нт и°п = у0 в и. Из
km
непрерывности операции x = x(u) в U получаем lim x(uL) = x(v0) в X, а по непрерывности
km
gі (X, и) из ), ) < 0 с 7 = 1, п получа-
ем в пределе (х(у0), У0) < 0 . Поэтому У0 - допустимое управление в 0-задаче. Но так как к-задачи аппроксимируют 0-задачу по функцио-
нал^ то ^ ^ при dkm = (х(ы0кт), ит).
кт
По непрерывности g0(х,и) будет сущест-
вовать Ііт go (х(и^), икт) = go (х(уй), ^). Тогда
кт
g0 (х(у0), у0) = d0. Но допустимо в 0-задаче. Отсюда у0 оптимально в 0-задаче. Теорема 3 доказана.
Теорема 4. Пусть выполнены условия теоремы 3 и для всех к > 1 существует аппроксимация Ук є и к с Ук - ик єие и || ик - Ук ||е <гк, где числа ^ 0. Тогда последовательность ук еЦе, компактна в ие, а ее предельные точки е-ограничены, оптимальны в 0-задаче, и предел
Ііт go (х(ук), ук) = d0.
к
Доказательство. Из выполнения условий теоремы 3 по этой теореме получаем компактность и0 в ие с предельными точками, являющимися оптимальными управлениями в 0-задаче. По неравенству ||и0 - ук|| <гк с єк ^ 0
имеем компактность ук в ие и такие же с и\ предельные точки. Из аппроксимации 0-задачи
^-задачами получаем Ііт g0(х(и<0),и0) = d0. Но
к
функционал £0 (х(и), и) непрерывен в и, а сходимость в ие влечет сходимость в и. Отсюда, по компактности ук в ие, а следовательно и
в и, с учетом Ііт g0 (х(м°), ик) = d0 нетрудно
к
уже показать, что будет существовать
Ііт g0 (х(ук), ук) = d0. Теорема 4 доказана.
к
2. Обозначим множество е-ограни-
ченных оптимальных управлений в 0-задаче, а Ре (и, в) = іпґ II и - V ||е - расстояние между эле-
УЄ<2
ментом и є ие и множеством Q С ие.
Теорема 5. Пусть выполнены условия теоремы 4. Тогда множество и°е ^0, и имеем равенство пределов 1іт(ре (м0, и0) = Ііт ре (ук ,иЄ) = 0.
к к
Доказательство. Поскольку в условиях теоремы 4 представлены условия теоремы 1, то по ней получаем е-ограниченность оптимальных управлений и0 в 0-задаче. Следовательно,
n
n
и0 е ие. Поэтому множество и'0 Ф0 . Из теоремы 4 управления ук е Це и последовательность компактна в ие, а любая ее предельная точка V принадлежит Ц0. Аналогичное же утверждение на основе теоремы 3 будет и для последовательности . Применяя теперь основные леммы о регуляризации [1] в пространстве ие, получаем равенства пределов
Ит(ре(и°к ,и°е) = Нтре(ук,и°е) = 0 . Теорема 5
к к
доказана.
3. Приведем теперь достаточные условия аппроксимации 0-задачи последовательностью к-задач. Обозначим через допустимое множество управлений в 0-задаче. Пусть Д0 ^ 0
для к > 1. Тогда Вк = Б0 п ик - допустимое
множество управлений в ^-задаче. Очевидно, для к > 1 будет Бк с Б0. По непрерывности исходных функционалов gi (х, и) и операции х = х(и) множество замкнуто в и, а с ним и все Вк.
Теорема 6. Пусть 1) существует множество Р с Б0, и замыкание Р = Ц0; 2) для любого к > 1 существует отображение Qk : р ^ вк; 3) для всякого V е Р верхний предел
Ит(g0 (х(0,к (V)), 0,к (V)) - go (х(у), V)) < 0 . Тогда
к
Пт (Зк = <30, и ^-задачи аппроксимируют 0-
к
задачу по функционалу.
Доказательство. Из условия 2) теоремы 6 получаем, что для любого V е Р будет
бк (V) е вк. Тогда (!к < (^0 (Хйк МЩ (V))), и получаем неравенства
4к- < (^о(х(<2к 0)Щ (V)))- <
< (gо (х(вк (У)),йк (У))) - gо ООХv) + gо ООХv) - dо • Переходя к верхнему пределу, имеем на основе условия 3) неравенства:
Нт(йк - йо) < Нт(gо (х{(2к (V)), 0 (у))-
к к
- gо(х(у \ у)) + (gо(х(у \ у)) +
+ (gо(хОХу) - йо) < gо(х(у\у) - йо • (13)
Поскольку V е Р с Д0 и Р = Ц0, то для любого элемента ^ е существует сходящаяся последовательность ут ^ я в и, где гт е Р. Тогда по непрерывности g0 (х(и), и) предел Пт g0 (х(ут), ут) = ^0 (х0Х . Но для ут е Р
т
имеем по (13) Мт(ёк - ёо) < g0 (х(ут), Ут)- , и
к
в пределе lim(dk - d0) < g0 (x(s), s) - d0 • Нетруд-
k
но установить неравенство:
lim(dk - d0) < inf g0 (x(s), s) - d0 = d0 - d0 = 0. (14)
Но Dk с D0. Поэтому для любого v e Dk будет d0 < g0 (x(v), v). Отсюда для всех k > 1 будет d0 < inf g0 (x(v), v) = dk. Следовательно,
v^Dt
dk - d0 > 0. Поэтому с учетом (14)
0 < lim(dk - d0) < lim(dk - d0) < 0 и, тем самым,
k k
lim(dk - d0) = lim(dk - d0) = 0 . Тогда существу-
k k
ет lim(dk - d0) = 0, а из него lim dk = d0. Теоре-
k k
ма 6 доказана.
Следствие. Пусть в U существует линейнонезависимая система из элементов sj е U, где
j = 1,2,... и 1) для всех к > 1 множество Uk - линейная оболочка для s2,..., sk ; 2) замыкание
ж
U Uk = U; 3) норма IIU < const для всех u e D0,
k=i
и D0 n Ul ^0 . Тогда lim dk = d0.
к
Доказательство. На основе [4] множества Uk будут конечномерными банаховыми подпространствами в U . Так как Uk с Uk +1, и по условию 3) D0 п их ^0, то для всех к > 1 будет Dk = D0 n Uk ^0. Поскольку по условию 3) множество D0 ограничено по норме и Dk с D0,
то все Dk тоже будут ограничены по норме одной и той же константой. Как известно из [4], всякое ограниченное по норме множество в конечномерном Uk будет компактно в U. Но Dk с Uk и ограничено по норме. Тогда Dk будет
компактно в U. По замкнутости множеств D0 и Uk имеем и замкнутость Dk = D0 n Uk. Введем
для всякого фиксированного элемента и eU функционал: f (v) =| u - ^| для всех v e U . Так
как множество Dk замкнуто и компактно в U, а функционал f (v) = ||и - V для фиксированного u
непрерывен в U, то по известной теореме Вей-ерштрасса о минимуме непрерывного функционала на компактном и замкнутом множестве существует элемент vk е Dk, который является точкой минимума для f (v) на множестве Dk. Определим для всех k > 1 отображение Qk (u) = vk, где vk - любая из точек минимума
функционала f (V) на множестве Бк . Очевидно, ‘1
&(«) = и для » е Д. Введём множество ^(Х’М) = 1 ((М) +Ь(х’0) ^М’ (15)
‘о
Р = и Д с йк = О0 пик. Тогда р = В01Г и ик']. х(0_ А(х> О + в()и, х(/о)_ х0, / е [/0, ^],
к=1 ук=1 ) Ч
(~ ^ gj (х, и) = | ( (м, () + Ъj (х, / )) < 0, } = 1п,
Отсюда P с D0 и р = D01
ГО
U ик
к=1 V У
. Но так как
‘о
где состояние х е С ([?0, /1], Ят), управление
В0 = Д и 0 ик = и, то Р = Д,. Пусть теперь м е £2[?0, ?! ], А(х, t) = (А (х, t)) является вектор-
к = 1
элемент V € Р . Тогда существует номер к = к0 , функцией, а В(() = (Вг;р ()) есть матрица разме-для которого у е Д . Но поскольку ик с ик+1, ра т х 5. Предполагается также, что функции
то Д = Д п ик с Д п ик+1 = Д+1. Поэтому А(х,), аУ(м’^, Ъ(х*), Где г =т , а ^ °п,
V е Д для к > к0. Но (и) = и для любого класса С1 для всех х е Я , и е Я , / е[/0,и
и е Д. Отсюда а (V) = V при к > к,, и для В‘,р непрерывны на [?с, . Заменим диффе-
ренциальное уравнение на интегральное:
V € Р существует в и предел 11Ш Qk (V) = V . То- ^ I
гда по непрерывности функционала g0(х, и) и ^(х’и) - х - хо -|(А(х’+ В($)и(э)№ - 0,
операции х = х(и) получаем, что предел “
Л / е[/0,. Отсюда получаем 0-задачу оптималь-
11т gо (А<2к (V)), & (V)) = gо (х(у), V). Отсюда для
к ного управления с интегральными ограничени-
V е Р верно равенство ями. В работе [5] приведены условия примени-
Нт( g 0 (х^к (у)), Qi (у)) - g 0 (х(у)), у)) = мости вышеизложенной теории статьи к задаче
к (15).Тогда для пространства управлений
= ^т(g0 (X(Qk (у))’Qk (у)) - g0 (х(у)’у)) = ^2 [?о, ^1 ] и системы элементов ^ j из вектор-
Тем самым выполнены условия теоремы ^ и функций многочленов при е, равной единич-тогда по ней Игп dk = (^о. Следствие доказано. ной вектор-функции, получаем сходимость
Замечание. Условие 3) следствия, в частно- оптимальных управлений ик (/) в Ьх [/0, 1Х ]. сти, выполнено, если и = 0 - внутренняя точка
множества Д, то есть gj (х(0),0) < 0 при Список литературы
7 = 1, п. Отметим также, что в условиях след- !_ Васильев Ф.П. Методы решения экстремаль-
ствия всякая ^-задача сводится к оптимизации в ных задач. М.: Наука, 1981. 400 с. конечномерном пространстве на компактном 2. Кларк Ф. Оптимизация и негладкий анализ. М.:
множестве и будет корректной. Для простран- Наука, 1988. 280 с.
ства и = 1™ [а, Ь] систему элементов из * ., удо- 1 Вулих Б.3. Введение в теорию полУУпорядо-
J ■> ченн^1х пространств. М.: Физматгиз, 1961. 407 с.
влетворяющих условию 1) следствия, образуют, 4. Вулих Б.З. Введение в функциональный ана-
в частности, вектор-функции многочлены, а е лиз. М.: Наука, 1967. 416 с.
здесь будет единичная вектор-функция. Тогда 5. Калашников А.Л. Аппроксимация и ограни-
КВ линеал и — С" [а Ь] ченность оптимального множества управлений для
е ю[ ’ ] динамической системы // Вестник ННГУ. Серия
4. Рассмотрим задачу оптимального управ- «Математическое моделирование и оптимальное ления: управление». 2003. Вып. 1 (26). С. 138-141.
APPROXIMATION AND LIMITATION OF THE SET OF OPTIMAL CONTROLS
A.L. Kalashnikov
The problem of optimal control in a KB-lineal is considered. This problem has a sequence of approximating finitedimensional k-problems. The conditions of the ordinal limitation of initial problem optimal sets and k-problems and enhanced convergence of the optimal controls of k-problems to the optimal set of the initial problem are presented.
Keywords: optimal control, lineal, ordinal limitation, convergence, approximation.