2008 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. Сер. 10. Вып. 4
ПРИКЛАДНАЯ МАТЕМАТИКА
УДК 539.3 В. В. Карелин
ТОЧНЫЕ ШТРАФЫ В ЗАДАЧЕ НАБЛЮДЕНИЯ
Введение. Задачу нахождения состояния динамической системы в начальный момент времени называют задачей наблюдения. Фиксированный процесс в пространстве состояний, описываемый следующей системой дифференциальных уравнений:
х = I (х,г), (1)
генерирует однозначно процесс в соответствии с уравнением выхода
у(г) = Зх(г), (2)
в котором В — п-мерный вектор. Представляет интерес, единственный ли процесс х(Ь) может вызвать этот выход у(Ь). Если процессы х(Ь) и у(Ь) находятся во взаимно однозначном соответствии, то задача наблюдения разрешима.
Постановка задачи. Обозначим вектор неизвестных параметров х(0) = х0, и рассмотрим функционал
I (xq)= F (x(t,xo ))dt,
J о
где F(x(t,xo)) = (y(t) — Bx(t, хо))2 и x(t,xo) - решение уравнений (1), (2) с хо G IR".
Пусть х,хо G IR", y G IRm, t G [0,T], T > 0, f : IR" x IR ^ IR" дифференцируема
no x. Функции /, ^ непрерывны на IR" x IR. Введем множество
Q := {[z, хо] | z G C[0, T],: y(z, хо) = 0},
здесь
\iT c i1 \2 11/2
<p(z,xo)= J (z(t) — f (хо + J z(t )dr,xo,t)j dt Заметим, что p(z,xo) ^ 0 Vz,xo G P[0,T]. Если z, хо G Q , то функция
x(t) = хо + z(t )dT
Jo
удовлетворяет (1), (2) и наоборот.
Карелин Владимир Витальевич — доцент кафедры математической теории моделирования систем управления факультета прикладной математики—процессов управления Санкт-Петербургского государственного университета. Автор 60 работ. Научные направления: идентификация систем управления, недифференцируемая оптимизация. E-mail: [email protected].
© В. В. Карелин, 2008
Таким образом, задача решения системы (1), (2) для некоторого хо Є Ш.п эквивалентна нахождению г Є Р[0,Т] такого, что р(г,хо) =0.
Пусть д := [и, д], где и Є С[0, Т], д Є Ш,п. Положим
:= тах{||-у||, ||^П}, ІМІ :=
(v(t))2 dt
1/2
:= Vх?-
Пара g определяет направление (на множестве C[0, T] х IR"). Функция р в точке [z, хо] удовлетворяет p(z, хо) > 0 в направлении g. Теперь определим
<p'(z, Х0;д) = lim — [p(z + av, х0 + ад) - <p(z, ж0)].
a|0 а
Можно показать, что предел существует и конечен, т. е. верно следующее утверждение.
Лемма 1 [1]. Если p(z,x0) > 0 (т. е. [z,xo] ^ Q), то функция р дифференцируема в окрестности точки [z, х0].
При этом
p'(z,x0\ g) = ^v(t),w(t)
(df(r)
l dx
j(r )dr dt —
где
w(t)~l (^йг) '<І)Л
(3)
Так как (3) линейно в д, заключаем, что р дифференцируема около [г,хо] вместе с «градиент» ^р (на множестве С[0,Т] х Ж"). Более того, справедливо утверждение. Лемма 2. Существует а > 0 такая, что
min (^р, д) ^ —а < 0 y[z, хо] Є И.
11з11=1
Доказательство. Докажем сначала, что
Vß = 0.
(4)
(5)
В (5) «0» - нулевой элемент в пространстве С[0, Т] х Ш". Предположим, что это не так, тогда
‘■Т (опту п V дх
т. е. 1м(1) =0" Ш € [0, Т], и мы получили противоречие. Предположим теперь, что (4) неверно. Тогда существует последовательность ^к,х^] такая, что
*>—і:
)(т)dr = 0„ yt Є [0, T],
[zk,xo] Є ^, ^ßk —— 0,
где
Vßk
M f (dfk(r)X t w f1 fdfk(t)Y u^u
Wk J \ dx ) Wk(T)dT’~J — ) wk{t)dt
о
=P
д/к(г) _ д/(хк(і),х%,г) д/к(г) д/(хк(і),х%,г)
дх
дх
дхо і
дхо
хк (г) = хо + гк (т)йт,
о
(г) =
1
р(гк,хк)
2к(і) - ¡(хо +! Ык (т)йт,х'к ,г)^ .
Отметим, что
Из соотношения (6) следует, что
где
ІКІІ =1 11^ І -0, гТ ( д/к (тГ *
ч \ дх
Из выражений (8) и (9) вытекает, что ^ 0, а это противоречит (7). Теперь рассмотрим случай, когда р(г,хо) = 0. Укажем, что
р(г,хо) = гп&х г(Ь) — I(хо + г(т)в,т,хо,1),гд(1)\ А,
Ы\ = ^о \ .¡о )
и2 (г) ¿г
1/2
Если р(г,хо) = 0, то Н(Ь) = г (г) — / (х0 + /0 г(т )йт,хо,г) =0 Ш Є [0,Т]. Так как
г (г) +аи(г) — / (хо + (г(т)+аи(т ))йт,хо + ад,г) =
о
ь(г) + а
”(т)* “ ~д^4
тогда (см. (6))
/Т / О Г /і\ пі
------I и{т)(1'
+ о(а),
д/(г)
у(т)с1т-------------д <М
дхо
Используя ту же процедуру, что ив (8), (9), для (11) имеем
р (г, хо; д) = тах
11^11 = 1
йг —
(Ш,
V дхо
д и(г)йг, д
Из (11) и (12) следует
(7)
(8)
(9)
(10)
(11)
(12)
о
о
*
о
Лемма 3. Если р(г, хо) = 0, тогда функция р дифференцируема по направлению в т. [хо,г] и даже субдифференцируема, т. в.
где
р'(г,хо; д) = тах (С,д),
ОЄд^(г,хо)
др(г,хо) = { О = [и*,д*]\и* Є С[0,Т],д* Є Ж^и*(г) = Щ —
(д/(т)
I дх
и(т)йт, д*
[ еС[0’т]’и*и ^ ч- (13)
Таким образом, задача наблюдаемости свелась к проблеме минимизации функционала
Г Ґ
ф(г,хо)= ¥ (хо + г(т )йт )йг,
оо
(14)
подчиненного условиям р(г,х о) = 0.
Функционал ф(г,хо) дифференцируем:
ф'(г,х0;д) = Ит-
а|о а
І'Т І'і
/ ¥ (хо + (г(т)+аи(т ))йт )йг — ф(г,х о)
оо
( д¥ (х(г))
(г)\ йг
о дх
и его «градиент» (на множестве С[0,Т] х Ш,п) имеет вид
Vф(г,хо) =
д¥ (х(г))
дх
0ЭТ
(15)
Следуя работам [1-3], можно доказать такое утверждение:
Теорема. Если р липщицева на С[0, Т] х Ж.п, тогда найдется Ао ^ 0 такая, что для всех А ^ Ао множество минимумов функции ф на множестве О = {[г,хо]\ р(г,хо) = 0} совпадает с множеством минимумов функции
ф\(г, хо) = ф(г, хо) + Ар(г, хо)
на всем множестве С[0, Т] х Ш.п.
Таким образом, если [г*,х*] - точка минимума функции ф\(г,хо) (для А ^ Ао), тогда р(г*,хо) = 0 и ф содержит его минимальные значения на О около [г*,х*]. Это также означает, что функция
"(г) = хо + [ г*(т)йт
о
является решением дифференциальной системы уравнений
х(г) = I (х(г),х*о ,г), х(0) = хо,
и функционал I(хо) имеет минимальное значение в точке хд. 6
*
X
Из него следует, что существует функция V € С[0,Т] такая, что ||г>|| ^ 1, и при этом
Заменяя \у^) на v(t) в (16) и (17), получаем, что если х*(Ь) = х(Ь,хо) минимизирует (14), то существует вектор-функция v(t) € С[0,Т] такая, что
Если ¥(х) дважды непрерывно дифференцируема, тогда (18) можно переписать в «дифференциальной» форме
Заключение. Таким образом, задачу наблюдения удалось свести к задаче оптимизации без ограничений, для которой найдены следующие условия оптимальности.
Если хд € Ж.п минимизирует функционал I(хо) с системой дифференциальных уравнений (1),(2), тогда функция v(t) € С[0,Т], определенная (20) и (21), удовлетворяет (19).
Karelin V. V. Exact penalty functions in the problem of supervision.
The problem of reducing a constrained mathematical programming problem to an unconstrained one has
(16)
(17)
где
df(t) _ df(x*(t),x*0,t) df(t) _ df(x*(t),x*0,t)
dx dx ’ dxo dxo
(18)
И
(19)
(20)
(21)
Summary
been given a great deal of attention. In most cases such a reduction is performed with the help of so-called
penalty functions. At present the theory of Penalization is well developed and widely used. The exact penalization approach is the most interesting and elegant but it generally requires solving a non-smooth problem even if the original one was smooth. However, recent developments in Non-differentiable Optimization give some hope that these difficulties will be overcome. To be able to reduce a constrained optimization problem to an unconstrained one via exact penalization it is suitable to represent the constraining set in the form of equality, where the function describing the set must satisfy some conditions on its directional derivatives (or, in general, on its generalized directional derivatives). In the present paper we show how to describe the constraints — given in the form of differential equations — by a (non-smooth) functional whose directional derivatives satisfy the required properties. We treat one parametric optimization problem. This problem is reduced to a non-smooth unconstrained optimization problem. It makes it possible to construct a numerical algorithm for the unconstrained optimization problem just allowing one to solve the original parametric optimization problem. Then by making use of necessary optimality conditions (for a non-smooth problem) it is shown that the conditions we obtain are equivalent to the well-known ones.
Key words: observability, the differential equations, penal functions, not differentiated optimization, management.
Литература
1. Demyanov V. F., Facchinei F., Karelin V. V. Optimal control problems via Exact Penalty Function // J. of Global Optimiz. - 1998. - Vol. 12, N 3. - P. 215-223.
2. Di Pillo G., Grippo L. On the exactness of a class of Non-differentiable Penalty functions // J. Optim. Theory Appl. - 1988. - Vol. 57. - P. 397-408.
3. Giannessi F., Niccolucci F. Connections between nonlinear and integer programming problem // Symposia Mathematica. - New York: Acad. Press, 1976. - Vol. XIX. - P. 161-176.
Статья принята к печати 29 апреля 2008 г.