Научная статья на тему 'Точные штрафы в многоточечной задаче для обыкновенных дифференциальных уравнений'

Точные штрафы в многоточечной задаче для обыкновенных дифференциальных уравнений Текст научной статьи по специальности «Математика»

CC BY
76
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАБЛЮДАЕМОСТЬ / ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ / ШТРАФНЫЕ ФУНКЦИИ / НЕДИФФЕРЕНЦИРУЕМАЯ ОПТИМИЗАЦИЯ / УПРАВЛЕНИЕ / OBSERVABILITY / THE DIFFERENTIAL EQUATIONS / PENAL FUNCTIONS / NOT DIFFERENTIATED OPTIMIZATION / MANAGEMENT

Аннотация научной статьи по математике, автор научной работы — Карелин В. В.

Проблеме учета ограничений в задачах математического программирования было уделено много внимания. Во многих случаях ее решали с помощью штрафных функций. В настоящее время идея точных штрафов хорошо разработана и широко используется. Подход, основанный на точном штрафе, наиболее интересен и изящен, но он приводит к необходимости решать негладкую задачу оптимизации, даже если исходная задача является гладкой. Однако прогресс в области численных методов недифференцируемой безусловной оптимизации, до стигнутый в последние годы, дает некоторую надежду, что эти трудности будут преодолены. Ранее теория точных штрафов была применена к исследованию одного класса задач управления, в которых «управления» были просто параметрами системы дифференциальных уравнений, описывающей поведение некоторого управляемого объекта. В статье рассматривается многоточечная задача для обыкновенных дифференциальных уравнений. Система дифференциальных уравнений считается ограничениями. Показано, как можно их убрать, вводя соответствующую штрафную функцию. Получающийся новый функционал существенно негладкий, тем не менее он обладает интересными дифференциальными свойствами, и современные методы недифференцируемой оптимизации позволяют решать указанные задачи численно. Библиогр. 3 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Exact penalties in a multipoint problem for ordinary differential equations

The problem of reducing a constrained mathematical programming problem to an unconstrained one has been given a great deal of attention. In most cases such a reduction is performed with the help of so-called penalty functions. At present the theory of Penalization is well developed and widely used. The exact penalization approach is the most interesting and elegant but it generally requires solving a nonsmooth problem even if the original one was smooth. However, recent developments in Nondifferentiable Optimization give some hope that these difficulties will be overcome. To be able to reduce a constrained optimization problem to an unconstrained one via exact penalization it is suitable to represent the constraining set in the form of equality, where the function describing the set must satisfy some conditions on its directional derivatives (or, in general, on its generalized directional derivatives). In the present paper we show how to describe the constraints given in the form of differential equations by a (nonsmooth) functional whose directional derivatives satisfy the required properties. We treat one multipoint problem for ordinary differential equations. This problem is reduced to a nonsmooth unconstrained optimization problem. It makes it possible to construct a numerical algorithm for the unconstrained optimization problem just allowing one to solve the original parametric optimization problem. Then, by making use of necessary optimality conditions (for a nonsmooth problem) it is shown that the conditions we obtain are equivalent to the well-known ones.

Текст научной работы на тему «Точные штрафы в многоточечной задаче для обыкновенных дифференциальных уравнений»

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

Сер. l0. 2009. Вып. 4

УДК 539.3 В. В. Карелин

ТОЧНЫЕ ШТРАФЫ В МНОГОТОЧЕЧНОЙ ЗАДАЧЕ

ДЛЯ ОБЫКНОВЕННЫХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

Введение. В многоточечных задачах вводятся дополнительные условия на решения. Эти условия имеют вид уравнений, содержащих комбинации значений решения и его производных, взятых в нескольких точках траектории.

Фиксированный процесс в пространстве состояний описывается следующей системой дифференциальных уравнений:

x = f (x,t),

(1)

где х = х(Ь] - неизвестная функция, подлежащая определению, £ € [0,Т]. Выберем на этом отрезке к точек ^ (г = 1, 2, ...,к). Будем рассматривать значения функции х(Ь) и ее производных до (п — 1)-го порядка включительно в указанных точках: х(и),х{")(и),... ,х(п (и), г = I, 2, ...,к. Образуем теперь уравнение, связывающие эти

величины:

Ф^і)^ )(tl), ...,x(n 1}(tl), ...,x(tk),x( }(tk), ...,x(n 1)(tk)) =

(2)

и поставим такую задачу: найти на отрезке [0,Т] решение х(і) уравнения (1), которое удовлетворяло бы поставленным условиям (2).

Получили задачу с условиями в к точках. Если к = 1 = 0), то мы будем иметь

дело с задачей Коши, определяемой уравнением (1) и условиями (2), которые в этом случае будут начальными. Если к = 2 = 0,Ї2 = Т), то задача (1), (2) в данном

случае называется граничной. Наконец, если среди к рассматриваемых точек будет т различных (2 ^ т ^ к), то задача (1), (2) в таком случае называется т-точечной (или многоточечной).

Постановка задачи. Рассмотрим функционал

I = ^(х(г, хо)) = (Ф(х(^), х( }(іі), х(п-1)(г1),х(гк), х(}(гк),х(п-1)(гк)) - ц)2

и х(ї,хо) - решение уравнений (1) с хо Є Ш.п.

Введем множество

здесь

p(z,xo)

О := {[z, xo] I z Є C[0, T],: p(z, xo) = 0},

J ^z(t) — f(xo + J z(t)dT,xo,t)^ dt

1/2

Карелин Владимир Витальевич — кандидат физико-математических наук, доцент кафедры математической теории моделирования систем управления факультета прикладной математики—процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 64. Научные направления: идентификация систем управления, недифференцируемая оптимизация. E-mail: [email protected].

© В. В. Карелин, 2009

Заметим, что р(г,хо) ^ 0 Уг,хо € Р[0,Т]. Если г, хо € О, то функция

х(Ь) = хо + г(т )в,т

о

удовлетворяет системе (1), и наоборот.

Таким образом, задача решения системы (1) для некоторого хо € Ш.п эквивалентна нахождению г € Р[0,Т] такого, что р(г,хо) = 0.

Пусть д := [и, д], где и € С[0, Т], д € К". Положим

\\д\\} ||и|| :=

(и(Ь))2йЬ

1/2

:= Vх?-

Пара д определяет направление (на множестве С[0, Т] х К"). Функция р в точке [г, хо] удовлетворяет неравенству р(г,хо) > 0 в направлении д. Теперь определим

<р'(г, х0;д) = Ит — [р(г + да, х0 + ад) - <р(г, ж0)].

а|0 а

Можно показать, что предел существует и конечен, т. е. верно следующее утверждение.

Лемма 1 [1]. Если р(г,хо) > 0 (т. е. [г,х0] € О), то функция р дифференцируема в окрестности точки [г, х0].

При этом

где

ЧР :

<11 = (ч^я),

^-1ти,(т) *’-/ (т^1)и,т

(3)

дх ) ’ У у дхо

г о

Так как (3) линейно по д, заключаем, что р дифференцируема около [г,хо] (на множестве С[0,Т] х К"). Более того, справедливо утверждение.

Лемма 2. Существует а > 0 такая, что

шт (ЧР, д) ^ —а < 0 У[г, хо] € О.

11з11=1

Доказательство. Докажем сначала, что

ЧР = 0.

(4)

(5)

В (5) «0» - нулевой элемент в пространстве С[0, Т] х К". Предположим, что это не так, тогда

■ш(ь) — !

№)

дх

ю(т)3,т = 0" УЬ € [0, Т],

о

*

т. е. 1м(Ь) = 0" УЬ € [0,Т], и мы получили противоречие. Допустим теперь, что (4)

неверно. Тогда существует последовательность [гк,х^] такая, что

[zk,x0] G ЧРк —— О,

где

VPk

f (д1к(т)\* f (9fk(t)\*

Wk{t) - I J wk{T)dT, - / (-7^— ) wk(t)dt

t 0 dfk(t) df(xk (t),xkk ,t) dfk(t) df (xk(t),xkk ,t)

dx

dx

dxt

0

dxt

0

t

xk(t) = xo + J zk(t)dr,

Wk (t) =

1

P(zk ,xo )

Zk(t) - f (xo + J zk(t)dT,x’k,t)^ .

Отметим, что

Из соотношения (6) следует, что

где

hk(t) = wk(t) — J wk{r)dT.

dx

Из выражений (8) и (9) вытекает, что ||wk|| — 0, а это противоречит (7). Теперь рассмотрим случай, когда p(z,xo) = 0. Укажем, что

T ( f I

p(z,xo)= max J I z(t) — f (xo + J z(t)dT,xo,t),v(t) I dt,

(6)

(7)

(8)

(9)

v (t)dt

o

1/2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Если p(z, xo) = 0, то h(t) = z(t) — f (xo + f z(t)dT, xo, t) = 0 Vt G [0, T].

o

Так как

t

z(t) + av(t) — f (xo + J(z(t) + av(T))dT, xo + aq, t) =

= h(t)

дШ,

dxo

+ o(a),

a

v

тогда (см. (6))

ір'(г,х0;д) = m.ax.^J J ^(т)3т - :1^1д ] Зі.

т)

дхо

(10)

Для (10) имеем

р(г, хо; д) = тах

||г;|| = 1

} (»тм‘) -} *т)*т) X-

/ШЧ тл’“

(11)

Из (10) и (11) следует

Лемма 3. Если р(г,хо) = 0, тогда функция р дифференцируема в направлении т. [хо,г] и даже субдифференцируема, т. в.

где

р'(г,хо; д)= тах (О, д),

ОЄд^(г,хо)

др(г,хо) = |О = У,ц*]|«* Є С[0,Т],д* Є Ш.п,«*(г) = Щ -

-] (^)* Чт)<1т,д* = -| (^У^№«єС[0,Т],||«|Кі|. (12)

г о '

Таким образом, наша многоточечная задача свелась к проблеме минимизации функционала

I(г,хо) = Р(хо + ! г(т)Зт),

(13)

подчиненного условиям

р(г,хо) = 0. Функционал I(г,хо) дифференцируем:

г

Г(г,х0;д) = Ит-

а|0 а

Р(хо + !(г(т)+ау(т))Зт) - ф(г,хо)

, у(і) ) Зі

дР(х(Ь)) дх

и его «градиент» (на множестве С[0,Т] х Ш,п) имеет вид

дР (х(і))

ЧФ(г,А)

і ^т

дх

Следуя работам [1-3], можно доказать такое утверждение:

(14)

Теорема. Если р липщицева на С[0, Т] хК", тогда найдется Ао ^ 0 такая, что для всех А ^ Ао множество минимумов функции ф на множестве О = {[г, хо]\р(г, хо) = 0} совпадает с множеством минимумов функции

ф\(г, хо) = I(г, хо) + Ар(г, хо)

на всем множестве С[0, Т] х К".

Отсюда получаем, что если [г*,х*] - точка минимума функции ф\(г,хо) (для А ^ Ао), то тогда р(г*, хо) =0 и ф содержит его минимальные значения на О около [г*, х*]. Это также означает. что функция

г

х*(Ь) = хо + У г*(т)йт

является решением дифференциальной системы уравнений

х(Ь) = / (х(Ь),х* ,Ь), х(0) = хо,

и функционал I(хо) имеет минимальное значение в точке х*.

Функция ф\(г,хо) субдифференцируема, и ее субдифференциал имеет вид

дфх (г*,х*о) = Чф(г*,х*) + Адр(г * ,х*),

где чФ определен формулой (14), а др - (12) (множество р(г*,х*) = 0). Необходимое условие оптимума

0 € дфх(г*,х*о).

Из него следует, что существует функция V € С[0,Т] такая, что ||г>|| ^ 1, и при этом

дР(х*{Ь))

дх

1

т — /

(д/(т) V дх

и(т )с!т

0" УЬ € [0, T],

(15)

где

о

д/(Ь) д/(х*(Ь), А* ,Ь) д/(Ь) д/(х*(Ь),х*о,Ь)

(16)

дх дх дхо дхо

Заменяя Аи(Ь) на и(Ь) в (15) и (16), получаем, что если х*(Ь) = х(Ь,хо) минимизирует (13), то существует вектор-функция и(Ь) € С[0,Т] такая, что

дР(х*(Ь))

дх

+ «(*) - I <т)йт = 0 Ше [0, Т\

(17)

(^г) = °”-

(18)

*

и

Если Р(х) дважды непрерывно дифференцируема, тогда (17) можно переписать в «дифференциальной» форме

Заключение. Таким образом, многоточечную задачу удалось свести к задаче оптимизации без ограничений, для которой найдены следующие условия оптимальности: если xo G IRn минимизирует функционал I(xk),k = 1,...,n, с системой дифференциальных уравнений (1) и дополнительными условиями (2), тогда функция

v(t) G C[0,T], определенная (19) и (20), удовлетворяет (18).

Литература

1. Demyanov V. F., Giannessi F., Karelin V. V. Optimal control problems via Exact Penalty Function // J. of Global Optimiz. 1998. Vol. 12, N 3. P. 215-223.

2. Di Pillo G., Grippo L. On the exactness of a class of Nondifferentiable Penalty functions // J. Optim.

Theory Appl. 1988. Vol. 57. P. 397-408.

3. Giannessi F., Niccolucci F. Connections between nonlinear and integer programming problem // Symposia Mathematica. 1976. Vol. XIX. P. 161-176.

(l9)

(20)

Статья принята к печати 28 мая 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.