Научная статья на тему 'Об условиях стационарности в задаче оптимального управления для траектории с простым выходом на фазовую границу'

Об условиях стационарности в задаче оптимального управления для траектории с простым выходом на фазовую границу Текст научной статьи по специальности «Математика»

CC BY
80
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЯЕМАЯ СИСТЕМА / ФАЗОВОЕ ОГРАНИЧЕНИЕ / РАЗМНОЖЕНИЕ ПЕРЕМЕННЫХ / УСЛОВИЯ СТАЦИОНАРНОСТИ / ЗНАКООПРЕДЕЛЕННОСТЬ МЕРЫ / АТОМЫ МЕРЫ / СКАЧКИ СОПРЯЖЕННОЙ ПЕРЕМЕННОЙ / CONTROL SYSTEM / STATE CONSTRAINT / REPLICATION OF VARIABLES / STATIONARITY CONDITIONS / NONNEGATIVITY OF MEASURE / ATOMS OF MEASURE / JUMPS OF ADJOINT VARIABLE

Аннотация научной статьи по математике, автор научной работы — Дмитрук А.В., Самыловский И.А.

Рассматривается некоторый класс задач оптимального управления с одномерным фазовым ограничением. В случае, когда выход траектории на фазовую границу происходит на отрезке, с помощью специальной техники (двухэтапного варьирования) получены условия оптимальности в форме Гамкрелидзе и затем условия в форме Дубовицкого-Милютина, включая знакоопределенность плотности меры и ее скачков в точках стыка.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Дмитрук А.В., Самыловский И.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stationarity conditions in optimal control problem for a trajectory with a single boundary subarc

We consider a class of optimal control problems with a scalar state constraint. For a trajectory with a single boundary subarc we first and obtain optimality conditions in the form of Gamkrelidze, and then, using a special technique (two-stage variation approach) obtain a full set of optimality conditions in the Dubovitskii-Milyutin form, including the nonnegativity of the measure density and its atoms at the junction points.

Текст научной работы на тему «Об условиях стационарности в задаче оптимального управления для траектории с простым выходом на фазовую границу»

УДК 519.612:632.4

А. В. Дмитрук1, И. А. Самыловский2

ОБ УСЛОВИЯХ СТАЦИОНАРНОСТИ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ ТРАЕКТОРИИ С ПРОСТЫМ ВЫХОДОМ НА ФАЗОВУЮ ГРАНИЦУ

Рассматривается некоторый класс задач оптимального управления с одномерным фазовым ограничением. В случае, когда выход траектории на фазовую границу происходит на отрезке, с помощью специальной техники (двухэтапного варьирования) получены условия оптимальности в форме Гамкрелидзе и затем условия в форме Дубовицкого-Милютина, включая знакоопределенность плотности меры и ее скачков в точках стыка.

Ключевые слова: управляемая система, фазовое ограничение, размножение переменных, условия стационарности, знакоопределенность меры, атомы меры, скачки сопряженной переменной.

1. Введение. Как известно, условия оптимальности в задачах с фазовыми ограничениями представляют собой значительную трудность в силу нестандартности множителя при фазовом ограничении. В случае, когда выход на фазовую границу происходит на отрезке, можно продиффе-

1 Факультет ВМК МГУ, проф., д.ф.-м.н., e-mail: avdmiQcemi.rssi.ru

2 Факультет ВМК МГУ, асп., e-mail: ivan.samylovskiyQcs.msu.ru

ренцировать фазовое ограничение и свести его к смешанному, для которого условия стационарности формулируются с помощью стандартных понятий. Полученный ответ можно затем переформулировать в терминах исходной задачи. Этот путь был предложен Р. В. Гамкрелидзе в классической книге [1], однако при его использовании надо добиться знакоопределенности меры — множителя при фазовом ограничении (что дает условие скачка сопряженной переменной в точках стыка с фазовой границей). В случае общего контакта с фазовой границей А. Я. Дубовицкий и А. А. Милютин [2] предложили брать этот множитель в виде неотрицательной меры, сосредоточенной на множестве выхода оптимальной траектории на фазовую границу, что полностью соответствует функциональному смыслу фазового ограничения. Однако при этом сопряженное уравнение содержит меру (точнее, ее обобщенную производную), т.е. получается дифференциальное уравнение нового, пока не изученного типа.

Таким образом, известны две формы условий оптимальности (в обоих случаях они относятся к принципу максимума) — форма Гамкрелидзе [1] и форма Дубовицкого-Милютина [2]. Естественно, возникает вопрос о связи между ними. В статье [3] и позднее в [4] было показано, что из условий в форме Дубовицкого-Милютина вытекают условия в форме Гамкрелидзе (путем некоторой замены сопряженной переменной), однако возможность обратного перехода не была установлена.

В данной статье рассматривается некоторый класс задач специального вида, в котором связь знакоопределенности меры и минимизации функционала проявляется наиболее наглядно. В этом классе удается до конца реализовать идею Гамкрелидзе и установить знакоопределенность меры, т. е. тем самым показать, что из условий оптимальности в форме Гамкрелидзе вытекают и условия в форме Дубовицкого-Милютина. Для простоты ограничимся необходимыми условиями так называемого расширенного слабого минимума (т.е. условиями стационарности), оставляя вопрос об условиях принципа максимума для дальнейших исследований.

2. Постановка задачи. На фиксированном отрезке времени [0,Т] рассмотрим следующую задачу оптимального управления с фазовым ограничением:

Здесь г € Жп, ж € Ж1, и € Ж™, фазовые переменные г(-) и ж(-) — абсолютно непрерывные функции, управление и(-) — измеримая ограниченная функция. Будем предполагать, что функции /, д, (р определены и непрерывны вместе со своими частными производными по г, ж, и первого порядка на некотором открытом множестве Я С Жто+П+1.

Определение 1. Произвольную тройку функций т = (г,ж,и) указанного класса, определенную на отрезке [¿о, Т] и удовлетворяющую уравнениям г = /(г, ж, и), ж = ж, и), будем называть процессом задачи А. Процесс го допустим в задаче А, если он удовлетворяет всем ограничениям (1).

3. Исследуемая траектория. Будем считать, что процесс ад0 = таков, что тра-

ектория х°(1) выходит на фазовую границу на некотором отрезке [¿1,^2]; где 0 < < 12 < Т. Другими словами, отрезок А = [0,Т] разбит на три части Д1 = [0, ¿1], А2 = [¿1,^2], Аз = [/2- '/"]• при этом ж°(£) > 0 на [0, ¿1), ж°(£) = 0 на А2 и ж°(£) > 0 на Кроме того, пусть и° непрерывна

на Д1, Аз, липшицева на А 2 и выполнены строгие неравенства

т. е. посадка траектории на фазовую границу и сход с нее происходит с ненулевой производной. Дополнительно предположим, что градиенты для г € I(u°(t)), позитивно независимы

на Ai U A3 и g'u(z°(t), х°(t), и0(t)) Ф 0 на Д2. Здесь 1(и) = {г| (pi(u) = 0} — множество активных индексов. Для удобства далее будем использовать векторную запись ограничений на управление: ср(и) ^ 0. Будем предполагать, что (p(u°(t)) < 0 на Д2.

4. Рассматриваемый тип минимума. Мы будем допускать как равномерно малые вариации управления, так и малые вариации точек его разрыва. Это соответствует рассмотрению так называемого расширенного слабого минимума (см., например, [5]).

z = f(z, ж, и), Ja = J(z(0), z(T), ж(0), ж(Т)) ^ min, ж = g(z, ж, и), (pi{u(t)) ^ 0, г = 1,..., dim(iyp), x(t) ^ 0.

(1)

xQ(t1 ^ 0 )=д (zQ(t1),xQ(t1),uQ(t1 - 0)) < 0 + 0) = д {za(t2),xa(t2),ua(t2 + 0)) > 0

(2)

Определение 2. Допустимый процесс wQ = (z°(t),x°(t),u°(t)), t G [0,T], доставляет расширенный слабый минимум в задаче А, если существует такое е > 0, что для всякого липши-цева сюръективного отображения а : [0,Т] —> [0,Т], удовлетворяющего условиям |cr(i) — i| < е и |<j(i) — 1| < е, и для любого допустимого процесса w = (z(t),x(t),u(t)), удовлетворяющего на [О, Т) условиям

\z(t) - zQ (a(t))\ < е, \x(t) - xQ (a(t))\ < e, \u(t) - uQ (a(t))\ < e, выполнено J(w) ^ J(w°). (Функция a(t) здесь обеспечивает деформацию времени.)

5. Сведение задачи А к задаче со смешанными ограничениями. Аналогично [6], введем новое (нормированное) время г € [0,1] и линейные функции отображающие отрезок

ГО, 11 на Аг. Функции ¿¿(т) зададим с помощью уравнений —-- = л, где р^> 0 — коэфффициенты

ат

пропорциональности между и т. Введем на отрезке [0,1] фазовые переменные г$(т) = ^(¿¿(г)), Уг{т) = х(и(т)), и управление Я1г{т) = и(и(т)). Таким образом, мы "размножили" переменные исходной задачи, рассмотрев сужения фазовых переменных и времени на отрезки А^, записанных как функции от нового времени, в качестве новых фазовых переменных. Тогда приходим к следующей задаче на отрезке времени г € [0,1]:

при наличии следующих ограничении: ' dr 1

d,r dyi dr dt\

dr

JB = J(zi(0),z3(l),yi(0),y3(l)) ->• min

ничений:

= Pif(ri,yi,v1), ri(l) - r2(Û) = 0,

(3)

= Pig(ri,yi,vi),

= Pu

^ = P2.f(r2,y2,v2)

dm , ч

= P29{r2,y2,V2)

dto

dr

= P2,

^T = РзДпьУз^з), ^ = i3(l)-T = 0,

2/i(l)-2/2(0) = 0,

Îi(0) = o, ii(l) -Î2(0) = o,

r2(l)-r3(0) = 0, 2/2(1) — уз(0) = 0,

i2(l)-i3(0) = 0,

d-Уз , ч

= P35(r2,y2,v2),

(4)

(5)

dr

— 0, 1 — 2,3»

dr

(6)

(7)

Вместо фазового ограничения у2(т) ^ 0 на [0,1] рассмотрим пару из концевого и смешанного

ограничений: у2(0) ^ 0, —^ = 0, т.е.

аг

Уг(0)^0, g(r2,y2,v2) = 0. Ограничение на управления v\, V3 запишется теперь в виде

(8)

(9)

Эти ограничения наряду с ограничением равенства в (8) будем трактовать как смешанные. Нетрудно проверить, что градиенты смешанных ограничений по V = (г>1, г>2, из) линейно независимы.

Назовем задачу (3)-(9) на отрезке [0,1] задачей В. Каждому процессу го = (г, ж, и) задачи А соответствует единственный процесс 7 = (г*, у*, ¿¿, рг, задачи В, и наоборот. Нетрудно проверить, что справедлива следующая

Лемма 1. Пусть процесс w° = (z°(t),х°(t),и0(t)) с моментами захода и схода с фазовой границы 15, t2 доставляет расширенный слабый минимум в задаче А. Тогда соответствующий ему процесс = (гг°(т), уг°(т), t®(г), , г>г°(т), i = 1,2,3) доставляет слабый минимум в задаче В.

6. Условия стационарности для задачи В. Пусть процесс

7° = {г i = 1,2,3)

доставляет слабый минимум в задаче В, тогда для него выполнены условия стационарности (см. например, [7, 8]), которые с учетом регулярности смешанных ограничений состоят в следующем. Существуют множители а0 ^ 0, а,\ ^ 0, flj, 1 ^ j ^ 8, липшицевы функции фг., фу., ipti, ¿ = 1,2, 3, измеримые ограниченные функции h\(г) ^ 0, h3(г) ^ 0, ст(т), для которых выполнены условия нетривиальности

ill

|ск01 + |«i| + £|/3j| + J\h1(r)\dr + J\о{т)\йт + J\h3(r)\dr > 0

ООО

и дополняющей нежесткости aiy2(0) = 0, hiip(v\) = 0, h3ip(v^) = 0. Для концевой функции Ла-гранжа

/ = a0J(ri(0),r3(l),yi(0),y3(l)) +0iii(O) + /32(ii(l)-i2(O)) + #$(¿2(1) - ¿з(0)) + &(*з(1) - Т) +

+ k (ri(l) - r2(0)) + /36(г2(1) - r3(0)) + /З7(yi(l) - 1/2(0)) + /38(2/2(1) - уз(0)) - aiy2(0)

и расширенной функции Понтрягина

п = AiPlf(rl,yi,Vl) + ФиР1 + ФР1 +'Фу1Р19(гъУъУ1) + Фг2Р21(г2,У2,'02) + Фг2Р2 + фр2 +

+ Фу2р29(г2,У2,У2) + ^г3Рз/(гз,Уз,«з) + Фг3Рз + ФРз + Фу3Рз9(гз,Уз,У3) - <трг5(г2,у2, v2)-

- hi(f{v{) - h3cp(v3)

для ¿ = 1,2,3 выполнены сопряженные уравнения с условиями трансверсальности:

— "г

ar

Лфу

dr

фгг (0) = lri( 0), Фп(1) = ~lri(l), ФуМ = lVi(0), ФуЛ1) = ^¿(1)>

(10)

¿Фи dr

= Пи, Фи( 0)=/ti(0), = ~1и(1),

1

J nPi dr = 0,

0

а также условие стационарности по управлениям vf.

еI /„о „,о „.о

(Н)

//,, = 0, nv = О { nV2 = о, { nV3 = о,

ФгХ(ги1Л) + ФуМ^ЛА) = Щ

Pi

ФгХ(г1 ylv°2) + Фу2д'и(г1 ylv°2) = ag'u(rl y°2,v 2°)

/ /„0 „,0 „,0\ _ ^з<рМ)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(12)

ФгХ(Г1У1у^ + ФуХ(Г1У1У^) =

Р°з

Поскольку и°(т) липшицева на Д2, то в силу (12) функция а(т) тоже липшицева. Легко убедиться в том, что здесь всегда «о > 0, и поэтому можно положить а0 = 1.

7. Условия стационарности в терминах исходной задачи. Перепишем условия из п. 6 в терминах исходной задачи (1). Для этого определим функции т(1) и на отрезке [0,Т] следу-

ющим образом:

(О на Дь Г/ц (т(г)) на Ал,

<х(т(г)) на Д2, Ц1) = <0 на Д2, (13)

О на Аз, [^з(т(£)) на А3.

Переходя в уравнениях (10) от нового времени г к исходному времени получим на всем отрезке [О, Т] следующую систему уравнений:

-Фг =--= Фг/г + (Фх ~ т)д'х,

р- ат

= + (14)

=__= 0

р\ йт

Поскольку переменные г^, у^ ^ задачи В непрерывно стыкуются в концах отрезка [0,1], то соответствующие переменные х{Ь) будут непрерывны (и, более того, липшицевы). По аналогичным соображениям будут липшицевы и сопряженные переменные фх, Для функции фх получим следующие условия стыковки:

Г ^(¿1 - о) = фх(Ь + 0) = - «1, \ Фх(ь - о) = -/з8, Мь + о) = -р8,

т.е. фх непрерывна в точке а в точке претерпевает скачок Афх(1\) = —«1 ^ 0. В концах отрезка выполнены условия трансверсальности

1^(0) = ^(0). МТ) =

Согласно (14), для расширенной функции Понтрягина задачи со смешанными ограничениями К(г,х,и,1) = фг/(г,х,и) + фхд(г,х,и) — гпд(г,х,и) — к(р(и) на всем отрезке [0, Т] выполнены сопряженные уравнения

-•фх = к'^а,ха,иа), -чрх = К,х(г°,х°,и0), =

и условия стационарности Ки = + (фх — т)д'и(г°, х°, и0) — 1ир'и(иа) = 0.

Перепишем эти условия в терминах задачи А с фазовым ограничением. Для этого положим Фх(£) = Фх(£) — тп(1) и введем расширенную функцию Понтрягина

Н = фх/(г, х, и) + фхд (г, х, и) + тх — 1кр(и) с множителем т(1) при фазовом ограничении. Нетрудно проверить, что тогда на всем отрезке [0,Т], кроме точек /•_>. выполнены уравнения фх = —Нх, фх = —Нх, и всюду выполнено условие стационарности Ни = 0. Условия трансверсальности (15) очевидно сохраняются. При этом функция фх имеет скачки

&Фх{Ь) = -ац - тЦ 1 + 0), АШ = тЦ2 - 0). Равенства (11) в терминах задачи А перепишутся следующим образом:

I х°,и°) + фхд {г°,х°,и0) + фг) <И = 0, г = 1, 2, 3. (16)

Аг

Эти равенства являются очевидным следствием "закона изменения энергии" + фхд + фг = 0 (см. [8]), который мы здесь не получили. Дело в том, что последний является результатом всевозможных малых вариаций (деформаций) самого отрезка времени [0, Т], в то время как у нас

допускаются лишь трехзвенные кусочно-линейные деформации. Поэтому мы и получили три условия (16). Если бы мы считали рг управлениями, то условие + фхд + фг = О вытекало бы из условий стационарности по р^.

Заметим, что на А2 имеет место х° = 0, а вне А2 в силу (13) т = 0, т.е. выполнено и условие дополняющей нежесткости для фазового ограничения т(1)х°(1) = 0, а из определения к вытекает выполнение условия дополняющей нежесткости для ограничения на управление: к(1)ср(и°(1)) = 0.

8. Знакоопределенность множителя при фазовом ограничении. Выше были получены условия стационарности в задаче А, при выполнении которых мера на интервале А2 абсолютно непрерывна с плотностью т(1) и имеет скачки (атомы) —а^ — т(1 \ + 0), т(12 — 0) в точках 12. Следующая цель — установить знак этой меры и ее скачков. Для этого исползуем вариации х(1) ^ 0 на отрезке А2.

Сначала рассмотрим произвольную тройку €¡(1) = (¿(¿), х(1), й(1)), удовлетворяющую на [0,Т] системе уравнений в вариациях вдоль процесса и!°(1):

¿ = + + й = дхг + дхх + д'ий. (17)

Лемма 2. Пусть на отрезке [0,Т] заданы липшицевы функции х(1) и измери-

мые ограниченные функции к(1), и(1), а также функции фх(1), т(1), липшицевые на отрезках Д1 = [0, ¿1], А2 = [1\,12}, Аз = '/"] с возможными разрывами в точках Ь1, 12, где 0 < < 12 < Т, такие, что на каждом из указанных отрезков выполнены соотношения

Фг = ~ {Фх - т)дх, фх = -фг]'х - (фх - т)д'х, фг]'и + (фх - т)д'и - к<р'и = 0. (18)

Тогда для любого решения Од = (¿,х,й) системы уравнений в вариациях (17) на [0, Т] справедливо равенство

и Т

ФЛТЩТ) + фх(Т)х(т) - фх(0)1(0) - фх(0)х(0) = I пгём + I

0 ¿2

¿2 Т

+ (Афх(Ь) - т(Ь + 0))®(*1) + (Афх(12) + т(Ь - 0))х(12) - 1тх<]Л + ^ к<р'ий <Й. (19)

о

Доказательство. Согласно (18), полный дифференциал выражения фг2 + фхх на каждом из отрезков Д^ имеет вид

— (фгг + фхх) = тд'хг + тд'хх + тд'ии + к(р'ий = тх + к(р'ий.

Интегрируя полученное равенство на всем отрезке [0, Т] (при этом тх на Аг по частям) и учитывая возможные скачки фх в точках 12, получаем

г ¿1 г ¿2 т

й(фгх + фхх) = J тпхсИ+ ! тхсИ + тх — J тх М + Аф^^х^х) + Афх(12)х(12) + J к<р'ийсИ,

о о t2 t1 о

откуда следует требуемое равенство (19).

Далее нам потребуются вариации некоторого специального типа.

Лемма 3. Для любой липшицевой функции ж(1) на отрезке А2 = [¿1,^2] найдется решение системы (17) на А2 с х(1) = ж(1).

Доказательство. Положим ж(£) = й(1) = у(Ь)д'и, где г>(£) — скалярная функ-

ция. Учитывая, что д'и(г°,х°,и°) ф 0, из второго уравнения системы (17) можно выразить г>(£) = (к — д'гх — дхм) /\д'и\2- Подставляя полученное й(£) в первое уравнение системы (17), приходим к неоднородному линейному уравнению на

- _ гI - _ е! I , ( е! _ дх РI I ^ . ^ I

% I \д' И у \2 ^ "Ч-З и ^ ^ ' 1и ]^2д и-

Полагая для определенности = 0, получаем решение этого уравнения. 6 ВМУ, вычислительная математика и кибернетика, № 2

Ограничимся теперь вариациями x(t) = x(t) > 0 на [ii, ¿2] • Для построения соответствующего допустимого процесса нам надо перейти к исходной нелинейной системе z = f(z,x,u), х = g(z,x,u). Согласно основному свойству уравнения в вариациях, для любого е > 0 найдется поправка w£ = (z£,x£,u£) с условием ||гое||оо ^ о(е), такая, что тройка w£ = wQ + ew + w£ удовлетворяет исходной системе на А2. Нетрудно показать, что для нее выполнены и ограничения x£(t) > О, (р(и£) < 0 на А2.

Достроим эту тройку, определенную на А2, до процесса на всем отрезке [0,Т]. На Ai зададим и£ = и0 (т.е. и = 0) и решим нелинейную систему с начальными значениями z£(ti), x£(ti). На A3 так же зададим и£ = и0 (т. е. и = 0) и решим нелинейную систему с начальными значениями z£(t2), x£(t2). Тем самым получаем процесс w£ = (z£,x£,u£) на всем отрезке [0,Т], который

/ \ ^ п т-г dw£(t) _ _ _

по определению удовлетворяет ограничению <р(ие) ^ и. При этом —-- = wit) = (z,x,u), где

ds

и = 0 на Ai U А3.

Лемма 4. На Ai U А3 при малых е > 0 выполнено x£(t) > 0.

Доказательство. Рассмотрим отрезок А3. На нем пара (ze,xe) удовлетворяет той же нелинейной системе, что и (z°,x°), но с измененными начальными условиями z£(t2), x£(t2). Тогда / dx \

пара ( z = -—х = —— 1 удовлетворяет системе линейных уравнений в вариациях z = f'zz + fxx,

ч <fe'~ de J ^.........................^ '.......

x = g'zz + gxx с начальными условиями z(t2) = (,(t2), x(t2) = x(t2). Поскольку с = x(t2) > 0, то при некотором S > 0 будет x(t) ^ с/2 на [t2, t2 + <5]. Тогда на этом отрезке x£(t) ^ ее/3 при достаточно малых е > 0. А поскольку x°(t) ^ const > 0 на [t2 + <5,Т], то здесь x£(t) > 0 при малых е > 0. Таким образом, x£(t) > 0 на всем отрезке А3. Отрезок Ai рассматривается аналогично.

Таким образом, построенный процесс w£ удовлетворяет всем ограничениям задачи, и поскольку w° доставляет слабый минимум, то —J(w£) = J'(w°)w ^ 0.

de

г=0

Применим лемму 2 для построенных выше функций т, к (см. (13)). Учтем, что к = 0 на А2, а и = 0 на Д1 и А3, и выполнены условия трансверсальности (15). Тогда левая часть (19) представляет собой ^ «/'(ад0)«), поэтому

¿2

(20)

Это неравенство выполнено для любой липшицевой функции х{Ь) = > 0 на А2. Возьмем теперь любую ^ 0 на А2. Приблизив ее равномерно функциями > 0 и перейдя к пределу в (20), получаем, что неравенство (20) справедливо для любой липшицевой ^ 0 на А2. Огра-

¿2

ничившись функциями >c(t), равными нулю в концах Д2, получим j rhx dt ^ 0, откуда вытекает,

ti

что rh(t) ^ 0 почти всюду на А2.

Рассмотрим теперь функции x(t), равные нулю на отрезке [t\ + ô, t2] при малом ô > 0, с условием >c{ti) = 1. При 8 0+ интеграл в правой части (20) стремится к нулю, поэтому ^A^x(ii)+m(ii+0) ^ 0, откуда с учетом равенства А'фх(ti) = —ai вытекает, что «i+m(ii+0) ^ 0. Аналогично, для точки t2 с учетом непрерывности фх в ней получаем, что m(t2 — 0) ^ 0. Таким образом, доказано следующее утверждение.

Лемма 5. Пусть w° доставляет расширенный слабый минимум в задаче А. Тогда

m(t) ^ 0 на Д2, ai + m(ti + 0) ^ 0, -m(t2 - 0) ^ 0.

Для того, чтобы "подравнять" значения скачков сопряженной переменной фх, введем на отрезке [0,Т] функцию

- ai — m{t\ + 0) на Ai, /j,(t) = •{ m(t) - m(t! + 0) на Д2,

- m(ti + 0) на A3.

Тогда, согласно лемме 5,

A/x(ii) = «1 + m(ti + 0) ^ 0, An(t2) = -m(t2 - 0) ^ 0, ß(t) ^ 0

почти всюду на [0, Т], а скачки фх в точках посадки и схода с фазового ограничения примут "симметричный" вид: Афх(и) = —A(i(ti), г = 1,2.

9. Основной результат. Итак, доказана следующая

Теорема. Пусть допустимый процесс w° = (z°(t),х°(t),и0(t)), такой, что x(t) = 0 на А® = [i?, > x(t) > 0 на [ta,T] \ (pi(u°(t)) < 0 на A2 и выполнено предположение (2), доставляет расширенный слабый минимум в задаче В. Тогда найдутся липшицевы функции ipz(t), ipt(t), кусочно-липшицевые на отрезках А,. / 1. 2. 3. функции ipx(t), ß(t) и измеримая ограниченная функция h(t) ^ 0, порождающие функцию Понтрягина H(t, z, х, и) = ipzf(z,x) + фхд(г,х,и) и расширенную функцию Понтрягина Н = i/;zf(z,x,u) + фхд(г,х,и) + ßx — h(p(u), такие, что ß = 0, h ^ 0 на Ai U А3, ß ^ 0, h = 0 на А2, и выполнены: сопряженные уравнения с условиями трансверсальности

' Фг = 4->zfz(z°-> - ifxg'z(z0,X°,U°), фг(г0) = J'z(Q), ф2(Т) = ~J'Z(T),

< Фх = ^Zf^(z°,x°,u0) -фхд'х(г0,х°,и0) - Д, фх{и) = Jx{Q), фх(Т) = -J^(r),

Jt = о,

условия скачка сопряженной переменной Афх(и) = —A/x(ij) ^ 0, г = 1,2, "ослабленный закон изменения энергии"

J H(t, z°, х°, и°) dt = 0, i = 1, 2, 3,

A i

и условие стационарности по управлению: Ни (t,zQ(t),xQ(t),uQ(t)) = 0 на [0,Т].

Замечание. При доказательстве теоремы варьирование исследуемого процесса выполнялось в два этапа, а не в один, как обычно. Сначала рассматривался не весь класс возможных вариаций, а только те, для которых х = const на отрезке выхода на фазовую границу Д2. Затем в полученные для этого суженного класса условия стационарности подставлялись "оставшиеся" вариации х ^ 0, сосредоточенные внутри отрезка Д2 и в окрестностях его концов, что позволило уточнить эти условия. Возможно, такой прием окажется полезным и в каких-то других задачах.

В заключение отметим, что имеется пример, в котором для рассматриваемой траектории существует единственный набор множителей, удовлетворяющий всем условиям теоремы, кроме условия ß ^ 0, которое не выполнено. Следовательно, это условие не вытекает из остальных, т. е. является содержательным. Имеется также пример стационарной траектории, для которой Афх^г,2) < 0, т.е. мера имеет атомы.

СПИСОК ЛИТЕРАТУРЫ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Понтрягин J1. С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М.: Наука, 1969.

2. Дубовицкий А.Я., Милютин A.A. Задачи на экстремум при наличии ограничений // ЖВМ и МФ. 1965. 5. № 3. С. 395-453.

3. Hartl F. Н., Sethi S. P., Vickson R. G. A survey of the maximum principles for optimal control problems with state constraints // SIAM Review. 1995. 37. N 2. P. 181-218.

4. Arutyunov A.V., Karamzin D.Y., Pereira F. L. The maximum principle for optimal control problems with state constraints by R.V. Gamkrelidze: revisited // J. Optim. Theory and Appl. 2011. 149. N 3. P. 474-493.

5. Dmitruk A.V., Osmolovskii N. P. Necessary conditions for a weak minimum in optimal control problems with integral equations on a variable time interval // Discrete and Continuous Dynamical Systems. 2015. 35. N 9. P. 4323-4343.

6. Dmitruk А. V., Kaganovieh A.M. The hybrid maximum principle is a consequence of Pontryagin maximum principle // System & Control Letters. 2009. 57. N 11. P. 964-970.

7. Milyutin A. A., Osmolovskii N. P. Calculus of Variations and Optimal Control. Providence: American Mathematical Society, 1998.

8. Милютин А. А., Дмитрук А.В., Осмоловский H. П. Принцип максимума в оптимальном управлении. М.: Изд-во Центра прикладных исследований при мех.-матем. ф-те МГУ, 2004.

Поступила в редакцию 21.09.15

STATIONARITY CONDITIONS IN OPTIMAL CONTROL PROBLEM FOR A TRAJECTORY WITH A SINGLE BOUNDARY SUBARC

Dmitruk A. V., Samylovskiy I. A.

We consider a class of optimal control problems with a scalar state constraint. For a trajectory with a single boundary subarc we first and obtain optimality conditions in the form of Gamkrelidze, and then, using a special technique (two-stage variation approach) obtain a full set of optimality conditions in the Dubovitskii-Milyutin form, including the nonnegativity of the measure density and its atoms at the junction points.

Keywords: control system, state constraint, replication of variables, stationarity conditions, nonnegativity of measure, atoms of measure, jumps of adjoint variable.

i Надоели баннеры? Вы всегда можете отключить рекламу.