Научная статья на тему 'Улучшение управлений в нелинейных системах на основе краевых задач'

Улучшение управлений в нелинейных системах на основе краевых задач Текст научной статьи по специальности «Математика»

CC BY
93
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / УЛУЧШЕНИЕ УПРАВЛЕНИЙ / КРАЕВЫЕ ЗАДАЧИ / OPTIMAL CONTROL / IMPROVEMENT OF CONTROLS / BOUNDARY VALUE PROBLEMS

Аннотация научной статьи по математике, автор научной работы — Булдаев Александр Сергеевич, Моржин Олег Васильевич

Показана принципиальная возможность нелокального улучшения в классе общих нелинейных задач оптимального управления со свободным правым концом. Предлагаемые процедуры обладают возможностью улучшения управления, удовлетворяющего принципу максимума. На основе процедур получены новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач. Приводятся иллюстрирующие примеры.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Improvement of controls in nonlinear systems on basis of boundary value problems

It"s shown the principal possibility for nonlocal improvement for common nonlinear optimal control problems with free terminal state. The suggested procedures have the possibility for improvement of control, which satisfies the principle of maximum. On bases of these procedures new necessary optimality conditions were created, which deepen the principle of maximum in the considered class of problems. There are some illustrative examples.

Текст научной работы на тему «Улучшение управлений в нелинейных системах на основе краевых задач»

Серия «Математика»

Том 2 (2009), № 1, С. 94-106

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 517.977

Улучшение управлений в нелинейных системах на основе краевых задач *

А. С. Булдаев

Бурятский государственный университет

О. В. Моржин

Бурятский государственный университет

Аннотация. Показана принципиальная возможность нелокального улучшения в классе общих нелинейных задач оптимального управления со свободным правым концом. Предлагаемые процедуры обладают возможностью улучшения управления, удовлетворяющего принципу максимума. На основе процедур получены новые необходимые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач. Приводятся иллюстрирующие примеры.

Ключевые слова: оптимальное управление, улучшение управлений, краевые задачи.

Рассматривается задача оптимального управления со свободным правым концом:

x(t) = f (x(t),u(t),t), x(t0) = x0, u(t) € U, t € T = [to,ti], (1-2)

в которой x(t) = (x1(t), ...,xn(t)) - вектор состояния, u(t) = (u1(t),..., um(t)) - вектор управления. В качестве допустимых управлений берется множество V кусочно-непрерывных на T функций со значениями в компактном множестве U С Rm. Начальное состояние x0 и промежуток управления T заданы.

* Работа выполнена при финансовой поддержке РФФИ (проекты 08-01-00945-а, 09-01-90203-Монг-а), РГНФ (проект 09-02-00493-а).

1. Введение

Ф^) = (p(x(t{)) + J F(x(t),u(t),t)dt ^ inf, T = [t0,t1], (1.1)

T

Аналогично [1 - 3] задача (1), (2) рассматривается при следующем наборе условий:

1) функция ^(х) непрерывно-дифференцируема в Кп, функции Г(х,и,г), /(х,и,г) и их производные Гх(х,и,г), Ги(х,и,г), /х(х,и,г), /и(х,и,г) непрерывны по совокупности аргументов (х,и,г) на множестве Еп х и х Т;

2) функция /(х,и,г) удовлетворяет условию Липшица по х в Кп х и х Т с константой Ь > 0: \\/(х, и, г) — /(у, и, г)|| < Ь\\х — у\\.

Условия гарантируют существование и единственность решения

х(Ь,ь), г € Т системы (2) для любого допустимого управления ь(Ь),

г € т .

Рассмотрим функцию Понтрягина с сопряженной переменной ф € Еп:

н (ф, х, и, г) = (ф, / (х, и, г)) — г (х, и, г).

Для допустимого управления V € V обозначим ф(Ь, у), Ь € Т - решение стандартной сопряженной системы

ф(г) = —Нх(ф(г),х(г),и(г),г), г € т, ф(гх) = —^х(х(г\)) при и(г) = у(г), х(г) = х(г,у).

С помощью отображения

и*(ф,х,г) = а^тахН(ф,х,и,г), ф € Еп, х € Еп, г € Т,

и,£и

принцип максимума для управления и € V представляется в виде

и(г) = и*(ф(г,и),х(г,и),г), г € т. (1.3)

Краевая задача принципа максимума имеет вид:

х(г) = /(х(г),и*(ф(г),х(г),г),г), х(г0) = х0, ф(г) = —Нх(ф(г),х(г),и*(ф(г),х(г),г),г), ф(гх) = —^х(х(г{)).

В общем случае правые части краевой задачи разрывны по фазовым переменным х, ф.

2. Краевая задача улучшения

Частное приращение произвольной вектор-функции д(у\, ...,у{) по переменным у31, у32, ... будем обозначать

^Уа1 +Дуг,1 , Уз2 +ДУз2 , ...д(у1, ■■■, у1) =

= д(у\,...,ув1 +^ув1 ,...,уз2 +^уз2 ,...,уг) — д(у\,...,уг)■

Приращение функционала (1) на допустимых управлениях и0, V в соответствии с принятым обозначением записывается в виде

АьФ(и0) = Ах(г1^(х(гг,и0))^ ^х(г^), ь(г)Р(х(г,и0),и0(г),г)М. (2.1)

т

Дополнительно обозначим Ах (г) = х(г,у) — х(г,и0).

Введем дифференцируемую вектор-функцию р(г) = (р\(г), ■■■,рп(г)) с условием

р(Ь\) = —(рх(х(гг,и0)) — д, (2.2)

где величина д удовлетворяет алгебраическому уравнению

(ух(х(г1,и0)), Ах(гг)^ + (д, Ах(г^) = Ах(г1^(х(гг,и0)). (2.3)

Тогда приращение терминальной части функционала в выражении (4) можно записать в виде

С d

Ах^1,ь)<р(х(г1,и0)) = — (р(Ь\), Ах(гг)) = — I — (р(г), Аx(г))dг =

т

= — ! {(р(г), Ах(г)) + (р(г), Ах^,ь), ьщ/(х(г,и0),и0(г),г))} ей. т

С помощью полученного соотношения приращение функционала (4) принимает вид

АьФ(и0) = —J {(р(г), Ах(г)) + Ах^,„), ь(г)Н(р(г),х(г,и0),и0(г),г)} ей =

= -1 {(р(г), Ах(г)) + Аь^н(р(г),х(г,у),и0(г),г)+ т

+Ах^ ь)Н (р(г), х(г, и0), и0 (г), г)} dг■

(2.4)

Введем модифицированную сопряженную систему для функции р(г), удовлетворяющей условиям (5), (6), в форме:

р(г) = —Нх(р(г),х(г,и0),и0(г),г) — г(г), (2.5)

где переменная величина г(г) = (г\(г), ■■.,гп(г)) определяется в каждый момент времени г € Т из алгебраического уравнения

(Нх(р(г),х(г, и0), и0 (г), г), Ах(г)) + (г(г), Ах(г)) =

= Ах(г , ь)Н (р(г),х(г,и0),и0(г),г). ( )

Тогда в силу дифференциально-алгебраической системы (8), (9) для р(г) с начальными условиями (5), (6) формула приращения (4) принимает вид

Аь Ф(и0) = — ! а^н (p(г),x(г,v),u0(г),г)dг■ (2.7)

т

(2.10)

Поставим задачу улучшения управления и0 € V по функционалу (1): найти управление V € V с условием Ф(у) < Ф(и0).

Рассмотрим дифференциально-алгебраическую систему

х(г) = /(х(г),и*(р(г),х(г),г),г), х(г0) = х0, (2.8)

'р>(г) = —Нх(р(г),х(г,и0),и0(г),г) — г(г), (2.9)

(Нх(р(г), х(г, и0),и0(г),г), х(г) — х(г, и0)) +

+(г(г),х(г) — х(г, и0)) = Ах^)Н (р(г),х(г, и0), и0 (г), г),

р(гг) = —ух(х(г1,и0)) — д, (2.11)

(ух(х(г1,и0)),х(г\) — х(г1,и0)) + (д, х(гг) — х(гг,и0)) = Ах(г1)у(х(гг, и0)).

(2.12)

Уравнение (13) можно явно разрешить относительно г(г) через х(г), р(г). Действительно, в случае линейных по х функций /, Г получаем (г(г), х(г) — х(г,и0)) = 0, г € Т. В этом случае положим г(г) =0, г € Т.

В нелинейном случае переменную величину г(г) можно построить по следующему правилу. Если для некоторого к выполняется хк (г) = 0\ „ лл _ п „• _± ь. _ АхН — (Нх, Ах)

хк(г, и0) , то можно взять Тг(г) =0, % = к, Гк (г) = .

Ахк

Если для всех г имеем хг(г) = хг(г, и0), то полагаем г (г) = 0.

Аналогично указанному правилу уравнение (15) можно явно разрешить относительно д. При линейной зависимости функции у определяем д = 0. В нелинейном случае, если Уг хг (гг) = хг(г\,и0), то д = 0;

0^_____ п . / „ АхУ — (ух, Ах)

иначе, если Эк хк (гг) = хк (гг, и0), то дг = 0, г = к, дк = . •

Ахк

Таким образом, от дифференциально-алгебраической системы (11)

- (15) можно перейти к вспомогательной двухточечной краевой задаче для обыкновенных дифференциальных уравнений

х(г) = /(х(г),и*(р(г),х(г),г),г), х(г0) = х0, р(г) = —Нх(р(г),х(г,и0),и0 (г), г) — Е(р(г),х(г),г), р(гг) = —Ух(х(гг,и0)) — Я(х(гг)).

При этом функции Е(р,х,г), Q(x) в общем случае определяются неоднозначно.

Предположим, что краевая задача (11) - (15) имеет решение (х(г), р(г)), г € Т (возможно, не единственное), а управление, формируемое по правилу

у(г) = и*(р(г),х(г),г), г € т, (2.13)

является кусочно-непрерывным. Тогда х(г) = х(г, у) и, в силу определения отображения и*, получаем Аь^Н(р(г),х(г,у),и0(г),г) > 0. Отсюда и из формулы (10) следует, что АьФ(и0) < 0.

(2.15)

Рассматриваемый подход к улучшению управления можно формализовать следующим образом. Введем дифференциально-алгебраическую сопряженную систему

р(г) = —Нх(р(г),х(г),'ш(г),г) — г (г), (2.14)

(Нх(р(г),х(г)^(г),г),у(г) — х(г)) + (г(г),у(г) — х(г)) = = Ау(г)Н (р(г),х(г)^(г),г)

с краевыми условиями

р(гг) = —Ух(х(гг)) — д, (2.16)

(ух(х(гг)),у(гг) — х(гг)) + (д, у(гг) — х(гг)) = Ау[Н)у(х(гг)). (2.17)

По определению положим г(г) = 0, если /, Г - линейны по х. Также определим д = 0, если у - линейна. В нелинейных случаях, если в некоторый момент времени г € Т у (г) = х(г), то полагаем г(г) = 0. При этом, если г = гг , то д = 0.

В остальных случаях можно явно разрешить г(г), д из алгебраических уравнений аналогично тому, как было сделано выше. Таким

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

образом, система (17) - (20) может быть сведена к вспомогательной

дифференциальной сопряженной системе (возможно, не единственным образом).

Для допустимых управлений и, V обозначим р(г, и, у), г € Т - решение системы (17) - (20) при х(г) = х(г,и), ,ш(г) = и(г), у (г) = х(г,у).

Из определения следует, что р(г, и, V) = ф(г, и), г € Т.

Формула приращения функционала (10) в новых обозначениях принимает вид

Аь Ф(и0) = — у Аь(1)Н (р(г,и0,у),х(г,у),и0(г),г)сМ. т

Выходное управление, формируемое по правилу (16), записывается в виде

у(г) = и*(р(г,и0,у),х(г,у),г), г € т. (2.18)

Обозначим множество допустимых выходных управлений дифференциально-алгебраической краевой задачи (11) - (15):

V(и0) = {у € V: у(г) = и*(р(г,и0,у),х(г,у),г), г € т}. Имеем, если и0 € V(и0), то и0(г) = и*(р(г, и0,и0),х(г,и0),г) = и*(ф(г, и0),х(г, и0),г), г € т,

т.е. управление и0 удовлетворяет условию принципа максимума (3).

Обратно, если и0 удовлетворяет принципу максимума, то оно удовлетворяет условию (21) при V = и0. Следовательно, и0 Є V(и0).

Это значит, что краевая задача (11) - (15) для управления и0, удовлетворяющего принципу максимума, всегда допускает решение х(і) =

х(і,и0), р(і) = ф(і,и0).

Таким образом, если краевая задача (11) - (15) не имеет решения, то и0 (і) не удовлетворяет принципу максимума.

Принцип максимума в задаче (1), (2) в терминах решения краевой задачи (11) - (15) принимает следующую форму.

Принцип максимума. Для оптимальности управления и0 Є V необходимо, чтобы пара (х(і,и0),ф(і,и0)) была решением краевой задачи

(11)-(15).

В случае линейной по состоянию задачи (1), (2) (функции f (х,и,і), Е(х,и,і), у(х) линейны по х) краевая задача (11) - (15) сводится к двум задачам Коши для сопряженной и фазовой систем. При этом предлагаемая процедура улучшения становится эквивалентной известному х-методу нелокального улучшения [2].

3. Модифицированная краевая задача

С целью повышения качества метода улучшения применим квадратичную фазовую модификацию целевого функционала (1) по аналогии с [2-3]. Модификация позволяет получить новые условия оптимальности, усиливающие принцип максимума в рассматриваемом классе задач. Модифицированный метод строго улучшает любое управление, не удовлетворяющее принципу максимума.

Пусть (и0(і), х(і,и0)), (и(і), х(і,и)), і Є Т - допустимые процессы в задаче (1), (2). Введем модифицированный функционал

Фа(и,и°) = Ф(и) + аЗ(и,и0), а > 0, (3.1)

где З(и,и0) - средневзвешенное фазовое отклонение

З (и, и0) = 2 I (В (х(і, и) — х(і, и0)), х(і, и) — х(і, и°))йі, т

В - ненулевая, симметричная, положительно-определенная матрица (В = 0, Вт = В, В> 0).

В принятых условиях имеем З(V,и0) > 0, V Є V, V = и0.

Поставим задачу улучшения и0 по функционалу Фа: найти управление Vа Є V с условием Фа(Vа,и0) < Фа(и0,и0) = Ф(и0). Тогда управление Vа Є V обеспечивает уменьшение исходного целевого функционала

с оценкой

Ф^а) — Ф(и0) < —аЗ(Vа,и0). (3.2)

Фазовая модификация не изменяет структуру задачи. Таким образом, для построения модифицированного метода улучшения можно использовать разработанный выше подход.

Для модифицированного функционала (22) функция Понтрягина с сопряженной переменной ф € Кп принимает вид

На(ф, х, и, Ь) = Н(ф, х, и, Ь) — 1 а(Б(х — х(Ь, и0)), х — х(Ь, и0)).

Модифицированная дифференциально-алгебраическая краевая задача приобретает форму

х(Ь) = /(х(Ь),и*(р(Ь),х(Ь),Ь),Ь), х(Ь0) = х0, (3.3)

р(Ь) = —Нх(р(Ь),х(Ь,и0),и0(Ь),Ь) — т(Ь), (3.4)

(Нх(р(Ь),х(Ь,и0),и0(Ь),Ь), х(Ь) — х(Ь,и0))+

+(т(ь),х(ь) — х(ь,и0)) = Ах(г)Н (р(ь),х(ь,и0),и0(ь),ь)— (3.5)

—1 а(Б(х(Ь) — х(Ь, и0)), х(Ь) — х(Ь, и0)),

р(Ь) = —<рх(х(Ь,и0)) — д, (3.6)

(^х(х(Ь\, и0)), х(Ь\) — х(Ь1,и0)) + (д, х(Ьг) — х(Ь1,и0)) = Ах^^ЫЬ, и0)).

(3.7)

Модифицированная дифференциально-алгебраическая сопряженная система имеет вид

р(Ь) = —Нх(р(Ь),х(Ь),,ш(Ь),Ь) + аБ(х(Ь) — х(Ь, и0)) — т(Ь), (3.8)

(Нх(р(ь),х(ь)^(ь),ь) — аБ(х(г) — х(г,и0)), у(г) — х(ь))+ ( )

(т(ь), у(г) — х(г)) = АуфНа(р(г),х(г),'ш(г),г) (.)

с краевыми условиями

р(Ьх) = —<рх(х(ь)) — д, (3.10)

(ух(х(Ь\)), у(Ь\) — х(Ьг)) + (д,у(Ь\) — х(Ь)) = Ау(^1)^(х(г{)). (3.11)

Для допустимых управлений и,у обозначим ра(Ь,и,у) , Ь € Т - решение системы (29) - (32) при х(Ь) = х(Ь,и), ,ш(Ь) = и(Ь), у(Ь) = х(Ь,у). Понятно, что ра(Ь, и0, и0) = ф(Ь, и0), Ь € Т.

Формула приращения функционала (22) на управлениях и0, у € V принимает вид

АФа(у,и0) = — ! А^Н(ра(Ь,и0,у),х(Ь,у),и0(Ь),Ь)М, т где АФа(у,и0) = Фа(у,и0) — Фа(и0,и0).

Предположим, что решение (ха(Ь),ра(Ь)), Ь € Т краевой задачи (24)

- (28) (возможно, не единственное) существует на интервале Т, причем выходное управление уа(Ь) = и*(ра(Ь),ха(Ь),Ь), Ь € Т является кусочнонепрерывным.

Имеем ха(Ь) = х(Ь, уа), ра(Ь) = ра(Ь, и0, уа), Ь € Т. При этом

уа(Ь)= и*(ра(1,и0,уа),х(1,уа),1), Ь € Т. (3.12)

Тогда в силу отображения и* получаем

А^^Н(ра(Ь,и0,уа),х(Ь,уа),и0(Ь),Ь) > 0, Ь € Т.

Отсюда и из формулы приращения функционала следует, что АФа(уа,и0) < 0. Таким образом, выходное управление уа, а > 0 обеспечивает невозрастание функционала (1) с оценкой (23).

При а = 0 (отсутствие модификации) рассматриваемый метод совпадает с первым методом. Значение а > 0 соответствует модификации первого метода.

Рассмотрим множество Vа(и0) управлений на выходе модифицированного метода улучшения, характеризуемых равенством (33). Аналогично немодифицированному методу можно получить следующее утверждение.

Управление и0 € V удовлетворяет принципу максимума тогда и только тогда, когда и0 € Va(u0) хотя бы для одного а > 0.

Отметим, что, если и0 € V удовлетворяет принципу максимума (3), то и0 € Va(u0) для всех а > 0.

Принцип максимума в терминах решения краевой задачи (24) - (28) принимает следующую формулировку.

Принцип максимума. Для оптимальности управления и0 € V в задаче (1), (2) необходимо, чтобы пара (х(Ь,и0),ф(Ь,и0)) была решением краевой задачи (24) - (28) хотя бы для одного а > 0.

Сформулируем аналогично [2 - 3] новое усиленное необходимое условие оптимальности на основе модифицированного метода улучшения.

Условие А. Для оптимальности управления и0 € V в задаче (1), (2) необходимо, чтобы пара (х(Ь,и0),ф(Ь,и0)) была единственным решением краевой задачи (24) - (28) для всех а > 0.

Действительно, если для некоторого а > 0 имеем уа = и0, уа € Va(u0), то на основании оценки (23) получаем строгое улучшение Ф(уа) < Ф(и0).

Очевидно, что принцип максимума является следствием условия А. Это значит, что модифицированный метод может строго улучшать управления, удовлетворяющие принципу максимума и не удовлетворяющие условию А.

В силу оценки (23) модифицированный метод (а > 0) позволяет строго улучшать любые управления, не удовлетворяющие принципу максимума.

В случаях, когда рассматриваемые краевые задачи улучшения не имеют решения, управление и0 Є V не удовлетворяет принципу максимума. Тогда нужно перейти к другим методам улучшения.

4. Примеры

Пример 1 (улучшение особого управления). Рассматривается задача [4, с. 220]:

Ф(и) = x2(1) ^ inf, T = [0,1],

xi = и, X2 = —Xi, xi(0) = 0, x2(0) = 0, lu(t)l < 1, t € T.

Функция Понтрягина H = piu — p2xf, отображение u*(p,x,t) = signpi.

Рассмотрим управление u0(t) = 0, которое является особым. Оно не удовлетворяет необходимому условию оптимальности 2-го порядка [1]. Имеем xi(t,u0) = x2(t,u0) =0, t € T, Ф(и0) = 0. При этом AxH(p,x(t,u0),u0(t),t) = —p2x2, Axi(t) = xi(t), Ax2(t) = x2(t).

Дифференциально-алгебраическая краевая задача улучшения для и0 имеет вид

x l(t) = signpi (t), x 2 (t) = xf (t), pi(t) = —ri(t), p2 (t) = —T2(t),

xi(0) = 0, x2(0) = 0, pi(1)=0, p2(1) = —1,

Г i (t)xi(t) + r2(t)x2(t) = p2 (t')x'i (t).

Если xi(t) = xi(t, u0) = 0, i = 1, 2, то полагаем ri(t) = 0, i = 1, 2.

Если xi(t) = 0, то положим r2(t) = 0. Имеем ri(t)xi(t) = —p2(t)x‘i(t) или ri(t) = —p2(t)xi(t).

Если xi(t) = 0, x2(t) = 0, то положим ri(t) = 0. Получаем

r2(t)x2(t) = 0 или r2(t) = 0.

Таким образом, получаем явные функции Ri(p,x,t) = —p2xi, R2(p, x,t) = 0 для вспомогательной дифференциальной краевой задачи, которая сводится к упрощенной задаче:

xi = signpi(t), pi(t) = —xi(t), xi(0) = 0, pi(1) = 0.

Предположим, что pi(0) > 0. Тогда xi(t) = 1, xi(t) = t, pi(t) = ^(1 — t2) на [0,1]. Следовательно, краевая задача улучшения допускает

решение с выходным управлением v(t) = 1. При этом Ф(-и) =----------------<

3

Ф(и0) = 0.

Предположим, что pi(0) < 0. Тогда xi(t) = —1, xi(t) = —t, pi(t) =

^(t2 — 1) на [0,1]. Таким образом, краевая задача допускает второе

решение с выходным управлением ь(Ь) = — 1. При этом также Ф(-и) =

- о < Ф(и°) = 0.

3

Далее, предположим, что р\(^ = 0 при £ > 0. Тогда Х\(1) = 0. При этом получаем тривиальное решение краевой задачи улучшения, которое обязана иметь краевая задача, удовлетворяющая принципу максимума.

В итоге процедура улучшения дает два улучшающих управления

у(г) = ±1.

Пример 2 (эффект модификации). Рассматривается известная модельная задача [5, с. 57 - 58]:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П

Ф(и) = І (и2(і) — х2(і)^ йі ^ ,

х(і) = и(і), х(0) = 0, и(і) Є Я, і Є Т = [0, п].

В данном случае Н = фи — и2 + х2, ф(і) = —2х(і), ф(п) = 0. Максимизирующее отображение и* = ^ ф.

Выделим управление и0(і) =0, і Є Т с соответствующими траекториями х(і,и0) = 0, ф(і,и0) = 0, і Є Т. Данное управление является особым.

Краевая задача улучшения без учета модификации (а = 0) имеет вид

х(і) = 2р®, х(0) = 0, р(і) = —г(і), р(п) = 0, г(і)х(і) = х2(і).

Если х(і) = 0, то по определению полагаем г(і) = 0. Если х(і) = 0, то получаем х(і) = г (і).

В итоге явная функция принимает вид Я(р, х,і) = х и краевая задача сводится к задаче

х(і) = 2р(і), х(0) = 0, р(і) = —х(і), р(п) = 0.

Нетрудно показать, что эта краевая задача имеет единственное нулевое решение, соответствующее управлению и0. Таким образом, немо-дифицированная процедура улучшения строго не улучшает исходное управление и0.

Модифицируем метод улучшения введением функционала (В = 2Е)

П П

Фа(и) = ! (и2(і) — х2(і)) йі + а] х2(і)йі, а > 0.

0

В этом случае Ha = pu — и2 + (1 — a)x2. Краевая задача в модифицированном методе улучшения принимает вид

X(t) = 2p(t), x(0) = 0, p(t) = —r(t), p(n) = 0, r(t)x(t) = (1 — a)x2(t).

Отображение R принимает вид R(p,x,t) = (1 — a)x. Отсюда получаем вспомогательную краевую задачу

x(t) = 2p(t), x(0) = 0, p(t) = —(1 — a)x(t), p(n) = 0.

При a = — эта краевая задача кроме нулевого решения имеет ненулевое решение x(t) = C sin 2, p(t) = C cos^2, t € T, C = 0. В итоге

кроме нулевого управления на выходе модифицированной процедуры

Ct

реализуется ненулевое выходное управление v(t) = — cos —, t € T. При

этом, согласно оценке (23), достигается строгое улучшение управления

1 ж

и0 с приращением исходного функционала AvФ(и0) =----------/ x2(t)dt =

2 о

C2

—— п < 0.

4

Таким образом, модификация метода улучшения приводит к строгому улучшению особого управления, которое не улучшается немодифи-цированной процедурой.

Пример 3 (задача с терминальным функционалом). Рассматривается известная задача [4, с. 214]:

Ф^) = sin 'nx2(l') ^ inf, T = [0, l],

x(t) = u(t), x(0) = 2, \u(t)\ < l, u0(t) = —l, t Є T.

Имеем x(t,u0) = —t + 2. Значение Ф^0) = l.

Функция Понтрягина H(p,x,u,t) = ^u. Стандартная сопряженная система

• . . , . . п nx(l)

rn = 0 ф(і) = — 2cos^~

имеет решение ф(t, u0) = 0.

Поскольку

H (ф(t,u°),x(t,u° ),u0(t),t) = 0, Hu(^(t,u0),x(t,u0),u0 (t),t) = 0,

AUH(ф(t, u0), x(t, u0), u0(t),t) = 0,

то управление u0(t) = 0 особое на T.

Отображение u*(p,x,t) = signp. Краевая задача улучшения имеет вид:

x(t) = signp(t), x(0) = 2, p(t) = 0, p(1) = —q,

q(x(1) — 1) = sin 2x(1) — 1.

Если x(1) = 1, то полагаем q = 0. Если x(1) = 1, то полагаем

п

sin — x(1) — 1 q = x(1) — 1 ■

Таким образом, функция Q имеет вид

{sin —x — 1

xr—i ' x = 1;

0, x = 1.

Получаем вспомогательную краевую задачу x(t) = signp(t), x(0) = 2,

p(t) = 0, p(1) = —Q(x(1)). Имеем p(t) = —Q(x(1)), t € T.

Предположим, что p(0) > 0 (или Q(x(1)) < 0), отсюда получаем начальную задачу x(t) = 1, x(0) = 2, имеющую решение x(t) = t + 2, t € T. При этом Q(x(1)) = —1 < 0. Таким образом, краевая задача улучшения допускает решение x(t) = t + 2, t € T с выходным управлением v = 1, которое улучшает исходное управление: Ф^) = —1 < Ф(и0) = 1.

В [4, с. 214] показано, что управление v = 1 является особым

(•0(t, v) = 0) и удовлетворяет необходимому условию оптимальности 2-го порядка, и поэтому является подозрительным на оптимальность.

Заключение

Выделим основные свойства предлагаемых процедур улучшения в рассматриваемом классе нелинейных задач:

1) трудоемкость улучшения определяется трудоемкостью решения специальной краевой задачи, которая по свойствам гладкости существенно проще краевой задачи принципа максимума;

2) в линейной по состоянию задаче оптимального управления со свободным правым концом процедура улучшения сводится к двум задачам Коши для фазовой и сопряженной систем;

3) нелокальность улучшения управления, т.е. улучшаемое и улучшающее управления не связаны параметром близости;

4) отсутствие процедуры слабого или игольчатого варьирования управления, характерной для стандартных локальных методов улучшения;

5) возможность улучшения управлений, удовлетворяющих принципу максимума (в том числе, особых управлений). Такая возможность появляется в случае неединственности решения краевой задачи улучшения.

Список литературы

1. Васильев О. В. Лекции по методам оптимизации / О. В. Васильев. — Иркутск: Изд-во Иркутск. ун-та, 1994. — 340 с.

2. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. — М.: Физматлит, 2000. — 160 с.

3. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем / А. С. Булдаев. — Улан-Удэ: Изд-во Бурятск. гос. ун-та, 2008. — 260 с.

4. Габасов Р. Качественная теория оптимальных процессов / Р. Габасов, Ф. М. Кириллова. — М.: Наука, 1973. — 508 с.

5. Гурман В. И., Батурин В. А., Расина И. В. Приближенные методы оптимального управления / В. И. Гурман, В. А. Батурин, И. В. Расина. — Иркутск: Изд-во Иркут. ун-та, 1983. — 180 с.

A. S. Buldaev, O. V. Morzhin

Improvement of controls in nonlinear systems on basis of boundary value problems

Abstract. It’s shown the principal possibility for nonlocal improvement for common nonlinear optimal control problems with free terminal state. The suggested procedures have the possibility for improvement of control, which satisfies the principle of maximum. On bases of these procedures new necessary optimality conditions were created, which deepen the principle of maximum in the considered class of problems. There are some illustrative examples.

Keywords: optimal control, improvement of controls, boundary value problems.

Булдаев Александр Сергеевич, доктор физико-математических наук, доцент, Бурятский государственный университет, 670000, Республика Бурятия, г. Улан-Удэ, ул. Смолина, 24а, 3-я приемная, тел.: (3012) 211691, (buldaev@bsu.ru)

Моржин Олег Васильевич, ассистент кафедры прикладной математики, Бурятский государственный университет, 670000, Республика Бурятия. г. Улан-Удэ, ул. Ранжурова, 5, каб. 1203, тел.: (3012) 21-97-57, (oleg-morzhin@yandex.ru)

Buldaev Alexander Sergeevich, Doctor of physical and mathematical sciences, associate professor, Buryat State University, 24a, Smolina Str., Ulan-Ude, Republic of Buryatia, Russia, 670000, Phone: (3012) 211691, (buldaev@bsu.ru)

Morzhin Oleg Vasilievich, Junior member of teaching, Buryat State University, Office 1203, Ranzhurova Str. 5, Ulan-Ude, Republic of Buryatia, Russia, 670000, Phone: (3012) 21-97-57, (oleg-morzhin@yandex.ru)

i Надоели баннеры? Вы всегда можете отключить рекламу.