I. УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.977.5 © А.С. Булдаев, Б. Очирбат, И.-Х.Д. Хишектуева
ПОИСК НЕПОДВИЖНЫХ ТОЧЕК ОПЕРАТОРОВ ПРОЕКТИРОВАНИЯ В ЗАДАЧАХ ПАРАМЕТРИЧЕСКОЙ ОПТИМИЗАЦИИ СИСТЕМ
Работа выполнена при финансовой поддержке РФФИ в рамках научных проектов №№ 12-01-00914-а, 12-01-98011-р_сибирь_а
Предлагается новый подход к улучшению управляющих параметров систем на основе построения и решения задачи о неподвижной точке определяемого оператора проектирования. Рассматриваемая процедура имеет возможность улучшать управления, удовлетворяющие принципу максимума, и позволяет получить усиленное необходимое условие оптимальности.
Ключевые слова: нелокальное улучшение, задача о неподвижной точке, оператор проектирования.
A.S. Buldaev, B. Ochirbat, I.-Kh.D. Khishektueva
SEARCH OF THE FIXED POINTS OF OPERATORS OF PROJECTION IN THE PROBLEMS OF PARAMETRIC OPTIMIZATION OF SYSTEMS
A new approach for improving control parameters of systems on the basis of construction and solution of the problem of fixed point defined by projection operator is proposed. The procedure can improve controls, which satisfy principle of maximum, and provides a necessary condition for optimality.
Keywords: non-local improvement, problem on fixed point, operator ofproiection.
1. Метод улучшения
Рассматривается задача оптимизации управляющих параметров
O(u) = (p(x(tj) +f F(x(t),u, t)dt ^ min, (1)
J T ueU
x(t) = f (x(t),u,t), x(t0) = x0, t eT = [t0,t1], (2)
А.С. Булдаев, Б. Очирбат, И.-Х.Д. Хишектуева. Поиск неподвижных точек операторов проектирования в задачах параметрической оптимизации систем
в которой x(t) = (x1(t),..., xn (0) - вектор состояния, u = (и^..., um) - вектор управляющих параметров со значениями в выпуклом множестве U с Rm. Начальное состояние x0 и промежуток управления T заданы.
Предполагаются выполненными следующие условия (ДПМ-условия [1]):
1) функция р(x) непрерывно-дифференцируема на Rn, вектор-функция F(x, u, t), векторная функция f (x, u, ^ и их производные Fx(x,u, t), Fu (x,u, t), fx(x,u, t), /и u,^ непрерывны по совокупности аргументов (x,u, t) на множестве Rn х U х Т;
2) функция f (x,и,^ удовлетворяет условию Липшица по x в Rn х и х Т с константой L > 0
(x,и, t) - f (у,и, < Щр - у|| .
ДПМ-условия гарантируют существование и единственность решения x(t, V), t е Т системы (2) для любого допустимого управления V е и .
Введем функцию Понтрягина с сопряженной переменной ц е Rn
Н (ц, x, и, t) = ( f (x, и, t ),Ц - F (x, и, t).
Для допустимого управления V еи обозначим ц^, V), t е Т - решение стандартной сопряженной системы
Ц(t) = -Нх(Ц),x(t),и,t), t е Т , Ц1) = -рх(x(tl)) при и = V, x(t) = x(t, V) .
Дифференциальный принцип максимума (ДПМ) для управления и еи с помощью оператора проектирования Ри на множество и представляется в виде
и = Ри (и + а| Ни (ц^,и), x(t,и),и, t, а > 0. (3)
Для выполнения ДПМ достаточно проверить условие (3) хотя бы для одного а > 0 .
Стандартные методы условного градиента и проекции градиента для задачи (1), (2) обеспечивают сходимость к нулю невязки ДПМ. Релаксация по целевой функции (1) на каждой итерации этих методов достигается поиском специального параметра, регулирующего область варьирования управления. Этот параметрический поиск является наиболее трудоемкой частью итерационного процесса, и улучшение управления достигается в достаточно малой окрестности варьируемого управления.
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
(5)
Предлагаемый в статье метод не содержит операцию параметрического варьирования управления на каждой итерации улучшения, характерную для градиентных методов, и позволяет получать нелокальные улучшающие управления.
Аналогично [2; 3] рассмотрим дифференциально-алгебраическую сопряженную систему
р (Х) = -Их (р(Х), х(Х), ^ Х) - г (Х), (4)
(Их (р(Х), х(Х), Х), у (Х) - х(Х)) + (г(Х), у(Х) - х(Х)) = = А у (х) И (р(Х), х(Х), X) с краевыми условиями
Р(Х\) = -фх(х(О) - Ч , (6)
(х(О), у (О - х(О) + (ч,у(Х[) - х(Х1^ = Ау(^х(Х1)) . (7)
Система (4)-(7) аналогично [2; 3] всегда может быть сведена к вспомогательной дифференциальной сопряженной системе. Предположим, что вспомогательная сопряженная система допускает решение р(Х,и,V), Х еТ для допустимых управлений и,V при ^ = и , х(Х) = х(Х,и), у(Х) = х(Х,V). Таким образом, на основе решения системы (4)-(7) можно построить однозначное отображение Р(и,V) = р(Х,и,V), Х еТ на множестве и х и (возможно, не единственным образом).
При этом всегда выполняется р(Х,и,и) = у(Х,и), Х еТ и в линейной по состоянию задаче (1),(2) (функции f (х,и,Х), F(х,и,Х), (р(х) линейны по х ) сопряженная система (4)-(7) сводится к стандартной, допускающей единственное решение у/(Х,и), Х еТ .
Поставим задачу об улучшении управления и е и : найти управление V е и с условием АуФ(и) < 0 .
Управляющий вектор параметров в задаче (1), (2) рассмотрим как постоянную векторную функцию времени на интервале Т . Тогда из формулы приращения целевого функционала в задаче оптимального управления, полученной в работе [2], в качестве очевидного следствия следует формула приращения целевой функции в задаче (1), (2)
А„Ф(и) = АИ(р(Х,и, V), х(Х,V),и, Х^Х' (8)
Формула (8) позволяет сконструировать метод нелокального улучшения допустимого управления и0 е и в задаче (1), (2).
Проекционный метод улучшения: для заданных а > 0 и и е и определим отображение Жа с помощью соотношения
Жа(и, V, 5) = Ри (и + а(| Ии (р(Х, и, V), х(Х, V), и, Х^Х + 5)), и еи, V еи,
5 е Rm
А.С. Булдаев, Б. Очирбат, И.-Х.Д. Хишектуева. Поиск неподвижных точек операторов проектирования в задачах параметрической оптимизации систем
и рассмотрим систему
V = Ж"(и, V, s), (9)
Г Л^Н(р(г,и,V),х(г,V),и,=
/ ^ \ (10) = ({гНи(Р(г,и,V),х(г,V),и,t)dt,V-и\ + (я,V-и^ .
Предположим, что система (9), (10) допускает решение (Vй,я"). Покажем, что решение Vй е и обеспечивает улучшение.
Согласно известному свойству проекции выполняется неравенство
( Г Ни (р(г, и, Vй), х(г, V"), и, t )dt + sa,va - и )> !| V" - и||2.
^ 1т а 11 11
Отсюда и из формулы (8) следует уменьшение целевой функции с оценкой
Л^ ф (и) = Ни (Р(г, и, V"), х(г, V"), и,г)dt + я", V" - и^ <
, (12)
1 и " п2
<--V" - и
а 11 11
Таким образом, метод нелокального улучшения состоит в решении системы (9), (10).
Уравнение (10) всегда можно разрешить относительно я . Один из способов по аналогии с [2] состоит в следующем.
В случае линейных по и функций f(х,и,г), F(х,и,г) уравнение (10)
сводится к уравнению V - и) = 0. В этом линейном случае положим я = 0.
В нелинейном случае определим я по следующему правилу. Если для некоторого k е{1,...,т} выполняется vk Ф и , то полагаем = 0, г Ф k ,
Г Л Шг-/Г Н dt, V - и)
¡т v и ' / Т7 ■ п 1
=-!--. Если для всех г е {1,...,т} имеем V. = и., то
^ - ик полагаем я = 0 .
Другой простой способ определения я можно использовать в квадратичном по управлению случае (функции f (х,и,г), F(х,и,г) квадратичны по и ). Определим
2[{тЯии (p(t,и, v), x(t,v),u, t)dt (v - u).
5 = —
2 LJ T
Очевидно, что при этом уравнение (10) удовлетворяется тождественно. Данный способ, основанный на разложении приращения функции Пон-трягина, легко распространяется на общую полиномиальную по управлению задачу (1), (2).
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
Таким образом, можно определить однозначное отображение S (и, V) = 5, и еи, V еи, где 5 однозначно определяется из решения уравнения (10). При этом всегда S(и,и) = 0 . Тогда система (9), (10) сводится к вспомогательному уравнению (возможно, не единственным образом)
V = Ж а(и, V, S (и, V)).
Определим оператор Ж" с помощью соотношения Ж"^) = Ж" (и, V, S(u, V)), V еи . Тогда система (9), (10) представляется в форме задачи о неподвижной точке проекционного оператора Ж"
V = Ж"^), V еи (13) и метод улучшения интерпретируется как поиск неподвижных точек этого оператора. Определяя различные однозначные отображения Р(и, V) и
S (и, V) в силу системы (4)-(7) и уравнения (10), получаем модификации метода улучшения с различными проекционными оператороми Ж" .
Рассмотрим множество неподвижных точек У1сс(и) = {V е и : V = Ж" (V)} в процедуре улучшения. Понятно, что если и еУ"(и) хотя бы для одного а > 0, то и удовлетворяет дифференциальному принципу максимума (3). Обратно, если и удовлетворяет условию (3), то и является решением уравнения (13) для всех а > 0, т. е. и0 еУ1а(и0), а > 0. Таким образом, справедливо следующее утверждение.
Лемма. Управление и еи удовлетворяет дифференциальному принципу максимума (3) тогда и только тогда, когда и е У" (и).
Следствие (дифференциальный принцип максимума). Для оптимальности управления и еи необходимо, чтобы и е У" (и) хотя бы для одного " > 0.
Таким образом, отсутствие неподвижных точек в процедуре нелокального улучшения хотя бы для одного " > 0 свидетельствует о неоптимальности управления и е и .
Оценка (12) гарантирует строгое улучшение управления и еи (в том числе удовлетворяющего ДПМ) при V" еУ1"(и), V" Ф и . Таким образом, случай неединственности решения задачи о неподвижной точке (13) обеспечивает строгое улучшение управления, удовлетворяющего ДПМ.
Оценка (12) позволяет сформулировать новое усиленное необходимое условие оптимальности на основе предлагаемого подхода улучшения.
Теорема. Для оптимальности управления и еи в задаче (1), (2) необходимо, чтобы оно было единственным управлением на выходе процедуры улучшения
А.С. Булдаев, Б. Очирбат, И.-Х.Д. Хишектуева. Поиск неподвижных точек операторов проектирования в задачах параметрической оптимизации систем
V" (и) = {и} для всех а > 0 .
Очевидно, что дифференциальный принцип максимума является следствием теоремы.
2. Примеры
Проиллюстрируем работу предлагаемого метода нелокального улучшения на простых примерах.
Пример 1 (улучшение нелинейного управления).
ф(и) = — j (x2(t) + и 2)dt ^ min,
2 о
x(t) = и, x(0) = — и eU = [-1,1], t e T = [0,1].
Рассмотрим управление и = 0 с соответствующей фазовой траектори-
ей x(t,и) = 1, t e T и значением функционала ф(и) = — . Поставим задачу
об улучшении управления и .
Применим процедуру улучшения. В данном случае имеем функцию
Понтрягина H = уи -—(x2 + и2), Hx = - x, Hu = у - и ,
AvH = y(v - и)-—(v2 - и2), решение фазовой системы x(t,v) = 1 + vt,
t e T, v e U, дифференциально-алгебраическую сопряженную систему
p (t) = 1 - r (t),
(1 - r(t))vt = 1(2 + vt)vt,
p(1) = -q,
qv = 0,
определяющую p(t,и,v), t eT .
При v = 0 получаем x(t,v) = x(t,и) и, в соответствии со способом однозначного разрешения алгебраических соотношений, аналогичным [2; 3], полагаем r(t) = 0, q = 0. Отсюда определяем p(t,и,v) = y(t,и) = 1 -1, teT.
При v Ф 0 сопряженная система принимает вид
p (t) = 1 +1 vt, 2
p(1) = 0,
12
из которой получаем p(t,и,v) = t + — 1 - — , t eT .
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
Отображение Wа с проекционным параметром а > 0 имеет вид Wа (u, v, 5) = Pj (а (J p{t, u, v)dt + s)).
Таким образом, получаем следующую систему, определяемую условиями (9), (10), которая формирует задачу о неподвижной точке
v = Pjj(a(Jrp(t,u,v)dt + s)),
J (p(t,u,v)v-1 v2)dt = v(J p(t,u,v)dt + s). jT 2 T
Пусть v = 0 является решением системы. В этом случае алгебраическое уравнение, соответствующее условию (10), вырождается в тождество. Тогда, в соответствии с указанным выше правилом однозначного определения s , полагаем s = 0 . Проекционный оператор W1a в задаче о неподвижной точке принимает вид
Wa(v) = Pv(-а2) * 0.
Следовательно, v = 0 не может быть неподвижной точкой. Полученное противоречие говорит о том, что данный случай не реализуем. В соответствии с леммой отсюда также следует вывод о том, что u = 0 не удовлетворяет дифференциальному принципу максимума.
Предположим, что v * 0 . В данном случае получаем следующую систему, определяющую задачу о неподвижной точке
v = Pjj(a(Jrp(t,u,v)dt + s)),
J^ (p(t, u, v) -1 v)dt = J^ p(t, u, v)dt + s .
Отсюда задача о неподвижной точке принимает вид
V = Ри ("(|т (Х + V- -1 - ^Х - 2 V)). После упрощений имеем уравнение
1 2
V = Ри ("(- - - ^ V)).
Методом подстановки точек V = ±1 в уравнение легко можно убедиться, что эти точки не могут быть неподвижными. Следовательно, неподвижные точки определяются соотношением
12
V = "(----V) ,
2 3
из которого получаем единственное решение
А.С. Булдаев, Б. Очирбат, И.-Х.Д. Хишектуева. Поиск неподвижных точек операторов проектирования в задачах параметрической оптимизации систем
1 ~3а п
-1 < v =-< 0 .
2(3 + 2а)
Полученное решение строго улучшает исходное управление u = 0 с оценкой, определяемой условием (12).
Отметим, что в данном простом примере, используя явное представление решения фазовой системы по параметру v, можно легко определить
. 3
оптимальное решение в виде v = — . Данное решение реализуется в ка-
8
3
честве выходного управления в процедуре улучшения при а = —.
Пример 2 (улучшение управления, удовлетворящего ДПМ).
i
Ф(и) = | (х 2(t) - u 2)dt ^ min,
о
X(t) = u, х(0) = 0, u eU = [-1,1], t eT = [0,1].
Рассмотрим задачу об улучшении управления u = 0 с соответствующей фазовой траекторией и значением функционала Ф^) = 0 .
Имеем H = yu - х2 + u2 решение фазовой системы x(t, v) = vt, t eT,
v eU, дифференциально-алгебраическую сопряженную систему
p(t) = —r(t), r (t)vt = v2t2,
p(1) = -q,
qv = 0,
определяющую p(t,u,v), t eT .
Если v = 0, т.е x(t, v) = x(t,u), то, в соответствии с правилами [2; 3] однозначного представления, полагаем r(t) = 0, q = 0 . При этом p(t,u,v) = y/(t,u) = 0, t eT .
Если v Ф 0, то получаем сопряженную систему
p (t) = -vt, p(1) = 0,
v 2
из которой следует p(t,u,v) = — (t -1), t eT . Отметим, что полученное
представление включает случай v = 0 .
Таким образом, получаем отображение Wа с проекционным параметром а > 0 в виде
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
v
W a(u, v, s) = PU (a(- + s)) и систему, определяющую задачу о неподвижной точке,
v
v = Pu (a(j + s)),
J^ (p(t,u,v)v + v2)dt = v(J (p(t,u,v) + 2v)dt + s).
При v = 0 алгебраическое уравнение, соответствующее условию (10), удовлетворяется тождественно. Тогда, согласно правилу однозначного определения s , определяем s = 0 . При этом точка v = 0 является решением проекционного соотношения для всех a > 0 . В соответствии с леммой это значит, что исходное управление u = 0 удовлетворяет дифференциальному принципу максимума.
При v Ф 0 получаем систему, определяющую задачу о неподвижной точке
v
v = Pu (a(~3 + s))
J^ (p(t, u, v) + v)dt = J (p(t, u, v) + 2v)dt + s, из которой следует задача о неподвижной точке
2
v = PU (a3 v).
Подстановкой точек v = ±1 в уравнение легко можно убедиться, что и точки являются неподвиж чек v Ф 0 уравнение не имеет.
3
Следовательно, неподвижные точки v = ±1 при a>— строго улучшают исходное управление u = 0 , удовлетворяющее дифференциальному принципу максимума, с оценкой, определяемой условием (12).
В данном простом примере, используя явное представление решения фазовой системы по параметру v , можно легко показать, что полученные решения v = ±1 являются оптимальными.
Заключение
Предложен новый подход к нелокальному улучшению нелинейных параметров динамических систем с помощью решения специальной задачи о неподвижной точке определяемого оператора проектирования. Показана принципиальная возможность строгого нелокального улучшения нелинейных управлений на основе применения операции проектирования в рассматриваемом классе задач.
12
3
эти точки являются неподвижными при а— — • Других неподвижных то-
А.С. Булдаев, Б. Очирбат, И.-Х.Д. Хишектуева. Поиск неподвижных точек операторов проектирования в задачах параметрической оптимизации систем
Выделим основные свойства предлагаемого подхода в рассматриваемом классе нелинейных по управлению задач параметрической оптимизации, выгодно отличающие его от градиентных методов.
1. Возможность строгого улучшения управлений, удовлетворяющих дифференциальному принципу максимума (в том числе особых управлений). Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.
2. Получение новых необходимых условий оптимальности, усиливающих дифференциальный принцип максимума в рассматриваемом классе задач.
3. Нелокальность улучшения управления и отсутствие процедуры параметрического поиска улучшающего управления в достаточно малой окрестности улучшаемого управления, характерной для стандартных локальных методов.
Отметим, что предлагаемый проекционный метод не требует ограниченности множества U.
Компенсацией за поиск неподвижных точек является свойство нелокальности улучшения и возможность строгого улучшения управлений, удовлетворяющих дифференциальному принципу максимума.
Возможна ситуация, когда задача о неподвижной точке определяемого проекционного оператора не имеет решения. Это значит, что управление u eU не удовлетворяет дифференциальному принципу максимума. В данном случае предлагаемый метод улучшения не действует, и следует перейти к другим методам улучшения.
Литература
1. Васильев О.В. Лекции по методам оптимизации. Иркутск: Изд-во Иркут. унта, 1994. 344 с.
2. Булдаев А.С., Моржин О.В. Улучшение управлений в нелинейных системах на основе краевых задач // Известия Иркут. гос. ун-та. Математика. 2009. Т. 2, № 1. С. 94-107.
3. Булдаев А.С. Новый подход к оптимизации управляемых систем на основе краевых задач // Автоматика и телемеханика. 2011. №6. С. 87-94.
Булдаев Александр Сергеевич, доктор физико-математических наук, профессор кафедры прикладной математики Бурятского государственного университета, директор Научно-образовательного инновационного центра системных исследований и автоматизации БГУ, e-mail: [email protected]
Очирбат Баатар, доктор математических наук, профессор, директор школы информатики и управления Монгольского университета науки и технологий, email: [email protected], [email protected]
Хишектуева Ишин-Хорло Дамбадоржиевна, аспирант кафедры прикладной математики Бурятского государственного университета, e-mail: [email protected]
ВЕСТНИК БУРЯТСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2/2012
Buldaev Alexander Sergeevich, doctor of physical and mathematical sciences, professor of applied mathematics department, Buryat State University, director of the Scientific and Educational Innovation Centre for System Studies and Automation at BSU.
Ochirbat Baatar, doctor of mathematical sciences, professor, director, Computer Science and Management School of Mongolian University of Science and Technology (Ulaanbaatar).
Khishektueva Ishin-Khorlo Dambadorzhievna, postgraduate student, applied mathematics department, Buryat State University.