УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ
УДК 517.977
Б01: 10.18101/2304-5728-2019-3-42-59
МЕТОД НЕЛОКАЛЬНОГО СПУСКА НА МНОЖЕСТВЕ ДОПУСТИМЫХ УПРАВЛЕНИЙ В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ1
© Булдаев Александр Сергеевич
доктор физико-математических наук, профессор, Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а E-mail: buldaev@mail.ru
© Бурлаков Иван Дмитриевич
научный сотрудник,
Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а E-mail: ivan.burlakov.91@mail.ru
Рассматривается метод построения релаксационной последовательности в классе допустимых управлений в задачах оптимального управления с фазовыми ограничениями. Релаксация осуществляется по функционалу вспомогательной задачи расширения и основывается на построении нелокальных условий улучшения управления в задаче расширения в форме задачи о неподвижной точке. Такая форма дает возможность применить и модифицировать известный аппарат теории и методов неподвижных точек для поиска улучшающего допустимого управления. Конструирование улучшающих управлений в классе допустимых управлений позволяет применить теорию принципа расширения для обоснования достаточных условий построения минимизирующей последовательности. Сравнительная эффективность предлагаемого метода спуска иллюстрируется на расчете известной модельной задачи.
Ключевые слова: управляемая система; фазовые ограничения; условия улучшения управления; задача о неподвижной точке; достаточные условия оптимальности.
Для цитирования:
Булдаев А. С., Бурлаков И. Д. Метод нелокального спуска на множестве допустимых управлений в задачах оптимального управления с фазовыми ограничениями // Вестник Бурятского государственного университета. Математика, информатика. 2019. № 3. С. 42-59.
1 Работа выполнена при финансовой поддержке Министерства образования и науки РФ, проект 1.5049.2017/БЧ, и РФФИ, проект 18-41-030005-р-а.
Введение
Распространенным подходом к решению задач оптимального управления с фазовыми ограничениями является сведение к вспомогательным задачам без ограничений с помощью штрафных функционалов или функционалов Лагранжа [1-3]. Решение вспомогательных задач часто основывается на построении релаксационной последовательности управлений с помощью локальных методов улучшения управления типа градиентных [4-6]. При этом на каждой итерации улучшения управления точное выполнение фазовых ограничений задачи не гарантируется.
В работе предлагается новый подход для построения релаксационной последовательности управлений на основе принципа расширения [3] с помощью конструируемых систем условий нелокального улучшения управления с точным выполнением фазовых ограничений задачи. Эти условия могут интерпретироваться как задачи о неподвижной точке оператора управления с дополнительным алгебраическим уравнением. Такая интерпретация позволяет применить развитую теорию и методы неподвижных точек для эффективного поиска улучшающих управлений, обеспечивающих точное выполнение фазовых ограничений. Построение релаксационной последовательности в классе допустимых управлений позволяет обосновать с помощью принципа расширения достаточные условия сходимости последовательности значений целевого функционала задачи к оптимальному значению.
Рассматриваемый подход неподвижных точек является развитием и расширением подхода к нелокальному улучшению управления, первоначально разработанного для линейных и линейно-квадратичных по состоянию задач оптимального управления [6]. Этот подход основывается на разработке нестандартных формул приращения функционалов задачи, не содержащих остаточных членов разложений. Методы неподвижных точек были построены и обоснованы в классах нелинейных задач оптимального управления [7-10]. В данной работе подход неподвижных точек развивается для задач с фазовыми ограничениями.
1 Задача и метод
Рассматриваются задачи оптимального управления с фазовыми ограничениями, которые известными способами [1; 2] могут быть приведены к эквивалентной канонической постановке следующего вида:
Х&О) = /(х(?),и0),0, х(?,) = X0, (1)
и (?) е и, I е Т = [?,, Фо(и) = %(х(0) + (F0(x(t),и(0,Г)Ж ® 1п£ , (2)
* ие¥ Т
ФДи) = л( X (О) = 0, (3)
в которой х(?) = (),..., хп (?)) — вектор состояния,
и(?) = (их(?),...,ит(?)) — вектор управляющих функций, и с Ят —
замкнутое выпуклое множество. Интервал T фиксирован. В качестве доступных управляющих функций рассматривается множество V кусочно-непрерывных на T функций со значениями в множестве U: V = (V е PC (Т): v(t) е U, t е Т} .
Функции <р0(х), <р1(х) непрерывно-дифференцируемы на Яп, функции F0(х,и,t), /(х,и,t) и их частные производные по X, и непрерывны по совокупности аргументов на множестве Rn х и х Т . Функция /(х,и,t) удовлетворяет условию Липшица по X в Rn хих Т с константой Ь > 0:
||/(х, и, t) - /(у, и, 0|| < Ь ||х - у ||.
Доступное управление и е V называется допустимым, если выполняется функциональное ограничение (3). Множество допустимых управлений обозначим
Б = (VеV:ФДV) = <(х(^) = 0}.
Следуя [3], рассмотрим вспомогательную задачу без ограничений на основе функционала расширения
х() = /(х^),и^),0, х^) = х0, (4)
и ^) еи , t е Т = t1], J(и) = <(x(t1)) +1^(х^),и^), t)А ® 1п£, (5)
Т
в которой функционал расширения определяется условием
J(и) <Ф0(и), и е Б с V .
В качестве примера функционала расширения может рассматриваться функционал штрафа за нарушение ограничения (3). В частности, функционал с квадратичным штрафом
Ми(и) = Ф0(и) + тФ2(и) ® inf, ¡и> 0. (6)
uеV
Другим актуальным примером функционала расширения является регулярный функционал Лагранжа
Ь\и) = Ф0(и) + 1Ф1(и) ® inf, 1 е Я . (7)
uеV
Функция Понтрягина с сопряженной переменной у е Яп и стандартная сопряженная система в задаче расширения (4), (5) имеют вид Н(у, х,и, t) = {у, /(х, и, t)) - ^(х,и, t), у (t) = -Нх (у(0, х (0, и (0,0, t е Т, у(^) = -<х (х (О). (8)
Для доступного управления V е V обозначим х^, V), t еТ — решение системы (1) при и(0 = v(t). Далее обозначим , V), t е Т — решение стандартной сопряженной системы (8) при х(0 = х^,V) и и(0 = v(t).
Рассмотрим задачу улучшения доступного управления в задаче расширения (4), (5): для заданного доступного управления vI е V требуется найти доступное управление у е V с условием
А^(у1) = J(у) - J(V1) < 0 .
Будем использовать следующее обозначение частного приращения произвольной вектор-функции g(у1,...,у,) по переменным ул , ул :
А Ул! +Ау^, Ул2 +АУл2 g (Уl,..., У) =
= g (Уl,..., Ул1 +АУs1,..., Ул2 +АУs2,..., У,) - g (Уl,..., У,).
Рассмотрим РУ — оператор проектирования на множество У с Як в евклидовой норме
РУ (г) = а^шт(||У - I), г е Як .
УеУ 11 11
В соответствии с [9] введем модифицированную дифференциально-алгебраическую сопряженную систему, включающую дополнительную фазовую переменную У(?) = (У1 (?),..., Уп (?)),
р (?) = -Нх (р (?), х(?), и(?), ?) - г (?), (9)
{Нх(р(?),х(?),и(?),?) + г(?),у(?) - х(?)) = Ау(?Н(р(?),х(?),и(?),?) (10) с краевыми условиями
Р (О = Р (х(О) - Ч , (11)
рх (х(?1)) + Ч, у(?х) - х^)) = Ау(?1)р(х(?,)), (12)
в которой по определению полагаем г (?) = 0, 4 = 0 в случае линейности функций / , ^, р по х (линейная по состоянию задача (4), (5)), а также в случае у(?) = х(?) при соответствующих ? е Т .
В линейной по состоянию задаче (4), (5) модифицированная сопряженная система (9)-(12) в силу определения совпадает со стандартной сопряженной системой (8).
В нелинейной по состоянию задаче (4), (5) алгебраические уравнения (10) и (12) всегда можно аналитически разрешить относительно величин г (?) и 4 в виде явных или условных формул (возможно, не единственным образом).
Таким образом, дифференциально-алгебраическую сопряженную систему (9)-(12) всегда можно свести (возможно, не единственным образом) к дифференциальной сопряженной системе с однозначно определенными величинами г (?) и 4 .
Для доступных управлений у е V, V е V обозначим р(?,V1,у), ? е Т — решение модифицированной сопряженной системы (9)-(12) при х(?) = х(?,у1), у(?) = х(?,у), и(?) = у1 (?). Из определения следует очевидное равенство р (?, у, у) = у(?, у), ? е Т .
Согласно [9] проекционные условия улучшения доступного управления V1 еV в задаче расширения с заданным параметром проектирования а > 0 принимают вид:
v(t) = Ри(V (0 + а(НиШ V, V), х^,V),V1 (0,0 + s(t))), t е Т, (13)
\ а) Н (Р^, V, V), х^, V), V ^), t) =
= Н (Р (t, V1, V), х^, V), V1 (t), t) + s(t), v(t) - V1 (0), (14)
в котором в уравнении (14) по определению полагается s(t) = 0 в случае линейности функций / , Е по и (линейная по управляющей функции и задача (4), (5)), или в случае v(t) = V1 (0 при t е Т .
В нелинейной по управлению задаче (4), (5) уравнение (14) всегда можно однозначно аналитически разрешить относительно величины s(t) (возможно, не единственным образом).
Таким образом, систему (13), (14) всегда можно свести к уравнению в форме (13) относительно управления V с однозначно определяемой правой частью. Полученное уравнение можно интерпретировать как задачу о неподвижной точке относительно управления V для оператора управления, однозначно определяемого правой частью уравнения.
Согласно [9] решение V системы (13), (14) обеспечивает улучшение управления V1 еV для любого параметра а > 0 с оценкой улучшения функционала:
^ (V) <-а ц ^) - V1 ^ )|2 л.
ау 11
При этом улучшение управления гарантируется не только в достаточно малой окрестности исходного управления V1 еV, т. е. рассматриваемая процедура улучшения обладает свойством нелокальности в отличие от известных градиентных методов и других локальных методов улучшения управления.
Рассмотрим задачу улучшения допустимого управления в задаче (1)-(3) в следующей постановке: для заданного допустимого управления V1 е Б требуется найти допустимое управление V е Б с условием
) = ФсМ -Фс(^) < 0.
Для реализации поставленной задачи достаточно решить систему (13), (14) с дополнительным условием выполнения ограничения (3).
Условия улучшения управления (13), (14), (3) с заданным способом однозначного разрешения уравнений (10), (12) и (14) относительно соответствующих величин г (t) , q и s (7) можно рассматривать как задачу о неподвижной точке с дополнительным алгебраическим уравнением (3) относительно управления V . Такая интерпретация позволяет применить и модифицировать известные [11] алгоритмы поиска неподвижных точек для решения задачи улучшения на множестве допустимых управлений.
В частности, для решения задачи о неподвижной точке (13), (14), (3) предлагается использовать следующую модификацию алгоритма простой итерации при к > 0 :
ук+1(?) = Ри(у1 (?) +а(Ни(р(?,у1 ,ук),х(?,ук),у1 (?),?) + л(?))), ? е Т, (15)
Аук (?) Н (р(?, у1, ук), х(?, ук), у1 (?), ?) =
= Н (р(?,у1,ук), х(?,ук),у1 (?), ?) + л(?),ук (?) - у1 (?)), (16) Р1( х(?1, ук+1)) = 0. (17)
При к = 0 задается начальное приближение у0 е V для итерационного процесса, в качестве которого на практике вычислений обычно выбирается управление у1 е V .
В данной модификации на каждой итерации алгоритма требуется точное выполнение ограничения (3), в отличие от других алгоритмов для решения аналогичных задач о неподвижной точке с дополнительным условием выполнения ограничения [10]. Решение уравнения (17) на каждой итерации алгоритма (15)-(17) для задач расширения (4), (6) и (4), (7) сводится к решению неявно заданного уравнения относительно скалярного параметра штрафа т > 0 и скалярного множителя Лагранжа 1е Я соответственно.
Условия сходимости итерационного процесса (15)-(17) можно получить аналогично работам [7; 11] на основе требований, обеспечивающих известное свойство «сжимания» для оператора правой части задачи о неподвижной точке.
Итерации по индексу к > 0 проводятся до первого строгого улучшения
управления у1 е V по функционалу расширения:
J(ук+1) < J(у1) .
Далее строится новая задача о неподвижной точке для улучшения полученного расчетного управления и итерационный процесс повторяется.
Если строгое улучшение управления не происходит, то итерационный
процесс проводится до выполнения условия:
к+1 к ^ „ у - у <£,
I I с(Т)
где е > 0 — заданная точность расчета задачи о неподвижной точке. На этом итерации расчета последовательных задач улучшения управления предлагаемым методом спуска заканчиваются.
Расчет методом спуска может начинаться с любого доступного старто -вого управления у1 е V для начальной задачи улучшения управления. Начиная со второй задачи улучшения улучшаемое управление у1 становится допустимым: у1 е О . Таким образом, только начальный член вырабатываемой методом спуска релаксационной последовательности может
быть недопустимым управлением. Возможная недопустимость стартового управления существенно упрощает реализацию метода спуска.
Условия сходимости релаксационной последовательности, конструируемой в классе допустимых управлений, к оптимальному решению задачи (1)-(3) можно обосновать на основе достаточных условий существования минимизирующей последовательности управлений в задачах с ограничениями, аналогично работе [3].
2 Условия оптимальности управления
Достаточные условия оптимальности управления в исходной задаче (1)-(3) можно сформулировать на основе принципа расширения.
Теорема 1 (достаточное условие оптимальности управления на основе задачи с функционалом расширения). Пусть допустимое управление V е V является оптимальным в задаче (4), (5) и Ф0^) = J(V). Тогда V е Б является оптимальным в задаче (1)-(3).
Действительно, в силу оптимальности V е Б в задаче (4), (5) имеем
Ф0С) = J(v) < J (V), V еV .
Отсюда, в силу свойства расширения, получаем
Ф0С) < J(V) <Ф0 (V), V е Б с V .
Следствие 1. Пусть допустимое управление а е Б является оптимальным в вспомогательной задаче расширения (4), (6) с некоторым параметром штрафа и > 0 или в задаче (4), (7) с некоторым множителем Ла-гранжа 1 е Я. Тогда данное управление будет оптимальным в исходной задаче с ограничениями (1)-(3).
Действительно, для оптимального V е Б в силу определения функционалов расширения (6) и (7) выполняется условие
Ф 0ОО = J (V).
Для поиска и проверки управления на оптимальность в задаче расширения (4), (5) успешно могут быть использованы разработанные в [9] необходимые условия оптимальности и улучшения управления в задачах без ограничений в форме задач о неподвижной точке.
Оптимальное управление в задаче (1)-(3) может не существовать, но всегда существует минимизирующая последовательность допустимых управлений, которая определяется как обобщенное решение задачи (1)-(3). Достаточное условие существования минимизирующей последовательности в задаче (1)-(3) также можно сформулировать на основе принципа расширения.
Теорема 2 (достаточное условие существования минимизирующей последовательности управлений на основе задачи с функционалом расширения) . Пусть последовательность допустимых управлений Vк е Б , к > 0 является минимизирующей в задаче расширения (4), (5) и Ф0 (ук) ® у = М J(V). Тогда Vк е Б является минимизирующей последо-
VеV
вательностью в задаче (1)-(3). При этом
j = i = inf Ф 0(v).
veD
Действительно, для любого e > 0 , в силу сходимости и свойства расширения, получаем
F0(vk) < j + e < inf J(v) + e < i + e
veD
при k .
Следствие 2. Пусть релаксационная последовательность допустимых управлений vk e D , k > 0 является минимизирующей в вспомогательной задаче расширения (4), (6) c некоторым параметром штрафа m > 0 или в задаче (4), (7) с некоторым множителем Лагранжа l e R. Тогда данная последовательность будет минимизирующей в исходной задаче с ограничениями (1)—(3).
Действительно, для любого vk e D по определению функционалов расширения (6) и (7) получаем
Ф 0(CTk) = J (sk).
Обобщением теоремы 2 является утверждение, используемое для обоснования условий удовлетворения вырабатываемой предлагаемым ме -тодом спуска цепочки допустимых управлений требованиям минимизирующей последовательности в задаче (1)-(3).
Теорема 3 (достаточное условие существования минимизирующей последовательности управлений на основе последовательности задач с функционалами расширения). Пусть существуют:
1) последовательность задач расширения без ограничений с функционалами расширения
Js (v) <F0(v), v e D с Vs, s > 0;
2) последовательность нижних границ js для функционалов расширения
js < Js (v), v eVs, s > 0;
3) последовательность допустимых управлений vk e D , k > 0 , для которых выполняется предельное соотношение
limF0(vk) = lim js.
k s
Тогда vk e D является минимизирующей последовательностью в задаче (1)—(3). При этом
lim js = i = inf F0(v) .
s veD
Действительно, для любого e > 0 , в силу условий теоремы, получаем Ф0 (vk) < lim js + e < inf Js (v) + e < i + e ,
s®¥ veD
при k .
Следствие 3. Пусть имеются:
1) релаксационная последовательность допустимых управлений vk e D, k > 0, получаемая методом спуска на основе последовательности вспомога-
тельных задач расширения (4), (6) c некоторыми параметрами штрафа ms > 0 или задач (4), (7) с некоторыми множителями Лагранжа 1s е R при s > 0 ;
2) последовательность нижних границ js, s > 0 для функционалов расширения в указанных вспомогательных задачах, для которых выполняется предельное соотношение
HmF0(vk) = lim js.
k S
Тогда последовательность vk е D , k > 0 будет минимизирующей в исходной задаче с ограничениями (1)-(3).
Отметим, что требуемые параметры штрафа ms > 0, соответствующие последовательности задач расширения (4), (6), или множители Лагранжа
l е R для последовательности задач (4), (7), определяются решением уравнения (17) на k -й итерации алгоритма (15)-(17), соответствующей построенному члену vk е D релаксационной последовательности допустимых управлений. На указанной итерации удовлетворяется условие
строгого улучшения управления v1 е V по функционалу расширения. При этом очевидно
J (vk) = F0(vk).
Подчеркнем, что именно свойство спуска в классе допустимых управ -лений, характеризующее предлагаемый метод, позволяет с помощью принципа расширения [3] обосновать принципиальную возможность считать конструируемую релаксационную последовательность минимизирующей. При этом параметры вспомогательных задач расширения могут удовлетворять только условиям расширения в указанных выше утвержде -ниях. В частности, параметр штрафа т > 0 в задаче расширения (4), (6) не обязательно должен принимать достаточно большие значения. Более того, задача расширения (4), (6) может рассматриваться с произвольным параметром те R .
3 Пример
Сравнительная эффективность предлагаемого метода спуска иллюстрируется на известном примере линейной задачи с двумя двухсторонними фазовыми ограничениями [12; 13]:
i x, (t) = ul (t), f x ( 0 ) = -1,
1 x&2 (t) = X (t) + U2 (t), jX2 ( 0) = 2, -8 < x (t)< 0, -4 < x2 (t)< 2, t е T = [0,10], Ф(u) = 3Xj (10) - x2 (10) ® inf ,
usV
V = {u = (Uj,u2) е PC(T): u(t) е U,t е T}, U = {u = (uj, u2): |uJ < 1, 1 < u2 < 2} .
Введением дополнительных фазовых переменных с использованием кубических штрафных функций задача сводится к эквивалентной задаче с одним терминальным ограничением-равенством:
' X ( 0 ) = -1, х, ( 0) = 2,
х (*)=и1 (*),
х2 (*) = х1 (*) + и2 (*), х3 (*) = й (Х1 (*)), х4 (*) = 02 (х2 (*)) ,
, 1 ( * ) ,
й ( Х1 ( * )) = <
* е Т,
а (Х2 (* )) =
(- (* )-8 )
( Х2 (*)- 2 )3,
,( 0 ) = 0, ,( 0 ) = 0,
X (*) > 0, X (*) е [-8,0],
X (*) <-8, Х2 (* )> 2, Х2 (*)е [-4,2],
Х2 (*) <-4,
(-Х2(*)-4) :
Ф(и) = 3х1 (10) - х2 (10) ® , х3 (10) + х4 (10) = 0.
Рассмотрим задачу расширения на основе регулярного функционала Лагранжа:
Ь1 (и) = 3х1 (10) - х2 (10) +1(х3 (10) + х4 (10)) ® шГ, 1 е Я .
Функция Понтрягина и дифференциально-алгебраическая сопряженная система для задачи расширения принимают следующий вид:
Н (p, X, u, *) = Ди! + рг ( X + и2 )+ Р& (х! ) + р^ (Х2 ) ,
р1 (*) = -р2 (*) - р3 (*) ^ (x, (*)) - Г1 (*),
р2 (* ) = - р 4 (*) °2 (х2 (*))- т2(г),
р3 ( * ) = -г3(*X р4 (*) = -г ( *) ,
Р (10 ) = -3, Р2 (10 ) = 1, Р3 (10 ) = -1, Р 4 (10 ) = -1,
О, (х, (X)) =
^2 (Х2 (X)) =
х, (X) > 0, х, (X) е [-8,0],
3 х,2 (X), 0,
-3(-х, (X)- 8)2, х, (X)<-8;.
3 (х2 (X)- 2)2, х2 (X)> 2, 0, х2 (X)е[-4,2],
-3 (-х2 (X)- 4)2, х2 (X)<-4.
При этом величина т^) = ( (X), г2 (X), г3 (X),т4 (X)) определяется из алгебраического уравнения с дополнительной фазовой переменной 2(X) = (),2^), 23^),74 (X)):
Р2 (X)(2, (X)- х, (X)) + Р (X) (0 (2, (X)) - а (х (X))) + р4 (X) (0 (22 (X)) - 0 (х2 (X))) = = (Р2 (X) + Р3 (X) (х, (X)) + Г (X)) (2, (X) - х, (X)) + + (Р4 (X) О2 (х2 (X)) + Т (X)) (22 (X) - х2 (X)) +
+Т (X) (23 (X) - х3 (X)) + Т4 (X) (24 (X) - х4 (X)) .
Зафиксируем следующий способ однозначного разрешения величины
т(X) = ( (X), т2 (X), Т3 ^),Г4 (X)):
, Если 2, (X) Ф х, (X), то
Т (X) = 0, т (X) = 0,т4 (X) = 0, Р2 (X)(2 (X) - х, (X)) + Р3 (X) (2 (X))-(х, (X)))
Т (X ) =
2, (X)- х, (X) Р4 (X)(& (22 (X))- 02 (х2 (X)))
■ +
2, ( X )- х, ( X ) - Р4 (X) О2 (х2 (X))(22 ^)- х2 (X)) 2, ( X )- х, ( X )
2. Если 2, (X) = х, (X) , то 2Л. Если 22 (X) Ф х2 (X) , то
Т (x) = 0, Тъ (X) = 0,т4 (X) = 0,
- Р2 (X)- Р3 (X) О, (х, (X))-
) Р4(I)(a(--2(I))-о,(х, (,))) (^ ( (1 ) =-(I)- х, (i)--Р(1) G'(х'(1)];
2.2. Если z2 (I) = х2 (I), то
1 (I) = 0, Г (I) = 0, Гз (I) = 0, r4 (I) = 0.
Отсюда имеем p3 (I) = -1, p4 (I) = -1, I е [0,10] .
В силу линейности задачи расширения по управлению задача о неподвижной точке для улучшения управления v = (v1/, v[) е V с дополнительным условием выполнения терминального ограничения принимает вид: (vi (I),V2 (I)) = Pu (vi1 (I) + «A (v/,v)V21 (I) + ^Р2 (v/,v))
Iе[0,10],
х3 (10, v) + х4 (10, v ) = 0.
Здесь a > 0 — заданный параметр проектирования.
Для решения поставленной задачи о неподвижной точке с дополнительным алгебраическим уравнением рассматривался процесс простой итерации при k > 0 c начальным приближением v0 е V при к = 0 :
(vk 1 (I), v21 (I)) = Pu (I) + ap (, v11, vk), v21 (I) + ^Р2 (, v21, vk)),
I е[0,10],
х3 (10, vk+1) + х4 (10, vk+1 ) = 0.
На каждой итерации процесса реализация ограничения сводится к решению неявно заданного уравнения относительно множителя l е R .
Вычислительная реализация метода спуска характеризуется следующими особенностями.
Численное решение фазовых и сопряженных задач Коши производилось методом Рунге — Кутта — Вернера переменного (5-6) порядка точности с помощью программы DIVPRK библиотеки IMSL Fortran PowerStation 4.0 [14]. Значения управляемых, фазовых и сопряженных переменных запоминались в узлах фиксированной равномерной сетки Th с шагом дискретизации h > 0 на интервале T . В промежутках между соседними узлами сетки Th значение управляющей функции принималось постоянным и равным значению в левом узле.
Численное решение алгебраического уравнения относительно параметра 1е R осуществлялось с помощью программы DUMPOL [14], реализующей метод деформируемого многогранника. Точность решения уравнения контролировалась по критерию:
Г = max^^I,vk+1)), Г2(X2(I, vk+1)),I е Th} < ^ ,
где > 0 — заданная точность выполнения соответствующих фазовых ограничений,
х, (X), х, (X)> 0,
Г, (х, (X)) = < 0, х, (X) е [-8,0],
(-х, (X) - 8), х, (X)<-8, '( х2 (X)- 2), х2 (X)> 2, Г2 (х2 (X)) = к х2 (X) е [-4,2],
(-х2 (X)- 4), х2 (X)<-4,
Итерации расчета задачи о неподвижной точке по к > 0 продолжались до первого выполнения строгого улучшения управления V е V :
1Л( Ук+1 )< 1Л( V1) .
В этом случае строилась новая задача о неподвижной точке для улуч -
шения полученного расчетного управления, и итерационный процесс по-
вторялся. При этом в качестве начального приближения управления
V0 е V при к = 0 для итерационного процесса выбиралось полученное расчетное управление.
Если строгое улучшение управления не достигалось, численный расчет задачи о неподвижной точке проводился до выполнения условия
тах{| (X) - ы'к (X) |, | щ1^) - ы'к (X) |, X еТк} < е2,
где е2 > 0 — заданная точность расчета задачи о неподвижной точке. На
этом процесс построения и расчета последовательных задач улучшения управления заканчивался.
Расчет методом спуска производился при различных доступных стартовых управлениях V е V для начальной задачи улучшения управления, различных шагах дискретизации к > 0 и параметра проектирования а > 0. В частности, в качестве одного из стартовых управлений рассматривалось управление V1 е V, являющееся приближенной копией расчетного управления, приведенного на рисунке в работе [Л3]. В качестве другого — начальное приближение (V, !, у2 ° !), использованного в расчетах [Л2].
Специфика линейности задачи по управлению определяет повышенные требования к точности расчета управляемых переменных. Значения управления согласно расчетной формуле итерационного процесса в рассматриваемой задаче зависят только от значений сопряженных переменных. Поэтому для повышения точности расчета сопряженной системы шаг к > 0 сетки дискретизации Тк, на которой запоминаются необходи-
мые для расчета сопряженной системы значения фазовых переменных, выбирался достаточно малым.
В таблице 1 приводятся результаты расчета методом спуска для трех
стартовых управлений V е¥ при И = 10-4, а= 10-2, £1 = 10-2, е2 = 10-16. Здесь Ф 1 и Г1 — значения целевого функционала и показателя Г фазового отклонения на стартовом управлении, Ф* и Г* — расчетные значения целевого функционала и показателя Г фазового отклонения, N — суммарное количество расчетных фазовых и сопряженных задач Коши.
Таблица
I V Ф 1 Г1 Ф* Г* N
—I V -9.2 3.1 -12,4232 1.0 х 10-2 134
( VI °-1, ^ ° 1) -7,3 3.4 -12,0988 1.0 х 10-2 98218
(VI ° 0, VI ° 1) -6.1 4.9 -12,1225 1.0 х 10-2 102236
На рисунках 1 и 2 демонстрируются расчетные управляемые переменные и1 (V) , и2 (t) и соответствующие фазовые траектории х1(^), х2(7),
полученные методом спуска для указанных в таблице 1 двух стартовых управлений.
Рис. 1. и1 и и 2 — траектории расчетных управляемых переменных для стартового управления ( у1/ ° 0, ° 1), и 1 и и 2 — траектории расчетных управляемых переменных
—I
для стартового управления V 55
для стартового управления ( ° 0, v2 ° 1), х 1 и х 2 — траектории расчетных фазовых переменных
—I
для стартового управления V
При уменьшении шага к > 0 сетки дискретизации Тк точность приближения управляемых переменных повышается. При этом расчетные значения целевого функционала улучшаются и приближаются к расчетно-оптимальному значению Ф* »-12.5 , указанному в работах [12; 13]. При увеличении шага к > 0 расчетные значения Ф* ухудшаются. Качественная структура расчетных управляемых и фазовых переменных остается одинаковой.
В целом принципиальная сходимость конструируемой релаксационной последовательности существенно зависит от настроечного параметра а > 0, который подбирается экспериментально для конкретной задачи оптимального управления. При уменьшении этого параметра увеличивается суммарное число N расчетных задач Коши и замедляется скорость сходимости итерационного процесса. При увеличении параметра а > 0 качество расчетного управления ухудшается вплоть до потери сходимости. Данный параметр также регулирует достаточно широкую область сходимости по начальному стартовому управлению. Проведенный расчет модельной задачи демонстрирует приемлемую для практики вычислительную и качественную эффективность предлагаемого метода спуска в сравнении с известными методами [12; 13], реализующими комбинированные многометодные вычислительные технологии.
Заключение
Разработанный метод спуска для поиска приближенно-оптимальных решений задач с фазовыми ограничениями характеризуется нелокальностью улучшения управлений; отсутствием трудоемкой процедуры игольча -того или выпуклого варьирования управления в малой окрестности улуч -шаемого управления, характерной для градиентных методов; точным выполнением ограничений; наличием одного основного настроечного параметра a > 0, регулирующего скорость, качество и область сходимости итерационного процесса. Конструируемая методом спуска релаксационная последовательность допустимых управлений обладает принципиальной возможностью удовлетворения требованиям минимизирующей последова -тельности. Указанные свойства являются существенными факторами повышения вычислительной и качественной эффективности решения нелинейных задач оптимального управления с фазовыми ограничениями.
Литература
1. Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации. М.: Наука, 1982. 432 с.
2. Федоренко Р. П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 488 с.
3. Гурман В. И. Принцип расширения в задачах управления. М.: Наука, 1997. 288 с.
4. Васильев Ф. П. Численные методы решения экстремальных задач. М.: Наука, 1980. 518 с.
5. Васильев О. В. Лекции по методам оптимизации. Иркутск: Изд-во ИГУ, 1994. 340 с.
6. Срочко В. А. Итерационные методы решения задач оптимального управления. М.: Физматлит, 2000. 160 с.
7. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем. Улан-Удэ: Изд-во Бурят. гос. ун-та, 2008. 260 с.
8. Buldaev A. S., Khishektueva I.-Kh. The fixed point method in parametric optimization problems for systems // Automation and Remote Control. 2013. V. 74, No. 12. P. 1927-1934.
9. Булдаев А. С. Методы неподвижных точек на основе операций проектирования в задачах оптимизации управляющих функций и параметров динамических систем // Вестник Бурятского государственного университета. Математика, информатика. 2017. № 1. С. 38-54. DOI: 10.18101/2304-5728-2017-1-38-54.
10. Buldaev A. S., Burlakov I. D. About One Approach to Numerical Solution of Nonlinear Optimal Speed Problems // Bulletin of the South Ural State University. Series: Mathematical Modeling, Programming & Computer Software. 2018. V. 11, No. 4. P. 55-66. DOI: 10.14529/mmp180404.
11. Самарский А. А., Гулин А. В. Численные методы. М.: Наука, 1989. 432 с.
12. Грачев Н. И., Фильков А. Н. Решение задач оптимального управления в системе ДИСО. М.: ВЦ АН СССР, 1986. 66 с.
13. Тятюшкин А. И. Многометодная технология оптимизации управляемых систем. Новосибирск: Наука, 2006. 343 с.
14. Бартеньев О. В. Фортран для профессионалов. Математическая библиотека IMSL. М.: Диалог-МИФИ, 2001. Ч. 2. 320 с.
NONLOCAL DESCENT METHOD AT A SET OF ADMISSIBLE CONTROLS IN OPTIMAL CONTROL PROBLEMS WITH CONSTRAINTS ON THE STATE
Aleksandr S. Buldaev Dr. Sci. (Phys. and Math.), Prof., Dorzhi Banzarov Buryat State University 24a Smolina St., Ulan-Ude 670000, Russia E-mail: buldaev@mail.ru
Ivan D. Burlakov Researcher,
Dorzhi Banzarov Buryat State University 24a Smolina St., Ulan-Ude 670000, Russia E-mail: ivan.burlakov.91@mail.ru
The article considers the method of constructing a relaxation sequence in the class of admissible controls in optimal control problems with constraints in the state. Relaxation is carried out according to the functional of auxiliary extension problem and based on the construction of nonlocal conditions for improving control in the extension problem in the form of a fixed point problem. This form makes it possible to apply and modify the well-known apparatus of fixed-points theorem and methods for the search of improving admissible control. The construction of improving controls in the class of admissible controls allows us to apply the theory of extension for justification of sufficient conditions for constructing a minimizing sequence. The comparative effectiveness of the proposed descent method is illustrated by calculation of the well-known model problem.
Keywords: controlled system; constraints on the state; conditions for improving control; fixed point problem; sufficient optimality conditions.
References
1. Evtushenko Yu. G. Metody resheniya ekstremalnykh zadach i ikh primenenie v sistemakh optimizatsii [Methods for Solving Extremum Problems and their Application in Optimization Systems]. Moscow: Nauka Publ., 1982. 432 p.
2. Fedorenko R. P. Priblizhennoe reshenie zadach optimalnogo upravleniya [An Approximate Solution to Optimal Control Problems]. Moscow: Nauka Publ., 1978. 488 p.
3. Gurman V. I. Printsip rasshireniya v zadachakh upravleniya [Extension Principle in Control Problems]. Moscow: Nauka Publ., 1997. 288 p.
4. Vasilyev F. P. Chislennye metody resheniya ekstremalnykh zadach [Numerical Methods for Solving Extremum Problems]. Moscow: Nauka Publ., 1980. 518 p.
5. Vasilyev O. V. Lektsii po metodam optimizatsii [Lectures on Optimization Methods]. Irkutsk: Irkutsk State Univ. Publ., 1994. 340 p.
6. Srochko V. A. Iteratsionnye metody resheniya zadach optimalnogo upravleniya [Iterative Methods for Solving Optimal Control Problems]. Moscow: Fizmatlit Publ., 2000. 160 p.
7. Buldaev A. S. Metody vozmushchenii v zadachakh uluchsheniya i optimizatsii upravlyaemykh system [Perturbation Methods in Problems of Improving and Optimizing Controlled Systems]. Ulan-Ude: Buryat State Univ. Publ., 2008. 260 p.
8. Buldaev A. S., Khishektueva I.-Kh. The Fixed Point Method in Parametric Optimization Problems for Systems. Automation and Remote Control. 2013. V. 74. No. 12. Pp.1927-1934.
9. Buldaev A. S. Metody nepodvizhnykh tochek na osnove operatsii proektiro-vaniya v zadachakh optimizatsii upravlyayushchikh funktsii i parametrov di-namicheskikh system [Fixed-Point Methods Based on Projection in Optimization Problems of Control Functions and Parameters of Dynamic Systems]. Vestnik Buryatskogo gosuniversiteta. Matematika, informatika. 2017. No. 1. Pp. 38-54. DOI: 10.18101/2304-5728-2017-1-38-54.
10. Buldaev A. S., Burlakov I. D. About One Approach to Numerical Solution of Nonlinear Optimal Speed Problems. Bulletin of the South Ural State University. Series: Mathematical Modeling, Programming & Computer Software. 2018. V. 11. No. 4. Pp. 55-66. DOI: 10.14529/mmp180404.
11.Samarskii A. A., Gulin A. V. Chislennye metody [Numerical Methods]. Moscow: Nauka Publ., 1989. 432 p.
12. Grachev N. I., Filkov A. N. Reshenie zadach optimalnogo upravleniya v sisteme DISO [Solution of Optimal Control Problems in DISO System]. Moscow: VTs AS USSR Computer Center, 1986. 66 p.
13. Tyatyushkin A. I. Mnogometodnaya tekhnologiya optimizatsii upravlyaemykh system [Multi-Method Technology for Optimizing Controlled Systems]. Novosibirsk: Nauka Publ., 2006. 343 p.
14. Bartenyev O. V. Fortran dlya professionalov. Matematicheskaya biblioteka IMSL [Fortran for Professionals. IMSL Mathematical Library]. Moscow: Dialog-MIFI Publ., 2001. Part 2. 320 p.