Проекционные методы возмущений в задачах оптимизации управляемых систем

Булдаев Александр Сергеевич

Серия «Математика»

2014. Т. 8. С. 29—43

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 518.517

Проекционные методы возмущений в задачах оптимизации управляемых систем *

А. С. Булдаев

Бурятский государственный университет

Аннотация. Методы возмущений применяются для реализации условий нелокального улучшения управлений, конструируемых в форме специальных краевых задач в пространстве фазовых и сопряженных переменных и в форме специальных задач о неподвижной точке определяемых операторов в пространстве управлений. Условия улучшения управлений определяются с помощью операции проектирования на допустимое множество значений управления. Методы характеризуются отсутствием операций выпуклого или игольчатого варьирования управлений и принципиальной возможностью улучшения неоптимальных управлений, удовлетворяющих принципу максимума.

Ключевые слова: управляемая система, условия улучшения управления, операторы проектирования, методы возмущений.

В работах [1]—[9] были предложены новые подходы к построению релаксационных последовательностей управлений на основе конструирования специальных условий нелокального улучшения управлений в задачах оптимизации линейных и нелинейных управляемых систем. В линейных по состоянию системах такие условия [8] предлагались в форме специальных задач Коши для фазовых или стандартных сопряженных переменных. В полиномиальных по состоянию и общих нелинейных системах условия нелокального улучшения управлений [1]-[7], [9] строились уже как специальные краевые задачи для фазовых и модифицированных сопряженных переменных и эквивалентные им специальные задачи о неподвижных точках определяемых операторов в пространстве управлений. При этом в случае линейной по состоянию

1. Введение

* Работа выполнена при финансовой поддержке РФФИ, гранты 12-01-00914-а, 12-01-98011-р-сибирь-а, 13-01-92200-Монг-а.

системы краевые задачи улучшения управлений сводились к задачам Коши, т. е. предлагаемые подходы для нелинейных систем можно было интерпретировать как обобщения известных [8] подходов улучшения для линейных систем. Для реализации условий улучшения в полиномиальных по состоянию системах в работах [1], [6] были разработаны вычислительно эффективные методы, которые основываются на теории и методах возмущений и позволяют сводить решение краевых задач и задач о неподвижных точках к решению последовательности попеременно чередующихся задач Коши для фазовых и сопряженных переменных. В данной работе подход возмущений предлагается применить для решения дифференциально-алгебраических краевых задач и задач о неподвижных точках, возникающих в задачах улучшения общих нелинейных управляемых систем. При этом для достижения нелокального улучшения в классах нелинейных систем рассматривается операция проектирования на выпуклое множество значений управления, которая в отличие от операции максимизации функции Понтрягина, является однозначной и непрерывной (более того, удовлетворяющей условию Липшица), что позволяет обосновывать разрешимость задач улучшения управлений в широких предположениях.

в которой х(Ь) = (х1(Ь),... ,хп(Ь)) — вектор состояния, и = (щ^),..., ит(Ь)) — вектор управления со значениями в выпуклом множестве и € Кт. В качестве допустимых управлений рассматривается множество V кусочно-непрерывных на Т векторных функций со значениями в выпуклом компактном множестве и С Кт. Начальное состояние х0 и промежуток управления Т заданы.

Предполагаются выполненными следующие условия:

1) функция !^(х) непрерывно-дифференцируема на Кп, вектор-функции ¥(х, и, Ь), (х, и, Ь) и их производные ¥Х(х, и, Ь), ¥и(х, и, Ь), /Х(х, и, Ь), ¡и(х, и, Ь) непрерывны по совокупности аргументов (х, и, Ь) на множестве Кп х и х Т;

2) функция f (х, и, Ь) удовлетворяет условию Липшица по х в Кп х и х Т с константой Ь > 0

2. Метод нелокального улучшения

Рассматривается задача оптимального управления

х(Ь) = f (х(Ь),и(Ь),Ь), х(Ьо) = х0,Ь € Т = [Ьо,Ь1], (2.2)

У(х,и,Ь) - f (у,и,Ь)\\ <Ь\\х - у\\.

Условия гарантируют существование и единственность решения х(Ь,ь), Ь € Т системы (2.2) для любого допустимого управления V € V.

Введем функцию Понтрягина с сопряженной переменной ф € Яп

Н (ф,х,и,Ь) = (/(х,и,Ь),ф) — Г (х,и,Ь).

Для допустимого управления V € V обозначим через ф(Ь,ю), Ь € Т решение стандартной сопряженной системы:

ф(Ь) = —Нх(ф(Ь),х(Ь),и(Ь),Ь), Ь € Т, ф(^) = —<рх(х(Ь))

при и(Ь) = v(t), х(Ь) = х(Ь^).

Для заданного параметра а > 0 и допустимого управления и € V рассмотрим проекционное отображение

иа(р,х,Ь) = Ри(и(Ь) + аНи(р,х,Ь)), р € Еп, х € Еп, Ь € Т,

где Ри — оператор проектирования на множество и в евклидовой норме.

Согласно известному свойству проекции имеем

(Ни(р, х, ¿),иа(р, х, ¿) — > — \\иа(р, —

а

С помощью отображения иа дифференциальный принцип максимума (ДПМ) в задаче (2.1), (2.2) для управления и € V представляется в форме условия

и(Ь) = иа(ф(Ь, и),х(Ь, и),Ь), Ь € Т, а > 0. (2.3)

Для выполнения ДПМ достаточно проверить условие (2.3) хотя бы для одного а > 0.

Стандартные методы условного градиента и проекции градиента для задачи (2.1), (2.2) обеспечивают сходимость к нулю невязки ДПМ. Релаксация по целевой функции (2.1) на каждой итерации этих методов достигается поиском специального параметра, регулирующего область варьирования управления. Этот параметрический поиск является наиболее трудоемкой частью итерационного процесса, и улучшение управления достигается в достаточно малой окрестности варьируемого управления.

Описываемый ниже метод [3] не содержит операцию выпуклого или игольчатого варьирования управления на каждой итерации улучшения, характерную для градиентных методов, и позволяет получать нелокальные улучшающие управления.

Поставим задачу улучшения управления и € V: найти управление V € V с условием Ф^) — Ф(и) = АьФ(и) < 0.

Аналогично [2; 3] рассмотрим дифференциально-алгебраическую сопряженную систему

р(Ь) = -ИхШ,х(г)Мг),г) - т(г), (2.4)

н(р(ь),у(1)^(1),ь) - и(р(г),х(г)Мг),г) =

= {Их(р(г),х(г)Мг),г) + т(г),у(г) - х(Ь)) (2.5) с краевыми условиями

р(Ь1) = -<Рх(х(Ь)) - д, (2.6)

<р(у(Ъ)) - ф(11)) = {^х(х(Ь1)) + д, у(1{) - х(Ь1)). (2.7)

Величины г(Ь) и д всегда можно выразить из соответствующих алгебраических уравнений (2.5) и (2.7) (возможно не единственным образом) [2],[3] и, таким образом, система (2.4)-(2.7) всегда может быть сведена к вспомогательной дифференциальной сопряженной системе.

Предположим, что вспомогательная сопряженная система допускает решение р(Ь,и,у), Ь € Т для допустимых управлений и,у при w(t) = и(Ь), х(Ь) = х(Ь,и), у(Ь) = х(Ь,у). Таким образом, на основе решения системы (2.4)-(2.7) можно определить однозначное отображение Р(и, у) = р(Ь,и,у), Ь € Т на множестве V х V (возможно, не единственным образом).

При этом очевидно выполняется р(Ь,и,и) = ф(Ь,и), Ь € Т, и в линейной по состоянию задаче (2.1), (2.2) (функции У(х,и,Ь), ¥(х,и,Ь), ф(х) линейны по х) модифицированная сопряженная система (2.4)-(2.7) сводится к стандартной, допускающей единственное решение ф(Ь,и), Ь € Т.

Рассматриваемая модификация сопряженной системы позволяет получить [2] формулу приращения целевой функции в задаче (2.1), (2.2) в следующем нестандартном виде

Ау Ф(и) = - Ам И (р(Ь,и,у),х(Ь,у),и(Ь),Ь)йЬ.

■)Т

Такая формула не содержит остаточных членов разложений и является основой для конструирования метода нелокального улучшения допустимого управления и € V.

Проекционный .метод улучшения: для заданных а > 0 и и € V определим отображение wa с помощью соотношения

wa(р,х,Ь,в) = Ри(и(Ь) + а(Ии(р, х, и(Ь),Ь) + в)), р € Еп, х € Еп, в € Ет

и рассмотрим дифференциально-алгебраическую краевую задачу:

х(Ь) = У(х(Ь)^а(р(Ь),х(Ь),Ь,в(Ь)),Ь), х(Ьо)= хо, (2.8)

р(Ь) = —Нх(р(Ь),х(Ь, и),и(Ь),Ь) — г(Ь), р(ь) = —<рх(х(Ь1,и)) — д, (2.9) Н (р(Ь),х(Ь),и(Ь),Ь) — Н (р(Ь),х(Ь,и),и(Ь),Ь) =

= (Нх(р(Ь),х(Ь,и),и(Ь),Ь) + г(Ь), х(Ь) — х(Ь, и)), (2.10)

^>(х(и)) — <р(х(Ь1,и)) = (<£х(х(Ь\,и)) + д, х(и) — х(Ь\,и)), (2.11)

Н (р(Ь),х(Ь),ша (р(Ь),х(Ь),Ь,в(Ь)),Ь) — Н (р(Ь),х(Ь),и(Ь),Ь) =

= (Ни(р(Ь),х(Ь),и(Ь),Ь) + в(Ь), ■а(р(Ь),х(Ь),Ь,з(Ь)) — и(Ь)). (2.12)

Предположим, что краевая задача (2.8) - (2.12) разрешима с некоторой кусочно-непрерывной функцией в(Ь) и (х(Ь),р(Ь)), Ь € Т — соответствующее решение (возможно, не единственное). Тогда выходное управление, формируемое по правилу

v(t) = (р(Ь),х(Ь),Ь,в(Ь)), Ь € Т обеспечивает невозрастание целевого функционала с оценкой

Ф(у)-Ф(и)<~- [ IШ)-иШ2<и.

а } т

При этом х(Ь) = х(Ь, V), р(Ь) = р(Ь, и, V), Ь € Т и V удовлетворяет условию v(t) = ■а(р(Ь,и^),х(Ь^),Ь,з(Ь)), Ь € Т, (2.13)

где в(Ь) удовлетворяет алгебраическому уравнению

Н (р(Ь,и^),х(Ь^)^(Ь),Ь) — Н (р(Ь,и^),х(Ь^),и(Ь),Ь) =

= (Ни(р(Ь, и, v),x(t, v),u(t),t) + в(Ь), v(t) — и(Ь)). (2.14)

Дифференциально-алгебраическая краевая задача (2.8) - (2.12) в пространстве фазовых и сопряженных переменных является эквивалентной поточечной системе уравнений (2.13), (2.14) в пространстве управлений в следующем смысле. Пусть (х(Ь),р(Ь)), Ь € Т — решение краевой задачи (2.8) - (2.12) с некоторой кусочно-непрерывной функцией в(Ь). Тогда выходное управление v(t) = (р(Ь),х(Ь),Ь,в(Ь)), Ь € Т удовлетворяет системе (2.13), (2.14). Наоборот, пусть допустимое управление v(t), Ь € Т — решение системы (2.13), (2.14) с некоторой кусочно-непрерывной функцией в(Ь). Тогда пара функций (х(Ь^),р(Ь,и^)), Ь € Т удовлетворяет краевой задаче (2.8) - (2.12).

По разрешимости рассматриваемой краевой задачи отметим следу-щие общие особенности [3].

1. Краевая задача улучшения (2.8) - (2.12) существенно проще по свойствам гладкости краевой задачи принципа максимума.

2. В линейной по состоянию задаче (2.1), (2.2) (функции f(х,и,Ь), Г(х,и,Ь), р(х) линейны по х) краевая задача улучшения (2.8) - (2.12)

сводится к специальной дифференциально-алгебраической задаче Ко-ши для фазовой переменной. Если дополнительно задача (2.1), (2.2) является линейной по управлению, то в этом билинейном случае процедура улучшения становится эквивалентной известному проекционному методу нелокального улучшения в билинейных управляемых системах [8].

3. Управление и € V, удовлетворяющее условию ДПМ (2.3), является очевидным решением задачи (2.13), (2.14) с в(Ь) = 0, Ь € Т. Это значит, что краевая задача улучшения (2.8) - (2.12) для управления и € V, удовлетворяющего ДПМ, всегда разрешима и имеет очевидное решение (х(Ь,и), ф(Ь,и)), Ь € Т в пространстве состояний. При этом, если задача (2.13), (2.14) имеет неединственное решение, то выходное управление, соответствующее другому решению, будет строго улучшать управление, удовлетворяющее ДПМ, в соответствии с оценкой приращения функционала.

4. Уравнение (2.14) всегда можно разрешить относительно в(Ь) аналогично [2] - [5] (возможно, не единственным образом). Таким образом, можно определить однозначное отображение Б(и,у,Ь) = в(Ь), и € V, у € V, Ь € Т, где в(Ь) однозначно конструируется на основе решения уравнения (2.14). Тогда система (2.13), (2.14) сводится к следующей задаче о неподвижной точке (возможно, не единственным образом)

у(Ь) = wa(p(t, и, у),х(Ь, у),Ь, Б (и, V, Ь)), Ь € Т.

Определяя различные однозначные отображения Р(и, у) и Б(и,у,Ь) можно сводить краевую задачу (2.8) - (2.12) к вспомогательной дифференциальной краевой задаче или эквивалентной ей вспомогательной задаче о неподвижной точке стандартного вида. При этом будем получать различные модификации условий нелокального улучшения с различными отображениями Р(и, у) и Б(и,у,Ь).

Множества выходных управлений, соответствующих различным отображениям Р (и, у) и Б (и, V, Ь), существенно расширяют потенциал улучшения заданного управления и позволяют конструировать специальные вычислительные технологии улучшения, в которых на каждой итерации улучшения выбирается наилучшее по функционалу управление среди модификаций метода с различными отображениями Р(и, у) и Б(и, у, Ь). Такие технологии могут эффективно реализовываться с помощью параллельных вычислений на многопроцессорных компьютерах. Таким образом, рассматриваемый метод является ориентированным на параллельные вычисления.

Трудности решения возникающих вспомогательных дифференциальных краевых задач улучшения в нелинейном случае обуславливаются возможной негладкостью правой части и наличием собственных чисел матрицы Якоби с положительной вещественной частью. Это затрудня-

ет применение стандартных методов для их решения (метод стрельбы, метод линеаризации, конечно-разностный метод).

В данной работе описываются подходы возмущений к решению дифференциально-алгебраической краевой задачи улучшения (2.8) - (2.12) и эквивалентной ей задачи о неподвижной точке (2.13), (2.14) в пространстве управлений.

3. Методы возмущений

Методы возмущений основываются на введении параметра возмущения в исследуемую задачу так, чтобы при некотором значении параметра задача, называемая невозмущенной, имела относительно простое или очевидное решение. Как правило, невозмущенная задача соответствует нулевому значению параметра возмущения. Для решения возмущенных задач при фиксированном ненулевом значении параметра возмущения строятся итерационные алгоритмы, на каждой итерации которых решается задача, аналогичная по сложности невозмущенной задаче. При этом в качестве начального приближения итерационного процесса используется решение возмущенной задачи, полученное при меньшем значении параметра возмущения.

Вначале проиллюстрируем метод возмущений краевой задачи улучшения управления (2.8) - (2.12).

Структура рассматриваемой краевой задачи позволяет естественным образом выделить определенную часть в качестве невозмущенной задачи, которая совпадает с соответствующей краевой задачей для случая линейной по состоянию задачи (2.1), (2.2). В остальную часть краевой задачи вводится искусственный параметр возмущения е € [0,1] по следующему правилу

х(Ь) = У(х(Ь)^а(р(Ь),х(Ь),Ь,в(Ь)),Ь), х(Ьо)= хо, (3.1)

р(Ь) = -Их(р(Ь),х(Ь,и),и(Ь),Ь) - ег(Ь), р(Ь) = -<рх(х(Ь1,и)) - ед, (3.2) И(р(Ь),х(Ь),и(Ь),Ь) - И(р(Ь),х(Ь,и),и(Ь),Ь) =

= {Их(р(Ь),х(Ь,и),и(Ь),Ь) + г(Ь), х(Ь) - х(Ь, и)), (3.3)

р(х(Ь1)) - <р(х(Ь, и)) = {<^х (х(Ь1 ,и)) + д, х(Ь1) - х(Ь ,и)), (3.4)

И(р(Ь),х(Ь)^а(р(Ь),х(Ь),Ь,в(Ь)),Ь) - И(р(Ь),х(Ь),и(Ь),Ь) =

= Ни(р(Ь),х(Ь),и(Ь),Ь) + в(Ь), wa(р(Ь),х(Ь),Ь,в(Ь)) - и(Ь)). (3.5)

Невозмущенная краевая задача соответствует значению параметра е = 0. Исходная краевая задача (2.8) - (2.12) получается из возмущенной (3.1) - (3.5) при е = 1.

Отсюда следует, что невозмущенная сопряженная система становится независимой от фазовой переменной и управления и ее решением является функция р(Ь) = ф(Ь,и), Ь € Т. Таким образом, невозмущенная краевая задача сводится к дифференциально-алгебраической задаче Коши

х(Ь) = f(х(Ь),ша(ф(Ь,и),х(Ь),Ь,в(Ь)),Ь), х(Ьо) = х0,

Н (ф(Ь,и),х(Ь),ша (ф(Ь,и),х(Ь),Ь,в(Ь)),Ь) — Н (ф(Ь,и),х(Ь),и(Ь),Ь) = = (Ни(ф(Ь,и),х(Ь),и(Ь),Ь) + в(Ь), ■а(ф(Ь,и),х(Ь),Ь,в(Ь)) — и(Ь)), которая эквивалентна задаче о неподвижной точке

v(t) = ша(ф(Ь, и),х(Ь, v),t, в(Ь)), Ь € Т, Н (ф(Ь,и),х(Ь^)^(Ь),Ь) — Н (ф(Ь,и),х(Ь^),и(Ь),Ь) = = (Ни(ф(Ь,и),х(Ь^),и(Ь),Ь) + в(Ь), V(Ь) — и(Ь)).

Для решения возмущенной краевой задачи (3.1) - (3.5) для е € (0,1] предлагается итерационный процесс при к > 0

хк+1(Ь) = /(хк+1(Ь),ша(рк+1(Ь),хк+1(Ь),Ь,в(Ь)),Ь), хк+1(Ьо)= хо, (3.6)

рк+1(Ь) = —Нх(рк+1(Ь),х(Ь, и),и(Ь),Ь) — ег(Ь), рк+1(Ь) = —ух(х(Ь,и)) — ед,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(3.7)

Н (рк(Ь),хк (Ь),и(Ь),Ь) — Н (рк (Ь),х(Ь,и),и(Ь),Ь) =

= (Нх(рк (Ь),х(Ь,и),и(Ь),Ь) + г(Ь), хк (Ь) — х(Ь, и)), (3.8)

у(хк(и)) — у(х(Ь,и)) = (Ух(х(Ь1 ,и)) + д, хк(ь) — х(Ь1,и)), (3.9)

Н(рк+1 (Ь), хк+1 (Ь), (рк+1 (Ь), хк+1 (Ь),Ь,в(Ь)), Ь)—Н(рк+1 (Ь), хк+1 (Ь), и(Ь),

Ь) = (Ни(рк+1(Ь),хк+1(Ь),и(Ь),Ь) + з(Ь), ■а(рк+1(Ь),хк+1(Ь),Ь,з(Ь)) — и(Ь)),

(3.10)

где на каждой итерации сопряженная система интегрируется независимо от фазовой и управляемой переменных, и краевая задача сводится к определенной дифференциально-алгебраической задаче Коши аналогично невозмущенной задаче. В качестве начального приближения (х°(Ь),р°(Ь)), Ь € Т итерационного процесса при к = 0 может выбираться решение невозмущенной задачи.

Процесс решения возмущенной задачи (3.1) - (3.5) при е < 1 повторяется с начальным приближением, равным полученному возмущенному решению с меньшим значением е. Дойдя до значения е = 1, получаем решение исходной задачи.

В реальных вычислениях итерационный процесс возмущений (3.6) -(3.10) применяется до первого улучшения управления и. Для полученного улучшающего управления строится новая возмущенная задача и процесс повторяется.

Другие методы возмущений продемонстрируем для задачи о неподвижной точке (2.13), (2.14) в пространстве управлений.

Первый метод основывается на введении параметра возмущения е e [0,1] в исходную задачу оптимального управления (2.1), (2.2). Для этого в ней выделяется специальная линейная по состоянию часть и параметризуется нелинейный остаток. Получаемая возмущенная задача оптимального управления имеет вид

Ф(и) = (c,x(ti)) + epi(x(ti)) +

+ ((a(u(t),t),x(t)) + d(u(t),t) + eFi(x(t),u(t),t))dt ^ min, (3.11) JT u€V

x(t) = A(u(t) ,t)x(t) + b(u(t),t) + efi(x(t),u(t),t),

x(to) = x0, u(t) e U,t e T. (3.12)

Функции A(u, t), a(u, t), b(u, t), d(u, t), Fi(x, u, t), fi(x, u, t) и их частные производные по состоянию и управлению являются непрерывными по совокупности своих аргументов.

Задача о неподвижной точке для невозмущенной задачи оптимального управления (е = 0) определяется как невозмущенная задача о неподвижной точке и представляет собой соответствующую дифференциально-алгебраическую задачу Коши для фазовой переменной.

Задача о неподвижной точке в возмущенной задаче (3.11), (3.12) при е e (0,1] определяется в качестве возмущенной задачи о неподвижной точке и представляется в виде:

v(t)= wa(pe(t,u,v),xe(t,v),t,s(t)), t e T, (3.13)

Н£(р£(Ь, и, у),х£(Ь,у),у(Ь),Ь) - Не(р£(Ь,и,у),х£(Ь,у),и(Ь),Ь) =

= {Ни(р£(Ь,и,у),х£(Ь,у),и(Ь),Ь) + в(Ь), у(Ь) - и(Ь)). (3.14)

Здесь для допустимых управлений и, у введены обозначения:

1) х£(Ь, у), Ь € Т — решение возмущенной фазовой системы (3.12) при и(Ь) = у(Ь);

2) р£(Ь, и, у), Ь € Т — решение соответствующей возмущенной дифференциально-алгебраической сопряженной системы

р(Ь) = -Н££(р(Ь),х(Ь)МЬ),Ь) - г(Ь),

Н£(р(Ь),у(Ь)МЬ),Ь) - Н£(р(Ь),х(Ь)^(Ь),Ь) = = {Нех(р(Ь),х(Ь)МЬ),Ь)+ г(Ь),у(Ь) - х(Ь))

р(Ь1) = -^£х(х(Ь1)) - д,

У(у(Ь1) — <ре(х(ь)) = (Ух(х(Ь1)) + д, у(Ь) — х(Ь1)).

при ш(Ь) = и(Ь), х(Ь) = хе(Ь, и), у(Ь) = хе(Ь, V) — х(Ь, и);

3) уе(х), Не(р,х,и,Ь), ша — функции и проекционное отображение, которые соответствуют возмущенной задаче (3.11), (3.12).

Невозмущенное условие улучшения получается из возмущенного (3.13), (3.14) при е = 0.

Для решения возмущенного условия (3.13), (3.14) рассматривается явный итерационный процесс при к > 0

vk+1(t) = ша(р£(Ь, и, Vк ),хе(Ь, Vк ),Ь, в(Ь)), Ь € Т, (3.15)

Н£ (ре (Ь,и,,ик ),хе (Ь,ик ),ик (Ь),Ь) — Н£ (ре (Ь,и^к), х е (Ь, ик ),и(Ь),Ь) =

= (Н£(ре(Ь,и^к),хе(Ь^к),и(Ь),Ь)+ в(Ь), Vк(Ь) — и(Ь)), (3.16)

на каждой итерации которого, в отличие от неявного процесса (3.6) - (3.10), решаются две обычные дифференциальные задачи Коши: х-система, р-система. Данная особенность явных методов является существенным фактором снижения вычислительных затрат решения задачи улучшения.

На начальной (нулевой) итерации задается начальное приближение V0 € V.

Во втором методе возмущение условия улучшения (2.13), (2.14) определяется через параметризацию краевой задачи улучшения (2.8) -(2.12) по следующему правилу.

В качестве возмущенного условия улучшения принимается условие, эквивалентное возмущенной краевой задаче (3.1) - (3.5)

и(Ь) = ■а(ре(Ь,и^),х(Ь^),Ь,в(Ь)), Ь € Т, (3.17)

Н (ре (Ь,и^),х(Ь^)^(Ь),Ь) — Н (ре (Ь,и^),х(Ь^),и(Ь),Ь) =

= (Ни(ре(Ь,и^),х(Ь^),и(Ь),Ь) + в(Ь), v(t) — и(Ь)). (3.18)

Здесь для допустимых управлений и, V введено обозначение ре(Ь,и, V), Ь € Т для решения возмущенной дифференциально-алгебраической сопряженной системы

р(Ь) = —Нх(р(Ь),х(Ь),ы(Ь),Ь) — ег(Ь),

Н (р(Ь),у(Ь)МЬ),Ь) — Н (р(Ь),х(Ь),ш(Ь),Ь) = = (Нх(р(Ь),х(Ь)МЬ),Ь) + г(Ь),у(Ь) — х(Ь)) р(ь) = —ух(х(Ь1)) — ед, у(у(Ь1 ) — <р(х(Ь)) = (<Рх(х(Ь)) + д,у(и) — х(и)).

при w(t) = u(t), x(t) = x(t, u), y(t) = x(t, v) — x(t, u).

Невозмущенное условие получается из возмущенного (3.17), (3.18) при е = 0 и определяется соотношениями

v(t) = wa(^(t, u),x(t, v),t, s(t)), t e T,

H (ф(t,u),x(t,v),v(t),t) — H (ф(t,u),x(t,v),u(t),t) = = (Hu(^(t, u),x(t, v),u(t),t) + s(t), v(t) — u(t)).

Для реализации условия (3.17), (3.18) предлагается неявный итерационный процесс при k > 0

vk+l(t) = wa(pe(t, u, vk),x(t, vk+l),t, s(t)), t e T, (3.19)

H(pe(t, u, vk),x(t, vk+1),vk(t),t) — H(pe(t, u, vk),x(t, vk+1 ),u(t),t) = = (Hu(pe(t, u, vk),x(t, vk+1 ),u(t),t) + s(t), vk(t) — u(t)). (3.20)

В качестве начального приближения итерационного процесса при k = 0 может выбираться решение невозмущенного условия.

Для сравнения с итерационным процессом (3.6) - (3.10) процесс (3.19), (3.20) можно представить в терминах фазовой и сопряженной систем

xk+1(t) = f(xk+1(t),wa(pk(t),xk+1(t),t,s(t)),t), xk+1(ta)= xo, (3.21)

pk(t) = —Hx(pk(t),x(t,u),u(t),t) — er(t), pk(t{) = —Vx(x(h,u)) — eq,

(3.22)

H (pk(t),xk (t),u(t),t) — H (pk (t),x(t,u),u(t),t) = = (Hx(pk(t),x(t,u),u(t),t) + r(t), xk(t) — x(t,u)), (3.23) v(xk(t1)) — v(x(t1,u)) = ((fix(x(t1,u)) + q, xk(t1) — x(t1,u)), (3.24) H(pk(t), xk+1(t), wa(pk(t), xk+1 (t),t,s(t)),t) — H(pk(t), xk+1 (t), u(t), t) =

= (Hu(pk(t),xk+1(t),u(t),t) + s(t), wa(pk(t),xk+1(t),t,s(t)) — u(t)).

(3.25)

На каждой итерации вначале решается независимая дифференциально-алгебраическая сопряженная система (3.22) - (3.24) и находится ее решение pk(t), t e T. Понятно, что pk(t) = ps(t,u,vk), t e T. Затем решается дифференциально-алгебраическая фазовая система (3.21), (3.25) и находится ее решение xk+1(t), t e T с некоторой функцией s(t). Формируется выходное управление vk+1(t) = wa(pk(t),xk+1(t),t,s(t)), t e T и осуществляется переход на (k+1)-итерацию. При этом xk+1(t) = x(t,vk+1), t e T.

В отличие от метода возмущений, определяемого соотношениями (3.15), (3.16), предлагаемый метод (3.19), (3.20) не требует операции параметризации исходной задачи оптимального управления (2.1), (2.2) по

правилу (3.11), (3.12). Это позволяет использовать метод (3.19), (3.20) для решения нелинейной задачи (2.1), (2.2) в случаях, когда метод (3.15), (3.16) оказывается малоэффективным (как правило, в случае, когда параметризация (3.11), (3.12) с е € [0,1] приводит к вырождению: а(и,Ь) = 0, й(и,Ь) = 0, А(и,Ь) = 0, Ъ(и,Ь) = 0).

Структура условия улучшения (2.13), (2.14) допускает другую эффективную схему параметризации. В качестве параметра возмущения можно рассматривать параметр проектирования а > 0.

Третий метод основывается на интерпретации условия улучшения (2.13), (2.14) как возмущенного по параметру проектирования а > 0

v(t) = Ри(и(Ь) + а(Ни(р(Ь, и, v),x(t, v),u(t),t) + в(Ь))), Ь € Т, (3.26) где в(Ь) удовлетворяет алгебраическому уравнению

Н (р(Ь,и^),х(Ь^)^(Ь),Ь) — Н (р(Ь,и^),х(Ь^),и(Ь),Ь) =

= (Ни(р(Ь, и, v),x(t, v),u(t),t) + в(Ь), v(t) — и(Ь)). (3.27)

Невозмущенное условие получается из возмущенного (3.26), (3.27) при а = 0 и имеет тривиальное решение и(Ь) = и(Ь), Ь € Т.

Для решения задачи (3.26) - (3.27) можно применить вычислительно эффективный явный итерационный процесс

vk+1(t) = Ри(и(Ь) + а(Ни(р(Ь, и, ик),х(Ь, ик),и(Ь),Ь) + в(Ь))), Ь € Т,

(3.28)

Н(р(Ь, и, Vк),х(Ь, Vк)^к(Ь),Ь) — Н(р(Ь, и, Vк),х(Ь, Vк),и(Ь),Ь) = = (Ни(р(Ь, и, ик),х(Ь, ик),и(Ь),Ь) + в(Ь), ик(Ь) — и(Ь)), (3.29)

Отметим, что метод проекционных возмущений (3.28), (3.29) выгодно отличается от методов возмущений с искусственным параметром возмущения е € [0,1] тем, что управление и € V улучшается решением возмущенной системы (3.26), (3.27) для любого параметра возмущения а > 0. Решение возмущенных задач в методах с параметром возмущения 0 < е < 1 в общем случае не гарантирует улучшения управления и.

4. Заключение

Сходимость предлагаемых итерационных процессов к решениям возмущенных задач в пространствах непрерывных функций с равномерной нормой обосновывается аналогично работе [1]. Основным условием сходимости является достаточно малое значение параметра проектирования а > 0, которое обеспечивает выполнение свойства "сжимания"для определяемых операторов проектирования в задачах о неподвижной

точке. При этом конструируемые итерационные процессы рассматриваются как модификации известного метода простой итерации для решения задач о неподвижной точке.

Расчет возмущенных задач осуществляется до первого улучшения исходного управления. Далее строится новая задача улучшения для полученного управления, для которой процесс решения методом возмущений повторяется.

Таким образом, проекционные методы возмущений для решения задач улучшения управления позволяют строить релаксационные последовательности управлений в классах непрерывных функций. Методы характеризуются отсутствием операций выпуклого или игольчатого варьирования управлений на каждой итерации улучшения и принципиальной возможностью улучшения неоптимальных управлений, удовлетворяющих дифференциальному принципу максимума. Такая возможность появляется в случае неединственности решения краевых задач и задач о неподвижной точке.

Выделим характерные особенности методов возмущений для улучшения управлений в рассматриваемом классе нелинейных задач.

1. Нелокальность улучшения управления, обусловленная фиксиро-ванностью параметра проектирования.

2. Отсутствие трудоемкой операции игольчатого или слабого варьирования при поиске улучшающего управления.

3. Принципиальная возможность строгого улучшения управлений, удовлетворяющих дифференциальному принципу максимума.

Данные свойства являются существенными факторами повышения эффективности решения задач оптимизации нелинейных управляемых систем.

Развиваемые подходы возмущений без принципиальных затруднений модифицируются для реализации условий нелокального улучшения в задачах оптимального управления с терминальными ограничениями типа равенств, построенных в работах [7; 9].

Список литературы

1. Булдаев А. С. Методы возмущений в задачах улучшения и оптимизации управляемых систем / А. С. Булдаев. - Улан-Удэ : Изд-во Бурят. гос. ун-та, 2008. - 260 с.

2. Булдаев А. С. Улучшения управлений в нелинейных системах на основе краевых задач / А. С. Булдаев, О. В. Моржин // Изв. Иркут. гос. ун-та. Сер. Математика. - 2009. - Т. 2, № 1, С. 94-106.

3. Булдаев А. С. Модификация метода проекций для улучшения нелинейных управлений / А. С. Булдаев, О. В. Моржин // Вестн. Бурят. гос. ун-та. -2010. - Вып. 9 : Математика, информатика. - С. 10-17.

4. Булдаев А. С. Новый подход к оптимизации управляемых систем на основе краевых задач / А. С. Булдаев // Автоматика и телемеханика. - 2011. - № 6, С. 87-94.

5. Булдаев А. С. Метод неподвижных точек в задачах параметрической оптимизации систем / А. С. Булдаев, И.-Х. Д. Хишектуева // Автоматика и телемеханика. - 2013. - № 12. - С. 5-14.

6. Булдаев А. С. Методы возмущений в квадратичных задачах оптимального управления / А. С. Булдаев, Д. О. Трунин // Автоматика и телемеханика. -2008. - № 3. - С. 135-145.

7. Булдаев А. С. Нелокальное улучшение управлений в линейных по состоянию системах с терминальными ограничениями / А. С. Булдаев, Д. О. Трунин // Автоматика и телемеханика. - 2009. - № 5. - С. 7-12.

8. Срочко В. А. Итерационные методы решения задач оптимального управления / В. А. Срочко. - М. : Физматлит, 2000. - 160 с.

9. Трунин Д. О. Об одном подходе к оптимизации нелинейных управляемых систем с терминальными ограничениями / Д. О. Трунин, А. С. Булдаев // Вестн. Бурят. гос. ун-та. Математика, информатика. - 2013. - № 1. - С. 15-20.

Булдаев Александр Сергеевич, доктор физико-математических наук, профессор, Бурятский государственный университет, 670000, Улан-Удэ, ул. Смолина, 24а тел.: (3012)221215 (e-mail: : )buldaev@mail.ru

A. S. Buldaev

Projection Perturbation Methods in Optimization Problems of Controlled Systems

Abstract. Perturbation methods are used to implement the conditions of nonlocal improvement of controls, constructed in the form of special boundary value problems in space of phase and conjugate variables and in the form of special tasks of a fixed point of definite operator in the space of controls. Terms improvement of controls are determined by the operation of projection onto the set of admissible control values. Methods are characterized by a lack of operations of convex or needle variation of controls and principal possibility to improve suboptimal controls satisfying the maximum principle.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Keywords: controlled system, conditions of control improvement, projection operators, perturbation methods.

References

1. Buldaev A.S. Perturbation Methods in Improvement and Optimization Problems for Controllable Systems(in Russian). Ulan-Ude, Buryat. Gos. Univ., 2008, 260 p.

2. Buldaev A.S., Morzhin O.V. Control Improvement in Nonlinear Systems Based on Boundary Problems(in Russian). Izv. Irkut. Gos. Univ., Mat., 2009, vol. 2, no. 1, pp. 94-107.

3. Buldaev A.S., Morzhin O.V. A Modification of the Projection Method for Improving Nonlinear Controls (in Russian). Vest. Buryat. Gos. Univ., Vypusk 9 «Mat., Informat.», 2010, pp. 10-17.

4. Buldaev A.S. A Boundary Improvement Problem for Linearly Controlled Processes. Automation and Remote Control, 2011, vol. 72, no. 6, pp. 1221-1228.

5. Buldaev A.S., Khishektueva I.-Kh.D. The Fixed Point Method in Parametric Optimization Problems for Systems. Automation and Remote Control, 2013, vol. 74, no. 12, pp. 1927-1934.

6. Buldaev A.S., Trunin D.O. Methods of perturbations in quadratic problems of optimal control. Automation and Remote Control, 2008, vol. 69, no. 3, pp. 472-482.

7. Buldaev A.S., Trunin D.O. Nonlocal improvement of controls in state-linear systems with terminal constraints, Automation and Remote Control, 2009, vol. 70, no. 5, pp. 743-749.

8. Srochko V.A. Iteration Methods for the Solution of Optimal Control Problems (in Russian). Moscow, Fizmatlit, 2000, 160 p.

9. Trunin D.O. An approach to the optimization of nonlinear control systems with terminal constraints (in Russian). Vest. Buryat. Gos. Univ. Mat., Informat., 2013, no. 1, pp. 15-20.

Buldaev Aleksandr Sergeevich, Doctor of Sciences (Physics and Mathematics), Professor, Buryat State University, 24a, Smolina st., Ulan-Ude, 670000 tel.: (3012)221215 (e-mail: : )buldaev@mail.ru

Проекционные методы возмущений в задачах оптимизации управляемых систем Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Булдаев Александр Сергеевич

Похожие темы научных работ по математике , автор научной работы — Булдаев Александр Сергеевич

Projection Perturbation Methods in Optimization Problems of Controlled Systems

Текст научной работы на тему «Проекционные методы возмущений в задачах оптимизации управляемых систем»