Научная статья на тему 'МОДИФИКАЦИИ ПРОЕКЦИОННЫХ МЕТОДОВ В БИЛИНЕЙНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ'

МОДИФИКАЦИИ ПРОЕКЦИОННЫХ МЕТОДОВ В БИЛИНЕЙНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
31
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БИЛИНЕЙНАЯ УПРАВЛЯЕМАЯ СИСТЕМА / ОПЕРАЦИЯ ПРОЕКТИРОВАНИЯ / УСЛОВИЯ УЛУЧШЕНИЯ УПРАВЛЕНИЯ / ЗАДАЧА О НЕПОДВИЖНОЙ ТОЧКЕ / ИТЕРАЦИОННЫЙ АЛГОРИТМ

Аннотация научной статьи по математике, автор научной работы — Казьмин И. Д.

В классе билинейных задач оптимального управления рассматриваются методы нелокального улучшения управления на основе нестандартных формул приращения целевого функционала, не содержащих остаточных членов разложений. Такие формулы позволяют конструировать условия улучшения управления в форме специальных задач о неподвижной точке проекционных операторов управления. Рассматриваемая форма условий улучшения управления в виде задач о неподвижной точке в пространстве управлений дает возможность применить и модифицировать известные в вычислительной математике методы неподвижных точек для поиска улучшающих управлений и построения релаксационных последовательностей управлений. Анализируются условия улучшения и оптимальности управления на основе задач о неподвижной точке. Конструируются итерационные процессы поиска улучшающих управлений и построения релаксационных последовательностей управлений. Приводятся результаты аналитического и численного сравнения эффективности предлагаемых проекционных методов оптимизации с известными проекционными методами на тестовых примерах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Казьмин И. Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODIFICATIONS OF PROJECTION METHODS IN BILINEAR OPTIMAL CONTROL PROBLEMS

In the class of bilinear optimal control problems, methods of nonlocal improvement of control are considered based on non-standard formulas for the increment of the objective functional that do not contain the remainder of the expansions. Such formulas make it possible to construct conditions for improving control in the form of special fixed point problems of projection control operators. The considered form of control improvement conditions in the form of fixed point problems in the control space makes it possible to apply and modify the fixed point methods known in computational mathematics to find improving controls and construct relaxation control sequences. The conditions for improvement and optimality of control based on fixed point problems are analyzed. Iterative processes of searching for improving controls and constructing relaxation sequences of controls are constructed. The results of analytical and numerical comparison of the effectiveness of the proposed projection optimization methods with the known projection methods on test examples are presented.

Текст научной работы на тему «МОДИФИКАЦИИ ПРОЕКЦИОННЫХ МЕТОДОВ В БИЛИНЕЙНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ»

Научная статья УДК 517.977

DOI: 10.18101/2304-5728-2021-2-44-60

МОДИФИКАЦИИ ПРОЕКЦИОННЫХ МЕТОДОВ В БИЛИНЕЙНЫХ ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

© Казьмин Иван Дмитриевич

аспирант,

Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а kazminvanya@mail.ru

Аннотация. В классе билинейных задач оптимального управления рассматриваются методы нелокального улучшения управления на основе нестандартных формул приращения целевого функционала, не содержащих остаточных членов разложений. Такие формулы позволяют конструировать условия улучшения управления в форме специальных задач о неподвижной точке проекционных операторов управления. Рассматриваемая форма условий улучшения управления в виде задач о неподвижной точке в пространстве управлений дает возможность применить и модифицировать известные в вычислительной математике методы неподвижных точек для поиска улучшающих управлений и построения релаксационных последовательностей управлений. Анализируются условия улучшения и оптимальности управления на основе задач о неподвижной точке. Конструируются итерационные процессы поиска улучшающих управлений и построения релаксационных последовательностей управлений. Приводятся результаты аналитического и численного сравнения эффективности предлагаемых проекционных методов оптимизации с известными проекционными методами на тестовых примерах.

Ключевые слова: билинейная управляемая система; операция проектирования; условия улучшения управления; задача о неподвижной точке; итерационный алгоритм.

Благодарности. Работа выполнена при финансовой поддержке Бурятского госуниверситета, проект 2021 г.

Для цитирования

Казьмин И. Д. Модификации проекционных методов в билинейных задачах оптимального управления // Вестник Бурятского государственного университета. Математика, информатика. 2021. № 2. С. 44-60.

Введение

Рассматривается класс билинейных управляемых систем, который опи -сывается линейными по состоянию и управлению обыкновенными дифференциальными управлениями. Такими системами моделируются управляемые динамические процессы в области биологии, экономики, медицины,

энергетики [1; 2]. Теория и методы решения билинейных задач оптимального управления рассматривались во многих исследованиях [3-5].

В работе [5] на основе построения нестандартных формул приращения целевого функционала, не содержащих остаточных членов разложений, разработаны эффективные методы нелокального улучшения управления в билинейных управляемых системах с квадратичными функционалами качества управления. Улучшение управления достигается решением специальных задач Коши для фазовых и сопряженных систем в пространстве состояний.

В данной статье рассматриваются новые модификации нелокальных методов оптимизации применительно к рассматриваемому классу билинейных управляемых систем на основе представления условий нелокального улучшения управления в форме задач о неподвижной точке в пространстве управлений. Этот подход позволяет получить новые особенности конструируемых методов оптимизации по сравнению с известными методами, важные для повышения эффективности решения задач рассматриваемого класса.

1 Условия улучшения и оптимальности управления

Рассматривается класс билинейных задач оптимального управления:

ф(и) = р(х+ I" Е(х^), и(X), ® М , (1)

* Т ие¥

Х(Г) = / (х(1), и(0, X), х(10) = х0, и (X) е и с Ят, X еТ = [¿0, (2)

в котором функция р(х) линейна на Я", функции /(х,и,X), Е(х,и,X) линейны по переменной х, линейны по переменной и и непрерывны по переменной X на множестве Я" х и х Т. В качестве допустимых управлений и(х) = (и1(х),...,ит(X)) рассматривается множество V кусочно-непрерывных функций на интервале Т со значениями в компактном и выпуклом множестве и с Ят. Начальное состояние х0 и интервал Т фиксированы.

В работе используются общие обозначения билинейных функций /(х,и,X), Е(х,и,X) для простоты и удобства представления конструкций предлагаемых методов, а также общее обозначение линейной функции р( х) для единообразия с общими обозначениями билинейных функций.

Функция Понтрягина с сопряженной переменной у и стандартная сопряженная система в общих обозначениях имеют вид:

Н(у, х,и, X) = {у,/(х, и, X))- Е(х, и, X), у е Я", у (X) = -Нх (У), х^), и^), X), X еТ, У1) = -Рх (х(О). (3)

Для допустимого управления V е V обозначим х^, у), X еТ — решение системы (2); у^,у), X е Т — решение стандартной сопряженной системы (3) при х^) = х^,у), и(X) = V(X). Будем использовать следующее

обозначение частного приращения произвольной вектор-функции g(yi,...,y,) по переменным , yÄ2 :

D^,ZSig(У1,...,У,) = g(У1,...,zSi,...,zS2,...,y,) -g(yi,...,y,...,yi2,...,y,) .

Обозначим PY — оператор проектирования на множество Y с Rk в евклидовой норме:

PY (z) = argmin(||y - z|I), z e Rk .

yeY 11 11

Важным свойством оператора проектирования является выполнение неравенства:

(y - Py (z), z - Py (z)) < 0, y eY .

Известное [5; 6] необходимое условие оптимальности (принцип максимума) для управления u eV в классе билинейных задач (1), (2) можно представить в форме:

u(t) = arg maxH(y(t, u), x(t, u), w, t) =

WeU , (4)

= arg max(Hu (y(t,u), x(t, u), u(t), t), w), t e T.

weU

С помощью отображения u*, определяемого соотношением:

u * (y, x, t) = argmax H(y, x, w, t), ye Rn, x e Rn, t eT,

weU

условие (4) можно записать в следующем виде:

u(t) = u*(y(t,u),x(t,u),t), t eT .

Условие (4) с помощью операции проектирования можно записать в эквивалентной форме с параметром a > 0 :

u (t) = PU (u(t) + aHu (y(t,u),x(t,u),u(t), t)) , t e T . (5)

Отметим, что для выполнения принципа максимума (4) достаточно проверить условие (5) хотя бы для одного a > 0 . Обратно, из условия (4) следует выполнение условия (5) для всех a > 0 .

Определим отображение ua с параметром a > 0 с помощью соотношения:

ua(y, x, w, t ) = PU (w + aHu (y, x, w, t)), x e Rn, ye Rn, w eU , t e T .

С помощью отображения ua принцип максимума в проекционной форме (5) можно записать в виде:

u(t) = ua(y(t,u),x(t,u),u(t),t), t eT . (6)

Рассмотрим задачу улучшения управления u eV: найти управление v e V с условием F(v) <F(u).

В соответствии с [5] в рассматриваемом классе задач (1), (2) имеют место две нестандартные формулы приращения функционала, не содержащие остаточных членов разложений:

Лу Ф(и) = -ГД^ )Н (у^, и), x(X, V), и (X), X)dX =

, (7)

= \т(Ни (у^,и),х^,у),и^),X),у^) - и(X))dX,

ЛуФ(и) = - Г Лу(,)Ну,у),х^,и),u(X),X)dX =

, (8)

= \т(Ни (у(X,у),х^,и),и(X),X),у^) - и(X))dX.

Для заданного и еV найдем решения х^,и), X еТ и у^,и), X еТ .

Рассмотрим уравнение относительно функции у е V для заданного а > 0:

у^) = ^{у^,и),х^,у),и(X),X), X еТ . (9)

Пусть уа еV — решение уравнения (9). Тогда функция х^, уа), X еТ является решением специальной задачи Коши:

х^) = /(х^),иа(у(X,и),х^),и(X),X),X), х^0) = х0. (10)

Обратно, пусть х(), X е Т — решение задачи Коши (10). Сформируем выходное управление по правилу:

уа(X) = иа(у^,и),x(X),и^),X), X еТ .

Имеем, что уа еV и х^) = х^, уа), X еТ . Таким образом, уа еV является решением уравнения (9).

Следовательно, для решения уравнения (9) на множестве допустимых управлений достаточно решить специальную задачу Коши (10), и наоборот. В этом смысле уравнение (9) является эквивалентным задаче Коши (10).

В силу свойств оператора проектирования (однозначность, условие Липшица) задача Коши (10) имеет единственное решение и однозначно определяет выходное управление уа еV .

Таким образом, получаем следующее утверждение.

Теорема 1. Уравнение (9) имеет единственное решение уа еV .

Отметим, что метод решения уравнения (9) по правилу: уа (X) = иа у, и), х^), и^), X), X еТ, где х^), X е Т — решение специальной задачи Коши (10), является эквивалентным известному [3] проекционному методу нелокального улучшения управления, применяемым к билинейной задаче (1), (2).

На решении уа еV уравнения (9), согласно свойству оператора проектирования, выполняется неравенство:

(Ни у и), х (X, уа), и (X), X), уа^) - и (X)) >-IИ0 - и (X )||2, X е Т .

\ 'а1 11

В результате по формуле (7) получаем улучшение заданного управления и еV с оценкой:

Л^Ф^) <--- и |va(t) - и(0||2 dt. (11)

Таким образом, уравнение (9) можно рассматривать как условие улуч -шения управления u е V .

Рассмотрим второе уравнение относительно функции v еV для заданного а > 0:

v(t) = и-(у^,v),x(t,u),u(t),t), t еT . (12)

Пусть V- еУ — решение уравнения (12). Тогда функция у^, va), t еТ, ввиду свойства линейности задачи (1), (2) по переменной х, удовлетворяет специальной задаче Коши:

у(t) = -Нх (у(0, х^,и),иа (у(0, х^,и),и(0, t), t), у(tl) = -(Рх (x(tl,и)). (13)

Обратно, пусть у(), t е Т — решение задачи Коши (13). Сформируем выходное управление по правилу:

V-^) = иа(у^),х^,и),и^),t), t еТ .

Имеем, что V- е У и у(0 = y(t, V-), t е Т . Таким образом, V- е У является решением уравнения (12).

Следовательно, для решения уравнения (12) на множестве допустимых управлений достаточно решить специальную задачу Коши (13) и наоборот. В этом смысле уравнение (12) является эквивалентным задаче Коши (13).

В силу свойств оператора проектирования (однозначность, условие Липшица) задача Коши (13) также имеет единственное решение и однозначно определяет выходное управление V- е У . Таким образом, получаем следующее утверждение.

Теорема 2. Уравнение (12) имеет единственное решение V- е У .

Также отметим, что метод решения уравнения (12) по правилу: V- ^) = и-(у^), х^, и), и^), t), t еТ, где у^), t е Т — решение задачи Коши (13), является эквивалентным другому известному [3] проекционному методу нелокального улучшения управления, рассматриваемым применительно к билинейной задаче (1), (2).

На решении V- еУ уравнения (12), согласно свойству оператора проектирования, выполняется неравенство:

(Ни у V-), х^, и), и (0,0, va(t) - и (0) >-IИ0 - и (0||2, t е Т . \ 'а11 11

В результате по формуле (8) получаем улучшение заданного управления и еУ с оценкой (11).

Следовательно, уравнение (12) можно рассматривать как второе условие улучшения управления и еУ .

Предлагаемые первый и второй проекционные методы улучшения

управления заключаются в решении уравнений (9) и (12) соответственно. Таким образом, предлагаемые проекционные методы улучшения управления отождествляются с уравнениями (9) и (12) в пространстве управлений.

При этом отметим, что указанные выше известные проекционные методы улучшения управления [5] в рамках задачи (1), (2) отождествляются со специальными задачами Коши (10) и (13) в пространстве состояний.

На основе предлагаемых проекционных методов улучшения управления (9) и (12) можно сформулировать следующее утверждение.

Теорема 3. Управление и еV удовлетворяет принципу максимума (6) при некотором а > 0 тогда и только тогда, когда решения уравнений (9) и (12) удовлетворяют условию уа = и .

Действительно, если при некотором а > 0 получаем уа = и, то соотношения (9) и (12) совпадают с условием принципа максимума (6).

Обратно, пусть и еV удовлетворяет принципу максимума (6) при некотором а > 0 . Тогда очевидно, что управление и е V удовлетворяет уравнениям (9) и (12) при у = и . Следовательно, в силу единственности решения, уа = и .

В качестве следствия отметим, что в силу единственности решений уравнений (9) и (12) управление, удовлетворяющее принципу максимума, строго не улучшается рассматриваемыми проекционными методами улучшения управления в классе билинейных задач (1), (2).

Из теоремы также следует, что проекционные методы строго улучшают любые управления, не удовлетворяющие принципу максимума, согласно оценке (11).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В качестве еще одного следствия получаем новую формулировку из -вестного необходимого условия оптимальности (6) на основе рассмотренных проекционных методов улучшения управления.

Теорема 4 (принцип максимума). Пусть управление и еV оптимально в билинейной задаче (1), (2).

Тогда и еV является единственным решением уравнений (9) и (12) при всех а > 0 .

Форма полученных условий улучшения управления (9) и (12) позволяет рассматривать эти условия как задачи о неподвижной точке на множестве допустимых управлений. Это дает возможность применить новый подход к решению этих уравнений.

2 Модификации проекционных методов оптимизации

Для численного решения задачи о неподвижной точке оператора О: УЕ ® VE, действующего на множестве УЕ в полном нормированном

пространстве Е с нормой ||-||Е

у = О(у), уеV,

можно использовать известным в вычислительном математике метод последовательных приближений и его модификации [7]. В частности, можно применить явный метод простой итерации с индексом к > 0 , имеющий форму:

vk+1 = G(vk), v0 eVE .

Сходимость итерационного процесса можно анализировать с помощью известного принципа сжимающих отображений.

Для решения задач о неподвижной точке (9) и (12) методы простой итерации с заданным начальным приближением v0 eV при к = 0 принимают соответственно следующий вид:

vk+1(t) = ua(y(t,u),x(t,vk),u(t),t), t e T . (14)

vk+1(t) = ua(y(t,vk),x(t,u),u(t),t), t e T . (15)

Сходимость итерационных процессов (14) и (15) можно анализировать с помощью известного принципа сжимающих отображений в полном пространстве измеримых функций:

V с V, = {v e L„ (T): v(t) eU, t e T}

с нормой ||v||¥ = ess sup ||v(t)||, v eVL.

¥ teT

В частности, можно показать аналогично работе [8], что при достаточно малых параметрах проектирования а > 0 процессы (14) и (15) могут сходиться в норме ||-||¥ к решениям соответствующих задач о неподвижной точке (9) и (12).

В предположении сходимости итерационных процессов (14) и (15) для заданного а> 0 рассмотрим следующие модификации проекционных методов последовательных приближений управления.

В предлагаемых модификациях проекционных методов в качестве начального приближения рассматривается управление v° eV, не являющееся экстремальным управлением, т. е. не удовлетворяющее принципу максимума. Итерации по индексу к > 0 проводятся до первого строгого улучшения управления u eV по целевому функционалу: F(vk) <F(u). Далее строится новая задача о неподвижной точке для улучшения полученного расчетного управления и итерационный процесс повторяется.

Если строгое улучшение управления u не происходит по индексу

к > 0 , т. е. F(vk) >F(u), то получаем условие: F(va) = F(u), где va — решение соответствующих задач о неподвижной точке: v(t) = ua(y(t,u), x(t, v),u(t), t), t eT . v(t) = ua(y(t,v),x(t,u),u(t),t), t eT .

При этом в силу оценки (11) получаем, что u = va, т. е. управление u удовлетворяет необходимому условию оптимальности (6).

В результате возникают релаксационные последовательности управлений и1, 1 > 0 со свойством Ф(уы) <Ф(иг), образуемые в результате последовательного расчета задач улучшения управления (9) и (12) соответственно.

В случае конечной релаксационной последовательности и1, I > 0, ко-

I

гда строгое улучшение конечного управления и не происходит по индексу к > 0 , т. е. Ф(ук) >Ф(и1), имеем для конечного управления и1 выполнение необходимого условия оптимальности (6).

Для случая бесконечной релаксационной последовательности и1, I > 0, когда Ф(и1+1) <Ф(и1), получаем следующее. В задаче (1), (2) семейство фазовых траекторий системы (2) в совокупности ограничено:

х(Х, и) е X , X е Т, и е V ,

где X е Я" — выпуклое компактное множество. В силу ограниченности семейства фазовых траекторий последовательности Ф(и1), I > 1 ограничены снизу. Следовательно, с учетом релаксации, эти последовательности являются сходящимися, т. е.

Ф(и'+1) -Ф (и1) ® 0, I ®¥.

Отсюда возникают следующие критерии окончания расчета задачи (1), (2) предлагаемыми модификациями методов.

Если выполнилось первое строгое улучшение управления и1 еV по индексу к > 0 : Ф(ук) <Ф(и1), то и1+1 = ук и проверяется условие остановки расчета по функционалу:

^(и1+1) -Ф(и1) <е |Ф(и' )|,

где е1 > 0 — заданная относительная точность расчета целевого функционала.

Если указанный критерий остановки выполнился, то на этом расчет предлагаемыми модификациями методов заканчивается. Иначе строится новая задача о неподвижной точке для улучшения полученного расчетного управления и1+1 и итерационный процесс повторяется.

Если строгое улучшение управления и1 еV по индексу к > 0 не происходит, т. е. Ф(ук) >Ф(и1), то итерационный процесс проводится до выполнения условия:

||ук+1 - /11 <е2|И ,

II Над II Над

где е2 > 0 — заданная относительная точность расчета задачи о неподвижной точке. На этом расчет предлагаемыми модификациями методов заканчивается.

Для сравнения предлагаемых модификаций проекционных методов на основе методов улучшения (9) и (12) рассмотрим известные проекцион-

ные методы на основе методов улучшения (10) и (13), конструируемые по следующим образом.

Для заданного начального (стартового) управления и е V находится решение соответствующих специальных задач Коши (10) и (13) с выходным управлением уа еV, которое обеспечивает улучшение управления с оценкой (11). Полученное выходное управление принимается в качестве нового управления, для которого указанный процесс улучшения повторя -ется.

Проведем анализ сходимости соответствующих релаксационных последовательностей управлений и1, ' > 0, образуемых в результате последовательного расчета специальных задач Коши (10) и (13) соответственно.

Для каждого ' > 0 рассмотрим величину

5(и') = Ф(и') -Ф (и1+1) > 0.

Если 5(и1) = 0, то в силу оценки (11) получаем, что и' =и1+1, т. е. управление и' удовлетворяет необходимому условию оптимальности (6). Таким образом, величина 5(и') характеризует невязку (меру) выполнения необходимого условия оптимальности (6) на управлении и'.

Теорема 5. Релаксационные последовательности допустимых управлений и1, I > 0, построенные на основе методов улучшения (10) и (13), сходятся по невязке необходимого условия оптимальности (6):

5(и') ® 0, ' ®¥.

Доказательство. В задаче (1), (2) семейство фазовых траекторий системы (2) в совокупности ограничено:

х(?, и) е X , t е Т, и еV ,

где X е Я" — выпуклое компактное множество. В силу ограниченности семейства фазовых траекторий последовательности Ф(и'), I > 1 ограничены снизу. Следовательно, с учетом релаксации, эти последовательности являются сходящимися, т. е.

5(и') = Ф(и')-Ф(и'+1) ® 0, ' ®¥.

Критерием окончания расчета задачи (1), (2) предлагаемым методом является выполнение условия:

5(и') = |Ф(у'+1) - Ф(и')| < £ |Ф(и')|,

где £ > 0 — заданная относительная точность расчета целевого функционала.

Отметим следующие сравнительные особенности рассмотренных предлагаемых методов.

1. Предлагаемые модификации проекционных методов на основе методов улучшения (9) и (12), в отличие от известных градиентных методов, не гарантируют релаксацию по целевой функции на каждой итерации по-

следовательных приближений управления. Свойство релаксации компенсируется нелокальностью последовательных приближений управления и отсутствием на каждой итерации достаточно трудоемкой операции выпуклого или игольчатого варьирования управления в окрестности текущего приближения управления.

2. В рассматриваемых модификациях проекционных методов на основе методов улучшения (9) и (12), в отличие от известных [5] проекционных методов на основе методов улучшения (10) и (13), на каждой итерации решается обычная задача Коши с предварительно вычисленным управлением, в отличие от достаточно трудоемкого решения специальных задач Коши (10) и (13) с проекционным оператором в правой части систем дифференциальных уравнений.

3. Известные [5] проекционные методы на основе методов улучшения (10) и (13) в силу единственности решения специальной задачи Коши не могут строго улучшать экстремальные управления, т. е. удовлетворяющие принципу максимума. Предлагаемые модификации проекционных методов имеют такую возможность за счет конструирования последователь -ных приближений управления, отличающихся от экстремального управления.

Данные особенности рассматриваемых модификаций проекционных методов на основе условий нелокального улучшения управления в форме задач о неподвижной точке являются важными факторами для повышения вычислительной эффективности решения билинейных задач оптимального управления по сравнению с известными градиентными и проекционными методами.

3 Примеры

Рассматриваются примеры, иллюстрирующие характерные особенности и вычислительную эффективность предлагаемых модификаций проекционных методов оптимизации по сравнению с известными методами.

Численное решение фазовых и сопряженных задач Коши производилось методом Рунге — Кутта — Вернера переменного (5-6) порядка точности с помощью программы DIVPRK библиотеки IMSL Fortran PowerStation 4.0 [9]. Значения управляемых, фазовых и сопряженных переменных запоминались в узлах фиксированной равномерной сетки Th с шагом дискретизации h = 10-3 на интервале T . В промежутках между соседними узлами сетки Th значение управления принималось постоянным и равным значению в левом узле. Критерии остановки расчета определялись значениями s1 = e = 10-6 и e2 = 10-4 .

Пример 1 (строгое улучшение экстремального управления). Рассматривается известная билинейная задача [5, с. 19]:

2

Ф(и) = -х(2) + 2| х^)(2 - 3и^))Л ® ,

0

Х^) = 2(u(t) -, х(0) = 1, и(0 е и = [0,1], t еТ = [0,2]. Функция Понтрягина и сопряженная система имеют вид: Н(у, х,и, 0 = 2у(и -- 2х(2 - 3и), у^) = 2(2 - 3и^)), у(2) = 1. Отображение и* можно представить в форме 0, g (у, х, 0 < 0, и* (у, х, 0 = Л, g (у, х, 0 > 0, g (у, х, 0 = 2yt + 6 х, у еи, g(у, х, t) = 0,

Экстремальные управления определяются на основе решений краевой задачи принципа максимума:

х^) = 2(и * (у (t), x(t), t) -, х(0) = 1, у^) = 2(2 - 3и*(y(t), x(t), t)), у(2) = 1. Анализ краевой задачи показывает существование трех экстремальных режимов:

1. х^) = 1, у^) = -2t + 5, t е Т с соответствующим управлением и(0 = 1, t е Т и значением функционала Ф(и) = -5 .

2. х^) = <

1, 0 < t < 1,

у^) = •

1-21 -1, 0 < t < 1,

с соответствующим

Ч2 + 2, 1 < t < 2, - 7, 1 < t < 2,

[1, 0 < t < 1, 4

управлением и^) = •! и значением функционала Ф(и) = -—.

3. х^) = <

1 0 <t < 4,

2 25 3 -2 +—, -< t < 2, 16 4

, y(t) = <

-2t --, 0 < t < 3, 2 4

4t - 7, - < t < 2, 4

с соответст-

вующим управлением и ^) =

1 0 <t < 4,

3

0, - < t < 2,

4

и значением функционала

Ч 65

Ф(и) =--.

48

Таким образом, оптимальным решением задачи оптимального управления является первое экстремальное управление.

Рассмотрим задачу улучшения второго экстремального управления

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с помощью модификации проекционного метода оптимизации на основе метода улучшения (9).

Отображение иа с параметром а > 0 можно записать в форме:

иа (у, х, м>, X) = Ри (w +ag(у, х, X)) , g(у, х, X) = 2уX + 6х .

Отсюда задача о неподвижной точке (9) для улучшения экстремального управления принимает следующий вид:

В качестве начальных приближений для метода простой итерации при к = 0 рассматривались управления, которые не являются экстремальными управлениями, в частности у0(^) = 0 и у0(^) = 0.5, X е Т . При а = 102 для обоих начальных приближений получалось расчетное управление и (/) = 1, X е Т с трудоемкостью, которая оценивается суммарным количеством 26 и 14 задач Коши соответственно. При достаточно больших а итерационный процесс не сходится, при достаточно малых а сходимость существенно замедляется с соответствующим увеличением суммарного количества расчетных задач Коши.

Пример иллюстрирует возможность строгого улучшения экстремального управления предлагаемой модификацией проекционных методов. Градиентные методы такой возможностью не обладают.

Пример 2 (сравнительная эффективность).

Проводится сравнение результатов расчета задачи примера 1 предлагаемой модификацией метода на основе метода улучшения (9) с фиксированным а = 103 и различными начальными приближениями у0 е V для метода простой итерации при к = 0 , не являющимися экстремальными управлениями, с известным проекционным методом на основе метода улучшения (10) для различных стартовых управлений и еV .

у(() =

Ри (1 + а(2^(-2^ -1) + 6х(г, у)), 0 < X < 1, Ри(а(2^(4^ - 7) + 6х(г,у)), 1 < X < 2.

Метод простой итерации для к > 0 соответственно имеет вид:

ук+\г)

Ри (1 + а (2 X (-2 X -1) + 6 х( X, ук)), 0 < X < 1, Ри (а(2( (4^ - 7) + 6 х((, ук)), 1 < X < 2.

В таблицах приводятся результаты расчета по итерациям улучшения с индексом I > 0 до выполнения критериев остановки. Здесь Фи Ф — расчетные значения целевого функционала соответственно проекционным методом (10) и предлагаемой модификацией на основе метода (9). На рисунках демонстрируются конечные расчетные управления ми и , полученные указанными методами. Соответствующие суммарные количества расчетных задач Коши N и N приводятся с учетом остановки по указанным критериям.

1) и = 0:_

1 Ф Ф

1 -1.354166666666666 -1.202510431999998

2 -1.354166666666666 -1.341536106085704

3 -1.709556895999993

4 -4.387292666666666

5 -5.000000000000000

6 -5.000000000000000

Начальное приближение для метода простой итерации выбиралось V0 = 0 . При этом получалось N = 5 с расчетным третьим экстремальным управлением и N = 2 9 с расчетным оптимальным управлением. При начальном приближении для метода простой итерации V0 = 0.5 количество расчетных задач Коши сократилось до N = 18 с тем же количеством итераций улучшения и расчетным оптимальным управлением.

-

1 1

: 1 1

! 0 5 1 5 2,

:

:

Рис. 1. Расчетные управления и и и

2) и = 0.5 :

1 Ф Ф

1 -5.000000000000000 0.333333333333333

2 -5.000000000000000 -1.202510431999998

3 -1.341536106085704

4 -1.709556895999993

5 -4.387292666666666

6 -5.000000000000000

7 -5.000000000000000

Начальное приближение у0 = 0 для метода простой итерации, N = 5 и N = 32 с расчетным оптимальным управлением. При начальном приближении для метода простой итерации у0 = 0.5 количество расчетных задач Коши уменьшилось до N = 18.

Рис. 2. Расчетные управления и и и

Результаты проведенных расчетов показывают, что модификация проекционного метода на основе (9) позволяет получить оптимальное решение u(t) = 1, t е T с различных стартовых управлений, в том числе с экстремальных стартовых управлений. Известный проекционный метод (10) позволяет получить только экстремальное управление, но не может строго улучшить неоптимальное экстремальное управление.

Заключение

В классе билинейных управляемых систем:

1) построены конструктивные условия нелокального улучшения управ -лений в форме задач о неподвижной точке в пространстве управлений;

2) получены новые формы принципа максимума на основе конструируемых задач о неподвижной точке;

3) разработаны модификации итерационных методов для оптимизации билинейных задач оптимального управления.

Выделим основные вычислительные особенности предлагаемых модификаций проекционных методов в классе билинейных задач оптимального управления.

1. Нелокальность улучшения управления и отсутствие трудоемкой операции выпуклого или игольчатого варьирования управления на каждой итерации, характерной для градиентных методов.

2. Возможность строгого улучшения экстремальных управлений в от -личие от градиентных и известных нелокальных проекционных методов.

3. Численное решение обычных фазовых и сопряженных систем с заранее вычисляемым управлением на каждой итерации, в отличие от численного решения трудоемких для реализации специальных фазовых и сопряженных систем в известных нелокальных проекционных методах.

Указанные свойства методов являются важными факторами для повышения эффективности оптимизации билинейных управляемых систем.

Литература

1. Möhler R. R. Bilinear Control Processes: with Applications to Engineering, Ecology and Medicine. Academic Press, New York, London, 1973. 223 p.

2. Рудик А. П. Ядерные реакторы и принцип максимума Понтрягина. Москва: Атомиздат, 1970. 224 с. Текст: непосредственный.

3. Хайлов Е. Н. Об экстремальных управлениях однородной билинейной системы, управляемой в положительном ортанте // Труды МИАН. 1998. Т. 220. С. 217-235. Текст: непосредственный.

4. Срочко В. А., Аксенюшкина Е. В. Задачи оптимального управления для билинейной системы специальной структуры // Известия Иркутского государственного университета. Сер. Математика. 2016. Т. 15. С. 78-91. Текст: непосредственный.

5. Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.

6. Vasiliev O. V. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.

7. Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.

8. Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского госуниверситета. Математика, информатика. 2020. № 1. С. 35-53. Текст: непосредственный.

9. Бартеньев О. В. Фортран для профессионалов. Математическая библиотека IMSL. Ч. 2. Москва: Диалог-МИФИ, 2001. 320 с. Текст: непосредственный.

Статья поступила в редакцию 24.06.2021; одобрена после рецензирования 25.06.2021; принята к публикации 19.08.2021.

MODIFICATIONS OF PROJECTION METHODS

IN BILINEAR OPTIMAL CONTROL PROBLEMS

Ivan D. Kazmin

Graduate student,

Dorzhi Banzarov Buryat State University

24a Smolina St., Ulan-Ude 670000, Russia

Abstract. In the class of bilinear optimal control problems, methods of nonlocal improvement of control are considered based on non-standard formulas for the increment of the objective functional that do not contain the remainder of the expansions. Such formulas make it possible to construct conditions for improving control in the form of special fixed point problems of projection control operators. The considered form of control improvement conditions in the form of fixed point problems in the control space makes it possible to apply and modify the fixed point methods known in computational mathematics to find improving controls and construct relaxation control sequences. The conditions for improvement and optimality of control based on fixed point problems are analyzed. Iterative processes of searching for improving controls and constructing relaxation sequences of controls are constructed. The results of analytical and numerical comparison of the effectiveness of the proposed projection optimization methods with the known projection methods on test examples are presented.

Keywords: bilinear controlled system; operation of projecting; conditions for improving control; fixed point problem; iterative algorithm.

For citation

Kazmin I. D. Modifications of Projection Methods in Bilinear Optimal Control Problems. Bulletin of Buryat State University. Mathematics, Informatics. 2021; 2: 44-60 (In Russ.).

References

1. Mohler R. R. Bilinear Control Processes: with Applications to Engineering, Ecology and Medicine. Academic Press, New York, London, 1973. 223 p.

2. Rudik A. P. Nuclear Reactors and the Pontryagin Maximum Principle. Atomiz-dat, Moscow, 1970. 224 p.

3. Khailov E. N. On Extremal Controls of a Homogeneous Bilinear System Controlled in a Positive Orthant. Trudy MIAN. 1998. (220). Pp. 217-235.

4. Srochko V. A., Aksenyushkina E. V. Problems of Optimal Control for a Bilinear System of Special Structure // The Bulletin of the Irkutsk State University. Series Mathematics. 2016. (15). Pp. 78-91.

5. Srochko V. A. Iterative Methods for Solving Optimal Control Problems. Fizmat-lit, Moscow, 2000. 160 p.

6. Vasiliev O. V. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.

7. Samarskii A., Gulin A. Numerical Methods. Nauka, Moscow, 1989. 432 p

8. Buldaev A. S. Operator Equations and Maximum Principle Algorithms in Optimal Control Problems. Bulletin of Buryat State University. Mathematics, Informatics. 2020. 1. P. 35-53.

9. Bartenev O. V. Fortran for Professionals. IMSL Math Library. Part 2. Dialogue-MIFI, Moscow, 2001. 320 p.

The article was submitted 24.06.2021; approved after reviewing 25.06.2021; accepted for publication 19.08.2021.

i Надоели баннеры? Вы всегда можете отключить рекламу.