Научная статья на тему 'МЕТОДЫ НЕПОДВИЖНЫХ ТОЧЕК В ОДНОМ КЛАССЕ ДИСКРЕТНО-НЕПРЕРЫВНЫХ ЗАДАЧ ОПТИМИЗАЦИИ УПРАВЛЯЕМЫХ СИСТЕМ'

МЕТОДЫ НЕПОДВИЖНЫХ ТОЧЕК В ОДНОМ КЛАССЕ ДИСКРЕТНО-НЕПРЕРЫВНЫХ ЗАДАЧ ОПТИМИЗАЦИИ УПРАВЛЯЕМЫХ СИСТЕМ Текст научной статьи по специальности «Математика»

CC BY
47
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИСКРЕТНО-НЕПРЕРЫВНАЯ СИСТЕМА / УСЛОВИЯ УЛУЧШЕНИЯ И ОПТИМАЛЬНОСТИ УПРАВЛЕНИЯ / ЗАДАЧА О НЕПОДВИЖНОЙ ТОЧКЕ / ИТЕРАЦИОННЫЙ АЛГОРИТМ

Аннотация научной статьи по математике, автор научной работы — Булдаев А. С., Думнов В. А.

В рассматриваемом классе дискретно-непрерывных управляемых систем конструируются формулы приращения целевой функции стандартного вида с остаточными членами разложений и нестандартные формулы, не содержащие остаточных членов разложений. На основе полученных формул строятся условия нелокального улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений. Такое представление условий дает возможность применить и модифицировать известную теорию и методы неподвижных точек для построения итерационных алгоритмов поиска экстремальных управлений и построения релаксационных последовательностей управлений в рассматриваемых дискретно-непрерывных задачах оптимального управления. Предлагаемые итерационные алгоритмы обладают свойством нелокальности последовательных приближений управления и отсутствием процедуры параметрического поиска улучшающего приближения на каждой итерации, характерной для методов градиентного типа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Булдаев А. С., Думнов В. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS OF FIXED POINTS IN ONE CLASS OF DISCRETE-CONTINUOUS PROBLEMS OF OPTIMIZING CONTROLLED SYSTEMS

In the considered class of discrete-continuous control systems, formulas for the increment of the objective function of the standard form with remainder terms of the expansions and non-standard formulas that do not contain the remainder terms of the expansions are constructed. Based on the formulas obtained, conditions for nonlocal improvement and control optimality are constructed in the form of fixed point problems in the control space. Such a representation of conditions makes it possible to apply and modify the well-known theory and methods of fixed points for constructing iterative algorithms for searching for extremal controls and constructing relaxation sequences of controls in the considered discrete-continuous optimal control problems. The proposed iterative algorithms have the property of nonlocality of successive control approximations and the absence of a parametric search procedure for an improving approximation at each iteration, which is characteristic of gradient-type methods.

Текст научной работы на тему «МЕТОДЫ НЕПОДВИЖНЫХ ТОЧЕК В ОДНОМ КЛАССЕ ДИСКРЕТНО-НЕПРЕРЫВНЫХ ЗАДАЧ ОПТИМИЗАЦИИ УПРАВЛЯЕМЫХ СИСТЕМ»

УПРАВЛЯЕМЫЕ СИСТЕМЫ И МЕТОДЫ ОПТИМИЗАЦИИ

Научная статья УДК 517.977

DOI: 10.18101/2304-5728-2021-2-28-43

МЕТОДЫ НЕПОДВИЖНЫХ ТОЧЕК В ОДНОМ КЛАССЕ ДИСКРЕТНО-НЕПРЕРЫВНЫХ ЗАДАЧ ОПТИМИЗАЦИИ УПРАВЛЯЕМЫХ СИСТЕМ

© Булдаев Александр Сергеевич

доктор физико-математических наук, профессор, Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а buldaev@mail.ru

© Думнов Владислав Александрович

аспирант,

Бурятский государственный университет имени Доржи Банзарова Россия, 670000, г. Улан-Удэ, ул. Смолина, 24а

Аннотация. В рассматриваемом классе дискретно-непрерывных управляемых систем конструируются формулы приращения целевой функции стандартного вида с остаточными членами разложений и нестандартные формулы, не содержащие остаточных членов разложений. На основе полученных формул строятся условия нелокального улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений. Такое представление условий дает возможность применить и модифицировать известную теорию и методы неподвижных точек для построения итерационных алгоритмов поиска экстремальных управлений и построения релаксационных последовательностей управлений в рассматриваемых дискретно-непрерывных задачах оптимального управления. Предлагаемые итерационные алгоритмы обладают свойством нелокальности последовательных приближений управления и отсутствием процедуры параметрического поиска улучшающего приближения на каждой итерации, характерной для методов градиентного типа. Ключевые слова: дискретно-непрерывная система; условия улучшения и оптимальности управления; задача о неподвижной точке; итерационный алгоритм.

Благодарности. Работа выполнена при финансовой поддержке РФФИ, проект 18-41-030005_р-а, и Бурятского госуниверситета, проект 2021 г.

Для цитирования

Булдаев А. С., Думнов В. А. Методы неподвижных точек в одном классе дискретно-непрерывных задач оптимизации управляемых систем // Вестник Бурятского государственного университета. Математика, информатика. 2021. № 2. С. 28-43.

Введение

Актуальность и интерес разработки дискретно-непрерывных моделей управляемых процессов диктуются несколькими важными обстоятельствами.

С одной стороны, в настоящее время многие модели управляемых процессов в актуальных эколого-экономических, медико-биологических, технических приложениях не могут быть адекватно представлены классиче -скими дифференциальными уравнениями, не изменяющими структуру в течение рассматриваемого периода времени. К ним относятся, например, системы, описываемые дифференциальными уравнениями с разрывными правыми частями, дифференциальными уравнениями различных порядков на различных временных отрезках либо содержащие кроме дифференциальных уравнений объекты другой природы. В этом случае одним из распространенных подходов к моделированию является полная или частичная дискретизация моделируемого процесса по управлению и состоянию. При этом возникают разнообразные модели неоднородной структуры [1-5].

С другой стороны, подобная дискретизация выступает в качестве эффективного инструмента исследования непрерывных задач и поиска приближенно-оптимальных решений таких задач, которые могут быть использованы в качестве хороших начальных приближений для последующего уточнения решений исходных задач. Подобные приемы хорошо разработаны и апробированы во многих приложениях [6; 7].

Кроме того, существует ряд задач, в частности, в области моделирования управления летательными и космическими аппаратами [8] или управления электропоездами [9], в которых управление технически может быть реализуемо лишь с дискретным регулированием силы тяги.

Дискретно-непрерывный подход к моделированию управляемых систем на основе частичной дискретизации только по управлению рассматривался во многих работах [10; 11]. В работах [12; 13] рассматриваются дискретно-непрерывные модели задач оптимального управления на основе кусочно-линейных аппроксимаций управления с представлением динамики состояния системы на интервалах аппроксимации управления в форме дифференциальных уравнений. Анализ решения задач в работе [12] проводится на основе градиентных методов, применяемых для эквивалентных конечномерных задач в пространстве управляющих параметров. В работе [13] в классе квадратичных задач строятся эквивалентные конечномерные квад -ратичные задачи в пространстве управляющих параметров, для решения которых модифицируются методы принципа максимума.

В настоящей работе предлагается новый подход для решения дискретно-непрерывных задач рассматриваемого класса на основе представления необходимых условий оптимальности и улучшения управления в эквива -лентных конечномерных моделях в форме задач о неподвижной точке в пространстве управляющих параметров. Подход иллюстрируется в рамках задач оптимального управления с кусочно-постоянными управлениями.

1 Дискретно-непрерывная задача оптимального управления

Рассматривается задача оптимального управления:

I (ы) = р(х^)) ® М , (1)

ы={u1,...,uN }еО

x(t) = Л МО, Ык, 0, х(0 = X0, ык еик с Кт(к), t е Тк = ^ ], к = , (2) в которой функция р(х) непрерывно дифференцируема на Я", функции /к (х, ык, t), к = 1, N и их частные производные по переменным X, ык являются непрерывными на множествах Я" х ик х Тк, к = 1, N . Функции /к (X, ык, t) удовлетворяют условию Липшица по X в К" х Цк х Тк с константами Ьк > 0: \\/к (х, ык, г) - ¡к (у, ык, < Ьк ||х - у||, к = 1, N . В качестве допустимых управлений рассматриваются N -мерные наборы т(к)-мерных векторов ы = {ы1,...,ыьг}, ык еик, к = 1,N . О — множество допустимых наборов. Множества ик с Кт(к), к = 1,N компактны и выпуклы. Начальное состояние х0 и интервалы Тк, к = 1,N фиксированы.

Для управления V = {у1,..., ум }еО обозначим х^, V), t еТ = [t0, tN ] — решение системы (2). Значения х(t,V), t е Тк, к = 1, N определяются последовательным интегрированием системы (2) на интервалах разбиения

Тк при ык = vk, t е Тк, к = IN.

Задачу (1), (2) можно рассматривать как специальную задачу математического программирования, в которой требуется определить набор векторов ы = {ы1,...,ыьг} на заданном разбиении интервала Т на N непересекающихся интервалов так, чтобы достигался минимум целевой функции (1).

Будем использовать следующее обозначение частного приращения произвольной вектор-функции g(у1,...,у1) по переменным у5 , у^ :

,zSlg(Уl,...,У1) = g(Уl,...,zs1,...,zs2,...,У:) -gСУ! — Уs1,...,У^.-У:) .

Приращение функции (1) на допустимых управлениях ы , V в соответствии с введенными обозначениями можно записать в виде:

ДД (ы) = Д хЦн,v)р(x(tN,ы)) . (3)

Дополнительно обозначим Дx(t) = х^,V) - х^,ы), Дм($) = v(t) - ы^) .

Рассмотрим кусочно-дифференцируемую вектор-функцию

Р(0 = (Pl(t),...,Р"(t)), t еТ с условием:

Р(tN) = -Рх (x(tN,ы)) - Я , (4)

где величина я удовлетворяет алгебраическому уравнению

(Рх (х(^ , ы )) + Я Д )) = Дх (tN V )Р( х(^ , ы )) . (5)

При этом по определению полагаем q = 0 в случае линейности функции р по х, а также в случае х(^,V) = х(^,и). Тогда приращение (3) можно представить в виде:

\1 (и) = -( р(1ы), Ах (^)).

Рассмотрим тождество:

N N

{р(^), Аx(tN)) - (р(^), Ах(О) = X((Р(Ч), Ах(Хк)) - (р(Хк-), Ах(Хк_х))) = к.

к =1 к=1

Определим на каждом интервале Тк, к = 1, N сопряженные переменные Рк(0 = (Ри(0,...,Ркп(t)) с условиями:

РN = Р^ы), Рк ^) = Рk+l(tk), к = 1, N -1.

Введем на каждом интервале Тк, к = 1, N функцию Понтрягина:

Нк (Рк, х, Wk, 0 = {рк,/к (х, Wk, 0> , Рк е Яп, ^к е ик(п), и определим с ее помощью дифференциально-алгебраическую систему для функции Рк ^) в форме:

Рк (t) = -Нкх (Рк (t), x(t, и), ик, 0 - Гк (0, t е Тк, (6)

где величина гк (^ = (гк1(^,...,г1пг(t)) определяется в каждый момент времени t еТк из алгебраического уравнения:

{Нкх (Рк (t), x(t, и), ик, 0 +Гк (0, Ах(0) = Ах ^ ,v) Нк (Рк (t), x(t, и), ик, 0 . (7)

При этом по определению полагаем гк ^) = 0 в случае линейности функции /к по х, а также в случае равенства х^,V) = х^,и) .

Определим функцию Р^), t еТ по правилу:

Р(0 = Рк (t), t еТк, к = .

Тогда каждое слагаемое 1к, к = 1,N в указанном выше тождестве можно записать в виде:

1к = (Рк (tk), МЧ)) -(Рк (Ч -l), МЧч)> = \Т1^Рк ^), Аг (t))л = = {<Рк(t), МО) + (Рк(t), Ах(^),к/к(x(t,и)ик,о)}Л =

= ¡Тк {-Ах(,^)Нк (Рк ^), х(t, и), ик, t) + Ах(,,v),^Нк (Рк ^), х(t, и), ик, t^ =

= 1 АvkHk (Рк (t), х ^, V), ик, t )Л.

•!Тк к

На основе полученного соотношения приращение (3) принимает вид:

N

Аv1 (и) = -££, АvkHk (Рк (0, х^, V),ик, . (8)

к =1 к

Таким образом, значения функции Р^), t еТ определяются последовательным интегрированием дифференциальных систем (6), включающих

алгебраические уравнения (7), на интервалах разбиения Тк, к = 1, N с начальным условием (4), включающим уравнение (5). Для представления полученной формулы (8) на основе функции р^), X е Т введем дифференциально-алгебраическую систему для переменной р^), X еТ следующими соотношениями:

р(X) = -Иы(р($),х($),Wk,X) -гк(X), X еТк, к = , (9)

(Икх(р( X), х(X), Wk,X) + Гк( X),у(X) - х(0) = Ау(X)Нк (р( X), х( X), Wk,X), (10) с начальным условием:

P(XN) = (х (x(XN)) - Ч , (11)

((x(XN)) + Ч,У(XN) - x(XN)) = Ау^((x(XN)), (12)

в которой по определению полагаем гк ( X) = 0, ч = 0 в случае линейности функций р, /к, к = 1, N по х (линейная по состоянию задача (1), (2)), а также в случае у(X) = х( X) при соответствующих X е Т .

Обозначим р^,и,у), XеT = [ X0,XN] — решение системы (9)-(12), полученное последовательным интегрированием на интервалах разбиения

Тк, к = 1, N при wk = ик, Xе Тк, к = 1, N, х^) = х (X, и), у^) = х^, у), Xе Т . Тогда формула приращения (8) приобретает следующую форму:

N

Ау1 (и) =-Х.[Т А уНк (р( X, и, у), х( X, у), ик ^ . (13)

к =1 к

Формула приращения (13) характеризуется отсутствием каких-либо остаточных членов разложений. Аналог классических формул приращения с остаточными членами разложения, полученных для непрерывных задач оптимального управления в работах [14; 15], применительно к рассматриваемой дискретно-непрерывной задаче (1), (2) можно получить по указанной выше схеме вывода следующим образом.

Рассмотрим кусочно-дифференцируемую вектор-функцию

) = (У^),...,^(X)), X еТ с условием:

) = -Рх (х (XN, и)). (14)

Тогда приращение (3) представляется в виде:

Ау1 (и) = - (у (XN), Ах(XN)) + о (|| Ах^ )||) . Рассмотрим тождество:

N N

У«»), Ах^)) - У (Xo), Ах(Xo)) = X (У &), Аx(Xk )) - У (X,-), Аx(Xk-1))) = X"7 к.

к=1 к=1

На каждом интервале Тк, к = 1, N с помощью функции Понтрягина Ик определим дифференциальную систему для сопряженных переменных

Ук (0 = ум (О—У,(X)) в форме:

У ^) = -Икх (У(X), х((:,u),ик, X), X еТк (15)

32

с условиями:

Ум= У(tN), Ук) = УкА(к)5 к = Я-1-Определим функцию у^), t е Т соотношениями:

У(0 = Ук (О, t еТк, к = 1М . Тогда каждое слагаемое 3к, к = 1,N в указанном выше тождестве можно записать в виде:

Л = Ук (^), )) -Ук (tk -1), -1)) = Ук (t), МО) Л =

= |т {У (t), ^)) + (У к ^) А х (,^ х^ /к (x(t, и), ик, t)) } Л =

= {т {- (Нкх (Ук ^), х^, и X ик, t), Ах^)) + АХ ((,у (ук ^), x(t, и), ик, t)} Л.

Полученное выражение в соответствии с [14; 15] можно представить в форме:

3к = |т Ак нк (Ук(t), x(t, ^ ик, 0Л + о (|| Аи 11). В итоге приращение (3) принимает вид:

N N

А/(и) = -£ Г, А уИк (у к (О, х^, V), ик, о^ + о(Х||Аик| |) - (16)

к=1 к к=1

Введем систему для переменной у^), t е Т следующими соотношениями:

у^) = -Нх(У),х(t),^к,t), t еТк, к = (17)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

с начальным условием:

У^м) = -х (х^м)). (18)

Обозначим у^, V), t еТ = tN ] — решение системы (17)-(18), полученное последовательным интегрированием на интервалах разбиения Тк,

к = 1, N при wk = vk, t е Тк, к = 1, N, х(0 = x(t, V), t е Т . Тогда формула приращения (16) приобретает следующую форму:

N. N

Аv^(и) = -£Г АуНк(у(,и),x(t,и),ик,+ о(Х||Аик||) . (19)

к=1 к к=1 Из формулы (19) следует формула стандартного вида с линейной по приращению управления главной частью приращения целевой функции:

N N

А/(и) = -£[, (Ныу,и),х^,и),ик,0,Аи^Л +о(^||Аик||) . (20)

к=1 Тк к=1

Отметим, что в линейной по управлению задаче (1), (2) (функции /к,

к = 1, N линейны по и) формулы (19) и (20) совпадают.

В линейной по состоянию задаче (1), (2) модифицированная сопряженная система (9)—(12) в силу определения совпадает с сопряженной системой (17), (18) стандартного вида. Из определений также следует очевидное равенство р^,и,и) = у^,и), t е Т .

В нелинейной по состоянию задаче (1), (2) алгебраические уравнения (10) и (12) всегда можно аналитически разрешить относительно величин г(X) и ч в виде явных или условных формул (возможно, не единственным образом). Таким образом, дифференциально-алгебраическую сопряженную систему (9)-(12) всегда можно свести (возможно, не единственным образом) к дифференциальной сопряженной системе с однозначно определенными величинами г (X) и ч .

2 Условия оптимальности и улучшения управления

На основе формулы приращения (20) нетрудно получить необходимое условие оптимальности в задаче (1), (2) для управления и еО в форме следующего неравенства:

N

XI (Ики У(X, и X x(X, и X ик, X), Wk - ик)Л < 0 ' W = К — WN } '

к=1 Тк

Wk е и к, к = .

Это неравенство можно представить в форме эквивалентной системы неравенств:

{Т(Ии У^, и), х^, и), ик, X), w - uk)dX < 0, w еик, к = Щ . (21)

Систему неравенств (21) можно записать в виде системы уравнений:

ик = а^шах . ИУ^,и),x(X,и),ик,X),w)dX, к = 1,N . (22)

wеUk -¡Тк

Обозначим Рг — оператор проектирования на множество У с Як в евклидовой норме:

РУ (г) = а^тт(||у - I), г е Як .

уеУ 11 11

С помощью оператора проектирования систему неравенств (21) можно также представить в проекционной форме с параметром а > 0 :

и к = Рщ (ик +а. И ки У( ,и), х^, и), ик, X )Л), к = 1, N . (23)

к •!Тк

Отметим, что для выполнения необходимого условия оптимальности (21) достаточно проверить условие (23) для некоторого а > 0. Обратно, из условия (21) следует выполнение условия (23) для всех а > 0 .

Для поиска экстремальных управлений, т. е. удовлетворяющих необходимым условиям оптимальности, можно применить и модифицировать известные градиентные методы и их модификации, основывающиеся на формуле приращения (20).

В работе рассматривается новый подход к поиску экстремальных управлений, основывающийся на представлении необходимых условий оптимальности (22) и (23) в форме задач о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов и = {и1,...,иы}. Такое представление дает возможность применить и модифицировать известную теорию и методы

неподвижных точек для конструирования новых итерационных алгоритмов поиска экстремальных управлений как решений рассматриваемых задач о неподвижной точке.

Рассмотрим задачу об улучшении допустимого набора и = {и1;...,иы} : найти допустимый набор V = уы} с условием Ау1 (и) < 0.

Для улучшения управления и = {и15...,иы} можно модифицировать известные градиентные методы, основывающиеся на формуле приращения (20), которые относятся к локальным методам улучшения. В работе рассматриваются новые методы нелокального улучшения, основывающиеся на конструировании с помощью нестандартной формулы приращения (13) условий нелокального улучшения управления в форме задач о неподвижной точке в пространстве управлений.

Покажем, что для улучшения управления в задаче (1), (2) достаточно решить следующую систему уравнений:

vk = а^шах Г Ик(р(¿,и,V),х(^V),м>,, к = 1,N . (24)

ws.Uk ЗТк

Действительно, для решения V = vN} системы (24) выполняется неравенство:

Г Ик (р(1, и, V), х(¿, V), Vк, № >1" Ик (р((, и, V), х(¿, V), ик, № , к = Щ .

■>4 ■>1к

Суммируя эти соотношения по индексу к, на основе формулы (13) получаем требуемое соотношение Ау1 (и) < 0.

Другое условие нелокального улучшения управления построим в линейной по управлению задаче (1),(2), в которой формула (13) принимает следующий вид:

N

А/(и) = -£ Г (Ики (р((,и,V),х((,V),ик,0, Ащ)Ж . (25)

к=1 1к

Рассмотрим систему уравнений:

V, = Р (ик + аГ Ики (р ({, и, V), х(и V), ик, г)&), к = 1, N . (26) к •!Тк

Для решения V = vN} системы (26) на основе известного свойства операции проектирования получаем неравенство:

I (Ики(p(t,и,v),х^,v),ик,t), Аик)Ж >-||Аик|Г .

•>Тк а

В результате из формулы (25) следует улучшение управления и = {и1,...,иьг} с оценкой:

1 N ,

АvI(и) <—£||Аик|| . (27)

а к=1

В данной работе системы (24) и (26) рассматриваются как задачи о неподвижной точке специальных операторов управления в конечномерном пространстве допустимых наборов векторов

V = {у1,...,уы}. Такой подход дает возможность конструировать новые итерационные алгоритмы для поиска улучшающих управлений.

Условия улучшения управления представим в стандартной операторной форме задач о неподвижной точке.

Для допустимых управлений и = {и1,...,иы}, V = vN} введем отображения с помощью соотношений:

Ж*(и,V) = аг§ шах I" Ик(р^,и,V),х^,V), w,X)dX, к = 1,N . (28)

wеUk Щ

С помощью введенных отображений (28) систему уравнений (24) можно записать в следующей операторной форме

V = Ж'(и,V) = О*(V), Ж* = (Ж,...,Ж*),

которая для заданного управления и = {и1,...,иы} принимает стандартный вид задачи о неподвижной точке с оператором О *. Обозначим О(и) с О — множество неподвижных точек задачи (24).

Определим следующие отображения с параметром а > 0 :

жа(и,V) = Р (ик + а\ Ики(р^,и,V),х^,V),ик,X)dX), к = . (29) к •!Тк

С помощью введенных отображений (29) систему уравнений (26) для улучшения управления и = {и1,..., иы} в линейной по управлению задаче (2), (3) можно записать в операторной форме:

V = Жа(и,V) = Оа^), Жа = (Ж*,...,^) .

Обозначим Оа(и) сО — множество неподвижных точек задачи (26).

Покажем, что рассматриваемый подход неподвижных точек для

представления условий улучшения управления позволяет в линейной по управлению задаче (1), (2) сформулировать необходимые условия оптимальности (22) и (23) в терминах конструируемых задач о неподвижной точке. При этом оценка улучшения (27) позволяет усилить и получить новое необходимое условие оптимальности по сравнению с необходимым условием (23).

В линейной по управлению задаче (1), (2) отображения (28) можно представить в виде:

Ж"(и,V) = а^шах ( (Ики(р^,и,V),х^,V),ик,X), w)dX, к = 1,N .

wеUk -¡Тк

На основе этого представления в линейной по управлению задаче (1), (2) получаем следующее утверждение.

Лемма 1. и еО(и) тогда и только тогда, когда и = {и1,...,иы} удовлетворяет необходимому условию оптимальности (22).

Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (22) можно сформулировать в терминах задачи о неподвижной точке (24) в форме следующего утверждения.

Теорема 1. Пусть управление и = {и1,...,иьг} является оптимальным в линейной по управлению задаче (1), (2). Тогда и еП(и).

бедствия (в линейной по управлению задаче (1), (2)).

1. Задача о неподвижной точке (24) всегда разрешима для управления и = {и1,..., иы }, удовлетворяющего необходимому условию оптимальности (22).

2. Отсутствие неподвижных точек в задаче (24) или невыполнение условия и еП(и) свидетельствует о неоптимальности управления

и = Ц,..., UN }.

3. В случае неединственности решения задачи о неподвижной точке (24) появляется принципиальная возможность строгого улучшения управления и = {и1,...,иьг}, удовлетворяющего необходимому условию опти-мальности (22).

На основе задачи о неподвижной точке (26) в линейной по управлению задаче (1), (2) получаем аналогичные утверждения.

Лемма 2. и еО,а(и) тогда и только тогда, когда и = {и1,...,иьг} удовлетворяет необходимому условию оптимальности (23).

Таким образом, в линейной по управлению задаче (1), (2) необходимое условие оптимальности (23) можно сформулировать в форме следующего утверждения.

Теорема 2. Пусть управление и = {и1,...,иы} является оптимальным в линейной по управлению задаче (1), (2). Тогда и еПа (и) для некоторого а > 0 .

бедствия (в линейной по управлению задаче (1), (2)).

1. Задача о неподвижной точке (26) всегда разрешима для управления и = {и1,..., иы }, удовлетворяющего необходимому условию оптимальности (23).

2. Отсутствие неподвижных точек в задаче (26) или невыполнение условия и еПа (и) для всех а > 0 свидетельствует о неоптимальности управления и = {и1,...,иьг} .

3. В случае неединственности решения задачи о неподвижной точке (26) управление и = {и1,..., иьг}, удовлетворяющее необходимому условию (23), строго улучшается на управлении V еПа (и), V Ф и согласно оценке (27).

Оценка (27) дает возможность сформулировать усиленное необходи-мое условие оптимальности по сравнению с условием (23) в линейной по управлению задаче (2), (3) в терминах задачи о неподвижной точке (26) .

Теорема 3 (усиленное необходимое условие оптимальности). Пусть управление и = {и1,...,иьг} является оптимальным в линейной по управлению задаче (1), (2). Тогда для всех а > 0 управление и = {и1,...,иьг} является единственным решением задачи о неподвижной точке (26), т. е.

ОГ(и) = {и} , а > 0.

Действительно, в случае существования при некотором а > 0 неподвижной точки V еПа (и), V Ф и, в силу оценки (27) получаем строгое улучшение Ау1(и) < 0, что противоречит оптимальности управления и = Ц,..., им }.

Проекционная задача о неподвижной точке (26), в отличие от задачи о неподвижной точке на основе операции максимизации (24), в случае существования решения V Ф и, V еПа (и) позволяет на основе оценки (27) получить вывод о строгом улучшении управления и еО без вычисления целевой функции. Таким образом, в случае существования неподвижных точек V Ф и, V еПа (и) можно сделать вывод о неоптимальности экстремального управления и еО без вычисления целевой функции.

3 Итерационные алгоритмы

Для численного решения задачи о неподвижной точке оператора О: Ув ® Ув, действующего на множестве Ув в полном нормированном

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

пространстве Е с нормой ||-||Е ,

V = О(V), Vе V, (30) можно использовать известный в вычислительной математике метод последовательных приближений и его модификации [17]. В частности, можно применить явный метод простой итерации с индексом 5 > 0, имеющий форму:

V"1 = О^), V0 еVE . (31)

Для улучшения сходимости итерационного процесса задачу о неподвижной точке (32) можно преобразовать к эквивалентной задаче с параметром 8 Ф 0 :

V = V + 8^ - О(^), V еVE,

на основе которой получаем модификацию итерационного процесса: V"1 = V5 + 8^5 - О (V5)), V0 еVE .

Выбором параметра 8 Ф 0 можно регулировать сходимость рассматриваемой модификации метода простой итерации.

Сходимость указанного итерационного процесса можно анализировать с помощью известного принципа сжимающих отображений. Операторный аналог известной теоремы [17] можно получить в следующей форме.

Теорема 4. Пусть оператор О: VE ® VE, действующий на множестве VE

в полном нормированном пространстве Е с нормой ||-||Е , удовлетворяет условию Липшица в шаре:

Б^0,1) = {V е^ : |V -|Е <I,V е ^,I > 0} с константой 0 <М = МI) < 1:

\\ОМ - О (и )||Е< - и||Е , V е Б (VI), и е Б(у0, I). (32) 38

При этом выполняется условие:

1^0) - |Е< (1 - М )1. (33)

Тогда задача о неподвижной точке (30) имеет единственное решение V е Б^0,1) и итерационный процесс (31) сходится к V в норме ||-||Е для

любого начального приближении V0 е В(у0,1). Для погрешности метода выполняется оценка:

№ - VII < м* IV0 - VII , ^ > 0.

II Не II НЕ

Доказательство теоремы несложно проводится по методике аналогично работе [17].

Следует отметить, что условие (33) вводится для того, чтобы итерационные приближения процесса (31) принадлежали множеству В^, I), на котором выполняется условие Липшица (32).

Для решения задач о неподвижной точке необходимых условий оптимальности (22) и (23) методы простой итерации с заданными начальными приближениями и0 е О принимают соответственно следующий вид:

и'+1 = а^ шах Г (Ии (у^, и'), x(t, и'), ик, 0, w)dt, к = 1, N, ' > 0. (34)

неи \ '

и? = Ри (ик + а\ Ии №, и'), x(t, и'), и'к, t)dt), к = , ' > 0. (35)

•!1к

В отличие от известных градиентных методов предлагаемые методы неподвижных точек (34) и (35) для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации методов. Свойство релаксации компенсируется нелокальностью последовательных приближений управления и отсутствием на каждой итерации достаточно трудоемкой операции выпуклого или игольчатого варьирования управления в окрестности текущего приближения управления.

На основе теоремы 4 можно показать аналогично работе [18], что при достаточно малых параметрах проектирования а > 0 процесс (35) определяет последовательность однозначно определенных и непрерывно зависящих от параметра проектирования итерационных приближений, которая обладает принципиальной сходимостью к экстремальному управлению, удовлетворяющему необходимому условию оптимальности (23).

Таким образом, проекционный метод неподвижных точек (35) в отличие от (34) обладает важной возможностью регулировки свойства сходимости к экстремальному управлению за счет настройки параметра проектирования.

Результаты сходимости итерационных процессов зависят от выбора начального приближения процессов. В частности, в случае не единственного решения уравнения (23), сходимость итерационного процесса (35) к тому или иному экстремальному управлению определяется выбором начального приближения.

Условия нелокального улучшения (24) и (26) позволяют конструировать итерационные алгоритмы для построения релаксационных по целевой функции последовательностей управлений и получения приближенных решений задачи оптимального управления (1), (2).

Методы простой итерации для решения задач о неподвижной точке (24) и (26) с начальными приближениями V0 еО соответственно имеют вид:

У'к+1 = а^шах Г Н(р(Х,и,V5),х(Х,V5),м>,, к = 1,N, 5 > 0.

м>еЦ *Тк

V,к+1 = Ри(ик + а\ Ни(р(X,и,V5),х(X,V5),ик,()Ж), к = Щ, 5 > 0.

Итерации по индексу 5 > 0 проводятся до первого строгого улучшения управления и еО по целевой функции: I (у^1) < I (и). Далее строится новая задача о неподвижной точке для улучшения полученного расчетно -го управления и итерационный процесс повторяется.

Если строгое улучшение управления не происходит, то итерационный процесс проводится до выполнения условия:

||у5+1 - <е\\ ^Ц ,

где е > 0 — заданная точность расчета задачи о неподвижной точке. На этом итерации расчета последовательных задач улучшения управления предлагаемыми методами неподвижных точек для построения релаксационных последовательностей управлений заканчиваются.

Заключение

В рассматриваемом классе дискретно-непрерывных управляемых систем построены новые конструктивные условия улучшения и оптимальности управления в форме задач о неподвижной точке в пространстве управлений, на основе которых разработаны итерационные методы решения оптимизационных задач.

Предложенные методы неподвижных точек для поиска экстремальных управлений не гарантируют релаксацию по целевой функции на каждой итерации в отличие от градиентных методов, но компенсируют это свойство нелокальностью последовательных приближений управления, а также отсутствием трудоемкой операции варьирования управления в окрестности текущего приближения с вычислением значений целевой функции, характерной для градиентных методов.

Предложенные методы неподвижных точек для построения релаксационных последовательностей управлений в рассматриваемом классе оптимизационных задач обладают следующими свойствами.

1. Нелокальность улучшения управления и отсутствие процедуры варьирования улучшающего управления в достаточно малой окрестности улучшаемого управления на каждой итерации, характерной для градиентных методов.

2. Возможность строгого улучшения неоптимальных экстремальных управлений. Такая возможность появляется в случае неединственности решения задачи о неподвижной точке. Градиентные методы такой возможностью не обладают.

Оптимизация управлений на основе конструируемых задач о неподвижной точке предлагаемыми итерационными методами последовательных приближений характеризуется простотой вычислительной реализации и сводится к чередующемуся решению задач Коши для фазовых и сопряжен -ных переменных с предварительно вычисляемыми управлениями.

Указанные свойства предлагаемых методов неподвижных точек являются важными факторами для повышения вычислительной и качественной эффективности решения дискретно-непрерывных задач оптимального управления и могут определять перспективное направление разработки эффективных методов оптимизации таких задач.

Литература

1. Emelyanov S., Korovin S., Mamedov I. Variable Structure Control Systems. Discrete and Digital. CRC Press, USA, 1995. 316 p.

2. The Control Handbook: Control System Advanced Methods. In: Levine, W. (eds). CRC Press, London, 2010. 1798 p.

3. Van der Schaft A., Schumacher H. An Introduction to Hybrid Dynamical Systems. Springer, London, 2000. 174 p.

4. Gurman V., Rasina I. Discrete-continuous Representations of Impulsive Processes in the Controllable Systems // Automation and Remote Control. 2012. № 8(73). P. 1290-1300.

5. Mastaliyev R. Necessary Optimality Conditions in Optimal Control Problems by Discrete-continuous Systems // Tomsk State University Journal of Control and Computer Science. 2015. № 1(30). P. 4-10.

6. Evtushenko Y. Numerical Optimization Techniques. Publications Division, New York, 1985. 562 p.

7. Табак Д., Куо Б. Оптимальное управление и математическое программирование. Москва: Наука, 1975. 279 с. Текст: непосредственный.

8. Gurman V., Ni Ming Kang. Degenerate Problems of Optimal Control. I. Automation and Remote Control. 2011. № 4(72). P. 727-739.

9. Moiseev A. Optimal ^ntM Under Discrete Control Actions. Automation and Remote Control. 1991. № 9(52). P. 1274-1280.

10. Teo K., Goh C., Wong K. A Unified Computational Approach to Optimal Control Problem. Longman Group Limited. New York, 1991. 329 p.

11. Rahimov A. On an Approach to Solution to Optimal Control Problems on the Classes of Piecewise Constant, Piecewise Linear, and Piecewise Given Functions // Tomsk State University Journal of Control and Computer Science. 2012. № 2(19). P. 20-30.

12. Gorbunov V. A Method for the Parametrization of Optimal Control Problems // USSR Computational Mathematics and Mathematical Physics. 1979. № 2(19). P. 292-303.

13. Srochko V., Aksenyushkina E. Parametrization of Some Control Problems for Linear Systems // The Bulletin of Irkutsk State University. Series Mathematics. 2019. Vol. 30. P. 83-98.

14. Срочко В. А. Итерационные методы решения задач оптимального управления. Москва: Физматлит, 2000. 160 с. Текст: непосредственный.

15. Vasiliev O. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.

16. Buldaev A., Khishektueva I.-Kh. The Fixed Point Method for the Problems of Nonlinear Systems Optimization on the Managing Functions and Parameters // The Bulletin of Irkutsk State University. Series Mathematics. 2017. Vol. 19. P. 89-104.

17. Самарский А. А., Гулин А. В. Численные методы. Москва: Наука, 1989. 432 с. Текст: непосредственный.

18. Булдаев А. С. Операторные уравнения и алгоритмы принципа максимума в задачах оптимального управления // Вестник Бурятского госуниверситета. Математика, информатика. 2020. № 1. С. 35-53. Текст: непосредственный.

Статья поступила в редакцию 24.06.2021; одобрена после рецензирования 25.06.2021; принята к публикации 19.08.2021.

METHODS OF FIXED POINTS IN ONE CLASS OF DISCRETE-CONTINUOUS PROBLEMS OF OPTIMIZING CONTROLLED SYSTEMS

Aleksandr S. Buldaev Dr. Sci. (Phys. and Math.), Prof., Dorzhi Banzarov Buryat State University 24a Smolina St., Ulan-Ude 670000, Russia E-mail: buldaev@mail.ru

Vladislav A. Dumnov Graduate student,

Dorzhi Banzarov Buryat State University 24a Smolina St., Ulan-Ude 670000, Russia

Abstract. In the considered class of discrete-continuous control systems, formulas for the increment of the objective function of the standard form with remainder terms of the expansions and non-standard formulas that do not contain the remainder terms of the expansions are constructed. Based on the formulas obtained, conditions for nonlocal improvement and control optimality are constructed in the form of fixed point problems in the control space. Such a representation of conditions makes it possible to apply and modify the well-known theory and methods of fixed points for constructing iterative algorithms for searching for extremal controls and constructing relaxation sequences of controls in the considered discrete-continuous optimal control problems. The proposed iterative algorithms have the property of nonlocality of successive control approximations and the absence of a parametric search procedure for an improving approximation at each iteration, which is characteristic of gradient-type methods.

Keywords: discrete-continuous system; conditions for improvement and optimality of control; fixed point problem; iterative algorithm.

For citation

Buldaev A. S., Dumnov V. A. Methods of Fixed Points in One Class of Discrete-Continuous Problems of Optimizing Controlled Systems. Bulletin of Buryat State University. Mathematics, Informatics. 2021; 2: 28-43 (In Russ.).

References

1. Emelyanov S., Korovin S., Mamedov I. Variable Structure Control Systems. Discrete and Digital. CRC Press, USA, 1995. 316 p.

2. The Control Handbook: Control System Advanced Methods. In: Levine, W. (eds). CRC Press, London, 2010. 1798 p.

3. Van der Schaft A., Schumacher H. An Introduction to Hybrid Dynamical Systems. Springer, London, 2000. 174 p.

4. Gurman V., Rasina I. Discrete-continuous Representations of Impulsive Processes in the Controllable Systems // Automation and Remote Control. 2012. 8(73). P. 1290-1300.

5. Mastaliyev R. Necessary Optimality Conditions in Optimal Control Problems by Discrete-continuous Systems // Tomsk State University Journal of Control and Computer Science. 2015. 1(30). P. 4-10.

6. Evtushenko Y. Numerical Optimization Techniques. Publications Division, New York, 1985. 562 p.

7. Tabak D., Kuo B. Optimal Control and Mathematical Programming. Nauka, Moscow, 1975. 279 p.

8. Gurman V., Ni Ming Kang. Degenerate Problems of Optimal Control. I. Automation and Remote Control. 2011. 4(72). P. 727-739.

9. Moiseev A. Optimal Сontrol Under Discrete Control Actions. Automation and Remote Control. 1991. 9(52). P. 1274-1280.

10. Teo K., Goh C., Wong K. A Unified Computational Approach to Optimal Control Problem. Longman Group Limited, New York, 1991. 329 p.

11. Rahimov A. On an Approach to Solution to Optimal Control Problems on the Classes of Piecewise Constant, Piecewise Linear, and Piecewise Given Functions // Tomsk State University Journal of Control and Computer Science. 2012. 2(19). P. 20-30.

12. Gorbunov V. A Method for the Parametrization of Optimal Control Problems // USSR Computational Mathematics and Mathematical Physics. 1979. 2(19). P. 292-303.

13. Srochko V., Aksenyushkina E. Parametrization of Some Control Problems for Linear Systems // The Bulletin of Irkutsk State University. Series Mathematics. 2019. (30). P. 83-98.

14. Srochko V. Iterative Methods for Solving Optimal Control Problems. Fizmatlit, Moscow, 2000. 160 p.

15. Vasiliev O. Optimization Methods. World Federation Publishers Company INC, Atlanta, 1996. 276 p.

16. Buldaev A., Khishektueva I.-Kh. The Fixed Point Method for the Problems of Nonlinear Systems Optimization on the Managing Functions and Parameters // The Bulletin of Irkutsk State University. Series Mathematics. 2017. (19). P. 89-104.

17. Samarskii A., Gulin A. Numerical Methods. Nauka, Moscow, 1989. 432 p.

18. Buldaev A. Operator Equations and Maximum Principle Algorithms in Optimal Control Problems // Bulletin of Buryat State University. Mathematics, Informatics. 2020. 1. P. 35-53.

The article was submitted 24.06.2021; approved after reviewing 25.06.2021; accepted for publication 19.08.2021.

i Надоели баннеры? Вы всегда можете отключить рекламу.