Метод равномерной оптимизации нелинейных управляемых систем с распределенными параметрами

Эдгар Яковлевич Рапопорт

Math-Net.Ru

Э. Я. Рапопорт, Метод равномерной оптимизации нелинейных управляемых систем с распределенными параметрами, Вестн. Сам. гос. техн. ун-та. Сер. Физ.-мат. науки, 2023, номер 2, 270-291

001: 10.14498^^2006

Использование Общероссийского математического портала Math-Net.Ru подразумевает, что вы прочитали и согласны с пользовательским соглашением

http://www.mathnet.ru/rus/agreement

Параметры загрузки:

IP: 109.252.33.182

29 сентября 2024 г., 12:09:02

Вестн. Сам. гос. техн. ун-та. Сер. Физ.-мат. науки. 2023. Т. 27, № 2. С. 270-291 ISSN: 2310-7081 (online), 1991-8615 (print) d https://doi.org/10.14498/vsgtu2006

EDN: LHFXZB

УДК 519.853.53

Метод равномерной оптимизации нелинейных управляемых систем с распределенными параметрами

Э. Я. Рапопорт

Самарский государственный технический университет,

Россия, 443100, Самара, ул. Молодогвардейская, 244.

Аннотация

Задача оптимизации нелинейной управляемой системы с распределенными параметрами в условиях равномерной оценки целевых множеств сводится к управлению линейной моделью объекта с дополнительным априори неизвестным пространственно-временным возмущением, компенсирующим влияние невязки между линейным и нелинейным дифференциальными операторами соответствующих начально-краевых задач, описываемых уравнениями в частных производных параболического типа. Конкретная форма зависимости возмущения от его аргументов опознается при заданном начальном приближении на каждом шаге предлагаемой сходящейся итерационной процедуры по результатам решения на предыдущей итерации разработанным ранее альтернанс-ным методом линейно-квадратичной задачи программного оптимального управления с детерминированным внешним воздействием в условиях промежуточного вычисления управляемой функции состояния нелинейного объекта на цифровой модели.

Показывается, что искомые уравнения оптимальных регуляторов находятся по известным результатам итерационного процесса отыскания программного управления в виде линейных алгоритмов обратной связи по измеряемому состоянию объекта с нестационарными коэффициентами передачи.

Ключевые слова: нелинейная система с распределенными параметрами, линейно-квадратичная задача оптимизации, итерационная процедура, альтернансный метод, параметризация управляющих воздействий, программное оптимальное управление, синтез оптимального управления.

Дифференциальные уравнения и математическая физика Научная статья

© Коллектив авторов, 2023 © СамГТУ, 2023 (составление, дизайн, макет) 3 ©® Контент публикуется на условиях лицензии Creative Commons Attribution 4.0 International (https://creativecommons.org/licenses/by/4.0/deed.ru) Образец для цитирования

Рапопорт Э. Я. Метод равномерной оптимизации нелинейных управляемых систем с распределенными параметрами // Вестн. Сам. гос. техн. ун-та. Сер. Физ.-мат. науки, 2023. Т. 27, № 2. С. 270-291. EDN: LHFXZB. DOI: 10.14498/vsgtu2006. Сведения об авторе

Эдгар Яковлевич Рапопорт А https://orcid.org/0000-0002-0604-8801 доктор технических наук, профессор; профессор каф. автоматики и управления в технических системах; e-mail: [email protected]

Получение: 10 марта 2023 г. / Исправление: 17 мая 2023 г. / Принятие: 25 мая 2023 г. / Публикация онлайн: 20 июня 2023 г.

Введение

Полное аналитическое решение задачи оптимального управления (ЗОУ) системами с распределенными параметрами (СРП) оказывается возможным лишь применительно к типовым линейным моделям управляемого объекта и критериям оптимальности простейшего вида. За рамками этих модельных представлений решения ЗОУ СРП могут быть получены только с помощью специальных численных методов, что в полной мере относится к СРП, описываемым нелинейными уравнениями в частных производных параболического типа. В настоящее время разработан целый ряд таких методов, общие схемы применения которых используются в ЗОУ объектами как с сосредоточенными, так и с распределенными параметрами [1—7].

Один из основных подходов в этом направлении заключается в применении различных модификаций метода вариаций в пространстве управлений [1—7], реализующих итерационную процедуру построения минимизирующих последовательностей малых изменений управляющих воздействий, которые обеспечивают на каждом шаге убывающие с учетом заданных ограничений значения линейных приближений соответствующих приращений минимизируемого критерия оптимальности, оцениваемых по величине его градиента. В итоге производится редукция исходной ЗОУ к пошаговой процедуре решения ряда специальных задач линейного программирования (ЛП) [6].

Реализация метода вариаций в пространстве управлений связана с необходимостью совместного численного интегрирования уравнений нелинейных моделей объекта и сопряженных систем в целях вычисления производных Фреше минимизируемого функционала по управляющему воздействию, выступающих в роли его градиента, а также со значительным возрастанием трудностей решения соответствующих задач ЛП в условиях фиксации требований к конечному состоянию объекта, учитываемых соответствующими ограничениями на искомые переменные [5-7]. Эти затруднения существенно увеличиваются в задачах равномерной оптимизации при характерных для приложений оценках заданных целевых множеств в равномерной метрике, учет которых приводит к необходимости использования специальных достаточно сложных способов решения ЗОУ ОРП даже применительно к задачам управления линейными моделями управляемого объекта [7-9].

В настоящей работе предлагается конструктивный метод равномерной оптимизации нелинейных управляемых СРП параболического типа с типовым квадратичным функционалом качества, сводимый к сходящейся итерационной процедуре аналитического решения линейных ЗОУ на каждом шаге итераций с промежуточным численным интегрированием уравнений нелинейной модели СРП при предварительно фиксируемом управляющем воздействии. Подобная технология оказывается свободной от ряда недостатков общего метода вариаций в пространстве управлений.

1. Математические модели объекта управления

Пусть объект управления (ОРП) описывается нелинейным пространственно-одномерным уравнением в частных производных параболического типа

dQ

= L(Q(x, t))+uv(х, t), х е (х0,х{), t> 0 (1)

относительно управляемой функции состояния Q(x, t), изменяющейся в зависимости от пространственной координаты х е [x0,xi] и времени t, с начальными и граничными условиями

Q^o,0) = Q0(х) = Q0 = const ^ 0, х е [х0,х1\; (2)

= 0; LiiQ^i, t)) =us(t), t> 0, (3)

допустимыми в классе кусочно-непрерывных функций внутренним пространственно-распределенным (uy) и граничным сосредоточенным (us) управляющими воздействиями. Всюду далее рассматривается общий случай одновременного использования uy и us.

В (1), (3) L и Li — заданные нелинейные параболические дифференциальные операторы по пространственной координате, рассматриваемые далее для большей определенности и наглядности без потери общности основных последующих результатов в следующей характерной форме [9,10]:

L(Q(х, t)) =C(Q) 0 + B(Q) dQQ + Bi(Q)( d?) + D(Q)Q; (4)

Li^i, t)) = ai (Q^i, t^Q^i, 1)+а2^(хъ t)) , (5)

где C, B, Bi, D, ai, a2 — заданные достаточно гладкие функции своих аргументов.

К виду (4) приводится, в частности, фундаментальное уравнение диффузии и теплопроводности в декартовых и цилиндрических координатах [10], а Li в виде (5) аналогичен по форме типовым граничным условиям в линейных уравнениях математической физики.

Всюду далее предполагается, что при заданных начальных условиях каждому допустимому управляющему воздействию соответствует единственное решение краевой задачи (1)—(3), понимаемое в обобщенном смысле [11—13].

Начально-краевая задача (1)—(5) может быть записана в следующем виде [9,10]:

' dQ(sc, t)

—— = L0(Q^, t))+uv(х, t) + F(х, t), х е (х0,х{), t> 0; < Q(х, 0) = Q0(х) = Q0 = const ^ 0, х е [х0,х-\\;; (6)

^ t] = 0; LwiQ^i, t)) = us(t) + Fi(t), t> 0.

Здесь

д 2Q dQ

LdiQ^, t)) = + B0^ + D0Q, х е (х0,х1), t> 0; (7)

dQ(x\, t)

L10(Q(xi,t)) = awQ(xi,t) + a.20-^ ' , (8)

— линейные дифференциальные операторы, определяемые в форме линейных приближений к L, L1 в (1), (3), где С0, В0, D0, a\0, a20 — некоторые константы, получаемые, например, путем усреднения соответствующих коэффициентов в (4), (5) и

F(x,t) = L(Q(x,t))- Lo{Q(x,t)), (9)

Fi(t) = Lw{Q(xi,t)) - Ll(Q(xi,t)). (10)

Всюду далее предполагается, что F(х, t) и F1(t) являются кусочно-непрерывными функциями своих аргументов. Если их считать заданными в (6), где они фигурируют в роли детерминированных внешних возмущений, то модель ОРП (6)—(8) становится линейной и аналитическое решение краевой задачи (6)—(8) может быть получено известными способами [14,15].

Однако согласно (9), (10), явная форма зависимостей F(x,t), F1(t) от х и t априори неизвестна и к их определению в целях перехода от исходной к линейной модели (6)—(8) сводится дальнейшая проблема.

Применение метода конечных интегральных преобразований по пространственному аргументу х £ [®0,®i] [16,17] к уравнениям линейной начально-краевой задачи (6)-(8) с ядром, равным ее собственным функциям фп(ц,п,х), n = 1, 2,..., где ^ — собственные числа, приводит к описанию рассматриваемого объекта бесконечной системой обыкновенных дифференциальных уравнений первого порядка для временных мод Qn(t) разложения Q(x,t) в сходящийся в среднем ряд по ортонормированной с весом г(х) системе <Рп(Рп,х) [7-9]:

те

Q(x,t) = ^2 Qn(t)tpn(v n, х); (11)

n=1

= -VnQn + ñvn(t) + Fn(^n, t) + gnus(t) + gnFi(t); (12)

Qn(0) = Q0 (Vn), n = 1, 2,...,

dQn 2 ~df =

с автономными сосредоточенными внутренними управляющими воздействиями п = 1, 2,..., и граничным управлением ив(Ь). Здесь

ГХ1

üvn(t) = uv (x,t)r(x)(pn(yn,x)dx;

Jx0

r xi

Fn(/J.n,t)= F(x,t)r(x)^n(^n,x)dx, n = 1, 2,

Jx 0

(13)

представляют собой модальные составляющие разложения в ряд вида (11) внутреннего управления иу(х,Ь) и функции Р(х,Ь):

те

uv (x,t) = J2 ÜVn(t)(Pn(^n,x), F (x,t) = J2 Fn(Vn ,t)<pn(Vn,x), (14

n=1 n=1

дп — известные коэффициенты [17].

Подставляя Q(x, t) в виде (11) в выражения (9), (10), где предполагается допустимым почленное дифференцирование ряда (11) по пространственной координате, и интегрируя в (13), получим Fn(in, t) и F1(t) в форме вполне определенных нелинейных зависимостей от QQ = (Qn), п = 1, 2,..., что приводит к преобразованию соотношений (12) в замкнутую относительно Q бесконечную нелинейную систему уравнений объекта [9,10]:

dQn

—^п = -lAQn + &n(Q) + ñvn(t) + gnUs (t), п = 1, 2,..., (15)

&n(Q) = Fn(Q)+ gnFi(Q).

Последующие подстановки решения этой системы в (11) и выражения (11) для Q(x, t) в правую часть равенств (9), (10) позволяют найти F(x, t) и F\(t), однако такое решение может быть получено с требуемой точностью даже при использовании известных способов конечномерного усечения системы (15) [18-20] только численными методами, сложность реализации которых оказывается сравнимой с трудностями непосредственного применения численных методов вариаций в пространстве управлений в задачах оптимального управления исходной нелинейной моделью (1)-(5).

Значительно более простым и конструктивным оказывается предлагаемый в последующих разделах статьи итерационный алгоритм вычисления F(x, t) и F\(t) по известному начальному приближению, реализуемый в процессе решения на каждом шаге итераций рассматриваемых задач оптимального управления с линейной моделью ОРП вида (6)-(8).

2. Постановка задачи оптимального управления

Пусть объект управления с распределенными параметрами описывается линейной начально-краевой задачей (6)-(8).

Управляющие воздействия в (6) стесняются ограничениями

UVmin < UV ^ t) < UVmax USmin < US ф < USmax (16)

с заданными пределами их допустимых значений.

Будем считать, что, согласно типовым в приложениях требованиям, необходимо обеспечить за фиксируемое конечное время t\ заданную точность е равномерного приближения пространственного распределения управляемой величины Q(x, t1) к требуемому Q**(x) > Q0 для всех x <Е [x0,xi] согласно соотношению

max \Q(x, ti) -Q**(x)\^ e, (17)

определяющему оцениваемое в равномерной метрике целевое множество конечных состояний ОРП [7-9].

Пусть далее эффективность процесса управления объектом (6)-(8) оценивается квадратичным функционалом качества, определяемым в следующей типичной частной форме:

r ti rx i

I(uv,us)= / / \ip1(x)Q2(x, t) + p2(x)nV(x, dxdt+

Jo Jx 0

ft 1

+ psu2s(t)dt ^ min (18) Jq uv ,us

с заданными весовыми коэффициентами pi (х), рг(х) и ps = const > 0.

Переход к описанию объекта (11), (12) в терминах модальных переменных приводит при pi (х) = р2 (х) = г(х) в силу ортонормированности семейства собственных функций к представлению критерия (18) в следующем виде:

dt ^ min ;

w ,us (19)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

rt1

h(uv ,us )= ^Ql(t) + У] uVn(t) + psU2s(t)

JQ \-n=i n=i

Uv = (uvn), n = 1,2,..., а требования (17) к конечному состоянию ОРП представляются условием

те

^ Qn(ti)(Pn(Vn,x) - Q**(x)

max

n

n=i

< £. (20)

Здесь и всюду далее в условиях выполнения усиленных условий Коши—Липшица [20] будем учитывать N1 слагаемых бесконечных сумм в (19), (20), где N1 = ж или N1 = N < ж в зависимости от используемой схемы анализа и возможностей практической реализации исследуемых алгоритмов управления, ограничиваясь в случае N1 = N с любой требуемой точностью решением «укороченной» системы N первых уравнений в (12) при достаточно большой величине N и полагая при этом (^п(1) = 0 при п > N [18-20]. При использовании усеченной модели объекта с N1 = N < ж все получаемые далее результаты следует считать субоптимальными.

Теперь рассматриваемая линейно-квадратичная задача оптимизации сводится к определению программного оптимального управления и,*3(¿) и и,у (¿), по которому иу(х,Ь) восстанавливается в форме ряда (14), и алгоритмов обратной связи и*(<Ц,х,1) = (иу(ф,х,1),и*8(С},1)), = (<^п), п = 1,^1, обеспечивающих при N1 = ж перевод объекта (11), (12) за заданное время в требуемое конечное состояние (20) при минимальном значении критерия оптимальности (19) в условиях ограничений (16).

3. Программное оптимальное управление при заданных зависимостях Р(х, £) и 3.1. Структура управляющего воздействия. На сформулированную бесконечномерную при N1 = ж задачу оптимального управления распространяется принцип максимума Понтрягина [7,21]. Основное условие

н(<^*(г),й*(г),^*(г)) = тахн(<^*(г),й,^*(г)), г е [0,и] (21)

достижения на соответствующих оптимальному процессу величинах *(Ь), и*(Ь), ф*(Ь) максимума функции Понтрягина

Н(<^(1),и(1),ф(1)) = - ^ Я1(1) - ^ и2упЮ - Ряи1 (I) +

п=1 п=1

N

(Ь) + + Рп(ц-п, Ь) + д„,из+ дпР\(£)) (22)

п=1

по векторному аргументу и(Ь) = (ииу(¿),ия^)) позволяет найти и*(Ь) в форме явных функций от ф*(Ь) для рассматриваемой задачи оптимизации (11), (12), (16), (19), (20). Здесь ((1) = и вектор сопряженных переменных

ф(1) = {фп^)) связаны системой уравнений

Лфп

дН д(С п

= 2ССп(1)+^пФп(1), п =1^1.

(23)

Ограничимся далее для простоты типичной постановкой линейно-квадратичной задачи оптимизации с не стесняемыми ограничениями (16) управляющими воздействиями в целях достижения максимального эффекта по величине критерия оптимальности (19) и последующего выбора предельно допустимых значений ив(Ь) и и,уп(£), связываемых условиями (16), на основании получаемых результатов.

В открытой области изменения и(Ь) оптимальное управление и*(Ь) при любой конкретной форме допустимых зависимостей Р(х, Ь) и Р\(Ь) в (6) от своих аргументов и требований к конечному состоянию объекта принимает, согласно (21)-(23), следующий вид [15,23]:

1 _ 1 ^

и*уп(^ = ^Ф*п (V, п = 1,Мг; и*8 (I) = — ^ дРф**>(1). (24)

р=1

3.2. Краевая задача принципа максимума. Уравнения (12) с подстановкой управляющих воздействий вида (24) образуют совместно с (23) линейную программно-управляемую систему (П-систему [6,9]), замыкаемую относительно неизвестных и ф(Ь) требованиями (20) к конечному состоянию объекта:

(1фп ол 2 I

— = 2( п + Vпфп, С^((п О ^ 1

п = 1,N1;

N1

М

= - 1^пЯп +1фп + дРфР +

(25)

2 ря"

р=\

+ Рп(ц.п, г)+ дпРг(г), п = 1,т.

Решение этой системы может быть представлено в векторно-матричной форме:

ф( )

=

АЬ

ф(0) С(о)

+ I\А( Т)ш(т)(1т.

Jo

Здесь

ш(т) =

Р(т) + дРг(т)

(26)

Р(т)+ дРг(т) = (Рп(1^п, т)+ дпРг(т)), п = 1,^;

0

Р?(т) + 9Р1 (т) — вектор-столбец; д = (дп), п = 1, N1; А — матрица коэффициентов системы (25); еА — матричная экспонента, столбцами которой являются линейно независимые решения однородной системы (25) при Рп(рп, Ь) = = Р1 ( ) = 0.

Матричная экспонента представляется в блочном виде

eAt =

An(t) Au(t) Ä2l(t) A22(t)

(28)

где блоки Aij(t) — известные N\xN\ матрицы в соответствии со структурой системы уравнений (25).

3.3. -параметризация управляющих воздействий. Согласно

(26) ф(Ь), а следовательно, и программное управление (24) определяются при известной величине Q(0) с точностью до вектора ф(0) начальных значений сопряженных функций, выступающих, таким образом, в роли параметрического представления U*(t) [2,6]. Однако для СРП подобный способ параметризации оказывается неконструктивным в силу бесконечной размерности этого вектора при N\ = те. В работе [24] применительно к требованиям (20), предъявляемым к Q*(t 1), предложен метод последовательной конечномерной параметризации управляющих воздействий («^-параметризация») на множестве М-мерных векторов ф(мУ финишных значений фi(11), i = 1,М, первых М < N1 сопряженных функций в (25) при равных нулю остальных величинах ф,1 (t^ =0, i > М:

Ф(М) = (фi(t 1)) = (ф), i = ХМ; фг(11) =0, i>M > 1. (29)

Интегрирование уравнений П-системы (25) в условиях ф-параметризации (29) позволяет получить конечное состояние управляемой величины, управляющие воздействия и значения критерия оптимальности в форме явных функций Q(x^(MУ), uVn(t,ф(м)), US(t,ф(м)) и 1]_(ф(мУ) от своих аргументов.

При этом минимально достижимые в классе параметризуемых управлений u(t,ф(м)) значения в^П ошибки е равномерного приближения Q(x, t1) к Q** (x) определяются в соответствии с (17) соотношением

вм = {m1** 1 I Q(x^m) -q**(X)\Y (30)

Как показано в [22], в типичных условиях существования отрицательной производной функции максимума в (30) по некоторому направлению в Е(м+1) ошибки минимакса в (30) уменьшаются с возрастанием М, образуя строго убывающую цепочку неравенств

J1) > J2) > > ЛЛ > Лз+1) > > Лр) = г (31)

min > min > • • • > min > min > • • • > min = inf,

где £inf — точная нижняя грань возможных значений е в (17) и р = те при einf = 0 и р < те при einf > 0 соответственно для управляемых и неуправляемых относительно Q**(x) моделей объекта [8,9]. При е < £inf решение

рассматриваемой задачи оптимального управления не существует. Неравенства (31) характеризуют сужающиеся к Q** (х) с возрастанием М семейства

целевых множеств для е = в (20), создавая возможности обеспечения достижимой точности равномерного приближения к Я**(х) при е ^ в (20) в процессе последовательной ^-параметризации управляющих воздействий с конечномерным вектором параметров ф(М), М < N1, для ряда возрастающих значений М в (29).

Искомое ^-параметризуемое оптимальное управление и(1, ф*Мохарактеризуется вектором параметров ф*М0 = (ф**), г = 1, М0, размерностью М = Мо, нижняя граница которой в силу определения (30) отвечает в условиях (31) в зависимости от величины е в (20) неравенствам

Мо > V Уе : е^ < е < е^, V е {Т^р}. (32)

Соотношения (29) представляют собой условия трансверсальности на правом конце траекторий в бесконечномерном фазовом пространстве переменных п, п = 1, 2,..., с некоторыми (заранее неизвестными для каждого вектора ф(М^) фиксированными конечными значениями (^пк, п = 1,М, первых М мод С^п(Ь1), п = 1,М, и свободными величинами (^п(11) при п > М для остальных модальных переменных:

Яп(и) = Япк, п = 1М; адо е Е1, п>М. (33)

Заменим требование (20) к конечному состоянию объекта в рассматриваемой задаче оптимального управления краевыми условиями (33) для заданных величин С^пк, п = 1, М, при некотором фиксированном значении М = М1. Пусть решение соответствующей П-системы (25), замыкаемой соотношениями (33), позволяет найти вектор ф(М1 ) = (грг), г = 1,М1, сопряженных переменных, параметрические зависимости управляющего воздействия й(1, ф(мх)) и отвечающие ему конечные значения С^пк для п > М1. Предположим, что на некотором множестве всех возможных по набору М1 вариантов величин Япк, п = 1, М1, удовлетворяется условие (20), и выделим такой из этих вариантов, для которого достигается наименьшее значение 11т\П(Ф(М1">) критерия оптимальности (19). В итоге оказывается решенной исходная задача оптимизации, если искомое управление и* (Ь) действительно принадлежит классу -параметризуемых функций и(1,ф(М1^).

Рассмотрим далее ф(МЛ-параметризованное управление й(1,ф(М2^) с М = = М2 > М1 в (33), где ф(М2) = (фг), г = 1,М2, и фг = 0 хотя бы для одного из значений г е {М1 + 1, М2}.

В классе таких управляющих воздействий число фиксируемых в (33) величин пк превышает М1. Так как при М = М1 согласно (29) фг = 0 для всех г е {М1 + 1,М2}, достигаемое при рассматриваемом управлении и(1,ф(М2)) значение 11т\п(гф(М2)) критерия оптимальности (19) для любого одинакового с и(1,ф(М1">) набора первых М1

величин пк отвечает неравенству 11т[п('Ф(М1)) < 11(ф(М2">) за счет свободы выбора большего числа составляющих С^п(Ь1), п > М в (33) при М = М1 по сравнению со случаем М = М2, которые автоматически устанавливаются из условий минимизации

функционала качества (19). Если управление и(£,ф(М2^) реализуется в условиях фг = 0 для всех г € {М1 + 1,М2}, то в таком случае ф(М2) = ф(М1^ согласно определению (29), и последнее неравенство уточняется следующим образом: 11т1п(ф{М1у) < 11(ф(М2)).

Отсюда следует, что размерность М0 вектора ф*Мо\ характеризующего искомое оптимальное управление, совпадает со своей нижней границей в (32) и находится по правилу

Мо = ь Уе : е^П < е < е^, " € {1,р}, (34)

однозначно устанавливающему величину Мо в зависимости от заданного значения е в (20) и характеризующему структуру оптимальных программных управлений минимальной сложности в условиях (20).

3.4. Явная форма ^(-^-параметризуемых оптимальных управлений. Перенос («прогонка») начальных условий в (26) в конечный момент времени приводит к следующему выражению для сопряженных функций в оптимальном процессе в зависимости от конечной величины ф*(Ь 1), начального состояния объекта (((0) и внешнего воздействия ш(т) в (26), (27) [15,23]:

ф*(г) = [Ап(г 1 - г) + Аи(г 1 - г) к (11)]ф* (г 1)+

+ Аи(11 - 1)К1(11)((0) + А12(11 - 1)БШ(11) + БШ1(1, и), (35) где Ау — подобные (28) блоки обратной матрицы е

к(11) = А21(11)А11(11), К1(11) = А22(11) - А21(11)А11(11)А12(11), Г* 1

вш(11)= А22(11 - т){Р(т) + дР1(т))йт -Jо

-А21(11)А-№ 1) Аи(ь - т)(Р(т)+ дР1(т))йт, о

Г*1 -

ВШ1(1, ь) = -у А12(т - 1){Р(т)+ дР1(т))б,т.

Подстановка (35) в (24) приводит к явной форме ф-параметризованных оптимальных программных управлений и,уп(Ь) и и*3(¿).

3.5. Д(м)-параметризация управляющих воздействий. В рассматриваемой ЗОУ искомые оптимальные управления находятся, согласно (24), непосредственно в терминах сопряженных переменных, позволяя получить в достаточно простом виде (24), (35) их ф(М)-параметризованное представление. Однако при отличном от (19) критерии оптимальности базовое условие оптимальности (21) приводит к гораздо более сложным зависимостям и ( ) от ф*(Ь), краевая задача принципа максимума становится нелинейной [7-9,24] и задача определения в явной форме ф(М)-параметризованного управления и*(Ь) оказывается трудноразрешимой.

Тем не менее в подобной ситуации процедура принципа максимума в совокупности с базовыми закономерностями предметной области во многих случаях позволяет найти оптимальные управляющие воздействия с точностью

до вектора Д(м) = (Д^м)), i = 1,М, параметров отличной от ф(м) природы, который непосредственно характеризует их поведение в заданной пространственно-временной области (Д( м)-параметризация u(t)) [7-9,24].

Типичным примером является классическая задача оптимального по быстродействию управления, для которой оптимальное управляющее воздействие заведомо определяется, согласно (21), в классе кусочно-постоянных функций с точностью до вектора Д(м) длительностей Д(м\ i = 1,М, М интервалов постоянства управляющих воздействий, попеременно принимающих только свои предельно допустимые максимальное и минимальное значения в соответствии с (16) [7-9]. Интегрирование системы уравнений (12) модели объекта с Д(м^параметризованным управлением u(t, Д(м)) позволяет найти конечные значения модальных переменных Qn(ti, Д(м)), n = 1,Ni, по которым Q(x,ti) = Q(x, Д(м)) восстанавливается в форме ряда (11), и значение критерия оптимальности Ь(Д(м)) в форме явных функций от Д(м). Процедура Д(м)-параметризации характеризуется величинами e^L минимакса, определяемыми соотношениями (30), (31) после замены в них ф(м) на Д(м).

Поскольку в результате -параметризации рассматриваемая задача оптимизации сводится к управлению объектом (12) с заданными конечным состоянием Qnk, п = 1, М, первых М мод управляемой величины при свободных значениях Qn(t\), n > М остальных модальных составляющих согласно (33), вектор Д*м), характеризующий оптимальное управление u*(t, Д*м)), может быть найден путем решения системы М уравнений

(ink = Qn(h, Д(м)), П = \Гм (36)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

относительно М неизвестных Д^м), i = 1,М, при каждом заданном наборе М величин Qnk, п = 1, М, и найденных зависимостях Qn(ti, Д(м)), п = 1, М.

Ввиду полной управляемости укороченной модели объекта, описываемой первыми М уравнениями в (12) для п = 1, М [25], система уравнений (36) всегда имеет решение относительно Д(м), если искомое оптимальное управление существует в классе Д(м)-параметризуемых управляющих воздействий.

Дальнейший анализ в этих условиях по схеме для

ф(м) -параметризованного управления приводит к подобному (34) правилу выбора размерности

М0 вектора Д*мо), характеризующего оптимальное управление и*(х, Д<*м°^)) в зависимости от заданного е в (20):

Mq = v Уе : ё^п < е < e{m-i), v G {1, р},

~(v) (v) / \

где значения ^in отличаются от ^in в (34).

Всюду далее продолжается исследование поставленной в разделе 2 задачи оптимизации с критерием оптимальности (19) применительно к поиску ф(м)-параметризованных управляющих воздействий.

3.6. Редукция к задаче полубесконечной оптимизации. После интегрирования уравнений системы (12) с ^-параметризованным управлением

и'<(1,ф*мо^) вида (24), (35) находятся при заданном детерминированном воздействии ш(т) в (26), (27) зависимости Q(х,ф<*мо^) управляемой величины

в конце процесса управления для каждого значения <5(0) и критерия оптимальности I\(ipiMo^) в (11), (19) в форме явных функций своих аргументов. В результате осуществляется точная редукция исходной задачи оптимального управления к задаче полубесконечной оптимизации (ЗПО) [7-9,24]:

h(*piMo)) ^ min ; max I <(х,ф<<Мо]) — Q**(х)\ < е (37)

ф(мо) x£[xo,xi}

на экстремум функции 1\(ф(М°^) конечного числа Мо переменных ф*, i = = 1,Мо, в (29) с бесконечным числом ограничений, порождаемых требованием выполнения условия (17) для всех х Е [xo,Xi] и заменяемых одним ограничением на функцию максимума в (37). Здесь размерность М = Мо оптимального вектора параметров ф<М0 определяется согласно (30), (31), (34).

Решение ЗПО (37) относительно вектора параметров ф<<М0, а также завело) (Мо) , ч

домо неизвестной величины е^т в случае, когда е = е^т в (37), может быть получено альтернансным методом параметрической оптимизации в условиях малостеснительных для прикладных задач допущений [7-9].

Метод базируется на специальных альтернансных свойствах искомой оптимальной величины вектора ф<<М0 = (ф*), i = 1,Мо, в (37), являющихся аналогом условий экстремума в теории нелинейных чебышевских приближений, и дополнительной информации о форме кривой пространственного

распределения результирующего состояния <(х,ф(Мо^), определяемой закономерностями предметной области. Согласно альтернансным свойствам, равные допустимой величине одинаковые значения максимальных отклонений max \ Q(x, ф<Мо)) — Q**(х) \ достигаются в некоторых точках х0°, j = 1, R, на

xe[xo,xi]

отрезке [х0,х1]. Общее число R этих точек

М, \М -

(Мо) < < ( Мо-1);

R = если £min < £ < £min ;

+ 1, если е = ¿m,0,

согласно [7-9] равно числу искомых неизвестных в ЗПО (37) и порождает замкнутую относительно этих неизвестных систему отношений

| д(х0°,ф(Мо)) -Я**(^)| = е, ¿ = 1,Я. (38)

При наличии дополнительной информации из предметной области о форме

й

о

Я(х0,ф*МО>), равенства (38), дополненные условиями существования экстре-

кривой Я(х,ф**М°"1) - Я**(х) на отрезке [хо,х\] э х, позволяющей при известной функции ш(т) в (26), (27) идентифицировать координаты х0 и знаки

мума функции <(х,ф'(Мо^) в точках х0д Е \п1[х0,х1], д = 1,R1, где R1 ^ R и х0д Е {х^О}, переводятся в систему уравнений

<(х0,ф<1Мо)) — <**(х0) = ±£, 3 = hR;

я . . __(39)

^[<(х°°д ,Ф*Мо)) —<**(х0д)] =0, g = 1,R1

с однозначно определяемым знаком е в каждой точке х0, которая разрешается известными численными методами относительно ф*, г = 1,Мо, значений х0д,

1 р (М0) (Мо) , \

д = 1, п\, а также ^тт , если е = ^тт в (37).

Явное выражение для зависимости ((х0,ф*Мо)) от своих аргументов в системе уравнений (39) представляется в форме бесконечной или укороченной суммы вида (20) разложения в ряд (11):

N1

д(х°°,ф*Мо)) = ^Яп(ф{*Мо)ШРп,х°),

п=1

',( Мо)л

где значения модальных переменных (п(ф( ) в конце оптимального процесса находятся в подобном (35) виде [15,23]:

Я(ф(МоУ) = Шф*МоУ)) = к ^ 1)ф*(г 1) + К1(11)((0) + (11). (40)

В итоге решение системы уравнений (39) относительно ф*Мо) определяет, согласно (29), вектор ф*(Ъ 1), подстановка которого в (35) приводит к явной форме описания в оптимальном процессе сопряженных переменных ф*(Ь) и управляющих воздействий иуп(Ь), и*8(Ь) в (24), завершая тем самым решение задачи программного управления в условиях детерминированных воздействий ш(т) вида (27) в (26).

В исходных условиях неопределенности ш(т) далее предлагается итерационная процедура вычисления Р(х, Ь) и Р1(Ь) в (6), а следовательно, и ш(т) в (26), (27), по известному начальному приближению.

4. Численный метод решения задачи программного управления

Пусть Р (к)(х, г), Р(к) (*), к = 1, 2,..., — известные приближения к Р( х, ), Р (Ь) в (6) на к-том шаге итерационной процедуры поиска этих функций при заданных начальных значениях

Р(1)(х, ¿)=р(1\*) = 0. (41)

Тогда к-тое приближение и(к)(1) = (и^^), п = 1,М1; и^^)) к оптимальному управлению и*(Ь) в (24) находится при фиксируемых зависимостях

Р(к)(х, ¿), Р1к\ь) по описанному в разд. 3 алгоритму, определяющему непрерывное отображение

Л : Р(к), Р(к) : ик)($ = Л(Р(к)(х, г),Р(1к)(г)], к = 1, 2,.... (42)

Построим ( к + 1)-е приближение Р(к+1)(х, ¿), Р(к+1\1) с учетом базовых соотношений (9), (10), позволяющих осуществить переход к линейно квадратичной задаче оптимизации (11), (12), (19), (20):

р (к+1) (х, г) = р (к) (х, г) + 5Р(к) (х, г);

5Р(к)(х, 1)=Ь(((к)(х, I)) -Ьо{((к)(х, 1)); (43)

SF(k)(;t) = L1o{Q(-k)(xi, t)) -Li(Q(k)(xi, i)).

Здесь Qk^(x, t) являются численным или аналитическим решением уравнений соответственно (1)—(3) или (6) при предварительно найденном управлении и

(k)(t) в (42), описываемым известным отображением Ф: и(к ^ Q(k\x, t) из множества и(к:

Q(k) (x, t) = Q(k)(

x, t, и (k)) = Ф(иЩ. (45)

Ограничимся здесь и далее достаточно общим случаем возможности выбора отображения Ф(ü(k^), обеспечивающего представление операторов L, Lo, Li, L10 с требуемой точностью в классе непрерывных функций переменных x и i с использованием применительно к нелинейным уравнениям (1)-(3) известных методов численного интегрирования, разностной аппроксимации пространственных производных

dQ(k)/d x, d2Q(k/dx2 и интерполяции сеточных функций на пространственно-временной плоскости при вычислении L и Li.

Рассмотрим далее типичную и наиболее характерную для приложений ситуацию, когда на компактном множестве переменных (x £ [xo,xi]; t £ [0,iij) в двумерном евклидовом пространстве Е2 операторы Л и Ф в (42), (45) вместе с L, Li, Lo, Lio являются ограниченными [1]. Ограниченные на этом

основании последовательности {F(k)(x, t)}, |F1i( k\t)}, {и(k)(t)}, {Q( k)(x, t)}, к = 1, 2,..., содержат в силу теоремы Больцано—Вейерштрасса [1,26] подпоследовательности, сходящиеся к некоторым пределам, соответственно F(x, t), Fi(t), u(t), Q(x, t), единственность которых устанавливается по указанной в [1] схеме.

Тогда

Ui(t)=^F(x, t),Fi(t)); Q(x, t) = <£{ü(t))]

и для сходящихся последовательностей {F(k)(x, t)}, {F(k\t)} на основании (43), (44) будем иметь, что

lim (F(k+i)(x, t) -F(k)(

x, t)) = lim (öF(k\x, t)) =

k—y^o k—y^o

= lim {L(Q(k)(x, t)) -Lo(Q(k)(x, t))) = L{Q(x, t)) - Lo {Q(x, t)) =0,

lim (F(1k+i)(t) - F(k\t)) = lim {6F(1k)(t)) = k—k—

= lim Lio (Q(k)(xi, t)) -Li (Q(k)(xi, t))) =

= Lio(Q(xi, t)) -Li(Q(xi, t)) =0,

и, следовательно,

L(Q(x, t)) =Lo{Q(x, t)), Li(Q(xi, t)) = Lw(Q(xi, t)). (46)

Полученные соотношения (46) с учетом (43), (44) означают, что нелинейные уравнения (1)-(3) объекта управления сводятся к линейной модели (6) в линейно-квадратичной задаче оптимизации (11)-(14), (19), (20) при зависимостях Р(х, Ь) = ^(х, ¿), Р1(Ь) = Р1(Ь), получаемых вместе с оптимальным программным управлением и*(Ь) = и(Ь) в сходящемся к Р(х, ¿), Р^), и*(Ь)

итерационном процессе вычисления Р(к), Р(к и и(к).

В итоге предлагаемый итерационный алгоритм решения задачи оптимального управления нелинейной моделью ОРП реализуется путем выполнения следующей последовательности вычислительных операций.

1. На первом шаге при начальном приближении Р(1\х, г), Р[1)(г), выбираемом согласно (41) (или каким-либо другим способом при наличии дополнительной информации), определяется решение й(1\1) линейно-квадратичной задачи (11)-(14), (19), (20) по алгоритму, описанному в разд. 3.

2. При найденном управлении находятся аналитическое (в форме (11)) и численное решение соответственно линейной и нелинейной начально-краевых задач (1)-(3) и (6) по алгоритму (45) для к = 1 с последующим вычислением операторов Ь^^Цх, Ь)), Ь0((^(1\х, Ь)), Ь1(<^(1 (х1, Ь)), Ью{Я(1)(х1, *)).

3. На втором и последующих шагах при к = 2, 3,... вычисляются по правилам (43), (44) следующие приближения Р(к)(х, ¿), Рнаходятся и (к)(г) согласно (42); определяются Я(к\х, 1) по алгоритму (45) и на этом приближении фиксируются значения операторов Ь, Ьо, Ь1, Ью.

4. Описанная процедура продолжается с возрастанием к до некоторого значения к*, при котором с требуемой точностью соблюдается приближенное равенство

р(к*+1)(х,г) * р(к*\х,г), р(к*+1)(г) * рР(1),

выполнение которого гарантируется в силу сходимости рассматриваемого итерационного процесса.

Таким образом, известная технология численного решения задачи оптимизации нелинейной СРП заменяется более простой итерационной процедурой аналитического решения ряда линейно-квадратичных задач оптимального управления с внешними возмущениями, предварительно опознаваемыми на каждом шаге итерационного процесса, и промежуточными вычислениями управляемой функции состояния нелинейного объекта на его цифровой модели при известных управляющих воздействиях.

Преимуществом подобного подхода является возможность получения алгоритмов оптимального программного управления нелинейной СРП в аналитической форме решения линейно-квадратичной задачи оптимизации.

5. Аналитическое конструирование оптимального регулятора

Перенос граничных условий при = в произвольный момент времени £ е (0,Ь 1) определяет в краевой задаче (25) по описанной в [15] схеме следующие зависимости конечных величин ф*(1\), *(Ь\) векторов сопряженных

и управляемых переменных от их текущих значений ф*(Ь), (*(Ь) в оптимальном процессе управления:

ф*(11) = Агф 1 - 1)ф*(1) + Аф1 - *($ + БШ2(1, Ь), (47)

(*^ 1) = А21 (I1 - 1)ф*(1) + А22(11 - 1)(*(1) + Пш3(1, ь). (48)

Здесь

гН

ПШ2(г, Ь) = А12(11 - т)(Р(т) + дР\(т))(1т,

гН

Пш3(г, ь) = ] А22(11 - т)(Р(т) + др1(т))с!т;

(49)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ац{Ъ 1 - т) — блоки матричной экспоненты еА^ в (28); функции Р(х, £), Р\(Ь) в (6) и вместе с ними ш(т) в (27) считаются уже найденными при предварительном решении задачи программного управления описанным в разд. 4 численным методом.

После умножения слева векторных равенств (47) и (48) соответственно на известные по результатам решения задачи программного управления (N1 х N1 )-матрицы 1)], (*(Ь) = ((*(1 1)), и <И^[ф* (11)], ф*(Ь) =

= (ф*(£ , з = 1^1 (левые части соотношений (47) и (48)) становятся одинаковыми. Последующее вычитание этих уравнений приводит к следующему результату:

ф*{1,ф*(ъ 1),((0)М)) =

= Т1&ь,ф*(11),( *(11),((0))Т2(1м,ф*(ь 1),( *(Ъ 1),Я(0))Я(1) +

+ Т1 (I,ь,ф*(11),(*(г 1),Ф(0))ВЕ{г,ь,ф*(11),(*(11),((0),ш(1)). (50)

Здесь

Т1 = [Ш1Ац(11 - г) -Ш2А21(11 - г)]-1, Т2 = [Ш2А22(11 -I) - Ш1А12(11 - *)];

Wl = <11Щ[(*(11)], W2 = <1\.щ[ф*(11)]; Въ = W2Dш3 - WlDШ2

и конечное состояние объекта 1) = (*(ф*М)) находится в форме ( ).

Подстановка (50) в выражения (24) для программного управления приводит к линейным алгоритмам синтеза оптимального регулятора с нестационарными коэффициентами обратных связей в системе управления с полным измерением состояния ((£):

и*¥п((, V = \{Т1Т2((1) + ТВ)П, п = тЖ; (52)

N1

У*у ((, г,х) = ^2 У*уп((, £)(рп(11п, х),

п=1

иЬ ((, V = 7Т-д(Т1Т2((г)+ТВ).

2Ря

(53)

Матрицы Т\ и Т2 вместе с представляются в (52), (53) известными функциями времени (49), (51) с фиксируемыми на протяжении процесса управления значениями (((0), которые находятся по результатам наблюдения ((Ь) в начальный момент £ = 0.

Переход в (52), (53) от ((Ь) к измеряемому выходу объекта (и(хи, ^ = = {Я(хщ, в Н точках Хщ е [х0,х\], ^ = 1,Н, определяется, согласно (11), векторно-матричным уравнением неполного наблюдения состояния объекта

Я(хи, ^ = Зи((г), Би = [рп(1^п,Хщ)], п = 1,N1, э = 1,Н, (54)

требующим построения наблюдателя полного или пониженного порядка [25]. Если по условиям необходимой точности моделирования объекта (11), (12) можно ограничиться учетом только М первых составляющих ((Ь) с минимальным их числом, необходимым для решения системы уравнений (39) относительно представляемого в форме (29) вектора ф*(Ь\), то ((Ь) непосредственно определяется решением системы уравнений (54) при Н = М, N = N = М:

((1) = 3-(и(хи, г). (55)

Подстановка (55) в (52), (53) приводит к линейному алгоритму синтеза оптимального регулятора с обратными связями по измеряемому выходу объекта:

и*Уп((и, ^ = 2(Т1Т2в-1(и(Хи, V + т1о^)п, П = 1Ж;

йу ((и ,^Х) =^2иуп(((и, $<Рп(Цп,х),

п=1

иЬ ((и, г) = 2^д{Т1Т2Б;;1(и(хи, Ъ + т&ъ).

Заключение

Предложен численный алгоритм решения задачи оптимального программного управления нелинейной системой с распределенными параметрами параболического типа в условиях равномерной оценки целевых множеств, сводимый к специальной итерационной процедуре решения на каждом ее шаге альтернансным методом линейно-квадратичной задачи оптимизации с определенным на предыдущей итерации внешним детерминированным пространственно-временным возмущением, компенсирующим влияние невязки между дифференциальными операторами уравнений линейной и нелинейной моделей объекта. На базе полученных результатов определены уравнения оптимальных регуляторов в форме линейных алгоритмов обратной связи по измеряемому состоянию системы с фиксируемыми предварительным расчетом нестационарными коэффициентами передачи.

В отличие от известных численных методов вариаций в пространстве управляющих воздействий предлагаемый подход характеризуется аналитической формой представления искомых алгоритмов программного и позиционного управления.

Конкурирующие интересы. Конкурирующих интересов не имею. Авторский вклад и ответственность. Я несу полную ответственность за предоставление окончательной версии рукописи в печать. Окончательная версия рукописи мною одобрена.

Финансирование. Исследование выполнено за счет гранта Российского научного фонда № 22-29-00180, https://rscf.ru/project/22-29-00180/, Самарский государственный технический университет.

Благодарность. Автор благодарен рецензенту за тщательное прочтение статьи и ценные предложения и комментарии.

Библиографический список

1. Васильев Ф. П. Методы оптимизации. М.: Факториал Пресс, 2002. 824 с.

2. Моисеев Н. Н. Элементы теории оптимальных систем. М.: Наука, 1975. 526 с.

3. Афанасьев В. Н., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления. М.: Высш. шк., 1998. 574 с.

4. Тятюшкин А. Н. Многометодная технология оптимизации управляемых систем. Новосибирск: Наука, 2006. 343 с. ЕБЫ: ддд—У.

5. Бутковский А. Г. Методы управления системами с распределенными параметрами. М.: Наука, 1975. 564 с.

6. Федоренко Р. П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 488 с.

7. Рапопорт Э. Я. Оптимальное управление системами с распределенными параметрами. М.: Высш. шк., 2009. 677 с. ЕБЫ: дМТРЕг.

8. Рапопорт Э. Я. Альтернансный метод в прикладных задачах оптимизации. М.: Наука, 2000. 336 с. ЕБЫ: ТТЕУМБ.

9. Рапопорт Э. Я., Плешивцева Ю. Э. Методы полубесконечной оптимизации в прикладных задачах управления системами с распределенными параметрами. М.: Наука, 2021. 286 с. ЕБЫ: дАББУА.

10. Рапопорт Э. Я. Аналитическое конструирование агрегированных регуляторов в системах с распределенными параметрами// Изв. РАН. Теор. сист. управл., 2012. №3. С. 38-54. ЕБЫ: ОХХРМ.

11. Ладыженская О. А. Краевые задачи математической физики. М.: Наука, 1973. 407 с.

12. Владимиров В. С. Уравнения математической физики. М.: Наука, 1981. 512 с.

13. Егоров А. И., Знаменская Л. Н. Введение в теорию управления системами с распределенными параметрами. СПб.: Лань, 2017. 292 с. ЕБЫ: ЕБИМБЕ.

14. Полянин А. Д. Справочник по линейным уравнениям математической физики. М.: Физматлит, 2001. 576 с. ЕБЫ: МУАЫРЫ.

15. Рапопорт Э. Я. Аналитическое конструирование оптимальных регуляторов в линейно-квадратичных задачах управления системами с распределенными параметрами при равномерных оценках целевых множеств// Изв. РАН. Теор. сист. управл., 2021. №3. С. 23-38. ЕБЫ: ЫХУБОИ. БО1: https://doi.org/10.31857/S0002338821030148.

16. Кошляков Н. С., Глинер Э. Б., Смирнов М. М. Уравнения в частных производных математической физики. М.: Высш. шк., 1970. 712 с.

17. Рапопорт Э. Я. Структурное моделирование объектов и систем управления с распределенными параметрами. М.: Высш. шк., 2003. 302 с. ЕБЫ: дММЫББ.

18. Валеев Г. К., Жаутыков О. А. Бесконечные системы дифференциальных уравнений. Алма-Ата: Наука, 1974. 415 с.

19. Персидский К. П. Об устойчивости решений счетной системы дифференциальных уравнений // Изв. АН КазССР. Сер. мат. мех, 1948. №2. С. 2-35.

20. Коваль В. А. Спектральный метод анализа и синтеза распределенных управляемых систем. Саратов: Саратов. гос. техн. ун-т, 1997. 192 с.

21. Егоров Ю. В. Необходимые условия оптимальности управления в банаховых пространствах// Матем. сб., 1964. Т. 64(106), №1. С. 79-101.

22. Рапопорт Э. Я. Равномерная оптимизация управляемых систем с распределенными параметрами// Вестн. Сам. гос. техн. ун-та. Сер. Физ.-мат. науки, 2022. Т. 26, №3. С. 419-445. ЕБЫ: УДСОдО. БО1: https://doi.org/10.14498/vsgtu1943.

23. Плешивцева Ю. Э., Рапопорт Э. Я. Пространственно-временное управление системами с распределенными параметрами в линейно-квадратичных задачах оптимизации с равномерными оценками целевых множеств// Изв. РАН. Теор. сист. управл., 2022. №4. С. 49-65. ЕБЫ: ЕГОВг1. БО1: https://doi.org/10.31857/S0002338822030118.

24. Плешивцева Ю. Э., Рапопорт Э. Я. Метод последовательной параметризации управляющих воздействий в краевых задачах оптимального управления системами с распределенными параметрами// Изв. РАН. Теор. сист. управл., 2009. №3. С. 22-33. ЕБЫ: КРРСХД.

25. Рапопорт Э. Я. Анализ и синтез систем автоматического управления с распределенными параметрами. М.: Высш. шк., 2005. 292 с. ЕБЫ: дМОУЕБ.

26. Кудрявцев Л. Д. Курс математического анализа. Т. 1. М.: Высш. шк., 1988. 712 с.

Vestn. Samar. Gos. Tekhn. Univ., Ser. Fiz.-Mat. Nauki

[J. Samara State Tech. Univ., Ser. Phys. Math. Sci.], 2023, vol. 27, no. 2, pp. 270-291 ISSN: 2310-7081 (online), 1991-8615 (print) d https://doi.org/10.14498/vsgtu2006

MSC: 90C47, 65K10

Uniform optimization method for nonlinear control systems with distributed parameters

E. Ya. Rapoport

Samara State Technical University,

244, Molodogvardeyskaya st., Samara, 443100, Russian Federation.

Abstract

The problem of optimization of a nonlinear controlled system with distributed parameters, and uniformly estimated target sets is reduced to controlling a linear model of the object. This linear model incorporates an additional, a priori unknown spatiotemporal disturbance that compensates for the influence of discrepancies between the linear and nonlinear differential operators in the corresponding initial-boundary value problems. Partial differential equations of the parabolic type describe these problems. The specific form of the disturbance's dependence on its arguments is identified based on the initial approximation at each step of the proposed convergent iterative procedure. This procedure is based on the results obtained in the previous step from solving the linear-quadratic programming optimal control problem using the developed alternance method. This problem includes a deterministic external input and requires the intermediate computation of the controlled state function of the nonlinear object using a digital model.

It has been shown that the desired equations for the optimal regulators can be obtained from the known results of the iterative process used to find the program control. The control is represented as linear feedback algorithms based on the measured state of the object, which uses nonstationary transfer coefficients.

Keywords: nonlinear system with distributed parameters, linear-quadratic optimization problem, iterative procedure, alternance method, parameterization of control actions, software optimal control, optimal control synthesis.

Received: 10th March, 2023 / Revised: 17th May, 2023 / Accepted: 25th May, 2023 / First online: 20th June, 2023

Differential Equations and Mathematical Physics Research Article

© Samara State Technical University, 2023 (Compilation, Design, and Layout) 9 ©® The content is published under the terms of the Creative Commons Attribution 4.0 International License (http://creativecommons.org/licenses/by/4.0/) Please cite this article in press as:

Rapoport E. Ya. Uniform optimization method for nonlinear control systems with distributed parameters, Vestn. Samar. Gos. Tekhn. Univ., Ser. Fiz.-Mat. Nauki [J. Samara State Tech. Univ., Ser. Phys. Math. Sci.], 2023, vol. 27, no. 2, pp. 270-291. EDN: LHFXZB. DOI: 10.14498/vsgtu2006 (In Russian). Author's Details:

Edgar Ya. Rapoport https://orcid.org/0000-0002-0604-8801

Dr. Techn. Sci., Professor; Dept. of Automation and Control in Technical Systems;

e-mail: [email protected]

Competing interests. I have no conflicting interests.

Authorship contribution and responsibility.. I take full responsibility for submitting the final version of the manuscript for publication. The final version of the manuscript has been approved by me.

Funding. The research was funded by the Russian Science Foundation grant no. 22-2900180, https://rscf.ru/project/22-29-00180/, Samara State Technical University.

Acknowledgments. The author is grateful to the reviewer for the thorough reading of the article and valuable suggestions and comments.

References

1. Vasilev F. P. Metody optimizatsii [Optimization Methods]. Moscow, Faktorial Press, 2002, 824 pp. (In Russian)

2. Moiseev N. N. Elementy teorii optimal'nykh sistem [Elements of the Theory of Optimal Systems]. Moscow, Nauka, 1975, 526 pp. (In Russian)

3. Afanas'ev V. N., Kolmanovsky V. B., Nosov V. R. Matematicheskaia teoriia konstruirovaniia sistem upravleniia [Mathematical Theory of Control Systems Design]. Moscow, Vyssh. shk., 1998, 574 c. (In Russian)

4. Tyatyushkin A. N. Mnogometodnaia tekhnologiia optimizatsii upravliaemykh sistem [Multi-method Technology for Optimization of Control Systems]. Novosibirsk, Nauka, 2006, 343 pp. (In Russian). EDN: QJQNJV

5. Butkovsky A. G. Metody upravleniia sistemami s raspredelennymi parametrami [Methods of Control by Systems with Distributed Parameters]. Moscow, Nauka, 1975, 564 pp. (In Russian)

6. Fedorenko R. P. Priblizhennoe reshenie zadach optimal'nogo upravleniia [Approximate Solution of Optimal Control Problems]. Moscow, Nauka, 1978, 488 pp. (In Russian)

7. Rapoport E. Ya. Optimal'noe upravlenie sistemami s raspredelennymi parametrami [Optimal Control of Systems with Distributed Parameters]. Moscow, Vyssh. shk., 2009, 677 pp. (In Russian). EDN: QMTFRZ

8. Rapoport E. Ya. Al'ternansnyi metod v prikladnykh zadachakh optimizatsii [Alternance Method in Applied Optimization Problems]. Moscow, Nauka, 2000, 336 pp. (In Russian). EDN: TTRVMB

9. Rapoport E. Ya., Pleshivceva Yu. E. Metody polubeskonechnoi optimizatsii v prikladnykh zadachakh upravleniia sistemami s raspredelennymi parametrami [Methods of Semi-Infinite Optimization in Applied Problems of Control of Systems with Distributed Parameters]. Moscow, Nauka, 2021, 286 pp. (In Russian). EDN: QADDYA

10. Rapoport E. Ya. Analytical construction of aggregated controllers in systems with distributed parameters, J. Comput. Syst. Sci. Int., 2012, vol.51, no. 3, pp. 375-390. EDN: RGNSPF. DOI: https://doi.org/10.1134/S1064230712020104.

11. Ladyzhenskaya O. A. Kraevye zadachi matematicheskoi fiziki [Boundary Value Problems of Mathematical Physics]. Moscow, Nauka, 1973, 407 pp. (In Russian)

12. Vladimirov V. S. Uravneniia matematicheskoi fiziki [Equations of Mathematical Physics]. Moscow, Nauka, 1981, 512 pp. (In Russian)

13. Egorov A. I., Znamenskaya L. N. Vvedenie v teoriiu upravleniia sistemami s raspredelennymi parametrami [Introduction to the Theory of Control Systems with Distributed Parameters]. St. Petersburg, Lan', 2017, 292 pp. (In Russian). EDN: ZBUMBZ

14. Polyanin A. D. Spravochnik po lineinym uravneniiam matematicheskoi fiziki [Handbook of Linear Equations of Mathematical Physics]. Moscow, Fizmatlit, 2001, 576 pp. (In Russian). EDN: MVANPN

15. Rapoport E. Ya. Analytical design of the optimal controllers in linear-quadratic problems of controlling systems with distributed parameters under uniform estimates of target sets, J. Comput. Syst. Sci. Int., 2021, vol.60, no. 3, pp. 364-378. EDN: BBXAQM. DOI:https:// doi.org/10.1134/S1064230721030138.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16. Koshliakov N. S., Gliner E. B., Smirnov M. M. Uravneniia v chastnykh proizvodnykh matem-aticheskoi fiziki [Partial Differential Equations of Mathematical Physics]. Moscow, Vyssh. shk., 1970, 712 pp. (In Russian)

17. Rapoport E. Ya. Strukturnoe modelirovanie ob"ektov i sistem upravleniia s raspredelennymi parametrami [Structural Modeling of Objects and Control Systems with Distributed Parameters]. Moscow, Vyssh. shk., 2003, 302 pp. (In Russian). EDN: QMMNDD

18. Valeev G. K., Zhautykov O. A. Beskonechnye sistemy differentsial'nykh uravnenii [Infinite Systems of Differential Equations]. Alma-Ata, Nauka, 1974, 415 pp. (In Russian)

19. Persidsky K. P. On the stability of solutions of a countable system of differential equations, Izv. AN KazSSR. Ser. Mat. Mekh., 1948, no. 2, pp. 2-35 (In Russian).

20. Koval' V. A. Spektral'nyi metod analiza i sinteza raspredelennykh upravliaemykh sistem [Spectral Method of Analysis and Synthesis of Distributed Control Systems]. Saratov, Saratov State Techn. Univ., 1997, 192 pp. (In Russian)

21. Egorov Yu. V. Necessary conditions for optimal control in Banach spaces, Mat. Sb. (N.S.), 1964, vol. 64(106), no. 1, pp. 79-101 (In Russian).

22. Rapoport E. Ya. Uniform optimization of controlled systems with distributed parameters, Vestn. Samar. Gos. Tekhn. Univ., Ser. Fiz.-Mat. Nauki [J. Samara State Tech. Univ., Ser. Phys. Math. Sci.], 2022, vol. 26, no. 3, pp. 419-445 (In Russian). EDN: WJCOQD. DOI: https:// doi.org/10.14498/vsgtu1943.

23. Pleshivtseva Yu. E., Rapoport E. Yu. Spatiotemporal control of systems with distributed parameters in linear-quadratic optimization problems with uniform estimates of target sets, J. Comput. Syst. Sci. Int., 2022, vol.61, no. 4, pp. 523-538. DOI: https://doi.org/10. 1134/S106423072203011X.

24. Pleshivtseva Yu. E., Rapoport E. Ya. The successive parameterization method of control actions in boundary value optimal control problems for distributed parameter systems, J. Comput. Syst. Sci. Int., 2009, vol.48, no. 3, pp. 351-362. EDN: LLQZJH. DOI: https:// doi.org/10.1134/S1064230709030034.

25. Rapoport E. Ya. Analiz i sintez sistem avtomaticheskogo upravleniia s raspredelennymi parametrami [Analysis and Synthesis of Automatic Control Systems with Distributed Parameters]. Moscow, Vyssh. shk., 2005, 292 pp. (In Russian). EDN: QMOYRB

26. Kudryavtsev L. D. Kurs matematicheskogo analiza [Course of Mathematical Analysis], vol. 1. Moscow, Vyssh. shk., 1988, 712 pp. (In Russian)

Метод равномерной оптимизации нелинейных управляемых систем с распределенными параметрами Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Эдгар Яковлевич Рапопорт

Похожие темы научных работ по математике , автор научной работы — Эдгар Яковлевич Рапопорт

Uniform optimization method for nonlinear control systems with distributed parameters

Текст научной работы на тему «Метод равномерной оптимизации нелинейных управляемых систем с распределенными параметрами»