Научная статья на тему 'Решение задач оптимального управления при кусочно-постоянных, кусочно-линейных и кусочно-заданных на классе функций управляющих воздействиях'

Решение задач оптимального управления при кусочно-постоянных, кусочно-линейных и кусочно-заданных на классе функций управляющих воздействиях Текст научной статьи по специальности «Математика»

CC BY
673
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ЗАДАЧА УПРАВЛЕНИЯ / СИСТЕМА С СОСРЕДОТОЧЕННЫМИ ПАРАМЕТРАМИ / ГРАДИЕНТ ФУНКЦИОНАЛА / ПРИНЦИП МАКСИМУМА / КУСОЧНО-ПОСТОЯННОЕ УПРАВЛЕНИЕ / КУСОЧНО-ЛИНЕЙНОЕ УПРАВЛЕНИЕ / КУСОЧНО-ЗАДАННОЕ УПРАВЛЕНИЕ / ИНТЕРВАЛ ПОСТОЯНСТВА УПРАВЛЕНИЯ / CONTROL PROBLEM / GRADIENT OF FUNCTIONAL / CONCENTRATED PARAMETERS SYSTEM / MAXIMUM PRINCIPLE / PIECEWISE CONSTANT CONTROL / PIECEWISE LINEAR CONTROL / PIECEWISE GIVEN CONTROL / CONSTANCY INTERVAL OF CONTROL

Аннотация научной статьи по математике, автор научной работы — Рагимов Анар Бейбала Оглы

Рассмотрены задачи оптимального управления объектами, описываемыми системами обыкновенных дифференциальных уравнений при кусочно-постоянных, кусочно-линейных и кусочно-заданных на классе функций управлениях. Оптимизируются как кусочно-постоянные значения параметров управлений, так и границы интервалов постоянства этих значений. Получены аналитические формулы градиента функционала по оптимизируемым параметрам, позволяющие для численного решения задач применять эффективные методы оптимизации первого порядка. Приведены результаты численных экспериментов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Optimal control problems for objects described by ordinary differential equations system on the classes of piecewise constant, piecewise linear, and piecewise given control functions are considered. Both the piecewise constant values of the coefficients participating in the expression of controls as well as the boundaries of constancy intervals of these values are optimized. Analytic formulas for the gradient of the functional on the optimized parameters are obtained. These formulas allow using efficient first order optimization methods to solve the problems numerically. Results of numerical experiments are given.

Текст научной работы на тему «Решение задач оптимального управления при кусочно-постоянных, кусочно-линейных и кусочно-заданных на классе функций управляющих воздействиях»

атематические проблемы управления

удк 519.6;517.977.5

РЕШЕНИЕ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ОРИ КУСОЧНО-ПОСТОЯННЫХ, КУСОЧНО-ЛИНЕЙНЫХ И КУСОЧНО-ЗАДАННЫХ НА КЛАССЕ ФУНКЦИЙ УПРАВЛЯЮЩИХ ВОЗДЕЙСТВИЯХ1

А.Б. Рагимов

Рассмотрены задачи оптимального управления объектами, описываемыми системами обыкновенных дифференциальных уравнений при кусочно-постоянных, кусочно-линейных и кусочно-заданных на классе функций управлениях. Оптимизируются как кусочно-постоянные значения параметров управлений, так и границы интервалов постоянства этих значений. Получены аналитические формулы градиента функционала по оптимизируемым параметрам, позволяющие для численного решения задач применять эффективные методы оптимизации первого порядка. Приведены результаты численных экспериментов.

Ключевые слова: задача управления, система с сосредоточенными параметрами, градиент функционала, принцип максимума, кусочно-постоянное управление, кусочно-линейное управление, кусочно-заданное управление, интервал постоянства управления.

ВВЕДЕНИЕ

При управлении многими реальными процессами осуществление частых изменений значений управляющих воздействий либо связано с большими трудностями реализации, либо вообще невозможно. Поэтому, с практической точки зрения, возникает необходимость исследования задач оптимального управления на заданных классах, например, на классах кусочно-постоянных, кусочно-линейных и других управляющих воздействий. В настоящей статье исследуются нелинейные задачи оптимального управления процессами, описываемые системами обыкновенных дифференциальных уравнений. В рассматриваемых задачах управление принадлежит классам кусочно-постоянных, кусочно-линейных и кусочно-заданных управляющих функций; оптимизируются кусочно-

1 Работа выполнена при финансовой поддержке Фонда развития науки при Президенте Азербайджанской Республики. Грант № Е1Р/аЛМ-2-2013-2(8)-25/06/1.

постоянные значения коэффициентов, входящих в выражении управлений, и оптимизируются сами интервалы постоянства этих коэффициентов. Важно, что границы интервалов постоянства коэффициентов неизвестны и оптимизируются. Предложен метод численного определения оптимальных кусочно-постоянных значений коэффициентов и интервалов их постоянства, основанный на методах конечномерной оптимизации первого порядка и полученных формулах градиента функционала по оптимизируемым параметрам.

Отметим, что различные другие аспекты оптимального управления на классе кусочно-постоянных функций исследовались многими авторами [1—9]. В частности, для решения линейно-квадратичной задачи управления на классе кусочно-постоянных управляющих функций с оптимизируемыми временами их переключения использована фундаментальная матрица решений [3], получены условия оптимальности для случая, когда управления принимают значения из заданного множества с конечным числом значений [7]. Предложен подход к синтезу зональных кусочно-постоянных уп-

равляющих воздействий [8]. Исследования данной работы отличаются от других подходов, использующих дискретизацию непрерывной задачи оптимального управления, в которых управляющие воздействия естественно становятся кусочно-постоянными. Здесь параметры управляющих воздействий предполагаются заведомо кусочно-постоянными, а интервалы постоянства никак не связанными с шагом дискретизации задачи, а самое важное то, что оптимизируются сами моменты времени переключения управлений, т. е. границы интервалов постоянства значений параметров управления.

1. ПОСТАНОВКА ЗАДАЧИ

Рассматриваются задачи оптимального управления объектами, описываемыми системами обыкновенных, в общем случае нелинейных, дифференциальных уравнений. Пусть состояние управляемого объекта определяется задачей Коши:

* (?) = /(х, и, ?), ? е (0, Т], х(0) = Х0, (1)

где х = х(?) е Е", ? е [0, Т] — фазовое состояние объекта; и = и(?) е Ег, ? е [0, Т] — управление; вектор-функция / = (/х, /2, ..., /")т непрерывно дифференцируема по (х, и) и непрерывна по ?. Момент времени Т и начальная точка х0 е Е" заданы. Рассмотрены три постановки задачи оптимального управления, различающиеся допустимыми классами функций, в которых ищутся оптимальные управляющие воздействия и(?).

1.1. Управления из класса кусочно-постоянных функций

Управление и = и(?) е Ег, ? е [0, Т ], постоянное на каждом полуинтервале [т.. _ 1 т.), у = 1, ..., X, полученном разбиением отрезка [0, Т] (X — 1) опти-

мизируемыми точками т., j = 1, ..., L — 1, (рис. 1), т. е. [10]

u(t) = v. = const, t e [т. _ 1 т.), v. e Er, (2) т.. _ j < т., j = 1, ..., L, т0 = 0, tl = T, (3)

а значения управления v. e Er, j = 1, ..., L, принадлежат некоторому множеству U, в частности, параллелепипеду:

U = {v : v = (vj, ..., Vl), a. < v.. < p.,

v., a., p. e Er, j = 1, ..., L}. (4)

Задача заключается в нахождении кусочно-постоянных значений управления u(t), т. е. значений конечномерных векторов v.. e Er, j = 1, ..., L, и границ интервалов постоянства этих значений, определяемых вектором т = (тр ..., тх _ j) , при которых заданный функционал

/(и) = / (V, т) = |/0(х, и, + Ф(х(Т)) (5)

0

при условиях (1)—(4) принимает минимальное значение, (V, т) е ЕЬС +1)-1. Предполагается, что заданные функции /0 и Ф непрерывны вместе с частными производными по своим аргументам и число интервалов постоянства управлений X задано.

1.2. Управления из класса кусочно-линейных функций

Управление и = и(?) е Ег, ? е [0, Т ] — линейная функция на каждом полуинтервале [т.. - т.), у = = 1, ..., X, полученном разбиением отрезка [0, Т] (X — 1) оптимизируемыми точками т., у = 1, ..., X — 1 (рис. 2), т. е.

и(?) = (? - т. - х) + с2, ? е [т. - р т.),

. - 1' 1 . - 1' . cj, e Er, (6)

Рис. 1. Кусочно-постоянное управление

а допустимые значения управления принадлежат некоторому множеству и, в частности, параллелепипеду:

и = {и : и = и(?), а < и(?) < в, а, в е Ег,

? е [0, Т]}. (7)

Если обозначить параметры управления С =

/Л гЬ\Т / 1 1 2 2 Ь ЬЧТ

= (С , ..., С ) = (с1, с2, с1, с2, ..., с1 , с2 ) , то ясно, что функционал (5) будет зависеть от С и т:

т

/(и) = / (С, т) = |/ 0(х, и, + Ф(х(Т)). (8)

0

Рис. 2. Кусочно-линейное управление

Задача заключается в нахождении таких векторов С = (С1, ..., С£)т и т = (тр ..., т1 _ 1)т, при которых заданный функционал (8) при условиях (1), (6), (3), (7) принимает минимальное значение.

1.3. Кусочно-заданные на классе функций управления

Управление и = и(*) е Ег, * е [0, Т] определяется заданными базисными функциями фж(? — т.- ,),

Ж . 1

т = 1, ..., М, * е [т..- 1, т.), с неизвестными оптимизируемыми постоянными коэффициентами С = (с{, ..., е]м)т, у = 1, ..., Ь, на каждом полуинтервале [т.._ 1, т.), у = 1, ..., Ь, полученном разбиением отрезка [0, Т ] (Ь — 1) оптимизируемыми точками т., у = 1, ..., Ь — 1 (рис. 3), т. е.

м

и(0 = Е СЖ Фж(? - т. - * е [т.. - р T/.),

m = 1

4 е .

m = 1,

M,

(9)

а допустимые значения управлений принадлежат некоторому множеству и, в частности, параллелепипеду (7).

Задача заключается в нахождении векторов параметров управления С = (С1, ..., С1) = (с1, ..., сМ,

..., с1 , ..., см) , и т = (т1, ..., т1 - 1) при условиях

(1), (9), (3), (7), при которых заданный функционал (8) принимает минимальное значение. Предполагается, что заданные функции фж(? — т._ ,),

Ж . 1

т = 1, ..., М, * е [т._ 1, т.), вместе с частными производными по (х, и) непрерывны.

Таким образом, в зависимости от выбора управления в форме (2), (6) или (9), будут рассмотрены три постановки задачи оптимального управления: 1) (1)—(5); 2) (1), (6), (3), (7), (8); 3) (1), (9), (3), (7), (8).

Отметим, что разрыв первого рода управляющих воздействий и(*) в какие-либо моменты времени т. е [0, Т], как известно, приводит к потере гладкости и появлению изломов траектории х(*) при * = т.. При расчетах, а именно, при решении системы дифференциальных уравнений (1) численными методами возможны два подхода к учету моментов разрыва управления. Согласно одному из них применяется неравномерный шаг интегрирования, при котором моменты переключения включаются во множество точек дискретизации интервала времени [0, Т ]. В этом случае изменение значения управления на интервалах, полученных при дискретизации, учитывается естественным образом. В соответствии с другим подходом множество точек дискретизации берется равномерным, а на интервалах, в которые попали точки переключения управления, значения управления усредняются.

2. ЧИСЛЕННОЕ РЕШЕНИЕ ДИСКРЕТИЗИР0ВАНН0Й ЗАДАЧИ

Исследуем решение задачи на каждом из рассмотренных выше классах управления в отдельности.

2.1. Управления в форме (2)

Для численного решения задачи (1)—(5) воспользуемся схемой, предложенной в работах [11—14]. Для этого на отрезке [0, T] введем равномерную сеточную область

Q = [Щ = ih, / = 0, ..., N, h = T/N},

где N — заданное натуральное число.

В области Q аппроксимируем значение управления u = u(t) е Er, t е [0, T]:

u. =

Рис. 3. Кусочно-заданное управление

Vj, [t„ ti +1) с [Tj-1, Tj), j = 1, ..., L,

(Vj + i(t, + 1 - Tj) + Vj(Tj - t,))/h, Tj е [t„ t{ +1), (10)

j = 1, ..., L - 1, / = 0, ..., N - 1.

Видно, что если момент времени переключения управления т.. находится между узловыми точками и + 1, то значение управления и, аппроксимируется линейной комбинацией значений V., V. + 1.

Применяя какую-либо схему аппроксимации (например, явную и неявную схемы метода Эйлера, метод Рунге — Кутты, метод Адамса и др.), аппроксимированную систему (1) можно в общем случае представить в виде:

х' = ^(х', П ог), х0 = Х0, I = 1, ..., N

X' = Ц : 5 е XX}, V1 = {^ : 5 е ¿V}, (11)

о, = {т^ : 5 е ^Т},

где функция Р., индексные множества XX, XV, ^Т определяются применяемой схемой аппроксимации задачи (1).

Например, для явного метода Эйлера функция

^(Х', V, Ог) = - 1 + А/Хх,- 1, и, - 1, - 1),

I = 1, ..., N. (12)

а индексные множества

XX = {' - 1}, XV = {У : т. - 1 < - 1 < т.},

Х'т = {у : - 1 < т.. < ?,}. Для неявного метода Эйлера ^(Х', П Ог) = - 1 + А/(хг, и, - 1, ?,), I = 1

^ = : т._ 1 < _к < т., I = 5q + к, к = 1, 2, 3, 4, К 1.0, / = 5#,

= : - к < т.. < - к +1,1 = 54 + к, к = 1, 2, 3, 4, Т 1.0, / = 54,

I = 1, ..., 5Ж, 4 = 1, ..., N - 1.

Интеграл, участвующий в выражении функционала (5), аппроксимируем с помощью какой-либо квадратурной формулы:

N

I

г = 0

/(V, т) = Ф(%) + А I уг/°(х, и,, ?,) ^ ш1п, (15)

? '"5 -1- т ?

где у,, / = 0, 1, ..., N — коэффициенты квадратурной формулы.

В результате получим конечномерную задачу математического программирования (10), (11), (15) с учетом условий (3), (4).

Для решения задачи (10), (11), (15), т. е. для определения оптимальных значений векторов V и т, воспользуемся численными методами конечномерной оптимизации первого порядка, в частности, итерационным методом проекции градиента функционала в пространстве оптимизируемых параметров (V, т):

(/ + 1, тк + 1) = Р(зШ)[(/, тк) -

XX = {/ - 1, ¿}, XV = {У : т.- 1 < - 1 < т.}, (13) - а(57(/, тк)/^, 57(/, тк)/дт)], к = 0, 1, ..., (16)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Х'т = {у: - 1 < т.. < ?,}. Для метода Рунге — Кутты четвертого порядка

^Х', Г', О,) =

1

А/и5^, ^), / = 54 + 1,

АЛ *5? + 2*5? + 1, и5у ?5^ + » = 54 + 2,

I ^ А

3 + 22+ 2, и5^ ?5? + ^ ' = 54 + 3 (14)

II А/(*5? + *5? + 3, и5у ?5^ + А), » = 54 + 4

л = 0

"5 q + £

I = 5 4 + 5,

Г =

{54 - 5,54 - 4,54 - 3,54 - 2,54 - 1},' = 54, {54 - к - 1,5 4 - 5}, / = 54 - к, к = 1, 2, 3, {54- 5}, / = 54- 4,

где Р(3) (4) — оператор проектирования вектора (V, т)

на допустимую область параметров, определяемую

ограничениями (3), (4); (V0, т0) — некоторое заданное начальное приближение для оптимизируемых параметров; векторы

¿/(V, т)/Л = (¿7/^, ..., ¿//^Ь)т, ¿/(V, т)М = (¿//¿т1, ..., ¿//¿тЬ - 1)т, (17)

определяют градиент функционала задачи (10), (11), (15), формулы для компонент которого будет получены далее.

Введем индексные множества XX, XV, ^Т, которые назовем сопряженными относительно множеств XX, X V, X т:

ZX = {5 : / е , 5 = 0, ..., N - 1}, XV = {5 : I е XV, 5 = 0, ..., N - 1},

7т = {5 : I е 7т, 5 = 0, ..., N - 1}.

4

Векторы

р, = ¿/(у, т)/яХ., р, е Е", I = 0, ..., N

(18)

будем называть импульсными переменными [10—14]. Здесь производная понимается как полная, с учетом взаимозависимости значений х,, / = 0, ..., N в соотношениях (11). Отсюда с учетом (11) следует:

Р. = З/ + у 33 Зх? =

' Зз; _г ¿х? Зх,

= + Е

ЗТ?(Х?, V?, О ?)

Зх,-

Зх,

Р?,

? е ¿X

I = 0.....N.

(19)

Систему (19) назовем сопряженной системой. Из формулы (12) несложно понять, что для явного метода Эйлера ЬХ = {/}, а сопряженная система имеет вид:

р = З/ + +1(х''+1, Vй 1, о'+1) р = р Зх, + Зх; Р'+1

=у-З/Кх^и!.-) +

Зх

Е + А

З/ (хЗ, иЗ З ) Зх

" ' + 1'

Для метода Рунге — Кутты четвертого порядка (14) из системы (19) имеем:

Р =

ЕРзд+5,» = 5д + 4,

6

3Р5 а+5 + 6

НЗ/ (х5д + х5д + 3, и5у *5д + Н)

Зх

5а + 3

р5д+4,

I = 5 д + 3,

1

Н2 З/Т( г, и5 д, *5 д + Н/2) Р

3Р5 д+5 + 'в Зг +3'

р5д + 3,

где г = х5д + Н/2(х5д+2), I = 5д + 2, 1

6Р5 д+5 + 6 Зг + '

где г = х5д + Н/2(х5д + 1), / = 5д + 1,

Н2 З/Т( г, и5 д, *5 д + Н/2)

р5д+2,

(22)

о т

, З/ (х5д, и5д, *5дК НЗ/ (х5д, и5д, *5д)„

Ну5д-З°-+ 6-зз-Р5д + 1 +

Зх

, НЗГ (х5д + Н/2(х5д + 1X u5д, *5д + Н/2)„

+ 3 зх— Р5д+2+

+ НЗ/Т(х5д + Н/2(х5д + 2X u5д, *5д + Н/2) Р

+ 3 Зхзд Р5д+3+

+ НЗ/Т(х5д + Н/2(х5д + 3X u5д, *5д + Н/2) Р + --3-Р5д + 4 +

Зх

+ Р5д + ^ » = 5д

I = N - 1.....0

? * " ?

(20)

Р = З/ = ЗФ(хж) + , З/ (х№ и№

Зх^ Зх^ Зх^

где Е — п-мерная единичная матрица.

Для неявного метода Эйлера (13) ЬХ = {¿, / + 1}, а сопряженная система (19) примет вид:

Р = З1 + ЗТ + 1 ( з'' + 1, з'' + 1, о '+1) р + Р' Зх , Зх ,' Р' + 1

+

ЗТ(Хг, V', О') _ _ __ ,З/0(х, и,, 3)

Зх

"Рг = У'Н"

Зх

+ Р + 1 +

+ НЗ/ (- 1, ц Р', , = N - 1, ..., 1, (21)

^ = л; + ЗТ) 33 о) = ЗФ (х3) + Зх^ Зх^ Зх^

+ ^ н З/ (х), '), -о) + н З/(х), и)- 1,

Зх

N

Зх

N

Р = ЗФ(х5N) + ч НЗ/ (х5N, и5№ Ы Р5N зз + '5^' зз

Зх5 N ЗХ5N

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I = 5N - 1, ..., 0, д = N - 1, ..., 0,

где

Ь = Ь =

{5д + 1,5д + 2,5д + 3,5д + 4,5д + 5}, / = 5д, {5д + к + 1, 5д + 5}, / = 5д + к, к = 1, 2, 3, {5д + 5}, / = 5д + 4.

Учитывая зависимости (11) и определение для сопряженных переменных (18), компоненты градиента

3 = ЗЗ + у .¿ЗЗ) = ЗЗ +

¿у. Зз. _,• ¿х ? Зу. Зу.

1 1 ? е ]

, у ЗТ?(X?, V?, О?)

+ у 3 '-р?, у = 1, ..., Ь, (23)

? е Хк

ЗV/'

33 = ЗЗ + у 33 ЗЗ = ЗЗ +

¿т.. Зт.. _,• ¿х? Зт.. Зт..

] ] ? е Ьт 4./ 1

+ у З3(3ЗП 3)р?, у =1, Ь -1. (24)

^ е Хт

Зт;

В частности, для явного метода Эйлера предположим, что момент переключения т. находится между узловыми точками ?к . -1 и ?к ., т. е. т. е [ ?к . -1, ?к .),

у у . У У

у = 1, ..., X - 1. Ясно, что тогда значение управления V. будет влиять на переменные х с индексами 5 = к. - 1, к.. - 1 + 1, ..., к. - 1, к... В этом случае

IV = {к.- 1, к..- 1 + 1, ..., к.. - 1, к.} и 1т = {к..}. Следовательно, компоненты градиента

¿V,

к

З- + I ^ р =

к

= А I

5 = к,

У- 1

У* - Г

З/0 С

"5 - 1> - 1 - 1

- 1 ) ди5 - 1

Зи

5 - 1

ЗV;

+

З/т (х

5 - 1> - 1 - 1

- 1) Зи5 - 1

Зи5 - 1

у = 1,

ЗV;

X,

где р5, 5 = к. - 1, ..., к., у = 1, ..., X, определяются из системы соотношений (20), а частные производные Зи/Зv., 5 = к. - 1 - 1, ..., к. - 1, у = 1, ..., X, определяются из соотношения (10):

З-

1,5 = к.

7 -1'

к - 2,

(+1 - т. -1) А 5 = к -1 -1

[(т..- )/А, 5 = к..- 1.

(25)

Для компонент градиента имеем:

¿7 _ З7

Зхк

З/

¿т к'

Зхк Зик -

Зт.

Зи

к -1

З 'Рк, Зт.. у

Зик -1

= А

Зт.

Уку -1

З/ 0( хк, -

1> ик; - 1 'к,-- 1

?к , - 1)

Зи

+

к -1

+ З/ (хку - 1, и-у - 1, - 1 )

Зи

Рк;

кУ -1

у = 1, ..., X - 1,

(26)

где рк . , у = 1, ..., 7 - 1, определяются из соотношений (20). Частные производные З ик-- 1/Зт., у = 1,

..., X - 1 определяются непосредственно из соотношения (10):

Тогда из выражений (26) и (27) для у = 1, X - 1 получаем

= (V - V+1)т

Уку -1

З/ (-ку - 1, —У- - 1 - 1 ) +

Зи

к -1

+ З/ (хку - ь ику- - l, - 1 )

Зи

к -1

рку

у = 1, ..., X - 1.

Для неявного метода Эйлера = {к. - 1, к. - 1 +1, ., к. - 1, к..}, = {к. и

к

* = А I

¿V 5 = к ,

¿7

-1

У* - 1

З/ (х- ь и5-1, -1) Зи5-1

Зи

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5 - 1

ЗV;

+ З/ ^ и5 - 1» Зи5 - 1 р

Зи

5 - 1

у = 1, ..., X,

37 = (V. - V. + 1)т

Уку--1

З/ (-кУ - 1, и -У - 1, ?ку - 1 ) +

Зи

к -1

+ З/ (хк/ "ку. - 1, V

Зи

рк

к -1

, у = 1, ..., X - 1,

где р5, 5 = к. - 1, ..., к., у = 1, ..., X, определяются из сопряженной системы (21), а частные производные Зиs/Зv/, 5 = к. - 1 - 1, ..., к. - 1, у = 1, ..., X, — по формулам (25).

Для метода Рунге — Кутты четвертого порядка

Гу = {5к. - 1, ..., 5к.}, Гт = {5ку - 4,5к. - 3,5к. -- 2,5к. - 1,5. и

¿7 = З- + I З- р =

^ ^ 5 = 5ку_ 1 ^ 5

к 0 5к

= I . а З/ (х55, и55, ?55) Зи55 + I ^ р 5 = к ,. , Зи5^ З7 5 = 5к._ 1 ЗV/.

ку--1

у = 1, ..., X,

(28)

¿7 _ З7

_ _ + I ^У*

¿т. Зт. ^ Зт. ркУ- 5

З/0( хк, -1, ик, -1, ?к, -1 )Зик, -1 , = А Ук; -1-—-У-У--— +

Зик

Зт.

З ику- 1/Зту = (v/. - ^ + 1)/А у = 1, ..., X - 1.

(27)

4 Зхк. „ Зик 1 + I ^ -к-1 рк.-5, у= 1, ..., X- 1, (29)

5 = 0 Зик - 1 Зт; У

5

где

З^

Зv/

АЗ/(х5 и 5 у -5а)З и5- 5 = 54 + 1

6 Зи5а Зv/.'

А З/(х5а + А/2(х5а + к -1X и5а ?5а + А/2) Зи5а

3

Зи

5 = 54 + к, к = 2, 3, А З/( х5а

5д + 3 и5а '5а

■А) Зи^

6

Зи

ЗV;

Зv..

54 + 4,

0, 5 = 54 + 5,

Зи 5 а =

Зv..

1, 4 = к.-1,..., к.- 2,

( ?5

а + 5

-т.

1) /А, 4 = к. -1 - 1,

(т. - ?5а)/А, 4 = к. - 1.

Импульсы р5, 5 = 5 к. - 1, ..., 5к., у' = 1, ..., X, определяются из соотношений (22), а частные производные З ику- 1/Зт., у = 1, ..., X - 1, — по формулам (27).

Формулы (23) и (24) определяют компоненты градиента (17) функционала задачи (10), (11), (15).

Как указывалось в работах [11—15], именно приведенные формулы для импульсов и градиента функционала точно соответствуют применяемым схемам аппроксимации. Для аппроксимации классической сопряженной системы для непрерывного случая так же необходимо использовать приведенные формулы, соответственно схеме аппроксимации прямой задачи. Но надо отметить, что при аппроксимации непрерывных прямых и сопряженных систем «увидеть» правильность согласования схем не просто. В предложенных формулах это согласование происходит естественно [11—15]. Отметим, что формулы (28) и (29), полученные для случая применения метода Рунге — Кутты, ранее никем не приводились как в классическом случае кусочно-непрерывного класса управлений, так и, тем более, для рассматриваемых в данной работе классов управляющих воздействий.

Итерационный процесс (16) осуществляется в несколько этапов:

1) при текущих значениях вектора тк) е Е2Ь-1 из формул (10) и (11) определяется решение аппроксимированной задачи Коши е Е", / = 0, ..., N

2) из формулы (19) в обратном порядке, начиная от / = N и продолжая до / = 0, определяются

векторы импульсов р, е Е ;

3) из формул (23) и (24) определяются компоненты градиента (17);

4) выполняется процедура (16) с выбором шага а из условия одномерной минимизации функционала (15) (учитывая «простоту» допустимой об-

ласти параметров (3), (4), операция проектирования Р(3) (4) не представляет сложности) определяется новое приближение (^ + 1, тк + 1).

В случае невыполнения условия оптимальности или останова повторяются этапы 1—4.

2.2. Управления в форме (6)

В области О аппроксимируем значение управления и = и(?) е Ег, ? е [0, Т ] и функционал (8):

и, =

X,

(30)

.- т..-1) + с2,[+ 1) ^ [т..-1, т.),у = 1 А[(Ь + 1 - т..)(+1(+ 1 - т..) + + 1) + + (т..- ?,)(с.(- т..-1) + с.)], т. е [+1),

у = 1,..., X -1,

I = 0, ..., N - 1, 7(С, т) = Ф(%) + А I у,/0(хр и,, ?,) ^ ш*п. (31)

,=0

С, т

Видно, что если момент времени переключения управления т. находится между узловыми точками и + 1, то значение управления и,, аппроксимируется линейной комбинацией значений

(с/(+ 1

т - 1) + с2), (с

А ^ + 1(,

! + 1

т.) + с2 + 1).

Итак, аппроксимируя задачу (1), (6), (3), (7), (8), в результате получим конечномерную задачу математического программирования (11), (12), (30), (31) с учетом условий (3), (7).

Для решения задачи (11), (12), (30), (31), т. е. для определения оптимальных значений векторов

^.1122 Ь Ьчт

С = (с1, с2, с1, с2, ..., с1 , с2 ) и т, воспользуемся

итерационным методом проекции градиента функционала в пространстве оптимизируемых параметров (С, т):

к + 1 к + 1 (С , т ) = Р

[(Ск, тк)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(3),(7)

а(^7(Ск, тк)/^С, ¿7(Ск, тк)/^т)], к = 0, 1, ...,

(32)

где Р(3) (7) — оператор проектирования вектора (С, т)

на допустимую область параметров, определяемую

ограничениями (3), (7); (С0, т0) — некоторое заданное начальное приближение для оптимизируемых параметров; векторы

¿7/^т = (¿7/Л1, ..., ¿7/^тЬ - 1)т, ^/¿С =

= (¿7/^01, ¿7/^02, ¿7/Л:?, ..., ^/¿сЬ, ¿7/^ )т, (33)

определяют градиент функционала (31).

5

Получим формулы для вычисления градиента (33). Предположим, что момент переключения т.

находится между узловыми точками 'к,_ 1 и 'к,, т. е. т. е [ 'к, -1, 'к,), у = 1, ..., Ь - 1. Тогда компоненты

/ У У

градиента

33 = я. + у Р? =

Зх?

¿с1

Ж

Зс1

= *, -1ЗС

к,

= Н у

?=к- -1

' З/ (х? -1, и? - ь '? -1) Зи? -1 + ^ _ 1-:--- +

Зи

? -1

Зс1

+ З/ (х? - 1, 3 - ь - 1 ) Зи? - 1Р + Р?

Зи

? -1

Зс .

п

у = 1, ..., Ь, т = 1, 2,

(34)

а из соотношения (30) частные производные определяются

'?- т/'-ь к/-1, ..., к/'- 2, 2

Зи?

Зс1

Зи ?

Зс2.

(+1 - т. -1) /Н, ^ = к -1 -1 (т. - )(- т.- 1)/Н, 5 = к. - 1,

1, 5 = к.-1,..., к.- 2,

(+1 - т. -1)/Н, 5 = к/ -1 - 1 Кт. - )/Н, 5 = к/ - 1.

2.3. Управления в форме (9)

В области О аппроксимируем значение управления и = и(') е Ег, * е [0, Т]:

и' =

м

у сЖфЖ' -1,[ '* 'г + 1 )с[т/ - 1,т/), У = 1,..., Ь.

Ж=1

(37)

мм

('г + 1 - т/) у сЖ+ 1 фЖ+ 1'1 + (т/- *г) у сЖФЖ' -1

/ ^ ^Ж ТЖ

Ж=1

Ж = 1

Ц е [+ 1),У = 1, I = 0.....N - 1,

Ь - 1,

М, / = 0,

N - 1,

где Фж1 = Фж(*г - т _ 1), т = 1, у = 0, ..., Ь - 1.

Итак, аппроксимируя задачу (1), (9), (3) (7), (8), в результате получим конечномерную задачу математического программирования (11), (12), (37), (31) с учетом условий (3), (7).

Для определения оптимальных значений век/ 1 1 Х Х ЧТ / торов С = (С1 , ..., См, ..., С1 , ..., См) и т = (т1, ...,

тХ _ 1)Т, воспользуемся процедурой (32). Здесь векторы

¿//¿т = (¿//¿т1, ..., ¿//¿тХ _ 1)Т,

1 1 Х Х Т

¿//¿С = (¿//¿с1, ..., ¿//¿см, ..., ¿//¿с1 , ..., ¿//¿см)

Для компонент градиента ¿//¿т., у = 1, ..., Ь - 1 получим выражение (26). Частные производные, участвующие в выражении (26), определяются непосредственно из соотношения (30):

Зи

/ = Н[2 С1 *1 (т - 'к- > + С1('к, - ■

/' + 1 I /1

- с2 + с2 '

т/ _ 1)

с2 + с2 ]. (35)

Если учесть формулу (35) в выражении (26), то получим

33

йт/

Ук, -1

З/ (хк, - l, 'к, - ь 'к, - 1 ) +

Зи

к, -1

+ З/ ( хк, . ъ ик, - l, 'к, - 1 )

Зи

Рк

к, -1

х [2с/+1 (т. - 'к,) + с/ ('к,-1 - т._ 1) - с2'+1 + с2],

,7. — '7 ^ 1 -у = 1, ..., Ь - 1.

(36)

Формулы (34) и (36) определяют компоненты градиента функционала (31) задачи (11), (12), (30), (31).

определяют градиент функционала задачи (11), (12), (37), (31).

Введем вектор импульсных переменных (18) и предположим, что т. е ['к,-1, 'к ,), у = 1, ..., Ь - 1.

1 У У

Тогда для компонент градиента имеем:

к

33 = ЗЗ + у ЗЗ Р =

¿сЖ ЗсЖ ?=к -1 ЗсЖ ?

= Н у

? = к,

-1

З/0(х? - 1, 3 - 1 '? - 1) З3 - 1

у? _ г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Зи

-1

Зс

п

+ З/ (х? - l, 3 - 1 - 1 ) З3 - 1 р

Зи

? -1

Зс 1

у = 1, ..., Ь, т = 1, ..., М,

(38)

а из соотношения (37) определяются частные производные

Зи Зс

=

? /' - 1 7

Фж1 ,5 = к,

/ -1'

к/' -2,

? +1, /' -1 >Ж /

(т/ - )фЖ'-1/Н, 5 = к/ - 1.

(+1- т/' -1 )фЖ+±' 1 - VН, 5 = к/' -1-1,

к

к

X

Для компонент градиента d//dT/, у = 1, ..., X - 1 имеют место соотношения (26). Частные производные, участвующие в соотношении (26), определяются непосредственно из выражения (37):

Зи

к, -1 _ 1

г м

Зт. А

I сИ Ф

к,- - 1,. - 1

м

У * - . + 1 ку''

■и I ст фт

_т = 1

м

т = 1

1 М ( 3 У 1.- 1 3 + 1 кУ' - 4 (-. -У - ст фИ

= 1 I ( 0И Фт

А т = 1 (

Тогда из формул (26) и (39)

(39)

¿7

йт

Уку- - 1

З/ (х - - 1, и-- - 1, -ку - 1 ) +

Зи

к -1

+ З/ ( хку - 1, ику- - 1, ? - - 1 )

Зик

рк

м

* I ( ст фт т = 1

. + 1 кУ . ст фт

у = 1, ..., X - 1.

(40)

Формулы (38) и (40) определяют компоненты градиента функционала (31) задачи (11), (12), (37), (31).

3. РЕЗУЛЬТАТЫ ЧИСЛЕННЫХ ЭКСПЕРИМЕНТОВ

Задача 1. Применим предложенный подход к решению тестовой задачи нелинейного оптимального управления на отрезке ? е [0, 3п/4] [16]:

х 1 = х2,

х1(0) = 1, х2(0) = 1,

х;2 = -и ( ?) х1,

1 < и(?) < 4, / = х1(Т) ^ шт. (41)

Рис. 4. График оптимального управления в задаче 1

Здесь п = 2, т = 1, Т = 3п/4 = 2,356194. Точное решение задачи (рис. 4):

и = |4, 0 < ?<п/4,

[ 1,п/4 < ? < 3 п/4,

* /а _ [соб2?, 0 < ?< п/4, х1 (?) <{

1 [-2бш(?- п/4),п/4 < ?< 3п/4,

_ [-2б1п2?, 0 < ?<п/4, х, (?) ^

2 [-2соб(?- п/4), п/4 < ?< 3п/4,

а минимальное значение функционала /(и *) = -2.

Оптимальное управление в задаче (41) имеет релейный вид с двумя интервалами постоянства, т. е. X = 2. Оптимальное значение вектора (V, т)

(V*, т*) = (V!, v2, т 1) = (4; 1; 0,785392).

Задача (41) решалась на классе кусочно-постоянных управляющих воздействиях. Для аппроксимации дифференциальных уравнений применялась схема метода Эйлера.

В табл. 1 приведены результаты численных экспериментов (М — число итераций). Применялся

Таблица 1

Численные результаты решения задачи 1

N (V0, т0) I0 (V*, т*) I* М

1 (3,200; 1,500; 1,231) -1,31334 (4,000000; 1,000000; 0,789326) -2,05638082 6

2 (2,850; 1,200; 0,522) -1,37611 (4,000000; 1,000000; 0,789323) -2,05638072 6

3 (3,150; 2,430; 0,953) -0,88576 (4,000000; 1,000000; 0,789325) -2,05638083 7

4 (3,540; 1,820; 1,847) -0,46159 (4,000000; 1,000000; 0,789325) -2,05638084 8

5 (2,180; 1,470; 1,368) -1,21106 (4,000000; 1,000000; 0,789329) -2,05638077 4

6 (1,890; 0,750; 2,092) -1,05994 (4,000000; 1,000000; 0,789325) -2,05638084 4

х

Рис. 5. График оптимального управления в задаче 2

женных градиентов с точностью е = 0,001 при различных начальных значениях (у0, т0) управляющего вектора (у, т), шаг Н = 0,05.

Задача 3. Рассмотрим тестовую задачу [18] на отрезке [0, 8]:

x 1 - x2,

X2 - x3, x1(0) - 16, x2(0) - 0, x3(0) - 0, |u(t)| < 1, xX 3 - u,

метод проекции сопряженных градиентов с точностью s = 0,001 при различных начальных значениях (v0, t0) управляющего вектора (v, t), шаг h » 0,01178.

Задача 2. Рассмотрим тестовую задачу [17]:

X 1 = x2, xx2 = u — sinx1, t е (0; 5], x1(0) = 5,

x2(0) = 0, |u(t)| < 1, J = x1 (5) + x2 (5) ^ min.

Здесь n = 2, m = 1, T = 5. Оптимальное управление имеет релейный вид с тремя интервалами постоянства (рис. 5), т. е. L = 3:

u*(t) = 1, t е [0; 0,95); u*(t) = —1, t е [0,95; 4,50);

u *(t) = 1, t е [4,50; 5];

(v*, T*) = (v1, v2, v3, T1, t2 ) = (1; —1; 1; 0,95; 4,50).

В табл. 2 приведены результаты численных экспериментов. Применялся метод проекции сопря-

J = x1 (T) + x2 (T) + x3 (T) ^ min. (42)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Здесь n = 3, m = 1, T = 8. Точное решение задачи:

u *(t) =

-1, 0 < t < 2, 1, 2 < t< 6, -1, 6 < t< 8,

а минимальное значение функционала /(и *) = 0. Оптимальное управление в задаче (42) имеет релейный вид с тремя интервалами постоянства, т. е. Ь = 3. Оптимальное значение вектора (у, т):

(у*, т*) = (у*1, у2, у3 , т1, т2) = (-1, 1, -1, 2, 6).

В табл. 3 и 4 приведены результаты численных экспериментов. Применялся метод проекции сопряженных градиентов с точностью е = 0,001 при различных начальных значениях (у0, т0) управляющего вектора (у, т), шаг Н = 0,04.

Таблица 2

Численные результаты решения задачи 2

N (v0, т0) I0 (v*, т*) i* М

1 (0,78; 3,46; 0,7; -0,6; 0,5) 32,38 (0,950; 4,511; 1,0; -1,0; 1,0) 11,6681 24

2 (0,78; 3,46; 2; -2; 0,5) 9,15 (0,950; 4,501; 1,0; -1,0; 1,0) 11,6686 19

3 (0,52; 2,73; 0,8; -0,8; 0,4) 44,39 (0,950; 4,528; 1,0; -1,0; 1,0) 11,6699 40

4 (0,28; 3,26; 0,26; -0,4; 0,32) 42,78 (0,950; 4,512; 1,0; -1,0; 1,0) 11,6681 22

Таблица 3

Начальные значения в задаче 3

N (v0, т0) i0

1 (-0,530; 0,760; -0,700; 0,382; 6,321) 4435,0140

2 (-0,600; 0,500; -0,800; 0,782; 4,647) 655,9553

3 (-0,300; 0,780; -0,550; 1,191; 3,463) 703,9213

4 (-0,840; 0,710; -0,670; 1,665; 6,742) 100,1715

5 (0,100; 0,640; -0,410; 2,357; 5,745) 1554,4936

6 (0,260; -0,400; 0,320; 3,281; 7,069) 713,2167

Таблица 4

Результаты численных экспериментов показывают возможность получения с достаточно высокой точностью решения задач управления, в которых сами оптимальные управления являются релейными, кусочно-постоянными. Это, прежде всего, обусловлено использованием полученных формул для компонент градиента функционала по временам переключения кусочно-постоянных параметров управления. С другой стороны, приводимые формулы позволяют применить для решения задач управления богатый арсенал стандартного программного обеспечения решения задач конечномерной оптимизации.

ЗАКЛЮЧЕНИЕ

Получены аналитические формулы для градиента целевого функционала в задаче оптимального управления при кусочно-постоянных, кусочно-линейных и кусочно-заданных на классе функций управляющих воздействиях с оптимизируемыми временами переключений. Полученные формулы для градиента целевого функционала позволяют применять методы оптимизации первого порядка для численного решения задач оптимального управления.

Учитывая техническую простоту реализации управляющих воздействий из рассмотренных классов функций, результаты данной работы могут найти применение при разработке математического обеспечения систем автоматизированного и автоматического управления технологическими процессами различного назначения.

ЛИТЕРАТУРА

1. The Control Handbook: Control System Advanced Methods / Ed. W.S. Levine. — Boca-Raton; London; New York: CRC Press, 2010. — 942 p.

2. Li R., Teo K.L, Wong K.H., Duan G.R. Control parameterization enhancing transform for optimal control of switched systems // Mathematical and Computer Modelling. — 2006. — Vol. 43, N 1112. — P. 1393—1403.

3. Табак Д., Куо Б. Оптимальное управление и математическое программирование. М.: Наука, 1975. — 280 с.

4. Рыжиков И.С., Семенкин Е.С. Система нахождения релейного программного управления для динамических объектов // Программные продукты и системы. — 2013. — № 1. — С. 167—171.

5. Квитко А.Н., Якушева Д.Б. Алгоритм построения кусочно-постоянного синтезирующего управления при решении граничной задачи для нелинейной стационарной системы // Вестник ВГУ. Сер.: Физика. Математика. — 2012. № 1. — C. 138—145.

6. Болдырев В.И. Метод кусочно-линейной аппроксимации для решения задач оптимального управления // Дифференциальные уравнения и процессы управления. — 2004. — № 1. — С. 28—123.

7. Моисеев А.А. Оптимальное управление при дискретных управляющих воздействиях // Автоматика и телемеханика. — 1991. — № 9. — С. 123—132.

8. Айда-заде К.Р., Кулиев С.З. Об одной задаче синтеза управления для нелинейных систем // Автоматика и вычислительная техника. — 2005. — Т. 39, № 1. — С. 15—23.

9. Фесько О.В. Алгоритм поиска кусочно-линейного управления с нефиксированными моментами переключений // Вестник Бурятского гос. ун-та. Матем. и информатика. — 2011. — № 9. — C. 52—56.

10. Айда-заде К.Р., Рагимов А.Б. О решении задач оптимального управления на классе кусочно-постоянных функций // Автоматика и вычислительная техника. — 2007. — Т. 41, № 1. — С. 27—36.

11. Айда-заде К.Р., Евтушенко Ю.Г. Быстрое автоматическое дифференцирование на ЭВМ // Математическое моделирование. — 1989. — Т. 1, № 1. — С. 120—131.

12. Айда-заде К.Р. Исследование и численное решение конечно-разностных аппроксимаций задач управления распределенными системами // Журнал вычислительной математики и математической физики. — 1989. — Т. 29, № 3. — С. 346—354.

13. Евтушенко Ю.Г. Оптимизация и быстрое автоматическое дифференцирование. — М.: ВЦ РАН, 2013. — 144 с.

14. Айда-заде К.Р, Евтушенко ЮГ, Талыбов СГ. Численные схемы решения задачи оптимального управления объектами с распределенными параметрами // Изв. АН АзССР. Сер. физ.-техн. и матем. наук. — 1985. — № 6. — С. 106—112.

15. Айда-заде К.Р., Талыбов С.Г. О согласовании схем конечномерной аппроксимации краевых задач в оптимальном управлении // Изв. АН АР. Сер физ.-техн. и матем. наук. — 1998. — № 6.

16. Практикум по численным методам в задачах оптимального управления / В.В. Александров, Н.С. Бахвалов, К.Г. Григорьев и др. — М.: Изд-во МГУ, 1988. — 80 с.

17. Васильев О.В., Тятюшкин А.И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Журнал вычислительной математики и математической физики. — 1981. — Т. 21, № 6. — С. 1376—1384.

18. Федоренко Р.П. Приближенное решение задач оптимального управления. — М.: Наука, 1978. — 486 с.

Статья представлена к публикации членом редколлегии

В.Н. Афанасьевым.

Рагимов Анар Бейбала оглы — канд. физ.-мат. наук,

вед. науч. сотрудник, Институт систем управления

(кибернетики) НАН Азербайджана, г. Баку;

Институт Френеля, г. Марсель, Франция,

И [email protected], [email protected].

Численные результаты решения задачи 3

N (v*, т*) I* М

1 (- -0,99866; 0,99820; -1,00000; 0,0000057 87

2,00052; 6,00382)

2 (- -1,00000; 0,99998; -1,00000; 0,0000007 70

2,00002; 6,00011)

3 (- -1,00000; 1,00000; -0,99956; 0,0000001 95

1,99997; 5,99966)

4 (- -0,99991; 0,99164; -0,99999; 0,0000523 93

1,99331; 6,01179)

5 (- -1,00000; 0,99998; -0,99895; 0,0000036 55

2,00002; 5,99977)

6 ( -0,99997; 1,00000; -0,99972; 0,0000429 90

2,00031; 6,00196)

i Надоели баннеры? Вы всегда можете отключить рекламу.