ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012 Управление, вычислительная техника и информатика № 2(19)
УДК 519.6, 517.977.5
А.Б. Рагимов ОБ ОДНОМ ПОДХОДЕ К РЕШЕНИЮ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НА КЛАССАХ КУСОЧНО-ПОСТОЯННЫХ, КУСОЧНО-ЛИНЕЙНЫХ И КУСОЧНО-ЗАДАННЫХ ФУНКЦИЙ1
Предложен численный метод решения задач оптимального управления объектами, описываемыми системой обыкновенных дифференциальных уравнений на классах кусочно-постоянных, кусочно-линейных и кусочнозаданных управлений. Получены аналитические формулы градиента функционала, которые позволяют для численного решения задач использовать эффективные методы оптимизации первого порядка.
Ключевые слова: задача управления, градиент функционала, принцип максимума, кусочно-постоянное управление, интервал постоянства управления.
При управлении многими реальными процессами осуществление частых изменений значений управляющих воздействий либо связано с большими трудностями реализации, либо вообще невозможно. Поэтому с практической точки зрения возникает необходимость исследования задач оптимального управления на заданных классах, например на классах кусочно-постоянных, кусочно-линейных и др. управляющих воздействий. В статье исследуются нелинейные задачи оптимального управления процессами, описываемыми системами обыкновенных дифференциальных уравнений. В рассматриваемых задачах управление принадлежит классам кусочно-постоянных, кусочно-линейных и кусочно-заданных управляющих функций; оптимизируемыми являются кусочно-постоянные значения коэффициентов, участвующих в выражении управлений и оптимизируются сами интервалы постоянства этих коэффициентов. Важным в рассматриваемых задачах является также то, что границы интервалов постоянства коэффициентов неизвестны и оптимизируются. Предложен метод численного определения оптимальных кусочно-постоянных значений коэффициентов, участвующих в выражении управлений, и интервалов постоянства этих коэффициентов, основанный на методах конечномерной оптимизации первого порядка и полученных формулах градиента функционала по оптимизируемым параметрам.
Отметим, что различные другие аспекты оптимального управления на классе кусочно-постоянных функций исследовались многими авторами [1-6]. В частности, в [3] для решения линейно-квадратичной задачи управления на классе кусочно-постоянных управляющих функций с оптимизируемыми временами их переключения использована фундаментальная матрица решений. В [5] получены условия оптимальности для случая, когда управления принимают значения из заданного множества с конечным числом значений. В [6] предложен подход к синтезу зональных кусочно-постоянных управляющих воздействий. Исследования данной работы отличаются от многих других подходов, использующих дискретизацию непрерывной задачи оптимального управления, в которых управляющие
1 Работа выполнена при финансовой поддержке Фонда развития науки при Президенте Азербайджанской Республики (проект NEIF-2010-1(1)-40/11).
воздействия естественно становятся кусочно-постоянными и ставится целью аппроксимировать оптимальное управление.
1. Постановка задачи
Рассматривается задача оптимального управления объектами, описываемыми системой обыкновенных в общем случае нелинейных дифференциальных уравнений. Пусть состояние управляемого объекта описывается следующей задачей Коши:
x(t) = f (x,u, t), t e (0, T], x(0) = x0, (1)
где x = x(t) e En, t e [0,7 - фазовое состояние объекта; u = u(t) e Er, t e [0,7 - управление; вектор-функцияf=(f1, f2,..., fn) вместе с частными производными непрерывны по (x,u). Момент времени T и начальная точка x0 е Еп заданы. Рассмотрены три типа задач в зависимости от наложения на управление различных условий.
1.1. Управления из класса кусочно-постоянных функций
Управление u=u(t) e Er, t e [0,T] является постоянным [7] на каждом полуинтервале [х,-1,ху), j=1,...,L, полученном разбиением отрезка [0, 7] (L-1) оптимизируемой точкой Ту, j=1,.,L-1, то есть
U (t) = Vj = const, t € [t j- , Tj ) , Vj € Er,
T j - -T j ’ j = 1’-’ L ’ T0 = ° TL = T , ()
а значения управления vye Er, j=1,...,L, принадлежат некоторому множеству U, в частности следующему параллелепипеду:
U = (v: v = (v1;..., vL), a j < Vj <P j, Vj, a j, P j e Er, j = 1,..., L}. (4)
Задача заключается в нахождении кусочно-постоянных значений управления u(t), то есть значений конечномерных векторов VjeEr, j=1,...,L, и границ интервалов постоянства этих значений, определяемых вектором t=(t1,.,tl-1), при которых заданный функционал
T
J (u) = J (v, т) = | f0 (x, u, t) dt + Ф (x (T)) (5)
0
при условиях (1) - (4) принимает минимальное значение, (v,t) e EL(r+1)-1. Предполагается, что заданные функции f0 и Ф непрерывны вместе с частными производными по своим аргументам и число интервалов постоянства управлений L задано.
1.2. Управления из класса кусочно-линейных функций
Управление u=u(t) e Er, t e [0,7] является линейной функцией на каждом полуинтервале [Т/мТу), j=1,...,L, полученном разбиением отрезка [0,T] (L-1) оптимизируемыми точками Ту, j=1,.,L-1, то есть
u(t) = С (t-Xj_x) + cJ2, t е[т7._ 1,тj), c{,c2 e Er, (6)
а допустимые значения управления принадлежат некоторому множеству U, в частности следующему параллелепипеду:
U = {u :и = u(t), a< u(t) < P, a,Pe Er, t e [0,T]}. (7)
1 Т 1100 т т
Если обозначить С=(С )= (с,с2,с1,с2с ,с2), тогда ясно, что функционал
(5) будет зависеть от параметров С и т:
т
J(и) = 3 (С, т) = |/0 (х,и,г) (г + Ф(х(Т)). (8)
0
Задача заключается в нахождении при условии (1), (6), (3), (7) таких векторов С = (С1,., С) и т = (ть...,т1_1), при которых заданный функционал (8) принимает минимальное значение.
1.3. Управления из класса кусочно-заданных функций
Управление и=и(г) е Ег, г е [0,7] определяется заданными базисными функциями фи(г-ту-1), да=1,...,М, ге [т^т,), с неизвестными оптимизируемыми постоянными коэффициентами С'= (е{с]м), 7=1,..,Д на каждом полуинтервале [т^т,-), 7=1,...,¿, полученном разбиением отрезка [0,7] (¿-1) оптимизируемой точкой т,, 7=1,.,¿-1, то есть
м
и (1) = Е Ст Ф т (-VI ) ) е[Т7-1 > Т7 ) Сш € Е' > т = 1’-’ М (9)
т=1
а допустимые значения управлений принадлежат некоторому множеству и, в частности параллелепипеду (7).
Задача заключается в нахождении векторов
С=(С ,.,С)= (С] См >•••> С] См ) и т=(т1,.,т1-1)
при условии (1), (9), (3) (7), при которых заданный функционал (8) принимает минимальное значение. Предполагается, что заданные функции фт(г-т,-1), да=1,...,М, г е [т^т,), вместе с частными производными по (х,и) непрерывны.
Таким образом, в зависимости от выбора управления в форме (2), (6) или (9), будем рассматривать три типа задач оптимального управления: 1) (1) - (5); 2) (1),
(6), (3), (7), (8); 3) (1), (9), (3) (7), (8).
2. Численное решение дискретизированной задачи
Для численного решения поставленных выше трех задач используем схему, предложенную в [8, 9]. Для этого на отрезке [0,7] введем равномерную сеточную область
П = {{. : {. = ¡И, I = 0,...,N, к = Т/Ы}.
Здесь N - заданное натуральное число. Не умаляя общности, для простоты расчетных формул систему (1) аппроксимируем явной схемой Эйлера:
Х+1 = X + Н/ (х, и;, г;), г = 0,..., N -1, х0 = х0. (10)
Рассмотрим каждую задачу по отдельности.
2.1. Определение управления по формулам (2)
Во введенной сеточной области аппроксимируем значение управления и = и(г) е Ег, ге [0,7], следующим образом:
и Ь. [4)фу-1,т/). j=1.-.
и !(( (+1 -т)+у/ (^))Л’ те
г=0,...,#-1. (11)
\11 ¿1+1). j'=1>-> ^-1,
Интеграл, участвующий в выражении функционала (5), аппроксимируем методом прямоугольников:
I (у т) = ф (хм) + к £ f0 (х, иг, )
^ Ш1П
V,!
(12)
В результате получим конечномерную задачу математического программирования (10) - (12) с учетом условий (3), (4).
Из (11) видно, что если момент времени переключения управления Ту находится между узловыми точками ?,, гг+1, то значение управления щ аппроксимируется линейной комбинацией значений у у, Уу+1.
Для решения задачи (10) - (12), то есть для определения оптимальных значений векторов у и т, используем численные методы конечномерной оптимизации первого порядка, в частности итерационный метод проекции градиента функционала в пространстве оптимизируемых параметров (у,т):
(/+1,тк+1) = Р(з);(4)[(Vк,тк)-а(д/ (Vк,тк)/Эу,5/(/,тк)/дт)], ] = 0,1,..., (13)
где Р(з),(4) - оператор проектирования вектора (у,т) на допустимую область параметров, определяемую ограничениями (3), (4); (ус,т°) - некоторое заданное начальное приближение для оптимизируемых параметров; векторы
с11 (V,т)/Су = (С7/а?у)т, (,т)/Ст = (С7/Ст С//Ст^), (14)
определяют градиент функционала задачи (10) - (12), формулы для компонент которого будет получены ниже; Т - знак транспонирования.
Введем векторы импульсных переменных [7-9]:
Р1 = С/ (V,т)/СХг-, р е Е”, г = 0,...,N . (15)
Здесь производная понимается как полная, с учетом взаимозависимости значений х,, г=0,...Д, из (10). Отсюда с учетом (10) следует
ді дх+
д хі д хі
д/0 (х, ,иі ,гі'
д х,
Рм =
Е+к
д/ Т (х, ,иі ,гі'
д х,
5/ ЭФ (хм)
д хЛ
д хЛ
Р+і, і=N-1,...,0, (16)
(17)
где Е - п-мерная единичная матрица. Систему (16), (17) назовем сопряженной системой.
Предположим, что момент переключения Ту находится между узловыми точками _1 и tk, , то есть Ту е Г/. /. ), 7=1,.,¿-1. Тогда компоненты градиента
с1Шуу, 7=1,.,Д определяются следующим образом:
Сї д1 у — =
Су, ду, р_к дV,• Р
7-1
д/0 (-1.«-1. ір-1)дИр-1 + д/т (-1,«-1,-1) д«-1 р
-Р Р
ди
дУу
д Vу
7 =1,..., =, (18)
а частные производные Эщ/Эуу, ^=ку_1-1,.,ку-1,7=1,.,¿, находятся из соотношения (11):
г=0
к
я = к,к-2, (+1 -ту_1) > я = ку_1 - 1
(- ^ )/Л, . = к] -1.
Для компонент градиента ^//Уту, у=1,.. .,£-1, имеем
дир д V,
д хк
д/
д хку ди ку-1
dт.• дт.• дт .• у дт .• дык ,
у у У У к / 1
дтЛу =
дм
= И-
к,-1
дт
/ (Хку-1 ’ Мку-1, 4у-1 ) д/ (Хку-1 ’ Мку-1, ^ку -1 ) дмку-1 дмку-1
Р,
У=1,..^. (19)
Частные производные 5ик,_1 /дту, у=1,...,£-1, определяются непосредственно из соотношения (11):
дикг\/дту = [У] -)/Ь> У = 1,->1 -!• Тогда из (19), (20) для у=1,...,£-1 получаем, что
а т j
/ (хк]-1 ,ику-1 Уку -1) д/ (хку -1 ,ику -1 Уку-1)
дику-1 5«ку-1
(20)
Формулы (18), (21) определяют компоненты градиента (14) функционала задачи (10) - (12). Реализация итерационного процесса (13) заключается в проведении следующих этапов:
1) при текущих значениях вектора (ук,тк)еЕ21-1 из формул (10), (11) определяется решение аппроксимированной задачи Коши х;е£", г=0,.. .Д;
2) из формул (16), (17) определяются векторы импульсов реЕ" в обратном порядке, начиная с /=¥, до г=0;
3) из формул (18), (21) определяются компоненты вектора градиента (14);
4) выполняется процедура (13) с выбором а из условия одномерной минимизации функционала (12) (учитывая «простоту» допустимой области параметров (3), (4) операция проектирования Р(3),(4) не представляет сложности), определяется новое приближение (/+1/+1). В случае невыполнения условия оптимальности или останова итерационного процесса повторяются этапы 1) - 4).
2.2. Определение управления по формулам (6)
Во введенной сеточной области аппроксимируем значение управления м=м(?)еЕг, ге[0,7] и функционал (8) следующим образом:
С/ (Ь -Ту-1 ) + с2 » к' » ) <=[ту'-1 » Ту ) » У =1»-» 1»
\ [(+1 -Ту ) +1 ( -Ту) + с2+1)+ / = 0,..., N -1, (22)
+ ( - ) )( ( - Т у-1 ) + с2 )] » ТУ е »(1+1) » У = 1»...»1 - 1»
I(С,т) = ф(хм) + к£ /0 (х,и;,)^ шп .
• г\ С ,т
(23)
Из (22) видно, что если момент времени переключения управления ту находится
между узловыми точками 4 ti+1, то значение управления мг- аппроксимируется линейной комбинацией значений (cj (гГТу_і)+ c{), (cj+1 (гг+і-Ту)+ cl,+1).
Итак, аппроксимируя задачу (1), (6), (3), (7), (8), в результате получим конечномерную задачу математического программирования (10), (22), (23) с учетом условий (3), (7).
Для решения задачи (10), (22), (23), то есть для определения оптимальных зна-
.->/1122 L Ь\
чений векторов C= (c1, c2, c1 , c2,..., c1 , c2 ) и t, используем итерационный метод проекции градиента функционала в пространстве оптимизируемых параметров (C,t):
(Ck+1, xk+1) = P( з)>(7) [(Ck, Tk)-a (dl (Ck, Tk )/dC, dl (Ck, Tk )/dx )], * = 0,1,..., (24)
где P(3),(7) - оператор проектирования вектора (C,t) на допустимую область параметров, определяемую ограничениями (3), (7); (C°,t°) - некоторое заданное начальное приближение для оптимизируемых параметров; векторы
dl/dт = (dl/dij,...,dl/dtl-1 )t ,
dl/dC = (d//dcj,dl/dc\,dl/ dcj,...,dl/ dcj ,dl/dci;) (25)
определяют градиент функционала (23).
После введения вектора импульсных переменных (15), определяемого из системы (16), (17), получим формулы градиента (25). Предположим, что момент переключения Ту находится между узловыми точками tk, — и tk,, то есть
Тує [tk,_1;tk,), 7=1,—,L-1. Тогда компоненты градиента dI/dc}m, m=1,2, j=1,...,L, определяются следующим образом:
dI _ + V dxs p _ h V df (xJ-1 ’-i) )us-i
dcL dcL _! scm s ,
kj-1
dus-1
cfcl,
+h £
df * (xs-1> us-1 , *s-1 )u
s-1
dus-1
del
-Ps
s=k
j -1
df 0 (xs-1 , us-1> ts-1 )dus-1 , df * (xs-1 , us-1 , *s-1 ) dus-1 „
dej s
dus-1 del dus-1
j _ 1,...,L, m _ 1,2, (26)
а частные производные ди/д cm, s=k/_i-1,...,k/-1, j=1,...,L, m=1,2, определяются из соотношения (22):
5м, d c(
t, -T
s ky-i ,•••, kj 2,
1 )2/h, s = ky_ -1,
(- t, )( -Ty_1 )/h, s = ky -1
+1 T y
1, s = kjkj -2,
(s+i -T j_i), s = kj_i -1,
(Tj -1)h, s = kj -1
k
s=kj -1
Для компонент градиента 7=1,...,£-1, получим соотношение (19). Част-
ные производные дык, _1 /5т,-, 7=1,...,£-1, участвующие в (19), определяются непосредственно из соотношения (22):
д«ь-і 1
дт;
h
[2с/+ ( - tkj ) + с{ (-1 - т j-і) - с/+1 + с2 ].
(27)
Если учесть (27) в (19), для dl/dTy, 7=1,.,L-1, получаем, что
dl
d т j
df 0 (xkj-i>ukj-i>-і) df * (Xt,-i>ukj-і>tt,-і)
duk
duk
-Pk j
x [2cj+1 (Tj - tkj ) + cj (-і - Tj-1) - +1 + ]> ] = 1 .»>
(28)
Формулы (26), (28) определяют компоненты градиента функционала (23) задачи (10), (22), (23).
2.3. Определение управления по формулам (9)
Во введенной сеточной области аппроксимируем значение управления и=и(г) е Ег, ге [0,7], следующим образом:
м
Z el ФІ 1 ’ [*t ,1м) C[Tj-1>Tj )’ j _1>->1
m=1 1
M
(-Tj) e^m^+(ч. )z em Фі1
m=1 m=1
i _ 0,..., N-1,
M
(29)
где ф^ =фи(ггТ/-і), m=1,.,M, i=0,.,N-1, 7=0,.,L-1.
Итак, аппроксимируя задачу (1), (9), (3) (7), (8), в результате получим конечномерную задачу математического программирования (10), (29), (23) с учетом условий (3), (7).
Для определения оптимальных значений векторов С= (cj,..., cMcf,..., cM) и т используем процедуры (24). Здесь векторы
dl/d т = (d//d т,..., dl/d tl-1 )T,
dl/dC = {dljdc\,..., dl/dcM,..., dl/dcf,..., dl/dcM)
определяют градиент функционала задачи (10), (29), (23).
Введем вектор импульсных переменных (15) и предположим, что Ту є [tk, _1; tk,), 7=1,.,L-1. Тогда компоненты градиента dI/dс^,, m=1,.,M,
7=1,.,L, определяются следующим образом:
k
dl dl ^ д xs
—- =—-+ > —- ps =
dcj де1 і д с] s
m m s-kj-\{J cm
df0 Xs-1. «s-1. ^s-1 )d «s-1 , df* Xs-1. «s-1. *s-1 )d «s-L p
s—k
j-1
d«
s-1
deJm
d«s-1
д el
j = 1,...,L, m = 1,...,M,
(30)
x
u_
а частные производные öw/ö , s=k-i-1,-••,&/-!> 7=1,---,L, m=1,...,M, находятся из
соотношения (29):
dus
d cm
s kj-!,•••, kj 2, (+i -tj-і )j"Vh, s=-i-1,
( -1 )mj-7h, s=kj-1
Для компонент градиента ^Шт,-, 7=1,.,¿-1, получим соотношение (19). Частные производные д ык,_1 /дт,, 7=1,.,¿-1, участвующие в (19), определяются непосредственно из соотношения (29):
du
kj—і 1
дт
M
У c 1 rokj—1’1—1 - У c 1+1rokj ’1
/ у m У у m т m
P*j—1’1—1 m
=1 m=1
Тогда из (19), (31) для d//dx,-, y=1,.,L-1, получаем, что
dl d t ,•
f (xk;-1, -1, hj-1) df (xkj-1,ukj-1,^-1 )
duk
d uk
(32)
<t (m (-1,j-1 - 4+^ ’] ), j = 1 ,...L - 1.
Формулы (30), (32) определяют компоненты градиента функционала (23) задачи (10), (29), (23).
Замечание. Ясно, что выбор схемы метода Эйлера для аппроксимации поставленных выше трех задач не имел принципиального значения для предлагаемого подхода. Полученные формулы несложно распространить и на другие схемы дискретизации исходной задачи [8, 9].
3. Результаты численных экспериментов
Задача 1. Применим предложенный подход к решению следующей тестовой задачи нелинейного оптимального управления на отрезке [0,3п/4] [10]:
X = x2, X2 =-u(t)xu x (0) = 1, x2 (0) = 0, 1 - u(t) - 4, J = x (T) ^ min. (33) Здесь n=2, m=1, 7=3л/4=2,356194. Точное решение задачи следующее:
4,0 < t <П, 4
і n ^ 3n
W < t <—,
. 4 4
x* (t) =
cos2t, 0<t<-,
4
„ . ( n] n 3n
-2sin11 — I,— <t<—, l 4/ 4 4
x* (t)=
-2sln2t, 0<t<—,
4
, ( п] п 3n
-2cosl t — I,— <t<—, l 4/ 4 4
а минимальное значение функционала /(м ) = -2. Оптимальное управление в задаче (33) имеет релейный тип с двумя интервалами постоянства, т. е. ¿=2. Оптимальное значение вектора (у,т)
(v*,т*) = (v*,v*,т*) = (4; 1; 0,785392).
В табл. 1 приведены результаты численных экспериментов с использованием метода проекции сопряженных градиентов с точностью е=0,001 при различных начальных значениях (ус,тс) управляющего вектора (у,т), шаг А-0,01178.
X
m
Таблица 1
Численные результаты решения задачи 1
N (vV) Io * * (v ,т) I * Число итер.
1 (3,200; 1,500; 1,231) -1,31334 (4,000000; 1,000000; 0,789326) -2,05638082 6
2 (2,850; 1,200; 0,522) -1,37611 (4,000000; 1,000000; 0,789323) -2,05638072 6
3 (3,150; 2,430; 0,953) -0,88576 (4,000000; 1,000000; 0,789325) -2,05638083 7
4 (3,540; 1,820; 1,847) -0,46159 (4,000000; 1,000000; 0,789325) -2,05638084 8
5 (2,180; 1,470; 1,368) -1,21106 (4,000000; 1,000000; 0,789329) -2,05638077 4
6 (1,890; 0,750; 2,092) -1,05994 (4,000000; 1,000000; 0,789325) -2,05638084 4
Задача 2. Рассмотрим следующую тестовую задачу [11]:
X = x2, X2 = м - sin X, t e (0;5], xl (0) = 5, x2 (0) = 0, |u (t)| < 1,
J = x2 (5) + x2 (5) ^ min.
Здесь n=2, m=1, 7=5. Оптимальное управление в данной задаче имеет релейный тип с тремя интервалами постоянства, т. е. L=3:
u* (t) = 1, t е [0, 0,95); u* (t) = -1, t е [0,95, 4,50); u (t) = 1, t е [4,50, 5];
(v*,т*) = (*,v*,v*,t*,t2) = (1, -1, 1, 0,95, 4,50).
В табл. 2 приведены результаты численных экспериментов с использованием метода проекции сопряженных градиентов с точностью s=0,001 при различных начальных значениях (ус,т°) управляющего вектора (v,t), шаг h=0,05.
Таблица 2
Численные результаты решения задачи 2
N (v0,t0) Io * * (v ,т) I* Число итер.
1 (0,78;3,46;0,7;-0,6;0,5) 32,38 (0,950;4,511;1,0;-1,0;1,0) 11,6681 24
2 (0,78;3,46;2;-2;0,5) 9,15 (0,950;4,501;1,0;-1,0;1,0) 11,6686 19
3 (0,52;2,73;0,8;-0,8;0,4) 44,39 (0,950;4,528;1,0;-1,0;1,0) 11,6699 40
4 (0,28;3,26;0,26;-0,4;0,32) 42,78 (0,950;4,512;1,0;-1,0;1,0) 11,6681 22
Задача 3. Рассмотрим следующую тестовую задачу [12] на отрезке [0,8]:
X = x2, X2 = x3, X3 = u, xl (0) = 16, x2 (0) = 0, x3 (0) = 0, |u (t)| < 1,
J = x2 (T) + x22 (T) + x32 (T) ^ min. (34)
Здесь n=3, m=1, 7=8. Точное решение задачи следующее:
u (t) = -1, t e [0,2); u (t) = 1, t e [2,6); u (t) = -1, t e [6, 8];
а минимальное значение функционала J(m*)=0. Оптимальное управление в задаче (34) имеет релейный тип с тремя интервалами постоянства, т. е. L=3. Оптимальное значение вектора (v,t)
(* * \ / * * * * * \ / її і^/'-Ч
v , Т ) = (V1 , V2, v3 , Ti , x2) = (-1, 1, -1, 2, 6).
В табл. 3 и 4 приведены результаты численных экспериментов с использованием метода проекции сопряженных градиентов с точностью є=0,001 при различных начальных значениях (vc,t°) управляющего вектора (v,t), шаг h=0,04.
Таблица 3
Начальные значения в задаче 3
N (v0,T0) I0
1 (-0,530; 0,760; -0,700; 0,382; 6,321) 4435,0140
2 (-0,600; 0,500; -0,800; 0,782; 4,647) 655,9553
3 (-0,300; 0,780; -0,550; 1,191; 3,463) 703,9213
4 (-0,840; 0,710; -0,670; 1,665; 6,742) 100,1715
5 (0,100; 0,640; -0,410; 2,357; 5,745) 1554,4936
6 (0,260; -0,400; 0,320; 3,281; 7,069) 713,2167
Таблица 4
Численные результаты решения задачи 3
N . * *. (v ,т ) I * Число итер.
1 (-0,99866; 0,99820; -1,00000; 2,00052; 6,00382) 0,0000057 87
2 (-1,00000; 0,99998; -1,00000; 2,00002; 6,00011) 0,0000007 70
3 (-1,00000; 1,00000; -0,99956; 1,99997; 5,99966) 0,0000001 95
4 (-0,99991; 0,99164; -0,99999; 1,99331; 6,01179) 0,0000523 93
5 (-1,00000; 0,99998; -0,99895; 2,00002; 5,99977) 0,0000036 55
6 (-0,99997; 1,00000; -0,99972; 2,00031; 6,00196) 0,0000429 90
Заключение
Получены аналитические формулы для градиента целевого функционала в задаче оптимального управления на классах кусочно-постоянных, кусочнолинейных и кусочно-заданных управлений с оптимизируемыми временами переключений. Полученные формулы для градиента целевого функционала позволяют применять методы оптимизации первого порядка для численного решения задач оптимального управления.
Учитывая существенную техническую простоту реализации кусочнопостоянных, кусочно-линейных и кусочно-заданных управляющих воздействий, результаты данной работы могут найти применение при разработке математического обеспечения систем автоматизированного и автоматического управления технологическими процессами различного назначения.
ЛИТЕРАТУРА
1. Systems and Control Encyclopedia / ed. M.G. Singh. V. 1-8. Pergamon Press, 1987.
2. The Control Handbook / ed. W.S. Levine. CDC Press - IEEE Press, 1996.
3. Табак Д., Куо Б. Оптимальное управление и математическое программирование. М.: Наука, 1975. 280 с.
4. Bryson A.E., Ho Yu-Chi. Applied Optimal Control: Optimization, Estimation, and Control. John Wiley & Sons, 1975. 481 p.
5. Моисеев А.А. Оптимальное управление при дискретных управляющих воздействиях // Автоматика и телемеханика. 1991. № 9. С. 123-132.
6. Айда-заде К.Р., Кулиев С.З. Об одной задаче синтеза управления для нелинейных систем // Автоматика и вычислительная техника. 2005. Т. 39. № 1. С. 15-23.
7. Айда-заде К.Р., Рагимов А.Б. О решении задач оптимального управления на классе кусочно-постоянных функций // Автоматика и вычислительная техника. 2007. Т. 41. № 1. С. 27-36.
8. Айда-заде К.Р., Евтушенко Ю.Г. Быстрое автоматическое дифференцирование на ЭВМ // Математическое моделирование. 1989. Т. 1. № 1. С. 120-131.
9. Айда-заде К.Р. Исследование и численное решение конечно-разностных аппроксимаций задач управления распределенными системами // Ж. вычис. матем. и мат. физики. 1989. Т. 29. № 3. С. 346-354.
10. Александров В.В., Бахвалов Н.С., Григорьев К.Г. и др. Практикум по численным методам в задачах оптимального управления. М.: Изд-во Моск. ун-та, 1988. 80 с.
11. Васильев О.В., Тятюшкин А.И. Об одном методе решения задач оптимального управления, основанном на принципе максимума // Ж. вычис. матем. и мат. физики. 1981. Т. 21. № 6. С. 1376-1384.
12. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978. 486 с.
Рагимое Анар Бейбала
Институт Френель (Марсель, Франция)
Институт кибернетики НАН Азербайджана
E-mail: [email protected], [email protected] Поступила в редакцию 16 декабря 2011 г.
Rahimov Anar B. (Fresnel Institute - Cybernetics Institute of ANAS. Marseille, France). On an approach to solution to optimal control problems on the classes of piecewise constant, piecewise linear, and piecewise given functions.
Keywords: control problem, gradient of functional, maximum principle, piecewise constant control, constancy interval of control.
Optimal control problems for objects described by an ordinary differential equations system on the classes of piecewise constant, piecewise linear, and piecewise given control functions are considered in the paper. Three types of problems are investigated, that depend on the various conditions imposed of controls: 1) controls belong to a class of piecewise constant functions: u(t) = vj = const, t e [TJ-ijTj), Vj e E, j=1,...,L; 2) controls belong to a class of piecewise linear functions: u(t) = cj (t-Tj_i)+ c2 , t e [Tj_ijTj), cj,cj e E, j=1,...,L; 3) controls belong to a class of
M
piecewise given functions: u(t) = ^ cJm Фт (t -t j-1), t e [Tj_1Tj), cJm e Er, m = 1,.,M, j=1,...,L.
m=1
Piecewise constant values of the coefficients participating in the expression of controls and, what is more important, the boundaries of constancy intervals of these values are optimized. The necessary optimality conditions and formulas for the functional gradient in the space of the optimized parameters that allow us to use numerical methods of first order finite dimensional optimization for solving the optimal control problem are obtained in this paper. Results of numerical experiments are given.