Управление, вычислительная техника и информатика
УДК 62-50
РЕШЕНИЕ ЛИНЕЙНОЙ ЗАДАЧИ ОПТИМАЛЬНОГО БЫСТРОДЕЙСТВИЯ В ОБЛАСТИ ДИФФЕРЕНЦИАЛЬНЫХ ПРЕОБРАЗОВАНИЙ ПУХОВА
А.Г. Аветисян, С.О. Симонян, Д.А. Казарян
Государственный инженерный университет Армении (Политехник), г. Ереван E-mail: [email protected]; [email protected]; [email protected]
Показана возможность решения задач оптимального быстродействия на основе новейшего операторного метода дифференциальных преобразовании Пухова. С помощью дифференциальных преобразований динамическая задача сводится к эквивалентной ей задаче нелинейного программирования, сравнительно легко поддающейся к решению. Рассмотрен модельный пример и показана эффективность предложенного подхода.
Ключевые слова:
Оптимальное быстродействие, принцип максимума, многоточечные краевые задачи, дифференциальные преобразования.
Key words:
Optimal speed, principle of maximum, multipoint boundary problems, differential conversions.
Введение. Рассмотрим следующую задачу линейного быстродействия [1-4]
т
I = \ldt =T ^ min, (1)
о U(t)
X (t) = AX (t) + BU (t), (2)
X(0) = ?, X(T) = ?, (3)
\uk (t )| < 1 , k = 1, r, (4)
где (1) - критерий качества, (2) - система уравнений движения, (3) - краевые условия (заметим, что на каждом краю фазовых траекторий должна быть задана хотя бы одна координата, в противном случае задача быстродействия лишается смысла), (4) -амплитудные ограничения, наложенные на управляющие переменные, A - матрица переменных состояния (матрица системы), X(t)=(x1(t), x2(t),...,xn(t))T - «-мерный вектор переменных состояния, U(t)=(u1(t), u2(t),...,ur(t))T - r-мерный вектор управляющих переменных (r<n), T - время перехода.
С целью получения обобщенной математической модели задачи можно допустить, что как на левом, так и на правом концах фазовых траекторий
все координаты переменных состояния неизвестны. Затем, подставив известные (заданные) краевые условия в эту математическую модель, получим эквивалентную к исходной задачу с соответствующими неизвестными краевыми условиями.
Пусть система полностью управляема и собственные числа матрицы А действительны (отрицательные и/или нулевые). Для решения задачи воспользуемся принципом максимума Понтрягина (или теоремой Фельдбаума). Известно, что при этом, кроме известного затруднения по определению вектора начальных значений сопряженных переменных Т(0) (относительно которых принцип максимума никакой регулярной информации не несет), добавляются и дополнительные, так называемые условия трансверсальности на левом и на правом концах фазовых траекторий, соответствующие неизвестным переменным состояния, что еще больше усугубляет затруднения, связанные с определением векторной функции оптимального управления Ц,р1(0.
С целью исключения отмеченных затруднений в настоящей работе в качестве основного математического аппарата используются дифференциальные преобразования Г.Е. Пухова [5], в частности, дифференциально-тейлоровские преобразования
X (K) =
Нк дKx(t)
K!
д»к
I»=к
K = 0, да х(») = ^
» - »V
н
X (к),
(здесь Х(К) - изображение оригинала х(() (вектор целочисленного аргумента К=0,да (номера дискрет)), Н - масштабный коэффициент, введенный с целью выравнивания размерностей векторов дискрет и возможности суммирования слагаемых оригинала Х(0, - центр аппроксимации разложения
Тейлора), которые значительно облегчают решение рассматриваемой задачи.
Математический аппарат. По предлагаемому подходу рассматриваемая задача (1-4) сначала решается как краевая задача (2, 3), с этой целью используя подход, предложенный в работах [6, 7], а затем к полученной трансцендентной и/или нелинейной алгебраической системе добавляются критерий качества (1) и ограничения типа (4). В итоге имеем эквивалентную (1-4) задачу нелинейного программирования (НЛП).
Для решения краевой задачи (2, 3) в области дифференциальных преобразований будем иметь спектральную модель [8—10]
X (К +1) =
Н
К +1
-I £[ А(Р) ■ X(К - Р) + В(Р) и (К - Р)]
1 V р=0
К = 0,1,... ,
(5)
где Х(К)=(х1(К),...,хп(К))т - изображение вектора Х(/)=(х1(0,...,х„(0)Т, А(Р) и В(Р) - соответственно Р-ые матричные дискреты матриц А и В. Заметим, что А(Р=0)=А, А(Р>1)=[0], а также В(Р=0)=В, В(Р>1)=[0], что дает возможность упростить соотношение (5). При этом будем иметь:
н
X (К +1) =-------(А-Х (К) + В-и (К)), К = 0,1,. (6)
К +1
Для рассматриваемого класса задач (согласно теореме Фельдбаума [11]) функция оптимального управления кусочно-постоянна, знакопеременна и для каждой компоненты и() к=1,г вектора иор1(0 количество моментов переключений не может превосходить (п—1). Следовательно на отрезке [0, Т] в общем случае будем иметь г(п-1)+1 подынтервалов знакопостоянства [0, ^], [¡ь /2],..., [/Р, ^Р+1], ..., р=1,г(п -1), и [¡г{п_Х), Т], а количество моментов переключений в общем случае будет равно г(п-1). Имея ввиду также, что на каждом подынтервале времени каждая компонента и() к=1,г вектора иор1(0 постоянна, т. е.
икр (») = икр = (+1 или -1} = ир (0),
ир (К > 1) = 0, к = 1,г, р = 1,г-(п -1) +1,
то окончательно (6) примет вид:
н
X (К +1) = —- (А -X (К) + В - и (К )Ъ(К)),
К +1
К = 0,1,.
где Ъ(К) - так называемая тейлоровская единица [5]), или
X (К +1) = НК+1 - [ Вк+, - X (0) + С К+,(и (0))],
К = 0,1,.
Здесь матрицы-изображения ВК+1, К=0,1,... и векторы-изображения СК+1(Ц(0)), К=0,1,... определяются в соответствии со следующими реккурент-ными соотношениями [9, 10]
Вк+1 = К+1 а-Вк , К = 0,1,...,
Ск+1 (и (0)) =-1- (А-Ск (и (0)) + Ви (К )Ъ( К)),
К +1
К = 0,1,....,
где В0=Епхп - единичная матрица порядка п; С0=(0)пх1 - нулевой вектор-столбец с размерами пх 1.
Для восстановления оригинала Х(0 воспользуемся обратным дифференциально-тейлоровским преобразованием вида
X (») = X (0) + X (1)(» - »и) +
+X (2)(» - »и)2 + ••• + X (К)(» - »и)К =
= X(0) + (В1X(0) + С1)(» - и) +
+(В2 X (0)+с2)(» - о2 + •••+
+(В„X (0) + Ск)(»- »и)к,
»е[0,Т]. (7)
Учитывая, что правый конец траекторий каждой подзадачи является левым концом траекторий последующей подзадачи, то при этом будем иметь для:
• первой подзадачи на интервале времени [0,^]:
X (») = A-X (») + В-и1;
X (0) = (xl0, Х20 , • • •, ХМУ , X (»1) = (^ x21,.,
• /-ой подзадачи на интервале времени /е[/;-1,/;]:
X(») = А-X(») + В-и,.;
X (»,-1) = (Х1,,-1, Х2,,-1, . , Хп ,-1)Т,
X (», ) = (X, , Х2,Хп, )Т ,
• для г(п-1)+1-ой подзадачи на интервале времени И^Т]:
X(») = А-X(») + В - иг-(п-1)+1;
X (»г - (п-1) ) = (Х1,г-(п -1) , Х2/-(п-1), •••, Хп Г-(п-1)) ,
X (Т) = (Х1Т,... ХПТ ).
В соответствии с предложенным в работе [10] подходом для решения задач оптимального управления с незакрепленными правыми условиями, рас-
к =0
смотрим ту же систему уравнений движения в обратном направлении времени перехода, т. е. с конца к началу. Это действие эквивалентно замене пределов интегрирования в функционале качества, что позволяет вместо зависящих от неизвестных переменных в правом конце линейных зависимостей получить гораздо более сильные нелинейные зависимости от тех же неизвестных переменных, что, в свою очередь, позволяет организовать более эффек-тивные-сходящиеся вычислительные процедуры.
Тот же подход применим и в рассматриваемой задаче. Имея в виду наличие взаимнооднозначного соответствия между переменных обоих задач, можно сократить количество переменных одной задачи соответствующей группой переменных другой.
Теперь, более конкретно: наряду с исходной задачей (1-4) рассмотрим и эквивалентную ей следующую задачу
I = -
0 Т
= | Ы» =Т
=Т ^Ш1П,
и (»)
У (») = АУ (») + Ви (»),
У(0) = X(Т) = ?, У(Т) = X(0) = ?, к (»)| < 1 , к = г ,2- г,
\Пк (
В итоге решения прямой задачи получим трансцендентную (алгебраическую) систему конечных уравнений
»р, р = 1,г (п -1); Т;
- Хт (Т) = 0,
кр, к = 1, г, р = 1, г (п -1);
',■0, , =1,п
т = 1, п,
а в итоге решения обратной задачи-аналогичную систему конечных уравнений
(
»р, р = г (п -1) +1,2 х г (п-1); Т;
Л
икр, У^
к = г +1,2 г, р = 1, г (п -1); , = 1,п
- Ут (Т) = 0, т = 1, п,
которые будут выступать в качестве ограничений вида равенств в соответствующей задаче НЛП.
Очевидно, что между переменными прямой и обратной задач имеют место следующие зависимости:
где, очевидно, Т=-Т.
Из этой задачи с обратным переходом (временем) будем иметь для:
• первой подзадачи на интервале времени
[0,^п-1)+1]:
У (») = А-У (») + В-Пг+1;
У(0) = (У10, У20 , •, УИ0)Т, У(»1) = (У11, У21, •, л/,
• у-ой подзадачи на интервале времени [/'■-1,/']:
У(») = А-У(») + В-и;;
У ($1-д =(У1, j-l, У2, j-l,•, Уп 4-1)Т,
У (»1) = (У1,4, У2,4 ,-* Уп, 4 )Т,
• г(п—1)+1—ой подзадачи на интервале времени
^е[^2г(п-1),-]:
У (») = А-У (») + В-и 2(Кя _1)+1);
У (»2г-(п-1) ) (У1,г-(п-1) , У2,г-(п-1) , * ", Уп г-(п-1) ) ,
У (Т) = (Ут ,... У„Т ).
Таким образом, исходную задачу (1)-(4) на интервале времени [0,Т] заменим двумя взаимодополняющими друг друга задачами (точнее, последовательностью стыкующихся друг с другом 2х(г(п-1)+1) двухточечными краевыми задачами), для решения которых будем использовать подход, предложенный в работах [6, 7].
X (0) = У (Т), X (Т) = У (0)
Т = —Т » = —»
1 ^ 11 2 г(п-1)
и1 _ и2( г( и-1)+1) , иг (п-1) _ иг (п-1)+1 •
»г (п-1) »г (п-1)+1,
Ввиду последних соотношений количество неизвестных параметров можно сократить вдвое, исключив одну группу этих параметров. Далее, учитывая теорему Фельдбаума, ограничения типа (4) можно заменить эквивалентными им ограничениями типа равенств ик^—1=0, к=1,г, р=1,г (п-1)+1. Кроме того, полученной системе ограничений можно чобавить и ограничения /р-1-/р<0, р=1,г(п— 1 )+1, /Г(„-1)-Т<0, /0=0, получаемые из вверх направленной последовательности моментов пере-ключений-цепочки 0<11<12<...<1г(п_1)< Т.
Окончательно, будем иметь следующую задачу НЛП:
1 ,Т ,ип*и1 г
Ш1П
1 ...ыг
. р =1,г-(п -1); Т; ыь
к = 1, г, р = 1, г - (п -1); Х,0, , = 1, п
п-1)+1 >Х10 Хп0 ,Х1Г *•>хпТ
Л
- Хт т=0,
ыкр -1 = 0, к = 1,г,р = 1,г-(п-1) +1,
»-1 -» + V = 0, р = 1,г-(п-1), »
( 1) -Т + V2, = 0,
' (п- 1) г ( - 1 1
где ур, ур, р=1,г(п— 1 )+1 - дополнительные неизвестные параметры, также подлежащие определению.
Т
0
Ф
Пример.
Г хх(г) ^ Х2(г )
V *з({)
Т ^ шт,
и (/)
0 1 0 0 0 1 0 0 0
ъ(()
Х2(( ) V ХзУ)
Л
1 0 0 0 1 0 0 0 1
Г ^ щ(Г )
V )
х,(0) = -1, х,(Т) = ?,
^(0) = Х20 = ?, Х2(Т) = 0,
^ Хз(0) = Х30 = ?; Хз(Т) = 0 ;
|ик (0| < 1 , к = 13 .
Очевидно, что А,=0, У/=1,3, а матричные дискреты
А (0) =
В (0) =
0 1 0
0 0 1
0 0 0
“ 1 0 0
0 1 0
0 0 1
А( К > 1) = [0];
В(К > 1) = [0].
Кроме того, для матриц и векторов при промежуточных вычислениях имеем:
“0 1 0“
В, = А(0) =
В2 = 2( А(0)В1 + А(1)) = 2
с1 = В (0)и (0) = Ги2(0)
001 0 0 0 0 0 1 000 0 0 0 Г и.(0)
и 2(0)
V из(0)
В>3 = [0];
С2 =-
2
из(0) 0
Сз =
Г из(0) 0 0
Л
С>4 = (0).
Таким образом, в общем случае для этой задачи будем иметь г(и-1)=6 моментов переключений, г(и-1)+1=7 подзадач и г(г(и-1)+1)=21 составляющих для управляющих переменных. Однако, для конкретной задачи в итоге проведения дополнительного анализа выясняется, что действительное количество моментов переключений не может превосходить значение 3, иными словами имеем 4 подзадачи с 12-ю составляющими переменных.
Прямая задача
(
)
Подзадача 1 Имеем
Хс1(Ч) = х2(Ч ) + и11 ГХ[(0) > (х Г 10
Х2(Ч) = х3(Ч ) + и21 , X(0)0 = Х2(0) = Х20
Хз(Ч) = И31 ; V Хз(0) у ^Х30 У
Г Х1 (¿1) ^ Г Х ^ Л-Ц
X (¿1) = Х2(0 = Х21
V Х3(0 у V Х31У
На подынтервале времени [0, согласно (7)
X (I) = X (0)0 + (ВХ (0)0 + су +
+(В2 X (0)0 + С2)Г2 + (В3 X (0)0 + СзК3 + • • • ,
откуда при t=t1 имеем следующую систему уравнений
X (О = X (0)0 + (В,X (0)0 + С.Х + (В2 X (0)0 + С2К2 +
+ (В3(0)0 + СзК +-----= (Х11> Х21■ Х31)Т
или, в явном виде
Г Х л 10 “0 1 0“ Г Х ^ 10 ' и11 >
Х20 + 0 0 1 Х20 + и21
V Х30 у 0 0 0 V Х30 у V из1 у
0 0 1 0 0 0 0 0 0
(Х ^ 10
V Х30 у
(и А и21
V 0 у
Х
¿12 +■
V 0 У
=
= X (/.) =
Отсюда
Х10 + (Х20 + и11)Ч1 + 2 (Х30 + и21)Ч1 + 6 и31Ч1 Х11 ■
, ч 1 2
Х20 + (Х30 + и21 X + ^ и31Ч1 = Х21 ■
Подзадача 2 Имеем
Хс1(Ч) = х2(Ч )+и12,
Х
Х2Ц) = Хз(ч) + и22, X (0)1 = X (¿1) = Хз(ч) = из2 ;
' Х1 (¿2 ) ^ Г Х ^ 12
X (¿2) = Х2 (^2 ) = Х22
V Х3 (^2 ) у Х V 32 у
На подынтервале времени [^, t2] согласно (7)
о
т
г
г
2
Х11 + (Х21 + и12)({2 - О + 2(Х31 + М22)(^2 - +
1 , ч3
+ Т М32(^2 — ¿1) = Х12 ■
6
12
Х21 + (Х31 + и22 )(^2 — ¿1 ) + "2и32 (^2 — ¿1 ) = Х22 ■
Х31 + и32 (¿2 — ¿1) = Х32 •
Подзадача 3 Имеем
Х1 (/) = х2 (¿) + и13,
Х
12
Х2(0 = Хз(/) + и2з, X (0)2 = X (¿2) =
1 ;^з(/) = изз;
Г Х1Х) ^ Г х ^ •*13
X (¿3) = Х2(?3) = Х23
V Х3(?3) у V Х33 у
На подынтервале времени [^, t3] согласно (7)
Х12 + (Х22 + «13 )& ¿2 ) + ,, (Х32 + и23 )(^3 ¿2 ) +
+ изз (?з ¿2) Х13 ■
Х22 + (Х32 + и23 ¿2 ) + ~ из3 Й ¿2 ) Х23 ■
Х32 + из3 (¿3 ¿2 ) Х33 •
Подзадача 4 Имеем
) = х2(/) + и14,
-Х2(^) = Х3(0 + и24, X(0)3 = X(¿3) =
^(^) = и34 ;
Х
13
Г Х1(Т) > Г х ^ 1Т
X (Т) = Х2(Т ) = Х л- 2Т
V Х3(Т) у Х V 3Т у
На подынтервале времени [^^ согласно (7)
1
-(
2
Х13 + (х23 + и14)(Т — ¿3) +Т (х33 + и24)(Т — ¿3)2 +
+ ^ и34 (Т ¿3) Х1Т ■
6
Х23 + (Х33 + и24)(Т ¿3) + ~ и34 (Т ¿3) Х2Т■
Х33 + и34(Т — ¿3) = Х3Т •
1
— 1 2
Таким образом, учитывая зависимости, полученные на предыдущих подзадачах и исключив промежуточные значения x11, x121, x13; x211, x221, x23; x311, x321, x33 переменных состояния в моментах переключений, окончательно будем иметь:
Х10 + (Х20 + «пХ + (0 Х30 + 0 и21)К + , ЩЛ +
2 2 6
1 2
+(Х20 + (Х30 + и21 X + 2 и31/1 + и12 )(?2 — О +
1 2 1 3
+ Т (Х30 + и3А + и22)(?2 — О + Т и32(?2 — О +
2 6
12
+(Х20 + (Х30 + и21Х + ^и31?1 + (Х30 + ¿1и31 + и22 )(?2 — ) +
1 2 1
+ 2 и32(^2 — ¿1) + U13)(t3 — ¿2) + 2( Х30 + ¿1и31 + (^2 — ¿1 )и32 +
2 1 3 +и23 )(?3 — ¿2) + Т и33(г3 — ¿2) + (Х20 +
6
12
+(Х30 + и21)?1 + 2 и3^1 + (Х30 + ¿1и31 + и22)(2 — ¿1 ) + 12
+ 2 и32(^2 — ¿1 ) + (Х30 + и31к + и32 (^2 — ¿1 ) + и23 )(^ — ¿2 ) +
1 2 1
+ 2 и33(?3 — ¿2) + и14)(Т — ¿3) + 2( Х30 + ¿1и31 + X — ¿1 )и32 +
+(?3 — ¿2 )и33 + и24)(Т — ¿3)2 + Ти34(Т — ¿3)3 — Х1Т = 0;
6
12
Х20 + (Х30 + и21 )^1 + 2и31к + (Х50 + ¿1и31 + и22 )(2 — ¿1 ) +
1 2
+ 2 и32(^2 — ¿1 ) + (Х30 + и31^1 + и32 (^2 — ¿1 ) +
12
+и23 )(?3 — ¿2) + 2и33 X — ¿2 ) + (Х30 + ¿1и31 + и32 X — ¿1 ) + 12
+и33 X — ¿2 ) + и24 )(Т — ¿3 ) + 2и34 (Т — ¿3 ) — Х2Т = 0
Х30 + и31?1 + и32 X — ¿1 ) + и33 X — ¿2 ) + и34 (Т — ¿3 ) — Х5 Т = 0
Обратная задача
(
)
Т ^ шт,
и (/)
'Г М) ^ “ 0 1 0 “ Г >1(/) ^ “ 1 0 0 “ Г иА^)'
•>2 (^) = 0 0 1 У2({ ) + 0 1 0 и5(/)
.1 J:’з(t) у 0 0 0 V >3(() у 0 0 1 V и6({) у
>1(0) = >10 = ? = Х1Т ■ >1(Т) =—1 = Х10>
У2 (0) = 0 = Х2Т ■ >2(Т) = >2Т = ? = Х20 ■
>3(0) = 0 = Х3Т; >3(Т) = >3Т = ? = Х30;
|ик (¿)| < 1, к = 4~6.
Подзадача 1 Имеем
М) = >2^) + и41>
>2({) = >3^) + и51 ■
М) = и61;
0
г
г
4
' У1(0)' ' У10 "
У(0)0 = У2(0) = У20
1 У3(°) VУ30 у
' У1 (/4 ) " (У“ 1
у (/4) = У 2 (/4 ) = У21
V У 3 (/4 ) у V У31 у
На подынтервале времени [0, /4] согласно (7)
' >10 '
1 “ 0 1 0" (У101 (и 1 и41
+ 0 0 1 У 20 + и 51
у 0 0 0 V У30 у Ч и61 у
1
+—
2
У 20
У30 0 0 1
0 0 0
0 0 0
/4 +
(У 1 (и, 1
У10 У 20
Vу30 у
= У (/4) =
V 0 у ( У11 1
У21
V У31 у
и
И61
V 0 у
1 2 1 3
у10 + (у 20 + и41)/4 + Т (Л30 + и51)/4 + Т иб1^4 = >11,
2 6
1 2
У 20 + (У30 + и51)/4 +Т иб1^4 = >21 ,
>30 + иб1/4 = У31-
Подзадача 2 Имеем
й(/) = У2 (/) + У>2 (/) = Уз(/) + и
42’ 52,
У (0)1 = У (/4) =
Имеем
' У1(/) = У 2(/) + и43. < У2(/) = Уз(/) + и53> . М!)=ибз ;
На подынтервале времени t5] согласно (7)
1 2
У11 + (У 21 + и42)(/5 - /4) + 2(У31 + и52)(/5 -14 ) +
13
+ Т иб2(/5 — /4) = У12 ,
6
12
У21 + (У31 + и52 )(/5 — О + ^иб2 (/5 — О = У22 ,
У31 + иб2 (/5 — О = У32 •
Подзадача 3
(У1 (/5) 1 (У12 '
( 0) = ( = У 2 (/5 ) = У 22
V У3 (/5 ) у V У32 у
(Ух(/6) 1 (У131
У (/6) = У2 (/6) = У23
V У3(/6)у VУ33 у
На подынтервале времени ^5, 4] согласно (10)
12
У12 + (У22 + и43 )(/6 - ?5 ) + ^ (У32 + и53 )(/6 - ?5 ) +
13
+ Т иб3 (/6 — /5) = У13 ’
6
12
У22 + (У32 + и53 )(/6 — ^5 ) + 2и63 (/6 — ^5 ) = У23 ’
У32 + и63 (/6 — ^5 ) = У33.
Подзадача 4 Имеем
У1(/) = У 2(/) + и44>
< У2(/) = У3(/) + и 54,
. М) = и64;
(У1(/6) 1 (У13 1
= у (/6) = У 2 (/6 ) = У 23
V У3(/6) у V У33 у
и62 ; (У1(/4) ^ (У111 ' У1(Т) 1 (У1Т ''
У2(/4) = У 21 , у (Т) = У2(Т ) = У 2Т
V У3 (/4 ) у V У31 у Ч У3(Т)у 3У Т
( У1(/5) ^ ( У12 1 На подынтервале времени [^, V] согласно (7)
у (О = У2 (/5 ) = У 22 12
ч У3(/5) у V У32 у У13 + (У23 + и44)(Т - /6) + 2(У33 + и54)(Т - /6 ) +
+ ¿т и64(Т /6) У1Т,
6
12
У23 + (У33 + и54)(Т — /6) + 2и64 0Т — ^6 = У2 Т,
„У33 + и64 (Т — О = У3Т •
Таким образом, учитывая зависимости, полученные на предыдущих подзадачах, и исключив промежуточные значения уи, у12, у13, у21, у22, у23, у31, У32, у33 переменных состояния в моментах переключений, окончательно будем иметь:
1 2 1 3
У10 + (У20 + и41 )/4 + 7 (У30 + и51 )/4 +Ти61^4 +
2 6
+ (У 20 + (У30 + и51 )/4 + 7 и61/42 + и42)(/5 - /4 ) +
12
+ 2 (У30 + и61?4 + и52 )(/5 - 14 ) +
1 3 1 2
+ 7 и62(/5 - /4) + (У20 + (У30 + и51 )/4 + Ти61^4 + 6 2
+ (У30 + и61?4 + и52 )(/5 - О +
1 2 1 + 2 и62(/5 - /4) + и43)(/6 - /5) + 2(У30 + и6114 +
2 1 3
+и62 (/5 - О + и53 )(/6 - {5 ) +7и63 (/6 - {5 ) +
6
+ (У20 + (У30 + и51 )/4 + 7 и61/42 +
+ (У30 + и61?4 + и52)(/5 - /4) + 7и62(/5 - ?4)2 +
1
— 1 2
+ (У30 + и61/4 + и62 (/5 - (4 ) + и53 )(/6 - Ч ) +
1 2 - 1 + 2 и63(/6 - /5) + и44)(Т - /6) + 2(У30 + и61?4 +
+и62(/5 - /4) + и63(/6 - /5) + и54)(Т - ?6)2 +
+6 и64(Т - О3 - У1Т =0;
6
12
У20 + (У30 + и51 )/4 + 7и61?4 + (У30 + и61?4 + и52 )(/5 -14
+ 7 и62(/5 - ?4)2 + (У30 + и61/4 + и62(/5 - 14 ) + и53 )(/6 - 1
+ 7 и63(/6 - ?5)2 + (У30 + и61/4 + и62(/5 - /4) +
Гг
Гг
Г»
(У1Т 1 У 2Т У3Т
(У111 У 21
У31 (и 1
Гг Л
г» ч\
( У131
У 23 у33
(У10 1 (и 1
( X 1 (У12 1
У22
У20
у30 (« 1
У32, (« 1
Vи64 у (и 1 (« 1
и что
/1 = Т - /6, /2 = Т - /5, /3 = Т - /4, Т = -Т, вторую группу переменных уи, У20, У30; У11, У12, У13; У21,
у22, у23; у31, у32, у33; у1Т, у2Т, у3Т и и41, М51, иб1; и42, М52, иб2; М43,
и53, и63; и44, и54, и64 можно заменить переменными первой группы Х10, хм, хм; хи, хп, хв; хя, Х22, Х23; %, Х32,
Х33; X1T, X2T, Х3Т и U11, U21, и31; U12, U22, и32; U13, U23, и33; U14,
и24, u34. В итоге получим следующую систему вида равенств:
1
2 1 2
+и63(/6 -/5) + и54)(Т-/6) + 2и64(Т-О2 -У2Т = 0;
У30 + и61/4 + и62 (/5 - О + и63 (/6 - О +
+и64 (Т - О - У3Т = 0
Отсюда, учитывая однозначные зависимости между двумя группами переменных,
Х1Т +(Х2Т + и14)(/3 - Т) + 7(ХТ + и24)(/3 - Т)2 +
1
—1 6
1
2
+7и34(/3 -Т)3 + (х2Т + (х3Т + и24)(/3 -Т) +
+ 7 и34(/3 - Т)2 + и13)(/2 - /3) +
1 2 1 3
+ 7 (Х3Т + и34(/3 - Т) + и23)(/2 - /3) + 7 и33(/2 - Ч) +
2 6
+(х2Т + (х3Т + и24)(/3 -Т)+ — и34(/3 -Т)2 +
1
2
+(Х3Т + и34(/3 -Т) + и23)(/2 - /3) +
1 2 3 1 + 2 и33(/2 - /3) + и12)(/3 - Т) + 2( Х3Т + и34(/3 - Т) +
2 1 3 +и33 & - /3 ) + и22 )(А - /2 ) +7«32 & - ?2 ) -
6
1 2
-(Х2т + (Х3Т + и24)(/3 - Т) + 2 и34(/3 - Т) +
+ (х3Т + и34(/3 - Т) + и23)(/2 - /3) + ^ и33(/2 - ?3)2 +
+ (Х3Т + и34(/3 - Т) + и33(/2 - /3) + и22)(/1 - /2) +
1 2 1 + 2 и32(/1 - /2) + и11)?1 + 2(Х3Т + и34(/3 - Т) +
2 1 3
+и33(/2 - /3) + и32(/1 - /2) + и21)/1 ^7и31^1 - ^10 = 0’
6
Х2Т + (Х3Т + и24)(/3 - Т) ^7 и34(/3 - Т)2 +
+ (х3Т + и34(/3 - Т) + и23)(/2 - /3) + 2 и33(/2 - ^ + + (Х3Т + и34(/3 - Т) + и33(/2 - /3) + и22)(/1 - /2) + 12 + 2 и32 (/1 - ^2 ) - (Х3Т + и34 (/3 - Т) + и33 (/2 - ^3 ) +
1 2
+и32(/1 - /2) + и21)/1 + 2и31/1 - Х20 = 0’
Х3Т + и34 (/3 - Т) + и33 (/2 - /3) +
+и32(/1 - /2) - и31^1 - Х30 = 0.
Таким образом, учитывая известные координаты х10=-1, х2Т=0, х3Т=0 переменных состояния и равенства, полученные в результате использования прямой и обратной задач, а также ограничения, наложенные на управляющие воздействия, окончательно получим следующую задачу нелинейного программирования
Т ^ шт
^2’ /3, Т, 1, и21,и31’
и12 и22 ’и32 5»1Э и23 и33 и14 и24 и34 ’Х1 Т ’Х20 Х30
-1 + (х20 + и11)/1 + (— Х30 + — и21)/12 + — и31/13 + 2 2 6
12
+(Х20 + (Х30 + и21)/1 + 2и31/1 + и12)(/2 - /1) +
+ Т(Х30 + и31/1 + и22)(/2 - О2 + Т и32(/2 - 11 )3 +
2 6
+(Х20 + (Х30 + и21)/1 + '2 и31/12 +
+(Х30 + /1и31 + и22)(/2 - /1) +
12
+ 2 и32(/2 - /1) + и13 )(/3 - /2) +
12
+ 2(Х30 + /1и31 + (/2 - ?1)и32 + и23)(/3 - /2) +
+ Т и33(/3 - ?2)3 + (Х20 + (Х30 + и21 )/1 + Т и31/12 + 6 2
12
+(Х30 + /1и31 + и22 )(/2 - К) + 2 и32 (/2 - О +
+(Х30 + и31/1 + и32(/2 - /1) + и23)(/3 - /2) +
1
2
+ Т и33(/3 - ?2)2 + и14)(Т - /3) +
+ 2(Х30 + /1и31 + (/2 - К)и32 + (/3 - ?2)и33 +
+и24)(Т - ¿3)2 + - и34(Т - ¿3)3 - Х1Т = 0;
Х20 + (Х30 + и21 )/1 + 2 и31/12 +
1 2
+(Х30 + /1и31 + и22 )(/2 - К) + 2 и32 (/2 - О +
+(Х30 + и31/1 + и32(/2 - /1) + и23)(/3 - /2) +
+ ^ и33(/3 - ?2)2 + (Х30 + /1и31 +
+и32(/2 - /1) + и33(/3 - /2) + и24)(Т - /3) +
+ 2 и34(Т - ?3)2 = 0;
Х30 + и31/1 + и32 (/2 - О +
+и33(/3 - /2) + и34(Т - /3) = 0;
Х1Т + м14(/3 - Т) + тм24(/3 - Т)2 +тм34(/3 - Т)3 +
+ (М24(/3 - Т) +ТМ34(/3 - Т)2 + и13 )(/2 - +
+ Т (и34 (/3 - Т) + М23)(/2 - ?3)2 + 7 М33(/2 - ?3)3 +
+ (М24(/3 - Т) + 2М34(/3 - Т)2 + (М34(/3 - Т) +
1 2
+М23 )(/2 - ^ ) + 2М33 (/2 - ^ ) + М12 )(/1 - /2 ) +
12
+ 2(и34(/3 - Т) + М33(/2 - + М22)(/1 - О +
+ 6 и32(/1 - ?2)3 - (М24(/3 - Т) + "Г и34(/3 - Т )2 + 6 2
+ (М34(/3 - Т) + М23)(/2 - О + ТМ33(/2 - О2 +
+ (и34 (/3 - Т) + и33 (/2 - *3 ) + М22 )(/1 - ^ ) +
1 2 1 + 2 и32 (^1 - + Иц)/1 + 2(и34(/3 - Т) + М33(/2 - О +
2 1 3
+и32(/1 - /2) + м21)/1 — м31/1 +1 = 0;
32 1 2 21 1 6 31 1
и24 (/3 - Т) + -М34 (/3 - Т)2 + (М34 (/3 - Т) + ИИ )(/2 - /3 )
и33(/2 ^3) + (и34(/3 Т) + и33(/2 ^3) + ^22) Х
Х(/1 ^2) + 2 и32 (/1 ^2) (М34 (/3 Т) + и33(/2 Ч) +
12
+и32 (/1 - ^2 ) + и21 )/1 + 2^1 и31 - Х20 _ 0;
М34 (/3 - Т) + и33 (/2 - ?3 ) +
+и32 (/1 - ^2 ) - и31/1 - Х30 _ 0;
и121 -1 = 0, и122 -1 = 0, и123 -1 = 0, и2 - 1 = 0, и^1 -1 = 0, и:22 -1 = 0, и:23 -1 = 0, и^ -1 = 0, и321 -1 = 0, и322 - 1 = 0, и323 - 1 = 0, и324 - 1 = 0;
—/1 + "I7! = 0, íl — Í2 + У2 = 0, Í2 — /3 + У3 = 0, /3 — Т + У4 = 0.
В результате решения этой задачи НЛП для неизвестных значений переменных состояния, моментов переключений и управляющих переменных имеем следующие значения: х20 =-0,07435, х30 =-0,07731, х1Т =-0,92558;
/1 = /2 = /3 = Т = 0,773246;
м11 = 1, и21 = 1, и31 = 1, и12 = 1, и22 =-1, и32 = 1
и13 = 1, и23 =-1, и33 =-1, и14 = 1, м24 =-1, и34 = 1.
При этом, анализируя полученные результаты, будем иметь ^^(0=1, ulopt(t)=1, ulopt(t)=1 U20pt(t)=1, и30р4(/)=1, а переменные состояния:
х1(/ ) =1 /3 + 0,46135/2 + 0,92565 /-1;
1 6
Х2(/) = 1/2 + 0,92269/ -0,07435; х3(/) = /-0,07731.
Резюме. При предложенном в настоящей работе подходе для определения иор() не используются
сопряженные переменные Т(0, ввиду чего исключаются как проблема по определению вектора Т(0), так и проблема по удовлетворению условиям трансверсальности на левом и/или на правом концах фазовых траекторий. Эти обстоятельства намного упрощают решение рассматриваемой задачи, несмотря на увеличение при этом размерности эквивалентной задачи НЛП.
СПИСОК ЛИТЕРАТУРЫ
1. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. - М.: Мир, 1972. - 554 с.
2. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. - М.: Наука, 1983. - 392 с.
3. Симонян С.О. Прикладная теория оптимального управления. - Ереван: ГИУА, 2005. - 180 с. (на армянском языке).
4. Симонян С.О. Основы синтеза специализированных вычислителей динамических задач нелинейного программирования: Автореф. дис. ... д.т.н. - Ереван, 1993. - 47 с.
5. Пухов Г.Е. Дифференциальные спектры и модели. - Киев: Наукова думка, 1990. - 184 с.
6. Симонян С.О., Аветисян А.Г Прямой метод решения линейных многоточечных краевых задач // Известия НАН РА и ГИУА. Сер. Технические науки. - 2002. - Т. 55. - № 1. -С. 95-103.
7. Симонян С.О., Аветисян А.Г., Казарян Д.А. Метод решения линейных многоточечных краевых задач, основанный на диф-ференциально-дирихлеевских преобразованиях // Вестник ИАА. - 2007. - Т. 2. - С. 253-257 (на армянском языке).
8. Симонян С.О., Аветисян А.Г., Казарян Д.А. Метод решения задач оптимального управления, основанный на дифференциальных преобразованиях // Вестник ГИУА. Сер. Моделирование, оптимизация, управление. - 2007. - Т. 2. - Вып. 10. -С. 102-114.
9. Симонян С.О., Аветисян А.Г., Казарян Д.А Решение задач линейного быстродействия с закрепленными краевыми условиями в области дифференциальных преобразований (общий случай) // Радиоэлектроника. Информатика. Управление (Запорожский государственный технический университет). -2009. - Т. 1. - С. 137-144.
10. Казарян Д.А. Об одном методе решения одного класса задач линейного оптимального быстродействия // Вестник-76 Государственного инженерного университета Армении (Политехник). Сб. научных и методических статей, Ереван. - 2009. -Т. 1. - № 1. - С. 491-497 (на армянском языке).
11. Фельдбаум А.А. Основы теории оптимальных автоматических систем. - М.: Наука, 1966. - 623 с.
Поступила 29.06.2009г.
УДК 519.233.22
ОДНОЭТАПНОЕ ПОСЛЕДОВАТЕЛЬНОЕ ОЦЕНИВАНИЕ ПАРАМЕТРОВ НЕЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ С ДИСКРЕТНЫМ ВРЕМЕНЕМ
А.А. Маляренко
Томский государственный университет E-mail: [email protected]
Построена и исследована одноэтапная последовательная процедура оценивания параметров нелинейных регрессионных процессов с дискретным временем. Построенная процедура применена к двумерной модели авторегрессии с дрейфующими параметрами и двумерной модели AR/ARCH.
Ключевые слова:
Оценивание параметров, стохастические системы, процессы авторегрессии, последовательный анализ, асимптотический анализ. Key words:
Parameter estimation, stochastic systems, autoregressive processes, sequential analysis, asymptotic analysis.
Известно, что нелинейные стохастические системы широко используются для описания реальных процессов в экономике, технике, медицине и т. д. Асимптотические методы идентификации, такие, например, как метод максимального правдоподобия, метод наименьших квадратов и др. позволяют находить оценки неизвестных параметров
моделей с известными статистическими свойствами при неограниченном увеличении объема наблюдений. В то же время, последовательный метод оценивания параметров динамических систем позволяет получить оценки с гарантированным качеством в среднеквадратическом смысле за конечное время. Время оценивания определяется моментом