ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2016 Управление, вычислительная техника и информатика № 1 (34)
УДК 681.5.01:62-50 DOI: 10.17223/19988605/34/2
К.С. Ким, В.И. Смагин
ЛОКАЛЬНО-ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДИСКРЕТНЫМИ СИСТЕМАМИ С ЗАПАЗДЫВАНИЕМ В КАНАЛЕ УПРАВЛЕНИЯ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ
О СОСТОЯНИИ И ВОЗМУЩЕНИЯХ
Работа выполнена в рамках государственного заказа Минобрнауки РФ на проведение научных исследований в Национальном исследовательском Томском государственном университете на 2014-2016 годы.
Рассматривается решение задачи управления в условиях неполной информации о состоянии объекта и модели возмущений с учетом запаздывания по управлению. Предполагается, что модель, описывающая возмущение, действующее на объект, содержит неизвестные параметры. Для определения оптимального управления используется метод локально-оптимального слежения, реализованный с использованием алгоритмов калмановской фильтрации и экстраполяции с неизвестным входом.
Ключевые слова: дискретные системы; локальный критерий; запаздывание по управлению; неполная информация.
Локально-оптимальные дискретные системы управления являются частным случаем дискретного прогнозирующего управления (Model predictive control) с прогнозом на один такт. Задачи управления для объектов с запаздываниями в канале управления исследовались в работах [1-7]. В [1-4] рассматривались задачи управления на основе метода расширения пространства состояний. В работах [5-7] изучались задачи синтеза управлений для объектов с запаздыванием в канале управления и с неполной информацией о возмущениях. В [5, 6] эта задача решалась на основе принципов адаптации, при этом в [6] модель объекта задавалась в непрерывном времени. В работе [7] рассматривалась задача синтеза управления в дискретных стохастических системах с использованием методов калмановской фильтрации с учетом оценок неизвестного входа (возмущений).
В настоящей работе решается задача управления в условиях неполной информации о состоянии объекта с запаздыванием по управлению при косвенных наблюдениях за возмущениями. Предполагается, что модель возмущений содержит неопределенные параметры.
1. Постановка задачи
Модель объекта с запаздыванием по управлению описывается дискретным уравнением
x(k +1) = Ax(k) + Bu(k - h) + Fs(k),
x(0) = X0, u(j) = yr(j), j = -h,-h +1,...,(1) где x(k) e Rn - вектор состояния; u(k - h) e Rm - вектор управления; h - количество тактов запаздывания; s(k) e Rn1 - вектор возмущений, y(j) (j = -h,-h +1,...,-1) - заданный вектор; A,B,F - заданные постоянные матрицы. Предполагается, что наблюдению доступен вектор wx (k) e R1 :
Wx (k) = HxX(k) + Tx (k), (2)
где Hx - матрица канала наблюдений, xx (k) - гауссовская случайная последовательность.
Модель возмущений содержит неизвестные переменные параметры и определяется следующим разностным уравнением:
s(k +1) = (R(k) + M(k))s(k) + f (k) + Af (k) + q(k) , s(0) = S0, (3)
где Я(к) - известная матрица, /(к)- известный вектор, АЯ(к) и А/(к) - некоторые неизвестные матрица и вектор, которые можно интерпретировать как ошибки определения параметров модели (3). Модель (3) представим как динамическую модель с неизвестным входом
s(k +1) = Я(к)я (к) + /(к) + г (к) + д(к), 5 (0) = 50, (4)
где г (к) = АЯ(к)я(к) + А/(к) - вектор неизвестного входа.
Косвенные наблюдения за вектором возмущений описываются следующим соотношением:
ш(к) = Ф5 (к) + т(к), (5)
где ю(к) е Я"1 - вектор наблюдений; Ф - т1х«-матрица; т(к) - случайные ошибки наблюдений. В (1) и
(3) х0, 50 - случайные векторы начальных условий, независимые от д(к), т(к) и тх(к) (М{ х0} = х0,
М{( Х0 - Х0)( Х0 - Х0)Т} = Р0, М{ 50} = 50, М{(50 - 50)(50 - 50 )Т} = р0); я(к), т(к), Тх(к) - независимые
гауссовские случайные последовательности с характеристиками:
М{ д(к) } = 0, М{ т(к) } = 0, М{ тх(к) } = 0,
М{ д(к)дт(,)} = ^, М{т(к)т(,)т} = 15,,., М{Тх(к)тх(,)т } = Тх5„,, (6)
5^ - символ Кронекера, Т - символ операции транспонирования.
Требуется построить такое управление, чтобы вектор выхода системы ^(к) е Я"1, ^(к) = Нх(к) отслеживал значение заданного вектора г(к) е Я "1.
2. Синтез локально-оптимального управления
Сначала определим управление, отслеживающее заданный вектор г(к). Предположим, что все компоненты вектора х(к) и 5(к) измеряются точно. Тогда оптимизируемый локальный критерий будет иметь вид
I(к) = М{(м>(к +1) - г(к))т С(м>(к +1) - г(к)) + ит (к - к)Би(к - к)/50к,Х0к}, (7)
где С > 0, В > 0 - весовые матрицы; г(к) - заданный отслеживаемый вектор; 5"0к = {5(0),5(1),...,5(к)}, X 0к = {х(0), х (1),..., х (к)}.
Вычислим значение критерия (7):
I(к) = и т (к - к)(ВтНтСНВ + В)и (к - к) + и т (к - к)ВтНтС(НАх(к) +
+Н^(к) - г (к)) + (НАх (к) + Н^(к) - г (к ))т СНВи (к - к). (8)
Оптимальное управление определим из условия
Д(к) = 0. (9)
ёи(к - к)
Тогда, в силу (9), получим уравнение
(ВтНтСНВ + В)и(к - к) + ВтНтС(НАх(к) + Нй(к) - г(к)) = 0. (10)
Выражая и(к - к) из (10), получаем управление в следующем виде:
и(к - к) = -(ВтНтСНВ + В)-1 ВтНтС(НАх(к) + Нй(к) - г(к)). (11)
Далее, учитывая (1), имеем равенства
х(к) = Ах(к -1) + Ви(к - к -1) + й(к -1),
х(к -1) = Ах(к -1) + Ви(к - к -1) + й(к -1),
х(к - к +1) = Ах(к - к) + Ви(к - 1к) + й(к - к). (11)
Тогда для вычисления вектора х(к) из системы (11) получим следующую формулу:
х(к) = Акх(к - к) + ]Г А'-1 Ви (к - к -') + ]Г А'-1^5(к - '). (13)
Учитывая (13), локально-оптимальное управление (11) представим в виде
и(к - к) = -(ВТ НТСНВ + Б)1 ВТНТС(ИЛк+1 х(к - к) + к к +£НЛ'Ви(к - к - О + £НЛ^£(к -1) - z(k)). (14)
1=1 1=0
Управление (14) формируется в момент времени к - к , и для его реализации необходимо знать состояние х(к - к), возмущение s(k - к) и прошлые значения управлений и(к - к - 1), а также необходимо вычислять прогноз возмущений для моментов времени к, к - 1,..., к - к + 1.
Построим управление для случая неполной информации об аддитивном возмущении и о состоянии объекта х(-). Управление в этом случае определим на основе принципа разделения, используя оценки фильтрации компонент х(-) и и оценки прогноза для вектора . В результате для текущего времени (к - к) получим
к
и(к - к) = -(ВтНТСНВ + Б)-1 ВтНТС(НЛк+1 Ху (к - к) + £НЛ1Ви(к - к -1) +
1=1
к-1
+HЛкFsf (к - к) + £р (к -1) - г(к)), (15)
1=0
где £ г (к - к) и Х, (к - к) - оценки фильтрации, которые определяются с помощью алгоритма оптималь-
ной калмановской фильтрации:
sf (к - h) = R(k - h -1)sf (k - h -1) + f (k) + r(k - h -1) + Kf (k - h)[o(k - h) -
-Ф(Я(к - h-1)sf (k - h-1) + f (k) + r(k - h-1))], sf (0) = s0, (16)
Kf (k - h) = P(k - h / k - h - 1)ФТ (ФР(к - h / к - h - 1)ФТ+ T)-1, (17)
P(k - h / k - h -1) = R(k - h -1)P(k - h - 1)R(k - h -1)T+ Q, (18)
P(k-h) = -Kf (k-h)Ф)P(k-h/k-h-1), P(0) = PSo. (19)
xf (k - h) = Axf (k - h -1) + Bu (k - 2h -1) + Fsf (k - h -1) + rx (k - h -1) + Kx (k - h)[w(k - h) -
-Hx (Axf (k - h -1) + Bu(k - 2h -1) + Fsf (k - h -1) + rx (k - h -1))], x(0) = x0, (20)
Kx (k - h) = Px (k - h / k - h -1) H T (HPx (k - h / k - h -1) H T + Tx )-1, (21)
Px(k - h/k -h -1) = APx(k - h -1)AT, (22)
Px (k - h) = (E^- Kx (k - h)H)Px (k - h / k - h -1), P (0) = P,, (23)
где Ещ - единичная матрица размерности щ. В (19) введена оценка вектора неизвестного входа гх(к); так как в исходной модели (1) £(к) точно не наблюдается, то введение в модели (1) аддитивного неизвестного вектора (вектора ошибок) гх (к) и последующая его оценка позволят обеспечить компенсацию ошибок, возникающих в модели объекта (1) из-за использования оценок £(к) при формировании управления. При определении управления (14) требуется вычислять также оценки и в моменты, большие, чем (к - к) (оценки прогноза), поэтому здесь воспользуемся экстраполятором, который позволит найти оценку возмущения с прогнозом на один такт £р (к - к +1):
£р (к - к +1) = Я(к - к)£р (к - к) + / (к - к) + г(к - к) +
+Кр (к - к)(ш(к - к) - Ф§р (к - к)), §р (0) = £0, (24)
Кр (к - к) = Я(к - к)Рр (к - к)ФТ (ФРр (к - к)ФТ + Т)-1, (25)
Рр (к - к +1) = (Я(к - к) - Кр (к - к)Ф)Рр (к - к)(Р(к - к) - Кр (к - к)Ф)Т +
+б + Кр (к - к)ТКТ (к - к), Рр (0) = р0 , (26)
а оценки 5р (к - к + ,) для , > 1 определятся по формулам
$р (к - к + ,) = Я(к - к + , -1)5^ (к - к + , -1) + /(к - к + , -1) + г(к - к + , -1). (17)
В (16) и (14) оценка г() вычисляется по методу наименьших квадратов на основе минимизации критерия [8]:
•л=1 {{+1|г (' -1)£ (18)
'=1
где х(') = ©(') -Ф(Я(' -1)5/ (' -1) + /(' -1)), р = к - к -1, V > 0, Ж> 0 - весовые матрицы соответствующих размерностей, ||х(')|¡У = Хт (')Ух('). В этом случае оценка имеет вид
г (к - к -1) = [ФтУ Ф + Ж ]-1 ФтУ {га( к - к) - Ф[Я (к - к -1) 5 (к - к -1) + / (к - к -1)]}, (19) которая учитывается при определении оценок 5/ и 5р, вычисляемых по формулам (16), (14).
Отметим, что в (14) используется оценка г(к - к), которая вычисляется по оценке (19) с использованием прогноза на один такт, здесь можно воспользоваться, например, методами прогнозирования временных рядов.
По аналогии с (19) находится оценка неизвестного входа гх (к), минимизируя следующий критерий:
•=!{{ (€х +1Г (' - €х (30)
'=1
где хх (') = м/х (') -Ф(Ах(' -1) + Ви(' - к -1) + М/ (' -1)), Ух > 0, Жх > 0 - весовые матрицы, получим оценку
г (к - к -1) = £ [м>х (к - к) - Нх (Ахс/ (к - к -1) + Ви(к - 1к -1) + (к - к -1)], (31)
5 = (НТУН + Ж)-1 НГУ .
Л: ^дгдгд: Л: ^ ХХ
Отметим, что для построения оценок неизвестных входов можно также использовать методы, предложенные в работах [9-11].
3. Результаты моделирования
Рассмотрим модель объекта для следующих исходных данных: (0,75 0 ^ ( 0 1 ^
А =
0,1 0,79
, Я(к) = Я =
V 0,1 0,6 ,
б = ^{0,05 0,01}, т = diag{0,04 0,06},
В = Н = М = С = У = Р0 = Ух = Е2, В = Ж = Жх = 0, г = (10 17)т ,
'0,4, если 0 < к < 10, Г 0,4,
/1(к) = <{-0,4, если 10 < к < 10, /1(к) = \ -0,4, 0,4, если 10 < к < 30, [ 0,4,
Алгоритм управления исследовался для следующей матрицы АЯ и компонент вектора А/ (к):
0,1sin(k) + 0,1, если 0 < к < 10,
если 0 < к < 10, если 10 < к < 10, если 10 < к < 30.
АЯ(к) = АЯ =
( 0 0,03^
V0,04 0,05,
А/1(к) =
, А/1(к) = <{ 0,Ып(к) + 0,1, 0,1sin(k) - 0,1,
0,Ып(к) - 0,1, если 0 < к < 10, 0,Ып(к) + 0,1, если 10 < к < 10, 0,Ып(к) - 0,1, если 10 < к < 30.
если 10 < к < 10, если 10 < к < 30,
Рис. 1. Компоненты вектора состояния: 1 - компоненты отслеживаемого вектора; 2 - компоненты вектора состояния для управления (14)-(25); 3 - компоненты вектора состояния для управления (14), когда в фильтрах (14)-(25)
не используются оценки неизвестных входов
Рис. 2. Компоненты вектора управления: 1 - компоненты вектора управления для алгоритма, использующего оценки неизвестных входов (14)-(25); 2 - компоненты вектора управления для алгоритма (14), не использующего оценки неизвестных входов
Результаты моделирования показали, что исключение оценок неизвестных входов в используемых алгоритмах фильтрации и экстраполяции приводит к значительному снижению точности слежения или к срыву слежения.
Заключение
Предложен алгоритм локально-оптимального управления для дискретной стохастической системы с запаздыванием по управлению, функционирующей в условиях неполной информации о модели возмущений и компонентах вектора состояния. Показано, что применение в алгоритмах фильтрации и экстраполяции с учетом оценок неизвестного входа приводит к повышению точности отслеживания компонент заданного вектора.
ЛИТЕРАТУРА
1. Дегтярев Г. Л., Ризаев И.С. Синтез локально-оптимальных алгоритмов управления летательными аппаратами. М. : Машино-
строение, 1991. 304 с.
2. Mohammad S., Modarres S., Karbassi S.M. Time-optimal control of discrete-time linear systems with state and input time-delays //
Int. Journal of Innovative Computing, Information and Control. 2009. Vol. 5, No. 9. P. 2619-2625.
3. Tehrani H.A., Ramroodi N. Eigenvalue assignment of discrete-time linear systems with state and input time-delays // AIJ-MISC.
2013. Vol. 45, No. 2. P. 23-30.
4. Киселева М.Ю., Смагин В.И. Управление с прогнозирующей моделью с учетом запаздывания по управлению // Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2010. № 2 (11). С. 5-12.
5. Смагин В.И., Смагин С.В. Адаптивное управление запасами с учетом ограничений и транспортных запаздываний // Вестник
Томского государственного университета. Управление, вычислительная техника и информатика. 2008. № 3 (4). C. 19-26.
6. Пыркин А.А. Адаптивный алгоритм компенсации параметрически неопределенного смещенного гармонического возмуще-
ния для линейного объекта с запаздыванием в канале управления // Автоматика и телемеханика. 2010. № 8. С. 62-78.
7. Kiseleva M.Yu., Smagin V.I. Model predictive control for linear discrete-time systems with time delays and unknown input // Com-
munications in Computer and Information Science (CCIS-487). Springer International Publishing Switzerland, 2014. P. 181-188.
8. Janczak D., Grishin Yu. State estimation of linear dynamic system with unknown input and uncertain observation using dynamic
programming // Control and Cybernetics. 2006. No. 4. P. 851-862.
9. Hsieh C.-S. On the optimality of two-stage Kalman filtering for systems with unknown inputs // Asian Journal of Control. 2010.
No. 4. P. 510-523.
10. Witczak M. Fault diagnosis and fault-tolerant control strategies for non-linear systems. Chapter 2. Unknown input observers and filters // Lecture Notes in Electrical Engineering. Springer International Publishing, Switzerland, 2014. P. 19-56.
11. Смагин В.И., Смагин С.В. Фильтрация в линейных дискретных нестационарных системах с неизвестными возмущениями // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. 2011. № 3 (16). С. 43-51.
12. Смагин В.И. Оценивание состояний нестационарных дискретных систем при неизвестном входе с использованием компенсаций // Изв. вузов. Физика. 2015. Т. 58, № 7. С. 122-127.
Ким Константин Станиславович. E-mail: kks93@rambler.ru
Смагин Валерий Иванович, д-р техн. наук, профессор. E-mail: vsm@mail.tsu.ru
Томский государственный университет
Поступила в редакцию 2 ноября 2015 г.
Kim Konstantin S., Smagin Valéry I. (Tomsk State University, Tomsk, Russian Federation).
Locally-optimal control of discrete delayed control systems with incomplete information about state and perturbations. Keywords: discrete system; local criteria; delayed control; incomplete information.
DOI: 10.17223/19988605/34/2
Model of object with delayed control is described by equation
x(k +1) = Ax(k) + Bu(k - h) + Fs(k),
x(0) = X0, u(j) = y(j), j = -h,-h +1,...,-1,
where x(k) e Rn is the state vector, u(k - h) e Rm is the control vector, h is the time delay, s(k) e Rn is the perturbation vector,
x0 and i//( j) ( j = -h, - h + 1,...,-1) are initial vector and initial function, А, В, and F are constant matrices. It is assumed that the
observable vector wx (k ) e Rl, and
wx (k ) = Hxx(k ) + tx (k ), where Hx is the matrix of channel of observations, xx (k) is the Gaussian random sequence. The perturbation model contains unknown parameters and is determined by the equation
s(k +1) = (R(k) + M(k))s(k) + f (k) + Д/(k) + q(k), s(0) = s0,
where R(k) is the known matrix, fk) is the known vector, ¿R(k) and Д/(k) are some unknown matrix and vector, s0 is the random vector of initial conditions independent of q(k), x(k) and xx (k); q(k), x(k), xx (k) are independent Gaussian random sequences with the known characteristics.
Indirect observations of the vector perturbations are described by the model
<B(k ) = ®s(k ) + x(k ),
where ra(k) e Rm1 is the vector of observations, Ф is m¡ x n-matrix, x(k) are random errors of observations. To solve the problem, we use the approach which is based on optimization of local criteria
I (k ) = M {(w(k +1) - z (k ))T C (w(k +1) - z (k )) + u T (k - h) Du(k - h)},
where w(k) = Hx(k) is the controlled output of the system, C = CT > 0 and D = DT > 0 are weight matrices, z(k) e Rn is the tracking vector. The control is realized on the base of the Kalman filtering and extrapolation with considering the unknown input.
REFERENCES
1. Degtyarev, G.L. & Rizaev, I.S. (1991) Sintez lokal'no-optimal'nykh algoritmov upravleniya letatel'nymi apparatami [Synthesis of locally optimal algorithms for flight vehicle control]. Moscow: Mashinostroenie.
2. Mohammad, S., Modarres, S. & Karbassi, S.M. (2009) Time-optimal control of discrete-time linear systems with state and input time-
delays. Int. Journal of Innovative Computing, Information and Control. 5(9). pp. 2619-2625.
3. Tehrani, H.A. & Ramroodi, N. (2013) Eigenvalue assignment of discrete-time linear systems with state and input time-delays. AIJ-
MISC. 45(2). pp. 23-30.
4. Kiseleva, M.Yu. & Smagin, V.I. (2010) Model predictive control with time-delay in control input. Vestnik Tomskogo gosudarstven-
nogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 2(11). pp. 5-12. (In Russian).
5. Smagin, V.I. & Smagin, S.V. (2008) Adaptive Inventory Control with Restrictions and Transport Delays. Vestnik Tomskogo gosudar-
stvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 3(4). pp. 19-26. (In Russian)
6. Pyrkin, A.A. (2010) Adaptive algorithm to compensate parametrically uncertain biased disturbance of a linear plant with delay in the
control channel. Automation and Remote Control. 71(8). pp. 1562-1577. DOI: 10.1134/S0005117910080060
7. Kiseleva, M.Yu. & Smagin, V.I. (2014) Model predictive control for linear discrete-time systems with time delays and unknown in-
put. Communications in Computer and Information Science (CCIS-487). Springer International Publishing Switzerland. pp. 181188.
8. Janczak, D. & Grishin, Yu. (2006) State estimation of linear dynamic system with unknown input and uncertain observation using
dynamic programming. Control and Cybernetics. 4. pp. 851-862.
9. Hsieh, C-S. (2010) On the optimality of two-stage Kalman filtering for systems with unknown inputs. Asian Journal of Control. 4. pp.
510-523. DOI: 10.1002/asjc.205
10. Witczak, M. (2014) Fault diagnosis and fault-tolerant control strategies for non-linear systems. Springer International Publishing, Switzerland. pp. 19-56.
11. Smagin, V.I. & Smagin, S.V. (2011) Filtering for linear not stationary discrete system with unknown disturbances. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika - Tomsk State University Journal of Control and Computer Science. 3(16). pp. 43-51. (In Russian).
12. Smagin, V.I. (2015) State estimation for nonstationary discrete systems with unknown input using compensations. Russian Physics Journal. 58(7). pp. 122-127. (In Russian).