Г.Н. Решетникова
СИНТЕЗ АДАПТИВНОГО УПРАВЛЕНИЯ ПО ЛОКАЛЬНОМУ КРИТЕРИЮ С МОДЕЛЬЮ ПОНИЖЕННОГО ПОРЯДКА
Рассматривается подход к формированию следящей системы адаптивного управления с моделью пониженного порядка при кусочно-постоянной настройке ее параметров. Приводятся алгоритмы агрегирования и синтеза управляющих воздействий на основе минимизации локального квадратичного критерия.
Совмещенный синтез адаптивного управления подвижными объектами обусловлен тем, что для достижения хорошего качества функционирования управляемого объекта необходимо, чтобы формирование управляющих воздействий осуществлялось за время, пренебрежимо малое в сравнении со скоростью изменения внешней среды и самого объекта. В связи с этим в настоящей работе предлагается агрегировать модель объекта и формировать управления по локальному критерию с использованием модели пониженного порядка при кусочно-постоянной настройке ее параметров.
1. ПОСТАНОВКА ЗАДАЧИ
Пусть математическая модель объекта управления описывается системой линейных нестационарных стохастических разностных уравнений:
x(k +1) = A(k) x(k) + B(k )u (k) + F (k )q(k),
x(0) = x0, (1)
где x(-) e Rn - вектор состояния; м(-) e Rm - вектор управления; q(-) e Rnxl‘ - вектор внешних возмущений, которые будем считать последовательностями гауссовских шумов с характеристиками M{q(k)} = q (k),
M{(q(k) - q(k))(q(j) -q(j))T} = Q(k^ , (2)
A( k), B(k), F (k) - матрицы соответствующих размерностей, характеризующие модель (1), k = 0, NH -1, N„ - число тактов моделирования.
Пусть информация о состоянии объекта поступает с помощью измерительного комплекса, математическая модель которого имеет вид
y(k) = Hx(k) + r (k), (3)
где y(-) e Rl - вектор измерений; H e Rlxn - матрица
канала измерений, нулевые столбцы которой соответствуют неизмеряемым компонентам вектора состояния; r (k) - погрешности измерений, которые будем считать последовательностями гауссовских шумов с характеристиками
M{r(k)} = 0, M{r(k)rT (j)} = RSk,j
M{r(k)qT (j)} = 0.
При синтезе управляющих воздействий будем предполагать, что модель объекта имеет вид x(k +1) = A( k, 9( k)) x(k) +
+B(k, 9(k))u(k) + F(k)q(k), x(0) = x0, (4)
где 9(k) e Rn - вектор неизвестных параметров модели объекта, при этом предполагатся, что априорные распределения векторов x0 и 90 являются гауссовскими:
М{х0} = х0, М{(х0 - х0)(х0 - х0)Т } = РХо,
М(0о} = 00, М{(00 - 00 )(00 -00)Т } = Р00.
Формирование следящей системы управления осуществляется на основе минимизации локального критерия [1]:
3(к) = 0,5М {(х(к +1) - х2 {к))Т С(х(к +1) - хг (к)) +
+иТ (к)Бы (к)}, (5)
где С > 0, Б > 0 весовые матрицы; х2 (•) - вектор заданных состояний, за которым осуществляется слежение. Тогда, с учетом принципа разделения, выражения для управляющих воздействий имеют вид
ы(к) = -(ВТ (к, 0(к ))СВ(к, 0(к)) + Б)-1 х хВТ (к, 0(к))С[А(к, 0(к))х(к) + F(к)д(к) - хг (к)], (6)
где х(-),0(-)- оценки векторов состояния и параметров, определяемые с помощью фильтров Калмана [2].
2. АЛГОРИТМЫ АГРЕГИРОВАНИЯ
Для построения модели пониженного порядка будем агрегировать систему
х( у +1) = А(к, 0(к)) х( у) +
+В(к, 0(к))ы(к) + F(к)д(у), х(к) = х(к), (7)
(у = к, к + ц),
где д(у) - последовательность гауссовских шумов с характеристиками
М{д( у)} = д (к), М{(д( у) - д (к ))(д(/) - д (к ))Т } = 0(к )5 у.
Задача агрегирования заключается в определении параметров системы
хр (у+1)=Ар (0(к )) хр ( у)+Вр (к ,0(к ))ы(к )+Fp (к ) д( у), хР (у = к) = Нрх(к), у = к, к + ц (8)
порядка р < п , для которой выполняется соответствие:
хр (у) = Нрх(у), у = к,к + ц, где Н - матрица агрегирования размерности р х п ранга р и
Вр (к, 0(к)) = НрВ(к, 0(к)), Fp (к) = HpF(к). (9)
Построение системы пониженного порядка р < п сводится к вычислению установившегося значения матрицы Акр (0(к)) системы (8) и матрицы Б(-) оператора обратного преобразования Б: Яр ^ Яп размерности п х р , которые будем строить таким образом, чтобы восстановление состояния исходной сис-
темы по состоянию агрегированной
*(•) = Б{хр (•)} (10)
позволяло получить состояние, близкое к исходному, т.е. х() и х() [3]. Тогда, согласно [4], это осуществляется по следующим рекуррентным формулам:
Ох (у +1) = А(к, 0(к ))Ох (у) АТ (к, 0(к)) +
+А (к, 0(к)) х (у)[ В(к, 0(к ))ы(к) + F (к )д (к )]Т +
+[ В(к, 0(к ))ы (к) + F (к )д (к )]хТ (у) АТ (к, 0(к)) + Ск,
Цу +1) = Ох (у +1) - А (к, 0(к)) Ре (у) АТ (к, 0(к)),
Б(у +1) = Цу +1)НТр [Нр!(у +1)НТр ]-1,
Ар (у +1,0(к)) = НрА(к, 0(к)) Б( у +1),
Ре (у +1) = Ох (у +1) - Б( у +1) Нр!( у +1), х (у +1) = А (к ,0(к)) х (у)+В(к ,0(к ))ы(к) + F (к )д (к), (11)
Ар(у,0(к)), если
Акр (0(к)) =
1г{Р- (у )}- 1г(Ре (у-1)}
1г{Ре (у-1)}
<е, у <Ц,
(13)
Ар (ц,0(к)), в противном случае,
Ох (у +1) = А (к ,0(к ))Ох (у) АТ (к ,0(к)+Сх (хуст (к))
Сх (хуст (к)) = А (к, 0(к))[ 1п - А (к, 0(к ))]-1 х х[ В (к, 0(к ))ы (к) + F (к )д (к)] [ В(к, 0(к)) + F (к )д (к )]Т
(17)
х[В(к,0(к))ы(к) + F(к)д(к)][В(к,0(к))ы(к)+F(к)д(к)]Т х х[[1п - А (к, 0(к))]-1]ТАТ (к, 0(к)) + Сх(к); (18)
Сх (к) = F(к)0(к)F1 (к) +
(19)
+В (к, 0(к ))ы(к )ыТ (к) ВТ (к, 0(к)).
2. Запишем уравнение (14) в виде
х2 (к) = А(к, 0( к)) х2 (к) + В(к, 0( к ))йг (к) +
+F (к )д (к), (20)
где йг (к) - вектор управления, определяемый по заданному состоянию х2 (к) и значению д (к). Из (20) получаем
В (к, 0(к Щ (к) = (1п - А (к, 0(к)) хг (к) - F (к )д (к). (21) Тогда
Ох (у +1) = А(к, 0(к))Ох(у)АТ (к, 0(к) + Сг (хг (к)); (22) С (хг (к)) = F(к)Ш(к)FT (к) + хг (к)хТ (к) -
(у = к, к + ц),
при следующих начальных и постоянных значениях:
Ох(у = к) = Охк ,
Б( у = к) = Ох (у = к )НТ [НрОх (у = к )НТ ]-1,
Ре ( у = к)=[1п - Б( у = к) Нр ]Ох (у = к) [1п - Б( у = к) Нр ]Т, х (у = к) = х(к),
Ск = F (к )Ш(к) FT (к) + +[ В(к, 0(к ))ы(к) + F (к) д (к)] х х[В(к,0(к))ы(к) + F(k)д(k)]T . (12)
Установившееся значение Ар (0(к)) определяется при выполнении условия
-А(к, 0(к))х2 (к)х'Т (к)АТ (к, (Э(к)).
(23)
При решении задачи стабилизации, когда х2 (к) = 0 . выражение (23) примет вид
Сг (хг (к)) = F (к )Ш(к) F1 (к).
(24)
где е - заданная точность агрегирования.
Можно получить модификации алгоритма (11) -(13), позволяющие упростить и уменьшить объем вычислений при агрегировании.
1. Запишем уравнение х( у +1) = А (к ,0(к)) х (у)+В(к ,0(к ))ы(к) + F (к )д(к), (14)
в виде
хуст (к) =
= А (к, 0(к)) хуст (к) + В(к, 0(к ))ы(к) + F (к )д(к), (15) где хуст (к) - установившееся состояние, определяемое по управлению ы(к) и значению д(к). Такое состояние системы называется балансировочным. Если матрица 1п - А(к, 0(к)) неособенная, то из (15) следует
х уст (к) =
= [1п - А(к, 0(к))]-1[В(к, 0(к))ы(к) + F(к)д(к)], (16) где 1п - единичная матрица п-го порядка. Тогда
3. СИНТЕЗ АДАПТИВНОГО УПРАВЛЕНИЯ С МОДЕЛЬЮ ПОНИЖЕННОГО ПОРЯДКА
Будем формировать управляющие воздействия для (1) при описании поведения объекта моделью пониженного порядка:
хр (к +1) = Ар (0(к)) хр (к) + Вр (к, 0(к ))ы (к) +
+Fp (к )д( к), (25)
где матрица динамики Ар (0(к)) определяется агрегированием системы (6) согласно основному алгоритму агрегирования или его модификациям, при этом ц < Ым - число тактов, определяющих скользящий интервал агрегирования. Тогда, если в (5) вместо х() использовать восстановленное состояние НО , а затем обозначить
хр (к) = Нрхг (к),
Ср (к) = Б(к )СБТ (к),
(26)
где Б(к) - матрица оператора обратного преобразования, определяемая одновременно с Акр (0(к)), то локальный критерий (5) примет вид
3р (к) = 0,5 М {(хр (к +1) - хр (к))Т Ср (к)(хр (к +1) -
хр (к) = Нрх(к),
- хр (к)) + ыТ (к) Бы (к)},
(27)
а управление будет формироваться следующим образом:
ы(к) = -[(Вр (к, 0(к )))Т Ср (к) Вр (к, 0(к)) + Б]-1 х х( Вр (к, 0(к )))ТСр (к) х
х[Ар (0(к))хр (к) + Fp (к)д (к) - хр (к)]. (28)
Заметим, что агрегировать модель объекта в каждый момент формирования управляющих воздействий является нецелесообразным, так как экономия
времени за счет использования модели пониженного порядка может быть либо незначительной, либо вообще отсутствовать из-за затрат времени на агрегирование. Значительное сокращение вычислительных затрат при синтезе достигается путем формирования управляющих воздействий в течение достаточно большого времени по модели пониженного порядка без ее пересчета, что соответствует кусочнопостоянной настройке ее параметров. При этом значения Х(),и(),д(•) в (28) должны соответствовать моменту формирования управлений.
4. ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ
Численное моделирование осуществлялось для математической модели, описывающей продольное движение летательного аппарата в виде системы разностных уравнений:
х(к +1) = Л(к) х(к) + Б(к )и (к) + Е (к )п(к), п(к+1) = д (к)п(к)+е (куф),
х(0) = Хо, П(0) = По , (29)
где компоненты векторов состояния х() = (-Э, V, -ш г ,Н ,У)
и управления
«(•) = (8р.в ,8с.г)
имеют следующий смысл: 9 - отклонение угла наклона траектории к горизонту (рад); V - отклонение угла тангажа (рад); таг - отклонение угловой скорости вращения (рад/с); Н - отклонение высоты полета (м); V - отклонение скорости полета (м/с); 5рв - возмущение угла отклонения руля высоты (рад); 5сг -
возмущение угла отклонения сектора газа (рад).
Второе уравнение в (29) является математической моделью внешних возмущений, которая описывает воздействие ветра. В этом случае матрицы Д (к), Е (к) имеют соответственно вид
(
А, (к) =
—Дґ
1
V 2(к)
Ь(к) 0
(
Дґ
1 — 2Дґ
V (к) Ь(к)
Л
Е (к) = л/Д
3У 2(к)
I Ь2(к) "
1 — Дґ
0
0
2^(к)Г
Ь(к) п
V (к) Ь(к),
Л
где Ь (к) - масштаб турбулентности, определяемый по значению высоты полета; стп - параметр, который
характеризует среднеквадратическое отклонение скорости турбулентного ветра; Дґ - период дискретизации модели. В (29) §(•) - вектор белых гауссовских шумов с нулевым средним и единичной дисперсией, который задает действие случайных возмущений в модели ветра.
При синтезе управляющих воздействий предполагалось, что модель объекта задана в виде (3), где вектор внешних возмущений ч() имеет следующие характеристики [5]:
ч (•) = 0,
а матрица Q(•) определяется уравнением:
Q(k +1) = Д, (кШ) + Q(k)Вту (к) + Е (к)ЕЇ (к) — Q(k),
Q(0) = Qo
(29)
где Q0 - заданная матрица начальных значений.
Моделирование осуществлялось для 400 тактов с периодом дискретизации Д/ = 0,1 с. Управление синтезировалось при неполном измерении, определяемым матрицей
( 0 1 0 0 0А
н =
0 0 0 1 0 0 0 0 0 1
и при пяти неизвестных параметрах, составляющих вектор 9 . Управляющие воздействия формировались с помощью модели пониженного порядка, при этом агрегирование осуществлялось при ц = 7 с периодом дискретизации, равным 40 тактам, и матрицей агрегирования вида
Г0,5 1 0 0 0А
0 0 10 0
0 0 0 1 0
0 0 0 0 1,
НР =
Построение матрицы Ср (•) осуществлялось один раз при первом агрегировании модели, оценки Х(), 9() формировались на каждом такте.
Полученные в результате синтеза переходные процессы и управления удовлетворяют ограничениям на максимальные отклонения компонент векторов состояния и управления, которые установлены по условию безопасности полета для рассматриваемой модели объекта. При этом качество функционирования системы управления с моделью как полного, так и пониженного порядков при использовании для агрегирования основного алгоритма и его модификаций различается незначительно.
ЛИТЕРАТУРА
1. Смагин В.И., Параев Ю.И. Синтез следящих систем управления по квадратичным критериям. Томск: Изд-во Том. ун-та, 1996. 171 с.
2. Браммер К., Зиффлинг Г. Фильтр Калмана - Бьюси. М.: Наука, 1982. 200 с.
3. Домбровский В.В. О приближенном агрегировании линейных стохастических систем // Автоматика и телемеханика. 1989. № 7. С. 102 -109.
4. Решетникова Г.Н. Следящая система адаптивного управления с прогнозирующей моделью пониженного порядка (настоящий сборник).
5. Параев Ю.И. Алгебраические методы в теории линейных систем управления. Томск: Изд-во Том. ун-та, 1980. 138 с.
Статья представлена кафедрой прикладной математики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию «Кибернетика» 1 июня 2005 г.