АНАЛИЗ И СИНТЕЗ СИСТЕМ УПРАВЛЕНИЯ
т-' і
УДК 531.36:62-50
ОБ УПРАВЛЕНИИ ОБЪЕКТОМ С АПРИОРНО НЕППРЕДЕЛЕННПЙ СТРУКТУРОЙ ВЕКТОРА СОСТОЯНИЯ
В. А. Погорелов Ростовский военный институт Ракетных войск, г. Ростов-на-Дону
Рассмотрен метод, позволяющий осуществлять точный синтез законов управления нелинейным стохастическим объектом с неопределенной структурой вектора состояния, оптимальных в смысле нелинейных вероятностных критериев. Показаны преимущества предложенного метода по сравнению с методом управления, не предполагающим точную идентификацию структуры вектора состояния в процессе движения объекта. Приведен пример практического использования предлагаемого подхода.
ВВЕДЕНИЕ
Существующие методы синтеза стохастического управления предполагают представление вектора состояния объекта управления в форме Ито или Ланжевена [1—3]. Предполагается, что векторные и матричные функции, входящие в правые части стохастических уравнений, известны с требуемой точностью. Однако в практических приложениях часто встречаются случаи, когда, по тем или иным причинам, априори не удается точно определить не только отдельные параметры вектора состояния подвижного объекта (ПО), но и некоторую часть структуры правых частей уравнений [1, 4—9]. Очевидно, что в таких случаях применить известные методы к синтезу управления ПО без дополнительного привлечения методов идентификации или робастных алгоритмов не представляется возможным. Остановимся на некоторых аспектах применения последних в системах управления.
Существующие методы стохастической непараметрической идентификации многосвязных многомерных объектов предполагают наличие огромного объема экспериментального материала, который для уникальных объектов из-за ограниченного жизненного цикла получить, в принципе, невозможно [1, 2]. Но даже для серийно выпускаемых объектов проблема непараметрической идентификации вследствие старения материала, износа конструкции, эксплуатации в экстремальных режимах и прочего остается нерешенной. Например, при синтезе вектора состояния корректируемой гиростаби-лизированной платформы модель ее дрейфа описывается полиномами второго порядка с известными по результатам наземных калибровок коэффициентами [5, 7]. Такая модель оказывается адекватной при перегрузках, не превышающих 15—20 g. В случае движения объекта
с большими перегрузками, например, при аварийном спуске космического аппарата с орбиты, данная модель оказывается неадекватной реальному движению платформы, т. е. модель углового движения объекта управления не соответствует априорным предположениям, что ведет к структурной неопределенности его вектора состояния.
В определенной степени решить проблему управления объектом с частично неопределенной структурой можно, применив робастные методы [8—12]. Они гарантируют надежное управление объектом в условиях действия возмущений с априорно неопределенными вероятностными характеристиками [11]. Однако грубость робастных методов, обусловленная, как правило, упрощением модели объекта, не всегда позволяет синтезировать требуемый закон управления.
В какой-то мере проблему грубости робастного управления решает часто применяемый на практике способ коррекции модели измерений, осуществляемый путем привлечения внешней информации, например, показаний спутниковых навигационных систем [13]. Хотя такой подход и позволяет существенно повысить точность управления движением, его применение может войти в противоречие с требованиями, предъявляемыми к объекту управления в целом, например, автономности его функционирования. Кроме того, анализ способов применения различных систем коррекции показывает, что они эффективны только в определенных условиях эксплуатации объекта управления, что ограничивает их применение [14].
Можно сделать вывод, что разработка нового подхода к синтезу управления нелинейными стохастическими объектами с неизвестной структурой является актуальной научной и практической задачей. Рассмотрим один из возможных подходов к ее решению.
1. ПОСТАНОВКА ЗАДАЧИ
Пусть стохастический объект описывается нелинейным векторным дифференциальным уравнением размерности N в симметризованной форме
Х = /(Х О + Л(Х, г) О + /2(Х, г) и + /з(Х, г) V, (1)
где Х — Ж-мерный вектор состояния системы; /1 (г = 0, ..., 3) — известные нелинейные векторная и матричные функции размерностей N N х М, N х £ и N х L, удовлетворяющие условию Липшица УХ, г; О(Х, г) — М-мер-ная неизвестная вектор-функция, определяемая физическими свойствами объекта и подлежащая идентификации по показаниям измерителя, М < N и(Х, г) — /-мерный вектор искомого управления, £ < N V — С-мерный вектор нормированного белого гауссовского шума с нулевым средним и матрицей интенсивностей ЗД, L < N.
Структурно неопределенный управляемый вектор X наблюдается с помощью измерителя, описываемого в общем случае нелинейным стохастическим уравнением вида
Z = Н(Х, г) + Ж,,
где Z — К-мерный вектор выходных сигналов измерителя, К т N Н(Х, г) — известная нелинейная вектор-функция наблюдения размерности К, удовлетворяющая условию Липшица УХ, г; — белый гауссовский век-
тор-шум измерения размерности К с нулевым средним и матрицей интенсивностей -Ож(г)
Апостериорная плотность вероятности (АПВ) р(Х, О, и, г/Дт), т е [0, г)) = рг такого процесса, удовлетворяющего приведенным условиям, описывается интегродиф-ференциальным уравнением с частными производными Стратоновича [1]:
дР* =
дt
= ¿{4, Ь, рг} - &у(/10рг - ¿іу(/2Ц)рг + [Л - Л^р., =
ау/і®Рг - аіу(/2^ )рг,
(2)
где
Х{4, Ь, рг} = ^{4(Х, t}pг} + 2 div[div {Ь(Х, ?)рг>], 4(Х, /) = /(Х, /) + 2 дХ/з(Х, /)ЛК[/Т(X, /)]М, Ь(Х, /) = /з(Х, 0^/"(X, 0, л = л(Х 0 = -1 [^ - Н(Х, 0]^ [Z - Н(Х, /)],
Я = I ЯХ Ор/Х
—да
(у) означает операцию преобразования матрицы в вектор [6]: А = |а11 а21 ... ат1 а12 а22 ... ат2 ... а1л а2п ”. ^л1 ,
div — символ операции дивергенции строки матрицы.
Задачу совместной идентификации структуры вектора состояния и формирования управления стохастической динамической системой при наличии текущих наблюдений за ее вектором состояния будем рассматривать далее как задачу синтеза вектора управления и и вектор-функции 0 в реальном масштабе времени. Иными словами, задачу поиска искомого управления и и вектор-функции 0 сформулируем далее как задачу синтеза таких векторов и и 0, которые доставляли бы минимум функционалу J, характеризующему текущее качество функционирования стохастической системы (1) в момент времени t:
(3)
Учитывая, что исчерпывающей характеристикой случайного процесса является его АПВ, в качестве величины Ф1 целесообразно выбрать критерий, выраженный через нее. Им может быть информационный критерий Фишера, Шеннона, Кульбака и другие [1], позволяющие получить потенциально более точные оценки вектора состояния Х вследствие оптимизации всего процесса Х, а не его локальной характеристики — дисперсии, как в традиционном среднеквадратическом критерии. Отметим, что при выборе критерия Ф1 важно обеспечить компромисс между требуемой точностью и объемом вычислительных затрат. Так, например, использование в качестве критерия Ф1 функционала Фишера
Ф
Гд1пРЛ Гд1п Р ¿\т
1 дХ ] [ дХ ]
обеспечивает большую по сравнению с критерием Шеннона Ф1 = —рг 1прг точность, но требует дополнительных вычислительных затрат.
Отсутствие информации о структуре вектор-функции О увеличивает энтропию состояния системы. Поэтому процесс идентификации вектор-функции О должен, прежде всего, осуществляться с целью минимизации неопределенности вектора состояния системы (1), причем требовать минимума энергетических затрат, т. е.
т
минимума квадратичной формы О О.
В ряде прикладных задач, например, навигации ПО, обработки и передачи информации, распознавания образов и других возникает необходимость максимизации информации о векторе состояния объекта или минимизации его энтропии. Решение этой задачи, наряду с идентификацией структуры вектора состояния, может быть осуществлено путем синтеза управления максимизирующего АПВ рг. При этом управление и необходимо осуществлять, как и идентификацию О, с минимальными энергетическими затратами, минимум которых можно обеспечить, минимизировав квадратичную форму ити.
Можно сделать вывод, что между векторами и и О возникает смысловая и формальная общность, что позволяет объединить их в блочный вектор Р = |ОТ . ит|т, а в качестве функционала Ф2 рассматривать квадратичную форму РтР.
да
С учетом введенного вектора Р критерий (3) принимает вид
t
J = j Ф1[р,]й'Х + JJ PTPdt,
X t X
t0
(4)
а уравнение (2) можно представить следующим образом:
или в компактном виде
г- 2
Г02Ф1
dXdpz
pz + 2^r(E 1)TE 1 = 0.
Из полученного уравнения можно определить промежуточный вектор
dpz = L{q, b, Pz> - div{(E §) P(X, t))p^} + [R - R>z =
= S[pi - div{(E g P)P7},
(5)
где E = |/¡(X, t) . /2(X t)|, g — знак блочного умножения матриц [6].
2. РЕШЕНИЕ ЗАДАЧИ СОВМЕСТНОГО УПРАВЛЕНИЯ И ИДЕНТИФИКАЦИИ
Для решения поставленной задачи приведем систему уравнений (1) к виду
X = /0(X t) + E g P + /3(X, t)V
и введем обобщенную функцию Y, выражаемую через вектор P как Y(X t) = E g P, или P = E-1 g *F(X t), где E-1 = /-1 (X, t) . /-1 (X, t)|.
Для синтеза функции Y воспользуемся известным фактом, что при неотрицательно определенной критериальной функции (в силу неизбежности положительной определенности информационных функционалов, а также «энергетической» составляющей критерия (4)) для обеспечения ее минимального значения в каждый момент времени достаточно, чтобы производная ее по времени, взятая с обратным знаком, имела максимум [3, с. 380]. Применение данного положения к критерию (4) приводит к условию:
max(— /) = max j-J^d“1 Pz + E-1 )TE-1 V) dX j- =
= max ¥
f[ дф1 J S[ ] ^p.
11 яРТ 1 S[pz] - dX pz - *
X vapz
—z !• +
0X
+ Yr(E 1)TE V I dX
Анализ полученного выражения показывает, что решение поставленной задачи сводится к классической задаче нахождения вектор-функции ¥, реализующей минимум определенного интеграла
X{S [pz] - I pz - +*Г(Е "yE "vldX
Искомая вектор-функция Y должна удовлетворять уравнению Эйлера:
-0 0®! р + ^ 0Р, - А г-1)te-1Y) = 0 dX 0pz 0pz 0X 0Yv v ; '
1
Y = -± E І
опт 2
. 2
д2Ф1
dX9p_
Очевидно, что искомый вектор Р в этом случае может быть представлен как
Ропт 2 ET 1
г ^2
0 Ф1 0X0p_
(6)
Выражение (6) позволяет получить как вектор оптимального управления системой (1)
г ^2
иопт = -2 /2(X, t)
д Ф1 dXdpz
(7)
так и найти априорно неизвестную вектор-функцию, минимизирующую энтропию системы (1)
Q = -2fi(X, t)
'дФ1
0X0p_
Функция р,^ в выражении (5) определяется из решения нелинейного уравнения, полученного после подстановки Р в уравнение (5):
— = S[p 1 + 2 div 1 E (
dt Pz 2 '
д Ф1 dX9p_
2
pz
(8)
По вычислительным затратам решение уравнения (8) оказывается не намного сложнее, чем решение исходного уравнения (5). Более того, сходство структур уравнений (5) и (8) определяет возможность применения в случае уравнения (8) методов, разработанных для решения уравнения (5).
Анализ выражения (7) показывает, что иопт зависит от параметров вектора состояния объекта (1), которые, исходя из постановки задачи, не известны. Данное обстоятельство делает принципиально невозможным использование выражения (7) для управления объектом (1) и требует проведения дополнительных преобразований.
Умножим обе части выражения (7) на р и проинтегрируем полученный результат по Х. В итоге получим
2
jJ2(X t)
2 -,T
д2Ф1
dX9pz
p2 dX.
Хотя найденное управление иопт является субопти-мальным, оно оказывается независимым от Х, следовательно, его можно использовать, в отличие от выражения (7), для управления движением объекта.
pz.
Р
z
р
z
pz.
3. ПРИМЕР
Для иллюстрации эффективности предложенного подхода рассмотрим следующий пример.
Объект управления описывается уравнением
х — -х + хд + 2хи + х(^) = 0,
(9)
где д — априорно неизвестная функция, зависящая от х, и — искомое управление, у — белый центрированный гауссовский шум интенсивности _Оу.
Уравнение наблюдателя имеет вид
= тах \ | (Во(рг, х) + В1(рг, х) -х + ^(Р;, х)Г
- ГТ(е 1)Те 1Г) ¿х !-,
1
где е
1 1 х 2х
, х) = [1 + ^Р^Р;) х) =
=(1 + 1пР>г, в2(Рг, х) = (1 + 1пРг) ^дхг.
Уравнение Эйлера, исходное для построения искомого управления и и определения функции д, имеет вид
г = 3 х2 +
дВх(Рг, х) _
дх ~2(^
В2(р;, х) + Гт(е 1)те 1Г = 0. (12)
где — белый центрированный гауссовский шум интенсивности _Ож.
Приведем выражение (9) к следующему виду: х = —х3 + е ® и + у, где е = |х 2х| а и = |д и|т.
Необходимо найти такой вектор и, который обеспечивал бы в текущий момент времени максимум информации о состоянии объекта, т. е. обеспечивал бы идентификацию функции д и синтез оптимального управления и. Для простоты дальнейших рассуждений в качестве меры информации рассмотрим функционал Шеннона. Тогда в соответствии с изложенным минимизируемый критерий принимает вид:
Выражение (12) позволяет найти искомый вектор
(13)
дх
который, в свою очередь, позволяет синтезировать уравнение для вектора и. С учетом вида функции (11) выражение (13) можно записать как
и = 1 еГр;.
2 ;
Отсюда получаем выражения для: оптимального управления и — хр;,
J = -
субоптимального управления и = | х рг ¿х
В рассматриваемом случае АПР р; описывается уравнением Стратоновича вида
ї = дх(х5р--) +1 ^ + 2% {3г(х2 — [х2р--*) +
+ 4 [ ( *4-*-х4]} - А(евр=) - ^Р;) - £<10>
и искомой функции — 4 - - хр;.
2 ;
После подстановки и в выражение (10) имеем:
2
хр - 1 х2р! + 1 ^ + Р; 2 ^ 2дх2
г то то
+ 2^- і 3^(х2 - | х2р;¿х) + 4 Г | х4р;¿х - х
(14)
где функция
Г - еи
(11)
введена для упрощения дальнейших математических преобразований.
Формируя условие оптимальности, имеем:
то Я
тах(-J) — тах\ | ^(1 + 1пр;)-р - ГТ(е 1)Те 1Г^
г
г
дГ
тгах\ | Г[1 + 1пр;]£(р;) - (1 + Іпр^
(1 + 1пр;) --х Г - ГТ(е 1)Те 1Г ] ¿х \ —
Для иллюстрации эффективности применения предложенного подхода было решено уравнение (14) методом прямоугольных сеток на интервале х е [—30, 30], г е [0, 200 с] с с равным шагом для всего интервала Ах = 0,1, Ау = 0,05 с при = 1,5; = 2. Значения Д^.)
получены в результате численного моделирования уравнений объекта и наблюдателя на интервале г е [0, 200 с] методом Рунге — Кутта 4-го порядка с шагом Дг = 0,05 с (управление и формировалось в масштабе времени поступления измерительной информации, т. е. для каждого временного шага моделирования г;).
В результате решения расчетное значение критерия J для найденной оптимальной функции управления и и идентифицируемой на основе разработанного метода функции д оказалось равным 4,5. А в случае эмпирически выбранной функции д (в тестовом примере
да'
то
Іто
да
то
Іл —то
да1
0
то
то
—то
—то
то
то
1 3
функция q была выбрана равной q = - x р _) оно оказа-
2 z
лось равным 2,5.
ЗАКЛЮЧЕНИЕ
Сравнительный анализ предложенного метода с уже существующими способами [7—12] управления объектами с априорно неопределенными структурами векторов состояния показывает, что он более точен, так как позволяет не только управлять подвижным объектом, но и достаточно точно идентифицировать структуру (1) в процессе его движения. Кроме того, он требует меньших вычислительных затрат по сравнению с подходом, рассмотренным в работе [1], и позволяет управлять объектами в отсутствие каких-либо допущений о характере шумов измерений.
ЛИТЕРАТУРА
1. Хуторцев В. В., Соколов С. В., Шевчук П. С. Современные принципы управления и фильтрации в стохастических системах. — М.: Радио и связь, 2001.
2. Тертычный-Даури В. Ю. Стохастическая механика. — М.: Факториал Пресс, 2001.
3. Казаков И. Е. Статистическая теория систем управления в пространстве состояния. — М.: Наука, 1975.
4. Бурлай И. В. Оценивание состояния маневрирующих объектов с использованием неклассических целевых функционалов и элементов регуляризации // Известия РАН. Теория и системы управления. — 2001. — № 1.
5. Пупков К. А., Неусыпин К. А. Вопросы теории и реализации систем управления и навигации. — М.: Биоинформ, 1997.
6. Чернов А. А., Ястребов В. Д. Метод оценки возмущений в алгоритмах решения навигационных задач // Космич. ис-след. — 1984. — Т. 22, № 3.
7. Ганеев М. Р., Погорелов В. А., Соколов С. В. Синтез системы навигации, содержащей управляемую гиростабилизирован-ную платформу на основе информационных критериев // Изв. РАН. Теория и системы управления. — 2002. — № 3.
8. Пелевин А. Е. Синтез робастного закона управления при неопределенностях параметров модели объекта // Гироскопия и навигация. — 1999. — № 2.
9. Сомов Е. И. Робастная стабилизация упругих космических аппаратов при неполном дискретном измерении и запаздывании в управлении // Известия РАН. Теория и системы управления. — 2001. — № 1.
10. Никифоров В. О. Адаптивное и робастное управление с компенсацией возмущений. — СПб.: Наука, 2003.
11. Небылов А. В. Гарантирование точности управления. — М.: Наука, 1998.
12. Arcak M. and Kokotovic P. Nonlinear observers: A circle criterion design and robustness analysis // Automatica. — 2001. — Vol. 37.
13. Интегрированные инерциально-спутниковые системы / Под ред. В.Г. Пешехонова. — СПб.: ГНЦ РФ-ЦНИИ «Электроприбор», 2001.
14. Дятлов А. П., Дятлов П. А., Кульбикаян Б. Х. Радиоподавление аппаратуры потребителей спутниковой радионавигационной системы «Навстар» сигналоподобными помехами // Изв. вузов. Северо-Кавказский регион. — 2004. — № 4.
e-mail: [email protected]
Статья представлена к публикации членом редколлегии
А.С. Манделем. □
Журнал «Информационные войны»
представляют Центр исследований проблем безопасности Российской академии наук и Центр проблем стратегических ядерных сил Академии военных наук.
Цель нового издания:
разработка теории информационного противоборства, научно-методических основ проведения информационных операций и противодействия информационной агрессии, освещение практики и истории информационных войн в экономике и политике.
Задачи:
S содействие в разработке теории информационного противоборства;
■S выявление угроз и источников информационной агрессии, разработка стратегий их нейтрализации и оценки рисков;
■S разработка методических документов, учебных пособий, инструкций, деловых обучающих игр, применение этих разработок на практике;
■S экспертиза проектов информационного противоборства и информационных войн в социально-экономических системах разной природы и масштаба — от предприятия и корпорации до государства и мирового сообщества.
Направления активности: фундаментальные исследования, прикладные разработки, научная публицистика, просвещение.
Основные рубрики:
■ теория информационного противоборства;
■ практика информационных войн в политике и бизнесе;
■ история информационных войн.
По вопросам распространения и подписки на журнал обращаться по тел. (495) 334-91-91, (495) 687-69-04; факс (495) 334-89-11; e-mail: [email protected]; [email protected]