Раздел V. Системы управления
УДК 519.283
Е.Я. Рубинович
ДОСТАТОЧНЫЕ УСЛОВИЯ ПОНИЖЕНИЯ РАЗМЕРНОСТИ ЛИНЕЙНЫХ ФИЛЬТРОВ СКАЧКООБРАЗНЫХ ПРОЦЕССОВ*
Для задачи оптимальной (в среднеквадратическом смысле) линейной фильтрации скачкообразного марковского процесса с N состояниями и известными переходными характеристиками, наблюдаемого на фоне аддитивной гауссовской помехи в дискретном и непрерывном времени, в общем случае размерность оптимального линейного фильтра равна N — 1. Однако для однородных процессов, когда переходные характеристики не зависят от времени, иногда удается понизить размерность фильтра, причем в некоторых случаях - вплоть до единицы. В работе приводятся достаточные условия понижения размерности оптимального линейного фильтра для однородного процесса как в случае дискретного, так и непрерывного времени. В прикладном плане рассматриваемые фильтры удобно использовать в задачах слежения за маневрирующими целями, когда маневр цели связывают со скачкообразным изменением некоторых ее динамических характеристик (скоростей, ускорений и т.п.), которые отождествляют с состояниями некоторого скачкообразного марковского процесса.
Марковские процессы; фильтрация; уменьшение размерности.
E.Ya. Rubinovich SUFFICIENT CONDITIONS FOR REDUSING-ORDER OF LINEAR FILTRATION FOR JUMP-WISE PROCESSES
It is well known that an optimal (in the mean square sense) linear filter for jump-wise Markov process with N-dimensional state-vector and blown transition matrix has a dimension А I. In cases when a transition matrix not depends on time it is possible sometimes to reduce the filter dimension. The paper deals with sufficient conditions for redusing-order of linear filtration for jump-wise Markov processes with N states. An example of possible reduction from A I up to dimension one is given. In applications the filters under consideration are used for state estimation in tracking problems with maneuvering targets where a maneuver is described by jump of some jump-wise Markov process with N-dimensional state-vector and known transition matrix.
Markov processes; filtering; dimension redusing.
Введение. Задача оптимальной (в среднеквадратическом смысле) линейной фильтрации скачкообразного марковского процесса с N состояниями и известными переходными характеристиками, наблюдаемого на фоне аддитивной помехи в дискретном и непрерывном времени рассматривалась в [1], [2]. В общем случае размерность оптимального линейного фильтра для такого процесса с N состояниями равна N — 1 [1]. Однако для однородных процессов, когда переходные ха-
* Работа выполнена при поддержке Программы Президиума РАН «Динамические системы и теория управления».
рактеристики не зависят от времени, иногда удается понизить размерность фильтра, причем в некоторых случаях - вплоть до единицы. В работе приводятся достаточные условия понижения размерности оптимального линейного фильтра для однородного процесса как в случае дискретного, так и непрерывного времени. Работа является продолжением [1], где приведены явные уравнения оптимального линейного фильтра в самом общем случае дискретно-непрерывного времени.
Постановка задачи. Пусть на стохастическом базисе (i2. F, F = (Ft)0<t<T- Р) с обычными условиями задан ненаблюдаемый скачкообразный марковский процесс Q — (Q(t))t>о с TV-мерным вектором состояний J — (о--|..... ctjv). Предполагается, что процесс Q однороден, т.е. матрица Л = | А,;| (с элементами A;J, i.j — l.N) переходных вероятностей (или интенсивностей переходов в случае непрерывного времени) не зависит от времени.
Как и в [1], определим индикаторный вектор-процесс /(£) — (f-| (/)..... /у(£))* с компонентами I,(/,) = I{Q(t) — г.,). г — 1. N. где I{-} — индикатор множества {■}. Далее все векторные процессы предполагаются вектор-столбцами, символ * означает транспонирование. В веденных обозначениях процесс О равен
(1)
где, в свою очередь, в дискретном времени £ = 0,1,2,... верно равенство [1]:
с последовательностью е(<) = (е1 ,е^(*)), представляющей собой мартингал-
разность, а в непрерывном времени индикаторный процесс допускает семимартин-гальное представление [1]
(3)
где M(t) = .. ,Mf/(t)) — квадратично интегрированный, чисто разрывный
мартингал относительно семейства F7 = (F/)f>0 и-алгебр F,1 = о-(Ц.ч), я < t) с квадратической характеристикой (М), = \{Mi: Ai,);||.
ГДб ' , ^ ^ .
При этом (здесь и далее Е — символ математического ожидания):
Е(МЙМ^ = - (АчРг(з) + \^(з))йз, г ф
./о
где вероятности р, (л) — Р{(}(з) — а, } удовлетворяют уравнениям Колмогорова:
Далее рассмотрим отдельно случаи дискретного и непрерывного времени, причем в случае непрерывного времени допустим возможность дискретно'-непрерывных
наблюдений. Итак, пусть в дискретном времени (I = 0,1,2,...) наблюдению за процессом (~) доступен скалярный процесс У — (У (¿))/>о, имеющий вид
(4)
где й — (¿(£))*>о - последовательность стандартных независимых гауссовских случайных величин, независящих от (¿. а £>=(&(£))*> о - заданная числовая последовательность «интенсивностей» помех в наблюдениях.
В случае непрерывного времени процесс наблюдений У может описываться следующими уравнениями: ^
где “в” - обозначает левосторонний предел, а процесс С = (С(*))^>о - квадратично интегрируемый мартингал (относительно Г), независимый от О. с квадратической характеристикой (0 = ('V';, ),>,■, и регулярными (т.е. непрерывными справа и имеющими пределы слева) траекториями. Уравнение (5) отвечает процессу непре-рывеых наблюдений, уравнение (6) - дискретно-непрерывным, а (7) отвечает дискретно-непрерывным наблюдениям с разными коэффициентами усиления для различных текущих состояний процесса (2. В (6) < 1,4 (■) представляет собой скалярную меру, допускающую разложение на непрерывную с1Ас( ) и дискретную А .4 (■ I составляющие:
при этом
Ті<І
где Ті — моменты скачков функции А (я), соответствующие моментам дискретных наблюдений. В (7) с1Л( ) - аналогичная векторная мера. Будем предполагать, что выполнены, так называемые, условия согласованности, т.е. существует с1Е{:,), -интегрируемая функция д{і) (скалярная в случаях (5), (6) и векторная в случае (7), что
(10) (11) (12)
Основные результаты. Выделим сначала тот случай, когда размерность линейного фильтра равна единице. Следующая теорема верна как для дискретного, так и для непрерывного времени.
Теорема 1. Пусть вектор J = (cti,..., ctjv) обладает следующим свойством:
где с 1, с-2 - константы, ah- вектор с единичными компонентами. Тогда оптимальный линейный фильтр для оценивания О имеет размерность единица.
Доказательство. 1. Дискретное время. Заметим, что h*I(t) и 1. Поэтому умножая обе части (3) на ■/*. получаем линейное рекуррентное уравнение для (¿i t ):
Этому рекуррентному уравнению, очевидно, отвечает одномерный линейный фильтр.
2. Непрерывное время. В этом случае Л Л — 0 и. следовательно, в силу (3):
(15)
где ,1*М(і) - мартингал с квадратической характеристикой Этому ска-
лярному линейному уравнению также отвечает одномерный линейный фильтр. □ Обратимся теперь к общему случаю. С этой целью рассмотрим последовательность векторов из йдг
Очевидно, что существует натуральное число г < N такое, что вектора:
(16)
линеино независимы, в то время как вектора являются линейно зависимыми. Эго означает, что
где с = (сі, С2,..., с,.) - ненулевой вектор, А = [7 | А7 | ... | Л’'~х7] - блочная матрица размера N х г, имеющая ранг г.
Обозначим далее через Сг - линейное подпространство, порожденное векторами (16), а через /і обозначим Лг-мерный вектор с единичными компонентами.
Следующая теорема справедлива для случаев дискретного и непрерывного времени.
Теорема 2. Оптимальный линейный фильтр в задаче оценивания процесса допускает понижение размерности до г, если Л, ф £т и до г — 1, если її Є С, .
Доказательство. Пусть Л 'т . В этом случае, очевидно, г < N — 1. Начнем с дискретного времени. Умножим обе части уравнения (2) на матрицу ,4 ':
Заметим далее, что в силу (17) где блочная матрица И размера г х г имеет вид
(20)
Здесь Е - единичная матрица размера (г — 1) х (г — 1).
Следовательно А*К*=В*А*. Введем вектор = (¿1 (¿)..... ^г(£)), где 2(1) = А*1(¿), т ~ 0. 1.2... Тогда рекуррентное уравнение (18) можно записать следующим образом:
При этом наблюдаемый процесс У = (У(£))4=1.2 . . имеет представление Поскольку (^(£) = _:1 (г), то линейный фильтр, очевидно, имеет размерность
Данный результат с сохранением обозначений переносится очевидным образом на непрерывное время. Так, вместо (3) и (5) имеем
I
Пусть теперь ¡г £ Сг и г > 3 (случай г < 2 охватывает теорема 1). Разложим к по базису в С г, за который примем столбцы матрицы А из (17)
где V — (VI,..., 1’г) — ненулевой вектор.
Начнем с дискретного времени. В этом случае Л/г = /г и, в силу (21), КАУ = АУ или (см. (19)) А(У — Г)У) — 0. Из линейной независимости столбцов матрицы 4 следует, что V — I)V = 0, т.е.
Откуда вытекает, что иг / 0. В силу (21) это означает, что в качестве базиса в Сг можно взять вектора ,1, Л,/...., ЛГ_2/¿. Далее, из (21) следует, что
где ^ ^
Определим теперь блочную матрицу А = [J | Л,/ | ... | Л' 2./]. В соответствии с (22):
АЛ = АЬ + сгН. (23)
где матрица Ь размера (г — 1) х (г — 1) имеет вид
Здесь Ё - единичная матрица размера (г — 2) х (г — 2), с — (с\,... .cr_i), Н = [010 |... | 01 h\ - блочная матрица размера N х (г — 1). Умножим далее обе части уравнения (2) на матрицу Ä*. Для Z(l) — Ä*I(t) с учетом равенства h*I(t) = 1 получаем ^
где /г, = (0, ...,0,1) G R7 -1. При этом наблюдаемый процесс допускает представление
Следовательно, линейный фильтр имеет в этом случае размерность г — I.
В случае непрерывного времени Ah. = 0, поэтому из (21) с учетом (19) получаем A.AV — 0 или ADV — 0. Из линейной независимости столбцов матрицы *4 следует, что DV = 0, т.е.
Откуда вытекает, что vr ф 0, т.е. в качестве базиса в Сг можно взять вектора / \ /....\ --I. !•. Сохраняя обозначения для дискретного времени, получаем (см.
(3). (5). (6)): ^ ^ ^ ^ ^ ^ '
где наблюдения Y(t) = j 5Л (s) ds + ((t)
Здесь Q(t) — zi (t), т.е. линейный фильтр в этом случае также имеет размерность г - 1. □
При понижении размерности уравнений фильтрации существенную роль играла замена переменных типа F* I\J ) — Z(t) с матрицей F. обладающей свойствами:
Так, при выполнении условий теоремы 2 F=A или А, (i = 1). или
Д d(t) = 0, или cr,h, а = 0. При этом размерность вектора Z(t) была г или
r-1. Возникает вопрос о существовании матрицы F размера N х m с m<r (или m<r-1), удовлетворяющей свойствам (24) и (25). Ответ на этот вопрос отрицателен. Чтобы установить этот результат нам необходима
Лемма 1. Г--,- - минимальное инвариантное относительно Л подпространство (т.е. Аи е Сг для любого и £ £, ). содержащее вектор J.
Доказательство. Пусть и £ £г, т.е. и — Av, где v £ К' и v Ф 0. Согласно
(19): ' Л \л 4 D С
поскольку Dv £ RT. т.е. С-г - инвариантное подпространство относительно матрицы А. Далее, пусть существует линейное инвариантное относительно А подпространство £- г,, с т < г — 1, содержащее J. В силу инвариантности Ст все вектора
(16) содержатся в Ст. Но система (16) линейно независима, что противоречит предположению т < г — 1.D
Предположим теперь, что существует отличная от А или А матрица F размера N х т (rank F = т < N). удовлетворяющая семействам (24), (25). Так как rank F — m, то столбцы f\,..., fm матрицы F линейно независимы и порождают линейное подпространство £т. Расмотоим далее два случая: h ‘I Ст и h £ Ст. где h - определенный выше .V-мерный вектор с единичными компонентами.
Пусть h <1 Сш . Покажем, что в этом случае линейное подпространство Сга \ \.
порожденное векторами j\.......fm, h, инвариантно относительно Л. Так как h -
собственный вектор матрицы Л, для этого достаточно проверить, что Л/; £ Lm ) 1 для i = 1, гп. В самом деле, ЛF — [ЛД | ... | Л/т], поэтому из (24) следует, что
где dj(t.) - i-я компонента вектора d(t), a g-t - i-й столбец матрицы G. Правая часть (26) представляет собой разложение вектора Л/j по базису h
подпространства jCm+i, т.е. Л/; £ Lm t \ и, значит, Cm+i - инвариантное подпространство.
Пусть теперь h £ Cm. Заметим, что из соотношения (25) следует, что
J = Fl + ah, (27)
т.е. J принадлежит £,,,+ . Но тогда по лемме 1 минимально возможное m = г — 1. Если h i_ £;n. то раскладывая h по векторам f , /,„ из (26), получим, что Afi £ ilm. т.е. Cm инвариантно относительно Л. Из (27) вытекает, что J £ £т. значит, согласно Лемме 1 минимальное m = г.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Рубинович Е.Я. Робастная линейная фильтрация скачкообразных процессов // Известия ЮФУ. Технические науки. - 2013. - № 3 (140). - С. 149-155.
2. Krichagina N. V., Liptser R.Sh. andRubinovich E.Ya. Kalman filter for Markov processes // In: Statistics and control of stochastic processes. - New York: Publ. Div., 1985. - P. 197-213.
Статью рекомендовал к опубликованию д.т.н. Е.П. Маслов.
Рубинович Евгений Яковлевич - Федеральное государственное бюджетное учреждение науки Институт проблем управления им. В.А. Трапезникова Российской академии наук; e-mail: [email protected]; 117997, г. Москва, ул. Профсоюзная, 65; тел.: +74953349111; зам. директора по научной работе; д.т.н.; профессор.
Rubinovich Evgeny Yakovlevich - Trapeznikov Institute of Control Sciences, Russian Academy of Sciences; e-mail: [email protected]; 65, Profsoyuznaya street, Moscow, 117997, Russia; phone: +74953349111; deputy director on R&D; dr. of eng. sc.; professor.
УДК 355/359
О.Ю. Аксёнов, Ф.Ф. Дедус, В.Б. Ларюхин, И.В. Майоров, С.П. Морозов, П.О. Скобелев, Д.Ю. Убоженко, В.Н. Федюнин
МОДЕЛИРОВАНИЕ ПРОЦЕССОВ УПРАВЛЕНИЯ РЕСУРСАМИ МОНИТОРИНГА КОСМИЧЕСКОГО ПРОСТРАНСТВА В МУЛЬТИАГЕНТНОЙ СРЕДЕ
Обосновывается целесообразность проведения комплексного моделирования в интересах создания и эффективной настройки мультиагентной системы (МАС) управления перспективными информационными ресурсами мониторинга космического пространства. Представлены принципиальные основы построения комплексной модели, выполняющей поставленные задачи. Рассматривается структура и функции основных компонент муль-тииагентной среды для создания прикладных систем моделирования процессов управления ресурсами для мониторинга космического пространства, включая мультиагентную платформу, адаптивный планировщик, конструктор онтологий, моделей и сцен, сцену миру, базу данных, интерфейс пользователя и другие компоненты. Показываются также особенности метода решения задач, основных классов агентов и логики работы агентов системы, компонент интерфейса пользователя. Обсуждается разрабатываемый прототип мультиагентной платформы, который состоит из редактора начальной сцены, генератора событий, очереди событий с заданием их классов, моментов их появления и поступления в систему, мира агентов (движка системы), базовых классов агентов и протоколов переговоров, визуальных компонент для редактирования параметров агентов и их отображения, экспорта и импорта данных, подсистемы логирования и трекинга сообщений и финансовых счетов агентов, а также некоторых других вспомогательных компонент. Предлагается подход к разработке специального аппарата диагностики и оценки эффективности функционирования применяемой МАС.
Мультиагентная среда; моделирование; информационные ресурсы мониторинга космического пространства; принятие решений; распределение ресурсов.
O.U. Aksyonov, F.F. Dedus, V.B. Laryukhin, I.V. Mayorov, S.P. Morozov,
P.O. Skobelev, D.U. Ubozhenko, V.N. Fedyunin
MODELLING OF RESOURCE ALLOCATION FOR SPACE MONITORING IN MULTI-AGENT SIMULATOR
In this paper the decision making process of allocation of resources for space monitoring is specified and discussed. The concept, architecture and functionality of multi-agent simulation system for modelling decision making process of allocation of resources is presented. The basic principles of the development of computerized models of resource allocation are introduced. The key components of multi-agent simulator are presented. One of the main components is multiagent scheduler which is able to re-schedule plans of resources in case of unforeseen events. Multi-agent scheduler is ontology-based for customization of agents logic for problem domain specifics. The developed prototype of simulator is discussed which contains scene editor, event generator, event queue, basic classes of agents and protocols of their negotiations, visual components for