Научная статья на тему 'СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ МАНЕВРОМ ОБХОДА ГРУППЫ ПОДВИЖНЫХ ПРОСТРАНСТВЕННЫХ ОБЛАСТЕЙ'

СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ МАНЕВРОМ ОБХОДА ГРУППЫ ПОДВИЖНЫХ ПРОСТРАНСТВЕННЫХ ОБЛАСТЕЙ Текст научной статьи по специальности «Математика»

CC BY
28
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ПОДВИЖНЫЙ ОБЪЕКТ / ГРУППА ПУНКТОВ СОПРОВОЖДЕНИЯ / АПОСТЕРИОРНОЕ ОЦЕНИВАНИЕ / СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ / ВЕРОЯТНОСТЬ СУЩЕСТВОВАНИЯ ВЕКТОРА СОСТОЯНИЯ / MOBILE OBJECT / GROUP OF MOBILE TRACKING UNITS / A POSTERIORI ESTIMATION / STOCHASTIC CONTROL / PROBABILITY OF EXISTENCE OF THE STATE VECTOR

Аннотация научной статьи по математике, автор научной работы — Соколов Сергей Викторович, Сахарова Людмила Викторовна, Манин Александр Анатольевич

Решена задача стохастического управления маневром подвижного объекта, обеспечивающим минимальную вероятность его попадания в область действия измерительных средств группы следящих за ним подвижных пунктов сопровождения. Управление подвижным объектом осуществляется на основе апостериорных оценок как вектора его собственного состояния, так и векторов состояния группы пунктов сопровождения, полученных по показаниям измерителей, расположенных непосредственно на борту объекта. Приведен пример, иллюстрирующий эффективность предложенного подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STOCHASTIC CONTROL OF THE MANEUVER TO BYPASS THE GROUP OF THE MOVING SPATIAL DOMAINS

The problem is solved of the stochastic control of the moving object maneuvering to minimize the probability for it to get into a coverage area of measuring devices of a group of mobile tracking units, keeping the track of it. The moving object control is realized based on a posteriori estimates of both the vector of its own state as well as the vectors of the state of the group of mobile tracking units, obtained from the readings of the measuring instruments located directly on an object board. An example is given illustrating the effectiveness of the approach proposed.

Текст научной работы на тему «СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ МАНЕВРОМ ОБХОДА ГРУППЫ ПОДВИЖНЫХ ПРОСТРАНСТВЕННЫХ ОБЛАСТЕЙ»

УДК 62-50 РС!: https://doi.org/10.25728/pu.2018.6.9

СТОХАСТИЧЕСКОЕ УПРАВЛЕНИЕ МАНЕВРОМ ОБХОДА ГРУППЫ ПОДВИЖНЫХ ПРОСТРАНСТВЕННЫХ ОБЛАСТЕЙ1

С.В. Соколов, Л.В. Сахарова, А.А. Манин

Решена задача стохастического управления маневром подвижного объекта, обеспечивающим минимальную вероятность его попадания в область действия измерительных средств группы следящих за ним подвижных пунктов сопровождения. Управление подвижным объектом осуществляется на основе апостериорных оценок как вектора его собственного состояния, так и векторов состояния группы пунктов сопровождения, полученных по показаниям измерителей, расположенных непосредственно на борту объекта. Приведен пример, иллюстрирующий эффективность предложенного подхода.

Ключевые слова: подвижный объект, группа пунктов сопровождения, апостериорное оценивание, стохастическое управление, вероятность существования вектора состояния.

ВВЕДЕНИЕ

Актуальная для подвижных объектов (ПО), функционирующих в условиях неопределенности, задача синтеза стохастического управления, обеспечивающего минимальную вероятность пересечения границ заданной пространственной области, на сегодня решена только для случая постоянных арг/ог/ известных границ последней [1—3]. В то же время в ряде практически важных случаев границы запрещенной целевой области могут изменяться во времени заранее неизвестным образом: при вынужденном движении (или дрейфе) пунктов сопровождения (ПС) данного объекта — следящих или управляющих, при незапланированной смене траектории ПС (например, для навигационных спутников), при изменении целевой пространственной области уже в процессе движения ПО, при преодолении объектом подвижных зон направленных помех (отслеживающих движение объекта) и др.

Более того, при наличии нескольких ПС, функционирующих одновременно и независимо друг от друга, запрещенных областей с подвижными центрами может быть несколько, причем в общем случае эти области пересекаются.

Решение подобной задачи требует уже иных подходов, среди которых наибольшее распространение получили игровые [4, 5]. Но сложность реализации в общем случае существующих в настоя-

1 Работа выполнена в рамках государственного задания № 1.11772.2018/11.12.

щее время игровых алгоритмов в бортовых вычислителях не позволяет обеспечить их практическое применение в многоразмерных динамических объектах, приводя к необходимости разработки новых методов управления, ориентированных на конкретный характер движения ПО и его ПС, а также алгоритмов их взаимодействия. Отметим, что в игровой постановке случай одновременного и пересекающегося взаимодействия сразу нескольких независимых игроков до настоящего времени не рассматривался.

В связи с этим рассмотрим далее один из возможных путей решения подобной задачи, сделав допущения:

— управление ПО осуществляется на основе апостериорных оценок как вектора его собственного состояния Х, так и векторов состояния каждого /-го, / = 1, ..., М, ПС у, полученных по показаниям измерительного комплекса (ИК), расположенного непосредственно на борту ПО;

— каждый /-й ПС имеет свой ИК, который обеспечивает получение точной информации о параметрах состояния ПО;

— сопровождение ПО осуществляется всеми независимыми друг от друга ПС по законам, линейно зависящим как от вектора скорости параметров состояния ПО, так и от самого вектора состояния ПО (как показано далее, линейный характер указанной зависимости не оказывает принципиального влияния на методику решения задачи и используется далее лишь для наглядности процедуры формирования искомого закона управления).

Опираясь на перечисленные допущения, вытекающие из реальных условий практического применения большинства известных комплексов сопровождения ПО, дадим постановку описанной задачи.

ПОСТАНОВКА ЗАДАЧИ

Пусть N-мерный вектор состояния Х сопровождаемого ПО описывается стохастическим нелинейным дифференциальным уравнением:

X = f(X, t) + f0(X, t)U(X, Y, t) + f1(X, t)S, (1) X0 = Д^

где f, fo и f — известные нелинейные векторная и матричные функции размерности, соответственно, N, Ns N и Ns L; S — L-мерный белый нормированный гауссовский вектор-шум; U(X, Y, t) — искомый N-мерный вектор управления, формируемый на основе апостериорных оценок векторов

состояния ПО X и ПС Y = | Yf Yf ... и зависящий только от них, а N-мерный вектор состояния /-го ПС Y, соответственно:

Y = Ф/Y, t) + a,.(t)Фо(.(Y, t)X + рг(?)Ф,.(Y, t)X +

+ Ф2,.(Y, t)Zi, y = %), (2)

где Ф,, Ф0 , Ф, и Ф2 — известные, определяемые

1 i i i

физико-техническими особенностями /-го ПС нелинейные векторные и матричные функции размерности соответственно N, P, s N, P2 s N, N s K;

a,, p,. — известные временные матричные функции, определяющие динамику сопровождения ПО, размерности соответственно Ns P Ns P2; Ç. — K-мер-ный белый нормированный гауссовский вектор-шум, / = 1, ..., q; при формировании вектора состояния /-го ПС в соответствии с уравнением (2)

принимается допущение, что векторы X , X при организации процесса сопровождения для каждого /-го ПС известны точно.

Движение /-го независимого ПС наблюдается измерительным комплексом ПО с помощью /-й группы соответствующих датчиков внешней измерительной информации, вектор выходных сигналов Z0 которых описывается в общем случае нелинейным стохастическим уравнением:

Zoi = Hoi (Y, t) + Woi, / = 1, ..., q, (3) где H0 — известная нелинейная вектор-функция размерности S0 , определяемая типом применяемых датчиков внешней информации; W0 — белый

>TiT .

гауссовскии центрированный вектор-шум размерности с матрицей интенсивности . Одновременно ИК подвижного объекта позволяет наблюдать параметры собственного движения с помощью, например, автономных измерителей, описываемых нелинейным уравнением:

2 = Н1(Х, /) + (4)

где Z1 — вектор выходных сигналов измерителей параметров собственного движения ПО размерности Н1 — известная нелинейная вектор-функция измерения размерности Ж1 — белый гауссовский центрированный вектор-шум размерности с матрицей интенсивности определяемой уровнем помехи измерения параметров состояния ПО.

Очевидно, что использование информации, содержащейся в уравнениях (1)—(4), позволяет применять для определения текущего состояния как ПО, так и любого /-го ПС, существующий аппарат теории стохастического оценивания [6]. Для возможности его эффективного применения предварительно сделаем следующие построения. Совокупность наблюдений (3), (4) представим в виде единого (обобщенного), наблюдателя

2;. = НО, ^ 0 +

где — вектор выходных сигналов обобщенного наблюдателя — датчиков измерительного комплекса ПО — размерности S¡ = + ¿0. ; Н — известная нелинейная вектор-функция наблюдения;

— центрированный белый гауссовский вектор-шум с матрицей интенсивности / = 1, ..., q. Также объединим уравнения (1), (2) в единую систему,

выразив вектор X в правой части (2) с помощью его представления (1):

/о( X, О Уо,(Х, Y, О

f( X t ) X Y, t)

+

U( X, Y, t) +

+ (X, Y, t)

^(X, Y, t) = Ф i(Y, t) + a(t)ф0, (Y, t)f(x, t) + + e/t) ф1(. (Y, t)X,

^0,. (X, y, t) = a(t) Фо; (Y, t)f0(X, t),

(X, Y, t) =

fi (X, t) a К t)Фо,( Y, t)fi(X, t)

i = 1, ..., q.

0

ф 2 ( Y, t )

Из всех существующих алгоритмов оценивания наибольшее практическое распространение получили алгоритмы на основе расширенного нелинейного (обобщенного) фильтра Калмана [6], что обусловлено прежде всего тем, что они позволяют осуществлять оценку динамических объектов произвольной размерности, а также тем, что принятое при его синтезе предположение о гауссовости апостериорной плотности вероятности (АПВ) вектора состояния обеспечивает максимальную точность оценивания последнего при минимуме информации о параметрах состояния (т. е. в условиях максимальной априорной неопределенности) [7]. При-

т

меняя для оценки расширенного вектора (X, 1) алгоритм обобщенного фильтра Калмана [6], имеем:

= Ф; + ф0 и + Kizt - H),

K = R.

dHi . dHi aX ' д Y

D

-1

W,-

R t = G. +

( дФ,

о,-

д( X, Y)

( дФ,

t ® U\ Rt + Rt

о

д(X Y)

О U ,

i = 1, ..., q,

G =

Ф

д(X Y)

• + R -

T i

дФТ

д(X Yi)

+ ^i ; < - KiDwi KT,

Ф =

f ^t

= M

Xo

Yo

о

R0 = M

Xo XXo ] ( Xo Xo

Yo,- Yo,. J V Yo Yo,.

где Щ — апостериорная ковариационная матрица;

® — знак блочного умножения матрицы на вектор, / = 1, ..., q. Ввиду того, что дальнейшее решение задачи предполагает операции с вектором параметров АПВ рр преобразуем матричное уравнение для апостериорной ковариационной матрицы Щ в векторное, воспользовавшись введенной в работе [8] операцией (V) преобразования произвольной матрицы 0 размерности т х п в вектор 0(К):

0¥) = !0ц 021 ... 0т1 012 022 ... 0*2 ... Оп ... 0т„!Т

где 0.. — элементы матрицы 0, а также соответст-

и

вующими правилами и операциями матричной алгебры, приведенными в Приложении 1. Окончательно имеем:

(XT, Yt, R( V) )T =

Ф i + K(Zt - Hi)

G (

(V)

+

U =

= Bt + Bo. U, i = 1, ..., q,

(5)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Go = (Rt О E)

Ф

о,-

+ (E О Rt)

Фо

1д X YO tJ

х; у{у

/ = 1, ..., q, «*», «**» — операции с матрицами, определенные в Приложении 1; ® — знак кронеке-ровского произведения; Е — единичная матрица соответствующей размерности,

B,. =

Ф t + Kt( Zt - Hi)

G (

(V)

Bo =

Фо

Go,

Таким образом, оценка расширенного вектора состояния ПО и его 1-го ПС, наблюдаемого измерительным комплексом ПО, может быть описана векторным уравнением (5), представленным в виде, удобном для последующего решения исследуемой задачи.

Формируемая в процессе движения ПО текущая оценка навигационных параметров как ПО, так и ПС, позволяет сформулировать задачу поиска управления ПО и(X, У, ^ как задачу синтеза управляющего вектора и, обеспечивающего минимальную апостериорную вероятность существования вектора состояния ПО Х в области, ограниченной размерами сферы общего действия средств наблюдения всех ПС. В свою очередь, апостериорная вероятность Р нахождения вектора Х в сфере пересечения областей наблюдения всех ПС определяется известной формулой вероятности q совместных независимых событий:

P = I Pt - I PtPj + (-1)K- 1 I Ph Pt2 ...PtK +

t= 1 t<j

h < ■■■ < 1K

+ (-1)q 1Pi ... P

где Pi — апостериорная вероятность нахождения случайного вектора Х в области наблюдения i-го ПС, векторные размеры которой известны apriori и неизменны на всем интервале времени движения ПО: [Dtmin, Dtmax] = const, а параметры движения

центра описываются вектором Y. В силу сделан-

о

о

ного выше предположения о гауссовском характере АПВ рг вектора состояния Х ПО:

Pi = P(X X, RiN) =

:exp j -1 (X - X )TR-jN( X - Xt)

J( 2 n)Ndet Ri

iN

RiN =

Rill Ril2 ••• RilN Ri2l Ri22 ••• Ri2N

RiNl Ri

iNl Ri2N ••• RiNN

RiN

где Р^. — к/-й элемент матрицы Я, выражение для Р1 в данном случае имеет вид:

Р = Р( X, Ъ, Я/ж) = 1

7( 2 n)Ndet RiN s J expj -1 (X- X)TR-N(X-X')l dX =

масштабирование всех составляющих функционала (6).

Исходя из изложенного, задачу синтеза управления ПО (1) сформулируем как задачу поиска вектора и, обеспечивающего минимум функционала / (6) при условии, что векторы параметров X,

X, ЯР, определяющие функционал (6), описываются системой q уравнений вида (5).

РЕШЕНИЕ ЗАДАЧИ

Для решения поставленной задачи воспользуемся известным фактом, что при неотрицательно определенной критериальной функции (как в рассматриваемом случае) для обеспечения ее минимального значения в каждый момент времени достаточно, чтобы производная ее по времени, взятая с обратным знаком, имела максимум [7, 9].

Для исследуемого функционала (6) предварительно имеем:

J p(X, X, R^

При окончательном формировании минимизируемого функционала учтем, что в силу ограниченных энергетических возможностей ПО при синтезе управления неизбежно введение ограничения на модуль вектора управления и, которое при формировании управления на текущем временном интервале может быть, например, задано в

виде условия минимума величины |итиШ [7, 9].

Тогда минимизируемый функционал /, отвечающий условиям поставленной проблемы, можно записать как

£ + й

q I гшах А

/ = £ | р(Х, X, Яш)йХ -' = 1 £ - д..

г г mm

Y + D-

±] jmax

£ J p(X X, RiN)dX J p(X, Xj, RjN)dX +

i < j Y- - D

г imin

Y - D ■ ■

±] jmin

YYi + D,

+ (-1)q 1 Y J P(X, Xi, RiN)dX •••

Y1 - D, min

Y + D

q qmax

J p(X Xq, RqN)dX + ц JUT Udt, (6)

YY - D

q qmin

где ц = const — нормировочный множитель, обеспечивающий единую физическую размерность и

J = P + цUTU = £ P{ - £ (P{Pj + PiPj)

i = 1 i < j

(-1)? - 1(

+ P Pi) +

i ^ N i j i ...

i = 1 i < j

+ (-1)i_1(P1 P2 ••• Pq + P1 P2 ••• P, + P1P2 ••• ^q) +

(

+

цUTU = £ Pi

i = 1

q

„ - ] "

+ (-1)q 1 п j

j = 1 j * i

1 - £ Pj + £ PA +

j = 1 j < к

j * i j, K * i

+ цUTU = £ Li + ^TU, i = 1

где Li = L^p •••, Pi - l, Pi + p •••, Pq) = Li(XK, yk, Rk K = 1, •••, q; K * /)•

Раскроем далее выражение для функции Pt, i =1, •••, q. Учитывая зависимость от времени вектора Yi (t), приведенное выше явное выражение для р, а также что [Dimin, Dimax] = const, по формуле обобщенного дифференцирования по параметру (формуле Лейбница) имеем:

Y + D

г imax

+

P =

5

J dP ( X X j, R iN) dX +

dt

d( ^i + Dimax) - D... - 5

d( i^i - Dimin)

J p(X, , Rm)dX-

Y,- -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

J p(X, X, RN)dX-Y{ •

Y -D

г imin

Y -D

г imin

Г + D г imax

Y -D

г imin

Y + D-г imax

0

Обозначая далее вектор-строки как

У + У + Л,,

■V + Л,„

д

д( У + Атах)

| | ... | р(х1, Х2, Хщ х, —ХЩ =

Ч -^/тах/ у, - Л . у. - Л

1- гшт^ 2- л

у + уы + Л;™

Улг - Д„,;„

I р( У1(. + А'тах1 ' Х2' ..., Х№ X' Л/Щ)—Х2 ... —ХЩ

у2(. -

у + Л™ у + л„

УМ1 - Л('шт

УЛГ + Л,т-а

| | ... | Р(Х1, У2(. + А'тах2 ' Х3' ...» ХЩ' X' Х1—Х3 ... —ХЩ

У1(.- Л1шш1 У3,,- Л(тт3 УЛГ(.- Лй

У1 + У + Ум 1 +

1 1

| р(Х1, Х2, ..., % - 1, Ущ. + В/тахш, X, ... —Хдг - 1

У1.- Л1шш1 У2,- Л('шт2 УЖ - Л('шт

N 1

= Р ( У + Атах' X ' Л/щ)

д

У1; - Л1шш1 У2,- Л('шт2 уж.- Л<шш

N

д( У - Ат1п)

1 1 ... 1 Р(Х1' Х2' ...' ХЩ' X' Х1—Х2 ... —ХЩ = Р ( У/ - Ат1п' X'

/ ^7тт/ -У + ^ У + Л

1,. + л('шах1 у2, + Лгшах2 УАГ(. + Л('шах

N

а также учитывая, что — р(Х, X, Л/лг) =

др др X

д^- дл/-«1 /? (р)

где Л/Щ = ЕхЛ( ^ , Ех — бинарная матрица раз-

мерности N х 4^2 (структура матрицы Ех, выражения и др приведены в Приложении 2), выражение

Х дX дЛр

для функции Рг представим далее в виде:

Р =

др др —X X-

дХ дл/щ Ех ^ (■ *

+ [ р ( У + Атах' X' - р ( У - Ашп' X' Л«)]1/ =

-шах ^

1 ^р- —х

л дХТ,-

р ( У + Атах' X' - р ( У - Ашп' X'

где Еу« — единичная матрица размерности 2Д

I -шах ^

р

У 1 дЛ¥)

у.- Л- ■ д л/щ

I ,ш т

—X

Е2 N 0 0 Ех

X

У/ = А

а (. ^

А =

1 ^р- —X

л дХ

р ( У + Атах' Х-' - р ( У/ - Ат1п' X' Л/щ) Окончательно с учетом вида правой части уравнения (5):

, -шах ^

р

■у. - л. ■ д Л/щ

I ,ш т

—X

Е2 N 0 0 Ех

р/ = + ААи.

■У- + л

, -шах

У - Л ■

I ,ш т

■У- + Л, -шах

Возвращаясь к приведенному выше выражению для функционала /, получаем:

q £

i = 1

J = £ + ABoU) + цUJu = £ LABi +

q £

i = 1

+

q

V = 1

£ LAB0iI U + цUTU = A* + AU + цUTU,

A* = A*( X, Y, R(V)) = £ LjAiBi.

i = 1

A = A(X, Y, R(V)) = £ L^

= | т ¿Vт ¿.р т|т,

откуда искомый вектор субоптимального управления и, доставляющий тах(— /), определяется из т

уравнения: —А — 2ц и = 0, т. е.

U = - -1 AT^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

опт 2 ц

(7)

Система q уравнений, определяющих динамику расширенных векторов оценивания после подстановки выражения для иопт (7) в формулу (5), окончательно имеет вид:

(X , X, ¿р )т = Б — 2Ц В0. Ат, / = 1, ..., q. (8)

Таким образом, управление иопт (7), сформированное по показаниям измерительного комплекса ПО и решению системы уравнений оценок (8), обеспечивает принципиальное решение поставленной задачи. Для иллюстрации возможности практического применения предложенного подхода рассмотрим пример.

ПРИМЕР

Движение центра масс (ЦМ) воздушного ПО относительно Земли в географической системе координат (СК) описывается известной системой уравнений навигации [10]:

i

ф —

h

,-1

0 0

[(R + h) cos ф]

0 (R + h)-1 0

0 0 1

= /0(ф, h) V, (9)

где Х0 = Х(г0), ф0 = ф(г0), к0 = й(г0), X, ф и к — долгота,

-1

широта и высота ЦМ;

0 0

[(R + h) cos ф] 0

0 0 1

I т

(R + h )-1 0

= /0(ф, к), R — радиус Земли; V = \у Уу у| , V, г = х, у, г — проекции линейной скорости ЦМ на оси его сопровождающей СК (ССК) [10], формируемые далее по показаниям ИК на основании только вектора оценок навигационных параметров ПО \ X, ф , к \ т и ПС:

У = У(X, ф , к, ..., г). Движение ЦМ следящих за ним двух наземных ПС задается аналогичными системами навигационных уравнений в той же (географической) СК:

i = 1 i н

X = |XT XI ... XT|T, Y = jYf YT . YT |T q ф H,

(R cos фн) 0

0

R-

гн

= Ф0 (Фн )Vh,(10)

Хяы = 'кн1 (г0)' Фн01 = ФН; (г0)' г = 1' 2 и фН — долгота и широта г-го наземного ПС,

(R cos фн) 0

0

R

-1

н т

= ф0 (Фн), Vh = IVH vH

есть вектор скорости г-го ПС, формируемый на основании точной информации о движении ПО. При этом формирование вектора скорости УН на практике осуществляется или по текущим измерениям непосредственно вектора скорости V ПО (например, с помощью радио- или оптикометрических средств ПС), или по информации от внешних средств измерения (ИСЗ, стационарных наземных измерительных пунктов и пр.) о текущих значениях долготы X, широты ф и высоты к ЦМ

и скорости их изменения (X , ф , к).

В первом случае вектор скорости V ПО измеряется в ССК пункта сопровождения, что при формировании закона сопровождения требует учета взаимосвязи вектора скорости ПО V в ССК подвижного объекта с его значением V * в ССК пункта сопровождения: V * = С(АХ, Аф, 0) V, С(АХ, Аф, 0) — матрица направляющих косинусов второго рода [10], зависящая от углов Эйлера — Крылова — углов взаимного разворота (АХ = X — Хн; Аф = ф — фн; 0) ССК пункта сопровождения и ССК подвижного объекта. Закон изменения скорости VH г-го

ПС — закон сопровождения, в этом случае может быть записан как

Vн¡ = у0. (г) + ао; (г)С(АХ,, Аф,, 0) V, (11)

где у0 (г) и а0 (г) — известные нелинейные временные

векторная и матричная функции размерности, соответственно, 2 и 2x3.

q

q

x

x

Во втором случае закон сопровождения формируется, как правило, в виде:

Ув. = у,(О + «,'(0

+ Р,(0

Ф1.(АХг, Дф,, г) Ф2(А^;, Дф;, О

где у;(0, а,(г), в,(0 — известные временные векторная и матричная функции размерности соответственно 2, 2x3 и 2x2; Фу, г, ] = 1, 2 — известные нелинейные функции, зависящие от конкретного вида ПС. Так как последнее выражение может быть представлено с учетом уравнения (9) как

уш = У,« + а,«/о(Ф, К)У + в,«'

Ф1,(Х - Хн, ф - фя,, I) Ф2- Ы' Ф - Ф н> г)

(12)

имея при этом более общий вид по сравнению с законом (11), то при последующем решении задачи будем пользоваться именно им. Тогда, подставляя выражение (12) в выражение (10) и объединяя с уравнением (9), имеем расширенный вектор состояния ПО и г-го ПС, подлежащий дальнейшему апостериорному оцениванию:

(X, ф , Н, X н., ф н ) =

0

+

Фо/Уг + Фо(Р,(Ф1, Ф2,)

или в принятых ранее обозначениях:

(X , ф , Н, Xн., фн )Т =

/о Фо,аг/о

У(X , ф, Н, Хн, фн, 0, г = 1, 2,

0 + /о

и,

(13)

где = Фо у,- + Фо в,( Ф,, Ф2) , = Фо а/ и = V Комплексирование на борту ПО астронавигационных, оптических, радиолокационных и других ИК позволяет осуществить наблюдение не только собственных навигационных параметров ПО, но и параметров г-го ПС [11]. В общем виде такой вектор 2, выходных сигналов ИК может быть представлен в виде [11]:

2,. = Н(Х, ф, Н, Хн , фн , 0 + Ж, г = 1, 2,

(14)

Н — известная нелинейная вектор-функция размерности не меньше 5 (как правило, существенно больше); Ж _ центрированный белый гауссовский вектор-шум с матрицей интенсивностей Бш Гауссовская оценка вектора (13) по показаниям ИК (14) имеет вид:

X, ф , Н, X н, ф н I =

0

^;(фн'н' ^ ф' г)

+

/о(ф, Н) ^п (ф н, ф, Н, г)

К- = к,

дНг дНг дНг дНг дН1

дX дф дН дXн дф

и + - Н( X, Xн, ф, ф н, н , г)],

,

к, = /Я. + Я/Т - КР- К + (/о. ® и)к,. + Я(^о. ® и)Т, г = 1, 2,

/ =

Фо в;

дФ, дФ, дФ,.

дX ... Фо вг дф: .0.Фо ,в;

дФ 2 , дФ2. дФ2.

дX дф:

дФо

дфн

У г + в г

Ф1

Ф2

Фо в,

дФ,

дф И,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

дФ2 _2

дф: н

/ , =

0 д/-о д/-о 0

дф: дН

0 Фо, а;/ дф: Фо, а/ ' дН 0 дФо, , —а/о дф: н

0

Приводя матричное уравнение для Л, к векторной форме, получаем расширенный вектор оценок:

i ф

h

i н, ф н

R;

+K[ Z - Hi]

у,

(FiRi )(V + (R,.Ff)(V) - (К, Dw

(R, ® E)F0* + (E ® R,)FT

U.

При формировании минимизируемого функционала / полагаем, что зона действия средств слежения обоих ПС одинакова и определяется как [— 0,05; +0,05] (рад), [фЯ. — 0,035; + 0,035] (рад), к,. = 18 х 10 м, I = 1, 2, тогда

J =

+ 0,05 ф„ + 0,035 18 . io3

- 1 J J J ехР

2n)3detR13 -0,05 ф^ -0,035 0

XHi + 0,05 Фн2 + 0,035 18 . 103

J J J exp

Ф1

Л T

R

13

7(2n)3detR23 ^H2 -0,05 фн2 -0,035 0

XH + 0,05 фн + 0,035

18 . 10

J J J exp

2n)3detR13 ^н1 -0,05 фн1 -0,035 0

Л T

R

Ф1

T

R

Ф1

Ф1

didpdh +

didpdh —

didpdh x

+ 0,05 фн + 0,035

18.10

J i J eXP

7(2n)3detR23 ^н2-0,05 фн2-0,035 0

T

R

didpdh + ц J UTUdt.

Согласно найденному выше закону управления (7), уравнения оценки (8), необходимой для его реализации, имеют

вид:

i ф

h

i н, ф н

Ri

+к,[ Z, - H, ]

у,

(F; Ri)(V) + (Ri FT)(V) - (KiDw *ТГ

--1--

/0 Ф0«/0

(R, ® E) F0* + (E ® R,) F*

•AJ, i = 1, 2,

где структура матрицы А для Ж-мерного случая (здесь N = 3) приведена выше при выводе выражения (7).

Для оценки эффективности синтезированного закона управления (7) в рассматриваемом случае было проведено численное моделирование движений ПО и ПС на временном интервале [г0, у = [0; 1000] (с) при начальных значениях векторов состояния и параметрах законов движения:

Хн = 0,8 рад, фн0 = 0,75 рад, Хн = 0,6 рад, фн = 0,6 рад, у,. = 0,

«ХО =

<2 'Л

0 0 0

<4-Л

, aj = 6,73; = 6,5;

0

+

+

х

0

0

в,(г) =

1 0 0 2,2

, Фь = X - , !0 = 0,7 рад,

ф0 = 0,68 рад, Ф2 = ф - фн, Н0 = 10-103 м, Н < 15- 103 м,

н=

0,8

0,5 0 1,2 0 0,7

0,7

ф Н

фн

рж =

4 ■ 10-

7 ■ 10-

0,5

8 ■ 10-

8 ■ 10-

г = 1, 2,

начальные значения вектора оценок выбирались равными их истинным значениям. В результате моделирования было установлено, что при отсутствии управления ПО наблюдается монотонное сближение значений навигационных параметров ПО и каждого из ПС: по окончании процесса движения отклонения параметров составили — по долготе А! = тах(|! - |) - 11 % от первоначального отклонения, по широте Дф = тах(|ф - фн |) - 16 %.

При наличии управления ПО сближения навигационных параметров не наблюдалось на всем интервале моделирования, по окончании движения отклонения параметров превысили первоначальные соответственно: min(ДXJ.) — в 2,7 раз, тт(Дф,.) — в 3,5 раза. Вычисленное с помощью метода Симпсона 4-го порядка в момент гк значение вероятности существования вектора состояния ПО в области действия средств слежения ПС при отсутствии управления превысило при этом значение аналогичной вероятности при наличии управления ~ в 4,95 раза.

Базовая операция — правило формирования вектора г> из элементов Qij некоторой матрицы Q размерности т х п [6]:

= \QnQn-QmQnQn-Qma-Q

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Операции над матрицами

Определение вновь введенных операций:

• операция ](л) = Q;

• преобразование «*» блочной матрицы В = |В1: В2:...; Вп| в блочную матрицу

В1

В

В,

^ В *;

• преобразование «**» матрицы В в матрицу

„г (л) Т

[(В(Т1))(^

Г (л) (

[( В(2))() ] ^ В *

Г (л) (

[(В(Г„) Л

т Т

где В(г) — г-й столбец В .

Алгебраические соотношения

• (Л£С)(К) = (СТ ® ® — символ кронекеровского произведения, А, 5, С — обыкновенные матрицы;

• ОУй)^ = 5 *Н;

• (йТ5Т)(^) = 5 **Н;

• 5(Е ® НТ) = 5 ® НТ, 5(НТ ® Е) = НТ® 5, Е — единичная матрица.

ПРИЛОЖЕНИЕ 2

Структура матрицы Ех:

ЗАКЛЮЧЕНИЕ

Приведенные результаты позволяют сделать вывод о возможности эффективного практического применения разработанного подхода как в существующих, так и в перспективных системах управления подвижных объектов, ориентированных на преодоление подвижных пространственных областей.

ПРИЛОЖЕНИЕ 1

Для возможности решения задач анализа матричных уравнений и использования их в процедуре синтеза оптимального управления необходимо дальнейшее расширение поля операций матричной алгебры.

С этой целью рассмотрим следующие операции и определения.

Ех =

Е (1)

р(2) -ло

3) ■^ло

Е (N

Ж2.

где Ело = : 0^], Еы — единичная матрица размерности N 0^- — нулевая матрица размерности N.

др =

д!

■ 1 ехр\ -1(Х - X)Тк^ (X - X) 1 х л/(2п)лёе1кл 1 2

х (X - X )Тк^

X

0

0

0

0

dp =

.2 J ( 2 п) NdetR

N

1

expJ --- (X- X)tRn1 (X- X)

2

(X - X )T( Rn1 E

RN )(X - X )

1

detR

{rSV }t

N

где обозначения: Е* = Д ®Ем; Е2®Ем;...; Ет®Е^|, Е — г-я строка матрицы Е№ Е^ — единичная матрица размерности Ж; ® — символ кронекеровского произведения матриц; ® — символ блочного умножения матриц; Лл — матрица алгебраических дополнений матрицы Л.

При выводе приведенных выражений были применены правила многомерного анализа линейных систем, полученные ранее в работах [7, 8]:

d С } Q- = { öAV) Q — некоторая произвольная

не-

öQ

особенная матрица размерности m s m;

dQ~1 = -Q-1 dQ

Q s — некоторый вектор;

as

as

^ = |E,®E;E2®E;... iE ®E| = E*, E. — i-я строка

n(v) 1 2 m *

öQ

единичной матрицы Е.

ЛИТЕРАТУРА

1. Алехин Д.В., Якименко О.А. Синтез алгоритма оптимизации траектории полета по маршруту прямым вариационным методом // Изв. РАН. Теория и системы управления. — 1999. — № 4. — С. 43—51.

2. Соколов С.В., Щербань И.В. Локально-оптимальное управление спуском космического аппарата // Космические исследования. — 2000. — Т. 38, № 4. — С. 432—436.

3. Маслов Е.П., Абрамянц Т.Г., Рудько И.М., Яхно В.П. Уклонение подвижного объекта от обнаружения группой наблюдателей при малых отношениях сигнал/помеха // Информационно-управляющие системы. — 2011. — № 2. — С. 2—7.

4. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. — М.: Физматлит, 1974. — 458 с.

5. Сысоев Л.П. Критерий вероятности обнаружения на траектории в задаче управления движением объекта в конфликтной среде // Проблемы управления. — 2010. — № 5. — С. 73—79.

6. Тихонов В.И., Харисов В.Н. Статистический анализ и синтез радиотехнических устройств и систем. — М.: Радио и связь, 2004. — 608 с.

7. Соколов С.В., Ковалев С.М., Кучеренко П.А., Смирнов Ю.А. Методы идентификации нечетких и стохастических систем. — М.: Физматлит, 2018. — 471 с.

8. Чернов A.A., Ястребов В.Д. Метод оценки возмущений в алгоритмах решения навигационных задач // Космические исследования. — 1984. — Т. 22, № 3. — С. 372—381.

9. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. — М.: Наука, 1975. — 432 с.

10. Соколов С.В., Погорелов В.А. Стохастическая оценка, управление и идентификация в высокоточных навигационных системах. — М.: Физматлит, 2016. — 264 с.

11. Боднер В.А. Приборы первичной информации. — М.: Машиностроение,^!. — 344 с.

Статья представлена к публикации членом редколлегии Б.В. Павловым.

Соколов Сергей Викторович — д-р техн. наук, профессор, Ростовский государственный экономический университет, Н s.v.s.888@yandex.ru,

Сахарова Людмила Викторовна — д-р физ.-мат. наук, профессор, Ростовский государственный экономический университет, Н L_Sakharova@mail.ru,

Манин Александр Анатольевич — канд. техн. наук, вед. науч. сотрудник, доцент,

Московский технический университет связи и информатики, Н manin1@rambler.ru.

х

х

Читайте в ближайших номерах

S Алескеров Ф.Т., Тверской Д.Н. Моделирование влияния внешней среды на возникновение специализации в абстрактных системах

Глущенко А.И. Адаптивный нейросетевой настройщик ПИД-регулятора для управления нагревательными печами

Дорри М.Х., Рощин А.А., Середа Л.А. Визуализация движения подводного аппарата по траектории Кузнецов Д.С., Котеленко С.А., Пятецкий В.Е. Идентификация операционной модели управления производственным комплексом

Мелехин В.Б., Хачумов В.М. Многоуровневая модель ситуационного управления сложными технологическими процессами

Сидельников Ю.В., Ряпухин А.В. Повышение эффективности совещаний в малых группах. Ч. 2. Нестандартные подходы к проблеме

Суховеров В.С. Система автоматической обработки тематически ориентированных текстов с терминологическим словарем в формате регулярных выражений

Трошин Д.В. Методический подход к моделированию рационального сценария обеспечения экономической безопасности России в долгосрочной перспективе

Угольницкий Г.А. Методология и прикладные задачи управления устойчивым развитием активных систем

•/ Шевыренков М.Ю. Оценка влияния активных прогнозов на рынки энергоносителей на примере европейского рынка газа

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.