Научная статья на тему 'Уклонение подвижного объекта от обнаружения в  конфликтной среде'

Уклонение подвижного объекта от обнаружения в  конфликтной среде Текст научной статьи по специальности «Физика»

CC BY
116
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УКЛОНЕНИЕ ПОДВИЖНОГО ОБЪЕКТА / КОНФЛИКТНАЯ СРЕДА / СИСТЕМА РАЗНОРОДНЫХ НАБЛЮДАТЕЛЕЙ / ОПТИМАЛЬНЫЙ ЗАКОН УКЛОНЕНИЯ ОТ ОБНАРУЖЕНИЯ / MOVING OBJECT DETECTION / THREAT ENVIRONMENT / COLLAGE OF OBSERVERS / OPTIMAL EVASION FROM DETECTION LAW

Аннотация научной статьи по физике, автор научной работы — Галяев Андрей Алексеевич, Маслов Евгений Петрович, Яхно Виктор Павлович, Абрамянц Тамара Гургеновна

Представлены формализация и результаты решения ряда задач об уклонении на плоскости подвижного объекта от обнаружения наблюдателем (системой однородных и / или разнородных наблюдателей), осуществляющих обнаружение объекта по излучаемым этим объектом сигналам первичного (пассивный режим) и переизлученного вторичного (активный режим) полей. Приведены результаты моделирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по физике , автор научной работы — Галяев Андрей Алексеевич, Маслов Евгений Петрович, Яхно Виктор Павлович, Абрамянц Тамара Гургеновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A moving object evasion from detection in the threat environment

Formalization and solution results of a number of a moving object evasion problems from detection by homogeneous or collage of observers on a plane are presented. The object is detected by signals of primary (passive mode) and secondary (active mode) field signals irradiated by it. Simulation results are also presented.

Текст научной работы на тему «Уклонение подвижного объекта от обнаружения в  конфликтной среде»

УКЛОНЕНИЕ ПОДВИЖНОГО ОБЪЕКТА ОТ ОБНАРУЖЕНИЯ В КОНФЛИКТНОЙ СРЕДЕ

Галяев А. А.1, Маслов Е. П.2, Яхно В. П.3,

Абрамянц Т. Г.4

(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)

Представлены формализация и результаты решения ряда задач об уклонении на плоскости подвижного объекта от обнаружения наблюдателем (системой однородных и / или разнородных наблюдателей), осуществляющих обнаружение объекта по излучаемым этим объектом сигналам первичного (пассивный режим) и переизлученного вторичного (активный режим) полей. Приведены результаты моделирования.

Ключевые слова: уклонение подвижного объекта, конфликтная среда, система разнородных наблюдателей, оптимальный закон уклонения от обнаружения.

1. Введение

Рассматриваемые в настоящем обзоре задачи относятся к классу задач об управлении, получившему в англоязычной литературе название «Path Planning in the Threat Environment» [16-22]; в русскоязычной литературе - название задач управления подвижными объектами (ПО) в конфликтной среде [5]. Под конфликтной средой понимается совокупность объектов (они называются конфликтующими), сближение с которыми для управляемого ПО нежелательно в ходе выполнения им основной задачи. Целью управления ПО при движении его в конфликтной среде является минимизация негативного воздействия конфликтующих объектов на управляемый объект путем выбора маршрута и параметров движения последнего. К числу негативных воздействий принято относить обнаружение объекта. Зада-

1 Андрей Алексеевич Галяев, чл.-корр. РАН, г.н.с. ([email protected]).

2 Евгений Петрович Маслов, д.т.н., в.н.с.

3 Виктор Павлович Яхно, к.т.н., с.н.с. ([email protected]).

4 Тамара Гургеновна Абрамянц, к.т.н., вед.инженер ([email protected]).

чи об оптимизации закона уклонения подвижного объекта от обнаружения рассматривались в целом ряде работ. Постановки задач отличаются предположениями о характеристиках информационных полей, в которых происходит обнаружение, классами допустимых законов управления, видом критериев качества, количеством обнаружителей, объемом и характером информации, доступной конфликтующим сторонам (см. [6, 15, 16-22] и библиографию к указанным статьям).

Совокупность конфликтующих объектов формирует карту угроз для ПО, которая должна учитываться при построении закона уклонения от обнаружения.

Для описания механизмов обнаружения в литературе наиболее часто используются два подхода.

Первый подход состоит в оценке интегрального уровня сигнала, излученного ПО и поступившего на вход относительно большой информационно-наблюдательной системы за все время наблюдения. В литературе такую систему принято называть сенсором.

Оценка интегрального уровня сигнала на входе сенсора определяется с учетом решения задачи об оптимизации закона управления ПО, перемещающимся в течение промежутка времени Т по маршруту из начальной точки Л(хл, ул) в конечную точку В(хв, ув) и уклоняющимся при этом от обнаружения сенсором (группой сенсоров), расположенных в районе. Интегральный уровень сигнала получил название энергетического риска.

Второй подход к описанию механизма обнаружения состоит в том, что наблюдатель отождествляется с точечным объектом, снабженным круговой зоной обнаружения фиксированного радиуса, центр которой совпадает с текущей позицией наблюдателя. В литературе такой наблюдатель принято называть информационным детектором (или просто детектором). В простейшем случае предполагается, что цели, попавшие внутрь круга, обнаруживаются мгновенно и достоверно; цели, не попавшие в круг, не обнаруживаются. Детектор является устройством, производящим обнаружение вторичного поля ПО. Указанный подход описан, например, в [18, 21].

2. Математические модели в задачах уклонения от обнаружения

При построении математических моделей предполагается, что, в общем случае, в состав разнородных сил и средств обнаружения входят стационарные и маневренные средства. Особенность задач уклонения от обнаружения состоит в том, что во всех случаях текущий уровень сигнала I на входе наблюдателя зависит от текущей дистанции В до уклоняющегося объекта, а для некоторых полей - и от величины текущей скорости V объекта. Для описания указанной зависимости в литературе широко используется степенная модель, в которой уровень сигнала пропорционален отношению:

I « ут1вк.

Величина показателя степени к является характеристикой физического поля, в котором осуществляется обнаружение. Содержательный смысл имеют значения к = 1, 2, 3, 4. Значение к = 1 соответствует процессу затухания волн на поверхности жидкости и убыванию уровня интенсивности гидроакустического поля в мелком море; к = 2 — убыванию уровней интенсивно-стей теплового поля, первичного электромагнитного поля и первичного гидроакустического поля в глубоком море при их распространении в пространстве; к = 3 - убыванию уровня магнитного поля; к = 4 — убыванию уровней интенсивностей вторичного электромагнитного и гидроакустического полей.

Величина показателя степени т характеризует зависимость уровня интенсивности излучаемого сигнала от скорости движения объекта. Такая зависимость имеет место для сигналов первичного гидроакустического поля.

Основным критерием в задачах уклонения объекта от обнаружения является вероятность обнаружения, т.е. вероятность обнаружения хотя бы один раз и хотя бы одним наблюдателем за время движения объекта по маршруту. Оптимизация сводится к нахождению траектории и закона изменения скорости объекта, доставляющих минимум указанному критерию

Робн 1 (1 Рстац)(1 Рман),

где Pобн, Рстац, Рман - вероятности обнаружения ПО всей системой средств, системой стационарных средств и маневренными средствами соответственно.

2.1. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ОБНАРУЖЕНИЯ ПОДВИЖНОГО ОБЪЕКТА СТАЦИОНАРНЫМИ СРЕДСТВАМИ Обнаружение осуществляется по результатам обработки излученного объектом сигнала и принятого системой сенсоров при наличии случайных помех. Для практически важных случаев гауссовских сигналов и помех решение о наличии или отсутствии сигнала от объекта принимается отдельным сенсором периодически [4], после предварительной обработки поступившей на интервале наблюдения (усреднения) реализации Xl, X2, ..., Xn гауссовских случайных величин XI,X2, ...,Xn с нулевым математическим ожиданием. Обозначим символом 02ш дисперсию помех на входе сенсора, символом 02с = D) - дисперсию сигнала, излученного объектом и поступившего на вход сенсора, зависящую от текущей скорости движения объекта v и текущего расстояния D между ним и сенсором. В отсутствие сигнала от объекта случайные величины X} имеют дисперсию 02ш, при наличии сигнала от объекта - дисперсию 02с + 02ш. Оптимальное правило принятия решения наблюдателем состоит в сравнении статистики ^(х) = 2* с порогом И. Если ^(х) < И, то принимается решение о том, что сигнал от объекта отсутствует, а если ^(х) > И, то принимается решение, что сигнал от объекта есть. Функция распределения вероятностей статистики 5"(х) описывается функцией ^-распределения с п степенями свободы и имеет вид

где Г( ) - гамма-функция, п - число степеней свободы (количество наблюдений в реализации), которое при аналоговых алгоритмах обработки определяется по формуле п = 2ТоДЕ, где

(1)

2

То - длительность интервала усреднения, ЛР - ширина полосы пропускания приемной системы средства обнаружения. Вероятность обнаружения объекта отдельным сенсором по результатам обработки информации на одном интервале усреднения вычисляется по формуле

( \

(2) Р^П) = 1 - ^

<<У, В)

1

где Нр - квантиль уровня (1 - а) для ^-распределения с п степенями свободы, Рлт - вероятность ложной тревоги; о2с(у, П)/о2ш -отношение сигнал/помеха на входе сенсора.

В гидроакустике [4] отношение сигнал/помеха принято выражать в терминах отношения интенсивностей сигналов. В том случае, когда спектральные плотности мощности сигнала и помехи можно считать постоянными в пределах анализируемого частотного диапазона, формула (2) переписывается следующим образом:

( \

(3) Р,б>,В) = 1 - ^

№ В)

1

Полагая, что зависимость уровня интенсивности излученного объектом сигнала от его скорости и закон распространения гидроакустического сигнала в среде носят степенной характер, имеем для интенсивности сигнала на входе сенсора [4]:

(4) 1С (V, В) = 1с (у0, В0)

( \т ( V

V V» )

В

г

V В ,

где /с(Уо) - интенсивность излучения объекта на некоторой эталонной скорости Уо, измеренная в стандартных условиях [4] на расстоянии Оо = 1 м от объекта, V - текущая скорость движения объекта, О - текущее расстояние между ним и средством обнаружения.

Интенсивность помехи на входе приемной системы сенсора рассчитывается по формуле

(5) 4, = ^, () " Л(/)'

где /п(/) - интенсивность помех в районе расположения сенсора, А(У) - коэффициент концентрации антенной системы сенсора в полосе приема.

С учетом формул (2), (5) выражение для текущего отношения сигнал/помеха на входе сенсора может быть записано в следующем виде:

(6) = №,ц)ГVУ4/мл.

4 с , °' IV, J Ц л(/)

В том случае, когда длительность интервала усреднения То намного меньше времени движения Т объекта по маршруту и в течение одного интервала усреднения скорость объекта и расстояние его до наблюдателя можно считать постоянными, вероятность обнаружения объекта 7-м наблюдателем хотя бы один

раз за время движения по маршруту находится по формуле

/

Робн = 1 -П (1 - Р0бН (V,, DJ¡)), ]=1

где ^ = Т/То, V - скорость объекта; Бц - расстояние между объектом и 7-м наблюдателем на ]-м интервале усреднения.

В случае когда имеется N сенсоров, принимающих решения об обнаружении независимо, вероятность обнаружения объекта хотя бы один раз хотя бы одним наблюдателем за время движения объекта по маршруту в указанных условиях определяется по формуле

/ N

Робн = 1 -ПП (1 - Робн (V], D)). ]=1'=1

В работе [13] показано, что в том случае, когда отношение сигнал/помеха на входе наблюдателя, описываемое формулой (6), мало в течение всего времени движения объекта по маршруту, при построении математической модели могут быть использованы следующие приближенные формулы.

Вероятность обнаружения объекта отдельным сенсором по результатам обработки информации на одном интервале усреднения:

Робн (V, Б) = а + д1-^^-,

ш

где а = Рлт - вероятность ложной тревоги.

Вероятность необнаружения ПО отдельным сенсором по результатам обработки последовательности наблюдений за все время его движения по маршруту вычисляется по формуле

~Га+ V

Рнеобн = еХР

±!

дШ, В0Щ*

I ш

Я(X - а)2

Ж

^ + (у - б)2]'

символами {а, Ь), (х,у),(х,у) обозначены соответственно координаты наблюдателя в некоторой неподвижной системе координат, текущие координаты объекта и составляющие вектора текущей скорости объекта.

В случае N независимых сенсоров, находящихся в пунктах с координатами (а,, Ь), г = 1, ..., N, вероятность того, что ни один из них не обнаружит объект за время прохождения маршрута, имеет вид

(7)

Рнеобн = еХР

N 1

-аТ V — -

гр

/=1 Т 0/

1С (Vo,Бо)Б А д, Т т Г I т J

v0 /=1 1 ш/т о/ 0

где д является постоянной индивидуальной характеристикой обнаружителя.

В том случае, когда все сенсоры имеют одинаковые характеристики, используются одинаковые алгоритмы обработки информации и осуществляется прием в одних и тех же помеховых условиях, оптимизация закона уклонения ПО от обнаружения системой из N сенсоров сводится к решению вариационной задачи о минимизации функционала (риска)

N х) + у) ))"

^ ГП1П .

( х (■), у (■))

0 '=1 (V(х(() - а, )2 + (у(() - Ъ, )2 )к

Вариационная задача (8) имеет следующую физическую интерпретацию. Подынтегральное выражение в (8) пропорционально мгновенному уровню интенсивности сигнала, излученного объектом, прошедшего через среду распространения и принятого системой сенсоров. Критерий (8) получил название энергетического риска, критерий (7) - название вероятностного риска. Таким образом, при малых отношениях сигнал/помеха минимизация вероятностного риска сводится к минимизации энергетического риска.

2.2. МАТЕМАТИЧЕСКИЕ МОДЕЛИ ОБНАРУЖЕНИЯ ПО МАНЕВРЕННЫМИ СИЛАМИ

При построении математической модели обнаружения ПО маневренными силами и средствами считаются известными расположение и характеристики района, в котором происходит противодействие сторон, а также предположения о составе сил и средств обнаружения и тактике их применения. Основной характеристикой модели является интенсивность поиска ХО -среднее число обнаружений объекта в единицу времени. В предположении о малости величины у(?) определяется вероятность обнаружения объекта маневренным средством хотя бы один раз за время поиска Т (в литературе [21] эта величина называется просто вероятностью обнаружения):

Стоящий в круглых скобках интеграл получил название потенциала поиска, или производительности поиска. Конкретное значение потенциала поиска определяется тактико-техническими характеристиками средств обнаружения.

В предположении о том, что все средства обнаружения действуют независимо, в силу(7) и (9) получаем следующее вы-

¡■Т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(9) Робн = 1 -ехр(-|оК')&)

Т

0

ражение для критерия оптимизации закона уклонения ПО от обнаружения всей системой наблюдателей:

Рнеобн = еХР

"Г То,-

N 1

-аТ V -1- -

¿-^ Т

[¥+ууг) Г

1с О'о, Ц,)Ц

I(х(г) - а)2 + (у(г) -ъ)2)'

I Т

=1 ш, о! 0

,=1

где -количество маневренных средств обнаружения, ^ - характеристическая функция, принимающая значение 1 в случае когда маршрут ПО проходит через район, контролируемый соответствующим маневренным средством, и 0 - в противном случае.

3. Уклонение подвижного объекта от обнаружения одиночным сенсором

3.1. УКЛОНЕНИЕ ПО С ПОСТОЯННОЙ СКОРОСТЬЮ ОТ ОБНАРУЖЕНИЯ СТАЦИОНАРНЫМ СЕНСОРОМ

Исторически задача об оптимизации законов уклонения от обнаружения сенсором вначале решалась для случая движения уклоняющегося объекта на постоянной скорости. Аналитическое решение задачи получено лишь при уклонении от одиночного стационарного сенсора на плоскости. Для случая уклонения от обнаружения системой сенсоров были предложены вычислительные алгоритмы.

Решение задачи о построении на плоскости оптимальной траектории уклонения объекта на постоянной скорости V от обнаружения одиночным неподвижным наблюдателем (сенсором) приведено в [6-10]. Объект перемещается в течение заданного времени Т из фиксированной начальной точки А(ха, уА) в фиксированную конечную точку В(хв, ув), минимизируя энергетический риск

(■») * = I ^

0 р

Здесь р = x2(t) + у2(У) , где x(t), у({) - текущие координаты уклоняющегося объекта в декартовой системе координат, начало которой совпадает с позицией сенсора; граничные условия имеют вид

(11) х(0) = , у(0) = ; х(Т) = хв, у(Т) = ув.

Энергетический риск, соответствующий уклонению на постоянной скорости, обозначается далее символом En, нижний индекс указывает значение степени п в знаменателе подынтегрального выражения (1„).

Схема решения задачи (1„), (11) имеет следующий вид [16-19]. Вначале выполняется параметризация задачи путем введения переменной 5 = Vt, где 5 - длина кривой, отсчитываемой от начальной точки траектории Л(хл, ул), а затем осуществляется переход к полярной системе координат, полюс которой совпадает с положением сенсора, а полярная ось проходит через начальную точку Л(хл, ул). В полярной системе координат для дифференциала дуги справедливо соотношение с1я2 = {рс1ц/)2 + с1р2 =(р2 + р^Лцг2;

где р, у/ - текущие координаты подвижного объекта, а р =йр!йу/, поэтому риск и граничные условия переписываются в следующем виде:

(12

0 р

(13) р(0) = рА, К0) = 0; р(Т) = рв, ¥{Т) = а.

Обозначим символом Р = Р(р,р ) функцию, стоящую

в (12) под знаком интеграла. Независимая переменная не входит в это выражение в явном виде, поэтому уравнение Эйлера для функционала (12) имеет первый интеграл [21]

(14 )Е-Г/у=С1,

где 1' р - 1''р1/г = С\. а С] - некоторая постоянная. Дифференциальное уравнение (14) интегрируется в явном виде. Отдельно рассматриваются два случая: п = 1 и п > 1.

При п = 1 уравнение оптимальной траектории в полярной системе координат, выраженное в терминах граничных условий, имеет вид [8]

(15) р{¥) = рА ехр ^ 1п ^

1а Ра.

Геометрический образ уравнения (15) - логарифмическая спираль, обращающаяся в окружность при Ра = рв. Величина риска на оптимальной траектории

Щ= 1а2 + 1п2 р . V Ра

Здесь и далее оптимальные величины снабжаются звездочкой.

При п > 1 уравнение оптимальной траектории имеет вид

(16) р(^) = р08т[(я -1)^ + С2],

где р0, С2 - постоянные величины, значения которых определяются из условия прохождения оптимальной траектории через заданные начальную и конечную точки. Подстановка в (16) граничных условий (13) позволяет записать уравнение оптимальной траектории уклонения в терминах граничных условий [21]:

г _1 Ч (1/я-1)

(17) р{ц/)=р \ 5"1|(п - 1)(а - Уу)\ + (Ре / РаГ яп(я -\)>// I

А [ 8т(я - 1)а ]

Параметры оптимальной траектории и время движения по оптимальной траектории связаны соотношением

"■>/р2+Р1

(18) Т =

о "

Величина риска на оптимальной траектории [19, 20]:

(19) Е УрА(я-1) +Рр2(я-1) - 2(РАРЕ Г СС8(П

( ) " (я - 1)(РАРЕ )я-1 '

Практически важным является случай n = 2, который соответствует обнаружению наблюдателем подвижного объекта в пассивном режиме по излучаемому объектом сигналу при сферическом законе распространения. Уравнение оптимальной траектории (16) имеет вид

P(w) = PoSin(^ + С2).

В декартовой системе координат, начало которой совпадает с положением сенсора, а ось ординат проходит через начальное положение уклоняющегося объекта, текущие координаты объекта выражаются следующим образом:

х = p sin(^ + С2) sin = p0 [cos(2^ + C2) - cos C2 ],

y = p0 sin(^ + C2)cos = pO[sin(2^ + C2) - sin C2].

Оптимальной траекторией является окружность, уравнение которой имеет вид

х + yCosC2 I +ly + p-sinC2 | =

2 („ ^

p

V 2 y

постоянные p и C2 определяются из условий прохождения траектории через точки A(xa, Уа) и В(хв, ув). В [2] показано, что p = d /sinа,

где а - угол между полярными радиус-векторами начальной и конечной точек маршрута;

(20) d=J(xA^xBf7(yA7yñy

- длина прямолинейного отрезка, соединяющего эти точки.

Центр окружности лежит на срединном перпендикуляре к отрезку АВ; положение центра совпадает с положением вершины равнобедренного треугольника; величина угла при этой вершине (между равными сторонами треугольника) составляет 2а. Из формул (19), (20) следует, что величина риска, соответствующего оптимальной траектории,

(21) = d / PaPb .

Соотношения (16)-(19) полностью описывают решение оптимизационной задачи об уклонении на плоскости подвижного

объекта на постоянной скорости от обнаружения одиночным неподвижным сенсором. Из (16) следует, что при некоторых начальных условиях решение оптимизационной задачи содержит особенность, а именно, при (п - 1)а^ я: р(у) ^ да. В частности, при п = 2 особенность возникает при таком расположении сенсора, начальной и конечной точек маршрута, при котором они находятся на одной прямой, причем последние расположены по разные стороны от сенсора. Причина возникновения особенности решения - отсутствие ограничений на энергетические и/или скоростные характеристики уклоняющегося объекта. Ряд способов устранения этой особенности предложен в [2-4].

В [11] приведено решение оптимизационной задачи (10), (11) для п = 2 при наличии ограничения на длину оптимальной траектории. В случае когда ограничение неактивно, решение описывается формулами (16)-(18). При активном ограничении решение задачи выражается через эллиптические интегралы. Оптимальная траектория строится численным методом. В [10-12] предлагается расширить критерий оптимизации путем введения дополнительного (регуляризирующего) функционала. В [1] при п = 2 расширенный критерий имеет вид

р2

<1ц/,

где X - весовой множитель, выбираемый из соображений об относительной важности подынтегральных слагаемых. В [19] оптимизацию в задаче (12), (13) при произвольных п предлагается

проводить с учетом ограничения

Т

•2 . „2-2

р +р у/- )Л<Р

о

где производные понимаются как производные по времени, Р - заданная величина. Данное неравенство описывает энергетическое ограничение, которому должна отвечать оптимальная траектория.

0

3.2. ОПТИМИЗАЦИЯ ЗАКОНА УКЛОНЕНИЯ ПО ОТ ОБНАРУЖЕНИЯ СТАЦИОНАРНЫМ СЕНСОРОМ

При движении уклоняющегося объекта по оптимальной траектории с постоянной скоростью величина скорости определяется видом оптимальной траектории и заданным временем движения - соотношениями (17), (18). При фиксированной скорости движения текущий уровень сигнала на входе сенсора (системы сенсоров) зависит лишь от текущей дистанции до уклоняющегося объекта. Развитие указанной постановки состоит в построении такого закона управления подвижным объектом, при котором оптимизируется не только траектория уклонения, но и закон изменения скорости его движения по траектории. Постановка и решение такой задачи приведены в [1, 6].

Постановка задачи. Управляемый объект перемещается в течение заданного времени Т из фиксированной начальной точки Л(хл, ул) в фиксированную конечную точку В(хв, ув) маршрута, минимизируя выбором траектории движения и закона изменения скорости функционал (интегральный риск)

Здесь т > 0 - произвольный показатель степени; х(0, у(0 -текущие координаты уклоняющегося объекта в декартовой системе координат, начало которой совпадает с позицией сенсора; производные, если иное не оговаривается особо, являются производными по времени.

Граничные условия:

х(0) = хА, х(Т) = х в,

У(0) = У л, У(т) = Ув •

В рамках приведенной выше физической интерпретации, числитель дроби в (22) есть величина, пропорциональная мгновенному уровню излучаемого объектом сигнала в предположении о том, что имеет место степенная зависимость этого уровня от текущей скорости объекта.

Функционал (22) получил название функционала обнаружения.

гтп .

Решение задачи. Осуществляется переход от декартовых координат (x, y) к полярным координатам (р, Y), где полюс совпадает с позицией наблюдателя, а полярная ось - с осью абсцисс исходной декартовой системы: x = р cos y, У = Р sin Y-В этих координатах риск равен

R =

Тг(р2+р2Ч?У

о Р2

граничные условия имеют вид:

р(0) = Ра > ¥(0) = ¥а ; Р(Т) = Рв> ИТ) = ¥в • Вводится новая переменная г = \пр. Тогда (23) р = ег, р = йр!й1 = рг

и выражение (23) переписывается в следующем виде:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(24) R = ](r2 + у/2)тФ(г)Ж,

где

(25) Ф(г) = exp(kr), k = 2m - 2.

Возможны два случая: га = 1 и тф I. При т = 1 подынтегральная функция в (24) зависит от (г, (//); при тф 1 -от (г, г, у/), поэтому необходимые условия оптимальности для этих случаев различны. При m = 1 риск равен

Т

R = j(f2+^2)mO(r)dt.

о

Необходимые условия оптимальности (уравнения Эйлера) имеют вид

г'г = О,

у/у/ = 0.

Отсюда г = const, у/ = const. Решение у/ = 0 отвечает движению управляемого объекта по прямой, проходящей через позицию наблюдателя и начальную и конечную точки маршрута. В остальных случаях у/ Ф 0. Так как, в силу (23),

dr . р . .

г =-р = —, то решению г = 0 при у/ ф 0 отвечает р = 0, что

dp р

0

соответствует движению по окружности; решению г ф 0 - движение по иной кривой.

При т Ф 1 уравнения Эйлера имеют вид

(26)

—\1тц/{г2 + Ф(г)] = О,

йг а

-—[2 тг(г2 + у/2 У'1 Ф(г)] + к(г2 + ц/2)тФ(г) = 0.

Результат интегрирования первого уравнения системы: (27) 2ту/{г2 +у/2)т1Ф{г) = С1,

где С\ - постоянная интегрирования. Возможны два случая: С 1 = 0 и (\ Ф 0. Случаю С 1 = 0 отвечает значение ц/ = 0; управляемый объект движется по прямой, проходящей через позицию наблюдателя, начальную и конечную точки маршрута. В остальных рассматриваемых ниже случаях ц/ Ф 0. Подстановка (27) во второе уравнение системы (26) приводит к уравнению

(28) -й

2т ц/

Вводится величина

(29) =

¥

(30) ^ =

производные по времени. Так как // / ц/ = сЬ] / б/у/, то (31) п = 18 [у^- + С2

С учетом (29) последняя зависимость может быть проинтегрирована как функция аргумента у В результате получаем

( 2т \

к к

(32) г (у) = 1п

(

Ро

С08| + С2 2т

где р и С2 - постоянные интегрирования. Так как г = 1п р, то из (32) следует, что уравнение оптимальной траектории движения объекта в полярной системе координат имеет вид

(33) р(у) = р0

f

cos I у

2m

При этом в силу (33)

(34) Ф(г) = р

f

cos I у

2m

-C

■a

2m

YT

Выведем выражение для модуля скорости движения объекта как функции полярного угла г\. Вначале найдем угловую скорость. С учетом (27), (29), (31), (34) имеем: к

(35) Ц/ = СЪ cos у/

2m

■а

где Сз - некоторая постоянная. Радиальная скорость определяется дифференцированием функции р( у) по времени:

(36) К¥) = ^г-¥ = РЩ Ч/^~ + С2 V.

ац/ ^ 2т J

Подставляя (35) в (36), находим

(37) р = Сър sin | + С2 I cos [ Ч/~~ + С2

^ 2т J ^ 2т

Используя (33), (35), (36), вычисляем

(38) f? + pV = Clp1 cos2 + C2 j = Clpl [cos^A. + C2 Соотношение

2m

n-2~2 ( ( k

(39) yjp +p у =C3p0\cos\y/— + C2j

определяет закон изменения модуля скорости по траектории уклонения как функцию полярного угла у.

Выражение для риска на оптимальной траектории уклонения находится с использованием формулы (25). В силу (29) и (31)

-2m

Производная '// определяется соотношением (35). Отсюда

Сомножитель Ф(г) в выражении для риска задается формулой (34). Поэтому стоящее под знаком интеграла в формуле для риска произведение

как функция времени есть величина постоянная. Но, по определению риска, левая часть равенства (41) пропорциональна мгновенному уровню сигнала, поступившего на вход наблюдателя. Следовательно, по оптимальной траектории уклонения управляемый объект движется с переменной скоростью, но оптимальный закон изменения величины скорости (формула (39)) таков, что мгновенный уровень сигнала, поступающего к наблюдателю, остается постоянным в течение всего времени движения по траектории. В свою очередь отсюда следует, что при всех т Ф 1 на оптимальной траектории модуль текущей скорости пропорционален текущему расстоянию между объектом и наблюдателем в степени (1/т).

В силу (38) на решениях уравнений Эйлера (26) функционал риска равен

Формулы (33), (35), (39) определяют решение оптимизационной задачи для произвольной степени т Ф 0. Подстановка в указанные формулы граничных условий позволяет определить параметры оптимального закона управления:

(41) (г2+у2)тф(г) = С2>0\ к = 2т-2,

т

т

(

Ро =Рл

1 + s2 - 2s С08(-а)

C2 = arctan

í k k ^ s cos(— y/A) - cos(— yB) _2m_2 m

k k s sin(— ) - sin(— y) 2m 2m

C3 =

~ 1 + s2 - 2s cos(-k- a) 2m _2m

kT„„

•2/ k \ sin (-a)

2m

где ^ = (рА / рв )кПт, \ а\=\ув -уА \.

Значение риска, соответствующего оптимальному закону управления, в терминах начальных условий задачи имеет вид

1 (/1„„2

Тр к2 Г А ' в ' А ' в - 2т

R' =

4m¿ Í k

4m I í-/». k/m o _k/2m к/2m___/ k ч

Pi - 2Pa Pb cos^a)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

k m k m

,2 I PА

Мгновенный постоянный уровень интенсивности сигнала, поступающего на вход сенсора, определяется соотношением

1

f 4т2

w = ■

T2

2 I pT + Pim - 2pA/2>B/2m cos(^ka)

v - l 2m „

Л

Далее находится вид оптимальных траекторий для ряда значений т.

1. При т = 1/2 уравнение траектории в полярных координатах имеет вид (43) p(y) = p0cos(y-C2).

В силу (43) в декартовой системе координат

х = р0 cos(y-C2 )cosy = p0 [cos C2 + cos(2y-C2)],

у = р0 cos(y- C2 )siny = ■Po [sin C2 + sin(2y- C2)].

так что оптимальной траекторией является окружность, уравнение которой имеет вид

(44) Í х - p°cos C2

у-POsinC2 I =

2 (P ^ р0

v 2 у

Постоянные р0 и С2 определяются из условий прохождения траектории через начальную и конечную точки маршрута.

Найдем длину радиуса и положение центра окружности. Запишем условия прохождения траектории через точки А и В в следующем виде:

(45) Р° 'PA = C0SyA - C2)=C0S '

Po~1Pb = C0S(yB - C2)=C0S Рв ■

Полагая рл = ул - C2, (в = ув - C2, получаем

(46) c0s(pa -Рв ) = С0Кул -ув ) = Po-2PlP2 +4(1 -P°-2Pl2)(l -Po-2P22) ■ Разрешая это уравнение относительно ро, находим

(47) р° = d /sin(|Лу\),

где Лу= ул - ув есть угол между радиус-векторами начальной и конечной точек маршрута,

- длина прямолинейного отрезка, соединяющего эти точки. В соответствии с (44), длина радиуса окружности равна

(48) l = d / 2sin(|Лу|.

Центр окружности лежит на срединном перпендикуляре к отрезку ЛВ и потому, в силу (48), положение центра совпадает с положением вершины равнобедренного треугольника; величина угла при этой вершине (между равными сторонами треугольника) составляет 2|Лу.

2. При т= 1 оптимальная траектория отвечает уравнениям г = const, у/ = const.

• ^ dr . р

Пусть ц/ Ф 0 . Так как г =-р = —, то возможны два слу-

dp р

чая: г = О и г Ф О.

Случаю г = О отвечает р = 0, что соответствует движению по окружности с центром, совпадающим с началом координат.

При г ф О имеем дифференциальное уравнение р

— = const. р

Его решение - логарифмическая спираль. Уравнение оптимальной траектории в полярной системе координат:

Ру) = Pa exP

¥-¥а lnРв_

У в -Уа Pa _

3. При т = 2, в соответствии с (33), уравнение в полярной системе координат имеет вид

Р(У)=Р0 cos-2 + C2J.

В декартовой системе координат ему соответствует уравнение

2р0 - х cos (2C2 ) + у sin (2C2) = д/х2 + у2.

Возводя равенство в квадрат, после приведения подобных членов получаем

1 2 (49) рр-р0[хcos(2C2) + уsin(2C2] = ~[хsin(2C2) + уcos(2C2] .

Формула (49) является уравнением параболы.

Полученные соотношения иллюстрируются двумя численными примерами.

Пример 1. Объект переходит из начальной точки маршрута A(1; 0) в конечную точку 5(0; 1). Ниже приводятся уравнения оптимальных траекторий в декартовой системе координат для различных значений т:

1 f 1V f 1V 1

m = —: х — + у -

2 I 2 J V 2J 2

m = 1: х2 + у2 = 1,

т = 2: х + у + 72 ^ х2 + у2 = 1 + 72, т = да: х + у = 1.

Траектории изображены на рис. 1. Траектория с номером 1 соответствует значению т = 1/2; с номером 2 - значению т = 1;

с номером 3 - значению т = 2, с номером 4 - значению т = да. Последний случай является описанием асимптотики решения по параметру т. Точка О на рис. 1 и 2 соответствует центрам окружностей - оптимальных траекторий при т = 1/2.

Рис. 1. Оптимальная траектория уклонения, рл = рв, \ Об -О = л/2

В силу (33) и (39) на оптимальной траектории текущее значения модуля скорости у(у) и текущее расстояние до наблюдателя р( у) при т Ф 1 связаны соотношениями

( к п к Л V = С 4рС08 у-----• — ,

РО) = Рс

(

2m 4 2m

л к 2m 4 2m

cos I у

2m

V X

f (л к ^ к рс = cos I--- .

I 14 2m JJ

Законы изменения модуля скорости и текущего расстояния для различных значений m имеют следующий вид:

m =1: v = С4р cos , РО) = V2cos (О"?] •

m = 1:v = С4Р, р(о) = 1, ро = 1.

m = 2: v = C4Pcos| О"? I' РО) = Ро

cos|7 " i

2 о ,

Ро = cos2 J , v = САрр .

Существенный интерес представляет оценка чувствительности критерия (риска) к отклонению законов управления от оптимальных. Оценка чувствительности определялась следующим образом. Для каждого значения m = 1/2; 1; 2 решалась оптимизационная задача, находились оптимальная траектория, оптимальный закон управления скоростью и соответствующее значение оптимального риска. Затем по очереди фиксировались некоторое m, соответствующий ему вид критерия и вычислялись значения этого критерия (риска) для законов движения, оптимальных при других m Результаты расчетов приведены ниже. Нумерация рисков i = 1, 2, 3, 4 соответствует возрастанию величины показателя m = 1/2; 1; 2; да.

При m = 1/2 риск вычисляется по формуле

ж

*. =рЕ </Г.

о Р

Соответствующие значения рисков: ^ =72; Л2 = 7 /2 ; Яз = 1,79; Л4 = 2, минимальным является значение риска, соответствующее зафиксированному значению показателя степени -в данном случае т = 1/2.

Для случая т = 1 риск вычисляется по формуле

ж

^ = С^

0 р

Значения рисков: ^ = 1,76С5, ^ = — С5, ^ = 1,61С5, й4 = ^ . Для случая т = 2 риск вычисляется по формуле

Чр1 +р2 ,

= С6 ] Л-1/2-¿у.

Р

Я =

Сб

п

Значения рисков: Я1 = 1,98С6 , Я = — С6, Я = 1,53С6, Я = 1,58С6 .

Пример 2. Объект переходит из начальной точки маршрута А(1; 0) в конечную точку В(0; 2).

Уравнения оптимальных траекторий:

т =| х -1 | + (у -1)2 = 5,

2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

т = 1: р(у) = ехрI 21п2 у

п

т = 2 : у = 2\/Т-Х, т = да: 2 х + у = 2.

Траектории изображены на рис. 2. Нумерация траекторий совпадает с нумерацией на рис. 1.

Рис. 2. Оптимальная траектория уклонения, РА Ф рв, | у|в - УА = п/2

Законы изменения модуля скорости и текущего расстояния имеют вид:

m = 1: v = С4р C0s (у - arctg2), р(у) = V?C0s(у-arctg2),

2

р°=45, v=С4р.

р°

m =1:v = Ср, р(у) = exp^^^П^у] ' р° = 1.

m = 2: v = С4р^, р(у) =р°cos-2 , р° = 1,

v = С4^[рр .

Риски для соответствующих значений m:

m =1 : R = —, R = 1,24, R =J2, R = 1,76.

2 1 2 ' ^ ' ' 3 v ' 4 '

m =1: R = 1,92C, R = 1,71C5, R = 1,76C5, R = R.

m = 2 : R = 2,58C6, R = 2,°5C6, R = 2C6, R = 2,°6Q .

В [6] приведены результаты сравнительного анализа оптимальных законов уклонения от обнаружения на постоянной и переменной скоростях для случая, когда уровень излучаемого сигнала пропорционален первой степени скорости. Решение задачи об оптимизации траектории уклонения на постоянной скорости приведено в [11]; движение на переменной скорости описывается формулами, соответствующими значению m = 1/2. Сравнение проводится по трем показателям:

- виду оптимальной траектории,

- величине риска,

- времени пребывания на маршруте.

Оптимальные траектории. При движении с переменной скоростью оптимальной траекторией является дуга окружности, определяемой формулой (44). Из результатов [10] следует, что та же окружность является оптимальной траекторией уклонения на постоянной скорости.

Риски. При движении с переменной скоростью риск вычисляется по формуле (42). При m = 1/2 риск определяется формулой

R = \Vl cos-2(y- C2)dy. ¡i

С учетом соотношений (46) и (47), величина риска R = d / рр2.

Из результатов [2] следует, что то же значение риска соответствует движению на постоянной скорости.

Время прохождения маршрута. При переменной скорости время прохождения маршрута (обозначим его TV) связано с параметрами закона уклонения соотношением

г 7 ds(i) V l v(l '

где ds(l - дифференциал дуги, v(l - скорость перемещения по дуге. В полярной системе координат

ds(l) = <\р], +Р2 di, где pi = dp/di. При m = 1/2, в соответствии с (39),

v(i) = Cp0cos2(v- C2).

Постоянная Сз здесь определяется исходя из требований, отличных от условий прохождения траектории через фиксированные начальную и конечную точки траектории.

Ниже рассматривается пример, в котором значение Сз определяется из условия равенства интервалов времени движения по маршруту на переменной и постоянной скоростях. Вычисляя интеграл (49), находим время прохождения маршрута при оптимальном законе изменения скорости: sin | Ai\

-i

T = C

tv C3 -2

Ро PaPb

С другой стороны, время прохождения маршрута на постоянной скорости и (обозначим его Тс) определяется соотношением

г ИИ

Тс =Ро--1.

u

Из условия равенства Te = Tv имеем:

С =ц Р" sin| Av1 3 РаРв I Aw I ' Подставляя значение Сз в формулу (40), находим величину начальной скорости объекта при которой длительности

интервалов времени движения на переменной и постоянной скоростях одинаковы:

„(„a) . „ра sin¡a^.

Рв \aW\

Так как решается задача об уклонении, то практический интерес представляет случай р2 > pi. Но sin |A^f < |A^f при всех Р = р2, |A^f = л/2, поэтому для указанного случая v(yi) < и. В частном случае при р = pz, |A = л/2:

v ÍWa ) = — ил

При движении на переменной скорости мгновенный уровень сигнала на входе наблюдателя остается постоянным и равным

Dv = v(Wa )/ Ра2-

При движении на постоянной скорости максимум мгновенного уровня сигнала достигается в начальной и конечной точках траектории и равен

dc = и / рх .

Следовательно, оптимизация траектории с одновременной оптимизацией режима скорости позволяет сформировать на входе наблюдателя сигнал, мгновенный уровень которого меньше максимального мгновенного уровня сигнала (в рассматриваемом примере - меньше в полтора раза), соответствующего движению по оптимальной траектории на постоянной скорости при одном и том же интегральном уровне принятого сигнала.

Такая особенность оптимального закона уклонения делает его перспективным для применения как с точки зрения необнаружения объекта по интегральному критерию, так и с точки зрения необнаружения его по мгновенному уровню сигнала.

На рис. 3 и 4 приведены графики вероятности необнаружения как функции текущего времени для двух значений длительности эпизода уклонения, Т\ < Т2. Графики построены в зависимости вероятности от длительности соответствующего интервала времени ^ /Тц г = \, ..., 2, нормированной по максимуму.

Рис. 3. Рис. 4.

Графики вероятности необнаружения для двух значений длительности эпизода уклонения, Т\ < Тг

3.3. О ЗАМЕНЕ ПЕРЕМЕННЫХ В ФУНКЦИОНАЛЕ РИСКА

В [\2] предложен следующий подход к решению задач оптимизации. Так как движение объекта происходит в М2, то предлагается отождествить вещественную плоскость М2 с комплексной плоскостью С, ввести комплексную координату г = х + гу, где г(х, у) - двумерный вектор координат объекта на вещественной плоскости, и проводить оптимизацию функционала (22) в С с последующим отображением полученных результатов в М2. В результате замены переменной функционал (22) записывается следующим образом:

' / Д. т 'П

2 2 2

— — т (7 '.7\т т 7т

(50) Щг,г,г,г)= Г Г —

.10 т -г Ли т

( ¿»Л

V 2 У

Л.

Подынтегральное выражение в (50) является произведением некоторой функции и комплексно-сопряженной к ней функции. Дифференциальная замена (5\) й ™ = г-1,тй г

приводит функционал (22) к виду

(52) К(м>,м>,м>,м>')= [ (м>м>У Ж.

* О

Интегрирование равенства (51) определяет явный вид замены переменной в С:

а(у - w0) = га, а = т—1, где т е[0,5;<х>1\ 1,

(53) т

w - w0 = где т = 1, w0 е С.

Из области определения т определяется область изменения а:ае[-1,1)\0.

Вариационная задача об оптимизации исходного функционала (22) сводится к задаче минимизации функционала

_ _ -Т - т

(54) Жу\>,м>,м>,м>) = ^ (м/,м/) Л —> тт.

Геодезической линией задачи (54) является прямая, проходящая через точки WA и wв - образы в пространстве комплексной переменной w граничных точек А, В в исходной задаче. Уравнение прямой, проходящей через точки WA и wв,

£ и)

(55) ^) = ™а(\-т) + ч>вт, т = ¿>0, g (0) = 0, g (Т ) = т.

С помощью обратной замены w ^ г находится оптимальная траектория в исходной вариационной задаче при различных значениях показателя степени т. С учетом того, что оптимальный закон управления объектом обладает тем свойством, что уровень сигнала, приходящего на вход сенсора, остается постоянным в течение всего времени прохождения маршрута, параметризация прямой (55), реализующей это свойство, имеет вид g(t) = I. В этом случае

1401= ——5

т

В [12] показано, что экстремали функционала (50) и, соответственно, (22) отвечают достаточным условиям оптимальности и доставляют функционалам глобальный минимум.

3.4. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ СТАЦИОНАРНЫМ СЕНСОРОМ ПРИ НАЛИЧИИ ПРЯМОЛИНЕЙНОГО ОГРАНИЧЕНИЯ НА ТРАЕКТОРИЮ

Ограничения такого вида возникают, например, при решении задачи о форсировании канала естественными ограничениями служат границы канала.

В [9] решена задача оптимизации закона уклонения ПО для случая, когда границей допустимой области является прямая. Полярное уравнение прямой имеет вид

Р(У) =

Ры

со$(у-5)'

где ры - длина нормали, проведенной из полюса к прямой, 5 - полярный угол нормали.

Вводится полярная система координат, полюс которой совпадает с положением наблюдателя, а полярная ось проходит через начальную точку маршрута А(ха, ул). Во введенной полярной системе координат задача об оптимизации закона уклонения сводится к минимизации функционала

(56) д = ^ +р2у/) л

о Р2

при наличии граничных условий

(57) р(0) = рл, ¥(0) = 0 ; р(Т) = рв, ¥(Т) = ¥в

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и ограничения

р{¥) < ры ; 0 <¥<¥в.

Аналитическое решение задачи получено лишь для т = \.

Из общих результатов теории оптимального управления [17] известно, что при наличии ограничений в виде неравенств на функции координат оптимальная траектория состоит из участков, часть из которых лежит на границе допустимой области, а остальные - внутри допустимой области. При т = \ в отсутствие ограничения оптимальной траекторией является логарифмическая спираль [9, 10].

Логарифмическая спираль является выпуклой функцией и с прямой (53) может иметь не более двух общих точек. Поэтому

решение задачи об оптимизации закона уклонения при наличии ограничений сводится к нахождению оптимального закона управления при движении объекта по прямолинейной траектории (границе), определению условий сопряжения отдельных участков траектории и минимизации суммарного риска.

При движении по фиксированной прямолинейной траектории (границе) оптимизация закона уклонения сводится к оптимизации закона изменения скорости. Пусть Эрэ, Щэ) и Е(ре, Ще) - точки входа и схода траектории с границы соответственно; Тэ, Те - моменты входа и схода. Так как для прямолинейной траектории

■ Pn sin(y-d) .

Р = -—W= PWtgW-ö\

cos (цг-о)

то в соответствии с (56) при m = 1 имеем вариационную задачу

Tf (р2 + р2у/), Tf у/2 Rde = | —-С dt = |--dt => min .

J p2 J cos2{y/-S)

¥

где нижние индексы здесь и далее указывают на то, вдоль какой кривой определяются элементы закона управления и риск. Независимая переменная (время) в явном виде в подынтегральное выражение не входит. Поэтому в вариационной задаче существует первый интеграл уравнения Эйлера [18]. Непосредственной проверкой устанавливается, что этим интегралом является гамильтониан, с точностью до постоянного множителя совпадающий с подынтегральной функцией в (51), поэтому для прямолинейной траектории справедливо соотношение

СОЕРМ

v (¥) = CDEp(¥) = ■

cos(щ- 3)

Постоянная Сэе определяется из условия прохождения отрезка прямой ЭЕ с использованием оптимального закона изменения скорости за время

т -Т =Т = i

а f а п а пе

ds(y)

le d * de i , ч

L

где ds(щ) = рнdщ|cos2(щ-3) . Отсюда находится длительность интервала времени

(58) Т, = 1^-

^ ¡ъ-5 ж.

Сш оо8(у-5) Сш . ¡¡в-5 Ж

2 4

Оптимальное значение риска, соответствующее движению по границе, равно

^ + Ж I 2 4

^БЕ СВЕТВЕ 1п

Тш ' (¡-I + ж

{ 2 4,

В [9] доказано, что участки АО и ОЕ оптимальной траектории сопрягаются гладко; условие сопряжения выражается равенством

(59) 1п-р^г= ъ Г'(ъ-5).

РлСО$,(¥в -5)

Аналогичное соотношение выписывается для участка логарифмической спирали, соединяющей точки Е и В:

(60) 1п-р^- = (ъ-Ъв ШЪЕ-5).

Рв со§(ъб -5)

С учетом граничных условий (57), конкретизация элементов оптимальных законов управления и рисков на криволинейных участках траектории имеет следующий вид. Криволинейный участок АО:

- уравнение оптимальной траектории:

Р(Ъ) = РА ехр(Ъ 1п р), Ъ РА

- оптимальный закон изменения скорости: у(¥) = СлпР(¥),

где С¿р = —^ ¡Ъ + 1п2р, Тло - время движения вдоль ТАП\ РА

участка АО;

риск:

КАЮ -

Т

-i а \

-1п2 В

Ра,

Криволинейный участок ЕВ: - уравнение оптимальной траектории:

(

Р(У) - Рв ехР

У~Ув 1п Рн_

\

\¥в ~¥в Рв

оптимальный закон изменения скорости: ^ (у)- СЕвР(у),

где

1

Сев -^1(ГЕ ~¥в)2 + 1п2Р ; ТЕ

Т

вдоль участка ЕВ. - риск:

1

(

Кев -

Т

Рв

2 Ре

ев

время движения

(¥е ~¥в)2 +

Рв

Задача об оптимизации закона уклонения от обнаружения свелась к задаче минимизации суммарного риска

К - КАО + + КЕв

при наличии ограничения

Т - ТАВ + ТОЕ + ТЕБ

и условий (59), (60).

Общие соотношения иллюстрируются следующим примером.

Объект переходит из точки, расположенной на одной оси декартовой системы координат, в точку, расположенную на другой оси, в течение фиксированного времени Т; положение наблюдателя совпадает с началом координат; начальная и конечная точки маршрута одинаково удалены от полюса. Соответствующие начальные условия имеют вид

р(0) - р(Т) - Ра ; у(0) - 0 , у(Т) - я/2 . Границей допустимой области является прямая, уравнение которой в декартовой системе координат имеет вид

у = - х + к. РА; 1 < к <%/2.

При к = \ оптимальной траекторией является прямая (59); при к >72 ограничение неэффективно. В полярной системе координат прямая (59) описывается уравнением

p(w) = -

кРл

\/2cos I —

I 4

В силу симметрии задача оптимизации решается для траектории, состоящей из двух участков - начального, до момента выхода на прямую, в точке D(pD, Wd) в некоторый момент Tad, и участка движения по прямой в течение времени (T/2 - Tad) до точки H(kpA / -Jl, п / 4). Условие сопряжения участков траектории принимает вид k

(61) -/=-;-TV,=wd tg (wd -п /4)-

у2рл cos(wD -п /4)

При фиксированном значении к соотношение (61) является уравнением относительно щз. График зависимости щ> = w(k) приведен на рис. 5. Так как точка H(kpA /V2,n/4) является правой граничной точкой отрезка прямой, то, в соответствии с (58) и (61), выражение для суммарного риска принимает вид

R =-W-+-1-ln2 ctg (w/2 + п / 8).

tad C0S (wd -п/4) T/2 - tad

Таким образом, при фиксированном значении параметра к задача оптимизации свелась к нахождению времени движения Tad по криволинейному участку траектории. Выражение для риска переписывается следующим образом:

R = iL + .

Т Т / 9 — Т

tad 1 ' 2 tad

Отсюда находятся: - оптимальные длительности интервалов времени и соответствующие им риски:

, _ Та , _ ТЬ 1а = 2(а + Ь)' 1ш = 2(а + Ь)'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

II- II 12 I - 14

Рис. 5. Зависимость уОщ

Звездочкой снабжены оптимальные величины.

Параметры оптимальной траектории были рассчитаны для конкретного значения к = 1,15: (щ> = 0,464, ро = 0,857). Значение оптимального риска

0,666

Я =—-.

Т/2

В отсутствие ограничения оптимальной траекторией является окружность, по которой объект движется с постоянной скоростью; центр окружности совпадает с положением сенсора и

0,6168

Дшп =■

Т/2

Решение задачи иллюстрируется рис. 6а, б, построенными при рл = рв = 1. Сплошными линиями изображены участки траектории, соответствующие движению внутри допустимой области, пунктирными - соответствующие движению по ограничению.

а б

Рис. 6. а) движение в вещественной плоскости; б) движение в комплексной плоскости

Каждая траектория состоит из двух отрезков: логарифмической спирали и прямолинейного отрезка.

3.5. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ ДВИЖУЩИМСЯ СЕНСОРОМ

В [18] решалась следующая задача. На плоскости расположены два объекта - ПО, движущийся по прямой с постоянной скоростью V = (Vx, Vy), и наблюдатель (сенсор). Координаты начальной и конечной точек маршрута заданы в неподвижной декартовой системе координат, начало которой совпадает с начальной позицией наблюдателя. Требуется найти траекторию ПО и закон изменения его скорости, доставляющие минимум функционалу

.о .о

ir х~ + v~ Ldt = --—---dt —» min .

0 Jo (х- Vff + (у -Vvty < wj1

Производные, если не оговаривается особо, являются производными по времени.

Граничные условия заданы в виде

x(0) = xA, y(0) = yA, x(T) = xB, y(T) = yB ,

где Л(лл, ул), В(хв, ув) - начальная и конечная точки маршрута. Величина Т (время движения по маршруту) задана. Замена переменных

# = * - = у -

приводит функционал (62) к виду (63) =

■'о 4 +Т1

Необходимые условия оптимальности для функционала (63) определяются уравнениями Эйлера:

(6 4)<*^+" е+П

Ж £-+Т]2 %2+т]2

Система (64) преобразуется к системе, состоящей из четырех дифференциальных уравнений первого порядка [18]:

% = и,

Т] = V,

(65)

. ^(у2 -и1) У2% -2Г[уи + 2у£Уу -2иг/Ух _ п

ь +ч % +Г

ф2 - й2) У2Л - 2£уи + 2ит1Ух - 2и^Уу _

У + е+Л2 ~ '

Первым интегралом системы (65) является гамильтониан, который в явном виде представляется выражением

(66) н = 2!'

В результате деления каждого уравнения системы (63) на первое уравнение этой системы получаем

Ъ

u

2 ;

{(V2 -u2) к2щт + 2<Уу - 2уПУг

и + - - + 0 ,, — 0,

1 и (5 +Ъ2) и ({2 +ъ2)

ф2 - V2) VЪ - + 2vыVx - 2и^у

Vг +-^Ц-/ +-^-^-- — О-

5 и ({2 +ъ2) и ({2 +ъ2)

Замена переменных w = в предположении о том, что за счет соответствующего выбора системы координат сенсор движется вдоль оси абсцисс, приводит систему (67) к следующему виду:

(68)

_ (и2 - V2) + V2 -2wuv + 2Ки ^ — (V - и)(52 +Ъ2) '

(V2 - v2)w + V2w - 2wu + 2Vv

"" (V -и)(52 +Ъ2)

В [10] показано, что система (64) может быть разрешена

относительно вектор-столбца \—-1—; —^— | при выполне-

^ w2 +1 w + 1)

нии следующих условий: (u Ф V; и2 + v2 > У2).

4. Об одном классе уклонения подвижных объектов от обнаружения

4.1. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ (СТАЦИОНАРНЫЙ СЕНСОР - СТАЦИОНАРНЫЙ ДЕТЕКТОР) В статье [11] приводятся постановка и решение задачи об оптимизации закона уклонения ПО от обнаружения системой из двух разнородных наблюдателей - стационарных сенсора и детектора. Задача сведена к задаче уклонения от обнаружения сенсором при наличии круговой запретной зоны (кругового ограничения) - зоны обнаружения детектора в предположении о том, что попадание ПО в эту зону приводит к мгновенному его обнаружению.

Вводится полярная система координат, полюс которой совпадает с положением сенсора, а полярная ось проходит через начальную точку маршрута A(xa, Уа). Полярные координаты произвольной точки плоскости обозначаются символами (р, у). Полярное уравнение круговой зоны обнаружения детектора имеет вид:

(69) р2 (у) - 2pd (у)1 cos(y -в) +12 = г2,

где pd( у) - полярный радиус точки окружности - границы круговой зоны обнаружения детектора (нижний индекс соответствует англ. detector); (l, в) - полярные координаты детектора -центра зоны обнаружения; r - радиус зоны обнаружения.

Квадратное уравнение (69) разрешается относительно полярного радиуса pd( у):

(70) Pd (У) = l cos(y - в) ±7 г2 -1 sin2 (у-в);

Pd у) ^ Pd2(у).

Попадание уклоняющегося объекта с полярными координатами (р, у) в пределы круговой зоны обнаружения детектора возможно лишь при выполнении системы неравенств

Pd1(V) >P(¥) > Pd2 (у) .

Во введенной полярной системе координат задача об оптимизации закона уклонения от обнаружения системой разнородных наблюдателей сводится к минимизации функционала

Т , ■ 2 , 2 • 2\

р Г KP +Р V )л+ . С11 \ л = -;-dt —> min ,

v'1' j p2 (¥,¥,p,p)

при наличии граничных условий

P(0) = Pa, у(0) = 0 ; P(r) = PS, у(Т) = ув , и ограничения (72) p(H Й [Pd 1(у),Pd2(у)]; уе [у(0),у(Т)].

Из общих результатов теории оптимального управления известно, что при наличии ограничений в виде неравенств на функции координат подвижного объекта оптимальная траектория состоит из участков, часть из которых лежит на границе допустимой области, а остальные - внутри допустимой области.

В точках сопряжения отдельные отрезки оптимальной траектории сшиваются гладко.

Решение задачи (71)-(72) об оптимизации закона уклонения при наличии ограничения на траекторию в виде окружности сводится к нахождению оптимального закона управления при движении объекта по дуге окружности (круговой траектории) при произвольном времени движения, нахождению в явном виде условий сопряжения отдельных участков траектории и минимизации суммарного риска.

При движении объекта по фиксированной круговой траектории оптимизация закона уклонения сводится к оптимизации закона изменения скорости. Пусть О(ро, щ>), Н(рн, Щн) - точки входа и схода траектории с круговой границы, соответственно; То, Тн - моменты входа и схода.

Явный вид функционала на круговой траектории при

к р

В силу (70) производная полярного радиуса по времени имеет вид

. _ 1ра$т(ц/-в) .

(74> п\ч,-е)Ч/'

Возводя (74) в квадрат, подставляя результат в (73) и приводя подобные члены, находим выражение для функционала при движении по круговой траектории:

(75)

В функционале (75) подынтегральная функция не зависит в явном виде от времени, поэтому в вариационной задаче на минимум функционала (75) при фиксированном времени движения по дуге окружности существует первый интеграл - гамильтониан, который совпадает с лагранжианом. Следовательно, исходя из физического смысла функционала и в силу (75), скорость

движения объекта по дуге окружности пропорциональна ро(у). Поэтому для круговой траектории справедливо соотношение

Лу') = СвиРа у).

Постоянная Сои определяется из условия прохождения отрезка дуги ОИ с использованием оптимального закона изменения скорости за время

/тт /тт й т

~~ *он

= г

ds(у)

Так как в полярной системе координат = ^р + р^ёу/, то

Рс! = -

ф-2 -Г-ып-(у-в)

Из (75) следует, что значение риска, соответствующее оптимальному закону уклонения при движении по круговому участку траектории,

(76)

Кви =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Гп

\

г2 -1^ш2(у —0)

Т

1 Г)

Задача имеет смысл, если начальная точка А и конечная точка В маршрута находятся вне зоны обнаружения детектора. Уравнение отрезка оптимальной траектории движения, проходящей через начальную точку А и произвольную точку о в отсутствие ограничений (логарифмической спирали), задается формулой

(

Р= Ра ^

¥-¥Л

1П рВ-

Л

¥в — ¥ а Ра.

Дифференцируя функцию р по у, находим уравнение касательной к спиральному отрезку траектории в точке О:

1П-

Ра

(77) ЛРв (у) =

В ¥в — ¥а

Продифференцировав уравнение окружности (69), находим уравнение касательной к окружности в точке О в виде

2

4Рв (Щ) _ Рв1^ Щ-в)

Щ Рв~ IС08

Пусть сопряжение участков оптимальной траектории, начинающейся из точки А спирали и дуги окружности, происходит в точке О. Так как участки траектории сшиваются гладко, то, в силу (77) и (78), полярный угол точки касания подчиняется одному из уравнений

В (79) знаку плюс в левой части уравнения соответствует знак минус в правой части и наоборот. Наличие двух уравнений типа (79) является следствием того, что из любой точки плоскости, лежащей вне круговой зоны обнаружения детектора, можно провести два отрезка логарифмической спирали, касающихся границы круга (окружности) в разных точках. Эти точки обозначаются далее О^ и Н), ] = 1, 2; соответствующие им траектории в вещественной плоскости, соединяющие начальную и конечную точки маршрута в вещественной плоскости, обозначаются символами (рис. 7а) АО\Н\Е; АОНВ; их образы в комплексной плоскости - символами , , , , I = 1,2 соответственно (рис. 7б). Точечная линия соответствует оптимальной траектории уклонения ПО в отсутствие детектора.

Подстановка найденных значений в (77) определяет полярные радиусы соответствующих точек касания.

Аналогичное условие сшивания выписывается для точки Н:

(79)

У в -Ул

+Ит(у/Н -в)

(80)

- 1п С05(Щ -в) Г2 - 128Ш2(ЩЯ -в) ) + 1п р

У в -Щн

а б

Рис. 7. Построение оптимальной траектории уклонения в системе сенсор-детектор в действительной (а) и комплексной области (б)

Из содержимого раздела 2 следует, что экспоненциальным участкам траектории соответствуют риски

(81) ЯАВ

1

(82) Янв =— (ун )

Т

нв

■1д2 Р Ра

-1д2 Р

Рв

Т

Т /С

Т

нв

Задача оптимизации закона уклонения свелась к решению уравнений (80), (81), суммированию отдельных рисков по траекториям ЛВ\И\В; ЛБИВ при наличии ограничения на время перехода Т и выбору меньшего полного риска.

В результате решения уравнений (81) и (82) определяются координаты точек В и И, которые являются точками сопряжения логарифмических спиралей и окружности. Далее, формулами (76), (81) и (82) задаются явные выражения для рисков, соответствующих различным участкам оптимальной траектории. Общий вид этих выражений следующий: а

Я =-

Т

где индексом i = 1, 2, 3 обозначен порядковый номер участка оптимальной траектории, а o - некоторые константы, определяемые через координаты начальной и конечной точек участков траектории.

Оптимизационная задача сводится к следующей задаче нахождения условного экстремума функции трех переменных вида

(83) 0 + o + ° ^ min

T 1 1 TiJiJ3

при условии

(84) T1 + T2 + T3 = T,

где Ti = Tad, T2 = Tdh, T3 = The- Решение задачи (83)-(84) имеет следующий вид.

Пусть функция R = R(Ti, ..., Tn) задается формулой

n „R = L o,

L T '

и на сумму Ti наложено ограничение

N

Zt=T.

i=1

Тогда функция R достигает минимума на значениях Ti, равных

Т = > т

Ti N 1 .

i=1

Минимальное значение R равно

l vo

R = '

Т

Решения оптимизационной задачи иллюстрируются рис. 8, на которых изображены оптимальные траектории уклонения ПО на плоскости при наличии и в отсутствие детектора. Управляемый объект переходит из точки (1; 0) в точку (0; 1). Начало системы координат совпадает с расположением сенсора. Каждая

2

траектория при наличии детектора состоит из трех участков -двух отрезков логарифмических спиралей и дуги окружности. Точечной линией изображена оптимальная траектория движения ПО в отсутствие детектора (круговая траектория). Рис. 8а соответствует расположению детектора в точке (0,8; 0,7). Оптимальной является траектория ЛВ^ИгВ, по которой ПО проходит между обнаружителями. Эта траектория может быть названа траекторией прорыва. Рис. 8б соответствует расположению детектора в точке (0,6; 0,7) Оптимальной является траектория ЛВ\И\В. Эта траектория может быть названа траекторией обхода системы обнаружителей.

яГ4'

Ч / л,1

я.\

А

Н г

\

\ а

я V

¿1 7 4

А ]:о

а б

Рис. 8. Построение оптимальной траектории прорыва в системе сенсор-детектор

4.2. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ (СТАЦИОНАРНЫЙ СЕНСОР - ГРУППА СТАЦИОНАРНЫХ ДЕТЕКТОРОВ)

Результаты решения задачи об оптимизации закона уклонения приводятся в статье [22], которая является развитием статьи [2\].

Вводится полярная система координат, полюс которой совпадает с положением сенсора, а полярная ось проходит через начальную точку маршрута Л(хл, ул). Полярные координаты

произвольной точки плоскости обозначаются символами (р, у). Уравнение круговой зоны обнаружения /-го детектора в полярной системе координат имеет вид: (85) pd(у)-2рш(у)1, cos^-6,) +l2 = r2 ,

где pd( у) - полярный радиус точки окружности - границы круговой зоны обнаружения /-го детектора (нижний индекс соответствует англ. detector); (//, 6) - полярные координаты детектора - центра зоны обнаружения; Г/ - радиус зоны обнаружения, / = 1, ..., q - номер детектора, q - число детекторов.

Квадратное уравнение (85) разрешается относительно полярного радиуса p/d( у):

Pd(у) =l icos(y-6) WГ -1<sin2(y-6); Pdi(у) >рй2(У)-

Попадание уклоняющегося объекта с полярными координатами (р, у) в пределы круговой зоны обнаружения детектора возможно лишь при выполнении системы неравенств

Pdiy) >P(V) >Pd2(У) .

Запрещенные области задаются строгими неравенствами

Qt = {(р, у): р2ш (у) - 2рш (у)1 cos(y - 6) + lf < r2 }.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Во введенной полярной системе координат задача об оптимизации закона уклонения от обнаружения системой разнородных наблюдателей сводится к минимизации функционала

v ' •> р (v.V.P.P)

при наличии граничных условий

(87) р(0) = рА, у(0) = 0 ; p(T) = рв, у(Г) = ув ,

и ограничениях

(р,у) ¿ Q,[рл(у),ра2(у)\; i= q ( ) уе[у(0),у(7)]•

Для нахождения оптимального закона уклонения в [22] используется конформная замена в функционале риска (см. также п. 2.3 настоящей работы). Так как движение объекта происходит в М2, то вещественная плоскость М2 отождествляется с комплексной плоскостью С, вводится комплексная координата

г = х + ¡у, где г(х, у) - двумерный вектор декартовых координат объекта на вещественной плоскости и проводится оптимизация функционала ((86) в € с последующим отображением полученных результатов в М2. В результате замены переменной функционал (86) записывается следующим образом:

(89) = =

т(И) , гт г ! 2 \ , 4 у ^ - 1 -Л. 2 2 2 у 2 у

Подынтегральное выражение является произведением некоторой функции и комплексно-сопряженной к ней функции. Дифференциальная замена й^=2 приводит функционал (89) к виду

(90) 11{м/,м/,м/,м/) = | {м/ м>)&.

Вариационная задача об оптимизации исходного функционала (22) сводится к задаче минимизации функционала

(90) при наличии ограничений (88)

(91) = ^ тт-

Геодезической линией (91) в отсутствие ограничений на скорость объекта является прямая, проходящая через точки жл, wв - образы в пространстве комплексной переменной ^ граничных точек Л, В. При наличии координатных ограничений геодезической также является кривая наименьшей длины.

Из общих результатов теории оптимального управления известно, что при наличии ограничений в виде неравенств на функции координат подвижного объекта оптимальная траектория состоит из участков, часть из которых лежит на границе допустимой области, а остальные - внутри допустимой области. В точках сопряжения отдельные отрезки оптимальной траектории сшиваются гладко.

Свойства решения задачи (87)-(89) устанавливаются в [22] следующим утверждением.

Пусть на плоскости заданы выпуклые открытые множества й П(2/= 0;*',7 = ] . Решение задачи (87)-(89) в плос-

кости ^ состоит из последовательно чередующихся отрезков прямых и криволинейных участков движения по границам множеств Qi. В точках сопряжения участки оптимальной траектории сшиваются гладко, а сама траектория включает не более одного участка границы любого множества Qi. В [22] показано, что оптимальная траектория состоит не более чем из 2д + 1 отрезков, где q - число детекторов и, соответственно, запрещенных множеств. На вещественной плоскости участки траектории являются чередующимися отрезками логарифмической спирали и дуг окружностей Qi, которые сшиваются гладко. Пусть участок оптимальной траектории - спирали, начинающейся из точки Огк окружности Qi и заканчивающейся в точке Dik окружности Qk, сопрягается с дугами окружностей Qi и Qk в точках Dik и Dki. Полярные углы точек касания подчиняются системе уравнений

(92)

2 - )

1п[/ ,. со^ -в,) г? -1.231П2(У% -в,))

У в., -Ув,.

гк кг

1п [¡к со8(Уви -вк ) гк - /^1П2(УВи -вк ) )

У в., -Ув,.

¡к кг

-в*)

^г2 - /2зт2(Уви -9к)

_ 1п[к С08(Уви -9к ) ±^гк - /к281П2(Уви -9к ))

1п [/1 со^й - 9) г2 - /¡^1П2(Увй -9))

В системе (92) знаку плюс в левой части каждого уравнения соответствует знак минус в правой части и наоборот. Комбини-

руя знаки плюс и минус, получаем четыре пары решений (Щк, щ) и, соответственно, четыре пары точек Вы. Полный риск

*=Е

Т

при ограничениях

N

т =ет

достигает минимума на значениях

Т =

I N

Т.

I=1

Минимальное значение риска

n 2

(Е &) *—. Т

Решение задачи (87)-(89) иллюстрируется рис. 9а, б, на которых изображены траектории уклонения от двух детекторов в комплексной (а) и вещественной плоскостях (б).

а б

Рис. 9. Траектории уклонения ПО от двух детекторов в комплексной (а) и вещественной плоскостях (б)

г=1

4.3. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ ИЗ ДВУХ СЕНСОРОВ

На плоскости расположены три объекта - два одинаковых стационарных сенсора и управляемый подвижный объект. Координаты начальной и конечной точек маршрута и позиций наблюдателей заданы в неподвижной декартовой системе координат, начало которой совпадает с серединой отрезка, соединяющего две позиции наблюдателей, расположенные в точках (-1; 0) и (1; 0) соответственно. Управляемый объект перемещается из начальной точки А(ха, уА) в конечную точку В(хв, ув) за фиксированное время Т, минимизируя путем выбора траектории скорости объекта функционал обнаружения (риск)

1 1

11(х,у,х,у) = \(хг+уг)т С

(х-1 )2+у2 (х + 1 )2+у2'

Ш1П

->-

х,У; х,у

Так как движение объекта происходит в М2, то предлагается отождествить М2 с € и ввести комплексную координату г = х + ¡у, где 7 - мнимая единица. В результате замены переменных функционал обнаружения переписывается в виде - Т - 1 1 { (г-1)(г-1) (г + 1)(г+1)

Дробно-линейная замена переменной г комплексной плоскости

г +1

н> = -

г -1

позволяет преобразовать функционал обнаружения к виду - т 1 - 1

• 2 У№

Далее переменная w рассматривается в координатах (Р, Щ): w = ехрр, схр(г р),

где

р е (-ж, х>), ре [0,2л]. В новых координатах функционал переписывается в виде

0

1

(92) Я(р,(р,р,ф) = ^(р + ф)скрЛ.

Уравнения Эйлера - Лагранжа для функционала (92) имеют вид

-

(-

- (-- I

■2 , - 2 р +ср

скр) = 0;

■ 2 , - 2 Р +(Р

скр) - д/р1 + ф2зкр = 0.

Решение уравнений Эйлера - Лагранжа для функционала (92) выражается через нормальные эллиптические интегралы Лежандра и имеет вид

( т-т \

™ =

ат( ФФ + Б(рл, С

ехр(/ ф),

где

р

ЯР, С) = |-

о С^

ф-фА = ±С1( Б (р, С;)- Б (Ра, С;)), ехрр = ^(|);Р(0) = РА,р(Т) = Рв .

Уклонение от обнаружения системой из двух сенсоров возможно на траектории прорыва либо на траектории обхода системы сенсоров. Для случая ^ = ™в прорыв в плоскости г осуществляется только если ^ е {¿ё < 1} .

4.4. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ ГРУППОЙ СТАЦИОНАРНЫХ СЕНСОРОВ

В статье [13] была описана модель обнаружения ПО по излучаемым им сигналам, в рамках которой при малых отношениях сигнал/помеха на входе сенсора оптимизация закона уклонения ПО по критерию вероятностного риска сводится к минимизации энергетического риска.

0

Аналитическое решение задачи оптимизации закона уклонения ПО от обнаружения при произвольном числе сенсоров и произвольном их расположении неизвестно. В статье [18] был описан численный алгоритм оптимизации для случая, когда все сенсоры имеют одинаковые характеристики, используют одинаковые алгоритмы обработки информации и осуществляют независимо прием в одних и тех же помеховых условиях. Оптимизация закона уклонения ПО от обнаружения системой из N неподвижных сенсоров сводится в этом случае к решению вариационной задачи о минимизации функционала (риска)

* U x2(t) + y 2 )Г

Я=Г У VV '-r dt —> min

(93) Jo - (x(-»

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

при наличии граничных условий

x(0) = XA' x(T) = XB,

(94) y(o) = yA, y(T)=yB:

где (x, y), (üt, bi) - координаты ПО и i-го сенсора в неподвижной декартовой системе координат.

Функционал (93) не зависит явно от времени - независимой переменной, поэтому уравнения Эйлера для вариационной задачи (93) имеют первый интеграл. Непосредственной проверкой устанавливается, что он совпадает, с точностью до постоянного сомножителя, с лагранжианом задачи. Следовательно, подынтегральное выражение остается постоянным при использовании ПО оптимального закона уклонения. Этот факт был использован при построении численного метода решения задачи оптимизации закона уклонения ПО от обнаружения системой стационарных сенсоров.

В основе метода лежит алгоритм Дейкстры [20]. Этот алгоритм был использован также в [1] при решении задачи об уклонении подвижного объекта от обнаружения, но, в отличие от рассматриваемого в настоящей работе случая, уклонение объекта осуществлялось на постоянной скорости в течение всего времени движения.

На плоскости строится квадратная сетка с расстоянием L между узлами. Каждый узел соединяется отрезками (ребрами) с 32 соседними узлами. Длины ребер равны

ь, ьЛ, ьТ5, ¿710, ¿л/1з . Множество допустимых траекторий ПО аппроксимируется неориентированным графом Go = (5Ь, Do), где 50 = {1, ..., п} - множество узлов, Do - множество неориентированных дуг. Траектория (х(-), у())ПО аппроксимируется отрезком пути Р на графе Go, где путь Р определяется как последовательность узлов (/о, ...,/Р) таких, что /о = А, /р = В (начальная и конечная точки маршрута) и дуг (ребер) </-1,ук> е Do для всех к от 1 до Р. Принимается, что ПО уклоняется на кусочно-постоянной скорости; на траектории движения между двумя соседними узлами скорость постоянна. Вводятся обозначения: у - момент попадания объекта в узел /к, v(/'к-ь /к) -скорость движения объекта на ребре </к-1, ук> между двумя соседними узлами.

Рис. 10. Применение алгоритма Дейкстры для построения оптимальной траектории уклонения

При принятых предположениях задача оптимизации функционала (93) при т = к = 2 сводится к задаче минимизации критерия

(95) R = — — f4 -V2( jk-1' jk)-d ^ min

(95) — —(x(t) -a) + (y(t) -b)2 (xm),y(-))

при наличии ограничения

p

(96) —(tjk - y3J = T•

k=1

Суммирование в формуле (95) ведется по числу ребер, включенных в маршрут, и по числу сенсоров.

Задача уклонения от обнаружения имеет смысл в том случае, когда на траектории уклонения сенсоры и объект разделяют достаточно большие расстояния. При достаточно мелкой сетке можно считать, что на интервале времени движения по ребру расстояние между сенсором и объектом остается постоянным и принять его равным, например, расстоянию в момент попадания pj-i).

При движении объекта по оптимальной траектории с использованием оптимального закона изменения скорости должно выполняться равенство

n 1

(97) у2 (jk -1 > jk —= С,

1=1 Р2( jk-1)

где С - некоторая постоянная (значение первого интеграла).

Обозначим символом L(jk-i, jk) длину ребра <jk-i, jk> е D. Тогда при фиксированном значении первого интеграла по формуле (96) для каждого ребра определяется оптимальная скорость движения, и далее - время движения по ребру

T = t - t = L(jk-1'jk )

(98) jkjk- h jk- V(jk-!, jk) .

Задача о минимизации функционала (95) свелась к задаче о минимизации функции

(99) R = ——Ртг (tjk - tjk-1)

k=1 1=1 Р (jk-1)

при наличии начальных условий (94) и ограничений (96), (97).

Алгоритм оптимизации закона управления подвижным объектом имеет следующий вид.

Шаг 1. Вводится система координат; задаются координаты начальной и конечной точек маршрута, количество сенсоров и их координаты; задается время движения объекта. Определяются шаг сетки и координаты узлов. Начальная и конечная точки маршрута входят в число узлов сетки. Задается произвольное положительное число С - начальное значение первого интеграла.

Шаг 2. По мере перемещения по сетке, для произвольного узла с номером /к-1 определяются два значения - частичная сумма (накопленное значение) Я ^ и время движения Т ^ от

начального узла сетки до данного узла. Для начальной точки маршрута эти значения устанавливаются равными 0.

В каждом узле делается шаг расчета. Вначале определяется множество возможных ребер. Возможным ребром считается ребро, ведущее в узел, из которого еще не делался шаг расчета и которое не ведет в узлы, находящиеся вне области нахождения решения.

Для каждого возможного ребра рассчитывается величина

При попадании в узел /к из узла /к-1 определяются значения

Если ранее в этом узле уже были установлены значения указанных параметров, то сравнивается ранее установленное значение Я с суммой Я + Я . Если Я > Я + Я , то

Зк J ^к-1 Зк-1Л Зк Зк-1 Зк-1 Зк

устанавливаются новые значения ЯЛ = ЯЛ + ЯЛ Л и

Т = Тк ^ + Т-г ; присваивается узлу номер N = /^ (смысл

операции - указание номера узла, из которого был осуществлен переход в данный узел).

Шаг 3. Из множества узлов, для которых установлены значения параметров и из которых не делался шаг расчета, выбирается узел /к, которому соответствует минимальное значение ЯЛ .

Если такого узла нет, т.е. время достижения узла Я превосхо-

N „2

дит заданное время прохождения маршрута Т, то задача, при выбранной величине первого интеграла, решения не имеет. В противном случае - переход к шагу 2 для узла д.

Шаги 2 и 3 повторяются до момента достижения конечной точки маршрута.

Шаг 4. Сравниваются время Tc достижения конечной точки и заданное время прохождения маршрута Т. При \Tc - ?1 > А, где А - величина, характеризующая принятую точность выполнения ограничения (97), выбирается новое значение первого интеграла С. Переход к шагу 2 для начального узла.

Решением задачи является нахождение пути, для которого значения первого интеграла минимально и при котором выполняется ограничение^ - T\ < А.

Описанная схема была использована для оптимизации закона уклонения ПО от обнаружения.

Цель моделирования состояла в построении оптимальной траектории уклонения объекта от обнаружения группой сенсоров и определении оптимального закона изменения скорости на траектории.

Результаты моделирования иллюстрируются рис. 11-14. На каждом рисунке изображены составляющие оптимального закона управления подвижным объектом - оптимальная траектория уклонения, оптимальный закон изменения скорости как функция текущего момента времени, вероятности необнаружения во времени каждым из сенсоров и всей системой наблюдателей. Вероятности рассчитывались в рамках изложенной в [13] модели обнаружения. Рисунки отличаются количеством сенсоров в регионе. На рисунках указаны положения начальной А и конечной В точек маршрута; количество и расположение сенсоров, обозначенных символами, Si, / = 2, 3, 4. Моделирование проводилось для региона размерами 220 х 300 км. При всех вычислительных экспериментах положения точек А, В и Sl не менялись; координаты их указаны на рисунках. Время прохождения маршрута составляло 45 часов. Шаг сетки L = 1,945 км.

Решение задачи об оптимизации закона уклонения от обнаружения единственным сенсором иллюстрируется рис. 11.

На рисунке изображены две траектории уклонения. Кривые, снабженные индексом 1, получены в результате аналитического решения задачи. Кривые, снабженные индексом 2, получены моделированием. Такое практическое совпадение теоретических результатов и результатов моделирования позволяет сделать вывод о пригодности алгоритма Дейкстры для целей оптимизации.

Рис. 11. а) Траектория уклонения от обнаружения единственным сенсором, 1 - построенная в результате аналитического решения задачи; 2 - построенная моделированием; б) скорость ПО; в) вероятность необнаружения сенсором 51

Рис. 12. а) Траектории уклонения от обнаружения двумя сенсорами; б) скорость ПО; в) вероятность необнаружения каждым сенсором ^ и Я - суммарная вероятность необнаружения

Рис. 13. а) Траектории уклонения от обнаружения тремя сенсорами; б) скорость ПО; в) вероятность необнаружения каждым сенсором и R - суммарная вероятность необнаружения

Рис. 14. а) Траектория уклонения от обнаружения 4 сенсорами; б) скорость ПО; в) вероятность необнаружения каждым сенсором Si и R суммарная вероятность необнаружения

4.5. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ РАЗНОРОДНЫХ НАБЛЮДАТЕЛЕЙ

Рассматриваемая в статье [11] задача об оптимизации закона управления подвижным объектом при наличии разнородных средств обнаружения трактуется как задача оптимизации при наличии ограничений на траекторию уклонения. Систему разнородных наблюдателей образуют сенсоры и детекторы. Так как попадание подвижного объекта в круговую зону обнаружения детектора, по предположению, приводит к его мгновенному обнаружению, то задача об оптимизации закона уклонения от обнаружения системой разнородных наблюдателей сводится к задаче уклонения от обнаружения системой сенсоров при наличии круговых запретных зон (круговых ограничений) - зон обнаружения детекторов. При малых отношениях сигнал/помеха оптимизация закона уклонения ПО от обнаружения системой из N неподвижных сенсоров и неподвижных детекторов сводится к решению вариационной задачи о минимизации функционала(риска)

и ограничений

ш1п[^ (1)-г ] > 0, 5 = 1,...,

03<Т 5

где (х, у), (а,, Ь) - координаты ПО и 7-го сенсора в неподвижной декартовой системе координат; d(s, /)- текущее расстояние между ПО и детектором с номером 5.

Аналитическое решение задачи об оптимизации закона уклонения подвижного объекта от системы, содержащей группу из произвольного числа разнородных наблюдателей, в литературе неизвестно. Для решения задач уклонения от систем разнородных наблюдателей был разработан численный алгоритм на

Ж

^ Ш1П

(*(■), уО)

при наличии граничных условий

х(0) = хА, х(Т) = х

V / _ лВ

У(0) = Ул> У(Т) = Ув,

основе алгоритма Дейкстры [20]. Алгоритм описан в п. 4.4 настоящего обзора и был доработан с целью учета круговых запретных областей.

Целями численного эксперимента были оптимизация закона уклонения объекта от обнаружения системой, включающей в себя несколько сенсоров и детекторов; оценка вклада каждого сенсора в вероятность обнаружения объекта; оценка зависимости вероятности обнаружения объекта от числа и расположения систем обнаружения.

Результаты моделирования иллюстрируются рис. 15-18. Рисунки отличаются составом наблюдателей в районе. На рисунках указаны положения начальной А и конечной В точек маршрута, количество и расположение сенсоров Si и детекторов Di. Перемещение объекта происходит в районе размерами 240 х 300 км в течение 45 ч. Положения точек А(160, 90), 5(80, 300), Sl(200, 90) км фиксированы во всех вычислительных экспериментах, S2(70, 250), Sз(80, 40).

На каждом из рис. 15-18 изображены:

- составляющие закона управления подвижным объектом: оптимальная траектория уклонения (снабженная стрелками) и оптимальный закон изменения скорости как функция текущего момента времени; на всех графиках указано максимальное значение скорости объекта на траектории, ось абсцисс соответствует нулевой скорости; на некоторых графиках указаны также значения начальной и конечной скоростей;

- значения вероятности необнаружения объекта как функции текущего момента времени, рассчитанные для каждого сенсора и системы сенсоров в целом; индекс Si при кривой указывает номер соответствующего сенсора; индексом снабжена результирующая кривая, характеризующая вероятность необнаружения системой в целом.

Введение нового сенсора или детектора в систему наблюдателей приводит к изменению положения и увеличению числа локальных минимумов функционала обнаружения при решении задачи оптимизации. Однако только один из этих минимумов будет глобальным при произвольном выборе положения и типов наблюдателей.

Рис. 15. Координаты детектора и его радиус: А(80, 40, Г1 = 50), вероятности необнаружения: Рг^\) = 0,756; Ргф) = 0,730, Рп = 0,552

Рис. 16. Два сенсора и два детектора. Координаты детекторов и их радиусы: А(130, 70; п = 50), £2(100, 220; Г2 = 30), вероятности необнаружения: Рг^) = 0,767; Рг^2) = 0,711,

Р^ = 0,545

Скорость

О 9 18 27 36 45

Время, ч

Рис. 17. Два сенсора и три детектора. Координаты детекторов и их радиусы: Щ130, 70; п = 40), ^(70, 170; п = 30), Щ110, 230; гз = 30); вероятности необнаружения:Рг(Б\) = 0,763; Рг(&) = 0,719, Ргъ = 0,55

Траектория 1 Траектория 2

Рис. 18. Три сенсора и два детектора. Координаты детекторов и их радиусы: А(130, 70; п = 30); Щ100, 220; п = 30); скорости; вероятности необнаружения

4.6. УКЛОНЕНИЕ ПО ОТ ОБНАРУЖЕНИЯ СИСТЕМОЙ НАБЛЮДАТЕЛЕЙ (СЕНСОР - МАНЕВРЕННОЕ СРЕДСТВО)

В статье [11] рассматривается задача построения траектории уклонения ПО на плоскости. Поисковая система состоит из сенсора, расположенного в начале декартовой системы координат, и маневренных поисковых средств. Заданы начальная A(xa, Уа) и конечная В(хв, ув) точки маршрута. Вводится полярная система координат, полюс которой совпадает с положением сенсора, а полярная ось проходит через начальную точку маршрута. Полярные координаты произвольной точки плоскости обозначаются символами (р, у). Время движения по маршруту фиксировано и равно T. Область поиска маневренного средства задается связной областью Q.

Основной характеристикой модели маневренного средства является интенсивность поиска y(t) - среднее число обнаружений объекта в районе поиска в единицу времени. Критерий имеет следующий вид:

R = iI ( ЛI+ p? xQY{t)) dt,

где pi, p2 - весовые коэффициенты, %Q - индикатор множества Q. Вводится величина p = Р2ХО /Pi. Предполагается, что интенсивность поиска постоянна. Тогда во введенной полярной системе координат задача об оптимизации закона уклонения от обнаружения системой сенсор - маневренное средство сводится к минимизации функционала

Ä = Jn -+ min,

J0 ^ р2 Q ) (у(.),p(.))

при наличии граничных условий

р(0) = PA, w(0) = 0, p(T ) = pb , w(T) = wB

,

где первое слагаемое, стоящее под интегралом, пропорционально интенсивности поиска сенсором, второе слагаемое - интенсивности поиска маневренным средством в заданном районе Q. Решение задачи

Решение краевой вариационной задачи, если зона действия маневренного поискового средства охватывает всю плоскость,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

не отличается от решения задачи при отсутствии такого средства, т.е. при р = 0. Оптимальной траекторией в этом случае является логарифмическая спираль, проходящая через начальную и конечную точку маршрута. Такой траектории соответствует значение функционала обнаружения [10]

(100)

яав -

1

(

Т

ав

(Уа ~Ув)2 + 1п2 — Ра

\

Р Т = Сав

Р 1 ав

Т

Р та

ав

Т = Т

тав Т .

Предполагается, что оптимальная траектория частично проходит внутри области Q, а именно проходит через точки А, С, В, В, где точки С, В лежат на границе области Q. Также предполагается, что логарифмическая спираль, соединяющая точки С, В, полностью лежит внутри области Q. Тогда задача оптимизации траектории заключается в выборе этих точек и времени нахождения на каждом участке траектории. Участкам траектории - частям логарифмической спирали соответствуют значения функционала обнаружения (нижний индекс указывает начальную и конечную точки участка траектории)

яас -

Ясп -

Т

/-Ч

Л

(Уа -Ус)2 + 1п —

Ра у Л

Т

А,

Япв

(Ус -Ув)2 + 1п2 —

Рс у

-Ув )2 + 1п2 Р Рв

+ Р Т = ^св + Р Т

+р тсв у, + р та

Оптимизационная задача сводится к следующей задаче нахождения условного экстремума функции семи переменных вида:

я(тас,тсв,ТввУс Ув ,1п Рс ,1пРв) - °АС

Т Т

-*■ лп -*■ т

+р тсв ^ ш1п

Твв ТАС, тсв , ТВВ ,уС ,ув, 1прС, 1прв

1

1

при ограничениях (102а) Тлс+Тсо+Тоб=Т

Qd0!íб)1nРс) = 0, QD,1пpD) = 0-

Здесь ограничения (102б) принадлежат границе Г^ множества Q.

Необходимые условия экстремума записываются в виде

(103) ^ = Л ^ - р = Я, ^ = Я, Я = СШ*,

тас тсв твб

дЯ дQc дЯ дQc

(104) -— = , т:-=

д¥с д¥с д 1п Ра д 1п Ра

дЯ дQD дЯ дQD

(105) дув Л ду0 , д 1пр ° д 1пр

Равенства (101)-(105) позволяют выразить константы Я, Яс, Яэ через координаты точек Л, Б, С, Э и полное время нахождения в пути подвижного объекта.

Решение уравнений (103)-(105) при условиях (101), (102), находится для двух областей действия маневренных средств. Сектор - зона действия маневренного средства Предполагается, что между начальной точкой А и конечной точкой В маршрута движения подвижного объекта находится область действия маневренного средства, заданная в виде

Q = {(¥,Р) ' ¥^ [¥с^], Ре (0, +да))-Границей множества Q являются лучи Qс = дQ = {(у,Р):у = ¥с, Ре (0, +да)}, QD = дQ = {(у,Р):у =WD, Ре (0, +да)}-

Поскольку угловые координаты зоны действия маневренного средства фиксированы, то необходимые условия экстремума (11), (12) переписываются следующим образом:

1п Рс - 1пРа , 1пРс-}пР^ = 0 1про—1прв+ 1пРс - 1прд -0

Т т , т Т

ТАс TCD TDB TCD

Вводятся новые переменные:

(106) r = ln р, т =

Нижние индексы у новых переменных обозначают участки траектории (точки начала и/или конца подмаршрута) движения ПО, к которым они будут относиться.

Таким образом получается система из шести нелинейных уравнений с шестью неизвестными (tac, tcd, tdb, re, td, Л), а именно:

((Wa -Wc)2 + (rA-rc)2)Tac = л (( Wc -Wd )2 + (rc-rD )2 )tCd -p = л ((Wd -Wb )2 + (rD - rB )2)Tdb = л (107) ^ (rc - rA )tac + (rC - rD )tcd = 0,

(rD - rB )tDB + (rD - rC )tcd = 0,

-l + -i_ -± = t .

тAC TCD TDB

В [22] показано, что решение системы (107) сводится к решению системы двух уравнений

ч2 /......\2

(108)

(Wc -Wd ) (Wa -Wc ) _

T

cd

T

p,

ac

í

T

-L A,

1 -

Wd -Wb

\

T = T

TCD T •

Wa -Wc

относительно переменных Tac, Tcd, которая, в свою очередь, сводится к полиномиальному уравнению четвертой степени относительно любой из переменных и поэтому в общем виде может иметь четыре пары корней вследствие линейной связи (108). Далее, выбираются те решения, для которых Tac ^ 0, Tcd ^ 0, а затем те, что дают минимальное значение критерия.

В качестве примера приводится решение при следующих начальных условиях: wa = 0, w = я/2, We = я/6, Wd = я/3, Pa = 1, рв = 2, T = 1, p = 1. Решение задачи иллюстрируется рис. 19.

Внутри сектора, границы которого показаны на рисунке пунктирной линией, действует поисковое средство с р = 1. Точечной линией показаны траектория и скорость ПО в отсутствие поискового средства, сплошной линией показаны оптимальная траектория и оптимальный скоростной режим ПО. Видно, что при заданных условиях задачи траектория меняется незначительно, а скоростной режим является разрывной функцией и существенно отличается от режима в отсутствии поискового средства.

в

Рис. 19. Графики, построенные на основе аналитического решения задачи для поискового средства вида «сектор»: а) траектория; б) скорость движения подвижного объекта; в) интенсивность поиска. Границы «сектора» показаны штрих-

пунктирной линией. Пунктирной линией обозначены траектория и скорость ПО в отсутствие поискового средства

Значение функционала на оптимальной траектории равно Я = 3,4357, на оптимальной траектории в отсутствии поискового средства Яо = 2,9481.

Кольцо - зона действия маневренных средств. Пусть между начальной точкой А и конечной точкой В маршрута движения подвижного объекта находится область действия маневренного средства, заданная в виде Q = {(О,Р): У е [0,2^], р е (рс,р0)}. Границей множества Q являются окружности

= {(О Р):Ое[0,2^], Р = Рс}, QD = = {(О Р):Ое[0,2^], Р = рв}.

Поскольку радиальные координаты зоны действия маневренного средства фиксированы, то необходимые условия экстремума (104), (105) переписываются следующим образом: (109) Ос -Оа , Ос- О =0,

Т

А,

Т

ГЧ

О -Ов , О -Ос _()

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т

Т

ХАС CD ^В

В переменных (106) необходимые условия экстремума записываются в виде системы из шести нелинейных уравнений с шестью неизвестными (тас, тсэ, тэв, гс, гэ, Л), а именно:

((Оа -Ос)2 + (га - гсУУас = Л,

((Ос -О )2 + (гс - гз)2 - Р = К

((О - О в )2 + (гз - гв УУов = Л,

(110) \°с -Оа)тас + (Ос -О )тсз =0,

(О - О в )тзв + (О - Ос )тсз = 0,

-1- + ± Н± = Т

тас тсз тзв

В [11] показано, что решение системы (110) сводится к решению системы из двух уравнений

(гс - Г3 )2 (ГА - Гс )2 _

(111) т2 т

4 ' -1 ГТ) -1 ,

Т

/I:

2

сз (

1 Н

'■Р,

- гв

ГА - гс

ас \

Т = Т

Остается совместно решить уравнения (111) и (112) относительно переменных Tac, Tcd, которые сводятся к полиномиальному уравнению четвертой степени относительно любой из переменных. Поэтому в общем виде система (110) может иметь четыре пары корней вследствие линейной связи (108). Далее, снова выбираются те решения, для которых Tac ^ 0, Tcd ^ 0, а затем те, что дают минимальное значение критерия.Возьмем те же граничные условия, что и в предыдущем примере, начальных условиях: щ = 0, щ = я/2, ц/с = я/6, щ = я/3, pa = 1, Рб = 2, T = 1, p = 1. Решение задачи иллюстрируется рис. 20.

Траектория Скорость

а б

Интенсивность

3.8 3.6 3.4 Р

3

2.6 -

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 t 8 0.9

в

Рис. 20. Графики, построенные на основе аналитического решения задачи для системы «сенсор - поисковое средство, действующее внутри «кольца»»: а) траектория ПО; б) скорость движения ПО; в) интенсивность поиска маневренного поискового средства

Значение функционала на оптимальной траектории Я = 3,2449. Границы «кольца» показаны штрих-пунктирной линией. Пунктирной линией обозначены траектория и скорость ПО в отсутствии поискового средства.

Внутри кольца, границы которого показаны на рисунке пунктирной линией, действует поисковое средство с р = 1 Точечной линией показаны траектория и скорость ПО в отсутствие поискового средства, сплошной линией показаны оптимальная траектория и оптимальный скоростной режим ПО. Видно, что при заданных условиях задачи ПО его скоростной режим является разрывной функцией и сильно отличается от режима в отсутствии поискового средства.

5. Заключение

В предположении о том, что противник использует для обнаружения лишь алгоритмы первичной обработки наблюдаемых сигналов приведены решения задач оптимизации законов уклонения ПО от обнаружения однородными и/или разнородными наблюдателями. Представляется, что в ходе дальнейших исследований будут решаться задачи оптимизации законов уклонения для случаев использования противником цифровых алгоритмов обработки информации и алгоритмов вторичной обработки сигналов, а также при наличии траекторных, динамических и интегральных ограничений.

Литература

1. АБРАМЯНЦ Т.Г., МАСЛОВ Е.П., РУДЬКО ИМ., ЯХНО В.П.

Уклонение подвижного объекта от обнаружения группой наблюдателей при малых отношениях сигнал/помеха // Информационно-управляющие системы. - 2011. - №2. -С.2-7.

2. АБЧУК В.А., СУЗДАЛЬ В.Г. Поиск объектов. - М.: Сов. радио, 1977. - 334 с

3. БРАЙСОН А., ХО Ю-ШИ. Прикладная теория оптимального управления. - М.: Мир, 1972. -545 с

4. БУРДИК В.С. Анализ гидроакустических систем. - Л.: Наука, 1988. - 392 c

5. ВОРОНИН АН, ЯСИНСКИЙ А.Г., ШВОРОВ С.А. Синтез компромиссно-оптимальных траекторий мобильных роботов в конфликтной среде // Проблемы управления и информатики. - 2002. - №8. - С. 12-18.

6. ГАЛЯЕВ А.А., МАСЛОВ Е.П., РУБИНОВИЧ Е Я. Об одной задаче управления движением объекта в конфликтной среде // Известия РАН. Теория и системы управления. - 2009. -№3. - С. 134-140.

7. ГАЛЯЕВ А.А., МАСЛОВ Е.П. Оптимизация законов уклонения подвижного объекта от обнаружения // Известия РАН. Теория и системы управления. - 2010. - №4. -С.52-62.

8. ГАЛЯЕВ А.А. О задаче прорыва между двумя сенсорами при движении объекта в конфликтнойсреде // Автоматика и телемеханика. - 2010. - №5. - С. 3-10.

9. ГАЛЯЕВ А.А.,МАСЛОВ Е.П. Оптимизация закона уклонения подвижного объекта от обнаружения при наличии ограничений // Автоматика и телемеханика. - 2012. - №6. -С.73-86.

10. ГАЛЯЕВ А.А. О задаче уклонения от подвижного одиночного наблюдателя на плоскости в конфликтной среде // Автоматика и телемеханика. - 2014. - №6. - С. 28-37.

11. ГАЛЯЕВ А.А., МАСЛОВ Е.П., ЯХНО В.П., АБРАМЯНЦ Т.Г. Уклонение подвижного объекта от обнаружения системой наблюдателей: сенсор - маневренное средство // Автоматика и телемеханика. - 2017. - №8. - С. 113-126.

12. ГАЛЯЕВ А.А. О функционале обнаружения при движении объекта в конфликтной среде // Автоматика и телемеханика. - 2010. - №4. - С. 100-105.

13. СЫСОЕВ Л.П. Критерий вероятности обнаружения на траектории в задаче управления движением объекта в конфликтной среде // Проблемы управления. - 2010. -№6. - С. 65-72.

14. ЦЛАФ Л.Я Вариационное исчисление и дифференциальные уравнения. - М.: Физматгиз, 1966. - 166 с.

15. ЯКУШЕНКО Е.И., ГУРЬЕВ Ю.В. И ДР. Бортовой комплекс управления скрытностью морских подводных объектов с оперативно-советующей системой // Вестник компьютерных и информационных технологий. - 2012. - № 10. -С. 916.

16. CACCETTA L., LOOSEN I., REHBOCK V. Optimal Transit Path Problem for Submarines // Proc. of the 4th Int. Conference on Engineering Applications and Computational Algorithms. -2005. - P. 785-802

17. HALLAM C., HARRISON R., WARD J. A Multiobjective Optimal Path Algorithm // Digital Signal Processing. - 2001. -Vol. 11(2). - P. 133-143.

18. MEGUERDICHIAN S., KOUSHANFAR F., QU G. Exposure in Wireless Ad-hoc Sensor Networks // Proc. of the 7th Int. Conference MobiCom'01. - 2001. - P. 139-150.

19. PACHTER L.S., PACHTER M. Optimal Paths for Avoiding a Radiating Source // Proc. of the 40th IEEE Conference Decision and Control. - 2001. - P. 3581-3586.

20. ZABARANKIN M., URYASEV S., PARDALOS P. Optimal Risk Path Algorithms // Cooperative Control and Opimizaton. Chapter 1 / Eds. Murphey R., Pardalos P. - Dordrecht: Kluwer Acad, 2002. - P. 271-303.

21. ZABARANKIN M., URYASEV S., MURPHEY R. Aircraft Routing under the Risk of Detection // Naval Research Logistics. - 2006. - Vol. 53, No. 8. - P. 728-747.

22. VELTRI G., HUANG Q., POTKONJAK M. Minimal andMax-imal Exposure Path Algorithms for Wireless Embedded Sensor Networks // Proc. Int. Conference Sensor Systems SenSys'03. -2003. - P. 242-249.

A MOVING OBJECT EVASION FROM DETECTION IN THE THREAT ENVIRONMENT

Andrei Galayev, V.A. Trapeznikov Institute of Control Sciences of RAS, Moscow, Corresponding Member of RAS, principle researcher ([email protected]),

Eugenii Maslov, V.A. Trapeznikov Institute of Control Sciences of RAS, Moscow, Doctor of Science, leading researcher, Victor Yahno, V.A. Trapeznikov Institute of Control Sciences of RAS, Moscow, Cand. Sc., senior researcher([email protected]), Tamara Abramyants, V.A. Trapeznikov Institute of Control Sciences of RAS, Moscow, Cand.Sc., leading engineer ([email protected])

Abstract: Formalization and solution results of a number of a moving object evasion problems from detection by homogeneous or collage of observers on a plane are presented. The object is detected by signals of primary (passive mode) and secondary (active mode) field signals irradiated by it. Simulation results are also presented.

Keywords: a moving object detection, threat environment, collage of observers, optimal evasion from detection law.

УДК 517.977 ББК 32.965

DOI: https://doi.org/10.25728/ubs.2019.79.5

Статья представлена к публикации членом редакционной коллегии М.В. Губко.

Поступила в редакцию 08.04.2019.

Опубликована 31.05.2019.

i Надоели баннеры? Вы всегда можете отключить рекламу.