ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2021 Управление, вычислительная техника и информатика № 55
УДК 519.234:621.391 Б01: 10.17223/19988605/55/9
И.М. Рудько
ОПТИМИЗАЦИЯ ТРАЕКТОРИИ ДВИЖЕНИЯ ОБЪЕКТА В КОНФЛИКТНОЙ АНИЗОТРОПНОЙ СРЕДЕ ПО ВЕРОЯТНОСТНОМУ КРИТЕРИЮ СКРЫТНОСТИ
Рассмотрена задача выбора траектории движения маневрирующего объекта и закона изменения его скорости при движении объекта в трехмерной анизотропной среде распространения сигнала, когда его пытаются обнаружить несколько наблюдателей, расположенных в заданном районе. Критерием выбора траектории объекта служит вероятность его необнаружения на всей траектории ни одним из наблюдателей. Предложен трехша-говый последовательный дискретный метод оптимизации этого критерия на основе принципа динамического программирования.
Ключевые слова: траектория движения объекта; вероятность необнаружения объекта на траектории; анизотропная среда; динамическое программирование.
Рассматриваемая задача относится к классу задач об управлении, получивших в отечественной литературе название задач управления подвижными объектами в конфликтной среде [1, 2]. Под конфликтной средой понимается совокупность объектов (они называются конфликтующими), сближение с которыми для управляемого объекта нежелательно в ходе выполнения им основной задачи. Минимизация негативного воздействия конфликтующих объектов на управляемый объект является целью управления. Эта цель достигается путем выбора маршрута его движения, параметров движения и (или) режимов работы технических средств. Задачи об оптимизации закона уклонения подвижного объекта от обнаружения рассматривались в ряде работ, отличающихся предположениями о характеристиках информационных полей, в которых происходит обнаружение [1-6].
В работах [3, 5, 6] рассматриваются задачи уклонения применительно к обработке гидроакустической информации. Как известно, распространение гидроакустического сигнала происходит в анизотропной среде, которая обладает контрастной структурой с чередованием зон акустической освещенности и зон акустической тени [7].
Чаще всего в качестве критерия решения задачи используется вероятностный критерий. Удобство его использования определяется тем, что он позволяет получать не только текущие локальные, но и интегральные оценки потенциальной возможности обнаружения объекта поиска по траектории, т.е. маршруту (в горизонтальной плоскости) и трассе (по глубине) следования.
В работах [5, 6] предлагается дискретный метод оптимизации этого критерия при решении задачи об оптимизации закона уклонения морского подводного объекта (МПО) от обнаружения несколькими независимыми стационарными наблюдателями (СГАС) и маневренными средствами (МС) на основе принципа динамического программирования (ДП) для изотропной [5] и анизотропной [6] среды. Считается, что время движения МПО ограничено известной величиной. В [5] рассмотрена аппроксимация путями графа, вершины которого равномерно покрывают район. При решении задачи ДП для каждого ребра графа ДП по известным параметрам (координаты (х, у) начала и конца ребра, глубина Лист, скорость Кист) вычисляется вероятность обнаружения Робн для 7-го наблюдателя, и затем находится интегральная вероятность обнаружения для независимых наблюдений [8]:
ь
Робн = 1 -П (1 - Робн, ) , (1)
1=1
где Ь - число наблюдателей. Таким образом, задача оптимизации решается с использованием 4-мерного вектора [X, у, Лист, Кист].
В настоящей работе предлагается подход к решению задачи об оптимизации закона уклонения МПО от обнаружения несколькими СГАС и МС для случая, когда известно единое поле вероятности обнаружения для всего района, пересекаемого МПО. Вектор управлений МПО включает траекторию уклонения и закон изменения скорости V на траектории.
1. Оптимизация закона уклонения в изотропном поле
Зададим закон движения МПО от начальной точки А до точки назначения В за время Т параметрическими уравнениями
х = х(г), у = у(г), 0 < г < Т, х(0) = Ха , у(0) = Уа .
Поскольку параметром является время, то тем самым задается также закон изменения вектора скорости (х(У), у(0). Качество маневрирования объекта будем характеризовать вероятностью того, что за время прохождения объектом маршрута его не обнаружит ни один из наблюдателей, контролирующих район. Будем называть ее вероятностью необнаружения, обозначив через Рнеобн . Зависимость этой вероятности от закона движения будем определять в предположении, что в районе расположено N СГАС в пунктах с координатами (хк, ук), к = 1, ..., N. Оптимальный закон движения из начального пункта в конечный ищется из условия максимума Рнетбн или, что то же самое, из условия минимума
вероятности Робн = 1 — Рнеобн того, что при прохождении маршрута объект будет обнаружен хотя бы
одним из наблюдателей.
Расстояние, на котором вероятность правильного обнаружения сигнала Робн равна установленному значению при соблюдении требований к вероятности ложных тревог Рлт, принято называть дальностью действия ГАС [9]. Данное определение в общем виде относится к однократному наблюдению (взгляду) при установленных зависимостях между временем накопления То, отношением сигнал / помеха р и заданных Робн и Рлт.
Для случая многократных последовательных независимых наблюдений (вероятность наступления события обнаружения хотя бы один раз за серию наблюдений) оценки производятся по формуле интегральной (кумулятивной) вероятности (1).
Из основного уравнения гидролокации (ОУГ) [10] для однократного наблюдения в [5] получено выражение для вероятности правильного обнаружения как функции от дальности для изотропного поля:
=1 — Ри (% + р)), (2)
где Рп (•) - функция ^-распределения с п степенями свободы, р - отношение сигнал /помеха; Но -квантиль
уровня (1 - а), а = Рт, п - число степеней свободы, которое в случае цифровой обработки определяется из условий Т = пЫ, Д^ = 1/ДР, & - интервал дискретизации по времени, ДР - полоса пропускания входного фильтра системы обнаружения, а в случае аналоговой обработки определяется как п = 2ТДР.
При заданной вероятности ложной тревоги Рлт = а вероятность правильного обнаружения Робн возрастает с увеличением р, а р монотонно убывает с ростом расстояния г до цели. Задаваясь минимально обнаруживаемым сигналом, т.е. минимальным значением ршт, можно найти максимальную дальность обнаружения Ртах. При г > Ртах цель не может быть обнаружена с заданной выбором ршт вероятностью а, а при г < Ртах обнаружение происходит с вероятностью, не меньшей Робн при заданном значении а. Пределом Ртах является расстояние г, для которого Робн = Рлт = а, так как обнаружение с вероятностью меньшей, чем Рлт, теряет смысл.
Расстояние г можно условно разбить на три участка:
- 0< г < Ршт, на котором объект будет обнаружен с заданной Робн за одно или, в худшем случае, за заданное число разовых наблюдений (1) - зона устойчивого обнаружения;
- г > Ртах, на котором скрытность объекта максимальна (Робн < Рлт) - зона необнаружения;
- Ртт< г < Ртах - зона неустойчивого обнаружения.
Таким образом, объект следует считать видимым лишь вне зоны необнаружения, а задача оптимизации траектории движения имеет смысл лишь в зоне неустойчивого обнаружения.
Единое поле вероятности обнаружения для всех наблюдателей, контролирующих заданный район, Робн(х, у) может быть вычислено следующим образом. Пусть имеются два наблюдателя с шириной полосы частот ДР\ и Др2 и со временами накопления Т\ и Т2 (Т\ Ф Т2) соответственно, в которых решение об обнаружении принимаются независимо. Для расчета вероятности совместного обнаружения хотя бы одним из двух наблюдателей, чтобы использовать формулу (1), нужно одинаковое время накопления, но Т\ Ф Т2. Определим наименьшее общее кратное - НОК(Т\, Т2) = То. Тогда То - Ь\ =То/Т\ - число взглядов для 1 -го наблюдателя, ¿2 = Т00/Т2 - число взглядов для 2-го наблюдателя.
Для 1-го наблюдателя, считая, что цель неподвижна, согласно (1) за время То получаем
А к
Рнеобн1 (Т0 ) = Рнеобн1 (Т1) =[ Рнеобн1 (Т1)] , (3)
а для 2-го наблюдателя за время То
Рнеобн2 (Т0 ) = ^П Рнеобн2 (Т2 ) = [ Рнеобн2 (Т2 )] • 1=1
Допустим, что у нас есть 3-й наблюдатель, который имеет время наблюдения Т2 и за время То обеспечивает по формуле (3) такую же вероятность необнаружения Рнеобн, как и 1-й наблюдатель, т.е.
[Рнеобн3 (Т2 )] =[Рнеобн1 (Т1)] и Рнеобн3(Т2) = [Рнеобн1 (Т1)] ^ = [Рнеобн1 (Т1)] •
Третий наблюдатель эквивалентен 1-му наблюдателю в том смысле, что рассчитанные для них по формуле (3) за время То вероятности необнаружения Рнеобн равны между собой. Так как время наблюдения - Т2 - для 3-го наблюдателя равно времени наблюдения для 2-го наблюдателя, то для
определения интегральной вероятности для независимых наблюдателей можно применить формулу (1):
у
Рнеобн(1+2) _ Рнеобн2 (Т2 )Рнеобн3 (Т2 ) _ Рнеобн2 (Т2 ) [Рнеобн1 (Т1 )] ' 1 • ^
Таким образом, вероятности необнаружения для двух СГАС с различными временами взглядов можно объединить, используя формулу (4), в Рнеобн с единым временем взгляда.
Пусть СГАС, расположенные в районе, имеют координаты (xk, yk). Тогда, используя формулу для вычисления Робн (d;) , приведенную в [5], можно рассчитать вероятность необнаружения для всех точек района (x, y), т.е. сформировать поле (матрицу) вероятностей необнаружения Рнеобн (x, y):
I--К ™/т
Рнеобн (x, y) = 4a2 + b2 lim ПРнеобнk (X, Л) k , (5)
k =1
где K - число наблюдателей, Тм - max[Tk], Tk - длительность взгляда для k-го наблюдателя, (xk, yk) -координаты k-го наблюдателя, Рнеобн k - вероятности необнаружения для k-го наблюдателя.
В качестве примера на рис. 1 приведены вероятности обнаружения (карта вероятностей) Робн^, y) = 1 - Рнеобн^, y) для трех независимых наблюдателей (СГАС), расположенных в заданном районе, в случае однократного наблюдения с использованием формулы (5).
На рис. 1 зона необнаружения выделена зеленым цветом, а зона обнаружения - коричневым. Границы зоны неустойчивого обнаружения определены из условий: Rmm - Робн = 0,5, Rmax - Робн = 0,02. Приведены также четыре возможных маршрута - 2 маршрута, обходящих районы СГАС, и 2 - проходящих между ними.
Шумность МПО зависит от скорости V, следовательно, карта вероятности (см. рис. 1) будет относительно координат k-ой СГАС изменяться: с ростом V граница зоны необнаружения будет расширяться, а с уменьшением V - сжиматься.
Учитывая, что обычно траектория объекта проходит на достаточно больших расстояниях от наблюдателя и (1/r2) является малой величиной, как показано в [11], можно разложить функцию зависимости изменения вероятности обнаружения Робн от дистанции r - Робн(г) в ряд по степеням (1/r2) и ограничиться несколькими членами разложения. В первом приближении имеем
Робн (r) = а +
YVи (ХL,n)"
2"/2 Г( ")
e 2 --т.
(6)
где Х1-а,п - (1 - а) - квантиль х2-распределения с п степенями свободы, о ш - дисперсия помехи, у^ - зависимость шумности МПО от его скорости V, у и ц - некоторые размерные коэффициенты.
Рис. 1. Вероятности правильного обнаружения (карта вероятностей) Робн(х, у) Fig. 1. Probabilities of correct detection (probability map) Pdet(x, y)
Рассмотрим прохождение МПО между двумя СГАС с перекрывающимися зонами наблюдения. Пусть расстояние между СГАС - Ro. Тогда из (6) для 1-й и 2-й СГАС соответственно получаем
Робн1 (r) = а + vc; 4. Робн2 (r)=а2+V .
r (R - r)
(7)
В обобщенный параметр С1 сведены все параметры ОУГ, относящиеся к первому СГАС, а в параметр С2 - относящиеся ко второму СГАС. При выполнении условий Робн1 = Робн2 и а1 = а2 параметры, относящиеся к МПО (шумность, зависящая от скорости V), сокращаются. Таким образом, положение тт[Робн(г)] от скорости МПО не зависит.
На рис. 2 приведен пример изменения вероятности обнаружения от скорости, где для различных скоростей V по формуле (5) рассчитана суммарная однократная вероятность обнаружения на линии, соединяющей два СГАС. Положение минимума интегральной вероятности (5) при изменении скорости не меняется, а величины тт(Робн) растут с ростом Vk.
Рис. 2. Суммарная вероятность обнаружения Робн для двух СГАС Fig. 2. The total probability of detection of Pdet for two SSS
Таким образом, маршрут, проложенный между двумя СГАС с перекрывающимися полями обнаружения (см. рис. 1), не зависит от скорости V и должен проходить через точки карты вероятностей, обеспечивающие тт(Робн(х, у)). Или, используя географическую терминологию, проходить по «дну долин» и через «перевалы» карты вероятностей.
х2
r
Оптимизация маршрута по вероятностному критерию производится методом ДП [5]. В результате решения задачи получаем несколько синтезированных кусочно-прямолинейных субоптимальных маршрутов движения МПО (гмО, каждый из которых при фиксированной скорости V будет характеризоваться Робнг(х,у) и временем перехода Тмг.
Наличие ограничений на время перехода ТМ требует проведения для каждого маршрута оптимизации по скорости V, которая также производится методом ДП.
2. Оптимизация закона уклонения в анизотропном поле
Предположение об изотропности гидроакустического поля справедливо лишь для однородной среды, в этом случае дальность обнаружения зависит только от расстояния между МПО и наблюдателем. В неоднородной среде дальность обнаружения зависит не только от расстояния между МПО и наблюдателем, но также от других параметров, таких как глубина и профиль дна, акустические свойства грунта, от гидрологических, определяемых видом вертикального распределения скорости звука (ВРСЗ), и метеорологических условий наблюдения, глубины погружения МПО, характеристик СГАС и глубины установки ее антенны и ряда других факторов [7]. Как результат влияния этих факторов круговая диаграмма, присущая изотропному полю, деформируется и зависит уже от четырех параметров: расстояния между МПО и наблюдателем (г), глубины погружения МПО (Лист), азимута на МПО и глубины установки антенны СГАС (Лпр).
Кроме обратной квадратичной зависимости затухания сигнала от дистанции, для каждой фиксированной дистанции г в анизотропном поле необходимо учитывать также перераспределение энергии сигнала по глубине, вызванное непосредственно анизотропией поля [7] и зависящее от дистанции г и глубин источника Лист и приемника Лпр, - коэффициент анизотропии у(Лпр, г, Лист).
Для учета анизотропии поля в формулу (2) необходимо ввести значение коэффициента анизотропии у(Лпр, г, Лист). Тогда вероятность правильного обнаружения как функции от дальности (2) для анизотропного поля преобразуется к виду:
Робн (^т, г, h ) = 1 - F
К Л , _ ( h
' 1
= 1 - F
-о
1 + PT(hnp , hnox )
(8)
1 + Р л
где Pa - отношение сигнал / помеха в анизотропном поле.
Задача расчета вероятности обнаружения в анизотропной среде хорошо разделяется на две независимые задачи: расчет анизотропного поля по заданной гидрологии и расчет вероятности обнаружения с учетом коэффициента анизотропии поля.
Такое разделение очень важно с учетом того, что гидрологические характеристики района остаются «квазистационарными» достаточно длительное время (от нескольких часов до многих суток), а сам расчет анизотропного поля требует очень большого объема вычислений. В то же время расчет вероятности обнаружения с учетом коэффициента анизотропии поля требует значительно меньшего объема вычислений и может проводиться в режиме online.
На рис. 3 в качестве примера приведены карты вероятности правильного обнаружения Робн(г, Лист, Лир) для СГАС с антенной, расположенной на глубине ЛПр, и двух заданных глубин - Лист1 и Лист2. Хорошо видно, что Робн зависит от глубины МПО и азимута на МПО. Следовательно, для анизотропного (слоисто-неоднородного) поля необходимо иметь набор карт вероятности Робн для дискретного ряда глубин ПЛ - Лист1, ..., Листу, ..., Лист./. Таким образом, если для изотропного поля карты вероятности обнаружения Робн строятся в координатах (x, у), то для анизотропного поля необходимо иметь набор из / карт, рассчитанных по формуле (8), в координатах (x, y) для ряда фиксированных глубин Листу. Такой набор карт вероятности можно описывать трехмерной матрицей в координатах (x, y, Лист) при фиксированных глубинах наблюдателей Лпрг.
На рис. 4 приведены вероятности обнаружения Робн(х, у) в анизотропном поле для двух СГАС, расположенных в заданном районе, для заданной глубины Лист. В качестве примера на этом же рисунке показан маршрут, который мог бы проложить оператор при условии минимизации вероятности обнаружения МПО при переходе их точки координатами (0, 0) в точку (500, 500).
Рис. 3. Карты вероятности обнаружения Робн(х, у, Лист, Лпр). а — Лист! , b — Нист2 Fig. 3. Probability maps of detection Pdet(x, y, horig, hrec): a — horigi, b — horig2
сгас1+сгас2, t-t1
100 200 300 400 500
y.e.
Рис. 4. Суммарное поле вероятности обнаружения для 1-го и 2-го наблюдателей по формуле (2) Fig. 4. The total field of probability of detection for the 1st and 2nd observer according to the formula (2)
Так же, как было показано выше для изотропного поля (см. рис. 1 и соответствующие формулы), рассмотрим прохождение МПО между двумя СГАС с перекрывающимися зонами наблюдения для анизотропного поля. Как следует из формулы (6), в ОУГ влияние анизотропии учитывается при расчете рл - отношения сигнал / помеха в анизотропном поле. В свою очередь, рл зависит от скорости МПО V и коэффициента анизотропии у(ЛПр, r, Лист). Очевидно, что коэффициент анизотропии от скорости МПО не зависит и может быть учтен при расчете параметров Ci и С2. Таким образом, в анизотропном поле положение тт[Робн (r)] также не зависит от скорости МПО.
На рис. 5, а для этого сечения приведены Робн, рассчитанные при одинаковой скорости МПО для различных глубин Лист, а также Робн для соответствующего изотропного поля. При изменении глубины МПО положение минимума вероятности min(Pобн (Лист)) практически не меняется, поэтому маршруты для различных глубин Лист при прохождении между двумя СГАС практически совпадают.
На рис. 5, b приведено (при фиксированной скорости МПО) сечения матрицы Робн(х, у, Лист) по линии (r), соединяющей два СГАС, в координатах (r, Лист), т.е. 2-мерная матрица, где по формуле (8) рассчитана интегральная вероятность обнаружения Ро6н(г, Лист). (Профиль дна окрашен в цвет, соответствующий Робн = 1.)
b
Рис. 5. Вероятности обнаружения Робн для различных глубин Лист при прохождении между двумя СГАС (a) и сечение матрицы Робн(х, у, Лист) по линии, соединяющей две СГАС (b) Fig. 5. Pdet detection probabilities for various depths of Лойя when passing between two SSS (а); the section of the matrix Pdet(x, y, Лorig) along the line connecting the two SSS (b)
a
Рассмотрим сечение матрицы Робн(х, у, Лист) по маршруту, проходящему, как показано на рис. 4, между двух СГАС - Робн(гм, Лист). На рис. 6 приведен пример такого сечения. Это сечение также можно рассматривать как карту вероятности обнаружения Робн, но уже не в координатах (х, у), а в координатах (гм, Лист), где гм - маршрут, Лист - глубина, по которой аналогично построению маршрута методом ДП вычисляется набор возможных трасс, одна из которых приведена на рис. 6.
Для изотропного поля изменение скорости МПО при прохождении между двумя СГАС не приводит к изменению маршрута. При расчете вероятности Робн для анизотропного поля учитывается фактор аномалии, входящий, как один из параметров, в ОУГ [9]. При определении шт[Робн(г)] между двумя СГАС для анизотропного поля получаем уравнение, аналогичное (7), в котором параметры, характеризующие факторы аномалии, входят в параметры С\ и С2 соответствующих СГАС. Следовательно, положение шт[Робн(г)] для анизотропного поля также не зависит от скорости МПО.
Вероятность правильного обнаружения
50 100 150 200 250 300 350
Проход между СГАС (у.е.)
Рис. 6. Сечение матрицы Робн(х, y, Лист) по маршруту ГМ - Робн(гм, Лист) Fig.6. The cross section of the matrix Pdet(x, y, Лойя) along the route гм - Pdet (гм, Ло1%)
С учетом перебора по скоростям Vk можно построить 4-мерную карту (матрицу) Робн(х, y, Лист, V), которая для заданного района может быть рассчитана заранее для фиксированного набора глубин Листу и скоростей Vk МПО при известных координатах наблюдателей и их технических характеристиках, гидрофизических характеристиках района (ВРСЗ, карта глубин, метеорологические условия наблюдения и ряд других факторов).
Таким образом, рассматриваемый алгоритм построения оптимальной траектории с использованием матрицы вероятности (риска) Робн(х, y, Лист, V) выполняется за три последовательных этапа:
1. Построение маршрута гм по карте Робн(х, y) - сечению матрицы Робн(х, y, Лист, V) при Лист = const, Vk = const.
2. Построение для выбранного маршрута rM трассы по Лист по карте Ро6н(гм, Лист) — сечению матрицы Робн(х, у. Лист. V) по Гм при Vk = const.
3. Расчет для выбранной траектории Тгл(гм, Лист) оптимальной скорости Vk по карте Робн(Тгл, V) — сечению матрицы Робн(х, у, Лист, V) по Trh.
Такая последовательная структура алгоритма позволяет существенно уменьшить объем вычислений при построении оптимальной траектории по сравнению, например, с работой [5], где оптимизация производится одновременно по четырем параметрам: х, у, Лист, V. Общее число двумерных карт вероятности Робн(х, у) определяется размерами векторов глубин Лист и скоростей V, т.е. (J х K).
Кроме того, расчеты на первых двух этапах (расчет траектории) желательно проводить при оптимальных для наблюдателей условиях — при движении ПЛ с максимально допустимой скоростью в подводном звуковом канале (если он есть). Эти условия позволяют производить ДП при максимально узких «долинах» и «перевалах» карты вероятности и, следовательно, более точно рассчитать маршрут и трассу (см. рис. 4, 6).
Заключение
Важной особенностью алгоритма является то, что наиболее трудоемкие расчеты вероятностей для анизотропного поля вынесены на предварительный этап решения задачи оптимизации.
Рассматриваемый алгоритм может применяться для решения задачи оптимизации маршрута в режиме online и позволяет корректировать расчеты в случае появления новых наблюдателей.
Алгоритм ориентирован на условия известного взаимного положения и движения объектов. Алгоритм построения оптимальной траектории универсален, поскольку он не зависит от количества средств обнаружения, их взаимного расположения, их параметров, при условии наличия моделей для расчетов вероятностей обнаружения объекта этими средствами.
ЛИТЕРАТУРА
1. Галяев А.А., Маслов Е.П., Рубинович Е.Я. Об одной задаче управления движением объекта в конфликтной среде // Изве-
стия РАН. Теория и системы управления. 2009. № 3. С. 134—140.
2. Галяев А.А., Маслов Е.П. Оптимизация законов уклонения подвижного объекта от обнаружения // Известия РАН. Теория
и системы управления. 2010. № 4. С. 52—62.
3. Какалов В.А., Поленин В.И., Дымент А.Б., Сергеев В.А. Метод оптимизации боевого маневрирования подводной лодки
по вероятностному критерию скрытности. // Морская радиоэлектроника. 2003. № 3 (6). С. 44—47.
4. Zabarankin M., Uryasev S. , Pardalos P. Optimal Risk Path Algorithms // Cooperative Control and Optimizaton / eds. R. Murphey,
P. Pardalos. Dordrecht : Kluwer Acad., 2002. Ch. 1. P. 273—298.
5. Добровидов А.В., Кулида Е.Л., Рудько И.М. Выбор траектории движения объекта в конфликтной среде // Проблемы
управления. 2011. № 3. С. 64—75.
6. Добровидов А.В., Кулида Е.Л., Рудько И.М. Оптимизация траектории движения объекта по вероятностному критерию
в режиме пассивной гидролокации в анизотропной среде // Проблемы управления. 2014. № 4. С. 31—37.
7. Сташкевич А.П. Акустика моря. Л. : Судостроение, 1966. 350 с.
8. Абчук В.А., Суздаль В.Г. Поиск объектов. М. : Сов. радио, 1977. 336 с.
9. Евтютов А.П., Колесников А.Е., Ляликов А.П. Справочник по гидроакустике. Л. : Судостроение, 1988. 552 с.
10. Burdic W.S. Acoustic system analysis. Englewood Cliffs, NJ : Prentice Hall, Inc., 1984. 392 p.
11. Сысоев Л.П. Критерий вероятности обнаружения на траектории в задаче управления движением объекта в конфликтной среде // Проблемы управления. 2010. № 6. С. 65—72.
Поступила в редакцию 12 августа 2020 г.
Rudko I.M. (2020) OPTIMIZATION OF THE TRAJECTORY OF THE OBJECT IN A CONFLICT ANISOTROPIC MEDIUM ACCORDING TO THE PROBABILISTIC CRITERION OF STEALTH. Vestnik Tomskogo gosudarstvennogo universiteta. Uprav-lenie, vychislitelnaja tehnika i informatika [Tomsk State University Journal of Control and Computer Science]. 55. pp. 71—79
DOI: 10.17223/19988605/55/9
The problem of choosing the trajectory of a marine moving object (MMO) and the law of change in its velocity during the movement of an object in a three-dimensional anisotropic medium of signal propagation, when several stationary observers (SSS)
are located in a given area, are considered. The criterion for choosing the trajectory of an object is the probability of its non-detection on the entire trajectory by any of the observers.
An approach is proposed to solve the problem of optimizing the law of MMO evasion from detection by several SSSs for the case when a single detection probability field is known for the entire area intersected by MMO. The MMO control vector includes the evasion path and the law of variation of the velocity V on the path.
Relations are derived in the work that make it possible to calculate in a isotropic and anisotropic observation fields a single field (map) of the probability of detecting an object for several SSSs with different technical characteristics. It is shown that for an anisotropic field, the map of the probability of detection can be represented as a 4-dimensional matrix in the coordinates (x, y, horig, V), where x, y are the coordinates of the surface of the region, horig is the depth of MMO, V is the MMO velocity.
It is shown that using the Pdet detection probability map (x, y, horig, V), when solving the problem of dynamic programming (DP) of the route, it is possible to replace the 4-dimensional vector (x, y, horig, V), according to which optimization is carried out, on a three-step sequential discrete optimization method based on the principle of DP. In this case, at each of the 3 steps, optimization is performed only for two-dimensional vectors:
- Construction of the rM route from the Pdet map (x, y) - to the section of the Pdet matrix (x, y, horig, V) with horig = const, Vk = const.
- Construction for the chosen route rM of the route according to horig on the Pdet map (rM, horig) - section of the Pdet matrix (x, y, horig, V) along rM at Vk = const.
- Calculation for the chosen trajectory Trh (r rM, horig) of the optimal speed Vk according to the Pdet map (Trh, V) - to the section of the Pdet matrix (x, y, horig, V) according to Trh.
Such a consistent structure of the algorithm can significantly reduce the amount of computation when constructing the optimal trajectory.
Keywords: trajectory of the object; the probability of an object not being detected on the trajectory; anisotropic medium; dynamic programming.
RUDKO Igor Mikhailovich (Candidate of Technical Sciences, Senior Researcher, V.A.Trapeznikov Institute of Control Sciences of Russian Academy of Sciences, Moscow, Russian Federation). E-mail: [email protected]
REFERENCES
1. Galyaev, A.A., Maslov, E.P. & Rubinovich, E.Ya. (2009) On one problem of controlling the movement of an object in a conflict
environment. Izvestiya RAN. Teoriya i sistemy upravleniya - Journal of Computer and Systems Sciences. 3. pp. 134-140.
2. Galyaev, A.A. & Maslov, E.P. (2010) Optimization of a mobile object evasion laws from detection. Journal of Computer and
Systems Sciences. 4. pp. 52-62.
3. Kakalov, V. A., Polenin, V. I., Dyment, A.B. & Sergeev V.A. (2003) Metod optimizatsii boevogo manevrirovaniya podvodnoy
lodki po veroyatnostnomu kriteriyu skrytnosti [A method for optimizing the combat maneuvering of a submarine by the probabilistic stealth criterion]. Morskaya radioelektronika - Marine Radio electronics. 3(6). pp. 44-47.
4. Zabarankin, M., Uryasev, S. & Pardalos, P. (2002) Optimal Risk Path Algorithms. In: Murphey, R. & Pardalos, P. (eds) Coopera-
tive Control and Optimizaton. Vol. 1. Dordrecht: Kluwer Acad. pp. 273-298.
5. Dobrovidov, A.V., Kulida, E.L. & Rudko, I.M. (2011) Vybor traektorii dvizheniya ob"ekta v konfliktnoy srede [The choice of
the trajectory of the object in a conflict environment]. Problemy upravleniya - Control Sciences. 3. pp. 64-75.
6. Dobrovidov, A.V., Kulida, E.L. & Rudko, I.M. (2015) Path optimization for a moving object in an anisotropic environment using
the probabilistic criterion in the passive sonar mode. Automation and Remote Control. 76(7). pp. 1271-1281. DOI: 10.1134/S0005117915070127
7. Stashkevich, A.P. (1966) Akustika morya [Acoustics of the Sea]. Leningrad: Sudostroenie.
8. Abchuk, V.A. & Suzdal, V.G. (1977) Poisk ob"ektov [Search for Objects]. Moscow: Sovetskoe radio.
9. Evtyutov, A.P., Kolesnikov, A.E. & Lyalikov, A.P. (1988) Spravochnikpo gidroakustike [Handbook of Hydroacoustics]. Lenin-
grad: Sudostroenie.
10. Burdic, W.S. (1984) Acoustic System Analysis. Prentice. Hall, Inc. Englewood Cliffs.
11. Sysoev, L.P. (2010) Kriteriy veroyatnosti obnaruzheniya na traektorii v zadache upravleniya dvizheniem ob"ekta v konfliktnoy srede [The probability criterion for detection on the trajectory in the task of controlling the movement of an object in a conflict environment]. Problemy upravleniya - Control Sciences. 6. pp. 65-72.