У
правление подвижными объектами и навигация
УДК 517.977
ЗАДАЧА ПЛАНИРОВАНИЯ ОПТИМАЛЬНОГО ДВИЖЕНИЯ
V V 4
ОБЪЕКТА ЧЕРЕЗ РАЙОН СЛУЧАЙНОГО ПОИСКА1
А.А. Галяев, П.В. Лысенко, В.П. Яхно
Рассмотрена задача планирования оптимальной траектории объекта, проходящей через район случайного поиска. Особенность задачи состоит в том, что район поиска заранее неизвестен, но известны алгоритмические и технические характеристики поисковых средств. Предложены две вариационные постановки задачи м инимизации интегрального риска при отсутствии и наличии ограничения на длину траектории. Для их численного решения разработаны программные модули.
Ключевые слова: поиск подвижного объекта, планирование движения, оптимальный закон уклонения от обнаружения.
ВВЕДЕНИЕ
Задачи планирования траектории подвижного объекта (ПО) в конфликтной среде вызывают большой интерес в связи с расширяющейся областью применения различного рода беспилотных летательных и подводных аппаратов. При планировании траектории ПО необходимо учитывать, что противоборствующая сторона решает задачу поиска объектов с выработкой плана и алгоритмов поиска. Термин «конфликтная среда» используется для описания взаимодействия ПО со средой движения, другими ПО и внешними ограничениями и также как реакция ПО на переменные внешние условия. Поскольку зачастую ПО движется в условиях недостатка информации о взаимодействующих объектах и среде, то для описания механизмов поиска подвижных объектов используются вероятностные модели [1].
Существуют два подхода к исследованию задач планирования траектории подвижных объектов при решении задач поиска-уклонения, а именно, экстремальный и теоретико-игровой. Экстремальный подход требует построения детерминированной или стохастической модели конкретной задачи с определением критерия эффективности миссии ПО. В экстремальных моделях критерий определяет целевую функцию при заданных кине-
1 Работа выполнена при финансовой поддержке РФФИ (проект № 16-08-01076-а).
матических связях-ограничениях, а в теоретико-игровых — функцию выигрыша при заданном множестве вариантов действий. В настоящей работе будет применяться экстремальный подход. Несмотря на большое разнообразие управляемых ПО, связанные с ними задачи управления имеют общие характерные черты. Прежде всего, это традиционные задачи планирования миссий, включающие в себя прокладку относительно безопасной траектории с учетом естественных и искусственных ограничений (рельеф местности, гидрологические и погодные условия), а также удержание (стабилизация) на заданном курсе [2—4]. Кроме того, характерными являются задачи оптимального м аневрирования при нештатных ситуациях (например, при резко меняющихся погодных условиях и др.) [5]. Как правило, успешность выполнения миссии оценивается значением некоторого функционала (критерия оптимальности), минимизация которого является основной задачей системы управления. Классические критерии оптимальности связаны с минимизацией расхода энергоресурса, времени (задачи быстродействия) или промаха [6]. В последнее время проявляется интерес к нетрадиционным критериям, таким как повышение скрытности движения (при движении в конфликтной среде с учетом карты уровня потенциальных рисков-угроз) [5, 7, 8]. Одной из моделей, описывающей поиск подвижного объекта в заданном районе, служит модель случайного поиска [1, 9]. В случае, когда район поиска известен и требуется, чтобы ПО при своем движении не был обнару-
жен, маршрут д вижения не д олжен проходить через район поиска. В общем случае траектория, реализующая такое движение ПО, может быть не единственной. Цель работы — распространить модель случайного поиска на случай неизвестного района поиска, предложить несколько постановок задачи с формализацией критерия и разобрать модельные примеры с исследованием особенностей полученных решений.
1. ПОСТРОЕНИЕ КРИТЕРИЯ КАЧЕСТВА — ФУНКЦИОНАЛА РИСКА
Пусть ПО движется на плоскости из заданной начальной в заданную конечную точку таким образом, что траектория его движения может пересечь район случайного поиска П, представляющий собой связное, ограниченное и измеримое множество в Я2 с площадью ¡(П). Тогда выполнено равенство
1 = Ц ^ = -Л- II 1п(х, у)йхйу,
п п) ¡( п);-2 п ,у'
где 1д(х, у) — индикатор множества П.
Предположим, что геометрический центр этого множества, точка (|, п), является двумерной случайной величиной с плотностью распределения р(|, п). Тогда справедливо
1=Е1=Е ¡4 и ^ = ш [1 ^(1)
Раскроем математическое ожидание в выражении (1) с учетом, что индикатор множества П принимает вид IП(х — I, У — п), и получим
¡555 ii^ =
Q ii I dxdy ii IQ(x - y - n)d|dJ.
■ »2 V »2 J
¡( П)
Обозначим
Г(х, у) = -П- II 1п(х - I, У - п)р(1, п)<Ып.
¡( п) к2
Функция Г(х, у) является плотностью распределения, поскольку
iir(x, y)dxdy = 1.
Эта же функция задает распределение уровней риска при прохождении траектории ПО через область поиска.
Предположим, что задана траектория я(х, у), такая, что йхйу = йхйк, где йк — инфинитезимальная толщина траектории.
Поисковый потенциал при случайном поиске в случайной области п равен произведению вероятности попадания в инфинитезимальную окрестность траектории и вероятности обнаружения к(х, у) при нахождении в окрестности заданной точки области. Определим йк = к(х, у)ыЛ, где и — скорость поискового средства, & — дифференциал времени. Поэтому выражение для поискового потенциала можно записать в виде
т 0 Ll
Pp = тx, У) dxk(x, y)
udt.
(2)
Задача оптимизации заключается в нахождении траектории ПО, доставляющей минимум выражению (2) на ней.
Обозначим выражение в квадратных скобках как Я(х(-), у(')) и назовем его функционалом риска. В общем случае вероятность обнаружения к(х, у) может зависеть не только от координат местоположения объекта, но и от алгоритма обнаружения объекта и особенностей распространения сигнала в среде. Без потери общности можно переобозначить функцию Г(х, у)к(х, у) ^ Г(х, у). По этой причине и чтобы упростить постановку задачи, далее будем считать, что к(х, у) является константой в области поиска П. Подвергнем анализу д ве задачи.
Задача 1:
R(x(-), y(-)) = ir(x, y)ds
^ Ш1П.
Задача 2:
R(x(-), y(')) = ir(x, y)ds ^ min
s s
при условии
i ds < L,
которое задает ограничение на длину траектории ПО.
2. ПРИМЕРЫ ПОСТРОЕНИЯ КАРТЫ УРОВНЕЙ РИСКА
Предположим, что известны размеры прямоугольника — области п случайного поиска, а координаты точки пересечения диагоналей прямоугольника являются случайными величинами (п). На рис. 1 показана функция 1п(х, у), отложенная по вертикальной оси и задающая детерминированную область случайного поиска.
2
Пусть независимые случайные величины § и п равномерно распределены на отрезках [-I, 'х] и [-'у, 'у] соответственно. Предположим, что линейные размеры прямоугольника равны 2Ьх, 2Ьу, а точка пересечения диагоналей прямоугольника есть точка с координатами (0, 0). Это означает, что
!д(х - §, У - П) = 1, х - § е [-Ь„ Ьх], у - п е [-Ьу Ьу]; 0, х - § г [-Ьх, Ьх], у - п г [-Ьу, Ьу],
. Х 'у
Г(х, у)ц(О) = -±- | | /0(х - §, у - п)«. (3)
4'х'у -'х -'у
Вычислим
Г(х, у)ц(0 = 1, х е [-Ьх + х Ьх - 1Х], у е [-Ьу + у Ьу - 1у]; (Ьх + 1Х - х) / (21Х), х е [ Ьх - х Ьх + 1х],
у е [ -Ьу + 1у, Ьу - 1у ];
(Ьх + 1Х + х) /(21Х), х е [-Ьх - х -Ьх + 1Х],
у е [ -Ьу + 1у, Ьу - 1у ];
(Ьу + 1у - у) /(21у), х е [-Ьх + Х Ьх - 1Х],
у е [ Ьу - 1у, Ьу + 1у];
(Ьу + 1у + у)/(21у), х е [-Ьх + Х Ьх - 1Х],
у е [ -Ьу - 1у, -Ьу + 1у ];
(Ьх + 1Х - х)(Ьу + 1у - у)/(41х1у), (4)
х е [ Ьх - Х Ьх + 1Х], у е [ Ьу - у Ьу + 1у];
(Ьх + 1Х + х)(Ьу + 1у - у) / (41х1у),
X е [-Ьх - 'х, -Ьх + 'х], у е [ Ьу - 'у, Ьу + 'у];
(Ьх + 'х - Х)(Ьу + 'у + у)/(4'х'у),
х е [ Ьх - 'х, Ьх + 'х], у е [ -Ьу - 'у, -Ьу + 'у];
(Ьх + 'х + Х)(Ьу + 'у + у) / (4 'х'у),
х е [-Ьх - 'х, Ьх + 'х], у е [-Ьу - 'у, -Ьу + 'у]; 0, х г [-Ьх- 'х, Ьх + 'х] или
у г [ -Ьу - 'у, Ьу + 'у ] .
На рис. 1 приведена функция 1д в случае Ьх = 10, Ьу = 1, а на рис. 2 — функция Г(х, у)ц(0 в случае Ьх = 10, Ьу = 1, 'х = 2, 'у = 0,2. Заданное распре-
х уху
деление случайных величин (§ и п) приведет к формированию функции распределения уровней риска. Например, на рис. 3 приведена функция Г(х, у)ц(0 в случае гауссовского распределения
этих случайных величин при Ьх = 10, Ьу = 1, стх = 2, сту = 0,4, т. е. результат вычисления интеграла
Г(х, у)ц(0 = —!— ] 110(х - §, у - п) X
2 п^х
л У - ад -ад Лиг, 2
X ехр(-§2/(2 а2) - п2/(2 а2))«
(5)
Другими словами, формулы (3)—(5) задают карты уровня рисков-угроз, а на рис. 1—3 показаны непосредственно значения функции распределения уровней риска. Полученные зависимости за-
Рис. 1. Детерминированная область случайного поиска
Рис. 2. Область случайного поиска в случае равномерного распределения координат точки пересечения диагоналей
Рис. 3. Распределенная область случайного поиска в случае га-уссовского распределения координат точки пересечения диагоналей
частую не м огут быть описаны аналитически, поэтому для д альнейшего аналитического описания модели будем пользоваться специальным видом функции Г(х, у).
3.ЗАДАЧА 1
В задаче 1 карта распределения уровней рисков задает функцию распределения уровней риска Г(х, у) как функцию двух переменных в некоторой неподвижной декартовой системе координат XOY, в которой движется ПО, например, беспилотный летательный аппарат. Перед планировщиком миссии стоит задача минимизации интегрального риска при движении ПО.
Поскольку в постановке задачи 1 для ее непосредственного решения требуется задать функцию Г(х, у), предположим, что объект движется от точки A к точке B по некоторой траектории s и Г(х, у): ехр(—аг). Тогда с точностью до постоянного множителя
R(x('), y(•)) = iexp(-ar)ds
^ min,
(6)
где а — константа, r = >Jx2 + y2 — радиус, dl =
= 7 dx2 + dy2 — элемент длины траектории.
В полярных координатах функционал (6) и задача оптимизации принимают вид
фд _
R(r(•), ф(')) = i exp(-аг)л/r2 + r'2 dф ^ min, (7)
Фа '
где г' — производная г по ф. Получили простейшую задачу вариационного исчисления. Чтобы применить принцип максимума [10], нужно проверить соответсвие подынтегральной функции его условиям. Сделаем замену переменной z = 1пг, ^ е (—ю, +<»), так как г е (0, +ю). Тогда функционал (7) перепишется в виде
фв _
Я(z(•), ф(')) = I ехр(-а(expz) + z) *Л + z'2 йф.
Фа
Подыинтегральное выражение в формуле (8) является непрерывной функцией и имеет непрерывные частные производные по своим аргументам (г, z '). Поэтому для задачи вариационного исчисления вида (7) необходимо выполнены уравнения Эйлера, которые запишем в исходных переменных (г, Ф):
й- Гехр(-агй - й (ехр(-аг^7Т2+72) = 0.
Поскольку функционал задачи явно не зависит от переменной ф, то для уравнений Эйлера — Лаг-ранжа существует первый интеграл вида
С1 = -г' ехр (-аг) г ' + ехр(-аг^Тг2+72 =
/г + r = exp(-ar)
m ¡2
л/r + r
(8)
где С1 > 0 — константа.
Обозначим С = 1/С1. Интегрирование уравнения (8) дает квадратуру
- Фа = i
dr
rA*jC2exp(-2ar)r4 - r2
(9)
Подынтегральное выражение имеет особенность, когда на траектории движения выполнено равенство
C 2exp(-2ar)r2 = 1.
(10)
Не для всех начальных и конечных точек траектории уравнение (9) может быть разрешимо. При выполнении равенства (10) справедливо
йг/йф = 0.
Это означает, что каждой паре значений (гА, гв) ставится в соответствие максимальное значение (фв - ФА)шах, которое теоретически может быть получено при решении уравнения (9) и фиксирован-
2
Ф
Рис. 4. Траектория движения подвижного объекта при - фА = 90°
Рис. 5. Траектория движения подвижного объекта при - фА = 115°
ном С, если оно разрешимо. С другой стороны, если константа Сх = 0, то как следствие выполняется
йф/йт = 0
вдоль траектории ПО. Из-за того, что на подобной траектории полярный угол не меняется, а расстояние до центра системы координат изменяется, объект д вижется вдоль радиус-вектора. Далее, поскольку на бесконечности экспонента убывает быстрее любой степенной функции, то подынтегральное выражение в формуле (6) и само выражение (6) можно сделать сколь угодно малыми. Поэтому траектория, которая состоит из двух радиальных ветвей и перехода между ветвями на бесконечности, может быть кандидатом на оптимальную.
Проиллюстрируем приведенные выводы результатами компьютерного моделирования при а = 1. При других значения а можно произвести замену переменых ат -— т, что приведет к изменению константы С в формулах (9) и (10). В среде МаИаЪ был разработан программный модуль, позволяющий для заданных граничных условий строить опти-
мальную траекторию и вычислять значение функционала. На рис. 4 и 5 вверху показаны траектории движения ПО на плоскости, внизу — те же траектории, а по вертикальной оси отложены уровни риска. Тонкими линиями показаны окружности, на которых находятся начальная и конечная точки маршрута. На рис. 4 начальной точке маршрута движения ПО соответствуют координаты фА = 180°, рА = 0,6, конечной точке — фв = 270°, рв = 2,0. В этом случае угол, под которым видна вся траектория, фв - фА = 90°, а его максимальное значение
(ФВ - ФАВтах = 105,92°.
Значения критерия качества: на оптимальной траектории Яор1 = 0,6754; на отрезке прямой, соединяющем точки А и В, ЯПпе = 0,7512; на траектории, состоящей из д вух радиальных ветвей и перехода между ними на бесконечности, Яад = 0,6842. Длина траектории 5 = 2,4578.
На рис. 5 теперь начальной точке маршрута движения ПО соответствуют координаты фА = 180°, рА = 0,6, конечной точке — фв = 295°, рв = 2,0. В этом случае угол, под которым видна вся траектория, фв - фА = 115°. Значения критерия качества: на локально оптимальной траектории Яор( = 0,7925; на отрезке прямой ЯПпе = 0,9287; на траектории, состоящей из двух радиальных ветвей и перехода между ними на бесконечности, Яад = 0,6842. Длина траектории равна 5 = 3,3313.
Из примеров видно, что оптимальной может быть траектория, которая проходит через бесконечность, поскольку значение критерия на ней наименьшее, что на практике не может быть реализовано из-за ресурных и/или временных ограничений. Поэтому длина траектории служит существенным фактором, который может быть учтен в постановке и соответственно в решении задачи планирования траектории ПО.
4.ЗАДАЧА 2
Далее рассмотрим задачу 2 — задачу построения оптимальной траектории ПО при ограничении на длину траектории. Подобное интегральное ограничение может быть связано с ограничением на максимальную скорость движения ПО и полное время нахождения на траектории, или быть завязанным на ресурсные ограничения, выделенные на выполнение задачи, и др. Также, как и в задаче 1, предположим, что объект движется от точки А к точке в по некоторой траектории 5 и Г(х, у) ~ ехр(-ат). Тогда вариационная задача нахождения условного экстремума может быть сведена к вариационной задаче на безусловный экс-
Обозначим С = 1/С1. Интегрирование уравнения (11) дает квадратуру
Рис. 6. Оптимальные траектории движения подвижного объекта при ограничении на их длину
тремум с неизвестным множителем Лагранжа X > 0, см., например, работу [10],
Я(г(-), ф(')) = | (ехр(—аг) + Х)^
^ Ш1П.
Также, как и в задаче 1, выпишем уравнения Эйлера — Лагранжа в виде
й I ( ехр ( -аг) + X)г'| —
^ тг^+г72
- А ((ехр(-аг) + X)*/ г2 + г'2) = 0.
Снова, поскольку функционал задачи явно не зависит от переменной ф, для уравнений Эйлера — Лагранжа существует первый интеграл вида
С = —г-( ехр ( -а г) + Х ) г' + (ехр(-аг) + *]г + г
+ Х)л/г2+г2 = (ехр(-аг) + X) -¡=-2=, (11) где Сх > 0 — константа.
Г2 . ,2 а/г + г
- Ф^ = I
йг
гл*1 С2( ехр (-а г) + X)2г4 - г2
Решение уравнений Эйлера — Лагранжа с заданными краевыми условиями дает оптимальную траекторию ПО. Выберем а = 1 и зададим набор длин траекторий. В среде МаНаЪ был разработан программный м одуль, позволяющий для заданных условий строить оптимальную траекторию и вычислять значение функционала. Пусть начальной точке маршрута движения подвижного объекта соответствуют координаты фА = 180°, рА = 4, конечной точке — фВ = 310°, рВ = 8. В этом случае имеем, что угол, под которым видна вся траектория, фВ — фА = 130°. Выбор начальной и конечной точек маршрута обусловлен тем, что при отсутствии ограничения на длину траектории оптимальная траектория проходила бы ч ерез бесконечность.
На рис. 6 вверху показаны траектории ПО на плоскости, внизу — те же траектории, а по вертикальной оси отложены уровни риска. Траектории пронумерованы от 1 до 4 в зависимости от ограничения на длину, от меньшей длины к большей. Тонкими линиями показаны окружности, на которых находятся начальная и конечная точки маршрута, а также угол между начальным и конечным положением ПО. В таблице приведены значения ограничений на длину Ь траектории, найденные по решению задачи на условный экстремум значения X и значения критерия.
Длина отрезка АВ, соединяющего точки А и В, 5 = 11, а значение критерия на нем Яй = 0,4431. По сравнению со значением критерия Яй уже на траектории, длина которой всего на 5 % больше длины отрезка АВ, значение критерия на такой траектории в 2,6 раза меньше. Это означает, что в данной задаче оптимизация траектории приводит к значительному увеличению возможности для ПО оставаться незаметным для средств обнаружения при выполнении им своей миссии.
Зависимость критерия от длины траектории
Номер траектории Ь X Я + XL Я
1 11,5 0,1492 1,8827 0,1668
2 14 0,0144 0,2540 0,0530
3 18 0,0026 0,0740 0,0274
4 22 0,00075 0,0381 0,0216
ЗАКЛЮЧЕНИЕ
Рассмотрены задачи планирования оптимальной траектории движения подвижного объекта на плоскости в случае, когда карта уровня рисков-угроз формируется на основе данных о неопределенном месторасположении района случайного поиска. В результате формализации предложен интегральный критерий и сформулированы две вариационные постановки задачи оптимизации при отсутствии и наличии ограничения на длину траектории. Обе двухточечные вариационные задачи решены в квадратурах, а для их численного решения разработаны программные модули, позволяющие находить решения для различных начальных и конечных условий, а также произвольных ограничений на длину траектории. Отметим, что полученные решения отражают геометрию задачи. Действительно, поскольку зону поиска по возможности следует обходить, то в качестве кандидатов на оптимальную также были получены траектории, проходящие на бесконечно удаленном от нее расстоянии. В общем случае для конкретного вида функции распределения уровней риска Г(х, у) локально оптимальная траектория не единственна, поэтому наилучшую траекторию нужно выбирать из набора траекторий — кандидатов на экстремальную. Дальнейшая работа будет посвящена исследованию функций Г(х, у), имеющих несколько локальных максимумов.
ЛИТЕРАТУРА
1. Абчук В.А., Суздаль В.Г. Поиск объектов. — М.: Советское радио, 1977. — 334 с.
2. Cacceta L, Loosen I., Rehbock V. Computational aspects of the optimal path problem // Journal of industrial and management opmization. — 2008. — Vol. 4, N 1. — P. 1—11.
3. Галяев А.А., Маслов Е.П. Оптимизация законов уклонения подвижного объекта от обнаружения // Известия РАН. Теория и системы управления. — 2010. — № 4. — С. 52—62.
4. Zabarankin M, Uryasev S., Murphey R. Aircraft Routing under the Risk of Detection // Naval Research Logistics. — 2006. — Vol. 53, N 8. — P. 728—747.
5. Dogan A., Zengin U. Unmanned Aerial Vehicle Dynamic-Target Pursuit by Using Probabilistic Threat Exposure Map // Journal of Guidance, Control and Dynamics. — 2006. — Vol. 29, N 4. — P. 723—732.
6. Андреев К.В., Рубинович Е.Я. Траекторное управление наблюдателем за мобильной целью по угломерной информации // Автоматика и телемеханика. — 2016. — № 1. — С. 134—162.
7. Галяев А.А., Маслов Е.П. Оптимизация закона уклонения подвижного объекта от обнаружения при наличии ограничений // Автоматика и телемеханика. — 2012. — № 6. — С. 83—94.
8. Галяев А.А. Задача уклонения от подвижного одиночного наблюдателя на плоскости в конфликтной среде // Автоматика и телемеханика. — 2014. — № 6. — С. 28—37.
9. Абрамянц Т.Г., Маслов Е.П, Яхно В.П., Галяев А.А. Уклонение подвижного объекта от обнаружения системой наблюдателей: сенсор — маневренное средство // Автоматика и телемеханика. — 2017. — № 8. — С. 113—126.
10. Гирсанов И.В. Лекции по математической теории экстремальных задач. — Ижевск: Регулярная и хаотическая динамика, 2003.
Статья представлена к публикации членом редколлегии
Б.В. Павловым.
Галяев Андрей Алексеевич — чл.-корр. РАН,
зав. лабораторией, н [email protected],
Лысенко Павел Владимирович — математик,
Яхно Виктор Павлович — канд. техн. наук,
ст. науч. сотрудник,
Институт проблем управления им. В.А. Трапезникова
РАН, г. Москва.
Содержание журнала Advances in Systems Science and Applications, 201T, Voi. 1T, N 2
New Analytics of International Relations: System Forecast of Cold War's Outcomes Victor Svetlov, Nikolay Sidorov P. 1—13
Economic Security under Disturbances of Foreign Capital
Kurt Schimmel, Sifeng Liu, Jeananne Nicholls, Nicholas A. Nechval, Professor, Jeffrey Yi-Lin Forrest
P. 14—28
Attitude to Entrepreneurship in Russia: Three-Dimensional Institutional Approach Irina Petrovskaya, Sergey Zaverskiy, Elena Kiseleva
P. 29—43
Reconfigurable Architecture for Image Feature Detection Saroja devi Hande, Rajesh Nandalike P. 43—51
A System Approach to the Regional Sustainable Management Gennady A. Ougolnitsky
P. 52—62
Тексты статей в свободном доступе на сайте http://ijassa.ipu.ru/ojs/ijassa