Научная статья на тему 'Проблемы поиска и преследования беспилотных летательных аппаратов с использованием теоретико-игрового подхода'

Проблемы поиска и преследования беспилотных летательных аппаратов с использованием теоретико-игрового подхода Текст научной статьи по специальности «Строительство и архитектура»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
теория игр / квадрокоптер / модель / кооперативная теория игр / Simulink MPCмоделирование / game theory / quadcopter / model / cooperative game theory / Simulink MPC modeling

Аннотация научной статьи по строительству и архитектуре, автор научной работы — Малафеев Олег Алексеевич, Чжан Кунь, Зайцева Ирина Владимировна, Гаранин Антон Владимирович

Цель: оптимизация эффективности стратегий обнаружения и захвата четырехроторных беспилотных летательных аппаратов (квадрокоптеров). Методы: математическое моделирование, аппарат теории игр, венгерский метод решения задачи о назначениях, теория принятия решений, принцип динамического программирования, пакет Maple для решения примеров. Результаты: для выполнения условий решения задачи об оптимальных назначениях необходимо и достаточно, чтобы она была сбалансирована. Данную задачу о назначениях можно сбалансировать, введя необходимое количество фиктивных катеров или убегающих. После этого можно сформулировать и решить двойственную задачу об оптимальных назначениях. Полученную игру можно решить любым методом решения матричных игр. Таким образом можно определить политику преследования и поиска между беспилотными летательными аппаратами. Практическая значимость: все ускользнувшие квадрокоптерные БПЛА могут быть преследованы и успешно перехвачены с использованием разработанных моделей. Приведены примеры исследования математических моделей с помощью программного пакета Maple.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Problems of search and pursuit of unmanned aerial vehicles using the game-theoretic approach

Currently, the application of mathematical modeling theory is widely used in various fields and, among other things, can be used to prevent illegal actions. This study examines scenarios involving a single pursuer tracking a single evader, as well as situations involving multiple pursuers pursuing multiple evaders. The authors formulate this problem as a search and pursuit problem for four-rotor unmanned aerial vehicles (UAVs) or quadcopters. The solution to the problem is based on game theory, as it provides a mathematical framework for modeling and studying strategic interactions involving multiple decision makers. The authors consider a game where the set of strategies of the runner is the set of possible combinations of speeds and directions of his movement, and the set of strategies of the pursuer is the set of all possible permutations of the elements of his speeds. The matrix of the resulting game consists of elements that are the time of capture. A mathematical problem on the optimal assignments of searching and pursuing unmanned aerial vehicles is formulated and solved. Purpose: optimizing the effectiveness of strategies for detecting and capturing four-rotor unmanned aerial vehicles (quadcopters). Methods: methods of mathematical modeling, game theory apparatus, Hungarian method of solving the problem of assignments, decision theory, the principle of dynamic programming, the Maple package for solving examples were used. Results: In order to fulfill the conditions for solving the problem of optimal assignments, it is necessary and sufficient that it is balanced. This assignment problem can be balanced by entering the required number of fictitious boats or escaping boats. After that, it is possible to formulate and solve the dual problem of optimal appointments. The resulting game can be solved by any method of solving matrix games. In this way, it is possible to determine the policy of harassment and search between drones. Practical importance: All escaped quadcopter UAVs can be chased and successfully intercepted using the developed models. Examples of the study of mathematical models using the Maple software package are given.

Текст научной работы на тему «Проблемы поиска и преследования беспилотных летательных аппаратов с использованием теоретико-игрового подхода»

^ СОВРЕМЕННЫЕ ТЕХНОЛОГИИ — ТРАНСПОРТУ

удк 533.65.013.622

Проблемы поиска и преследования беспилотных летательных аппаратов с использованием теоретико-игрового подхода

О. А. Малафеев1, К. Чжан1, И. В. Зайцева2, А. В. Гаранин3

1 Санкт-Петербургский государственный университет, Россия, 190034, Санкт-Петербург, Университетская наб., 7-9

2 Российский государственный гидрометеорологический университет, Россия, 192007, Санкт-Петербург, Воронежская ул., 79

3 ООО «Новые технологии», Россия, 196084, Санкт-Петербург, ул Заозёрная, д. 8, к. 2, литера А

Для цитирования: Малафеев О. А., Чжан К., Зайцева И. В., Гаранин А. В. Проблемы поиска и преследования беспилотных летательных аппаратов с использованием теоретико-игрового подхода // Известия Петербургского государственного университета путей сообщения. СПб.: ПГУПС, 2024. Т. 21, вып. 3. С. 744-760. DOI: 10.20295/1815-588X-2024-03-744-760

Аннотация

Цель: оптимизация эффективности стратегий обнаружения и захвата четырехроторных беспилотных летательных аппаратов (квадрокоптеров). Методы: математическое моделирование, аппарат теории игр, венгерский метод решения задачи о назначениях, теория принятия решений, принцип динамического программирования, пакет Maple для решения примеров. Результаты: для выполнения условий решения задачи об оптимальных назначениях необходимо и достаточно, чтобы она была сбалансирована. Данную задачу о назначениях можно сбалансировать, введя необходимое количество фиктивных катеров или убегающих. После этого можно сформулировать и решить двойственную задачу об оптимальных назначениях. Полученную игру можно решить любым методом решения матричных игр. Таким образом можно определить политику преследования и поиска между беспилотными летательными аппаратами. Практическая значимость: все ускользнувшие квадрокоптерные БПЛА могут быть преследованы и успешно перехвачены с использованием разработанных моделей. Приведены примеры исследования математических моделей с помощью программного пакета Maple.

Ключевые слова: теория игр, квадрокоптер, модель, кооперативная теория игр, Simulink MPC-моделирование

Материалы и методы

Рассмотрим следующую ситуацию. Дозорное судно обнаруживает неизвестный подводный объект, который тут же скрывается в неизвестном направлении. Необходимо перехватить объект за минимально возможное время. Предположим, что дозорное судно не знает точно скорость объекта. Од-

нако известен дискретный набор скоростей, одна из которых является действительной скоростью скрывающегося. Далее дозорное судно будем называть преследователем, а неизвестный объект — убегающим и обозначать соответственно Р и Е.

Представим сначала алгоритм для нахождения времени поиска в условиях, когда

преследователю достоверно неизвестна скорость убегающего [8-10]. Предположим, что скорость преследователя намного больше скорости убегающего. В первоначальный момент времени обнаружения преследователь точно определяет местоположение убегающего. Таким образом, преследователю известно расстояние между ним и убегающим. Обозначим его через Б0. Для нахождения времени поимки необходимо определить траекторию, по которой должен двигаться преследователь. Введем полярную систему координат р и ф таким образом, чтобы полюс, точка О, находился в точке обнаружения убегающего, а полярная ось проходила через точку, в которой находился преследователь. Тогда динамика убегающего описывается уравнениями:

РЕ = V

фЕ = 0.

Преследователю точно неизвестна скорость, однако известно, что она выбирается из дискретного множества Vе. Максимально возможную скорость преследователя обозначим через VP. Преследователь может гарантировать поимку, перебрав все элементы множества Vе. Первоначально преследователь делает предположение, что убегающий имеет скорость у1 е Vе. Для поимки убегающего в момент t0 преследователь начинает движение со скоростью V1' в направлении на точку О и движется так до момента t1, в который игроки оказываются на одинаковом расстоянии от точки О, т. е. чтобы выполнялось равенство

pi =pi

и

С момента ^ преследователь должен двигаться, выбирая скорость так, чтобы постоянно находиться на таком же расстоянии от точки О, что и убегающий. Для этого скорость преследователя раскладывается на две составляющие: радиальную V и тангенциальную V Радиальная составляющая — скорость, с которой преследователь отдаляется от полюса, т. е.

Vр = р.

Тангенциальная составляющая представляет собой линейную скорость вращения относительно полюса, т. е.

Vф = фр.

Для того чтобы встреча произошла, радиальная составляющая скорости преследователя полагается равной скорости убегающего. Тогда для нахождения траектории преследователя необходимо решить систему дифференциальных уравнений:

фу=ю2-м2-

Начальными условиями для этой системы будут:

ф(Г)=0,

Решая ее, находим:

ф(0=——--fr—»

vi Vi

p(0=v

Выразим время как функцию полярного угла:

\\dt + Vp(tl-t0) = D0.

¿(ф) = ^ехр

Vi9

Таким образом, траектория состоит из прямолинейных участков и участков логарифмической спирали. В [2] доказано, что при движении по спирали встреча произойдет за время, не превышающее времени прохождения одного витка. Тогда, если преследователь, обойдя виток спирали, не находит убегающего, значит, первоначальное предположение о скорости убегающего было неверным. Далее выбирается следующая скорость у2 е Vе. Значит, убегающий за время ^ прошел расстояние рЕ(/2) = v2 а преследователь рр(^2) = у1 t2. Если рР(^2) > > рЕ(?2), тогда расстояние между игроками будет равно Б2 = рР(^2) - рЕи для нахождения момента времени ¿3 необходимо решить уравнение

" '2

Если < рЕ(*2), значит, расстояние между игроками будет равно Б2 = рЕ(^2) - рр(^2), и для нахождения момента времени t3 необходимо решить уравнение

ур(4-г2)-]%2л = а-

После движения по прямолинейному участку преследователь движется по спирали. Преследователю для уменьшения времени целесообразно упорядочить перебор скоростей по убыванию. Однако если это становится известно убегающему, он может двигаться с минимальной скоростью, что позволит максимизировать время поиска.

Таким образом, получается следующая игра. Множество стратегий убегающего — это множество комбинаций возможных скоростей его движения и направлений движения а. Множество стратегий преследователя — это множество всевозможных

перестановок элементов Vе. Матрица полученной игры состоит из элементов T, которые являются временем поимки [11—13].

Теперь предположим, что преследователь должен обнаружить n убегающих, для поимки каждого из которых требуется тг:/ часов. Для реализации перехвата имеется m катеров, каждый из которых направляется за убегающим. Известна матрица А = {т j — матрица эффективности выполнения поиска i-м катером j-го убегающего. Требуется построить такой план назначений Х = {xi}, i = l...m, j = l...n, который минимизирует время поиска, при этом каждый катер назначают искать не более чем одного убегающего и каждого убегающего может искать не более чем один катер. Величины хц могут принимать только два значения:

[ 1, assigned i boat for j escaping ij [O, assigned i boat for j escaping

Математическая формулировка задачи об оптимальных назначениях:

т п

¿=i м

т

^<1,7=1..«;

¿=1

п

^jctj <\,i = \..m\

м

Х- ^ 0.

У

Для того чтобы задача об оптимальных назначениях имела оптимальное решение, необходимо и достаточно, чтобы количество катеров было равно количеству убегающих, т. е. n = m. При этом условии ограничения неравенства превращаются в равенства:

¡=17=1

п

^=1,7 = 1. Л;

>=1

л

7=1

х,>0.

Если и ^ да, то задача о назначениях несба-лансирована. Любую задачу о назначениях можно сбалансировать, введя необходимое количество фиктивных катеров или убегающих. Двойственная задача об оптимальных назначениях будет иметь вид:

п п

тах со = тах(^г + ^г), ¿=1 ¿=1 г + г > Ту,г = 1 ..п, у = 1 ..п.

Рассмотрим венгерский метод решения задачи о назначениях [14-20]

1. В исходной матрице А производитель-ностей определим в каждой строке минимальный элемент и вычтем его из всех других элементов строки.

2. В матрице, полученной на первом этапе, найдем в каждом столбце минимальный элемент и вычтем его из всех других элементов столбца. Если после выполнения п. 1 и п. 2 не получено допустимое решение, необходимо выполнить:

a) в последней матрице проводится минимальное число горизонтальных и вертикальных прямых по строкам и столбцам, чтобы вычеркнуть все нулевые элементы;

b) находится минимальный невычеркну-тый элемент, вычитается из всех остальных невычеркнутых элементов и прибавляется ко всем элементам, стоящим на пересечении проведенных в предыдущем пункте прямых;

c) если новое распределение нулевых элементов не позволяет построить допусти-

мое решение, повторяем п. 2, а в противном случае, переходим к п. 3.

3. Оптимальным назначениям будут соответствовать нулевые элементы, полученные в п. 2.

Рассмотрим еще один случай [21-25]. Предположим, что преследователь отправляет п катеров за одним убегающим. Убегающий имеет дискретный набор скоростей и направлений движений, и ему необходимо выбрать, как действовать, чтобы максимально увеличить время поимки. Другими словами, убегающий должен выбрать наилучший вариант действий или лучшую стратегию поведения. Воспользуемся теорией принятия решений. Каждый катер последовательно в случайном порядке пытается перехватить убегающего. Следовательно, имеем п шагов. Пусть находимся на шаге t. Необходимо определить вероятность победы в случае выбора стратегии I при условии, что она лучше всех предыдущих, т. е. вероятность, что она вообще лучше всех. Обозначим эту вероятность через gt. Кроме того, определим вероятность, что последняя стратегия будет самой лучшей при условии, что пропускаем первые t стратегий и далее убегающий пользуется оптимальной стратегией. Эту вероятность обозначим через И. По принципу динамического программирования убегающий знает, как действовать оптимально, начиная с шага t+1. Оптимальная стратегия поведения: если на шаге t стратегия не лучше всех предыдущих, то ее нужно отвергнуть; если же она действительно лучше среди первых t, то необходимо сравнить gt и И. Если gt > И, то убегающий выбирает стратегию ^ если gt < И, то переходим к следующей. Посчитаем gt. Начнем с конца, т. е. gп, gn-1... Если на шаге п стратегия оказалась лучше всех предыдущих, то вероятность gп = 1. Рассмотрим

шаг п - 1. Эта стратегия лучше всех предыдущих. Вероятность проигрыша в случае, если убегающий выберет ее, будет вероятностью того, что последний лучше всех.

По условию стратегии упорядочены по возрастанию качества и равновероятно разбросаны по списку. Тогда вероятность самой лучшей стратегии оказаться на п-месте равна 1/ п. Следовательно, вероятность по-1 п — 1

беды р. =1--=-. Найдем gn-2. Пусть

и п

п-2-стратегия оказалось лучшей среди всех предыдущих. Посчитаем вероятность того, что она действительно лучше всех, т. е. вероятность того, что ни п-стратегия, ни п-1-стратегия не являются самыми лучшими. Вероятность и-1-стратегии оказаться

лучше и-2-стратегии равна —-—. Вероят-

и- 1

ность, что и-1-стратегия будет не лучше

и-2-стратегии, равна 1—Ц- = ——Далее

и-1 и-1

посчитаем условные вероятности победы.

Если и-1-стратегия лучше п-2-стратегии, то п-1-стратегия — точно не самая лучшая среди всех п стратегий, т. е. вероятность победы равна 0. Если и-1-стратегия хуже и-2-стратегии, то тогда и-2-стратегия является лучшей среди первых и-1 стратегий. Вероятность победить в этом случае равна ——-> т. е. gи-1. Таким образом,

1 О О

% ---0+——2 а методом

и-1 и-1 и

математической индукции можно доказать, что [2].

Найдем И. Это вероятность выбрать в конце концов самую лучшую стратегию, если дойти до шага t, пропустить эту стратегию, а дальше действовать по оптимальной стратегии. Таким образом, это вероятность победить, действуя оптимально, начиная с t+1 шага. По определению И для любой

стратегии поведения, при которой убегающий может делать свой выбор только с шага t+1, вероятность успеха не превосходит И в случае действия в соответствии с этой стратегией поведения. То есть для любого t И > И(+1. Чем раньше действовать оптимально, тем больше вероятность победить.

Следовательно, И{ — монотонно невоз-растающая функция. По выбранной стратегии поведения, если на шаге t вероятность Иt > gt, то продолжаем перебор. Если И < gt, то убегающий останавливается в случае, когда текущая стратегия лучше всех предыдущих, и продолжает перебор в противном случае. Пусть Т — точка пересечения графиков, а ^ — последнее целое число перед Т. Очевидно, что Ип = 0. Ип-1 — вероятность того, что Е выберет лучшую стратегию, если пропустит п - 1. Это может произойти, только если последняя окажется лучше всех. Вероятность такого события равна —. Найдем

п

Ип-2. Пусть убегающий пропустил стратегию п - 2 и дальше действует оптимально. Тогда возможны два случая: п -1 является лучшей среди первых п-стратегий (вероятность это-

1 Ч 1

го равна--) и п -1 стратегия не является

п~1 п-2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

лучшей (вероятность равна-). Из первого

и-1

случая следует, что убегающий выбирает п-стратегию, что соответствует оптимальному поведению. Вероятность победы в этом слу-и-1 тт

чае gn_1 = Из второго случая следует, что Е пропускает п-стратегию. Тогда шансы на победу кп_х - значит

_ 1 п-1 + п-2 1 _(и-2) + (и-1) "~2 и-1 и и-1 и и-(и-1)

Продолжая рассуждать аналогичным образом, получим [3]

^ 1 1 ^ + ...+

- + V* t +1

и-1 к

Проанализируем выражение — для t > t,:

S,

g, i i + 1

1 1

л — 1

В [3] найдено число, которое соответствует точке пересечения на графике, равно t = —.

е

При этом h = %= — = —, т. е. вероятность * п е

успеха при n ^ да равна - = 0,368.

е

С помощью программного пакета Maple было решено несколько примеров [26-31].

Результаты исследования и обсуждение результатов

Пример 1. Пусть первоначальное расстояние между преследователем и убегающим было 200 км. Убегающий выбирает скорость из множества Vе = {8, 56, 78}, а направление — из множества а = {23, 137, 182}. Максимальная скорость преследователя VP = 100 км/ч. Тогда множество стратегий убегающего:

(а1' ^ ) ' (а1' У2 ) ' (а1' ^ ) ' (а2' ) ' (а2' ) ' (а2,у3),(а3,у1),(а3,у2),

а множество стратегий преследователя:

Матрица полученной игры выглядит следующим образом (см. ниже).

Игру можно решить любым методом решения матричных игр. Предположим, что расстояние между убегающим БПЛА и поверхностью земли составляет 100 м. Убегающий БПЛА выбирает свою скорость из набора Vе = {8, 56, 78} в качестве компоненты скорости по оси X и выбирает значение из набора а = {23, 37, 82} в качестве направления по оси У Максимальная скорость преследователя (другого БПЛА) обозначена как Vр = 120 м/мин:

(а2,у3)>(аз,у1),(а3,у2).

На рис. 1 представлены девять стратегий моделирования убегающего беспилотного летательного аппарата.

11,7 11,7

3,62-107 2,08-Ю11

2,53-1015 3,62-1013

1,1-Ю5 1,1-Ю5

1,06-1041 6,07 -1044

1,3-1077 1,86-1075

4,09-Ю6 4,09-Ю6

1,71-Ю54 9,84-1057

2,98-10101 4,26-10"

819,8 4,71-Ю6

7,24-106 7,24-106

2,53-1015 5,06-1014

7,71-Ю6 4,43-1010

2,11-Ю40 2,11-Ю40

1,3-1077 2,6-1076

2,86-108 1,64-1012

3,42-1053 3,42-1053

2,97-10101 5,95-10100

Матрица для примера 1

29547 2,07-106

9,12-Ю10 1,82-1010

3,17-1012 3,17-Ю12

2,78-108 1,94-1010

2,66-1044 5,32-1043

1,63-1074 1,63-1074

Ю10 7,19-Ю11

4,31-1057 8,62-1056

3,73-1098 3,73-1098

Таким образом, оптимальной будет стратегия, изображенная на последнем рисунке.

Пример 2. Пусть преследователь обнаружил четырех убегающих. Первоначальное расстояние до каждого из них соответственно 100 км, 200 км, 50 км и 163 км. Преследователь имеет четыре катера для поимки убегающих. Максимальная скорость каждого катера соответственно 74 км/ч, 90 км/ч, 178 км/ч и 124 км/ч. Первый убегающий движется по прямой а1 = 23 со скоростью у1 = 23 км/ч, второй — а2 = 137, у2 = 50 км/ч,

третий — а3 = 187, у3 = 67 км/ч, четвертый — а4 = 50, у4 = 70 км/ч.

Тогда матрица для задачи о назначениях выглядит следующим образом:

1903 386 9,96 52

1,15-Ю71 6,4-1051 1,3-1034 1,89-1026

5,6-10172 1,13-Ю90 2-1032 3,7-1051

2,4-Ю63 7,56-1026 1,28-109 5,96-Ю14

Решить игру можно венгерским методом. Определим политику преследования и поиска

Рис. 1. Стратегии моделирования убегающего БПЛА (начало)

iMfi, ЯЛ5, уйД Пй, IÖ "" мД, hgib yyyt. iy5 ДА лдб

а лнн^ыкпниюй

Рис. 1. Стратегии моделирования убегающего БПЛА (окончание)

между беспилотными летательными аппаратами. Допустим, что перехватывающий квадрокоптер сталкивается с четырьмя вторгшимися квадрокоптерами, которые представляют угрозу. У оператора есть четыре преследователя, предназначенных для преследования убегающего. Максимальная скорость каждого преследователя по осям XYZ составляет 74 км/ч, 90 км/ч, 178 км/ч и 124 км/ч соответственно.

Рассмотрим характеристики каждого вторгшегося квадрокоптера.

Первый квадрокоптер БПЛА вторжения:

— максимальная скорость по оси X: 23 м/мин;

— максимальная скорость по оси ^ 23 м/мин.

Высота: 100 м.

Второй квадрокоптер БПЛА вторжения:

— максимальная скорость по оси X: 50 м/мин;

— максимальная скорость по оси ^ 137 м/мин.

Высота: 200 м.

Третий вторгающийся квадрокоптер БПЛА:

— максимальная скорость по оси X: 67 м/мин;

— максимальная скорость по оси ^ 7 м/мин.

Высота: 50 м.

Четвертый квадрокоптер БПЛА вторжения:

— максимальная скорость по оси X: 70 м/мин;

— максимальная скорость по оси ^ 50 м/мин.

Высота: 163 м.

Учитывая максимальные скорости и высоты каждого вторгшегося квадрокоптера, матрица соответствия будет выглядеть следующим образом:

'0010' 1000 0100

На рис. 2 представлены изменения значений осей X, Y и Z дронов-преследователей и вторгающихся квадрокоптеров.

Таким образом, на последнем рисунке изображена оптимальная стратегия.

Пример 3. Пусть первоначальное расстояние между преследователем и убегающим было 50 км. Убегающий выбирает скорость из множества Vе = {4, 10, 16}, а направление — из множества а = {8, 10, 16}. Максимальная скорость преследователя Vр = 80 км/ч. Тогда множество стратегий убегающего:

(а1>ПМа1>^)>(а1^з)>(а2^1)>(а2>У2)> (а2,у3),(а3,у1),(а3,у2),

а множество стратегий преследователя:

Матрица полученной игры выглядит следующим образом:

0,73 0,73 1,6 6,75 2,6 5,79

1,5 6,2 0,92 0,92 5,28 3,32

4,83 2,19 4,83 3,03 1,18 1,18

0,98 0,98 2,17 9,12 3,54 7,81

3,12 13,1 1,96 1,96 11,2 7,06

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16,45 7,45 16,45 10,3 4,01 4,01

1,33 1,33 2,93 12,3 4,78 10,56

6,64 27,95 4,17 4,17 23,96 15,04

55,99 25,37 55,99 35,14 13,65 13,65

Рис. 2. Изменения значений осей X, Y и Ъ дронов-преследователей и вторгающихся

квадрокоптеров

Чтобы смоделировать данную матричную игру между преследователем и убегающим, можно представить ее в виде матрицы выигрышей, где строки представляют стратегии преследователя, а столбцы — стратегии убегающего. Каждая ячейка матрицы будет содержать выигрыш преследователя в зависимости от выбранных стратегий обеих сторон.

Политику преследования и поиска между беспилотными летательными аппаратами

можно определить следующим образом. Обозначим Vе как множество скоростей убегающего БПЛА по оси X, а — как множество направлений по оси Y, V1' — как максимальную скорость преследователя:

(а1>У1Ма1>У2)»(а1»Уз)>((Х2»У[)»((Х2>|,2)»

(а2,у3),(а3,у1),(а3,у2).

На рис. 3 представлены девять стратегий моделирования убегающего дрона.

Таким образом, отчетливо видно, что на последнем рисунке изображена оптимальная стратегия.

Пример 4. Пусть преследователь обнаружил четырех убегающих. Первоначальное расстояние до каждого из них соответственно 30 км, 11 км, 62 км и 8 км. Преследователь имеет четыре катера для поимки убегающих. Максимальная скорость каждого катера соответственно 60 км/ч, 65 км/ч, 95 км/ч и 105 км/ч. Первый убегающий движется по

прямой а) = 7 со скоростью у1 = 7 км/ч, второй — а2 = 11 и у2 = 11 км/ч, третий — а3 = 30 и у3 = 30 км/ч, четвертый — а4 = 44 и у4 = 44 км/ч. Тогда матрица для задачи о назначениях выглядит следующим образом:

1,02 0,89 0,49 0,43 1,2 0,96 0,37 0,3

2,3-Ю7 3,9-106 1 075 8 3519,7 3,14-1019 2,75-1016 5,6-108 3,54-107

Рис. 3. Девять стратегий моделирования убегающего дрона (начало)

Рис. 3. Девять стратегий моделирования убегающего дрона (окончание)

Игру можно решить венгерским методом. Преобразуем этот пример в задачу преследования дрона-квадрокоптера. Предположим, перехватывающий квадрокоптер обнаруживает четыре вторгшихся квадрокоптера. Есть четыре преследователя, которые преследуют убегающего. Максимальная скорость каждого преследователя по оси XYZ составляет 31 м/мин, 12 м/мин, 63 м/мин и 9 м/мин соответственно.

Первый квадрокоптер БПЛА вторжения имеет максимальную скорость по оси X v13 = 7 м/мин, максимальную скорость по оси Y aj = 7 м/мин, высота 30 м.

Второй квадрокоптер БПЛА вторжения имеет максимальную скорость по оси X

v23 = 11 м/мин, максимальную скорость по оси Y a2 = 11 м/мин, высота 11 м.

Третий вторгающийся квадрокоптер БПЛА имеет максимальную скорость по оси X v3 = 30 м/мин, максимальную скорость по оси Y a3 = 30 м/мин, высота 62 м.

Четвертый квадрокоптер вторжения БПЛА имеет максимальную скорость по оси X v34 = 44 м/мин, максимальную скорость по оси Y a4 = 44 м/мин, высота 44 м.

На рис. 4 изображены изменения значений осей X, Y и Z дронов-преследователей и убегающих квадрокоптеров.

Таким образом, с помощью моделирования получена оптимальная стратегия, изображенная на последнем рисунке.

Рис. 4. Изменения значений осей X, Y и Z дронов-преследователей и убегающих квадрокоптеров

Заключение

Таким образом, разработаны динамические модели проведения инспекций, которые позволяют анализировать поиск и прогнозировать местонахождение в естественных условиях беспилотных летательных аппаратов, составлен алгоритм для нахождения времени поиска в условиях неопределенности. С помощью моделей при разумных параметрах преследования БПЛА с учетом вероятности успеха и эффективности перехвата, после расчета всех параметров движения БПЛА с использованием венгерского алгоритма, все ускользнувшие квадрокоптерные БПЛА могут быть преследованы и успешно перехвачены. При этом учитываются основные параметры, такие как скорость каждого перехватчика и совместимость между квадрокоптерами в лагере БПЛА-пере-хватчиков и БПЛА-убегающих. Математические динамические модели можно исследовать с помощью программного пакета Maple.

Библиографический список

1. Koopman B. O. Search and screening // Operation evolution group office of the chief of naval operations. Report № 56. Washington, 1946.

2. Хеллман О. Введение в теорию оптимального поиска / пер. с англ. Е. М. Столяровой. М.: Наука, 1985. 246 с.

3. Абчук В. А., Суздаль В. Г. Поиск объектов. М.: Советское радио, 1977. 336 с.

4. Староверов О. В. Об одной задаче поиска // Теория вероятностей и ее применение. 1963. Т. 8, № 2. С. 196-201.

5. Kelin M. Note a sequential search // Naval research Logistic Quarterly. 1968. Vol. 15, № 3.

6. Koopman B. O. Theory of search: I. Kinematic bases // Operations Reseach. 1956. Vol. 4, № 3.

7. Koopman B. O. Theory of search: III. The optimum distribution of searching efforts // Operations Research. 1957. Vol. 5, № 5.

8. Алферов Г. В., Малафеев О. А., Мальцева А. С. Теоретико-игровые модели поиска подвижного объекта при инспектировании // Проблемы механики и управления: нелинейные динамические системы, 2014. С. 11-19.

9. Алферов Г. В., Малафеев О. А., Мальцева А. С. Модель проведения антикоррупционных инспекций // Управление социально-экономическим развитием регионов: проблемы и пути их решения: сборник научных статей 4-й Международной научно-практической конференции / Юго-Зап. гос. ун-т. Курск, 2014. С. 20-24.

10. Malafeyev O., Kun Zhang. Problems of search and pursuit of unmanned aerial vehicles using the game-theoretic approach. Arxiv: 2305.19832.

11. Лапшин В. П. Кинематические основы теории поиска // Морской сборник. 1962. № 8.

12. Charnes A., Cooper W. Theory of search: optimal distribution of search effort // Management Science. 1958. Vol. 5, № 1.

13. MacQueen J., Miller R. G. Optimal persistence polices // Operations Research. 1960. Vol. 8, № 3.

14.Posner E. C. Optimal search procedures // IEEE Transactions of Information Theory. 1963. Vol. 9, № 3.

15. Дубровин К. О., Сиротин П. А. Время пребывания цели в районе поиска // Морской сборник, 1965. № 6.

16. Морз Ф. М., Кимбелл Д. Е. Методы исследования операций / пер. с англ. И. А. Полетаева и К. Н. Трофимова, под ред. А. Ф. Горохова. М.: Советское радио, 1956. 308 с.

17. Брэм Дж. А. Игра с поиском N-области для 2 игроков // Отчет OIRM 31, 1963.

18. Нейтс М. Ф. Многоэтапная поисковая игра // Журнал СИАМ. 1963. Т. 11, № 2.

19. Джонсон С. М. Поисковая игра // Достижения в теории игр. Издательство Принстонского университета, 1964.

20. Danskin J. M. A theory of reconnaissance // Operations Research. 1963. Vol. 10, № 3.

21. Айзекс Р. Дифференциальные игры / пер. с англ. В. И. Аркина, Э. Н. Симаковой; под ред. М. И. Зеликина. М.: Мир. 1967. 479 с.

22. Зеликин М. И. Об одной дифференциальной игре с неполной информацией // ДАН СССР. Серия «Математика, физика». 1972. Т. 202, № 5.

23. Альперн С. Поисковая игра с подвижным укрытием на круге // Дифференциальные игры и теория управления. Нью-Йорк: Марсель Деккер, 1974.

24. Форман Дж. К. Принцесса и чудовище на круге // Дифференциальные игры и теория управления. Нью-Йорк: Марсель Деккер, 1974.

25. Форман Ю. Г. Дифференциальные поисковые игры с мобильным хидером // Журнал СИАМ по управлению и оптимизации. 1977. Т. 15, № 5.

26. Хальперн Б. Робот и задача преследования кролика // The American Math. 1969. Т. 76, № 2.

27. Гал С. Поисковые игры с подвижным и неподвижным хадером // Журнал СИАМ по управлению и оптимизации. 1979. Т. 17, № 1.

28. Фицджеральд Ч. Дифференциальная игра «Принцесса и чудовище» // Журнал СИАМ по управлению и оптимизации. 1979. Т. 17, № 6.

29. Уилсон Д. Д. Дифференциальные игры без информации // Журнал СИАМ по управлению и оптимизации. 1977. Т. 15, № 2.

30. Mathematical model of network flow control / I. V. Zaitseva [et al.] // IOP Conference Series: Materials Science and Engineering. "1st International Conference on Innovative Informational and Engineering Technologies, IIET 2020", 2020. P. 012036.

31. Алферов Г. В. Генерация стратегии робота в условиях неполной информации о среде // Проблемы механики и управления: нелинейные динамические системы. 2003. № 35. С. 4-24.

32. Григорьева К. В., Иванов А. С., Малафеев О. А. Статическая коалиционная модель инвестирования инновационных проектов // Экономическое возрождение России. 2011. № 4. С. 90-98.

Дата поступления: 01.05.2024 Решение о публикации: 05.06.2024

Контактная информация:

МАЛАФЕЕВ Олег Алексеевич — докт. физ.-мат. наук, профессор; o.malafeev@spbu.ru ЧЖАН Кунь — аспирант; z282250684@mail.ru ЗАЙЦЕВА Ирина Владимировна — канд. физ.-мат. наук, доцент; i.zaitseva@rshu.ru ГАРАНИН Антон Владимирович — технический директор; garanin@nt-smt.ru

Problems of search and pursuit of unmanned aerial vehicles using the game-theoretic approach

O. A. Malafeev1, K. Zhang1, I. V. Zaitseva2, A. V. Garanin3

1 St. Petersburg State University, 7-9, Universitetskaya nab., St. Petersburg, 190034, Russian Federation

2 Russian State Hydrometeorological University, 79 Voronezhskaya str., St. Petersburg, 192007 Russian Federation

3 New Technologies LLC, 196084, St. Petersburg, Zaozernaya str., 8/2, letter A

For citation: Malafeev O. A., Zhang K., Zaitseva I. V, Garanin A. V. O problems of search and pursuit of unmanned aerial vehicles using the game-theoretic approach // Proceedings of Petersburg Transport University. 2024. Vol. 21, iss. 3. P. 744-760. (In Russian) DOI: 10.20295/1815-588X-2024-03-744-760

Abstract

Currently, the application of mathematical modeling theory is widely used in various fields and, among other things, can be used to prevent illegal actions. This study examines scenarios involving a single pursuer tracking a single evader, as well as situations involving multiple pursuers pursuing multiple evaders. The authors formulate this problem as a search and pursuit problem for four-rotor unmanned aerial vehicles (UAVs) or quadcopters. The solution to the problem is based on game theory, as it provides a mathematical framework for modeling and studying strategic interactions involving multiple decision makers. The authors consider a game where the set of strategies of the runner is the set of possible combinations of speeds and directions of his movement, and the set of strategies of the pursuer is the set of all possible permutations of the elements of his speeds. The matrix of the resulting game consists of elements that are the time of capture. A mathematical problem on the optimal assignments of searching and pursuing unmanned aerial vehicles is formulated and solved.

Purpose: optimizing the effectiveness of strategies for detecting and capturing four-rotor unmanned aerial vehicles (quadcopters). Methods: methods of mathematical modeling, game theory apparatus, Hungarian method of solving the problem of assignments, decision theory, the principle of dynamic programming, the Maple package for solving examples were used. Results: In order to fulfill the conditions for solving the problem of optimal assignments, it is necessary and sufficient that it is balanced. This assignment problem can be balanced by entering the required number of fictitious boats or escaping boats. After that, it is possible to formulate and solve the dual problem of optimal appointments. The resulting game can be solved by any method of solving matrix games. In this way, it is possible to determine the policy of harassment and search between drones. Practical importance: All escaped quadcopter UAVs can be chased and successfully intercepted using the developed models. Examples of the study of mathematical models using the Maple software package are given.

Keywords: game theory, quadcopter, model, cooperative game theory, Simulink MPC modeling

References

1. Koopman B. O. Search and screening // Operation evolution group office of the chief of naval operations. Report № 56. Washington, 1946.

2. Hellman O. Vvedenie v teoriyu optimal'nogo pois-ka // per. s angl. E. M. Stolyarovoj. M.: Nauka. 1985. 246 s. (In Russian)

3. Abchuk V. A., Suzdal' V. G. Poisk ob''ektov. M.: Sovetskoe radio, 1977. 336 s. (In Russian)

4. Staroverov O. V. Ob odnoj zadache poiska // Te-oriya veroyatnostej i ee primenenie. 1963. T. 8, № 2. S. 196-201. (In Russian)

5. Kelin M. Note a sequential search // Naval research Logistic Quarterly. 1968. Vol. 15, № 3.

6. Koopman B. O. Theory of search: I. Kinematic bases // Operations Reseach. 1956. Vol. 4, № 3.

7. Koopman B. O. Theory of search: III. The optimum distribution of searching efforts // Operations Research. 1957. Vol. 5, № 5.

8. Alferov G. V., Malafeev O. A., Mal'ceva A. S. Teoretiko-igrovye modeli poiska podvizhnogo ob''ek-ta pri inspektirovanii // Problemy mekhaniki i upravle-niya: nelinejnye dinamicheskie sistemy. 2014. S. 11-19. (In Russian)

9. Alferov G. V., Malafeev O.A., Mal'ceva A. S. Model' provedeniya antikorrupcionnyh inspekcij // Upravlenie social'no-ekonomicheskim razvitiem regionov: problemy i puti ih resheniya: sbornik nauchnyh statej 4-j Mezhdu-narodnoj nauchno-prakticheskoj konferencii / Yugo-Zap. gos. un-t. Kursk, 2014. S. 20-24. (In Russian)

10. Malafeyev O., Kun Zhang. Problems of search and pursuit of unmanned aerial vehicles using the game-theoretic approach. Arxiv: 2305.19832.

11. Lapshin V. P. Kinematicheskie osnovy teorii poiska // Morskoj sbornik, 1962. № 8. (In Russian)

12. Charnes A., Cooper W. Theory of search: optimal distribution of search effort // Management Science, 1958. Vol. 5, № 1.

13. MacQueen J., Miller R. G. Optimal persistence polices // Operations Research. 1960. Vol. 8, № 3.

14. Posner E. C. Optimal search procedures // IEEE Transactions of Information Theory. 1963. Vol. 9, № 3.

15. Dubrovin K. O., Sirotin P. A. Vremya prebyva-niya celi v rajone poiska // Morskoj sbornik, 1965. № 6. (In Russian)

16. Morz F. M., Kimbell D. E. Metody issledovaniya operacij / per. s angl. I. A. Poletaeva i K. N. Trofimova, pod red. A. F. Gorohova. M.: Sovetskoe radio, 1956. 308 s. (In Russian)

17. Brem Dzh. A. Igra s poiskom N-oblasti dlya 2 igrokov // Otchet OIRM 31, 1963. (In Russian)

18. Nejts M. F. Mnogoetapnaya poiskovaya igra // Zhurnal SIAM. 1963. T. 11, № 2. (In Russian)

19. Dzhonson S. M. Poiskovaya igra // Dostizheniya v teorii igr. Izdatel'stvo Prinstonskogo universiteta, 1964. (In Russian)

20. Danskin J. M. A theory of reconnaissance. Operations Research. 1963. Vol. 10, № 3.

21. Ajzeks R. Differencial'nye igry / Per. s angl. V I. Arkina, E. N. Simakovoj; pod red. M. I. Zelikina. M.: Mir. 1967. 479 s. (In Russian)

22. Zelikin M. I. Ob odnoj differencial'noj igre s nepolnoj informaciej // DAN SSSR. Seriya "Mate-matika, fizika", 1972. T. 202, № 5. (In Russian)

23. Al'pern S. Poiskovaya igra s podvizhnym ukry-tiem na kruge // Differencial'nye igry i teoriya uprav-leniya. N'yu-Jork: Marsel' Dekker, 1974. (In Russian)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

24. Forman Dzh. K. Princessa i chudovishche na kruge // Differencial'nye igry i teoriya upravleniya. N'yu-Jork: Marsel' Dekker, 1974. (In Russian)

25. Forman Yu. G. Differencial'nye poiskovye igry s mobil'nym hiderom // Zhurnal SIAM ob upravlenii i optimizacii. 1977. T. 15, № 5. (In Russian)

26. Hal'pern B. Robot i zadacha presledovaniya kro-lika // The American Math. 1969. T. 76, № 2. (In Russian)

27. Gal S. Poiskovye igry s podvizhnym i nepod-vizhnym haderom // Zhurnal SIAM ob upravleniyu i optimizacii. 1979. T. 17, № 1. (In Russian)

28. Ficdzheral'd CH. Differencial'naya igra "Princes-sa i chudovishche" // SIAM ob upravlenii i optimizacii. 1979. T. 17, № 6. (In Russian)

29. Uilson D. D. Differencial'nye igry bez infor-macii // SIAM ob upravlenii i optimizacii. 1977. T. 15, № 2. (In Russian)

30. Mathematical model of network flow control / I. V. Zaitseva [et al.] // IOP Conference Series: Materials Science and Engineering. "1st International Conference on Innovative Informational and Engineering Technologies, IIET 2020". 2020. P. 012036.

31. Alferov G. V. Generaciya strategii robota v usloviyah nepolnoj informacii o srede // Problemy me-khaniki i upravleniya: nelinejnye dinamicheskie siste-my. 2003. № 35. S. 4-24. (In Russian)

32. Grigor'eva K. V., Ivanov A. S., Malafeev O. A. Staticheskaya koalicionnaya model' investirovaniya in-novacionnyh proektov // Ekonomicheskoe vozrozhdenie Rossii. 2011. № 4. S. 90-98. (In Russian)

Received: 01.05.2024 Accepted: 05.06.2024

Author's information:

Oleg A. MALAFEYEV — Doctor of Physical and Mathematical Sciences, Professor;

0.malafeev@spbu.ru

Kun ZHANG — Postgraduate Student; z282250684@mail.ru

Irina V. ZAITSEVA — PhD in Physical and Mathematical Sciences, Associate Professor;

1.zaitseva@rshu.ru

Anton V. GARANIN — Technical Director; garanin@nt-smt.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.