Оптимальные траектории беспилотного летательного аппарата при слежении за подвижной целью с помощью антенной решетки

Андреев Кирилл Владимирович

У

правление подвижными объектами и навигация

УДК 629.735

ОПТИМАЛЬНЫЕ ТРАЕКТОРИИ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ ПРИ СЛЕЖЕНИИ ЗА ПОДВИЖНОЙ ЦЕЛЬЮ С ПОМОЩЬЮ АНТЕННОЙ РЕШЕТКИ

К.В. Андреев

Рассмотрена задача оптимизации траекторий полета беспилотного летательного аппарата (БПЛА), осуществляющего слежение за подвижной целью с помощью линейной антенной решетки путем угловых азимутальных наблюдений. Показано, что точность измерения азимутальных направлений на цель существенно зависит от взаимного расположения цели и БПЛА, что приводит к наличию «слепых» зон — значений углов с присущими им высокими ошибками измерений. Отмечено, что учет такой структуры наблюдений позволяет ставить задачу о выборе оптимальных (в смысле точности слежения за целью) траекторий полета БПЛА и необходимости введения дополнительных ограничений на интенсивность его маневрирования. Оптимальные траектории получены известными численными методами, основанными на принципе максимума Л.С. Понтрягина.

Ключевые слова: угловые наблюдения, фильтр Калмана, принцип максимума Понтрягина, вырожденная задача оптимального управления.

ВВЕДЕНИЕ

Постановка задачи определения элементов движения цели (ЭДЦ) по угломерной информации известна с 1947 года [1]. С ее решением связаны две основные трудности: результаты измерений нелинейно зависят от координат цели [2] и при слежении за подвижной целью возникает проблема ее наблюдаемости [3], что требует от БПЛА выполнения маневров. Задача планирования траектории БПЛА при определении ЭДЦ по угломерным данным достаточно подробно исследована в работах [4—6]. Однако, как будет показано далее, учет ограничений на точность наблюдений, обусловленных физической структурой детектора сигнала, установленного на борту БПЛА [7], может существенно влиять как на вид программных траекторий полета, так и на точность оценки ЭДЦ.

В настоящей работе рассмотрен случай слежения за целью в радиодиапазоне с помощью линейной антенной решетки (антенные элементы размещены вдоль прямой линии на равном расстоянии друг от друга), расположенной вдоль фюзеляжа

БПЛА. Антенные решетки (или «умные антенны» — smart antennas) и алгоритмы определения угла прихода сигнала (AoA — Angle of Arrival) получили широкое распространение, в частности, и в телекоммуникациях [8, 9]. Некоторые алгоритмы определения AoA опираются на законы Фурье-оптики [10] и основаны на построении псевдоспектральной плотности, например, алгоритм Бартлетта [11], Capon [12] и MUSIC [13], которые описаны в работе [8]. Поскольку эти алгоритмы базируются на построении спектральной плотности, они требуют существенных вычислительных затрат, связанных со сканированием возможных значений AoA, и построением спектральной плотности для каждого возможного значения. Альтернативный подход связан с применением алгоритма ESPRIT — Estimation of Signal Parameters via Rotational Invariants [14], не требующего сканирования всех возможных значений AoA, оценки которого выводятся непосредственно из корреляционной матрицы сигнала [8]. Алгоритм основан на том, что исходная линейная антенная решетка может быть разделена на две идентичных антенных решетки, причем одна из другой получается параллельным

переносом. В качестве примера можно привести антенную решетку с четным числом элементов и разбиением на массивы четных и нечетных элементов. Алгоритм ESPRIT работает в предположениях:

— принимаемый сигнал узкополосный;

— помеха представляет собой аддитивный белый шум, что выполняется только при отсутствии многолучевого распространения сигнала или при достаточно большой высоте полета БПЛА [15] по сравнению с элементами ландшафта.

1. ПОСТАНОВКА ЗАДАЧИ И СПОСОБ РЕШЕНИЯ

Рассмотрим БПЛА, выполняющий полет на фиксированной высоте с постоянной по модулю скоростью V. С борта БПЛА осуществляется наблюдение за целью, движущейся равномерно и прямолинейно со скоростью v вдоль плоской поверхности Земли. Управление БПЛА задается углом рысканья у = y(t) — гладкой функцией времени. Введем прямоугольную систему координат с началом отсчета в центре масс БПЛА и выберем координатные оси так, чтобы относительные координаты цели (x, y) = (x(t), y(t)) задавались системой дифференциальных уравнений

X = - Vcos y + vx, y = - Vsiny + Vy, t e [ 0, T],

(1)

с некоторыми начальными условиями (х0, у0).

Здесь V и V — неизвестные, но постоянные зна-

х у

чения компонент вектора скорости цели. Предполагается, что время Т выполнения миссии БПЛА фиксировано. Если относительные координаты цели точно известны, то известно и точное азимутальное направление на цель

9(t) = arctn ^ ( ) У ( t)

(2)

Реальные наблюдения ф(?) = 9(?) + п(?) содержат аддитивную ошибку п = п(?), имеющую нормальное распределение с нулевым средним. Дисперсия распределения ошибок является функцией направления (2) на цель и ориентации антенной решетки, определяемой направлением движения БПЛА или углом рысканья.

Фильтр Калмана [16] — на сегодня, пожалуй, один из наиболее распространенных способов получения оценок ЭДЦ по сериям зашумленных наблюдений. Если функция наблюдений нелинейная (как, например, функция (2)), то применяется расширенный фильтр Калмана, в уравнения которого подставляется линеаризованная (в окрестности текущей оценки) функция наблюдений [2]. Пусть ЭДЦ задаются фазовым вектором р = р(?):

р = (x, y, V

x'

V/.

(3)

Здесь и далее символ «штрих» означает транспонирование.

В соответствии с уравнениями фильтра Калмана [17] эволюция оценки р = р (?) вектора (3) ЭДЦ описывается стохастическим дифференциальным уравнением

dt = FР + PH'R х(ф

HР ),

(4)

начальное условие которого представляет собой га-уссовский вектор с заданными средним р0 = (х0, у0, Ух0, уУо)' и матрицей ковариации Р0. Динамика

системы описывается уравнением ^ = /р, где

д?

F =

(0 0 10л 0 0 0 1 0 0 0 0 V 0 0 0 0J

Р = Р (?) — матрица ковариации текущей оценки ЭДЦ, Я = Я(?) — скалярная функция, характеризующая дисперсию шума в наблюдениях (определена ниже), а Н = Н(?) — линеаризованная вектор-функция наблюдений

H =

д(6)

3( X, y, Vx, Vy )

^ H = ( -у, У, 0, 0

r r

/1 2 где г = л/х + у .

В случае, когда цель не совершает маневров, элементы матрицы ковариации подчиняются матричному уравнению Риккати [17]

P = FP + PF - PH 'R 1HP '.

(5)

Критерием качества получаемой оценки ЭДЦ может служить след матрицы ковариации в конечный момент времени Т:

G = trPjt = T = Pxx + Pyy + P.

+ Pvyvy| , (6)

y y|t = T

где 1г — оператор следа матрицы, р с индексами обозначает соответствующие диагональные элементы матрицы ковариации (см. Приложение).

При планировании миссии БПЛА будущие наблюдения не могут быть использованы для уточнения ЭДЦ. По этой причине задача оптимального планирования траектории решается при экстраполяции начальной оценки ЭДЦ. Иными словами, уравнение (4) меняется более простым уравнением

Др/Д? = /р, что эквивалентно замене Ух и уу на уХо и ууо в уравнении (1). Задача оптимального управления состоит в том, чтобы найти такую функцию времени у = Y(?), для которой система (1), (5) с на-

x x

Рис. 1. Линейная антенная решетка, нормаль к ней и направление на цель

а, град.

17,5 15,0 12,5 10,0 7,5 5,0 2,5

* - эксперимент "'- - OoCOS~20

i : :

: : ;

: : :

! ! !

О

10

20

30

40

50

60

а, град.

Рис. 2. Зависимость ошибки определения АоА от азимутального направления на цель

чальными условиями р0, P0 реализовывала бы минимально возможное значение функционала (6).

При решении задачи необходимо сначала определить зависимость среднеквадратической ошибки а(а) определения AoA от взаимного расположения антенной решетки и цели, после чего появляется возможность включить эту зависимость в явном виде в уравнение (5). Далее задача оптимального управления может быть сведена к двухточечной задаче с помощью принципа максимума Л.С. Понтрягина и решена численно.

Рассмотрим угол а (рис. 1) между точным направлением на цель и нормалью к линии фюзеляжа, вдоль которой установлены антенные элементы. Линия фюзеляжа задается единичным вектором (cosy, siny). Нормаль к ней представляет собой единичный вектор (siny, —cosy), где у — угол рысканья БПЛА. Точность определения AoA оценим с помощью вычислительного эксперимента в предположении, что многолучевое распространение сигнала отсутствует, а модель шума в канале представляет собой аддитивный гауссовый шум. В результате получена зависимость среднеквадрати-ческой ошибки определения AoA от значения а, изображенная на рис. 2.

Значения параметров вычислительного эксперимента при определении s(a)

Число отсчетов при оценке матрицы ковариации

сигнала..............................................................500

Число элементов антенной решетки..................40

Расстояние между элементами антенной решетки, длин волн....................................................0,25

Отношение «сигнал/шум» на приемнике, дБ . . 0 Число независимых экспериментов для оценки а

для каждого значения а....................................104

Из результатов вычислительного эксперимента видно, что а(а) достаточно хорошо аппроксимируется зависимостью

а(а)

2

cos а

(7)

где а0 = а(0).

Поскольку для каждого значения а было выполнено 104 независимых испытаний, то можно с высокой степенью достоверности утверждать, что распределение ошибки определения AoA нормальное с нулевым средним для значений а вплоть до 60°. Большие значения а могут быть охарактеризованы как «слепые» зоны, поскольку точность определения угла прихода сигнала становится слишком низкой.

Запишем теперь зависимость (7) как функцию x, y, у. Для этого найдем cosa с помощью скалярного произведения вектора относительных координат цели и единичного вектора нормали к линии антенной решетки:

cosa = (x, y)

с \

cos у

1 = x sin у - y co s y r r

V - sin y y

Перепишем уравнение (7) в виде

1 = (x sin у - y cos у ) 4 = П ( x, y, y )

2, , 2 4 2 "

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

a (x, y, y) a0r a0

Коэффициент n(x, y, у) возрастания ошибки определения AoA полностью задает дисперсию R в уравнении (5).

Матричный множитель H'R-1H в уравнении (5) может быть записан как

HR H

rlff-

/ Л

Hxx 0 V 0 0 J

Hxx =

h1 h2

V h2 h3 J

где H — (2x2) симметричная матрица с элемен-

тами

y2

h1 = ti n(x У, yX r

h2 = - n(x, У, y), aor

= x = 2 4

a0 r

n(x ^ y)-

h

3

В результате уравнение (5) фильтра Калмана принимает вид

(

Р = /Р + Р/ - Р

Нхх 0 | Р' 0 0

(8)

Уравнение (8) описывает эволюцию всех десяти элементов симметричной матрицы Р = Р(?) размером 4x4.

2. ДВУХТОЧЕЧНАЯ ЗАДАЧА И СПОСОБ ЕЕ РЕШЕНИЯ

Сформулированная задача оптимального управления представляет собой задачу Майера. В соответствии с принципом максимума Л. С. Пон-трягина, эта задача может быть сведена к двухточечной задаче [18]. Из условий трансверсальности часть граничных условий будет определена на левом конце траектории (при ? = 0), а часть — на правом (при ? = T). Запишем условия трансверсальности в виде, предложенном в работе [19]:

[^ - Н8? + I = 0,

где Н — гамильтониан задачи, символ 8 обозначает вариацию, точкой обозначено скалярное произведение, индекс / символизирует набор граничных условий в начальной точке траектории БПЛА, а индекс f — в конечной, G — оптимизируемый функционал (6). Вектор фазовых переменных ^ состоит из элементов матрицы ковариации Р = Р(?) (вычисляются в Приложении) и относительных координат х, у цели:

¡5 = (¡р ^ ^ ^ ^ ^ ^ ^ ^ ¡Ш ^12) =

= ^хх, рху, руу, , , р^у ,

Рхгх , рхгу , ргху , рууу , X y),

а вектор сопряженных переменных у определен как

у = у^ у^ у^ ^ у^ у^ у^ у^ уШ у^

у :

где гамильтониан Н = | • у.

Начальные условия (/) полностью заданы априорным значением матрицы ковариации и начальной оценкой ЭДЦ. Поскольку время выполнения миссии фиксировано (т. е. 8Т = 0), условия трансверсальности можно переписать в виде

^ + у-8^ = 0,

что определяет значения сопряженных переменных в конечной точке (/) выполнения миссии, т. е.

I I

при ? = Т: у 1,3,4,6 = -1, у^,5,7,8,9,10,11,12

но принципу максимума Л.С. Понтрягина, необходимым условием оптимальности выбранного уп-

I

= 0. Соглас-

равления Y является максимум гамильтониана Н по этому управлению в каждой точке траектории. Гамильтониан задачи имеет вид:

Н = Н0(хх^ — ycosY)4 + В — у11(VcosY — Ух) — — у^Квту — Уу), (9)

где

Н = -Ау + Вху - Сх

Н 0 2 8 ,

а выражения для А, В, С и В определены в Приложении.

Опишем далее процедуру численного решения задачи поиска максимума гамильтониана, заметив, что гамильтониан представляет собой полином четвертой степени от тригонометрических функций управления, поэтому при Y е [0, 2п) он может иметь несколько локальных максимумов.

В ходе численного решения управление хранится в виде последовательности значений в различные моменты времени с интервалом А? П Т. Поскольку применялся метод решения дифференциальных уравнений с переменным шагом, то для получения управления в произвольный момент времени применялась интерполяция.

Для получения оптимальной траектории применялся итеративный алгоритм, на каждом шаге которого значение функционала G строго убывает. Каждая итерация состоит из нескольких шагов. Сначала решается система дифференциальных уравнений для фазовых переменных с известными начальными условиями для прямого времени «слева направо», затем по известным значениям фазовых переменных строится решение системы сопряженных уравнений «справа налево» с граничными условиями в момент ? = Т [20]. Для перехода к следующей итерации необходимо обновить оптимальное управление. Для этого был выбран такой способ (уравнение записано для каждой точки траектории, в которой хранится управление):

Yk + 1 = а Yk + (1 — а) Yk + 1,

где Yk + 1 — новое управление на текущей итерации к + 1 с номером в каждой точке траектории, а Yk +1 — оптимальное управление, полученное из условия глобального максимума гамильтониана по управлению при известных фазовых и сопряженных переменных в каждой точке траектории. Параметр а е (0, 1) выбран для сглаживания [20].

Альтернативой поиску глобального максимума гамильтониана служит изменение управления пропорционально градиенту гамильтониана по управлению:

Н = 4Н0(х sinY — у cosY)3(x cosY + у sinY) +

+

уп^ту — у12FcosY.

(10)

Однако такой метод может привести к сходимости к локальному максимуму гамильтониана. Оптимальное управление ищется в диапазоне у е 9 ± п, поскольку Н(у) является периодической функцией аргумента у, а 9 — азимутальное направление на цель. Как будет показано далее, в действительности оптимальное управление находится в диапазоне у е 9 ± п/2.

3. ТРАЕКТОРИИ ПОЛЕТА БПЛА

Оптимальные траектории полета получены с помощью описанной выше численной процедуры в предположении дискретного времени. В случае непрерывного времени для получения Я в уравнении (5) необходимо умножить среднеквадрати-ческую ошибку определения АоА на квадратный корень из периода между последовательными наблюдениями. Предположим, что точность определения элементов скорости движения цели важнее точности определения координат. В качестве единицы длины в выражении (6) удобно выбрать километр, а в качестве единицы скорости — метр в секунду. Начальная матрица ковариации берется диагонального вида с заданными элементами ,2 2 2 2,

Значения параметров вычислительного эксперимента для построения траекторий полета БПЛА

Скорость полета БПЛА, м/с............... 100

Среднеквадратическая ошибки определения азимута а0 (7), мрад ..................... 26

Частота прихода наблюдений, Гц......................10

Время выполнения миссии, с............................210

Скорость движения цели, м/с............................15

Начальное расстояние между БПЛА и целью, км 20 Начальная априорная ошибка определения

координат цели ах, км ......................................10

Начальная априорная ошибка определения скорости цели м/с.................... 15

Для решения задачи рассмотрим сначала случай п(х, у, у) = 1 и сформулируем возможные труд-

Рис. 3. Оптимальная траектория БПЛА при слежении за подвижной целью для случая ^(х, У, т) ° 1

Рис. 4. Функция управления БПЛА при слежении за подвижной

целью для случая ^(х, У, т) ° 1:- — направление наилучшей

точности;------угол в направлении цели;--оптимальное управление

ности, связанные с получением искомого решения.

На рис. 3 представлена траектория полета БПЛА для случая, когда точность определения азимутального направления на цель не зависит от взаимного расположения БПЛА и цели, т. е. при n(x, y, у) - 1, или при «изотропном» сенсоре. В этом случае гамильтониан имеет единственный максимум в каждой точке траектории при у е 9 ± п, а полученная функция управления и соответствующая ей траектория гладкие. При этом максимальное угловое ускорение БПЛА вдоль программной траектории удовлетворит любым конструкционным ограничениям. Для реальной антенной решетки гамильтониан состоит из двух слагаемых, в которые входит управление. Первое слагаемое

H1(y) = ... - Vcosy - Vl2Vsiny (11)

задает оптимальное управление БПЛА в случае n(x, y, у) - 1 и определяет маневры, необходимые для наблюдаемости цели (см. рис. 3 и 4), оно имеет единственный максимум при у е 9 ± п. Максимум второго слагаемого

H2(y) = H0(x sinY - y cosy)4 — ... (12)

достигается в том случае, когда БПЛА движется в направлении, перпендикулярном направлению на цель (y = 9 ± п/2). При таком управлении достигается максимальная точность собираемых угловых наблюдений.

На рис. 4 представлена зависимость функции управления от времени для случая n(x, y, y) - 1. Более тонкими линиями показаны величины Y = 9 ± п/2, обозначенные как «направление наилучшей точности». В моменты времени 160 и 180 с оптимальное управление пересекает границу

секторов обзора — угол в направлении цели. Так как максимум гамильтониана (9) достигается на интервале между максимумами слагаемых (11) и (12), итоговое оптимальное управление может оказаться разрывным в те моменты времени, когда максимум слагаемого (11) при движении вдоль траектории пересечет границу секторов обзора.

Именно такой случай продемонстрирован на рис. 5. Соответствующая этому управлению траектория не является гладкой (рис. 6, тонкая линия), т. е. для получения физически реализуемого управления необходимы дополнительные ограничения на интенсивность маневрирования БПЛА.

Введем новую фазовую переменную у, которая в предыдущем варианте постановки задачи играла роль управления. Для учета ограничений на интенсивность маневрирования зададим динамику угла рысканья в виде дифференциального уравнения

• V ■

у = -ъти,

£шах

у, рад.

S. "i.....Г"—j..... \ 1 1 1 ^^^ V 1 1 1 1 1 ^^ .....i_____1: i i / i * ■' i У 1 1

—i—i—V ! * Г"*—! \ -i ¡- \ 1 i ii \ / 1 \ / 1 \ T i \ i / i \ i / i l /\/ 1 1 rH- , г n

1 1 1 1 1 • 1 1 1 1 « г» л г "г 1 т 1 1 1 1 ■ § а 1 1 1 1 ■ i 1 1 1 1 1 'it

""Т — — III! i i i i I ------1-----1-----1-----1- JVlVu***.,- -V- 1 1 1 1 - ATi 'Л-'Г-Ъ-Ч

О 20 40 60 80 100 120 140 160 180 t, с

Рис. 7. Функция управления БПЛА при слежении за подвижной целью при наличии ограничений на интенсивность маневрирования БПЛА:-------— • 100;.....— границы секторов об-

5у

зора;--оптимальное управление

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 5. Функция управления БПЛА при слежении за подвижной целью при использовании антенной решетки в случае у, у) ° 1:

- — значение у, доставляющее максимум (11),------

границы секторов обзора у = 6 + я/2;--оптимальное уп-

равление

X, км

-Л

-2 0 2

!

:

;

Траектории БПЛА \

III! \

-18

-14 -10

-2

2 у, км

Рис. 6. Траектории полета БПЛА при слежении за подвижной целью при наличии (жирная линия) и отсутствии (тонкая линия) ограничений на интенсивность маневрирования БПЛА

где и = и(1) — новое управление. Такой способ задания управления позволяет естественным образом ограничить модуль максимального бокового ускорения БПЛА величиной £шах. Введение новой фазовой переменной влечет за собой новую сопряженную переменную у13, динамика которой описывается в точности уравнением (10). Новый гамильтониан имеет вид:

V

- Hold + Vn-

+ V13;

■ smu,

где Hold задается уравнением (9), в котором у теперь является фазовой переменной.

Оптимальное управление u определяется максимизацией гамильтониана Hnew и зависит от знака переменной у 13. В случае у 13 > 0 БПЛА выполняет маневр с максимальной интенсивностью в одну сторону, в случае у13 < 0 — в другую. Для у13 = 0 на каком-либо участке траектории необходимо найти особое управление. Легко убедиться в том, что Hold является первым интегралом при у13 = 0.

Численный метод поиска оптимальной траектории с учетом ограничений на интенсивность маневрирования БПЛА состоит в следующем. С помощью метода градиентного спуска, используя уравнение (10) при у13 = 0, следует найти такое управление, при котором Hold — const. В противном случае, в зависимости от знака переменной у13, необходимо двигаться с максимально допустимым боковым ускорением gmax. Аналогичный подход, позволяющий учесть ограничения на фазовые пе-

max

Ожидаемые среднеквадратические ошибки определения координат цели при движении БПЛА вдоль оптимальных траекторий

Сценарий в Ах, м Ау, м/с

Случай п(х, у, у) = 1 0,369 73,8 0,603

Нет ограничений на манев- 0,837 139,4 0,904

рирование БПЛА

Максимальное угловое уско- 0,951 160,8 0,962

рение БПЛА ^

ременные, описан в работе [19]. Кроме того, явное включение новых переменных у и у13 в системы дифференциальных уравнений для фазовых и сопряженных переменных не требуется. Новая (см. рис. 6) траектория полета БПЛА гладкая. На рис. 7 представлено соответствующее такой траектории непрерывное управление. Для полученной траектории локальный максимум гамильтониана в каждой точке траектории, где у13 ^ 0, является глобальным. На этом же рисунке для наглядности представлена зависимость Ну (см. уравнение (10)) от времени. Это значение оказывается близким к нулю в те моменты времени, где условие на максимальную перегрузку строго выполнено. Количественные оценки получаемых точностей определения координат представлены в таблице. Обозначим через Ах арифметический корень следа матрицы Рх — координатной части матрицы ковариации оценки ЭДЦ, а через Ау — арифметический корень следа матрицы Рг, (см. Приложение). Данные величины могут рассматриваться как 1ст доверительные области (или размер 50 % доверительной области [2]) для координат и компонент скоростей цели.

ЗАКЛЮЧЕНИЕ

Рассмотрен метод получения программных оптимальных траекторий БПЛА, следящего за подвижной целью с помощью азимутальных наблюдений, принимаемых линейной антенной решеткой. Учет физической структуры сенсора изменяет вид оптимальных траекторий БПЛА, а также приводит к 2,5-кратным потерям в оценке значения функционала. Однако если БПЛА выполняет полет вдоль оптимальной траектории, вычисленной для случая п(х, у, у) = 1 и осуществляет наблюдения с помощью антенной решетки, то значение функционала О = 4,961, что более, чем впятеро больше оптимального значения функционала, полученного вдоль траектории, вычисленной с учетом свойств антенной решетки. Потому физические свойства сенсора на борту БПЛА должны быть учтены при планировании траектории полета.

Проблема построения траектории наблюдателя, осуществляющего угловые наблюдения, связа-

на с наблюдаемостью цели [3]. Если наблюдатель движется вдоль траектории, при которой точность наблюдений максимальна (т. е. когда направление на цель ортогонально направлению движения БПЛА), то получить оценки координат цели невозможно, и значение функционала возрастает в этом случае более чем в 100 раз, что показывает необходимость БПЛА совершать маневры.

Рассмотренная задача оптимального управления служит поиском компромиссного решения: с одной стороны (см. выражение (12)), для получения точных оценок ЭДЦ необходимо, чтобы точность наблюдений была бы высокой. С другой стороны (см. выражение (11)), БПЛА должен выполнять маневры, сближаясь с целью (см. рис. 3). Однако при сближении с целью большая часть наблюдений попадает в «слепую» зону сенсора — значения углов, при которых точность определения азимутальных направлений низкая. Необходимость смены секторов наблюдения (двух областей с высокой точностью наблюдения по левому и правому бортам БПЛА) приводит к тому, что оптимальное управление оказывается разрывной функцией. Введение дополнительных ограничений на фазовые переменные позволило разрешить эту проблему и получить гладкие траектории полета БПЛА.

ПРИЛОЖЕНИЕ

Система дифференциальных уравнений для элементов матрицы ковариации. Запишем уравнение (5) в блочном виде

Р =

Р Р'

X XV V Pxv Р

\

Р + Р'

Р Н Р

X XX X

Р - Р Н Р

Р - Р Н Р'

V X XX XV

-Р Н РТ

XVЛЖ-XXÍ XV У

Здесь каждый блок имеет размер 2x2 и может быть представлен в виде элементов

Г \

Pxx Px '

Рх =

XX Лг xy

pxy Руу

Рх, =

Р =

V pv V р V V }

V ух Уу Уу Уу У

( \

Pxvx Pvxy Рх*,. Pv

Система дифференциальных уравнений для сопряженных переменных. Гамильтониан можно записать в виде

Н = Н¥р - уп( КсОБу - Ух) - ^(^Шу - Уу), где Н^р соответствует скалярному произведению первых десяти элементов фазового вектора и первых десяти сопряженных переменных и является линейной функцией элементов к{1 2 3| матрицы Нхх. Группируя множи-

(П2)

тели перед этими элементами, перепишем гамильтониан в виде:

= -(Л^ + Вк2 + Ск3) + Б.

Для первых десяти сопряженных переменных имеем дифференциальные уравнения:

¥1 = к1(^¥1 + Pxy¥2 + ¥7 + Г XV,, ¥8 ) +

Л у

+ к2(^у¥ + Руу¥2 + Pv у¥7 + Pv у¥8),

Х у

¥ 2 = к1 (^¥2 + ^у¥з +

¥9 + ¥10) +

Х у

+ к2(^¥1 + ^у¥2 + ^уу¥з + PxvлV7 + PxvyV8 + (П1) + PvлyV9 + PvyyVl0) + к3( ^у¥1 + Pyy¥2 + PvлyV7 + PvyyV8), ¥ 3 = к2 (^¥2 + ^у¥з +

¥9 +

-Г XV,,

¥10) +

Х у

+ ^^¥2 + ^уу¥з + Pvу¥9 + Pv1,y¥l0),

X у

>4 =

¥5 = -¥8 - ¥9, ¥ 6 = -¥l0,

¥7 = к1(2Pxv ¥4 + Pxv ¥5 + PxxV7 + Pxy¥9) +

Х у

+ к2(2Pv у¥8 + Pv у¥9 + PxyV7 + Pyy¥9) - 2¥^

Х у

¥ 8 = к1 (PxvX ¥5 + ¥6 + Pxx¥8 + Pxy¥ 10 ) +

Х у

+ к2^гу¥5 + ^,,у¥6 + PxyV8 + Pyy¥l0) - V2,

Ху

¥ 9 = к2( ^¥4 + Pxvv ¥5 + PxxV7 + Pxy¥9 ) +

Ху

+ к3(^у¥4 + Pv1,y¥5 + PxyV7 + Pyy¥9) - ¥2,

Х у

¥ 10 = к2^Х¥5 + ^„¥6 + PxxV8 + Pxy¥l0) +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Х у

+ к3^гу¥5 + ^„у¥6 + Pxy¥8 + Pyy¥l0) - 2¥2,

Х у

Для последних двух сопряженных переменных имеем дифференциальные уравнения:

¥ 11 = Л(к1)х + В(к2)х + С(кз)х,

¥ 12 = Л(к1)у + В(к2)у + С(кз)у. (П4)

Чтобы записать двухточечную задачу в явном виде, необходимо вычислить частные производные к{1 2 3| по переменным х и у. Для этого необходимо сначала продифференцировать п:

Пх = 4у(хБШу - уСОБу)(уБШу + хСОБу)г 6, пу = 4х(хв1пу - уСОБу)(у81пу + ХСОБу)г 6.

Запишем теперь частные производные элементов матрицы Н :

_ 2x(y2-x2) , x2 ,, ч _ 4x2y x2

(h3)x " 2 6 П + -5-7 Л* (h3)y " - -ri П - — V

2 6 a0r

24

a0r

26 a0r

2 4 'У a0r

(П3)

(h,)x = П +

CT0r

y2

T"4

(h ) = 2y(x!ziL)n - jLn

(h1)y 2 fi n 2 4 ПУ

ст0 r CT0r

(h2)x - У(3x2 - y2)n _ 2 6 1 xy 2 4

CT0r

(Ч = x ( 3y 2 - x2 )n + 2 6 1 n, 24y

2 4 'y' CT0r

Таким образом, система дифференциальных уравнений для сопряженных переменных определяется выражениями (П1)—(П4).

ЛИТЕРАТУРА

1. Stansfiled R.G. Statistical Theory of D.F. Fixing. Part III: Radiocommunication // Journal of the Institution of Electronical Engineers. - 1947. - Vol. 94 (15). - P. 762-770.

2. Don Koks. Numerical Calculations for Passive Geolocation Scenarios / Defense Science and Technology Organization Research Report, DSTO-RR-0319, Australia, 2007.

3. Aidala V.J, Nardone S.C. Observability Criteria For Bearings-Only Target Motion Analysis // IEEE Trans. on Aerospace and Electronic Systems. - 1981. - Vol. AES-17, N 2.

4. Liu P.T. An Optimum Approach in Target Tracking with Bearing Measurements // Optimization Theory and Applications. -1988. - Vol. 56, iss. 2. - P. 205-214.

5. Hammel S.E., Liu P.T. Hilliard E.J, Kong K.F. Optimal Observer Motion For Localization With Bearing Measurements // Computers Math. Applic. - 1989. - Vol. 18, N 1. -C. 171-180.

6. Oshman Y., Davidson P. Optimization of Observer Trajectories for Bearings-Only Target Localization // IEEE Trans. on Aerospace and Electronic Systems. - 1999. - Vol. 35, N 3. -С. 892-902.

7. Adamy D.L. EW 103: Communications Electronic Warfare. -URL: http://www.sofly.org/ebooks-list/ew-103-tactical-battle-field-communications-electronic-warfare_363ko.html (дата обращения 7.07.2015).

8. Gross F. Smart Antennas for Wireless Communications: With MATLAB. - N.-Y.: McGraw-Hill Education, Professional Engineering, 2005.

9. Godara L.C. Smart Antennas - Taylor & Francis / Electrical Engineering & Applied Signal Processing Series, 2014.

10. Goodman J.W. Introduction to Fourier Optics. - N.-Y.: McGraw-Hill, McGraw-Hill Series in Electrical and Computer Engineering: Communications and Signal Processing, 1996.

11. Bartlett M.S. An Introduction to Stochastic Processes, with Special Reference to Methods and Applications. - Cambridge: Cambridge University Press, 1978.

12. Haykin S.S. and Justice J.H. Array Signal Processing. - Prentice-Hall, Signal processing series, 1985.

13. Schmidt R.O., Multiple Emitter Location and Signal Parameter Estimation // IEEE Trans. on Antennas and Propagation. -1986. - Vol. 34. - P. 276-280.

14. Roy R. and Kailath T. ESPRIT-Estimation of Signal Parameters via Rotational Invariance Techniques // IEEE Trans. on Acoustics, Speech and Signal Processing. - 1989. - Vol. 37. -P. 984-995.

15. Rappaport T.S. Wireless Communications: Principles and Practice. - N.-Y.: IEEE Press; 1996.

16. Davis M.H.A. Lectures on stochastic control and nonlinear filtering. - Berlin - Heidelberg - N.-Y. - Tokyo: Springer Verlag, 1984.

17. Липцер Р., Ширяев А. Статистика случайных процессов. -M.: Наука, 1974.

18. Моисеев Н.Н. Элементы теории оптимальных систем. -M.: Наука, 1969.

19. Летов А.М. Динамика полета и управление. - M.: Наука, 1969.

20. Черноусько Ф.Л., Баничук Н.В. Вариационные задачи механики и управления. Численные методы. - M.: Наука, 1973.

Статья представлена к публикации членом редколлегии Е.Я. Рабиновичем.

Андреев Кирилл Владимирович — науч. сотрудник, Институт проблем передачи информации им. А.А. Харкевича РАН, г. Москва, H andreev@iitp.ru.

Аннотация научной статьи по математике, автор научной работы — Андреев Кирилл Владимирович

Похожие темы научных работ по математике , автор научной работы — Андреев Кирилл Владимирович

Текст научной работы на тему «Оптимальные траектории беспилотного летательного аппарата при слежении за подвижной целью с помощью антенной решетки»