Научная статья на тему 'Расчёт экстремалей и поиск глобально оптимальной траектории в задаче облёта препятствий'

Расчёт экстремалей и поиск глобально оптимальной траектории в задаче облёта препятствий Текст научной статьи по специальности «Математика»

CC BY
748
121
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Ученые записки ЦАГИ
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Бунаков А. Э., Гревцов Н. М., Мельц И. О., Сазонов Д. С., Тегин А. В.

Рассматривается задача расчета экстремальных по критерию безопасности траекторий летательного аппарата при облете препятствий. Считается, что траектории расположены в горизонтальной плоскости и скорость полета постоянна. Эти допущения могут быть оправданы не только для маловысотного полета, но и при других условиях полета. Время полета или расход топлива считаются ограниченными. Безопасность полета зависит от времени пребывания летательного аппарата в опасных зонах, обусловленных наличием препятствий. Расчет экстремальных траекторий основан на использовании принципа максимума. Решение двухточечной краевой задачи сводится к определению начального направления полета без использования уравнений для сопряженных переменных. Глобально оптимальная траектория определяется в результате перебора полученных экстремальных траекторий.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бунаков А. Э., Гревцов Н. М., Мельц И. О., Сазонов Д. С., Тегин А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Расчёт экстремалей и поиск глобально оптимальной траектории в задаче облёта препятствий»

Том XXXIII

УЧЕНЫЕ ЗАПИСКИ ЦАГИ 20 0 2

№ 3—4

УДК 629.7.015

РАСЧЕТ ЭКСТРЕМАЛЕЙ И ПОИСК ГЛОБАЛЬНО ОПТИМАЛЬНОЙ ТРАЕКТОРИИ В ЗАДАЧЕ ОБЛЕТА ПРЕПЯТСТВИЙ

А. Э. БУНАКОВ, Н. М. ГРЕВЦОВ, И. О. МЕЛЬЦ,

Д. С. САЗОНОВ, А. В. ТЕГИН

Рассматривается задача расчета экстремальных по критерию безопасности траекторий летательного аппарата при облете препятствий. Считается, что траектории расположены в горизонтальной плоскости и скорость полета постоянна. Эти допущения могут быть оправданы не только для маловысотного полета, но и при других условиях полета. Время полета или расход топлива считаются ограниченными. Безопасность полета зависит от времени пребывания летательного аппарата в опасных зонах, обусловленных наличием препятствий.

Расчет экстремальных траекторий основан на использовании принципа максимума.

Решение двухточечной краевой задачи сводится к определению начального направления полета без использования уравнений для сопряженных переменных. Глобально оптимальная траектория определяется в результате перебора полученных экстремальных траекторий.

Задача оптимального облета или преодоления опасных зон является, как известно, одной из труднейших в прикладной теории оптимального управления, особенно, когда таких зон достаточно много. Основная особенность этой задачи — возможность существования многочисленных локально оптимальных траекторий. Простой иллюстрацией этого является задача «оптимального» маловысотного полета над холмистой местностью, когда требуется облет рельефа.

В задаче оптимального облета или преодоления опасных зон возникает аналогичная ситуация. Среди возможных траекторий желательно найти самую безопасную, к тому же с минимальным расходом топлива. То есть задача становится двухкритериальной, но с приоритетом безопасности, если расход топлива не является лимитирующим фактором.

В связи с трудностями нахождения оптимального маршрута нужно иметь в виду следующее:

формальная постановка оптимизационной задачи требует упрощенного описания взаимодействия между опасными зонами и летательным аппаратом (ЛА), в противном случае использование каких-либо регулярных методов оптимизации становится практически неосуществимым;

возможность существования многих локально оптимальных траекторий превращает эту задачу в сложную вычислительную проблему, для решения которой требуется создание или использование некоторых достаточно конструктивных схем расчета экстремалей с их последующим целенаправленным перебором;

требуются упрощения уравнений движения, без которых расчет этих экстремалей и их сортировка с учетом двух критериев становится серьезным барьером на пути решения задачи.

Итак, возможные маршруты оцениваются по двум критериям: безопасность полета и время полета или расход топлива. Предполагается, что скорость полета постоянна, а границы опасных

зон имеют малую кривизну и в связи с этим траектории мало искривлены. Поэтому критерии времени полета из начальной точки в конечную, длина траектории и расход топлива практически идентичны и отличаются лишь множителями.

Математической основой для решения задачи является принцип максимума Понтрягина. Известно, что использование принципа максимума в общем случае требует решения двухточечной краевой задачи.

Принятый подход позволяет свести решение двухточечной краевой задачи к перебору начального направления полета без использования уравнений для сопряженных переменных с использованием полученного в работе уравнения для изменения угла пути на экстремали. Однако этим вычислительные трудности полностью не преодолеваются, так как необходимо найти все экстремали, приходящие в заданную конечную точку, с последующим их перебором с учетом обоих критериев для нахождения глобального оптимума. Кроме того, результаты расчетов оказываются очень чувствительными к начальным условиям, в особенности, когда количество опасных зон достаточно велико. Эта высокая чувствительность, по-видимому, является свойством, присущим рассматриваемой задаче.

В связи с рассматриваемой задачей следует отметить работы [1] — [6], в которых также указываются трудности решения подобных задач.

1. Постановка задачи. Повторим постановку задачи, которая была сформулирована выше: требуется определить оптимальную траекторию между двумя точками на плоскости, которая обеспечивает максимальную безопасность при заданном ограничении на время полета, или дальность, или расход топлива. Метод расчета такой траектории имеет тесную связь с определением оптимального маршрута при его заданной продолжительности. В этом и следующем пунктах рассматривается именно эта задача. К первоначальной постановке задачи мы вернемся при рассмотрении процедуры построения экстремальных траекторий и процедуры их перебора для нахождения возможных решений задачи. Имеется в виду вариация ограничения на время полета и построение множества Парето как наиболее полное решение задачи.

Будем рассматривать так называемое простое движение на плоскости с координатами х, у, когда управляющей переменной или управлением является направление движения, задаваемое углом пути % [7].

Уравнения движения имеют вид

х = Усс®х, у = Рвтх, (1)

где V — скорость движения, которая полагается постоянной.

Задаются начальные и конечные условия:

х(0) = Х0, у(0) = у0, х(^ ) = хг, у(гг) = уг, (2)

где ^ = Т — заданное время полета.

Координаты х, у можно рассматривать как компоненты вектора х, а траекторию или маршрут можно обозначить как |х(/)}-

Необходимо отметить, что длина траектории связана со временем полета:

ь== гт.

По этой причине с позиций постановки и решения задачи ограничения на время и длину траектории могут рассматриваться как эквивалентные.

Задача с заданным временем процесса может быть сведена к задаче со свободным временем при помощи следующего известного приема. Дополнительно к переменным х, у вводится

фазовая переменная т, которая удовлетворяет уравнению

т = 1. (3)

Начальные и конечные значения для переменной т имеют вид:

т( 0) = 0, т(у ) = Т.

(4)

Таким образом, условие на время окончания процесса заменено условием на конечное значение фазовой переменной т и формально время окончания процесса является свободным.

На участок траектории, находящийся в опасной зоне, налагается штраф, пропорциональный времени нахождения ЛА в зоне и степени исходящей от этой зоны опасности. Последняя для каждой 7-й зоны определяется гладкой неотрицательной функцией:

При наложении зон их степени опасности (5) суммируются. Таким образом, каждой точке

где суммирование проводится по всем зонам, содержащим точку х.

Тогда любая траектория [х(/)|, с точки зрения безопасности, может быть оценена функционалом

Замечание. Введенную здесь степень опасности qi (х) можно интерпретировать как функцию потока вероятности гибели ЛА. Тогда формула

будет определять вероятность гибели ЛА на траектории |х(/)}-

В задаче требуется найти траекторию х = х(1), которая обеспечивает минимум функционала (6) при заданной величине Т. Очевидно, что Т не может быть меньше, чем время полета по прямой между начальной и конечной точками, и не должна превышать время, необходимое для безопасного облета всех зон, если это возможно.

Итак, постановка задачи с использованием введенных выше обозначений и соотношений может быть записана в следующей компактной форме:

Чі=Чі(х), і = 1,-,М

(5)

—* т

х = (х, у) соответствует степень опасности

(6)

0

р = Р(2) = 1 - е

0

(7)

х = Усоз%, х(0) = х0, х(Уу) = Ху, у = У$ ІПХ, У(0) = Уо, у((г) = уг, х = 1, т(0) = 0, х {^^ = Т, ^

(8)

У

Величина Т может быть записана в виде функционала

У

Т =|

который можно использовать как изопериметрическое условие в постановке задачи, по форме отличной от (8).

2. Необходимые условия для нахождения оптимальной траектории. Рассмотрим необходимые условия оптимальности для задачи (8) в форме принципа максимума.

Расширенный функционал для этой задачи можно записать в стандартной форме

которые подбираются так, чтобы выполнялись заданные на правом конце траектории условия для фазовых координат. Из (9) следует стандартная для подобного рода задач форма записи гамильтониана

При этом на оптимальной траектории для рассматриваемой автономной системы при свободном времени окончания процесса выполняется равенство

Необходимые условия минимума наряду с (11) включают в себя следующее: уравнения движения и краевые условия для них (1), (2), (3), (4);

уравнения для сопряженных переменных и условия трансверсальности, которые связывают сопряженные переменные и фазовые координаты на правом конце траектории.

Необходимые условия оптимальности вместе с (10) описывают двухточечную краевую задачу, которая имеет вид

Две последние строки в (12) содержат уравнения для сопряженных переменных и условия трансверсальности.

Для решения поставленной двухточечной краевой задачи необходимо подобрать постоянные рх, ру, рх так, чтобы в результате интегрирования прямой и сопряженной систем в

обратном времени при определении управления из условия минимума гамильтониана (10) были выполнены начальные условия на фазовые переменные. Решение может быть получено также путем подбора параметров рх (0), ру (0), А,х и интегрирования прямой и сопряженной систем в

прямом времени таким образом, чтобы выполнялись конечные условия, накладываемые на фазовые переменные.

Необходимо отметить, что значение Хх (или рх) должно удовлетворять условию

'/

^ | (б + Рх (^соэх - х) + ру (Vвіпх -у)+х^ (1 - х))л +

0

+ Рх (* (і/)-х/ ) + Ру (У (і/)-У/ ) + Рх(х(і/)-Т),

(9)

где Рх = Рх (і), Ру = Ру (іX ^х — сопряженные переменные; Рх, ру, рх —

множители Лагранжа,

Н = рхУ сое х + РуУ кт х + б + ^х •

(10)

Н = 0.

(11)

тіп Н = 0,

(12)

Рх (і/ ) = Рх, Ру (і/ ) = Ру, ^х=Рх •

Ях> 0.

Это связано с тем, что на оптимальной траектории

х =-dJ

х dT ’

а из физического смысла задачи следует, что на оптимальной траектории производная в правой части этого равенства должна быть отрицательной. Это утверждение является следствием того, что увеличение допустимого времени полета приводит к возможности выбора более безопасной по критерию (6) траектории.

3. Управление на оптимальной траектории. Поскольку на управление % не

накладывается ограничений, одно из условий оптимальности имеет вид

H%=- pxV sin % + pyV cos % = 0, (13)

откуда следует, что оптимальное управление удовлетворяет условию

tg % = pL. (14)

Px

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Но это не дает решения задачи, поскольку требует знания сопряженных переменных. Решение системы уравнений (11), (13) относительно px и ру дает следующий результат:

Q + Я. Q + Я. . , ,

Рх =---------— c0s % Ру =------------------------— sin %. (15)

Используя (15) для расчета второй производной гамильтониана по управлению, из (13) получим

H%z=-PxV c0s %- PyVsin % = (Q + Ях) c0s2 % + (Q + Ях) sin2 % = Q + ЯХ > 0 (16)

так как Q > 0 и Ях > 0. Условие (16) является одним из достаточных условий минимума [8].

Дифференцируя (14), с использованием уравнений для сопряженных переменных из (12) и соотношений (15) можно получить следующее дифференциальное уравнение для расчета оптимального управления:

х=-

V (80 80 . л

— cos 1——sinx

Q + \ I 8у 8х

(17)

Применение этого уравнения позволяет производить расчет экстремалей без использования сопряженных переменных.

Если задать начальное значение угла пути %о и некоторое значение Хх и проинтегрировать систему (1) совместно с (17), можно получить некоторую экстремаль, в общем случае не удовлетворяющую конечным условиям. Для решения задачи (8) необходимо подобрать соответствующие значения параметров %о, А,х.

Особенность рассматриваемой задачи заключается в том, что может существовать не единственная пара значений %о, А,х, обеспечивающая решение задачи (8), т. е. может существовать несколько локально оптимальных траекторий. Если все они найдены, то остается выбрать из них траекторию с наименьшим значением функционала 3. Однако на практике оказывается, что нахождение именно всех локально оптимальных траекторий представляет собой непростую в вычислительном отношении задачу.

4. Процедура нахождения решения. В соответствии с исходной постановкой задачи требуется определить глобально оптимальную траекторию полета из заданной начальной в заданную конечную точку, которая обеспечивает максимальную безопасность при заданном ограничении на время полета

гг = т < т

(18)

В предлагаемой процедуре нет необходимости решать задачу (8) для всех возможных Т, удовлетворяющих условию (18), а затем выбирать оптимальную траекторию, дающую глобальный минимум функционалу 3. Процедура основана на том, что любая исходящая из начальной точки х0, Уо траектория, управление на которой определяется в соответствии с (17) при некотором значении Хх, является экстремалью. Любая точка на этой экстремали может рассматриваться в качестве конечной, а полученное время считаться заданным. Если эта точка совпадает с х^, у^, а время Т = ^ удовлетворяет условию (18), полученная экстремаль в общем

случае является локально оптимальной траекторией. При интегрировании уравнений (1) и (17) необходимо рассчитывать и функционал (6) (или (7)), значение которого является решающим при выборе глобально оптимальной траектории.

Нахождение всех оптимальных траекторий следовало бы производить для всех значений

Ях ^ шш, Ях тах • (19)

Здесь А,х т;п — минимальное значение сопряженной переменной Хх, которое определяется

конфигурацией и расположением опасных зон и ограничением на время полета (18), и Хх тах —

максимальное значение сопряженной переменной Хх, при котором оптимальная траектория является практически прямолинейной, т. е. угловая скорость (17) близка к нулю.

На практике берется конечное число значений Хх из интервала (19), и для каждого из них находятся, в пределах точности вычислительных процедур, все оптимальные траектории, которые определяются начальным значением угла пути %0 •

Для численного нахождения локально оптимальной траектории использовалась зависящая от /о функция «пролета» к, определяющая минимальное расстояние траектории [х(/)|, полученной интегрированием системы уравнений (1), (17) при начальных условиях (2), от конечной точки. Причем знак «пролета» определяется направлением ее облета.

К отмеченным выше вычислительным трудностям добавляется еще и то, что заранее нельзя сказать, какое количество локально оптимальных траекторий существует в каждом конкретном случае. Это количество зависит как от конкретной постановки задачи, так и от значения Хх.

Результаты расчетов локально оптимальных траекторий могут быть представлены в виде графиков или таблиц, пример которых приведен ниже.

В последний столбец такой таблицы вместо времени могут быть занесены значения путевой дальности или расхода топлива, вычисленного путем отслеживания экстремали с использованием уравнений, описывающих движение ЛА.

Для нахождения глобально оптимальной траектории решается задача

Шп (Зг\Т < Тшах J *, Т *,

1 < г < 5

которая сводится к простому перебору результатов, приведенных таблице. Если в результате перебора найдены двe или более пар (А,х, х0), обеспечивающих наименьшее

значение функционала 3, то из них выбирается пара с наименьшим значением Т.

В приведенных ниже примерах каждая опасная зона задается двумя концентрическими окружностями. Во внутреннем круге функция (х), характеризующая степень опасности, принимается постоянной. Между внутренней и внешней окружностями значение функции падает

Номер экстремали (^ Хо) Jl Т

1 (^х, Х0 )1 Jl Т

2 (^х, Х0)2 ^2 т2

3 (^х, Х0 )з J 3 Тз

* * * *

* * * *

* * * *

5 (^х> Х0 )5 '^8 Т8

до нуля гладким образом. Однако изложенный подход может применяться для задач поиска оптимального маршрута при наличии опасных зон произвольной формы. Главное, чтобы описывающие степень их опасности функции были гладкими.

5. Примеры. На рис. 1 для одной опасной зоны показаны локально оптимальные траектории для некоторого значения Хх. В данном случае таких траекторий пять. Отметим, что для дру-

Рис. 1. Простейший пример — пять экстремалей

гих значений Хх может быть три локально оптимальных траектории или даже одна. Последний случай реализуется при большом значении Хх. На рис. 1 тонирование зоны определяется функцией, характеризующей степень опасности.

Функция «пролета» к для рассматриваемого примера приведена на рис. 2. Даже для этого простейшего примера видна большая чувствительность функции к начальному углу %о в окрестности значений ± 24°. Поэтому для решения поставленной задачи требуется эффективный алгоритм поиска нулей одномерной функции.

Л,км

0 -а 0 0 ( 1 0 2

! -266—

Рис. 2. Зависимость «пролета» от начального угла пути

На рис. 3 приведены некоторые результаты расчета задачи преодоления трех круговых зон. Здесь сценарий является симметричным относительно линии, проходящей через начальную и конечную точки. На рисунке для различных значений Хх показана только часть локально оптимальных траекторий, проходящих выше оси симметрии. Очевидно, что существуют и оптимальные траектории, симметричные приведенным. Следует отметить, что некоторые

траектории

с высокой точностью прилегают к дугам на границах зон, что соответствует практически безопасному облету этих зон.

Иногда с целью анализа возможных решений необходимо решить задачу не для одного значения Тпах> а для нескольких. В этом случае полезно построить множество Парето для заданного диапазона ограничений. Напомним, что ограничения могут накладываться не только на время полета, но и на дальность, и на расход топлива. Множество Парето можно построить по резуль-

100500-50-

-100-

Рис. 3. Локально оптимальные траектории при преодолении трех опасных зон

татам, предварительно занесенным в таблицы вида, приведенного выше. Сначала находится строка с минимальным значением Т. Значение T присваивается переменной T1.

Соответствующее значение J присваивается переменной J1.

Затем находится строка с минимальным значением Т, не меньшим, чем T1, в которой

значение функционала J меньше J1. Таким образом получаем точку T2, J2. Последующие

строки для построения множества Парето определяются в соответствии с правилом

Tj min T\Jt < Jj, j = 3,4,...

T > Tj 1

Величине Jj присваивается значение J в найденной строке. Если в таблице имеется несколько строк с одинаковым значением T, из них выбирается строка с наименьшим J.

Аналогичным образом может быть построено множество Парето для случаев, когда в качестве ограничений принимается дальность полета или располагаемый запас топлива.

На рис. 4 построено множество Парето для сценария, изображенного на рис. 3, в случае ограничения на дальность полета.

J

0,3 0,25

0,2

0,05 0 V

\

360 370 380 390 400 410 L. км

Рис. 4. Множество Парето в задаче с тремя опасными зонами

Следует отметить, что зависимость функционала J от ограничения, соответствующая множеству Парето, может изменяться скачком. Такой скачок виден на рис. 4 при L = 405 км и L = 409 км. Кроме того, может существовать диапазон значений ограничения, в котором его увеличение не приводит к уменьшению функционала.

Результаты расчетов позволяют сделать следующие выводы.

1. Использование полученного в работе уравнения для оптимального изменения угла пути позволило организовать быстродействующую вычислительную процедуру для расчета экстремалей, поиска локально оптимальных траекторий и последующего нахождения глобального оптимума.

2. Рассмотренные примеры подтверждают конструктивность предложенного подхода к поиску глобального экстремума.

3. Выявлена высокая чувствительность результатов расчетов к начальному углу пути что требует проведения исследований по возможности уменьшения этой чувствительности.

ЛИТЕРАТУРА

1. Jonh L. Vian, John R. Moore. Trajectory optimization with risk minimization for military aircraft//AIAA Guidance, Navigation and Control Conference. — 1987. Vol. 2.

2. S i l b e r t M. Comparison of the event-step algorithm to other path planning methods to avoid dynamic 3D obstacles//AGARD-CP-504.— 1992.

3. Бунаков А. Э. Комбинаторный метод прокладки оптимального маршрута//ТВФ.— 1995, № 5 — 6.

4. Бунаков А. Э., Гревцов Н. М., М е л ь ц И. О. Оценка безопасности маршрута летательного аппарата//Депонированные рукописи ВИНИТИ.— 1997. № 280-В97.

5. Данеев А. В., Куменко А. Е., Русанов В. А. Геометрический подход к выбору траектории экраноплана с учетом опасных препятствий на маршруте//Авиационная техника.— 1995.

6. Бунаков А. Э., Гревцов Н. М., Мельц И. О., Мирный Д. С., Михай -лов В. Н., Чанов О. В. Об одной многоэкстремальной задаче оптимизации траектории летательного аппарата//Депонированные рукописи ВИНИТИ.— 1998, № 596-B98.

7. Isaacs R. Differential games//John Wiley and Sons, Inc.— 1965.

8. Bryson A. E., Yu-Chi Ho. Applied optimal control//Blaisdell publishing Company.— 1969.

Рукопись поступила 22/V 2002 г.

93

i Надоели баннеры? Вы всегда можете отключить рекламу.