Научная статья на тему 'ОПТИМИЗАЦИЯ МАРШРУТОВ НЕПРЕРЫВНО-ДИСКРЕТНОГО ДВИЖЕНИЯ УПРАВЛЯЕМЫХ ОБЪЕКТОВ ПРИ НАЛИЧИИ ПРЕПЯТСТВИЙ'

ОПТИМИЗАЦИЯ МАРШРУТОВ НЕПРЕРЫВНО-ДИСКРЕТНОГО ДВИЖЕНИЯ УПРАВЛЯЕМЫХ ОБЪЕКТОВ ПРИ НАЛИЧИИ ПРЕПЯТСТВИЙ Текст научной статьи по специальности «Математика»

CC BY
76
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Труды МАИ
ВАК
Область наук
Ключевые слова
НЕПРЕРЫВНО-ДИСКРЕТНОЕ ДВИЖЕНИЕ / МИНИМИЗАЦИЯ ПЕРЕКЛЮЧЕНИЙ / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / БЫСТРОДЕЙСТВИЕ

Аннотация научной статьи по математике, автор научной работы — Бортаковский Александр Сергеевич, Урюпин Илья Вадимович

В статье рассматриваются задачи планирования и оптимизации маршрутов плоского движения модели летательного аппарата при наличии препятствий. На этапе планирования разрабатывается оптимальный по быстродействию маршрут непрерывно-дискретного движения по заданной карте в обход имеющихся препятствий. При этом на основе достаточных условий минимизируется количество поворотов траектории и время достижения цели. На втором этапе запланированная траектория используется в качестве опорной для модели Маркова - Дубинса движения летательного аппарата и оптимизируется на основе необходимых условий оптимальности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бортаковский Александр Сергеевич, Урюпин Илья Вадимович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ROUTES OPTIMIZATION OF CONTINUOUS-DISCRETE MOVEMENT OF CONTROLLED OBJECTS IN THE PRESENCE OF OBSTACLES

The objective of the research consists in developing techniques for optimal routes forming of the aircraft flat motion in the presence of obstacles. The problems of aircraft control routes planning and optimizing are being studied currently with increasing intensity. The relevance of these studies is determined by the need for effective automated control of unmanned aerial vehicles (UAV) for various purposes. The article regards the models of the flat motion of control objects along the specified map with obstacles with various quality functionals. The map represents a connected graph, which arcs correspond to the continuous movements of the object, its vertices correspond to the discrete changes of its state (switches), and the path connecting several vertices of the graph describes the continuous-discrete nature of the motion trajectory. The first section considers the control object movement along the rectangular grid. The movement between two grid nodes is either uniform of uniformly accelerated. The movement direction changing in the grid nodes (turn) is considered to be switching. A number of the grid nodes is inadmissible for the movement due to the obstacles contained in them. The problem on minimizing the number of switches, response time or response time with account for the number of switches is being set. The second section solves the problem on the flat movement optimization of the unmanned aerial vehicle (UAV). The Markov-Dubins model was selected as the model of motion. The feature of the response time problem consists in the presence of intermediate conditions, i.e. the points on the map, through which the UAV trajectory should pass. This problem is being reduced to solving an aggregate of Markov-Dubins problems with additional finite-dimensional minimization. The third section combines the two problems discussed previously in the first two sections. The UAV rational trajectory is being formed in two stages. Initially, the optimal polyline, i.e. the trajectory of movement on the rectangular grid with obstacles, is being synthesized. Then, the optimal Markov-Dubins trajectory is being built “atop” this polyline, and the vertices of the polyline serve as intermediate points for the UAV trajectory. The result of this work is algorithms, allowing build rational routes of the UAV's flat movement with many obstacles, such as in the city. It is difficult to solve the optimal control problem under such phase restrictions. Thus, application of the proposed rational control patterns seems righteous.

Текст научной работы на тему «ОПТИМИЗАЦИЯ МАРШРУТОВ НЕПРЕРЫВНО-ДИСКРЕТНОГО ДВИЖЕНИЯ УПРАВЛЯЕМЫХ ОБЪЕКТОВ ПРИ НАЛИЧИИ ПРЕПЯТСТВИЙ»

УДК 519.977 DOI: 10.34759/trd-2020-113-17

Оптимизация маршрутов непрерывно-дискретного движения управляемых объектов при наличии препятствий

Бортаковский А.С.*, Урюпин И.В.**

Московский авиационный институт (национальный исследовательский университет), МАИ, Волоколамское шоссе, 4, Москва, А-80, ГСП-3, 125993, Россия

*e-mail: asborlakov@mail. ru **e-mail: uryupm93@yand.ex.ru

Статья поступила 20.07.2020

Аннотация

В статье рассматриваются задачи планирования и оптимизации маршрутов плоского движения модели летательного аппарата при наличии препятствий. На этапе планирования разрабатывается оптимальный по быстродействию маршрут непрерывно-дискретного движения по заданной карте в обход имеющихся препятствий. При этом на основе достаточных условий минимизируется количество поворотов траектории и время достижения цели. На втором этапе запланированная траектория используется в качестве опорной для модели Маркова - Дубинса движения летательного аппарата и оптимизируется на основе необходимых условий оптимальности.

Ключевые слова: непрерывно-дискретное движение, минимизация переключений, оптимальное управление, быстродействие.

Введение

Различные задачи планирования и оптимизации маршрутов управления летательными аппаратов (ЛА) исследуются в настоящее время с нарастающей интенсивностью. Актуальность этих исследований определяется необходимостью автоматического управления беспилотными летательными аппаратами разного назначения. Задачи оптимального управления возникают в процессе предполетного планирования действий смешанных групп пилотируемых и беспилотных ЛА (см. обзор в [1-3]). Вопросы быстродействия при боевом применении ударных ЛА имеют решающее значение.

Задачи планирования маршрутов движения ЛА, как правило, решаются на плоскости. При оптимизации распределения целей используются методы математического программирования [4,5], в некоторых случаях [6] - линейное целочисленное программирование. Траектории ЛА обычно представляются ломаными. При отклонении от источников потенциальных угроз (пунктов противовоздушной обороны противника) траектории строятся [7,8] при помощи диаграмм Вороного или триангуляции Делоне. Критерием качества управления в этих работах служит расход топлива (пропорциональный протяженности маршрута) и/или риск уничтожения ЛА зенитно-ракетным комплексом противника. Описание плоских траекторий движения ЛА дифференциальными уравнениями применяется

при планировании маршрутов [9], в задачах адаптивного управления [10,11], в частности, при управляемом движении за лидером [12,13].

Для оптимизации траекторий ЛА, описываемых дифференциальными уравнениями, применяются различные методы: переход к дискретной задачи оптимального управления и ее решение с использованием принципа максимума [1], вариационные принципы [14], метод динамического программирования [15]. Для разных моделей БЛА методы синтеза разработаны в [16,17].

В настоящей статье рассматривается движение объектов управления по заданной карте маршрутов. Карта представляет собой связный граф, дуги которого соответствуют непрерывным перемещениям объекта, вершины - дискретным изменениям его состояния (переключениям), а путь, соединяющий несколько вершин графа, описывает непрерывно-дискретный характер траектории движения. К таким картам, например, относится схема движения пассажиров в метро, на которой вершинами графа обозначаются станции, а дугами - перегоны. Пересадка из одного поезда в другой является переключением. Другим примером служит карта пассажирских авиаперевозок, на которой вершины графа - это аэропорты, а дуги -маршруты перелета. Пересадка пассажиров или дозаправка топливом на аэродроме являются переключениями.

Наличие переключений, прерывающие непрерывное движение объекта управления, является важной особенностью рассматриваемых карт. Подчеркивая это обстоятельство, будем говорить о карте маршрутов непрерывно-дискретного

движения. Например, карту автомобильных дорог без указания переключений нельзя считать схемой непрерывно-дискретного движения. Если же на этой карте планировать, например, только дальние грузоперевозки, считая переключениями погрузочные или разгрузочные работы, прохождение пограничного и таможенного контроля, отдых водителя или его смену, заправку и т.п., то непрерывно-дискретный характер движения становится очевидным.

На рассматриваемых картах можно ставить разные задачи оптимизации. Наиболее востребованными являются задачи оптимизации терминальных маршрутов, связывающих заданные начальное и конечное состояние. Например, задачи минимизации длины пути, времени передвижения, затрат топлива, стоимости перевозки и другие логистические задачи. При планировании маршрутов движения ЛА военного назначения на первый план выходят задачи быстродействия, скрытности, координации взаимодействий по времени и на местности.

Математическая постановка задачи кроме описания карты маршрутов должна включать модели непрерывного движения и переключений системы управления, функционал качества. В настоящей статье рассматриваются разные модели плоского движения переключаемой системы (ПС) с разными функционалами. В первом разделе исследуется передвижение объекта управления по прямоугольной сетке. Движение между узлами сетки равномерное. Изменение направления движения в узлах сетки (поворот) считается переключением. Часть узлов сетки недопустима для передвижения - в них находятся препятствия. Ставятся задачи минимизации

переключений, быстродействия или быстродействия с учетом количества переключений. Для решения этих задач применяются достаточные условия оптимальности переключаемых систем [ 18].

Во втором разделе рассматривается задача оптимизации плоского движения беспилотного летательного аппарата (БЛА). В качестве модели движения выбрана модель Маркова - Дубинса [19,20]. Особенностью задачи быстродействия является наличие промежуточных условий - точек на карте, через которые должна проходить траектория БЛА. Эта задача сводится к решению совокупности задач Маркова -Дубинса с дополнительной конечномерной минимизацией.

В третьем разделе объединяются обе задачи, рассмотренные в первых двух разделах. Рациональная траектория движения БЛА формируется в два этапа. Сначала синтезируется оптимальная ломаная - траектория движения на прямоугольной сетке с препятствиями. Затем "поверх" этой ломаной строится оптимальная траектория Маркова - Дубинса, причем вершины ломаной служат промежуточными точками для траектории БЛА.

Предлагаемые в статье алгоритмы позволяют разрабатывать рациональные маршруты плоского движения БЛА при многочисленных препятствиях, например в городе. Задачу оптимального управления при таких фазовых ограничениях решить трудно. Поэтому применение предлагаемых рациональных управлений кажется оправданным. Окончательное решение, разумеется, остается за практиками.

1. Планирование маршрутов на прямоугольной сетке

Постановки задач. Рассматривается движение объекта управления на координатной плоскости. Пути передвижения (карта маршрутов, сеть) образованы целочисленной решеткой, т.е. прямыми, параллельными координатным осям, причем точки пересечения этих прямых (узлы решетки) имеют целые координаты. В

этих точках возможно изменение направления движения. Поворот на 90° (в любом направлении) считается переключением системы. Допустимы многократные переключения. Например, полный разворот кругом реализуется двумя последовательными переключениями. Некоторые узлы закрыты для проезда препятствиями. Цель управления состоит в перемещении объекта из заданного начального состояния в место назначения в обход препятствий.

Описанная задача представляет в упрощенном виде систему управления движением погрузчика на складе, в библиотеке и т.п. Погрузчик перемещается по дорожкам между стеллажами (контейнерами, полками и т.п.). Пути передвижения образуют сеть. Прямолинейное движение чередуется с поворотами, которые считаются переключениями. Повороты происходят в узлах сети (на развилках и перекрестках). Некоторые дорожки (или узлы сети) закрыты для проезда препятствиями (грузами, неразмещенными на стеллажах, другими погрузчиками и т.п.). Цель управления состоит доставке груза из заданного начального положения в место назначения в обход препятствий.

Пусть на промежутке времени [0,T] динамическая система совершает N

переключений (скачков) в моменты времени t. , i = 1,...,N, образующие конечную неубывающую последовательность T = ,..., ^}:

0 < ti < ... < Ín < ÍN+i = T . (1.1)

Равенство последовательных моментов в (1.1) означает, что система совершает мгновенные многократные переключения.

Между неравными последовательными моментами переключений состояние системы изменяется непрерывно, согласно дифференциальным уравнениям:

x(t) = V cos y(t), y (t) = V sin y(t), y (t) = 0, (1.2)

В этих уравнениях: t eTf = [t,,t-, i e N = (i = 0,1,..., N|t- < t-j} -множество

номеров ненулевых (по длине) частичных промежутков T прямолинейного

движения системы; x(t), y(t) - прямоугольные координаты положения объекта в

момент времени t eT; V - модуль скорости движения. Угол y(t) наклона

траектории к оси абсцисс имеет значение, кратное л /2, и не меняется при непрерывном движении. Управление непрерывным движением системы отсутствует.

В момент переключения происходит мгновенное изменение направления движения на величину л /2. При этом повороте угол наклона траектории изменяется согласно рекуррентному уравнению

Л

Чг =Уг - + 2 V , г = X , (1.3)

В уравнении (1.3): V - управление, задающее направление поворота, V- е{+1}; У = у(^-) - величина угла наклона траектории сразу после г -го переключения, а у._ - величина угла непосредственно перед г -м переключением:

У г _ =

ЧЪ _ 0), _1 <

У г _1 ' <г _1 = <г ■

Прямоугольные координаты при повороте не меняются, т.е. х. = х._, у. = у._.

На сетке заданы запрещенные позиции (препятствия), в которых объект

2

управления не может находиться. Обозначим через М множество допустимых узлов сетки, через которые возможно движение объекта управления. Тогда дополнение М будет описывать препятствия. Начальное состояние системы задано

х(0) = х0, У(0) = У0, У(0) = У 0,

причем координаты х0, у0 - целочисленные, а величина угла у0 кратна л /2. Терминальные условия

х(Т) = хт, у(Т) = ут

определяют момент Т окончания процесса управления. Здесь (хт, ут) -целочисленные координаты цели. Направление движения у(Т) в момент

<

достижения цели не существенно. Начальное (х0,у0) и конечное (хт,ут)

положения системы, разумеется, допустимые, т.е. принадлежат M.

Движение рассматриваемой модели управляется при помощи поворотов, т.е. заданием функции v(-): T ^ {+1}. Допустимые траектории представляют собой

ломаные, соединяющие начальное и конечное состояние системы и принадлежащие M. Управление считаем допустимым, если оно порождает допустимую траекторию. Множество допустимых программных управлений обозначим через V . Подчеркнем, что количество N =| T | = | v(-) | переключений и моменты переключений (1.1) не фиксированы и у разных допустимых процессов могут не совпадать.

В задаче минимизации количества переключений требуется найти допустимое управление с минимальным количеством переключений:

N * = min | v(-) |. (1.4)

v(-)eV

В задаче быстродействия требуется найти допустимое управление, минимизирующее время достижения цели

T* = min T . (1.5)

v(-)eV

В задаче условного быстродействия требуется найти управление с фиксированным количеством переключений N , минимизирующее время достижения цели:

T* = min T. (1.6)

N v(-)eV ^

Здесь V N - множество допустимых управлений, имеющих ровно N переключений.

В задаче быстродействия с минимальным количеством переключений

требуется найти условное по быстродействию управление с наименьшим количеством переключений:

T* = min T. (1.7)

N v(-)eV *

N *

Задача быстродействия с ограничениями скорости движения и ускорения.

В задачах (1.4)-(1.7) непрерывное движение объекта управления неуправляемое, а скорость - постоянная. Изменим модель (1.2), дополняя ее уравнением изменения скорости движения

x(t) = V(t)cos y(t), y(t) = V(t)sin y(t), у(t) = 0, V(t) = u(t). Здесь u(t) - ускорение, ограниченное по модулю | u(t) | < ^ . Линейную скорость V(t) движения будем считать также ограниченной: V(t) < V^^ . Предполагаем, что повороты выполняются только при нулевой скорости движения V(t) = 0, причем

время поворота на угол 90° равняется AT. Роль управления непрерывным движением играет ускорение u(-). Множество допустимых управлений U включает такие кусочно-непрерывные управления u(-): [0, T] ^ [- ^, ^ ], при которых не нарушается ограничение скорости V(t) < V^^ . Качество допустимого управления оценивается функционалом

T (u(-), v(-)) = T + NAT,

в котором кроме времени T кусочно-непрерывного движения учитывается время, затраченное на повороты.

Требуется найти допустимые управления u(-) и v(-), при которых время

движения с учетом поворотов минимальное

*

T = min T (u(-), v(-)).

(u(- ),v(- ))eü xV

Решение задачи минимизации количества переключений. Синтез позиционного управления, минимизирующего количество переключений, получаем на основе достаточные условия оптимальности [18]. Пусть s(x, y, у) - функция цены, равная минимальному количеству поворотов траектории, исходящей из состояния (x, y, у) и попадающей в цель (x^, yj,) ; s^ (x, y, у) — образующая функции

цены, равная либо количеству поворотов k , траектории соединяющей состояние (x, y, у) с целью (x^, y^), либо , если такой траектории не существует. Введем

двухпозиционную функцию достижимости S(x, y, у | x, y), равную нулю, если существует допустимая траектория без переключений, приводящая систему из состояния (x, y, у) в положение (x, y). В противном случае S(x, y, у | x, y) = +да. Отметим, что эта функция находится просто. Если отрезок от стартовой точки (x, y) до прицельной точки (x, y) принадлежит лучу:

x(t) = x + tV cos у, y(t) = y + tV sin у, t > 0, (1.8)

и содержит только допустимые узлы из M, то S (x, y, у | x, y) = 0, иначе

S (x, y, у | X, y) = . Направление движения у в прицельной точке должно совпадать

с направлением у, так как переключений нет. Поэтому у не указывается в

аргументах функции S(x, y, у | XX, y).

Запишем уравнения для образующих функции цены. Нулевая образующая находится по двухпозиционной функции достижимости

s0( x ^ у) = S (x, y, у| xF, yF).

Остальные образующие удовлетворяют рекуррентному уравнению

sk(x,y,у) = min {S(x,y,у | xx,y) + min s, i(x,y,у + -^v) +1}, к = 1,2,... (1.9)

k (x,y)eM ve{±1} к 1 2

В процессе решения уравнений (1.9) находится условное оптимальное позиционное управление

vk (x, y, у) = arg min sk-1(x, y, у + f v). (1.10)

ve{±1} 2

Минимальное количество переключений N* определяется по образующим функции цены

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N* = min sk(Xo,Уo,у0),

keZ +

где Z+ - множество целых неотрицательных чисел.

Численное решение задачи проводится на ограниченной сетке M. При этом операцию минимизации по узлам сетки в уравнении (1.1 0) можно выполнить

простым перебором. Для сеток с большим количеством узлов необходимо использовать методы целочисленной минимизации.

На рис. 1 показаны оптимальные траектории с наименьшим количеством поворотов на сетке размеров 10 х 10 при следующих значениях параметров:

х0 = 7, = 10, у0 = л / 2, = 5, ут = 1.

(111)

Препятствия на сетке отмечены "крестиками", начальное состояние представлено треугольником, конечное состояние - квадратом. Оптимальные по количеству переключений траектории представлены двойной штриховой (а) и пунктирной (в) линиями, направление движения отмечено стрелками. Минимальное количество переключений равно пяти.

10 9 8 7 6 5 4 3 2 1

О

У

г

= =а - А

ж ж ж х х

б

в X X

X X X X X X

N = 5 Т = 19

N = 7 Т = 13

|| о о о о

И ° ° ° -x о „ ^Це^-Ч

N = 5

° *Т = 17

У

X X

X

2

4 6 Рис. 1

8

10

Решение задачи быстродействия. Синтез позиционного управления, оптимального по быстродействию, получаем на основе достаточные условия оптимальности [18]. Обозначим через 6(х,у,у) - значение функции цены, т.е. минимальное время достижения цели (х , у ) , начиная движение из стартового состояния (х, у, у). Поскольку задача стационарная, то функция цены не зависит от времени. Образующая 0к (х, у, у) функции цены равна, по определению,

минимальному времени достижения цели на допустимых траекториях, имеющей ровно к переключений (поворотов). Если допустимой траектории с к поворотами не существует, то полагаем 0^ (х, у, у) = +го. Определим двухпозиционную функцию

цены 0(х, у, у | х, у), равную времени прямолинейного движения из стартового состояния (х, у, у) в прицельное положение (х, у). Направление движения у в конечном состоянии совпадает с у, так как поворотов нет. Если такого прямолинейного движения не существует, то полагаем 0( х, у, у | х, у) = +го. Отметим, что эта функция находится просто. Если отрезок от стартовой точки (х, у) до прицельной точки (х, у) принадлежит лучу (1.8), то

0(х,у,у | х,у) = (| х_ х | +1 у _ у I)/V .

В противном случае 0(х0, у0, у0 | х1, у) = +<ю.

Запишем уравнения для образующих функции цены. Нулевая образующая находится по двухпозиционной функции цены

00(х ^ у) = ®(х ^ у| хт, ут). (1.12)

14

Остальные образующие удовлетворяют рекуррентному уравнению

0k (x,у,у) = min {0(x,у,у I x,у) + min 0k,(x,у,у + f v)}, k = 1,2,... (1.13)

k (x,у)eM ve{±1} k 1 2

В процессе решения уравнений (1.13) находится условное оптимальное позиционное управление

Vk (x, У, у) = arg min фк_1(x, j), у + f v).

ve{±1} 2

Минимальное время движения определяется по образующим функции цены

T *= min 0k (xo, Уo, у о). (1.14)

keZ+

Численное решение задачи проводится на ограниченной сетке M. При этом операцию минимизации по узлам сетки в уравнении (1.13) можно выполнить простым перебором. Для сеток с большим количеством узлов необходимо использовать методы целочисленной минимизации.

На рис. 1 показана траектория (в), оптимальная по быстродействию. Решение получено на сетке размеров 10 х 10 со значениями параметров (1.11). Минимальное время движения равно 13. Заметим, что эта траектория имеет семь поворотов.

Для решения задачи условного быстродействия с заданным количеством N переключений достаточно найти первые N +1 образующих функции цены, решая рекуррентное уравнение (1.13) для к = 1,..., N. После чего условное минимальное время достижения цели находится по формуле

TN= min 0k^Уo,уо).

N k=0,1,...,N k 000

Решение задачи быстродействия с минимальным количеством переключений выполняется в два этапа. Сначала определяется минимальное

количество переключений N. Затем при этом количестве переключений решается задача условного быстродействия и находится время (1.7). Для параметров (1.11) на рис. 1 пунктирной линией (б) показана оптимальная по быстродействию траектория с минимальным количеством переключений. Время движения равно 17.

Решение задачи быстродействия с ограничениями скорости движения и ускорения. Для системы (1.7) двухпозиционная функция цены находится, используя принцип максимума [21]. Оптимальная по быстродействию траектория непрерывного движения состоит из трех участков: разгон с максимальным ускорением, движение с максимальной скоростью, торможение с минимальным ускорением. График скорости представлен на рис. 2. Если скорость движения не ограничена или длина отрезка мала, то оптимальная траектория состоит из разгона и торможения (график скорости на рис. 3). Время движения вычисляется по формулам:

-2

0( Уо> У о I У\)=

2

V2

^ ^ тах

^тах итах

Л V V2

° ^ тах ^ > тах

=| Х1 - х0 1 +1У - Уо 1. (1.15)

^тах итах итах

Если нет допустимой траектории, то 0(х0, у0, у0 | х1, у) = .

5

<

V (t)

iV (t)

Рис. 2.

Рис. 3.

Нулевая образующая находится по двухпозиционной функции цены (1.15), согласно (1.12). Остальные образующие удовлетворяют рекуррентному уравнению 9, (x,y,у) = min {0(x,y,у \ i,y) + min 9._,(X,y,у + -^v) + AT}, к = 1,2,...

к (X,y)eM ve{±1} к 1 2

Минимальное время движения определяется по формуле (1.14).

Численное решение задачи получено на сетке размеров 10 х 10 со значениями параметров (1.1 1 ). Оптимальные траектории представлены на рис. 1. Они совпадают

с найденными ранее для других задач. Траектория (а) получена для и^^ = 2

АТ = 1, т.е. без ограничения скорости. Время движения по этой

траектории T = 10,3323. Траектория (б) найдена при = 2, V^x = 4, AT = 1

max

причем Т^ = 10,6171. Траектория (в) оптимальная при = 2, = 4, АТ = 0,

когда повороты выполняются мгновенно. Время движения - Т = 5,7511.

Таким образом, для планирования маршрутов непрерывно-дискретного движения вполне эффективно применение достаточных условий оптимальности переключаемых систем. Разумеется, что предлагаемые алгоритмы синтеза управления переносятся и на другие карты с более сложной сетью дорог. Кроме препятствий на схеме можно учитывать факторы, затрудняющие движение.

t

Например, ограничения на отдельных участках скорости и направления движения, габаритов и грузоподъемности, достаточно просто задаются на нагруженных ориентированных графах.

2. Оптимизация траекторий Маркова - Дубинса с промежуточными условиями Постановка задачи. Пусть на промежутке времени [0,Т] плоское движение объекта управления описывается уравнениями

где х, у - прямоугольные координаты объекта; у - угол между вектором скорости

и осью абсцисс, V - линейная скорость, и - угловая скорость, которая является управлением, ограниченным по модулю заданной величиной ю. Уравнения (2.1) описывают так называемые траектории Маркова - Дубинса [19,20], которые часто используют в качестве модели движения БЛА [20].

Терминальные условия определяют начальное состояние

х(г) = V соб у(0, у (О = V соб у(0, у (О = и(г), | и(г) | <ю,

(2.1)

х(0) = хо, у(0) = Уо, У(0) = Уо

(2.2)

и конечное положение объекта управления

х(Т) = хт, у(Т) = Ут.

(2.3)

Промежуточные условия

х(и ) = X , У(и ) = Уг , г = 1,-5 т ,

(2.4)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

задают точки, через которые траектория должна проходить. Моменты времени ^,..., ^ ограничены неравенствами 0 < ^ <... < ^ < Т. Углы у(^ ),..., у(^), у(Т),

определяющие направления движения в промежуточных точках и в конечный момент времени, произвольные. Допустимым считается кусочно-непрерывное управление и :[0,Т] ^ [-ю, ю], которое порождает допустимую траекторию, соединяющую терминальные состояния (2.2),(2.3) и проходящую через промежуточные точки (2.4).

Требуется найти минимальное время Т и допустимое управление, при котором это минимальное время достигается, т.е. решить задачу быстродействия:

Оптимальные и попадающие траектории. В классической задаче Маркова -Дубинса [19] требуется перевести систему из заданного начального состояния (2.2) в заданное конечное

Решение этой задачи описано в [21]. Заметим, что для произвольных состояний аналитический выбор оптимальной траектории достаточно сложный. Задача с произвольным направлением скорости в конечный момент времени исследована в [17]. Для решения обеих задач можно использовать принцип максимума [22]. Оптимальное управление релейное: либо нулевое (и(?) = 0), которому прямолинейное движение, либо максимальное по модулю (и(?) = +ю), которым соответствует движение по окружности радиуса V / ю в положительном или

Т ^ шт.

(2.5)

х(Т) = ХТ, У(Т) = УТ, у(Т) = УТ.

(2.6)

отрицательном направлениях соответственно. Типовые оптимальные траектории для задачи "состояние - состояние" (с конечными условиями (2.6)) описаны в [23]. Они представляют собой гладкое соединение либо трех дуг окружностей, либо двух дуг и отрезка их общей касательной. Для задачи "состояние - цель" (с конечными условиями (2.4)) типовые оптимальные траектории - это гладкое соединение либо двух окружностей, либо дуги окружности и отрезка. Допустимые траектории видов "дуга - отрезок - дуга" или "дуга - дуга - дуга" для задачи с конечными условиями (2.6), а также "дуга - отрезок " или "дуга - дуга " для задачи с конечными условиями (2.4), будем называть попадающими. В зависимости от терминальных условий попадающих траекторий в задаче "состояние - состояние" не может быть более восьми, а в задаче "состояние - цель" - не более шести. Поэтому для решения достаточно составить все попадающие траектории, вычислить время движения по каждой из них и выбрать минимальное.

Алгоритм решения задачи "состояние - состояние". Обозначим через ю0 = и(0) и = и(Т) значения управления в терминальные моменты времени. Эти

значения равны по модулю | ю0 | = | | = ю и могут отличаться только знаком. Всего

возможны четыре комбинации знаков ю0, ют. Разделим эти четыре случая на два,

когда знаки либо одинаковые (А), либо разные (Б). Если знаки одинаковые (ю0 = ю^), то повороты в начале и в конце движения выполняются в одном

направлении. Если знаки противоположные (ю0 = -ю^), то повороты - в разные

стороны. В любом случае центры 2П и 2Т окружностей, по которым объект

начинает или заканчивает движение, находятся соответственно по формулам

20 =

Х0 - Б^ю^Яб1пу0 Уо + БВП(®0) Я СОБ у 0

^^ —

г хт - &т )Я б1П ут Л

Ут + &т )Я СО Б ут

(2.7)

где Я — V / ю - радиус поворота.

Случай А. Если терминальные повороты выполняются в разных направлениях, то попадающая траектория представляет собой две дуги окружности, соединенные отрезком касательной. На рис. 4 траектория "дуга-отрезок-дуга" изображена полужирной линией, терминальные состояния Х0 — (х0, у0), Хт — (хт, ут) отмечены

полужирными точками, а центры окружностей поворотов - крестиками. Маленькими окружностями

Х '0 7т

0 р ^ обозначены точки сопряжения 70 и 7^, в которых

дуги соединяются с концами отрезка. Заметим, что такая траектория возможна для

"не близких" позиций, удовлетворяющих условию | | > 2Я (при этом

окружности терминальных поворотов не пересекаются). Координаты точек сопряжения находятся по формулам:

70 — 20 + Я

СОБ а - Б1п а

22

0^ т

ч Б1па СОБа , 1

V /I^0 т

1 202т 1

Ут — ^^

СОБ а - Б1п а

22

0^ т

ч Б1п а СОБ а , |

V /I^0 т

1 202Т 1

где а — -Б§п(ю0)агССОБ-

1 202т 1

Длина траектории равна сумме длин двух дуг и

отрезка. При вычислении длины дуги нужно учитывать направление движения. Для

этого обозначим через Р ЛОБ величину угла поворота вектора ОЛ вокруг точки О

в положительном (при ю > 0) или отрицательном (при ю < 0) направлениях до совпадения с вектором ОБ по направлению. Тогда длины дуги ХТУТ

выражается через углы поворотов

и ХгХъ = ^ • Р ^ Xr.Zr.Yr., и ХгтУ^ = ^ • Р ^ Xт^Zт^Yт^. 0 0 ю 0 0 0' 11 ю ^ 111

(2.8)

Таким образом, в случае А время движения определяется равенством

1 =

и XoYo +1 YoYT | + и YтX,

V

(2.9)

Случай Б. Если терминальные повороты выполняются в одном направлении, то траектория может быть двух видов: "дуга-отрезок-дуга" или "дуга-дуга-дуга". Эти траектории представлены на рис. 5 и 6 соответственно. Заметим, что попадающих траекторий вида "дуга-дуга-дуга" может быть две. На рис. 6 одна траектория изображена полужирной линией, а часть второй траектории -

Yn

Zr

^ Х

т0+

Х0 Y-

Хп

Рис. 5

\ Z- /

Рис. 6

пунктирной.

Получим время движения по траектории "дуга-отрезок-дуга". Центры 20 и

2^ терминальных окружностей определяются равенствами (2.7), а точки

сопряжения находятся по формулам

70 — 20 + Я

ЛСОБ а - б1п аЛ

22

VБ1па СОБа/1202 |

, 7т — 70 + 202т,

л

где а — - Б§п(ю)~ . Длины дуг вычисляются по формулам (2.8), а время движения -по формуле (2.9).

Найдем время движения по траектории вида "дуга-дуга-дуга". Нужно вычислить время движения по каждой из двух траекторий (см. рис. 6). Центры 20 и

2у, терминальных окружностей определяются равенствами (2.7). Отметим, что

попадающие траектории, рассматриваемого вида, существуют только для "не

далеких" позиций, когда | 202^ | < 4Я. Точки сопряжения окружностей находятся по формулам

70± — 2 0 + Я

СОБ а - Б1п а

Б1п а СОБ а

^^ / | 202т

1202Т | т 0 2

7т — 70± + ~ 202т, (2.10)

| 202т |

где а —± агССОБ-—. Координаты центра 2 промежуточной окружности

выражаются через координаты точки сопряжения

2± — 20 + 22070± . (2.11)

В формулах (2.10), (2.11) верхний индекс "плюс" или "минус" берется при

положительном или отрицательном значениях а соответственно. Точки У0+ , У^,

2+ и У0", Уу , 2+ отмечены на рис. 6. Время движения находится по формуле

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ и ХПУП± + иУгУг + иУ^т Хт

Т ± =-^-^-(2 12)

V

где и У(±У^ = Я Рю У0±2±У^ - длина дуги окружности с центром 2 ±

соответственно. Вычисления по формулам (2.10) - (2.12) выполняются для двух траекторий при положительном и отрицательном значениях а. При этом получаем

два значения Т + и Т~. Следовательно, в случае Б оптимальное время движения определяется равенством

Т = шт(Т, Т+, Т "}, (2.13)

Таким образом, алгоритм решения задачи "состояние - состояние" заключается в расчете четырех вариантов, отличающихся выбором направлений терминальных поворотов: ю0=±ю, ю^=±ю. В каждом случае вычисления

выполняются по формулам (2.9) или (2.13) соответственно. Из четырех вариантов выбирается оптимальный, с наименьшим значением времени движения.

Алгоритм решения задачи "состояние - цель". В этой задаче направление скорости в конечный момент времени произвольное. Поэтому оптимальные траектории могут быть двух видов: либо "дуга - отрезок ", либо "дуга - дуга ".

Будем рассматривать задачу с фиксированным направлением поворота в начальный момент времени, которое определяется знаком угловой скорости ш0 = ±ю.

Для заданного значения ю0 находим центр 20 поворота по формуле (2.7).

1. Если цель Х^ = (, ут) "близкая" (при \ 2^ХТ \ < Я), то попадающей траектории (с заданным направлением поворота) нет.

2. Если цель "не близкая" (при \ 2^ХТ \ > Я), то существует попадающая

траектория вида "дуга - отрезок". На рис. 7 она представлена полужирной линией. Координаты точки сопряжения 70 вычисляем по формуле

70 = 20 + Я

'соб а - Бт а^ 20Хт у Бт а соб а ) \ 2^ХТ

Я

где а = - б§п( ю0 )агссоБ—-—. Время движения по этой траектории

\ 2 0 Хт \

и Х070 + \ 70Х \ Т =-—-. (2.14)

V

Здесь, как и ранее, дуга иХ7 определяется равенством (2.8).

7+ 2+

У V

70 Хт /7 УС \ХТ

• Т 2 0> ^ ^ 1

Х0

20 Х0 7-^2

Рис. 7 Рис. 8

3. Если цель "не далекая" и "не близкая" (при Я < | ^Х | < 3Я), то

существуют две попадающие траектории вида "дуга - дуга". На рис. 8 одна траектория изображения полужирной линией, а часть другой траектории -пунктирной. Точки сопряжения окружности находятся по формулам

Уо± = 2 о + Я

лсоб а - б1п аЛ

22

к Б1п а соб а ) 12^2 |

0 Т (2.15)

3Я2 +1 202 |2

где а = ± агссоБ- '—. Координаты центра 2 второй окружности

4Я | 2о 2Т |

выражаются через координаты точки сопряжения

2±= 20 + 220У± . (2.16)

В формулах (2.15), (2.16) верхний индекс "плюс" или "минус" берется при положительном или отрицательном значениях а соответственно. Точки Уп+, 2 + и

У0 , 2 + отмечены на рис. 8. Время движения находится по формуле

+ и ХПУП± + иУп± X ±

Т ±=-О-0—Т_ (2 17)

V

где иУ±Х± = Я-Р_ю У±2±Х± - длина дуги окружности с центром 2±, которая получается при повороте в направлении, противоположном ю0.

Таким образом, алгоритм решения задачи "состояние - цель" заключается в расчете двух вариантов, отличающихся выбором направления начального

поворота: ю0=±ю. В каждом варианте вычисления выполняются по формулам

(2.14) и (2.17). Из всех попадающих траекторий выбирается оптимальная, с наименьшим времени движения.

Решение задачи Маркова - Дубинса с промежуточными условиями.

Назначим в промежуточных точках направления движения, задавая углы

УЪ) = уг, г = 1,..., т. (2.18)

Тогда допустимая траектория будет разбита на т участков вида "состояние -состояние" и еще один (последний) участок вида "состояние - цель". На каждом участке можно, используя описанные алгоритмы, найти частичную оптимальную траекторию. Однако траектория, составленная из частичных оптимальных траекторий, не будет оптимальной в целом. Для этого нужно выполнить оптимизацию углов (2.18).

Действительно, обозначим через 0(х0, у0, у0 | х1, у, у1) или

0(х0, у0, у0 | Хр, ур) минимальное время движения из состояния (х0, у0, у0) в

состояние ( х1 , у1, у1) или в цель ( х^ , ур ) соответственно. Тогда время движения по

составленной траектории будет зависеть только от углов у1,... ут, определяющих

направление движения в промежуточных точках

т

T(Уl,..., Ут) = Е0(Хг-1,Уг-1,Уг-1 | Хг,У,Уг ) + 0(хт,Ут,Ут | ХЕ,Уе) . (2Л9)

г =1

Оптимальное по быстродействию время является решением задачи минимизации

minT = min T(y1v..,уm) (2.20)

У1'...'У m

по углам у. е [0,2л], i = 1,...,m.

В самом деле, согласно принципу оптимальности Беллмана [15], любой участок оптимальной траектории является оптимальной траекторией. Поэтому траектории между состояниями

Уo, У о)' (x^ Уl, У1)'...' (x m, Уm, У m ) являются решениями задач состояние - состояние, а на последнем участке от (xm, Ут, Ут) до точки (x^, yF) - решением задачи состояние - цель. Время

движения по этой попадающей траектории определяется формулой (2.19). Минимизируя это выражение по направлениям скорости в промежуточных точках, получаем лучшую попадающую траекторию и наименьшее значение времени (2.20). Таким образом, справедливо утверждение.

Теорема. Оптимальная траектория в задаче (2.1)-(2.5) с промежуточными условиями представляет собой последовательное гладкое соединение оптимальных траекторий Маркова - Дубинса между точками (x0,y0), (x,y),..., (xm,ym),

(, Ур) • Направления скоростей в промежуточных точках определяются углами

у1,... ут, которые являются решением задачи минимизации (2.10).

Замечание. Как показали расчеты, задача (2.20) хорошо решается методами спуска. В качестве начального приближения для у., i = 1,...,m, можно взять угол,

соответствующий среднему направлению в промежуточной точке

[(х(Гг ) - х(Гг-1), у(1г ) - у(1г _1)) + (Х^-+1) - ^ ), у(^ +1) - у(^ ))] .

3. Оптимизация траекторий БЛА при наличии препятствий

Рассмотрим задачу оптимизации маршрутов движения БЛА при наличии препятствий. Рациональная траектория БЛА формируется в два этапа. Сначала по карте непрерывно-дискретного движения с отмеченными препятствиями синтезируется оптимальная по быстродействию ломаная (см. разд. 1). Используя эту ломаную в качестве опорной траектории, формируется оптимальная траектория Маркова - Дубинса. Вершины ломаной служат промежуточными точками для траектории БЛА.

Для опорных траекторий, найденных в разд. 1 на прямоугольной сетке, получены оптимальные траектории Маркова - Дубинса с промежуточными условиями. Расчеты проводились при V = 1 и ю = 3. На рис. 9 начальное состояние системы обозначено треугольником, конечное - квадратом, промежуточные точки -окружностями. Опорные траектории изображены штрихпунктирными линиями (ломаные а, б, в), а оптимальные траектории Маркова - Дубинса представлены двойной штриховой (а), пунктирной (б) и сплошной (в) линиями соответственно. Время движения по этим траекториям: Т = 19.45, Т- = 17.43, Т = 14.43.

Рис. 9

Заключение

Предлагаемые алгоритмы можно использовать для планирования рациональных маршрутов плоского движения БЛА при наличии препятствиях, например в городе. При этом карта непрерывно-дискретного движения позволяет "обходить" многочисленные фазовые ограничения. При планировании маршрутов БЛА актуальным является использование нескольких карт, каждая из которых соответствует заданной высоте полета. При этом изменение высоты полета БЛА можно считать переключением состояния системы.

Другим продолжением исследований может быть решение задачи

планирования маршрутов непрерывно-дискретного движения на сетках,

необязательно прямоугольных и целочисленных. Представляет интерес учет

нежестких препятствий, учет на карте областей, нежелательных для продолжительного движения. Например, это могут быть области химического заражения, с высокой радиоактивностью или с большой вероятностью обнаружения противником. Целесообразно рассмотреть модификации модели Маркова -Дубинса, например, учитывающие расход топлива. К промежуточным точкам можно отнести пункты заправки или смены полезной нагрузки. Особенно важной предстг

Работа выполнена при финансовой поддержке РФФИ, проект 18-08-00128-а.

Библиографический список

1. Евдокименков В.Н., Красильщиков М.Н., Оркин С.Д. Управление смешанными группами пилотируемых и беспилотных летательных аппаратов в условиях единого информационно-управляющего поля. - М.: Изд-во МАИ, 2015. - 272 с.

2. Лебедев Г.Н., Румакина А.В. Система логического управления обхода препятствий беспилотным летательным аппаратом при маршрутном полете // Труды МАИ. 2015. № 83. URL: http ://trudymai.ru/published.php?ID=61905

3. Матюшин М.М., Луценко Ю.С., Гершман К.Э. Синтез структуры органа управления полетом космических группировок // Труды МАИ. 2016. № 89. URL: http://trudymai.ru/published.php?ID=72869

4. Richards A., How J.P. Aircraft trajectory planning with collision avoidance using mixed integer linear programming // Proceedings of the American Control Conference, «ACC' -2002», 2002, vol. 3, IEEE Publ., pp. 1936 - 1941. DOI: 10.1109/ACC.2002.1023918

5. Jia Zeng, Xiaoke Yang, Lingyu Yang, and Gongzhang Shen. Modeling for UAV resource scheduling under mission synchronization // Journal of Systems Engineering and Electronics, October 2010, vol. 21, no. 5, pp. 821 - 826. DOI: 10.3969/j.issn.1004-4132.2010.05.016

6. Schouwenaars T., Valenti M., Feron E., How J. Linear Programming and Language Processing for Human/Unmanned-Aerial-Vehicle Team Missions // Journal of Guidance, Control, and Dynamics, March-April 2006, vol. 29, no. 2, pp. 303 - 313. DOI: 10.2514/1.13162

7. Winstrand M. Mission Planning and Control of Multiple UAV's. Scientific Report № FOI-R-1382-SE Swedesh Defence Research Agency, 2004. p. 52.

8. Rong Zhu, Dong Sun, Zhaoying Zhou. Cooperation Strategy of Unmanned Air Vehicles for Multitarget Interception // Journal Guidance, 2005, vol. 28, no. 5, pp.1068 - 1072. DOI: 10.2514/1.14412

9. Kamal W.A. and Samar R. A Mission Planning Approach for UAV Applications // Proceedings of the 47th IEEE Conference on Decision and Control, Cancun, Mexico, Dec. 9-11, 2008, pp. 3101 - 3106. DOI: 10.1109/CDC.2008.4739187

10. Schumacher C.J. and Kumar R. Adaptive control of UAVs in close-coupled

formation flight // Proceedings of the American Control Conference, 2000, vol. 2, pp. 849 - 853.

11. Dusan M. Stipanovic, Gokhan Inalhan, Rodney Teo, Claire J. Tomlin. Decentralized overlapping control of a formation of unmanned aerial vehicles // Automatica, 2004, vol. 40, no. 8, pp. 1285 - 1296.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Jongki Moon. Mission-Based Guidance System Design for Autonomous UAVs. A Thesis Presented to The Academic Faculty, Georgia Institute of Technology, December 2009, 145 p.

13. Ha J., Sattigeri R. Vision-based obstacle avoidance based on monocular slam and image segmentation for UAVs, Infotech@Aerospace, 2012, pp. 1 - 9.

14. Tewari A. Optimal nonlinear spacecraft attitude control throung Hamilton - Jacobi formulation // Journal Astronautical Science, 2002, vol. 50, pp. 99 - 112.

15. Беллман Р. Динамическое программирование. - М.: ИЛ, 1960. - 400 с.

16. Дивеев А.И., Конырбаев Н.Б. Управление группой квадрокоптеров методом вариационного аналитического программирования // Труды МАИ. 2017. № 96. URL: http://trudymai.ru/published.php?ID=85774

17. Бортаковский А.С., Щелчков К.А. Задачи группового быстродействия летательных аппаратов // Труды МАИ. 2018. № 99. URL: http://trudymai.ru/published.php?ID=91644

18. Бортаковский А.С., Урюпин И.В. Минимизация количества переключений оптимальных непрерывно-дискретных управляемых процессов // Известия РАН. Теория и системы управления. 2019. № 4. С. 29 - 46.

19. Марков А.А. Несколько примеров решения особого рода задач о наибольших и наименьших величинах // Сообщения Харьковского математического общества. 1889. 1, № 5,6. С. 250 - 276. URL:

http://sector3.imm.uran.ru/stat oth/markov1889/markov 1889.pdf

20. Dubins L.E. On Curves of Minimal Length with a Constraint on Average Curvature, and with Prescribed Initial and Terminal Positions and Tangents // American Journal Mathematics, 1957, vol. 79, no. 3, pp. 497 - 516. URL:http://dx.doi.org/10.2307/2372560

21. Tsourdos A., White B., Shanmugavel M. Cooperative Path Planning of Unmanned Aerial Vehicles, New York, Wiley&Sons, 2011, 190 p.

22. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. - М.: Физматгиз, 1961. - 392 с.

23. Аграчев А.А., Сачков Ю.Л. Геометрическая теория управления. - М.: ФИЗМАТЛИТ, 2005. - 392 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.