Научная статья на тему 'ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ПОЛЕТОМ ГРУППЫ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ НА ОСНОВЕ АЛГОРИТМА МНОГОАГЕНТНОЙ МОДЕЛИ РОЕНИЯ'

ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ПОЛЕТОМ ГРУППЫ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ НА ОСНОВЕ АЛГОРИТМА МНОГОАГЕНТНОЙ МОДЕЛИ РОЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
445
120
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА УПРАВЛЕНИЯ / БЕСПИЛОТНЫЙ ЛЕТАТЕЛЬНЫЙ АППАРАТ / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ГРУППЫ / КООРДИНАЦИЯ / УПРАВЛЕНИЕ РОЕМ

Аннотация научной статьи по математике, автор научной работы — Чжу Юйцин

Рассмотрена задача управления группой беспилотных летательных аппаратов (БПЛА) для организации движения роем по заданной траектории, обеспечивающей наиболее эффективное достижение цели полета. Изучены вопросы выбора математической модели пространственного движения группы БПЛА, пригодной для решения задачи синтеза согласованного управления всей совокупностью летательных аппаратов. Учитывая специфику требований к пространственно-временному положению отдельных БПЛА (агентов) в группе, предложено использовать модель с лидером. В группе агентов находится виртуальный лидер, который планирует маршрут движения группы в соответствии с заданной задачей и отслеживает определенную цель движения. Виртуальный лидер рассчитывает свое собственное управление движением с помощью алгоритма отслеживания траектории или отслеживания цели, чтобы двигаться по желаемой траектории. При этом сигнал наведения может позволить отдельным БПЛА собираться на позиции виртуального лидера и соответствовать вектору скорости виртуального лидера, чтобы обеспечить связь топологии многоагентной системы и обеспечить роевое формирование.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Чжу Юйцин

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORMATION OF FLIGHT CONTROL FOR A GROUP OF UNMANNED AERIAL VEHICLES BASED ON ALGORITHM OF MULTI-AGENT SWARM MODEL

The problem of controlling a group of unmanned aerial vehicles (UAVs) is considered to organize the movement of a swarm along a given trajectory, which ensures the most effective achievement of the flight goal. The issues of choosing a mathematical model of the spatial motion of a group of UAVs, suitable for solving the problem of synthesis of coordinated control of the entire set of aircrafts, are discussed. Taking into account the specifics of the requirements for the space-time position of individual UAVs (agents) in a group, it is proposed to use a model with a leader. A group of agents has a virtual leader who plans the route of the group in accordance with a given task and tracks a specific goal of movement. The virtual leader calculates its own motion control with a trajectory-tracking or target-tracking algorithm to move along the desired trajectory. In this case, the guidance signal can allow individual UAVs to gather at the position of the virtual leader and correspond to the velocity vector of the virtual leader in order to communicate the topology of the multi-agent system and ensure swarm formation.

Текст научной работы на тему «ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ПОЛЕТОМ ГРУППЫ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ НА ОСНОВЕ АЛГОРИТМА МНОГОАГЕНТНОЙ МОДЕЛИ РОЕНИЯ»

Научная статья

DOI: https://doi.org/10.18721/JCSTCS.15402 УДК 681.5

ФОРМИРОВАНИЕ УПРАВЛЕНИЯ ПОЛЕТОМ ГРУППЫ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ НА ОСНОВЕ АЛГОРИТМА МНОГОАГЕНТНОЙ МОДЕЛИ РОЕНИЯ

Ю. Чжу1 н

1 Санкт-Петербургский политехнический университет Петра Великого,

Санкт-Петербург, Российская Федерация

е [email protected]

Аннотация. Рассмотрена задача управления группой беспилотных летательных аппаратов (БПЛА) для организации движения роем по заданной траектории, обеспечивающей наиболее эффективное достижение цели полета. Изучены вопросы выбора математической модели пространственного движения группы БПЛА, пригодной для решения задачи синтеза согласованного управления всей совокупностью летательных аппаратов. Учитывая специфику требований к пространственно-временному положению отдельных БПЛА (агентов) в группе, предложено использовать модель с лидером. В группе агентов находится виртуальный лидер, который планирует маршрут движения группы в соответствии с заданной задачей и отслеживает определенную цель движения. Виртуальный лидер рассчитывает свое собственное управление движением с помощью алгоритма отслеживания траектории или отслеживания цели, чтобы двигаться по желаемой траектории. При этом сигнал наведения может позволить отдельным БПЛА собираться на позиции виртуального лидера и соответствовать вектору скорости виртуального лидера, чтобы обеспечить связь топологии многоагентной системы и обеспечить роевое формирование.

Ключевые слова: система управления, беспилотный летательный аппарат, математическая модель группы, координация, управление роем

Для цитирования: Чжу Ю. Формирование управления полетом группы беспилотных летательных аппаратов на основе алгоритма многоагентной модели роения // Computing, Telecommunications and Control. 2022. Т. 15, № 4. С. 22-36. DOI: 10.18721/JCSTCS.15402

© Чжу Ю., 2022. Издатель: Санкт-Петербургский политехнический университет Петра Великого

Research article

DOI: https://doi.org/10.18721/JCSTCS.15402 UDC 681.5

FORMATION OF FLIGHT CONTROL FOR A GROUP OF UNMANNED AERIAL VEHICLES BASED ON ALGORITHM OF MULTI-AGENT SWARM MODEL

Y. Zhu1 e

1 Peter the Great St. Petersburg Polytechnic University, St. Petersburg, Russian Federation

e [email protected]

Abstract. The problem of controlling a group of unmanned aerial vehicles (UAVs) is considered to organize the movement of a swarm along a given trajectory, which ensures the most effective achievement of the flight goal. The issues of choosing a mathematical model of the spatial motion of a group of UAVs, suitable for solving the problem of synthesis of coordinated control of the entire set of aircrafts, are discussed. Taking into account the specifics of the requirements for the space-time position of individual UAVs (agents) in a group, it is proposed to use a model with a leader. A group of agents has a virtual leader who plans the route of the group in accordance with a given task and tracks a specific goal of movement. The virtual leader calculates its own motion control with a trajectory-tracking or target-tracking algorithm to move along the desired trajectory. In this case, the guidance signal can allow individual UAVs to gather at the position of the virtual leader and correspond to the velocity vector of the virtual leader in order to communicate the topology of the multi-agent system and ensure swarm formation.

Keywords: control system, unmanned aerial vehicle, mathematical model of the group, coordination, swarm management

Citation: Zhu Y. Formation of flight control for a group of unmanned aerial vehicles based on algorithm of multi-agent swarm model. Computing, Telecommunications and Control, 2022, Vol. 15, No. 4, Pp. 22-36. DOI: 10.18721/JCSTCS.15402

Введение

Успехи, достигнутые в разработке беспилотных летательных аппаратов (БПЛА) как военного, так и гражданского назначения, создают хорошие предпосылки для широкого круга их применения, в частности для исследования земной поверхности, в том числе зон стихийных бедствий, мест чрезвычайных ситуаций, для обнаружения очагов пожаров, для измерения метеорологических данных, радиационного фона и других факторов, а также для обеспечения телекоммуникаций, мониторинга трубопроводов и линий электропередач, патрулирования границ. Связано это с тем, что БПЛА дешевле пилотируемой авиации, более простые в обслуживании, их полет может быть намного продолжительнее, они также могут работать в темноте, в условиях плохой видимости, кроме того, они могут применяться в ситуациях, угрожающих жизни пилота.

Эффективность использования БПЛА значительно повышается при организации групповых полетов. Однако при этом возникает ряд сложных проблем, связанных с обеспечением управления полетом группы БПЛА. Под группой БПЛА обычно понимают некоторую совокупность летательных аппаратов, подчиняющихся определенным правилам сбора в группу, способных выдерживать свое место в строю на прямолинейных и криволинейных участках полета всей группы в целом, реагировать на изменения окружающей среды и взаимодействовать друг с другом для решения единой целевой задачи, поставленной перед группой.

© Zhu Y., 2022. Published by Peter the Great St. Petersburg Polytechnic University

23

Это определяет необходимость гибкого формирования группы в операции: позволяет выбирать параметры пространственно-временного и комбинаторного взаимного положения элементов группы, исходя из требований и целей операции.

С точки зрения пространственно-временного положения элементов в группе, последние могут выполнять:

♦ групповой маневр, при котором номинальные траектории движения всех элементов конгруэнтны;

♦ индивидуальный маневр, при котором каждый элемент, независимо от других, может менять параметры траектории движения;

♦ смешанный маневр, при котором возможно изменение параметров движения как всей группой средств, так и отдельными элементами.

Что касается комбинаторного положения, то оно характеризует структуру построения группы БПЛА различных типов, например, целевых элементов (непосредственно решающих задачу) и обеспечивающих её выполнение БПЛА. Формирование пространственно-временной модели построения группы должно базироваться на учете ограничений по располагаемой энергетике, маневренным возможностям, взаимной расстановке и т. д.

При этом на систему управления полетом группы БПЛА возлагается задача согласованного управления каждым из летательных аппаратов для организации движения строем по заданной траектории, которая обеспечивает наиболее эффективное достижение цели, поставленной перед группой. Система управления полетом БПЛА в группе осуществляет контроль правильности удержания траектории каждым БПЛА с точностью, обеспечивающей безопасность в плотных групповых порядках. На эту же систему возлагается задача межсамолетной навигации и организации взаимодействия БПЛА по информационным каналам с целью определения взаимных координат [1].

В области исследований формирование группы БПЛА постепенно становится новой разнонаправленной и междисциплинарной областью исследований. В этой области существует множество направлений исследований: исследования аэродинамических помех при близком формировании группы [2—4], исследования по проектированию формирования группы [5—7], исследования по планированию траектории формирования группы [8, 9], исследования по управлению формированием группы [10—13], исследования по реконструкции формирования группы [14—16], исследования по распределению задач формирования группы [17, 18], предотвращение столкновений БПЛА и т. д. Поскольку управление формированием строя (группы, роя) является важной технологией, то в этой области многочисленные исследователи предложили большое количество алгоритмов управления формированием группы. При этом теоретическая основа алгоритмов группового управления как правило связана с моделью роевого движения.

Для достижения высокой стабильности и хорошей координации группы БПЛА получается, что управление формированием групп БПЛА сложнее управления одним БПЛА (агентом). Необходимо учитывать не только контроль над мультиагентом (членом группы), но и принимать интерактивные и совместные решения по получаемой информации для обеспечения эффективного управления. Необходимо также учитывать взаимодействие между агентами и взаимодействие между агентами и окружающей средой.

Полет группы БПЛА можно представить как движение роя. Модель роевого движения — модель, используемая для изучения движения одновременно большого количества индивидуумов. Формулируя закон индивидуального движения, можно определить относительное регулярное положение между перемещениями отдельных БПЛА, при этом движения индивидуального БПЛА имеют тенденцию приближаться к регулярности.

Следовательно, необходимо не только учитывать совместное управление мультиагентами, но и изучать модель роя и движение строя мультиагентов.

Интеллектуальные системы и технологии^

В статье предлагается модель роя в применении к многоагентной системе с кооперативным движением: модель движение роя.

Модель роя БПЛА

Рой — повсеместное явление в природе. Это врожденная способность, приобретенная после длительной эволюции социальной группы организмов, объединяться в группы и тем самым адаптироваться к окружающей среде для выживания при восполнении слабости отдельных членов группы. Примерами могут служить стаи птиц, рыб и др.

В 1986 году Рейнольдс предложил три эвристических правила, которые привели к созданию первой компьютерной анимации группового поведения [19]:

1) Центрирование стаи: старайтесь держаться ближе к ближайшим товарищам по рою.

2) Предотвращение столкновений: избегайте столкновений с ближайшими товарищами по рою.

3) Сопоставление скорости: попытка сопоставить скорость с ближайшими товарищами по рою.

Эти правила также известны в литературе как правила сплоченности, разделения и согласования. Исходя из этих правил различными исследователями было предложено множество моделей роя.

В 1995 году Vicsek предложил модель роя многоагентной сложной системы и создал простую модель группового движения — модель Vicsek на основе статистической механики [20, 26]. Джад-бабайе и др. [22] представили последовательность графов соседей, образованную всеми индивидуальными отношениями местоположения в модели Vicsek, и теоретически доказали, что, если эти графы соседей связаны согласованным образом, группа будет синхронизирована. Эта модель описывает синхронное движение автономной системы, состоящей из нескольких агентов. Агенты в модели следуют следующим правилам:

1. Агент, движущийся в системе, имеет постоянную скорость р.

2. Любая пара агентов в системе имеет радиус влияния г. Только когда прямолинейное расстояние между парой агентов меньше г, они могут влиять друг на друга.

3. Направление движения агента в каждый момент такое же, как и среднее направление движения всех других агентов в пределах радиуса влияния в предыдущий момент.

В этой модели агент , имеет постоянную скоростьр, смещение равно д (I), а направление скорости агента , равно 0.(0, что удовлетворяет следующим условиям:

0, (' + 0 = ¿^„М (1)

где N, (г) = {] <*|||г, (I)-)|| < г}.

Кукер и Смейл предложили кластерную модель группы (CS-модель) [23], основанную на работе Vicsek. Модель Соигт [27] представила проблему перспективного угла, основанную на модели Vicsek. Первоначальное намерение авторов [27] состояло в том, чтобы моделировать группу животных с учетом ограниченного пространства и улучшить эффективность синхронизации модели группы. Этот результат исследования показывает, что агент в базовой модели Vicsek использует информацию о соседних агентах избыточно, т. е. агенту не нужно получать всю информацию о соседях в группе и обладать информацией о всех членах группы. Увеличение числа членов группы не обязательно означает повышение эффективности синхронизации.

Данная модель имеет следующие допущения:

1. Все агенты имеют взаимное влияние.

2. Значимость агента, на которого действуют другие агенты, зависит от абсолютного расстояния и разницы в скорости между ними.

Непрерывная модель CS имеет многоагентную систему с N агентами, где смещение агента i в момент времени t записывается как q(t), а скорость записывается какpfi):

q (t)=pt (t) (2)

pi(t)=aZ (I ъ(t)-q(t M Pi(t)-P'(t)) > (3)

где Q'i (t) = Nф(||?у (t) -q (t)||), и ф(И) = --в> параметры a > ° P > 0.

N (1+l И )

В исследовании Баллерини и др. [24] было обнаружено, что особи в стае птиц взаимодействуют только с ближайшими 6-7 соседями во время движения стати и это не связано с плотностью группы и расстоянием до птиц-соседей. Кроме того, было принято, что в зависимости от способности отдельного организма запоминать информацию, возможно, что запоминаемая информация оказывает немаловажное влияние на принятие решений о временном поведении агента.

Джордж [25] считает, что, если запоминаемая информация о соседях может быть эффективно использована, то скорость сходимости синхронизации группы также будет улучшена.

Следовательно, можно считать возможным построить частично наблюдаемую групповую модель (модель роя) для управления групповым движением (движением роя).

Тадмор и др. создали новую модель кластера многоагентных сложных систем (MT), основанную на модели CS [28]. Непрерывная модель MT рассматривает сложную систему с N индивидуумами. Для индивидуума i в момент времени t смещение записывается как q.(t), а скорость записывается какp.(t), то (t) , pt (t)J удовлетворяет:

Я (г) = р, (г) (4)

А (г) = «I(I% (г)-я, (г)||)(Р} (г) -Рг (г)), (5)

ф(||% (г)- qi (г)||) 1 где А (г) = —-п——-—^ , и ф(г) = ---в, тараметры а > 0, р > 0.

Iк.м ф(|%(г)- Я,(гII) (1 + |\г\\2)

На основе модели CS Шен и др. [29] предложили модель роя с механизмом лидерства (модель НЦ). Модель HL рассматривает сложную иерархическую систему, состоящую из (к + 1) агентов и индивидов [0, 1, 2, ..., к]. При этом каждый уровень соответствует соответствующему индивиду, а (г) означает, что индивид , возглавляет индивидчто удовлетворяет двум условиям: 4 1. ] < ,, то а (г) ф 0;

Ч ( / ч )

2. если набор лидеров индивидуума г равен Ь = {а^. (г) > 0} , то для любого , > 0 есть Ь ф Ф.

Ли Чжучунь [30] дополнительно улучшил модель HL на основе модели Шэнь и установил более общую модель кластера многоагентной сложной системы с единым механизмом лидерства, которая имеет глобального лидера и не зависит от других агентов.

Алгоритм управления движением роя по модели Олфати-Сэйбера. Олфати-Сэйбер [29] разработал алгоритм роения с несколькими БПЛА, имея ввиду, что роение — скопление БПЛА, которое относится к большому количеству БПЛА, движущихся вместе. В природе коллективное движе-

ние стаей пчел, птиц, рыб и животных является типичным примером роения. Формирование роящейся группы часто не имеет глобального лидера или информационного центра для обработки и выдачи групповой информации. Агенты в группе могут координировать общее поведение группы в соответствии с простыми местными правилами. Алгоритм разделяет силу агента на условия искусственного потенциального поля, условия согласования скорости и условия наведения. Алгоритм мультиагентного роения используется для вычисления вектора позиции, и получается распределенная, постепенно генерируемая формация квазирешетки, которая имеет хорошую надежность и масштабируемость, чтобы поддерживать группу роя агентов и формы, тем самым обеспечивая предотвращение столкновения с препятствиями и отслеживание.

Методы моделирования и анализа роения включают в себя метод Лагранжа, метод Эйлера и метод дискретной модели системы. Метод Лагранжа использует обыкновенные дифференциальные уравнения для описания всех индивидов в группе, которые могут описывать процесс динамического изменения объекта; метод Эйлера описывает группу как поле в пространстве, а функция плотности поля представляет индивидов в группе. Плотность распределения в пространстве выражается уравнениями в частных производных, чтобы выразить явление диффузии поля плотности, тем самым отражая динамику групповых изменений. Модель дискретной системы принимает вид набора уравнений дискретного времени для выражения динамики системы.

Алгоритм, используемый в модели Олфати-Сэйбера, выглядит следующим образом.

В трехмерном евклидовом пространстве динамика агента / моделируется как интегральное звено второго порядка:

Г = Р , г = 1,2, ..., N, (6)

I Рг = Щ

где д., рг и п. е Я" представляют положение, скорость и управляющий вход /-го агента соответственно. Каждый агент может взаимодействовать только с соседними агентами в своей области связи, и в момент времени I набор соседних агентов может быть выражен следующим образом:

^(0 = {/ :\\я, - < г, ] = 1, 2, ... N, ] Ф/}, (7)

где ||д, - | | — расстояние Эйлера, а г — максимальный радиус взаимодействия или максимальное критическое расстояние. Желаемая геометрическая модель кластера требует, чтобы каждый агент находился на одинаковом расстоянии от всех соседних индивидуумов и удовлетворял следующим ограничениям:

\\дг -д;\\ = й, V/, ] е N (I), (8)

где й — положительная константа, указывающая минимально допустимое расстояние или минимальное критическое расстояние между каждой парой соседних агентов, и й < г.

В среде с множеством препятствий входные данные каждого агента в многоагентном алгоритме управления состоят из следующих трех частей [29]:

Щ = иа+ ив+ и], (9)

где а, в, у представляют трех агентов, основанных на теории роения Олфати-Сэйбера.

Агент а представляет любого агента в группе, агент в генерируется проекцией соседнего агента а на поверхность препятствия, используемую для представления физического препятствия, которое необходимо обойти, а агент у используется для построения навигационной обратной связи,

указывающей цель, которую необходимо отслеживать. ига означает элементы взаимодействия (а, а), и. — элементы взаимодействия (а, в), а и. — распределенная навигационная обратная связь.

Определения uf, ue и uj следующие:

uf=-<

S ря ( q )фа ( q )■- < S av ( q ) ( p<- P ) ,

S hk (q )ф e (q )- S bik (q, ) (p,- p,,* ) ,

kteNf keNf

uiY = -c>y ( q - )- c P ( p,- Py ) ,

(10)

(11) (12)

ига состоит из двух частей. Первая часть устанавливает расстояние между агентами как желаемое расстояние, а вторая часть делает скорость агентов согласованной со скоростью соседних агентов. Конкретное выражение первой части заключается в следующем:

z„ =( q, - q} )-

q -qj *d,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

q,- q,

(13)

Фа(qt ) =

i

1 + e.

(14)

р я ( q, ) =

( q,- qJ- d )

VN--i_ +1,

я

(15)

где Н, еа, Сц и Ср являются нормальными числами, а значение Н обычно больше, чем й. Фрагментация — это алгоритм кластеризации Олфати-Сэйбера, и введение рН (qi) может эффективно предотвратить фрагментацию. Когда расстояние между агентами увеличивается, значение РН () также быстро увеличивается.

Второй компонент и™ равен а,}. (qi) = р

llq - qn

g [0,1], j Ф i. atj = 0, если aij Ф 0,

обмен информацией между агентами / и] также может рассматриваться как обмен информацией между агентами.

рй (г) — функция воздействия, как показано ниже:

ph( - Н1

1 + cos

1,

п

z g

( - - h ) (1 - h )

[о, h] [ h,1]

otherwise

z g

(16)

и: позволяет агенту отслеживать виртуального пилота или желаемую траекторию, , Ср — обычное число, д и р представляют положение и скорость виртуального пилота соответственно,

фу( q,- qy)

имеет следующее представление:

z

2

z

Фг(Я* - Ят)= , Ч' -47 ,,2 (17)

1 + е у \Яг -Яу

/1

ив позволяет агенту обходить препятствия, где св и св являются нормальными числами. Прин-

* Я р

цип заключается в следующем: виртуальный в - агент с положением и скоростью создается на поверхности препятствия в пределах диапазона обнаружения агента в кластере. Метод построения заключается в следующем [29].

1. Для совпадения с границей гиперплоскости и единичной нормалью а , проходящей через точкуук, положение и скорость в- агента определяются по следующей формуле:

Яа = ря, +(1 - Р) Ук,Р1Л = РР, (18)

где Р = I - акатк — проекционная матрица.

2. Для сферического препятствия с радиусом к* и центральной точкой у , положение и скорость в- агента равны:

Яг,к = МЯг +(1 -М) Ук • рг,к = МРР г• (19)

где М = ц К* ■■, а* • Р = 1 -а*а1 •

II я* - у* || ||я* - у Л

Созданный таким образом виртуальный в- агент, направлен на то, чтобы индивидуальная скорость в группе соответствовала скорости виртуального в- агента, сохраняя при этом определенную дистанцию.

ир

Фр (Яг) и Ь i к (Я1) в и* определяются как

Яг - Яг, к

ФР( Яг )= , ц • * - 1 , (20)

V1+е р||я* я*• к ||

Ьг, к (Яг ) = Р*

Яг - Яг

г, к

(21)

где ев — нормальное число, а г о — максимальное расстояние обнаружения БПЛА относительно препятствия.

Упрощенный алгоритм многоагентной модели роения

Конструкция Олфати-Сэйбера имеет множество параметров искусственного потенциального поля и характеризуется громоздкими вычислениями. Принимая во внимание требования системы управления БПЛА к вычислительной эффективности, было проведено упрощение модели Олфати-Сэйбера с учетом только условия искусственного потенциального поля и условия согласования скоростей и условия наведения.

Решетчатые и квазирешеточные структуры. В многоагентной системе если расстояние между каждым агентом и соседним агентом одинаково, относительное положение многоагентной системы составляет решетчатую структуру.

Если расстояние между агентом и соседним агентом не может быть точно одинаковым, а изменяется в пределах определенного диапазона, то относительные позиционные отношения муль-

тиагента образуют структуру квазирешетки. Для квазирешеточной структуры расстояние между соседними агентами примерно одинаково.

Разработка многоагентного алгоритма роения. Алгоритм многоагентного роения предполагает такой управляющий ввод и , который заставит относительные пространственные положения мультиагентов образовывать структуру, подобную решетке или квазирешетке, и сводить вектор скорости мультиагентов к согласованному значению. Алгоритм Олфати-Сэйбера представляет элемент управления и -го агента как комбинированное действие трех элементов управления:

u¡ = ug + ^ + и], (22)

£

где иг — элемент искусственного потенциального поля, используемый для реализации агрегации и предотвращения столкновений агентов; и^1 — элемент сопоставления скорости, используемый для реализации сопоставления скорости; и] — элемент руководства, используемый для отслеживания виртуального лидера, чтобы группа агентов двигалась в соответствии с желаемым направлением.

Эффекты искусственного потенциального поля и сопоставления скоростей отражают три принципа роения Рейнольдса. Однако если начальное положение группы агентов распределено случайным образом, топология связи системы может быть несвязанной, что приведет к разделению группы. Эффект руководства позволяет всем агентам отслеживать одного и того же виртуального лидера, а группа агентов собирается от начальной позиции до виртуального лидера, увеличивая связность топологии системы и избегая разделения групп.

Проектирование искусственного потенциального поля. Существует множество параметров искусственного потенциального поля, первоначально разработанных в модели Олфати-Сэйбера, что привело к громоздкому расчету. Для преодоления этого недостатка искусственное потенциальное поле было переработано, физическое значение при этом приобрело более четкий характер, параметры стали лучше отлажены, а расчет силы потенциального поля стал более лаконичен.

При этом функция инструмента проектирования заключается в следующем.

Функция плавного шага второго порядка 51 (г) и s2 (г )

(r ) =

1, r < ra

r - ra r - r,

0, r > r

Ph (z), z =-^, ra < r < rb, (23)

(г ) = 1 - j, (г ), (24)

где г , гь — левая и правая границы интервала шагов; ph (z) должна быть гладкой функцией второго порядка, зависит от детальных требований и граничных условий, например:

13" 1

ph (z) = — +—т-г cos nz--т-г- cos3nz. (25)

2 2 (3" -1) 2 (3" -1)

Представим функцию плавного шага второго порядка s3 ( г) в виде

J (г ) = J (г ) г + (га + гъ) ^ (г )/2, (26)

где г , гь используется для настройки интервального диапазона функции насыщения.

Функция силы искусственного потенциального поля, предназначенная для имитации линейной структуры, выглядит следующим образом:

/ ( г ) = А ( Г - г0 ) 5! ( Г),

(27)

где г — относительное расстояние между двумя соседними агентами; г0 — расстояние действия, когда сила искусственного потенциального поля равна нулю; / — амплитуда силы потенциального поля, когда относительное расстояние между двумя соседними агентами равно нулю. Степенная функция может быть получена путем интегрирования силовой функции следующим образом:

ф( г ) = .[/(2) ^

(28)

При г = г0 сила потенциального поля / (г0) = 0, соседний агент находится в равновесии, а энергия потенциального поля ф(г0 ) = 0 имеет минимальное значение. При г < г0, / (г) « ~ /0 /г0'(г - г0 ) < 0, сила потенциального поля пропорциональна относительному расстоянию между агентами и проявляется как сила отталкивания. Если ф (г ) « / /2г0 - (г - г0 ) , то относительная сила между агентами аналогична упругости отталкивания. При г > г0, в меньшем диапазоне, / (г) > 0, это проявляется как относительное притяжение между агентами, которое используется для организации образований роя; в большем диапазоне /(г) сходится к нулю, чтобы избежать взаимного вмешательства между агентами, не являющимися соседями, и потенциальная функция сходится к значению е0, которое представляет минимальную энергию для разделения соседних агентов.

Таким образом, функция /(гст) силы искусственного потенциального поля и потенциальная функция ф(гст) выглядят следующим образом:

/0

/ ( г ) = ^ ( г - г ) 5! ( г), г0

ф( г )=[Г/ (7)

(29)

Элементы искусственного потенциального поля. Пусть 1-й агент находится в искусственном потенциальном поле, генерируемом у'-м агентом, и потенциальная функция выражается следующим образом:

ф,

(IIV у -яII) = ф(||V у -),

(30)

*

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где | | || представляет значение векторного модуля. Потенциальная сила поля, создаваемая г-м агентом от у'-м агентом, представляет собой отрицательный градиент энергии потенциального поля в положении г-го агента:

4' (Iъ - я II) = -Уяг фг,у (Iъ - я II) = / (IIъ - я II)П',

(31)

где п— единичный вектор, представляющий положительное направление потенциальной силы п оля, от г-го агента ку'-му агенту; / ( ду - qi ) — амплитуда потенциальной силы поля. Если расстояние между г-м агентом и -м агентом мало, амплитуда отрицательна, и потенциальная

сила поля ,-го агента направлена от j-го агента к ,-му агенту, что является силой отталкивания. Если расстояние между ,-м агентом и j-м агентом велико, амплитуда положительна, и потенциальная сила поля ,-го агента направлена от ,-го агента к j-му агенту, что является силой гравитации.

Если ,-й агент находится в группе агентов, полученная потенциальная сила поля представляет собой совокупную силу потенциальных сил поля, создаваемых всеми другими соседними агентами, которая выражается следующим образом:

fg = Е ft,j (II - q||).

(32)

jeNt

Согласование скорости агентов. Роль согласования скорости заключается в том, чтобы группа агентов имела одинаковую скорость движения. Агент динамически регулирует свою собственную скорость на основе информации о скорости соседнего агента, вычисляет суммарную скорость соседнего агента на основе принципа векторной суперпозиции и использует её среднее значение в качестве собственной желаемой скорости. В фактическом расчете агент вычисляет разницу между соседним агентом и его собственным вектором скорости и принимает векторную сумму разницы в качестве члена соответствия скорости, который выражается следующим образом:

Г" = 1 < ( , Ч, )(Р, - Р.■ ) , (33)

где а^ ( ч*, ч, ) — весовой коэффициент, представляющий собой плавную ступенчатую функцию

второго порядка относительного расстояния агента

а d

ij

(q, ) = (|- q, I). (34)

При перемещении группы агентов изменяется относительное положение группы, и соответственно изменяется отношение соседей между агентами. Когда один агент входит в соседство с другим агентом и выходит из него, эффект члена согласования скорости возникает или исчезает. Благодаря функции плавного шага второго порядка этот процесс изменения может быть сглажен. Можно избежать силовых мутаций и формировать способность поддержания стабильности.

Руководство движением роя. Предположим, что в группе агентов есть виртуальный лидер, который планирует маршрут движения группы в соответствии с заданной задачей или отслеживает определенную цель движения. Виртуальный лидер рассчитывает свое собственное управление с помощью алгоритма отслеживания траектории или отслеживания цели, чтобы двигаться по желаемой траектории. Модель виртуального лидера выглядит следующим образом:

{•Леайег _ 1еас1ег

q =Р , (35)

Р ^ = и1еа'ег

leader ^ т->3 1ва^г _ т->3

где q е R — вектор положения виртуального лидера; p е R — вектор скорости вирту-

leadeг

ального лидера; u — вектор управления виртуального лидера. Виртуальный лидер передает информацию о своем местоположении и скорости группе агентов во время движения, и группа агентов подчиняется виртуальному лидеру с помощью элемента управления, чтобы сформировать рой вокруг виртуального лидера.

Тогда руководящий сигнал алгоритма роения выражается как

rleader leader ( leader \ , leader ( leader \

f _ c (q > 4i)+c2 (p -Pi)> (36)

где c[eader [qIeade\ q^ — часть согласования положения, которая является функцией плавного насы-

leader I leader \ leader

щения второго порядка; c2 I р - рЛ — часть согласования скорости и с2 — постоянный коэффициент; CjfeaAr ( qIeader, q^ определяется следующим образом:

„leader _ „

leader ( leader q\ _ leader s i\\ leader _ _li (37)

C1 \4 , 4i)~ Ч Л3 ЦЧ 4i\\) II leader _ q II '

||q qi ||

где c1ader — коэффициент, соответствующий положению; s3 (*) — функция насыщения второго

leader „

порядка; q - qt 11 — расстояние между агентом и виртуальным лидером.

Сигнал наведения может позволить агентам собираться на позиции виртуального лидера и соответствовать вектору скорости виртуального лидера, чтобы обеспечить связь топологии связи многоагентной системы и сформировать роевое формирование. С другой стороны, из-за притяжения направляющего агента (лидера), который влияет на силу агента, исходная решетчатая структура образования между мультиагентами может нарушать квазирешетчатую структуру образования. Причина в том, что сила, создаваемая согласованием положения в термине наведения, пропорциональна расстоянию между агентом и виртуальным лидером. Агенты на периферии группы агентов подвергаются большему усилию и сжимаются внутри формирования, разрушая однородность формирования. Выражение части определения положения, соответствующей положению, в качестве функции насыщения может помочь избежать чрезмерного воздействия на периферийные агенты и вызвать помехи в формировании.

Основываясь на всеобъемлющей модели агента, терминах искусственного потенциального поля, терминах согласования скорости и терминах руководства, представление роевого формирования многоагентных систем выглядит следующим образом:

•leader _ leader

q _ P

P ^ _-Vq Хф,

- 1 - ^ - р^' р'д1еа"ег'р1еааег)'(38)

' ^ ;е г

Заключение

Таким образом, с помощью предложенного метода синтезируется координирующее управление, обеспечивающее согласованное управление БПЛА в группе с целью достижения желаемой траектории движения. При решении задачи управления полетом группы БПЛА, центральное место занимает выбор математической модели для описания пространственного движения группы летательных аппаратов, поскольку уравнения динамики представляют собой сложную систему нелинейных дифференциальных уравнений, которая включает кинематические уравнения, уравнения сил, уравнения моментов, а также совокупность уравнений связей параметров движения в различных системах координат. Использованная в работе модель относительного движения позволяет декомпозировать совокупность уравнений динамики группы летательных аппаратов в набор моделей движения лидера и ведомых БПЛА.

Такой подход позволил упростить анализ задачи управления группой БПЛА, упростить переход к новой базовой системе отсчета при измерении координат относительного движения, а также упростить техническую реализацию выбранной базовой системы координат на борту БПЛА, что определяет простоту всей системы управления и в особенности её измерительной части.

В результате удалось реализовать принцип координирующего управления, которое обеспечивает перевод вектора переменных состояния в заданную область за один такт управления.

В группе агентов находится виртуальный лидер, который планирует маршрут движения группы в соответствии с заданной задачей и отслеживает определенную цель движения. Виртуальный лидер рассчитывает свое собственное управление с помощью алгоритма отслеживания траектории или отслеживания цели, чтобы двигаться по желаемой траектории. При этом сигнал наведения может позволить агентам собираться на позиции виртуального лидера и соответствовать вектору скорости виртуального лидера, чтобы обеспечить связь топологии связи в многоагентной системе и сформировать роевое формирование.

СПИСОК ЛИТЕРАТУРЫ

1. Ефанов В.Н., Мизин С.В., Неретина В.В. Управление полетом БПЛА в строю на основе координации взаимодействия группы летательных аппаратов // Вестник УГАТУ. 2014. Т. 18, № 1 (62). С. 114-121.

2. Pachter M., D'Azzo J.J., Proud A.W. Tight formation flight control // J. of Guidance, Control, and Dynamics, 2001, 24 (2): 246-254.

3. Zhang X.Y., Duan H.B., Yu Y.X. Receding horizon control for multi-UAVs close formation control based on differential evolution // Science China Information Sciences, 2010 (53): 223-235.

4. Mu Y. Research on aerodynamic coupling in UAV formation. Xi'an: Northwestern Polytechnical University, 2006.

5. Pollini L., Giulietti F., Innocenti M. Robustness to communication failures within formation flight // American Control Conference. Anchorage, AK, 2002: 2860-2866.

6. Gautier H., Simon L., Rachid A. Formation flight: Evaluation of autonomous configuration control algorithms // IEEE / RSJ Internat. Conf. on Intelligent Robots and Systems, San Diego, USA, 2007: 2628-2633.

7. Giulietti F., Pollini L., Innocenti M. Autonomous formation flight // IEEE Control Systems Magazine, 2000 (12): 566-572.

8. Joâo S., Tunc S., Pravin V. Task planning and execution for UAV teams // IEEE Conference on Decision and Control. Atlantis, Bahamas, 2004: 3804-3810.

9. Lechevin N., Rabbath C.A., Lauzon M. Cooperative and deceptive planning of multi-formations of networked UCAVs in adversarial urban environments // AIAA Guidance, Navigation and Control Conference and Exhibit. Hilton Head, South Carolina, AIAA-2007-6410.

10. Reyna V.R., Pachter M., D'Azzo J.J. Formation flight control automation. AIAA: AIAA-94-3557, 1994.

11. KOO T.J., Shahruz S.M. Formation of a group of unmanned aerial vehicles (UAVs) // Proc. of the American Control Conf. Arlington, VA, 2001: 69-74.

12. Zong L., Xie F., Qin S. Intelligent optimal control of UAV formation flight based on MAS // J. of Aeronautics and Astronautics, 2008, 29 (5): 1326-1333.

13. Shin J., Kim H.J. Nonlinear model predictive formation flight // IEEE Transactions on Systems, Man and Cybernetics, 2009, 39 (5): 1116-1125.

14. Fidelis A.P.L., Tiauw H.G. A collision-free formation reconfiguration control approach for unmanned aerial vehicles // Internat. J. of Control, Automation, and Systems, 2010, 8 (5): 1100-1107.

15. Fidelis A.P.L., Tiauw H.G. Reconfiguration control with collision avoidance framework for unmanned aerial vehicles in three-dimensional space // J. of Aerospace Engineering, 2013, 26 (3): 637-645.

16. Xiong W., Chen Z., Zhou R. Optimization method for multi-aircraft formation reconstruction using hybrid genetic algorithm // J. of Aeronautics and Astronautics, 2008(29): 209-214.

17. Ye Q., Hu X., Ma H. Two-stage solution method for coordinated target assignment of multi-UAV formations // J. of Hefei University of Technology, 2015, 38 (10): 1431-1436.

18. Dai J., Li X., Sun Y., et al. Research on coordinated target allocation method for multi-formation ground attack // J. of System Simulation, 2009, 21 (8): 2148-2151.

19. Reynolds C.W. Flocks, herds, and schools: A distributed behavioral model // Comput. Graph. (ACM SIGGRAPH'87 Conf. Proc.), Jul. 1987, vol. 21, Pp. 25-34.

20. Czirok A., Vicsek M., Vicsek T. Collective motion of organisms in three dimensions // Physica A, 1999, 264 (1-2): 299-304.

21. Qiu H., Duan H. Pigeon interaction mode switch-based UAV distributed flocking control under obstacle environments // ISA Transactions, 2017, 71 (1): 93-109.

22. Jadbabaic A., Lin J., Morse A.S. Coordination of groups of mobile autonomous agents using nearest neighbor rules // IEEE Transactions on Automatic Control, 2003, 48 (6): 988-1001.

23. Cucker F., Smale S. Emergent behavior in flocks // IEEE Trans Autom Control, 2007, 52 (5): 852-862.

24. Ballerini M., Cabibbo N., Candelier R. Interaction ruling animal collective behavior depends on topological rather than metric distance: Evidence from a field study // Proc. of the National Academy of Sciences, 2008, 105 (4): 1232-1237.

25. George M., Ghose D. Reducing convergence times of self-propelled swarms via modified nearest neighbor rules // Physic A, 2012, 391 (16): 4121-4127.

26. Vicsek T., Czirok A., Ben-Jacob E., et al. Novel type of phase transition in a system of self-driven particles // Physical Review Letters. 1995, 75 (6): 1226-1229.

27. Couzin D., Jens K., Richard J., Ruxton G.D., Franks N.R. Collective memory and spatial sorting in animal groups // J. of Theoretical Biology, 2002, 218 (1): 1-11.

28. Motsch S., Tadmor E. A new model for self-organized dynamics and its flocking behavior // J. of Statistical Physics, 2011, 144 (5): 923-947.

29. Olfati-Saber R. Flocking for multi-agent dynamic systems: Algorithms and theory // IEEE Transactions on Automatic Control, 2004, 51 (3): 401-420.

30. Li Z., Xue X. Cucher-Smale flocking under rooted leadership with fixed switching topologies // SIAM J. on Applied Mathematics, 2010, 70 (8): 3156-3174. DOI: 10.1137/100791774

REFERENCES

1. Yefanov V.N., Mizin S.V., Neretina V.V. Upravleniye poletom BPLA v stroyu na osnove koordinatsii vzaimodeystviya gruppy letatelnykh apparatov. Vestnik UGATU, 2014, vol. 18, No. 1 (62), Pp. 114—121. (rus)

2. Pachter M, D'Azzo J.J., Proud A.W. Tight formation flight control. Journal of Guidance, Control, and Dynamics, 2001, 24 (2): 246-254.

3. Zhang X.Y., Duan H.B., Yu Y.X. Receding horizon control for multi-UAVs close formation control based on differential evolution. Science China Information Sciences, 2010 (53): 223-235.

4. Mu Y. Research on aerodynamic coupling in UAV formation. Xi'an: Northwestern Polytechnical University, 2006.

5. Pollini L., Giulietti F., Innocenti M. Robustness to communication failures within formation flight.

American Control Conference, Anchorage, AK, 2002: 2860-2866.

6. Gautier H., Simon L., Rachid A. Formation flight: Evaluation of autonomous configuration control algorithms. IEEE/RSJ International Conference on Intelligent Robots and Systems, San Diego, USA, 2007: 2628-2633.

7. Giulietti F., Pollini L., Innocenti M. Autonomous formation flight. IEEE Control Systems Magazine, 2000 (12): 566-572.

8. Joâo S., Tunc S., Pravin V. Task planning and execution for UAV teams. IEEE Conference on Decision and Control, Atlantis, Bahamas, 2004: 3804-3810.

9. Lechevin N., Rabbath C.A., Lauzon M. Cooperative and deceptive planning of multi-formations of networked UCAVs in adversarial urban environments. AIAA Guidance, Navigation and Control Conference and Exhibit, Hilton Head, South Carolina, AIAA-2007-6410.

10. Reyna V.R., Pachter M., D'Azzo J.J. Formation flight control automation. AIAA: AIAA-94-3557, 1994.

11. KOO T.J., Shahruz S.M. Formation of a group of unmanned aerial vehicles (UAVs). Proceedings of the American Control Conference, Arlington, VA, 2001: 69—74.

12. Zong L., Xie F., Qin S. Intelligent optimal control of UAV formation flight based on MAS. Journal of Aeronautics and Astronautics, 2008, 29 (5): 1326—1333.

13. Shin J., Kim H.J. Nonlinear model predictive formation flight. IEEE Transactions on Systems, Man and Cybernetics, 2009, 39 (5): 1116-1125.

14. Fidelis A.P.L., Tiauw H.G. A collision-free formation reconfiguration control approach for unmanned aerial vehicles. International Journal of Control, Automation, and Systems, 2010, 8 (5): 1100-1107.

15. Fidelis A.P.L., Tiauw H.G. Reconfiguration control with collision avoidance framework for unmanned aerial vehicles in three-dimensional space. Journal of Aerospace Engineering, 2013, 26 (3): 637-645.

16. Xiong W., Chen Z., Zhou R. Optimization method for multi-aircraft formation reconstruction using hybrid genetic algorithm. Journal of Aeronautics and Astronautics, 2008 (29): 209-214.

17. Ye Q., Hu X., Ma H. Two-stage solution method for coordinated target assignment of multi-UAV formations. Journal of Hefei University of Technology, 2015, 38 (10): 1431-1436.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

18. Dai J., Li X., Sun Y., et al. Research on coordinated target allocation method for multi-formation ground attack. Journal of System Simulation, 2009, 21 (8): 2148-2151.

19. Reynolds C.W. Flocks, herds, and schools: A distributed behavioral model. Comput. Graph. (ACM SIGGRAPH'87Conf. Proc.), Jul. 1987, vol. 21, Pp. 25-34.

20. Czirok A., Vicsek M., Vicsek T. Collective motion of organisms in three dimensions. Physica A, 1999, 264 (1-2): 299-304.

21. Qiu H., Duan H. Pigeon interaction mode switch-based UAV distributed flocking control under obstacle environments. ISA Transactions, 2017, 71 (1): 93-109.

22. Jadbabaic A., Lin J., Morse A.S. Coordination of groups of mobile autonomous agents using nearest neighbor rules. IEEE Transactions on Automatic Control, 2003, 48 (6): 988-1001.

23. Cucker F., Smale S. Emergent behavior in flocks. IEEE Trans Autom Control, 2007, 52 (5): 852-862.

24. Ballerini M., Cabibbo N., Candelier R. Interaction ruling animal collective behavior depends on topological rather than metric distance: Evidence from a field study. Proceedings of the National Academy of Sciences, 2008, 105 (4): 1232-1237.

25. George M., Ghose D. Reducing convergence times of self-propelled swarms via modified nearest neighbor rules. Physic A, 2012, 391 (16): 4121-4127.

26. Vicsek T., Czirok A., Ben-Jacob E., et al. Novel type of phase transition in a system of self-driven particles. Physical Review Letters, 1995, 75 (6): 1226-1229.

27. Couzin.D., Jens K., Richard J., Ruxton G.D., Franks N.R. Collective memory and spatial sorting in animal groups. Journal of Theoretical Biology, 2002, 218 (1): 1-11.

28. Motsch S., Tadmor E. A new model for self-organized dynamics and its flocking behavior. Journal of Statistical Physics, 2011, 144 (5): 923-947.

29. Olfati-Saber R. Flocking for multi-agent dynamic systems: Algorithms and theory. IEEE Transactions on Automatic Control, 2004, 51 (3): 401-420.

30. Li Z., Xue X. Cucher-Smale flocking under rooted leadership with fixed switching topologies. SIAM Journal on Applied Mathematics, 2010, 70 (8): 3156-3174. DOI: 10.1137/100791774

INFORMATION ABOUT AUTHOR / СВЕДЕНИЯ ОБ АВТОРЕ

Чжу Юйцин

Zhu Yuqing

E-mail: [email protected]

Поступила: 13.07.2022; Одобрена: 18.12.2022; Принята: 12.01.2023.

Submitted: 13.07.2022; Approved: 18.12.2022; Accepted: 12.01.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.