УДК 51-74:519.6
DOI: 10.18698/0236-3933-2020-4-114-133
СИНТЕЗИРОВАННОЕ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ГРУППОВЫМ ВЗАИМОДЕЙСТВИЕМ КВАДРОКОПТЕРОВ НА ОСНОВЕ МНОГОТОЧЕЧНОЙ СТАБИЛИЗАЦИИ
А.И. Дивеев1 Е.Ю. Шмалько1 О. Хуссейн2
1ФИЦ ИУ РАН, Москва, Российская Федерация 2РУДН, Москва, Российская Федерация
Аннотация
Рассмотрена задача оптимального управления групповым взаимодействием трех квадрокоптеров. Группа из трех квадрокоптеров перемещает груз из одной точки пространства в другую, не задев препятствий, при этом масса груза не позволяет выполнить задачу одним квадрокоптером. Для решения задачи использован метод синтезированного оптимального управления на основе многоточечной стабилизации. Метод называется синтезированным, поскольку сначала решается задача синтеза системы стабилизации для каждого робота, на следующем этапе решается задача оптимального расположения точек стабилизации в пространстве состояний так, что при переключении этих точек от одной к другой через заданный интервал времени квадрокоптеры перемещают груз из начальной позиции в конечную с оптимальным значением критерия качества. Для решения задачи синтеза использован метод сетевого оператора. Все фазовые ограничения, описывающие групповое взаимодействие и препятствия, включены в критерий качества методом штрафных функций. Для поиска позиций точек использован эволюционный алгоритм оптимизации роя частиц
Ключевые слова
Групповое взаимодействие, оптимальное управление, синтез системы стабилизации, метод роя частиц, эволюционный алгоритм, группа квадрокоптеров, фазовые ограничения
Поступила 01.05.2020 Принята 16.06.2020 © Автор(ы), 2020
Работа поддержана грантом РФФИ № 18-29-03061-мк (разделы 3-5) и грантом РНФ N0 19-11-00258 (разделы 1,2)
Введение. В настоящее время при решении определенных задач часто используется не один робот, а группа роботов, при этом требуется разработка системы управления групповым взаимодействием роботов [1]. Здесь возникает два альтернативных подхода.
Первый подход состоит в рассмотрении задачи управления групповым взаимодействием объектов как задачи управления одним сложным объектом, состоящим из нескольких более простых объектов. В этом случае предполагается, что на одном объекте или вне его существует центральная система управления, которая отвечает за управление всеми объектами группы и выполнение целевой задачи. При синтезе такой центральной системы управления следует учитывать, что размерность агрегированной модели объекта управления существенно возрастает и в простейшем случае равна сумме размерностей моделей каждого объекта группы. При таком управлении центральная система управления должна также разрешать все коллизии, возникающие, например, при опасности столкновения объектов группы между собой.
Второй подход состоит в декомпозиции задачи управления на несколько более простых задач отдельно для каждого объекта управления группы. Данная декомпозиция не всегда возможна, например, если необходимо нескольким мобильным объектам управления переместить груз из одной точки пространства в другую, то невозможно разделить массу груза для каждого объекта. Объекты в этом случае должны взаимодействовать и в процессе выполнения задачи динамически перераспределять нагрузку между собой в зависимости от формальных оценок качества выполнения задачи, положения объектов и груза.
Возможна также комбинация обоих подходов, когда задачи синтеза системы управления каждым объектом решаются по отдельности, но с учетом того, что объект управления должен быть использован в дальнейшем в группе. Затем решается задача управления группой как задача управления целями каждого объекта группы.
В настоящей работе рассматривается прикладная задача управления групповым взаимодействием квадрокоптеров. Группа из трех квадрокоптеров должна переместить груз на гибких тягах из одной точки пространства в другую (рис. 1). На пути перемещения груза могут размещаться некоторые препятствия, положение которых известно заранее. Масса груза не позволяет выполнить задачу одним квадрокоптером.
Для эффективного решения поставленной задачи необходимо учитывать групповое взаимодействие объектов управления. Формально в рассматриваемой задаче заданы математические модели объектов управления, ограничения на управление, фазовые ограничения, начальное терминальное состояние, определяющие выполнение работы, а также некоторый критерий качества управления. Необходимо построить систему управления группой летающих роботов для достижения цели управления с оптималь-
Рис. 1. Схема взаимодействия трех квадрокоптеров в группе: В, Е — начальное и конечное положения квадрокоптеров; цилиндры — препятствия; штриховые линии — возможные траектории движения квадрокоптеров; круг — груз
ным значением заданного критерия качества. Полученная система управления также должна быть мало чувствительной к внешним возмущениям и неопределенностям математических моделей объектов управления.
Необходимо найти оптимальное управление всеми квадрокоптерами, чтобы они перемещали груз из заданного исходного положения в заданное конечное положение, минуя препятствия, которых должны избегать квадрокоптеры, груз и тяги. Критерий качества управления определяется скоростью доставки груза до пункта назначения. Квадрокоптеры должны находиться на определенном расстоянии от груза, не сталкиваясь друг с другом, чтобы участвовать в допустимом распределении нагрузки по всем трем квадрокоптерам.
Обычно разработчики систем управления изначально делают объект устойчивым, а затем ищут оптимальное управление. В настоящей работе применен новый подход синтезированного оптимального управления [2, 3]. Подход заключается в решении на первом этапе задачи синтеза стабилизирующего управления, обеспечивающего устойчивость объекта управления относительно некоторой заданной точки стабилизации в пространстве состояний. На втором этапе осуществляется поиск координат нескольких точек стабилизации с использованием методов конечномерной оптимизации. Управление осуществляется путем переключения точек стабилизации от одной к другой через заданный интервал времени.
Преимущества такого подхода состоят в том, что все этапы разработки реализуются на ЭВМ. Подход является универсальным и не ограничивается определенными типами моделей объектов управления или функционалов качества управления. За счет численного решения задачи синтеза системы стабилизации на первом этапе удается нивелировать некоторые неопределенности моделей объектов управления.
Математическая постановка задачи. Рассмотрим квадрокоптеры одного типа: симметричные, с четырьмя винтами [4]. Математическую модель квадрокоптера задает следующая система дифференциальных уравнений:
х( = х{+ (х}5 sin х( + х{ eos х() sin x{¡cos х{;
х}2 = (xJ5 sinх( + x}6 cos x\)jcos x{;
х3ъ = (xJ5 sin x{ + xJ6 cos x{);
xi=44{i2-h)lh+M{lh;
xl=xixl(I3-h)/l2+Mi/l2;
xi = x{xi(h-I2)/h+MÍ/l3; (1)
X7 = X10' = XU>
X9 = X12'
x(0 = FÍ sin x}3 cos x32 cos x( + sin x( sin x^-w(;
x}n = FÍ cosx\ cosx{ cosx{-g-wJ2;
x{2 = FÍ sin x[ cos x[ - cos x{ sin x[ sin x33 - w]3, где j — номер квадрокоптера; x(, x\ — углы поворота квадрокоптера j вокруг горизонтальных осей; х2 — угол поворота квадрокоптера j вокруг вертикальной оси; х{ w. х^ — угловые скорости вращения квадрокоптера j вокруг горизонтальных осей; х}5 — угловая скорость вращения квадрокоптера j вокруг вертикальной оси; х\, Хд — координаты центра масс квадрокоптера j на горизонтальной плоскости; х% — высота квадрокоптера j; x{Q, x{v х{2 — проекции линейной скорости квадрокоптера j на соответствующие оси; I¡ — моменты инерции квадрокоптера вокруг осей x¿, i = 1, 2, 3; M¡ — управляющие моменты, создаваемые винтами квадрокоптера j вокруг осей Xi, i = 1,2,3; F-> — общая тяга четырех винтов квадрокоптера с учетом поправки на массу т; g — ускорение свободного падения; — компоненты весовой нагрузки квадрокоптера j от веса переносимого груза, к = 1, 2, 3; w¡, w{, w33 — проекции нагрузки на оси х7, Xg, хд соответственно.
Положение груза определяем вектором у е Е3 состояния центра масс груза в подпространстве {х7, Xg, хд}:
У = Ь\ У2 УзГ, (2)
где у\, у г, уз — положения центра масс груза по осям Х7, хв, хд соответственно.
Задано начальное и конечное положения груза:
у° =[у0 у0у07> (3)
у/=[у{ у{ у(]\ (4)
Полагаем, что все три квадрокоптера одинаковы, а тяги, за которые они перемещают груз, имеют одинаковую длину: <¿1 = <¿2 = <¿3 =
Для равномерного распределения нагрузки на квадрокоптеры три квадрокоптера всегда должны находиться на одной высоте и быть расположены в вершинах равностороннего треугольника, от которого зависит высота груза. Пусть треугольник определяет радиус описанной окружности
Но. Тогда разность высот квадрокоптера ] = 1, 2, 3, и груза у2 найдем
4-У2=^2-Щ, ;' = 1,2,3. (5)
Определим проекции силы реакции нагрузки на каждый квадрокоп-тер (рис. 2):
= ЛУ1 + + (6)
Чтобы определить проекции указанных сил реакции с равносторонним треугольником, который образуют квадрокоптеры, введем дополнительную систему координат (рис. 3).
Рис. 2. Силы реакции нагрузки, действующие на квадрокоптеры
Рис. 3. Расположение квадрокоптеров в равностороннем треугольнике
Для расчета проекций сил реакций необходимо знать угол поворота т равностороннего треугольника, образованного квадрокоптерами, относительно инерциальной системы координат. Полученные уравнения имеют вид:
W[ = —
Ro =COS Т/d-, w12=\w1\y¡d2-R2/d; w\ = w1 So sin x/d-, w\ =|w2|k0 (cos t + -s/3sin x^jld-,
wj = \w2yd2-R%/d;
wi =|w2|ä0 (sin t-Vicos x^jld-, w\ =|w3|ä0 (cos T-VJsin x^jld-,
w2 = |w3|a/<¿ -Rq jd\
Ro (sin т + л/з cos x^jld,
(7)
(8)
(9)
w\ = w
где
= ^(w{)2-(wi2)2+(wi3)2, i = 1,2,3; Ro = ^3((4-*7)2+(*9-*9)2)Д
Xg (Xg "i" Xg + Xg )/3
t = arctg
X'j (Xj + X'j + X'j
(10) (и)
(12)
Дополнительные фазовые ограничения в задаче оптимального управления определяются расположением квадрокоптеров в вершинах равностороннего треугольника на одной высоте и имеют вид:
xi = |(*7 - х7 )2+(4 - *9 )2 - («7 - ^ )2 - (4 - 4 )21 ~ 8Р ^
х2 = |(*7 " *7 )2 + (*9 - 4 )2 - (*7 " ■Х7 )2 - (*9 " *9 )2|":ЕР * Хз =\(x¡-xi)2 -(x¡-x¡)2\-ep <0;
х4 = | (*8 - *8 )2 ~ (Xi ~ Х8 )21 - 'БР < °> где sр —заданное небольшое положительное число. Координаты груза определяем из уравнений:
ух =x^-^Li>2/3 eos Q;
y2=xl-^d2-L1>2/3;
Уз = 4 - (*7 ~ VLl>2/3 sin Q)'
где Q = arctg(| x2 |/| Li; 2 = -x2)2 +{x\ -x|)2.
(13)
(14)
Расстояние между каждым квадрокоптером и грузом не может быть больше и не должно быть значительно меньше длины тяги с1. Данные ограничения формализуем в виде следующей системы неравенств:
Ф,(х1) = Ь-с1 <0; (15)
Фъ+1{х1) = й-1-гг<0, (16)
где Ь = у](х7 -у\)2 + (4 ~ У2)2 +(х'д - уз)2 > г = 1» 2, 3; ег — заданное малое положительное число.
В области перемещения грузов существуют препятствия, которые определяют дополнительные фазовые ограничения:
Ф6+(1_1)5+;(х1') = г} -^(4-XI,])2 +(4-Х2,})2 <0, (17)
где * = 1, 2, 3, ] = 1,..., 5(5 — число препятствий); гу — параметр препятствия }, определяющий размер препятствия; — координаты геометрического центра препятствия на плоскости {ху, х$}.
Далее запишем условия столкновения груза и тяг с препятствиями:
%4+1=Ч-^(у1-х1^)2+(у3-Х2,})2 <0; (18)
+ + ; = -х17)2+(х2,] ~х\)2 ~г/ < 0, (19)
где = 1,..., 5, г = 1, 2, 3.
Уравнение (19) включает в себя величины (х7, х9) — координаты точки пересечения проекции тяги на плоскость {х7, х9} и проекции перпендикуляра из центра препятствия к линии тяги. Для вычисления этих координат используем следующие отношения.
Если
>5 и
Х7-У1 значение, то
Ц~У з
> б, где 5 — небольшое положительное
х
t _.
(хг9-уз)2+(хг7-у!)2
и _ (4-уз) ~л (4 -уз)
^(4-уз) , (4-л) л
—.— — xh + Уз + ху i н--:--— хл \
(4-л) ; (4-уз) }
х9 — —т-х7----х7 + у3;
(4 ~yi) (4~ л)
(20) (21)
иначе, если
<8 и
х'9-у з
>8, то
Х7 — Х7, Х9 — X2ji
(22)
иначе, если
*7 ~У\
>6 и
Ц-Уз
<8, то
Ху Xi,j, Х99 — Х99.
<8 и
Ц~Уз
Здесь ) = 1,..., 5, I = 1,2,3.
Отметим, что условия Ху - у\
менно не выполняются.
Уравнения (19)-(23) формализуют условия отсутствия столкновения тяг, на которых перемещается груз, с препятствиями. (у\,уз) Геометрический смысл используемых переменных объясняет рис. 4.
Отметим, что фазовые ограничения, которые вытекают из условия отсутствия столкновений между роботами, учитывать не нужно, поскольку эти ограничения поглощены ограничениями группового взаимодействия: квадрокоптеры должны находиться в вершинах равностороннего треугольника (13).
Таким образом, всего в задаче имеется 4 + 45 фазовых ограничений, определяющих групповое взаимодействие квадрокоптеров, и 6 + 35 индивидуальных фазовых ограничений для каждого квадрокоптера.
В качестве критерия качества управления используем аддитивную свертку времени доставки груза в терминальное положение и точности доставки этого груза в конечную точку (24). Функционал качества управления также включает в себя условия нарушения фазовых ограничений в виде штрафных функций:
(x\j, X2j)
Рис. 4. Расположение тяги квадрокоптера и статическое фазовое ограничение
} = tf+ ai
tff , (
3 / -2 tf 4 + 4s
Z(yi(tf)-y¡) +0C2Í Z &(lj(x\x2,x3))dt + ¿=1V ; 0 j=í
+ a3j Z 9(®í(x¿)) + 9(03+i(xI))+Z»(®6+(«-i)s+;(x1))
■ " M .
o
dt^y
—» min ,
u-j(-), 7=1,2,3
(24)
Здесь a,- — весовые коэффициенты, i = 1, 2, 3; u-7 (■) = = [M/Q M{(•) M¡(•) Fi(-)]T ,j = 1,2,3; Э(А) —функцияХэвисайда,
Г1, если А > 0; 0 — иначе;
.И-
t, если t <t+ и Lc(t)<ef, t+ —иначе,
где
Задача (1)-(24) относится к 1слассу задач оптимального — управления с фазовыми ограничениями [5, 6]. Для ее решения часто используют численные методы поиска управления как функции времени [7]. Применение прямых или непрямых численных методов позволяет находить оптимальные траектории в пространстве состояний. Для перемещения квадроко-птеров по этим траекториям необходимо разработать систему стабилизации для каждого квадрокоптера, которая стабилизирует их как объекты управления вблизи этих оптимальных траекторий. Другой подход к решению этой задачи состоит в применении метода динамического программирования [8]. Этот метод позволяет находить управления в функции вектора пространства состояний, но используется, как правило, только для одного начального условия, что также влечет необходимость разработки системы стабилизации для каждого квадрокоптера. Применение же метода динамического программирования для области начальных условий является очень сложной вычислительной задачей.
Предлагаем для поставленной задачи оптимального управления в первую очередь решить задачу синтеза системы стабилизации. Это позволяет стабилизировать каждый квадрокоптер в точке пространства состояний. Затем для определения оптимального движения квадрокоптеров найдем оптимальные положения некоторых точек стабилизации, чтобы оптимизировать функционал (24). Такой метод решения задачи оптимального управления называется методом синтезированного оптимального управления [2,3].
Синтез системы стабилизации. Для решения задачи синтеза системы стабилизации можно применять, например, методы аналитического проектирования оптимальных [9, 10] и агрегированных [11, 12] регуляторов, метод с использованием функции Ляпунова [13, 14] или любой другой метод. Все они требуют ручного преобразования математической модели объекта управления.
В настоящей работе для синтеза системы стабилизации используется метод сетевого оператора [15, 16], который представляет собой метод символьной регрессии и позволяет автоматически находить математическое выражение в виде специального кода без предварительных аналитических преобразований. Метод сетевого оператора кодирует математическое выражение в виде целочисленной верхнетреугольной матрицы. Элементами матрицы являются номера элементарных функций с одним или двумя аргументами из базового набора функций. Более подробно узнать о методе сетевого оператора можно из работ [15,16].
При синтезе системы стабилизации рассмотрим модель (1) одного квадрокоптера = 1 без груза = 0, к = 1,2,3, и без фазовых ограничений (13)-(23). Зададим набор начальных условий и одно терминальное условие. Нужно найти такую функцию управления, которая обеспечит перемещение квадрокоптера из любых начальных условий в терминальное за минимальное время.
В результате синтеза системы стабилизации методом сетевого оператора получены функции управления обратной связи для каждой компоненты вектора управления и^(-) = [М/(-) М^(-) М^(-) ^(-)]т, ;' = 1,2,3. Математические выражения для каждой компоненты вектора управления имеют вид:
М,=
Mi , еслиМ,- < Mi ;
еслиМ,- >М+; х\ = Mi — иначе;
х1, еслиХ; < хГ;
х+, если х,- > х*; 1 = 1,2,3; (25) х(* — иначе;
F =
F~, ecnmF <F~; F+, ecjmF >F+; F — иначе;
(26)
где
Ml = (q4(xl-x4) + qi(xl -x\) + (x4 -x4)3 +^i(xi -*i) j +
+ {q4(x4 -x4) + qi(xi -Xi) + (X4-x4)3 -xi) j +
+ sgn(x6-x6)log(|q6{x*6 -x6)\ +1) + q2(x*2 -x2) + qi(x{ -Xi) + + sgn(X4 -x4)^\q4(xl-x4)\ + (q4(X4 -x4))3; M2 = sgn (sgn A\ exp (| Ai | -1)J sgnAi exp(|Ai |-1) |;
А.И. Дивеев, Е.Ю. Шмалько, О. Хуссейн
М3 = th (0,5Bi) - q3 (*з - х3) + sgn (Х5 -x5)log(| q5 (х*5 - х5) | +1) --х3 + х3 + 1[Bi + q6(x*6-x6) + q2(x2-x2)i М =Cl+(q3+l)(x*3-x3);
Bi = ( Q + q3 (xl - x3) )3 + q6 (x*6 - x6) + q2 (x*2 - x2); Q = sgn (*5 - x5) log (| q5 (X5 - *5) | +1); xl = ^A2q9(x(-x9)cosxn exj>(-qu)}lJÄ^\og^q9(x( -x9)cosxn|);
x2 = yfä + 2arctgC2 -qf0xf0 +D2-qi 1X11qj(x{-Xg)2-q7{x( -x7) + + arctg (A2q9 (x/ - x9) cos xi i exp (~q12) j + + arctg ( -gio^io + <37 (*/ - x7) j + q8 (x( - x8) +
+ sgn (<210*10 + 47 (xj - x7 <7io*i30 + <?7 (*7 - x7) I + th (-0,5X12 ) + + sgnB2 (exp(| B2 |)-l) + (x(A2q9(x/ -x9)cosXn exp(—^12»; x3 = sgn xi In (| xi I +1) + if&i + arctg C2 - qi0xfQ -x{ + + (-<310^10 +<?7(^7 -*7)) ; F = sinX3 + sgnx2 exp (| X2 | -1) + sgnx\ In(| xi | +1) + Cf + th (0,5B2) +
+ (Mq9 (x9 - x9) cos xi 1 exp(-<ji2) j +
+ th(0,5£2) + ( -gio^io + 47 (x{ ~ x7)) ; A2 = qi2xi2 + yfqiö + arctg q9 + cos (x/ - x7); B2 = arctg (-qioxfQ +q7(x/ - x7)) - q7 (x/ - x7) --311*11^8(*e ~x8)2+q8(xl -x8); C2 = sgn (-qio^io +17 (xi - X7)) (exp I -<710X10 + «?7 (xi - X7) I -1) + +
+ sgnX10Vi<210*10 \+\i(q7(x{ -x7));
Аг =2^агс^(-<2юх130 + Цу{ху -х8)2 -х8)-1 +
+ вдп (-<л1^11<?8 (*8 - *8 )2) ехр (-1 -ф 1*1(х{ - х8 )2 |) + + ехр (дю ) + ( -Пф0*10 + (*7 ~ *7 ) ) - (*/ - *7 ) ^;
(8§па, если |а|>1; фа = 1-ехр(-2а) ^ [а—иначе; 1 + ехр(-2а)
<21 =12,224, <?2 =14,197, =13,661, <24=4,361, =9,989, =4,114, <27 =0,115, =3,371, <29 = 3,076, дю =0,144, дц =3,131, <212 =4,515.
Решение получено в виде матрицы сетевого оператора и декодировано к виду (25). Для стабилизации объекта управления данные функции подставляются в правые части модели (1) объекта управления.
На рис. 5 приведены графики движения квадрокоптера из восьми начальных условий в нулевое терминальное состояние. Использованы следующие начальные условия:
х0'1 =[0 0 0 0 0 0 -0,5-0,5-0,5 0 0 0]т; х0'2 =[0 0 0 0 0 0 -0,5-0,5 0,5 0 0 0]т; х0'3 =[0 0 0 0 0 0 -0,5 0,5-0,5 0 0 0]т ; х0'4 =[0 0 0 0 0 0 -0,5 0,5 0,5 0 0 0]т ; х°'5= [0 0 0 0 0 0 0,5-0,5-0,5 0 0 0]т; х0'6 =[0 0 0 0 0 0 0,5-0,5 0,5 0 0 0]т ; х°'7=[0 0 0 0 0 0 0,5 0,5-0,5 0 0 0]т; х°'8= [0 0 0 0 0 0 0,5 0,5 0,5 0 0 0]т .
Выбранные начальные условия представляют собой вершины куба в трехмерном пространстве, а графики на рис. 5 показывают проекции пространственных траекторий на указанные плоскости.
Поиск оптимального расположения точек стабилизации. На втором этапе задача оптимального управления решается как задача поиска оптимального положения точек стабилизации. Поскольку положения двух любых квадрокоптеров зависят от положения третьего квадрокоптера и параметра Ко равностороннего треугольника, необходимо найти следующие оптимальные значения параметров:
/ 1,*1 1,м 1,*1 *1 *1\ / 1 ,*,к 1, *, к 1 ,*,к *, к *к\ ( . 1^7 , , хд , к() , x i,..., 1x7 , , хд >1*0 1> у^')
где К — число точек стабилизации.
-0,5 -0,4 -0,3 -0,2 -0,1
-0,4 -0,3 -0,2 -0,1 0 0,05 0,15 0,25 0,35 0,45
б
Рис. 5. Проекции траекторий движения квадрокоптера на плоскости {х7, х8} (а) и {х9, х8} (б)
Положения квадрокоптеров определяются по значениям найденных оптимальных параметров (27) из уравнений
= х7 - ! (cos xJ)/2 + (sin x*''') /2; х2/'{ =x
2, 1 1, i
-jÄn ICOST ' i/ztvjÄn isinx ' i/z; Xo =x<> :
(28)
x29' *' l=xy'1- 3r.y (sin x*' !')/2 - yf3r0'1 (cos x*' ')/2;
xj' 'l-х7' ' 1 -3Rq'* (cost ,l)j2-y[bR¿1 (sinx '%)¡2\ ''-Xg x} *'f = X9 *1 -3R¿1 (sin t* 1)¡2+>¡3R¡¡¿ (eos ¡2, где i = l, ...,K.
Для поиска оптимальных параметров (27) использован эволюционный алгоритм оптимизации роя частиц (PSO) [17, 18]. В качестве целевой функции использован функционал (24), который вычисляется при моделировании системы (1) с функциями управления (25), (26) в правых частях. Для искомых параметров (27) использовались следующие ограничения:
х) *'¿ е (0,12), xlg *'¿ е (0,8), х) ¿ е (0,12), 1 е (0,8, 1,5),
* i
т ' е(-л/4, л/4).
Искомые параметры (27) использовались группами по пять параметров:
1 * i 1 * ! 1 * Í первые три параметра х7' , Xg и Хд — координаты точки стаби-
* i * i
лизации, остальные параметры Rq' и т ' определяли конфигурацию роя. Переключение между группами параметров осуществляется через заданный интервал времени, равный 0,8 с. Поскольку предельное время процесса управления t+ = 4, число интервалов К = 5. Общее число оптимизируемых параметров равно 25. Использованы следующие значения свободных параметров алгоритма PSO: число возможных решений (частиц) в начальном наборе 64, число эволюционных циклов 16 384.
Для проведения вычислительного эксперимента заданы следующие параметры.
Начальные условия:
хЧ0) = [0 0 0 0 0 0 0,67 2 0 0 0 0]т; х2(0) = [0 0 0 0 0 0 -0,33 2 -0,87 0 0 0]т; х3(0) = [0 0 0 0 0 0 -0,33 2 -0,87 0 0 0]т.
Терминальное положение груза
у/ =[10 1 10]т.
Длина тяги d = 1,8 м. Число статических ограничений 5 = 4. Параметры ограничений:
ri=l, r2= 1, r3= 1, r4= 1, x\t i = 2,5, х2, i = 2,5, *i)2=7,5, х2,2=7,5, xi} з=2, х2,з = 8, 4=8, х4> i = 2.
Весовые коэффициенты: a¡ = 2,5, а2 = 2,5, аз = 2,5. Другие параметры: £р = 0,05, ег - 0,1, t+= 4, К = 5.
В результате получены следующие значения параметров:
х17'*Л =-1,137, 4'* 1 =2,257, 4,%1=0'85' i^'1 =1,919, тМ=-1,57,
* 2 = 11,072, 4' * 2 = 4,597, 4' ^ 2 = Ю, 936, B¡¡ 2 = 0,842, т*2 = -0,457,
4' *'3 = 4,786, 4" *'3 = 3>303> 4' *'3 = 2>556» 3 = °>535> т*'3 = !»508»
4' * 4 = 5,734, 4' 4 = 4,295, 4 *'4 = "1» 80> ^о 4 = 1» 416, т*4 = -0,745, 4'* 5 =-2, Xg'*'5 =1,261, 4'*'5 =5,957, J^'1 =0,676, т* 1 =1,305.
Проекции полученных траекторий квадрокоптера на горизонтальную плоскость {xj, х<э\ приведены на рис. 6. Точечная кривая показывает траекторию движения груза, красные круги — препятствия, черные квадратики — пять искомых точек стабилизации из (27). Видно, что квадрокоптеры и груз не касаются препятствий. Груз достиг конечной точки без столкновений и нарушения фазовых ограничений.
14 12 10 8 6 4 2
х7
0 --
-2
-2 0 2 4 6 8 10 12 14 Рис. 6. Траектории движения квадрокоптеров и груза на плоскости {х7,х9}
Заключение. Рассмотрена задача оптимального управления групповым взаимодействием квадрокоптеров: перемещение груза из исходного состояния в конечную точку тремя квадрокоптерами без столкновений и с оптимальным значением критерия качества. Для решения задачи использованы оригинальный метод синтезированного оптимального управления —
в первую очередь решена задача синтеза системы стабилизации квадрокоптеров, и метод символьной регрессии [15]. В задаче синтеза системы стабилизации математическая модель квадрокоптера разбита на две более простые модели — модели углового и пространственного движений. Поскольку пространственное управление квадрокоптером осуществляется путем наклона его на некоторый угол, синтез системы угловой стабилизации был решен в первую очередь. После этого решена задача синтеза системы пространственной стабилизации квадрокоптера. Для решения обеих задач использован метод сетевого оператора [16]. На втором этапе найдены оптимальные положения точек стабилизации в пространстве состояний. При поиске этих точек учитывались фазовые ограничения и критерий качества. Для поиска точек стабилизации использован эволюционный алгоритм. Расчетный пример выполнен для трех квадрокоптеров, которые должны перемещать груз из одной точки в другую заданную точку за минимальное время без столкновений и нарушения фазовых ограничений.
ЛИТЕРАТУРА
[1]Пшихопов В.Х., Медведев М.Ю. Групповое управление движением мобильных роботов в неопределенной среде с использованием неустойчивых режимов. Труды СПИИРАН, 2018, № 60, с. 39-63.
[2] Дивеев А.И., Шмалько Е.Ю. Метод синтезированного оптимального управления для группы роботов. Надежность и качество сложных систем, 2018, № 4, с. 40-47.
[3]Diveev A., Shmalko Е. Hybrid evolutionary algorithm for synthesized optimal control problem for group of interacting robots. CoDIT, 2019, pp. 876-971.
DOI: https://doi.Org/10.l 109/CoDIT.2019.8820344
[4] Гурьянов A.E. Моделирование управления квадрокоптером. Инженерный вестник, 2014, № 8. URL: http://ainjournal.ru/doc/723331.html
[5] Arutyunov A.V., Karamzin D.Y. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained. SIAM J. Control Optim., 2015, vol. 53, no. 4, pp. 2514-2540.
DOI: https://doi.0rg/lO.l 137/140981368
[6] Chertovskih R., Khalil N.T., Pereira F.L., et al. Path-constrained trajectory time-optimization in a three-dimensional steady flow field. Proc. 18th ECC, 2019, vol. 18, pp. 3746-3751. DOI: https://doi.Org/10.2514/3.11428
[7] Rao A.V. A survey of numerical methods for optimal control. Adv. Astr. Sc., 2010, vol. 135, no. 1, pp. 1-32.
[8] Bertsekas D.P. Dynamic programming and optimal control. Vol. 1. Athena Scientific, 1995.
[9] Mizhidon A.D. On a problem of analytic design of an optimal controller. Autom. Remote Control, 2011, vol. 72, no. 11, pp. 2315-2327.
DOI: https://doi.org/10.1134/S0005117911110063
[10] Афанасьев B.H. Оптимальные системы управления. M., Изд-во РУДН, 2007.
[11]Podvalny S.L., Vasiljev Е.М. Analytical synthesis of aggregated regulators for unmanned aerial vehicles. /. Math. Sc., 2019, vol. 239, no. 2, pp. 135-145.
DOI: https://doi.org/10.1007/sl0958-019-04295-w
[12] Колесников А.А., Колесников А.А., Кузьменко А.А. Методы АКАР и бэкс-теппинг в задачах синтеза нелинейных систем управления. Мехатроника, автоматизация, управление, 2016, т. 17, № 7, с. 435-445.
DOI: https://doi.org/10.17587/mau. 17.435-445
[13] Prajna S., Parrilo P.A., Rantzer A. Nonlinear control synthesis by convex optimization. IEEE Trans. Autom. Control, 2004, vol. 49, no. 2, pp. 304-314.
DOI: https://doi.Org/10.l 109/TAC.2003.823000
[14] Кунцевич B.M., Лычак M.M. Синтез систем автоматического управления с помощью функций Ляпунова. М., Наука, 1977.
[15] Diveev A.I. A numerical method for network operator for synthesis of a control system with uncertain initial values. J. Comput. Syst. Sc. Int., 2012, vol. 51, no. 2, pp. 228-243. DOI: https://doi.org/10.1134/S1064230712010066
[16] Дивеев А.И., Софронова E.A. Метод сетевого оператора и его применение в задачах управления. М., Изд-во РУДН, 2012.
[17] Kennedy J., Eberhart R. Particle swarm optimization. ICNN, 1995, pp. 1942-1948. DOI: https://doi.org/10.1109/ICNN.1995.488968
[18] Дивеев А.И., Константинов C.B. Исследование практической сходимости эволюционных алгоритмов оптимального программного управления колесным роботом. Известия РАН. Теория и системы управления, 2018, № 4, с. 80-106.
Дивеев Асхат Ибрагимович — д-р техн. наук, профессор, главный научный сотрудник, начальник отдела «Управление робототехническими устройствами» ФИЦ ИУ РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 44, корп. 2).
Шмалько Елизавета Юрьевна — канд. техн. наук, старший научный сотрудник отдела «Управление робототехническими устройствами» ФИЦ ИУ РАН (Российская Федерация, 119333, Москва, ул. Вавилова, д. 44, корп. 2).
Хуссейн Оубаи — аспирант департамента механики и мехатроники Инженерной академии РУДН (Российская Федерация, 117198, Москва, ул. Миклухо-Маклая, д. 6).
Просьба ссылаться на эту статью следующим образом:
Дивеев А.И., Шмалько Е.Ю., Хуссейн О. Синтезированное оптимальное управление групповым взаимодействием квадрокоптеров на основе многоточечной стабилизации. Вестник МГТУ им. Н.Э. Баумана. Сер. Приборостроение, 2020, № 4, с. 114-133. DOI: https://doi.org/10.18698/0236-3933-2020-4-114-133
SYNTHESIZED OPTIMAL CONTROL OF GROUP INTERACTION OF QUADROCOPTERS BASED ON MULTI-POINT STABILIZATION
A.I. Diveev1 [email protected]
E.Yu. Shmalko1 [email protected]
O. Hussein2 [email protected]
1FRC CSC RAS, Moscow, Russian Federation
2 RUDN University, Moscow, Russian Federation
Abstract
The study examines the problem of optimal control of group interaction of three quadrocopters. A group of three quadrocopters must move the load on flexible rods from one point in space to another one without hitting obstacles, one quadrocopter being not able to complete the task due to the weight of the load. To solve the problem, the method of synthesized optimal control based on multi-point stabilization was used. The method is called synthesized, since the problem of synthesizing the stabilization system for each robot is first solved. At the next stage, the problem of the optimal location of stabilization points in the state space is solved in such a way that when these points are switched from one to another, at a given time interval, the quadrocopters move the load from the initial position to the final one with the optimal value of the quality criterion. The network operator method is used to solve the synthesis problem. All phase constraints describing group interaction and obstacles are included in the quality criterion by the method of penalty functions. An evolutionary particle swarm optimization algorithm was used to find the positions of points
Keywords
Group interaction, optimal control, stabilization system synthesis, particle swarm optimization, evolutionary algorithm, group of quadrocopters, phase constraints
Received 01.05.2020 Accepted 16.06.2020 © Author(s), 2020
This work was supported by the RFBR, project no. 18-29-03061-mk (sections 3-5), and the RSF, project no. 19-11-00258 (sections 1,2)
REFERENCES
[1] Pshikhopov V.Kh., Medvedev M.Yu. Group control of autonomous robots motion in uncertain environment via unstable modes. Trudy SPIIRAN [SPIIRAS Proceedings], 2018, no. 60, pp. 39-63 (in Russ.).
[2] Diveev A.I., Shmalko E.Yu. Method of synthesized optimal control for a group of robots. Nadezhnosf i kachestvo slozhnykh system [Reliability & Quality of Complex Systems], 2018, no. 4, pp. 40-47 (in Russ.).
[3] Diveev A., Shmalko E. Hybrid evolutionary algorithm for synthesized optimal control problem for group of interacting robots. CoDIT, 2019, pp. 876-971.
DOI: https://doi.Org/10.l 109/CoDIT.2019.8820344
[4] Gur'yanov A.E. Simulation of control on quadrocopter. Inzhenernyy vestnik [Engineering Bulletin], 2014, no. 8 (in Russ.).
Available at: http://ainjournal.ru/doc/723331.html
[5] Arutyunov A.V., Karamzin D.Y. On some continuity properties of the measure Lagrange multiplier from the maximum principle for state constrained. SLAM J. Control Optim., 2015, vol. 53, no. 4, pp. 2514-2540. DOI: https://doi.org/10.1137/140981368
[6] Chertovskih R., Khalil N.T., Pereira F.L., et al. Path-constrained trajectory time-optimization in a three-dimensional steady flow field. Proc. 18th ECC, 2019, vol. 18, pp. 3746-3751. DOI: https://doi.Org/10.2514/3.11428
[7] Rao A.V. A survey of numerical methods for optimal control. Adv. Astr. Sc., 2010, vol. 135, no. 1, pp. 1-32.
[8] Bertsekas D.P. Dynamic programming and optimal control. Vol. 1. Athena Scientific, 1995.
[9] Mizhidon A.D. On a problem of analytic design of an optimal controller. Autom. Remote Control, 2011, vol. 72, no. 11, pp. 2315-2327.
DOI: https://doi.0rg/lO.l 134/S0005117911110063
[10] Afanas'yev V.N. Optimal'nye sistemy upravleniya [Optimum control systems]. Moscow, RUDN Publ., 2007.
[11] Podvalny S.L., Vasiljev E.M. Analytical synthesis of aggregated regulators for unmanned aerial vehicles. /. Math. Sc., 2019, vol. 239, no. 2, pp. 135-145.
DOI: https://doi.org/10.1007/sl0958-019-04295-w
[12] Kolesnikov A.A., Kolesnikov A.A., Kuz'menko A.A. Backstepping and ADAR method in the problems of synthesis of the nonlinear control systems. Mekhatronika, avtomatizatsiya, upravlenie, 2016, vol. 17, no. 7, pp. 435-445 (in Russ.).
DOI: https://doi.org/10.17587/mau.17.435-445
[13] Prajna S., Parrilo P.A., Rantzer A. Nonlinear control synthesis by convex optimization. IEEE Trans. Autom. Control, 2004, vol. 49, no. 2, pp. 304-314.
DOI: https://doi.Org/10.l 109/TAC.2003.823000
[14] Kuntsevich V.M., Lychak M.M. Sintez sistem avtomaticheskogo upravleniya s pomoshch'yu funktsiy Lyapunova [Synthesis of automated control systems using Lia-pounov function], Moscow, Nauka Publ., 1977.
[15] Diveev A.I. A numerical method for network operator for synthesis of a control system with uncertain initial values. J. Comput. Syst. Sc. Int., 2012, vol. 51, no. 2, pp. 228-243. DOI: https://doi.org/10.1134/S1064230712010066
[16] Diveev A.I., Sofronova E.A. Metod setevogo operatora i ego primenenie v zadachakh upravleniya [Network operator method and its application in problems of control]. Moscow, RUDN Publ., 2012.
[17] Kennedy J., Eberhart R. Particle swarm optimization. ICNN, 1995, pp. 1942-1948. DOI: https://doi.Org/10.l 109/ICNN.1995.488968
[18] Diveev A.I., Konstantinov S.V. Study of the practical convergence of evolutionary algorithms for the optimal program control of a wheeled robot. J. Comput. Syst. Sc. Int., 2018, vol. 57, no. 4, pp. 561-580. DOI: https://doi.org/10.1134/S106423071804007X
Diveev A.I. — Dr. Sc. (Eng.), Professor, Chief Research Fellow, Head of the Department of Robotics Control, FRC CSC RAS (Vavilova ul. 44, korp. 2, Moscow, 119333 Russian Federation).
Shmalko E.Yu. — Cand. Sc. (Eng.), Senior Research Fellow, Department of Robotics Control, FRC CSC RAS (Vavilova ul. 44, korp. 2, Moscow, 119333 Russian Federation).
Hussein O. — Post-Graduate Student, Department of Mechanics and Mechatronics, Engineering Academy, RUDN University (Miklukho-Maklaya ul. 6, Moscow, 117198 Russian Federation).
Please cite this article in English as:
Diveev A.I., Shmalko E.Yu., Hussein O. Synthesized optimal control of group interaction of quadrocopters based on multi-point stabilization. Herald of the Bauman Moscow State Technical University, Series Instrument Engineering, 2020, no. 4, pp. 114-133 (in Russ.). DOI: https://doi.org/10.18698/0236-3933-2020-4-114-133