Раздел I. Групповое управление роботами
УДК 004.896, 519.688, 004.023 DOI 10.23683/2311-3103-2017-9-6-21
А.И. Дивеев, Е.Ю. Шмалько
ЧИСЛЕННЫЕ МЕТОДЫ СИНТЕЗА СИНЕРГЕТИЧЕСКОГО УПРАВЛЕНИЯ ГРУППОВЫМ ВЗАИМОДЕЙСТВИЕМ РОБОТОВ*
В настоящей работе представлены результаты исследований применения современных численных методов символьной регрессии для автоматического синтеза синергетиче-ского управления групповым взаимодействием роботов. Синергетическое управление определяется наличием в пространстве состояний таких многообразий, которые должны обладать свойствами аттрактора, в частности терминальные многообразия, а так же области, через которые не проходят решения системы или же обладающие свойствами репеллеров, например области фазовых ограничений. В работе мы сформулировали многоточечный численный критерий обеспечения свойств аттрактора у многообразий в пространстве состояний. Представленный критерий учитывает не только попадание решения в окрестность многообразия, но и поведение решения, находящегося в окрестности многообразия. Предложенный критерий оказывается особенно важным для одномерных многообразий, для которых необходимо не только попасть в окрестность многообразия, но и обеспечить определенную форму изменения решения во времени в окрестности многообразия. В работе приведены результаты вычислительных экспериментов по эффективному применению предложенного критерия. В качестве объекта приложения нами рассматривается задача синтеза управления групповым взаимодействием роботов. Особенность задачи управления группой роботов состоит в наличии динамических фазовых ограничений, которые определяют отсутствие столкновений роботов между собой. Данные ограничения принципиально усложняют процесс поиска оптимального решения как для задачи синтеза управления, так и для задачи оптимального управления. Сложность поиска в основном продиктована изменением свойств выпуклости области поиска. На вычислительных экспериментах показано, что решение задачи синтеза управления и задачи поиска оптимального управления наиболее эффективно выполнять для объектов управления, которые обладают свойством локальной устойчивости относительно заданной точки пространства состояния. Поэтому при решении указанных задач применяется предложенный двухэтапный подход, когда необходимо предварительно решить задачу синтеза системы стабилизации для обеспечения устойчивости объекта относительно заданной точки пространства состояний, а затем решать задачи синтеза и оптимального управления, как задачи управления точкой стабилизации в пространстве состояний. Для синтеза управления используем методы символьной регрессии, которые позволяют находить закодированное математическое выражение искомой синтезирующей функции с помощью эволюционного алгоритма. При поиске оптимальных траекторий используем различные эволюционные и градиентные алгоритмы.
Управление групповым взаимодействием роботов; синергетическое управление; методы символьной регрессии; аттракторы и репеллеры в пространстве состояний; синтез управления; оптимальное управление; эволюционные алгоритмы.
* Работа выполнена при поддержке Российского фонда фундаментальных исследований (№ 16-29-04224-офи_м «Исследование и разработка численных методов синтеза управления групповым взаимодействием роботов» и № 17-08-01203-а «Исследование эволюционных методов синтеза синергетического управления»).
A.I. Diveev, E.Yu. Shmalko
COMPUTATIONAL METHODS OF SYNTHESIS
OF SYNERGETIC CONTROL FOR ROBOTS GROUP INTERACTION
The paper presents the results of our research in application of modern numerical methods of symbolic regression for the automatic synthesis of synergistic control for robots group interaction. Synergetic control is determined by the presence of such manifolds in the state space that must have the properties of an attractor, in particular terminal manifolds, as well as domains through which solutions of the system do not pass or have repeller properties, for example, the domain of phase constraints. In this paper we formulated a multipoint numerical criterion for ensuring the properties of an attractor for manifolds in the state space. The presented criterion takes into account not only the hit of the solution to the neighborhood of the manifold, but also the behavior of the solution in the neighborhood of the manifold. The proposed criterion turns out to be especially important for one-dimensional manifolds, for which it is necessary not only to get into the neighborhood of a manifold, but also to provide a definite form of variation of the solution in time in the neighborhood of the manifold. The paper presents the results of computational experiments on the effective application of the proposed criterion. As an application object, we consider the problem of synthesizing the control for group of robots. Additional complexity of the task of controlling a group of robots is the presence of dynamic phase constraints that determine the absence of collisions between robots. These dynamic constraints seriously complicate the process of finding the optimal solution for both the control synthesis and optimal control problems. The complexity of the search is mainly dictated by changing the convexity properties of the search area. The paper shows by computational experiments that the solution of the synthesis problem and the problem of optimal control is most effectively performed for control objects that have the property of local stability with respect to a given point in the state space. Therefore, when solving these problems, the proposed two-stage approach is applied when firstly the problem of synthesis of the stabilization system is to be solved in advance to ensure the stability of the object relative to a given point in the state space, and secondly problems of synthesis and optimal control are solved as problems of controlling the stabilization point in the state space. To synthesize control, we use the methods of symbolic regression, which allow us to find the coded mathematical expression of the required synthesizing function using evolutionary algorithms. When searching for optimal trajectories we use various evolutionary and gradient algorithms of nonlinear programming.
Control of group of robots; synergetic control; symbolic regression methods; attractors.
Введение. Синергетическое управления как подход к решению задач синтеза управления был предложен в работах Колесникова А.А. [1-3]. Основная идея подхода заключалась в том, чтобы после синтеза управления и нахождения синтезирующей функции, зависящей от вектора координат пространства состояний объекта управления, получить такую систему дифференциальных уравнений, описывающих динамику объекта управления вместе с системой управления, которая не содержит свободного вектора управления в правых частях уравнений из-за замены управления синтезирующей функцией, что все решения полученной системы уравнений обладают заданными разработчиком свойствами. Свойства, которым должны удовлетворять решения дифференциальных уравнений, описывающих замкнутую систему управления, определяются наличием многообразий в пространстве состояний, в частности терминальные многообразия должны обладать свойствами аттрактора, а фазовые ограничения должны указывать на области пространства состояний, через которые не проходят решения системы или же обладать свойствами репеллеров.
К сожалению, наиболее качественные примеры синтеза управления на основе синергетической теории рассматривают объекты невысокого порядка, в частности не выше второго, где свойства решений систем дифференциальных уравнений
очевидно отображаются на плоскости. Практически все синергетические подходы [2], не смотря на глобальные выводы, ограничиваются рассмотрением примеров систем второго порядка.
Невысокая размерность системы, как условие применения синергетической теории не может удовлетворить специалистов в области управления, так как современные объекты управления, в частности роботы или группы роботов описываются системами дифференциальных уравнений намного более высокого порядка.
В настоящей работы мы рассматриваем применение современных численных методов символьной регрессии [4-7] для решения задач управления на основе си-нергетической теории. Во-первых, мы формулируем численные критерии для проверки свойств аттрактора у многообразий в пространстве состояний. Представленные численные критерии учитывают не только попадание решения в окрестность многообразия, но и поведение решений, находящегося в окрестности многообразия. Предложенный критерий оказывается особенно важным для одномерных многообразий, для которых необходимо не только попасть в окрестность многообразия, но и обеспечить определенные форму изменения решения во времени в окрестности многообразия. Далее мы приводим результаты численных экспериментов, которые показывают эффективность используемых численных критериев проверки свойств аттрактора. Во-вторых, мы решаем задачу оптимального управления группой роботов с учетом пространственных невыпуклых ограничений. Здесь мы используем два подхода: прямое решение с помощью редукции к задаче конечномерной оптимизации и решение задачи с помощью синергетиче-ской теории, для чего первоначально решаем задачу синтеза управления для обеспечения устойчивости объекта относительно заданной точки пространства состояний, а затем решаем задачу оптимального управления, как задачу выбора точек стабилизации в пространстве состояний. Для решения задач используем наиболее популярные эволюционные алгоритмы и классический алгоритм наискорейшего градиентного спуска.
1. Постановка задачи синтеза синергетического управления. Рассмотрим постановку задачи синтеза управления с учетом возможности ее решения численным методом.
Задана математическая модель объекта управления
х = Г (х, и), (1)
где х е Я.п, и е и с Ит, и - компактное множество, Г(х, и): Ип х Ит ^ Ип,
Г(х, и) = [/¡(х, и) ... /п (х, и)]Т, х = [X! ... хп ]Т, и = Щ ... Пт ]Т, т < п. Задана область начальных условий
Х0 с Яп. (2)
Задано терминальное многообразие
gi (х) = 0, I = 1,..., Г, Г < п. (3)
Задан критерий качества
J = J f (x, u)dt ^ min
(4)
0
где I/ - заданное время процесса управления.
Необходимо найти управление в виде функции от координат пространства
состояний
и = Ь(х), (5)
где И(х): Яп ^ Кт.
Функция Ь(х) удовлетворяет следующим условиям: решение системы дифференциальных уравнений
х = {(х, Ь(х)) для любого начального значения из области (2)
Ух(0) е Х0 с Яп
имеет решение х = у(х(0), г), такое, что оно достигает за заданное время гу терминального многообразия (3)
& (у(х(0), гу)) = 0, не нарушает ограничений на управление
Ь(у(х(0), г)) е и, 0 < г < г у,
и обеспечивает минимум критерию качества
Iу(у(х(0), г), Ь(у(х(0), г)))& = шп^ |/(х, и)Ж,
0 и(-)еи 0
*
где И - множество допустимых управлений, которые удовлетворяют ограничениям на управление и для тех же начальных условий х(0) е Х0 объекта обеспечивают достижение терминального многообразия (3).
Для синтеза управления используем методы символьной регрессии [4-6], которые позволяют находить закодированное математическое выражение искомой синтезирующей функции с помощью эволюционного алгоритма.
На основе синергетической теории терминальное многообразие в результате синтеза управления должно обладать свойством аттрактора. Если терминальное многообразие имеет размерность ноль, п — г = 0, т.е. является точкой в пространстве состояний, то при численном синтезе выполнение терминальных условий в виде
II 8(х) ||<8, (6)
т
где g(x) = (х) ... (х)]^ , 8 - заданная малая положительная величина, при нахождении синтезирующей функции обеспечивает получение свойств аттрактора для терминального многообразия. Здесь в (6) г = п, так как многообразие является точкой и имеет нулевую размерность.
Если размерность терминального многообразия больше нуля, п — Г > 0, то при численном синтезе управления условия (6) не достаточно для получения свойств аттрактора. Необходимо еще описать поведение объекта управления после достижения терминального многообразия.
Например, система уравнений (3) при Г < П имеет множество решений.
Пусть х одно из таких решений, & (х ) = 0, / = 1,..., г. Тогда условие
|| х — х* ||<8 (7)
*
равносильно условию (6) и при синтезе может быть найдена точка x , которая
принадлежит терминальному многообразию (3). В этом случае мы при синтезе
*
обеспечим устойчивость системы относительно точки x в пространстве состояний на терминальном многообразии, но не движение объекта управления по множеству точек терминального многообразия.
2. Многоточечный критерий обеспечения свойств аттрактора. Многоточечный критерий целесообразно применять при численном синтезе синергетиче-ского управления для терминальных многообразий, размерность которых больше нуля.
Многоточечный критерий заключается в том, чтобы установить дополнительные требования, которые учитывают особенности движения объекта после попадания в окрестность терминального многообразия. Согласно дополнительному критерию требуется достичь некоторого заданного количества точек на терминальном многообразии, оставаясь в окрестности этого многообразия.
Для определения требований достижения множества точек на терминальном многообразии введем целочисленную функцию
ф(К*,t) = K* -min{K*,kit)}, (8)
*
где K - заданное количество различных точек на терминальном многообразии, которое необходимо достичь, k (t) - количество различных точек на терминальном многообразии, достигнутых к моменту t
1, если t < tf, k(t) = 0, || g(x(t)) ||< s, X f = {x1 = x(t)} k(t) + 1, если t < tf, || g(x(t))||<s, (9)
Vxj e Xf ,||x(t) -xj||>s, j = 1,...,k(t),
k (t) ^
X f ^ X f j {xk(t)+1 = x(t)} 0, если t < tf, || g(x(t))||>s
Функция ф(К , ¿у) либо равна нулю, если решению удалось достичь К
различных точек на терминальном многообразии за время ^у, либо равна разно*
сти между заданным К и достигнутым к (¿у) ко времени ^ у решением количествами точек на терминальном многообразии.
3. Примеры численного синтеза синергетического управления. Рассмотрим задачу синтеза управления нелинейным объектом второго порядка
*1 = х2 + Щ
3
Х2 = -Х2 "Х1 -Х1 + и2'
где -1 < щ < 1, г = 1,2.
В первом примере рассмотрим следующее терминальное многообразие
Х2 = -Х1, Х1 < Х1 < Х1+ . Достичь терминальное многообразие необходимо из области начальных значений
Хо = {[Х1 (0) Х2 (0)]Г : -1.1 < Х1(0) < 1,-1.1 < Х2(0) < 1} .
В качестве критериев оптимальности синтеза рассматриваем следующие функционалы
31 =аф(К , 1у) + {Лу(Х2(0, х^))Л,
0
*
32 =афК , 1у ) + Л у (хг(гу ), х^у )),
где Лу (^ ), х (^)) - расстояние до терминального многообразия,
Л ,(х2(?),хКО) (?)'Л+(?)}' если (Р"(0 < 0) V (Р+® < 0),
■' 2Л(()/1у - иначе
А (t) = ^ (t) - Х1 )2 + (Х2 (t) - Х2 )2 :
Д+ (t) = А/(X1(t)-x+ )2 + (x2(t)-x+ )2 ,
P" (t) = (x1+ - x- )(X1(t) - x- ) + (x+ - x2 )(x2 (t) - x2 ),
P+ (t) = (x- - x+ )(x1 (t) - x+ ) + (x- - x+ )(x2 (t) - x+ ) :
lf = V (x1 - x- ) + (x2 - x- ) ,
S(t) = д/p(t)(p(t) - Д- (t))(p(t) - А+ (t))(p(t) - lf),
А- (t) + А+ (t) + lf - - + + p(t) =---y, x2 = - x1 , x+ = -x+
a - весовой коэффициент.
Синтез осуществляли методом бинарного вариационного генетического программирования [6, 7]. В вычислительном эксперименте были использованы следующие значение постоянных параметров: x-=-0.5, x+ = 0.5, s = 0.005,
>к
a = 0.1, K = 8, ty = 8 с.
В результате было синтезировано следующее управление
f1, если Uj > 1 W = [-1, если Uj < -1 j =1,2, [Uj - иначе
где
U1 = sin(( 42 + 1)(cos( 41) + x0 + 4342 sin( 41)) +
+ Sgn( 42x1 cos(42 ) + (42 + 1)x2 sin( 44 )), u2 = -(41 +1)(44 + 2)arctan( x2 / g2) + (2g4 + 1)9(-4 -1 + arctan( g3 / x1)), 41 = 0.54395, 42 = 2.70215 , g3 = 0.21973, g4 = 3.69531, где 9(a) - функция Хэвисайда
f1, если a > 0
9(a) = <,„
0 - иначе
Графики решений для четырех начальных значений приведены на рис. 1. Там же красной линией отмечено терминальное многообразие.
Рис. 1. Решения системы с синтезирующей функцией в 1-ом эксперименте
Во втором эксперименте рассматривалось терминальное многообразие
Х2 = Х1, х- < Х1 < Х+,
где х- = -0.5, х- = -0.5, х+ = 0.5, х+ = 0.5.
В результате было получено следующее управление
2
= (92 + 43 )Х1 ^(д!) + (д3 +1) Х2 8т( дг) + ^ Х1 ) + (43 +1) Х2 sin(1)
42Х1 008(92) + (Чз +1)Х2 ®ш(1),
~2 = ехР((43 + §т(Ч4) + 41 + с^СЩагсга^43 вепСщ')^ х1 |) - (1п | 41 | +1)) +
3
+ 8§п((ч1 + 42 +1 - (42 +1) )(агс1ап(Х2 / Х1) -1 - агс1ап(х1))) х
х д/I (41 + 42 +1 - (42 +1)3 )(агс1ап(Х2 / Х1) -1 - агс1ап(Х1)) |). 41 = 2.97946 , 42 = 2.78613 , 43 = 3.39160 , 44 = 1.50488.
Графики решений для четырех начальных значений и терминальное многообразие приведены на рис. 2.
Рис. 2. Решения системы с синтезирующей функцией во 2-ом эксперименте В третьем эксперименте рассматривалось терминальное многообразие
x2 = 0, x1 < x1 < x1
где xj =-0.5, xj = 0.5.
В результате было получено следующее управление
= (Я 2 + <?2 )Х1 С08(42 ) + (?3 + ^ёК Х2^л/ГХ2Г ,
~2 = (3(Х2) + Я3 +1)3(^ /4 - (Х2 + 8ю( Я1)))3, Я1 = 1.47168, я2 = 2.53027 , д3 = 2.15723 , д4 = 1.21289. Графики решений для четырех начальных значений и терминальное многообразие приведены на рис. 3.
-т2
1,1-1 -0,9 -0.7 -0,5 -0,3 -0,1 0 0,10,20,30,40,50,60,70,80,9 1
Рис. 3. Решения системы с синтезирующей функцией в 3-ем эксперименте
В четвертом эксперименте рассматривалось терминальное многообразие
Х1 = 0, х- < Х2 < х+, где х- =-0.5, х+ = 0.5.
В результате было получено следующее управление
=-Я1х1(Я2 + Я1) + (Я3 + 1)3х2зт( Я1) + + 8ёп(( Я2 + ехр( Я4))со8( Я2)атс1ап( Х1) - Я2 Х2 агсап( ^3)) х х л/1 (Я2 + ехР(Я4))сов(Я2)агСап(хх) -Я2Х2 агсап(#3) |, ~2 = (агсап( Х2 / хг) - (я +1))(Х2 + + 2) -- (л/Я4 + 3) агс:ап( Я2 / Х1), Я! = 3.04883 , д2 = 3.39453 , д3 = 1.15625, д4 = 0.00195 .
Графики решений для четырех начальных значений и терминальное многообразие приведены на рис. 4.
х2
-1,1-1-0,9 -0,7 -0,5 -0.3 -0,1 0 0,10,20,30,40,50,60,70,80,9 1
Рис. 4. Решения системы с синтезирующей функцией в 4-ом эксперименте
Как видно из результатов экспериментов многоточечный критерий (8) обеспечивает возможность получения аттрактора и движение по нему для терминального линейного многообразия.
4. Оптимальное синтезированное управление группой роботов. Особенность задач управления группой роботов состоит в наличии динамических фазовых ограничений, которые определяют отсутствие столкновений роботов между собой. Данные ограничения принципиально усложняют процесс поиска оптимального решения как для задачи синтеза управления, так и для задачи оптимального управления. Сложность поиска в основном продиктована изменением свойств выпуклости области поиска.
В работах [8-12] предложен двухэтапный метод синтеза, в котором первоначально решаем задачу синтеза системы стабилизации объекта относительно точки пространства состояний. Затем решаем задачу управления объектом или объектами как управление перемещением точек стабилизации в пространстве состояний. На втором этапе возможно, как решение задачи оптимального управления, так и решение задачи синтеза управления, при этом следует иметь виду, что управление на втором этапе осуществляется положением точек стабилизации для каждого объекта управления, причем объекты не обязательно в процессе движения должны достигать точек стабилизации.
Решение задачи синтеза управления на первом этапе изменяет математическую модель объекта управления, так как в правых частях дифференциальных уравнений вектор управления заменяется найденной синтезирующей функцией, а свободными параметрам управления становятся точки стабилизации объекта в пространстве состояний. При таком подходе очевиден вопрос, насколько изменяется задача оптимального управления и значения критерия качества при переходе от исходной модели объекта к модели с синтезированным управлением.
Для оценки синтезированного управления проведем вычислительный эксперимент, в котором решим задачу оптимального управления группой мобильных роботов с фазовыми ограничениями на основе двух подходов дискретизации функции управления по времени и с предварительным решением задачи синтеза системы стабилизации относительно точки пространства состояний для каждого объекта.
Рассмотрим следующую задачу оптимального управления группой N одинаковых мобильных роботов.
Задана математическая модель мобильного робота
х( = 0.5Щ + и]2 )с08(Хз) , Ху = 0.5(и( + Щ2 ) 8т(х]ъ ), Х3 = 0.5(и/ - и]2 ),
где у - номер робота в группе, у = 1,..., N.
Заданы ограничения на управление
щ- < и/ < иг+, г = 1,2, у = 1,.,N.
Для каждого робота у заданы начальные значения
х{ (0) = х0,У, г = 1,2,3, у = 1,N.
Заданы фазовые ограничения
Р(х-/) = Г2 - (Х* - х/)2 - (Х* - Х2)2 < 0, у = 1,N.
Заданы динамические фазовые ограничения, учитывающие отсутствие столкновений роботов между собой
S(x', xi+k) = r02 - (x[ - x[+k)2 - (x£ - x+)2 < 0,
i = 1,..., N -1, k = 1,..., N - i.
Заданы терминальные состояния роботов
xj -xf,j = 0, i = 1,2,3, j = 1,...,N. i i j
Задан критерий качества
J = tf ^ min ,
где
tf =
t, если t < t+ и max \ |X(x/ (t) - xf,j ): j = 1,., N¡><8,
i=1
t + - иначе,
где t - заданное предельное время управления, 8 - малая положительная величина.
Для учета ограничений при численном решении задачи включим фазовые ограничения в функционал качества с помощью функции Хэвисайда
N 'Г N-1 N-i 'f
J = ^ + X j адхj))dt + X Z j w, x'+k ))dt ^ min. j=1 0 i=1 k=i+1 0 Если необходимо получить дифференцируемый функционал, то функцию Хэвисайда заменяем на сигмоидальную функцию
Ntf^t N-1 N-i tf ^
Л dt Г dt
= tf + X I -— + X X I -:—-->min '
f j=1 j 1 + exp(-Aß(xj)) i=1 k=i+1 0 1 + exp(-AS(x!, xl+k))
где A - большое положительное число.
5. Метод дискретизации. Приведем задачу оптимального управления к задаче конечномерной оптимизации с помощью дискретизации управления по времени
[13]. Введем постоянный интервал времени At = t^+\ -1i, i = 0,.,d = t+ /At и будем искать управления в виде кусочно-линейных функций между значениями параметров qi, i = 0,..., d, с учетом ограничений на управление
u(t) =
u +, если J > u +
u -, если J < u -J - иначе
^) = Ш^И а _ ц) + д,, г е (г,-; ^. Дt
Задача заключается в нахождении вектора параметров
т
ч = [д1 — Ч(а+1)2^] '
д_ < < д +, , = +1)2Ы,
Для решения задачи используем эволюционные алгоритмы [14-19] и метод наискорейшего градиентного спуска со множеством начальных точек. В качестве оценки трудоемкости алгоритмов используем количество вычислений целевой функции.
При вычислительном эксперименте использовали следующие параметры задачи: число роботов N = 3, ^ = 2.8, е = 0.01, х}(0) = 10, х2(0) = 10, х1(0) = 0, х2(0) = 0, х|(0) = 10, х32(0) = 0, х3(0) = 5, х3(0) = 10, х^(0) = 0, х{Л = 0, х{Л = 0, х{Л = 0, х{2 = 10, х{2 = 0, х{'2 = 0, х{3 = 5, х{3 = 0, х{3 = 0, х* = 5, х* = 5, г = 3,
г0 = 2, и- =-10, и+ = 10, и- =-10, и+ = 10,q- =-20, q+ = 20, At = 0.25 .
Результаты вычислительного эксперимента приведены в табл. 1. В таблице приведены следующие обозначения: GA - генетический алгоритм [16], Р80 - алгоритм роя частиц [17], MFGD - алгоритм многоточечного наискорейшего градиентного спуска, GW - алгоритм серого волка [18], ВА - пчелиный алгоритм [19], Я8 - алгоритм случайного поиска. В каждой строке таблицы приведены результаты одного запуска для каждого алгоритма. В левой колонке указано значение целевой функции, в правой колонке - количество вычислений функционала в данном эксперимента. Если количество вычислений функционала постоянно для всех экспериментов, то оно указано в заголовке столбца под наименованием алгоритма. В последней строке приведены средние значения по экспериментам.
По результатам вычислений следует делать вывод, что наиболее эффективно решили задачу генетический алгоритм, алгоритм роя частиц и алгоритм серого волка. Все эволюционные алгоритмы существенно эффективнее случайного поиска. Алгоритм многоточечного градиентного спуска не справился с решением данной задачи.
Таблица 1
GA PSO 250102 MFGD GW 249922 BA 250842 RS 249753
1 4.0600 253349 2.9108 16.4982 302478 4.4847 4.5059 7,7758
2 3.5677 252313 2.8709 15.2204 301631 4.3873 6.1123 7,5557
3 4.3905 251605 2.8514 14.8579 301352 3.2669 5.9611 12,6330
4 3.4863 251865 3.3193 18.2539 304820 3.8574 5.5988 5,8897
5 3.5742 251625 3.0399 15.9367 303971 4.6096 5.8744 6,9021
6 3.5386 250917 2.8252 15.2256 301957 3.7341 4.9996 11,5478
7 3.2563 251921 2.8618 16.0122 304617 3.4787 5.2893 4,9812
8 3.3331 248959 2.8499 16.5209 303495 3.4810 5.9089 7,8379
9 2.9423 250483 2.9420 15.7707 300756 3.1490 5.0168 13,1539
10 5.0961 253171 3.7014 16.9575 301455 3.6580 5.6336 9,8940
3.7245 251621 3.0173 16.1254 302653 3.8107 5.4901 8,8171
На рис. 5 приведены траектории движения роботов для наилучшего найденного решения, найденного алгоритмом роя частиц в шестом эксперименте со значением функционала 2.8252.
Рис. 5. Оптимальные траектории метода дискретизации
6. Метод синтезированного управления. Решаем задачу оптимального управления в два этапа. Первоначально находим систему стабилизации для каждого робота, чтобы обеспечить его устойчивость относительно заданной точки в пространстве состояний. Для решения задачи синтеза используем метод многослойного сетевого оператора [12]. В результате решения задачи синтеза получили следующую синтезирующую функцию
~ = 4)(ехр | А | -1))1п(| ехр | А | -11 +1) + В + С,
~2 = А)(ехр| А | -1))1п(| ехр | А | -1| +1) - В - С,
А = 8§п(1п | рз3 (р2 - р2 ) | Ч1 + ехр(рз))(ехр 11п | р3 (Р2 - р2 ) | + ^ 1 + ехр(рз) | -1^(Ах - 8§п(Ду)(ехр | Ау | -1^(А0)) х х 1п(| Ах - sgn(Аy)(exp | Ау | -1^(А0) | +1),
1 - ехр(Ау / Ах)
( 1 _ олт/ Ли / ЛтАЛ
В = sgn(p3А0)(exp | р3А01-1) + ц(А0) +
1 + ехр(Ау / Ах)
С = sgn(р\Ау(Ах + Ау))^ р\Ау(Ах + Ау | + sgn(sgn( А0)(ехр | А01 -1)(Рз - Р33)) х х (1п | (ехр | А01 -1)(рз - рз3) | +1) + ц(АхАу),
Ах = - хх, Ау = ~2 - х2, А0 = ~з - Хз, р1 = 0.84180, р2 = 0.65527 , рз = 2.45020 . Теперь решаем задачу конечномерной оптимизации по нахождению точек стабилизации ~/,к, I - номер компоненты вектора состояния, \ = 123, / номер
I ' ' ^
робота, / = 1,2,3, к - номер точки. При поиске переключение точек осуществляем
через интервал времени Аt = 1, последней точкой стабилизации является терминальное состояние робота поэтому выполняем поиск вектора с 3 • 3 • [2.8/1] = 18 компонентами.
Результаты вычислительного эксперимента приведены в табл. 2.
Таблица 2
N GA PSO 65602 MFGD BA 65838 GW 65026 RS 65537
1 2.2117 64600 2.8918 4.9758 86626 2.8746 2.0115 3.8471
2 2.2424 64616 2.3665 6.1991 82530 2.8751 2.0028 3.2535
3 2.4058 65314 2.8514 6.5167 74338 2.8744 2.1668 3.6467
4 2.5942 65350 2.8702 5.7414 94818 2.8740 2.2147 3.6829
5 2.8727 65458 2.2850 5.7305 80482 2.8720 1.9924 3.6580
6 2.5462 65332 2.8459 4.7807 96866 2.8965 2.0120 3.4420
7 2.3855 65204 2.8959 5.8009 84578 2.8681 2.0333 3.9205
8 2.3068 65214 2.4346 6.1118 86626 2.8681 2.1706 4.1116
9 2.1633 65602 2.8943 6.2203 84578 2.8729 2.1312 4.3129
10 2.6650 65556 2.3971 5.8471 90722 2.8689 1.9241 3.9199
2.4394 65225 2.6733 5.7924 86216 2.8745 2.0659 3.7795
Несмотря на то, что при поиске оптимального управления методом синтезированного управления количество вычислений целевой функции для каждого метода выполнялось приблизительно в четыре раза меньше, чем при решении задачи методом дискретизации, результаты поиска оказались существенно лучше. Все эволюционные методы дали результаты лучше, чем алгоритм случайного поиска и существенно лучше, чем алгоритм многоточечного наискорейшего градиентного спуска. Наилучший результат показал алгоритм серого волка. На рис. 6 приведены траектории движения роботов с управлением, найденным алгоритмом серого волка в десятом эксперименте со значением функционала 1.9241.
Точки стабилизации для оптимального решения, представленного на рис. 6, имели следующие значения
[~и х21Д х31Д]г = [0.08539 3.1936 - 0.0469]т, [х2д х22,1 х32Д]г = [5.7851 7.8697 0.5353]т, [хх3д х23Д х3Д]Г = [0.0015 1.4369 0.1729]т, [х^1'2 х!2 Хз'2]г = [0.7282 1.5034 - 0.0294]т, [х2'2 х2'2 х22]т = [10.0000 0.5002 0.0927]т, [х3'2 х3'2 х32]т = [9.4238 3.1071 - 0.7933]т.
Заключение. Рассмотрены особенности построения численных методов си-нергетического управления. Указано, что условия достижения терминального многообразия недостаточно для численного метода синергетического управления. так как данное условие не определяет свойства решений в окрестности терминального многообразия. Приведен численный многоточечный критерий оценки свойств многообразия, оценивающий характер решений в окрестности многообразия. С помощью вычислительных экспериментов показана эффективность применения представленного критерия при численном синтезе синергетического управления. рассмотрена задача оптимального управления группой роботов. На сравнительном численном эксперименте показано, что метод синтезированного управления, в котором первоначально решается задача синтеза управления, приводит к получению оптимального управления с более лучшими значениями функционала качества.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Колесников А.А. Синергетические методы управления сложными системами: теория системного синтеза. - М.: Едиториал УРСС, 2005. - 228 с.
2. Колесников А.А. Синергетическая теория управления. - Таганрог: ТРТУ, М.: Энерго-атомиздат, 1994. - 344 c. - ISBN:5-230-24678-2.
3. Колесников А.А. Последовательная оптимизация нелинейных агрегированных систем управления. - М.: Энергоатомиздат, 1987. - 160 с.
4. Дивеев А.И. Численный метод сетевого оператора для синтеза системы управления с неопределенными начальными значениями // Известия РАН. Теория и системы управления. - 2012. - № 2. - С. 63-78.
5. Дивеев А.И. Приближенные методы решения задачи синтеза оптимального управления.
- М.: Изд-во ВЦ РАН. 2015. - 184 с.
6. Дивеев А.И., Шмалько Е.Ю. Эволюционные методы вычислений для синтеза управления группой роботов и поиска оптимальных траекторий их движения // Cloud of Science.
- 2017. - T. 4, № 3. - С. 395-414.
7. Diveev A.I., ShmalkoE.Yu. Complete Binary Variational Analytic Programming for Synthesis of Control at Dynamic Constraints // ITM Web Conf. Vol. 10, 2017 Seminar on Systems Analysis, 10. 1051 /itmconf/20171002004.
8. Дивеев А.И., Шмалько Е.Ю. Численный синтез системы управления группой роботов методом символьной регрессии // Известия ЮФУ. Технические науки. - 2015. - № 10 (171). - С. 29-45.
9. Дивеев А.И., Шмалько Е.Ю. Двухэтапный синтез системы управления методом сетевого оператора // Вестник РУДН. Серия: Инженерные исследования. - 2015. - № 1. - С. 91-99.
10. Diveev A.I., ShmalkoE.Yu. Automatic Synthesis of Control for Multi-Agent Systems with Dynamic Constraints // Preprints, 1st IFAC Conference on Modelling, Identification and Control of Nonlinear Systems June 24-26, 2015. Saint Petersburg, Russia. - P. 394-399.
11. Diveev A.I., ShmalkoE.Yu. Self-adjusting Control for Multi Robot Team by the Network Operator Method // Proceedings of the 2015 European Control Conference (ECC) July 15-17, 2015. Linz, Austria. - P. 709-714.
12. Diveev A.I., ShmalkoE.Yu. Optimal Control Synthesis for Group of Robots by Multilayer Network Operator // Proceedings of 3rd International Conference on Control, Decision and Information Technologies (CoDIT'16). St. Paul's Bay - Malta on April 6-8, 2016. - P. 077-082.
13. Евтушенко Ю.Г. Оптимизация и быстрое автоматическое дифференцирование. - М.: ВЦ РАН, 2013. - 144 с.
14. Дивеев А.И., Константинов С.В. Эволюционные алгоритмы для решения задачи оптимального управления // Вестник РУДН. Серия: Инженерные исследования. - 2017.
- Т. 18, № 2. - С. 254-265.
15. Карпенко А.П. Современные алгоритмы поисковой оптимизации. Алгоритмы, вдохновленные природой. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2014. - 448 с.
16. Goldberg, D.E. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley. 1989.
17. Kennedy J., Eberhart R. Particle Swarm Optimization // Proceedings of IEEE International Conference on Neural Networks IV. - 1995. - P. 1942-1948.
18. Mirjalili S.A., Mirjalili S.M., Lewis A. Grey Wolf Optimizer // Advances in Engineering Software. - 2014. - Vol. 69. - P. 46-61.
19. Pham D.T. et al. The Bees Algorithm - A Novel Tool for Complex Optimisation Problems // Intelligent Production Machines and Systems. - 2nd I*PROMS Virtual International Conference 3-14 July 2006. Elsevier Ltd, 2006. - P. 454-459.
20. Пантелеев А.В., Летова Т.А. Методы оптимизации в примерах и задачах: учеб. пособие. - М.: Высшая школа, 2005. - 544 c.
REFERENCES
1. Kolesnikov A.A. Sinergeticheskie metody upravleniya slozhnymi sistemami: teoriya sistemnogo sinteza [Synergetic control methods of complex systems: theory of system synthesis]. Moscow: Editorial URSS, 2005, 228 p.
2. KolesnikovA.A. Sinergeticheskaya teoriya upravleniya [Synergetic control theory]. Taganrog: TRTU, M.: Energoatomizdat, 1994, 344 p. ISBN:5-230-24678-2.
3. Kolesnikov A.A. Posledovatel'naya optimizatsiya nelineynykh agregirovannykh sistem upravleniya [Sequential optimization of nonlinear aggregated control systems]. Moscow: Energoatomizdat, 1987, 160 p.
4. Diveev A.I. Chislennyy metod setevogo operatora dlya sinteza sistemy upravleniya s neopredelennymi nachal'nymi znacheniyami [A numerical method for network operator for synthesis of a control system with uncertain initial values], Izvestiya RAN Teoriya i sistemy upravleniya [Journal of Computer and Systems Sciences International], 2012, No. 2, pp. 63-78.
5. Diveev A.I. Priblizhennye metody resheniya zadachi sinteza optimal'nogo upravleniya [Approximate methods of solution of synthesis problem of optimal control]. Moscow: Izd-vo VTs RAN. 2015, 184 p.
6. Diveev A.I., Shmal'ko E.Yu. Evolyutsionnye metody vychisleniy dlya sinteza upravleniya gruppoy robotov i poiska optimal'nykh traektoriy ikh dvizheniya [Evolutionary computing methods for control synthesis a group of robots and the search for optimal trajectories of their movemen], Cloud of Science, 2017, Vol. 4, No. 3, pp. 395-414.
7. Diveev A.I., ShmalkoE.Yu. Complete Binary Variational Analytic Programming for Synthesis of Control at Dynamic Constraints, ITM Web Conf. Vol. 10, 2017 Seminar on Systems Analysis, 10. 1051/itmconf/20171002004.
8. Diveev A.I., Shmal'ko E.Yu. Chislennyy sintez sistemy upravleniya gruppoy robotov metodom simvol'noy regressii [Numerical synthesis of control systems by group of robots with the method of symbolic regression], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2015, No. 10 (171), pp. 29-45.
9. Diveev A.I., Shmal'ko E.Yu. Dvukhetapnyy sintez sistemy upravleniya metodom setevogo operatora [Two-step synthesis of a control system by the network operator method], Vestnik RUDN. Seriya Inzhenernye issledovaniya [Bulletin of the Russian University of friendship of peoples. Series: Engineering research], 2015, No. 1, pp. 91-99.
10. Diveev A.I., ShmalkoE.Yu. Automatic Synthesis of Control for Multi-Agent Systems with Dynamic Constraints, Preprints, 1st IFAC Conference on Modelling, Identification and Control of Nonlinear Systems June 24-26, 2015. Saint Petersburg, Russia, pp. 394-399.
11. Diveev A.I., ShmalkoE.Yu. Self-adjusting Control for Multi Robot Team by the Network Operator Method, Proceedings of the 2015 European Control Conference (ECC) July 15-17, 2015. Linz, Austria, pp. 709-714.
12. Diveev A.I., ShmalkoE.Yu. Optimal Control Synthesis for Group of Robots by Multilayer Network Operator, Proceedings of 3rd International Conference on Control, Decision and Information Technologies (CoDIT'16). St. Paul's Bay - Malta on April 6-8, 2016, pp. 077-082.
13. Evtushenko Yu.G. Optimizatsiya i bystroe avtomaticheskoe differentsirovanie [Optimization and fast automatic differentiation]. Moscow: VTs RAN, 2013, 144 p.
14. Diveev A.I., Konstantinov S. V. Evolyutsionnye algoritmy dlya resheniya zadachi optimal'nogo upravleniya [Evolutionary algorithms for solving optimal control problem], Vestnik RUDN. Seriya Inzhenernye issledovaniya [Bulletin of the Russian University of friendship of peoples. Series: Engineering research], 2017, Vol. 18, No. 2, pp. 254-265.
15. Karpenko A.P. Sovremennye algoritmy poiskovoy optimizatsii. Algoritmy, vdokhnovlennye prirodoy [Modern algorithms of search engine optimization. Algorithms inspired by natur]. Moscow: Izd-vo MGTU im. N.E. Baumana, 2014, 448 p.
16. Goldberg, D.E. Genetic Algorithms in Search, Optimization, and Machine Learning. Addison-Wesley. 1989.
17. Kennedy J., Eberhart R. Particle Swarm Optimization, Proceedings of IEEE International Conference on Neural Networks IV, 1995, p. 1942-1948.
18. Mirjalili S.A., Mirjalili S.M., Lewis A. Grey Wolf Optimizer, Advances in Engineering Software, 2014, Vol. 69, pp. 46-61.
19. Pham D.T. et al. The Bees Algorithm - A Novel Tool for Complex Optimisation Problems, Intelligent Production Machines and Systems. 2nd I*PROMS Virtual International Conference 3-14 July 2006. Elsevier Ltd, 2006, pp. 454-459.
20. Panteleev A.V., Letova T.A. Metody optimizatsii v primerakh i zadachakh: ucheb. posobie [Optimization methods in examples and tasks: textbook]. Moscow: Vysshaya shkola, 2005, 544 p.
Статью рекомендовал к опубликованию д.т.н., профессор С.Г. Капустян.
Дивеев Асхат Ибрагимович - Федеральный исследовательский центр «Информатика и управление» РАН; e-mail: [email protected]; 119333, Москва, ул. Вавилова, д. 44, корп. 2; зав. cектором проблем кибернетики; д.т.н.; профессор.
Шмалько Елизавета Юрьевна - e-mail: [email protected]; к.т.н.; с.н.с.
Diveev Askhat Ibragimovich - Federal research center «Computer science and control» of RAS; e-mail: [email protected]; 44, Vavilova street, Moscow, 119333, Russia; head of the department of cybernetics problems; dr. of eng. sc.; professor.
Shmalko Elizaveta Yurievna - e-mail: [email protected]; cand. of eng. sc.; senior researcher.
УДК 519.87 Б01 10.23683/2311-3103-2017-9-21-34
Л.А. Мартынова, Г.В. Конюхов, И.В. Пашкевич, Н.Н. Рухлов
ОСОБЕННОСТИ ГРУППОВОГО УПРАВЛЕНИЯ АНПА ПРИ ВЕДЕНИИ
СЕЙСМОРАЗВЕДКИ*
При использовании группы автономных необитаемых подводных аппаратов для ведения сейсморазведки в подледных условиях на Арктическом шельфе возникает ряд задач, решение которых должно быть получено с учетом особенностей ведения сейсморазведки. Целью работы явился анализ задач, возникающих при ведении сейсморазведки с использованием группы аппаратов, и определение методов их решения. При этом разработаны подходы к формированию алгоритмов системы управления аппарата, исключающие возникновение между аппаратами конфликтных ситуаций. Особенности поведения группы аппаратов при ведении сейсморазведки связаны с необходимостью навигации каждого аппарата, удержания аппарата на маршрутной траектории с корректировкой местоположения, координацией выполнения разнородных функций отдельными аппаратами группы. В качестве решения задачи навигации предложено использовать разностно-дальномерный метод, при котором по четырем измерениям положения излучателя в различные моменты времени каждый аппарат определяет свое местоположение. При решении задачи удержания аппарата на маршрутной траектории использован алгоритм наведения автономного необитаемого подводного аппарата путем управления аппаратом по углу между линией визирования и заданной траекторией. Для обеспечения координации действий, производимых каждым аппаратом, использован мультиагентный подход. При этом определены возможности и полномочия каждого аппарата-агента, алгоритм их взаимодействия, объем и содержание сообщений при их общении между собой. Для обеспечения взаимодействия
* Работа выполнена при поддержке Российского Фонда фундаментальных исследований (проект № 17-08-00666).