RUDN Journal of Engineering researches 2017 Vol. 18 No 1 115—124
Вестник РУДН. Серия: Инженерные исследования http://joumals.rudn.ru/engineering-researches
УДК 62-50, 519-714
DOI 10.22363/2312-8143-2017-18-1-115-124
СИНТЕЗ УПРАВЛЕНИЯ ДЛЯ АВТОНОМНОЙ ГРУППЫ РОБОТОВ С ФАЗОВЫМИ ОГРАНИЧЕНИЯМИ МЕТОДОМ МНОГОСЛОЙНОГО СЕТЕВОГО ОПЕРАТОРА С РАССТАНОВКОЙ ПРИОРИТЕТОВ*
А.И. Дивеев1,2, Е.Ю. Шмалько1,2
1 Федеральный исследовательский центр «Информатика и управление» РАН ул. Вавилова, 44, Москва, Россия, 119333
2 Инженерная академия Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
Рассмотрена задача синтеза системы управления для малых групп автономных роботов с фазовыми ограничениями и несколькими возможными начальными условиями. Основная задача управления для группы роботов состоит в перемещении роботов из некоторых текущих позиций в заданные терминальные положения без столкновений между собой. Обычно синтез управления группой роботов состоит из двух этапов: стабилизация роботов относительно некоторой точки пространства состояний; построение оптимальных траекторий. Траектории должны обеспечить движение роботов из начальных состояний в определенные состояния из терминального множества без столкновений. Во избежание столкновений система управления использует приоритеты роботов, основанные, например, на расстоянии между роботом и его конечным положением. Ввиду наличия фазовых ограничений обычная стабилизация роботов не может обеспечить безопасного движения роботов из различных начальных условий в терминальное положение. В работе представлен новый подход авторов к решению задачи стабилизации с фазовыми ограничениями методом многослойного сетевого оператора. В статье приводится пример синтеза управления для четырех роботов.
Ключевые слова: синтез управления, система стабилизации, символьная регрессия, эволюционные вычисления, группы роботов, фазовые ограничения
Управление автономными системами с многими роботами должно осуществляться на основании данных, полученных от датчиков о текущем состоянии роботов. При этом вырабатываемое управление должно быть оптимальным для любого состояния объекта, а не только для одного предварительно рассчитанного. Таким образом, решение традиционной задачи оптимального управления для объекта в каком-нибудь известном начальном состоянии и получение оптимальной программы управления в зависимости от времени не может отвечать требованиям автономных систем. Модуль управления должен вырабатывать оптимальное управление для различных возможных начальных состояний объекта, а также для любых возможных состояний, в которых объект может оказаться в
* Работа выполнена при поддержке гранта РФФИ № 16-29-04224-офи_м. CYBERNETICS AND MECHATRONICS
процессе управления, даже если они не принадлежат полученной оптимальной траектории.
В связи с этим мы рассматриваем задачу синтеза управления. Она заключается в разработке такого модуля управления, который на основании полученных данных о состоянии объекта вырабатывает управление, обеспечивающее достижение цели с оптимальными значениями некоторых заданных функционалов.
Задача управления группой роботов обладает дополнительной сложностью из-за необходимости обеспечения координации между роботами. В сложных ро-бототехнических системах каждый робот должен удовлетворять своим кинематическим уравнениям, а также существующим фазовым ограничениям [1], включая динамические ограничения [2], обеспечивающие отсутствие столкновений между роботами.
Решение задачи синтеза управления представляет собой математическое выражение, описывающее модуль управления. Сегодня задача синтеза управления, или нахождение математического выражения функции управления, может быть решена численно с помощью методов символической регрессии. Все методы символической регрессии позволяют находить оптимальное решение на множестве кодов математических выражений с помощью некоторого эволюционного алгоритма. Методы символической регрессии различаются между собой по форме кодирования возможных решений. Форма кода влияет на реализацию эволюционного алгоритма поиска, в частности на выполнение операции кроссовера. В настоящее время существует несколько методов символической регрессии: грамматическая эволюция [3], аналитическое программирование [4], метод сетевого оператора [5—7] и т.д. Генетическое программирование использовали для решения задачи синтеза [8—11]. В отличие от генетического программирования и других известных методов символической регрессии метод сетевого оператора был специально разработан для решения задачи синтеза управления. Он использует принцип малых вариаций базисного решения [12]. Этот принцип позволяет уменьшить пространство поиска и время расчета за счет выбора хорошего базисного решения.
Метод сетевого оператора кодирует математическое выражение в виде ориентированного графа. Для моделей объектов управления большой размерности метод многослойного сетевого оператора является более удобным в использовании. Многослойный сетевой оператор представляет собой несколько связанных сетевых операторов меньшего размера. В работе [13] мы использовали метод многослойного сетевого оператора для синтеза управления группой роботов. Мы рассматривали группу роботов как один объект управления. Необходимо было найти функцию управления для обеспечения движения роботов из различных начальных состояний в терминальное состояние без столкновений. При синтезе мы учитывали столкновения роботов с помощью функции штрафа. Такой подход, основанный на рассмотрении группы роботов как одного единого объекта, трудно применить к большой группе роботов. В работе [14] нами решалась аналогичная задача управления для перемещения группы из различных начальных состояний во множество терминальных состояний. В этой работе мы сначала синтезировали одну систему управления для стабилизации робота относительно
некоторой точки пространства состояний с фазовыми ограничениями. Установили полученную систему управления для всех роботов. И далее мы искали оптимальные траектории движения роботов в виде точек пространства состояний для движения роботов из разных начальных условий в заданные конечные положения. Основная сложность заключалась в обеспечении отсутствия столкновений между роботами.
В настоящей работе мы устанавливаем приоритеты для роботов для исключения столкновений между ними. Для решения задачи стабилизации мы используем метод многослойного сетевого оператора. В качестве примера мы рассмотрим задачу с четырьмя роботами и двумя фазовыми ограничениями в виде прямоугольных областей.
Рассмотрим систему дифференциальных уравнений, описывающих группу роботов одного типа:
хц = "м со^зА (1)
х2,/ = "м ^(-КзА (2)
ип
-з,/ = Ь *е(и2,/), (3)
где (х1 , х2 ) — координаты геометрического центра робота /; х31 — угол между продольной осью робота I и осью ОХ неподвижной системы координат; Ь — общий габаритный параметр робота; и1 , и2 I — компоненты вектора управления робота /; I = 1, ..., N N — количество роботов в группе.
Для системы (1)—(3) заданы ограничения на управление
и- < иИ < и+, и- < и2г- < , (4)
задано множество начальных значений
V -К (у 0,1 у 0,1 у 0,1 \ / 0,1 у 0,1 у 0,1 \\ х0 - ^1,1 , у2,1, у3,1 ), ■■■, N, у2,N, у3,N )), ...
((у 0,М у 0,М у 0,М\ (у 0,М у 0,М у 0,м\\ (5)
у1,1 , у2,1 , у3,1 ), ■•; N , у2,N , )), (5)
заданы терминальные условия
1 -1,к ) - х(к £, 1 К2,к ) - Х2,к £,
1-3,к (*/ ) - -(к 1^е, к = 1, ..., N, (6)
где ( — не заданное, ограниченное сверху время выполнения терминальных условий,
+ +
( < ? ; е — заданная малая положительная величина; ? — заданная верхняя временная граница выполнения терминальных условий.
Заданы фазовые ограничения в виде прямоугольных областей (рис. 1).
(а, с)
m
id,с)
(,а,1>)
(d,b)
Рис. 1. Фазовое ограничение [Phase constraints]
На рисунке 1 (а, в) — координаты углов прямоугольной области ограничения, а е {а, й}, в е {Ь, с}, а < й, Ь < с.
Мы рассматриваем роботов прямоугольной формы. Углы любого робота не должны находиться внутри общей площади фазовых ограничений, т.е. должно выполняться условие
где (Ху, х2^) — координаты угла у робота /, у = 1, 2, 3, 4, / = 1, ..., N к = 1, ..., К; К— количество фазовых ограничений.
Координаты положения углов каждого робота (рис. 2) определяем по следующим формулам:
где Xf = x1cos(x3) + x2sin(x3) + L/2, y^ = —x^in(x3) + x2cos(x3) + H/2; xlb = x1cos(x3) + + x2sin(x3) - L/2, yhb = yif, xr/ = Xif yrf = -x1sin(x3) + X2Cos(x3) - H/2, xrb = Xhb, yrb = yrf
Задан критерий качества управления
(XW < ak) V (XW > 4) V (X2ji < Ьк) V (X2ji > с*),
(7)
Рис. 2. Углы габаритной площади робота [Corners of the robots area]
*i,i = xif cos(x3) - yvsin(x3), x21 = xlf sin(x3) + ylf cos(x3),
Xl,2 = X/,bCOS(X3) - y/,bSin(X3), X2,2 = X/^COSfo) + y^sinfo),
Xl,3 = X^Cosfo) - y^sinfo), X2,3 = X^Cosfo) + y^sin^),
X14 = Xrf COs(X3) — yr,f sin(X3), X2,4 = Xrf COs(X3) + yrf sin(X3),
i=11 к=1 0
\
(8)
где нижний индекс ■ у скобок (...),■ означает, что выражение в скобках вычисляется для начальных значений ((х0', х0'', х0'),..., (х^, х, х0'^)), 1 < ■ < М.
Необходимо найти управление, которое для любых начальных условий (5) обеспечивает достижение цели управления (6) без нарушения фазовых ограничений (7) с оптимальным значением критерия качества (8).
Для решения поставленной задачи синтеза системы управления на первом этапе мы решаем задачу синтеза системы стабилизации для одного робота, но с фазовыми ограничениями, а затем мы тиражируем эту систему стабилизации для всех роботов.
Для решения задачи стабилизации мы используем функционал
M h
J = Ё t1 +J pdt
i=1 0
^ min,
(9)
где M — количество начальных условий,
t1 =
t, if (xf - Xj(t))2 <£
t + — иначе
(10)
е и ?+ — заданные положительные величины; р(0 — штраф за нарушение фазовых ограничений.
Рис. 3. Нарушение фазовых ограничений [Violation of phase constraints]
Нарушение прямоугольных фазовых ограничений возникает при условии попадания угла робота внутрь общей площади фазовых ограничений или если угол фазовых ограничений попадает внутрь площади робота (рис. 3 а, б).
Р =
r +, if (5152 > 0) а (5253 > 0) а (5354 > 0) s+, if (Y1Y2 > 0) а(y2Y3 > 0) а(YзY4 > 0), 0 — иначе
(11)
где 51 = (X11 - a)(x1,2 - Xu) + fei - Р)^, - ¿2,1),
§2 = (§1,2 - а)(*1,з - *1,2> + (§2,2 - Р)(^2,3 - *2,2>, §3 = (§1,3 - а)(Х1,4 - Х1,з) + (Х2,3 - Р)(Х2,4 - *2,з)'
54 = (§1,4 - а)(§1,1 - §1,4) + (§2,4 - Р)(§2,1 - §2,4),
г+ = тах{г1, г2, г3, г4}, г1 ^ ,1 = 1, 2, 3, 4,
71 = (й - §1)(а - й), 72 = (с - §2)(Ь - с), 73 = (а - x1)(d - а), 74 = (Ь - §2)(с - Ь),
s+ = тахЦ, s2, э3, 54}, ^ (й-§1)2 + (с-§2)2, s2 (а-х^2 + (с-х2)2,
Для решения задачи стабилизации с фазовыми ограничениями мы используем метод многослойного сетевого оператора. Описание метода представлено в работе [15].
В качестве примера используем предложенный метод для решения задачи синтеза системы управления группой из N = 4 мобильных роботов с К = 2 фазовыми ограничениями и М = 2 начальными состояниями. Были заданы следующие начальные условия:
Хо = {(§1,1 = -12.5, §2,1 = 2 §3,1 = 0) (§1,2 = -12.5, §2,2 = 4 §3,2 = 0)
(( = -12.5, x20,31 = 6, §0,3 = 0), (( = -12.5, Xо0,4 = 8, = о),
(§1022 = 12.5, §2022 = 2, x30)22 = 0), (xl022 = 12.5, X20;2 = 4, x30;2 = 0),
(( = 12.5, x20;32 = 6, x30;32 = 0), (x3)42 = 12.5, x20;42 = 8, x30;2 = 0)} и целевое терминальное положение
х
f = 1,1
7.5, х2" i 0, xf i 0, x12 2.5, x2" 2 0, xf 2 0,
§■^3 2.5, 13 0, §'3'3 0, §14 7.5, §'24 0, §,34 0. Были заданы следующие параметры фазовых ограничений:
а1 = -20, Ь1 = -1, с1 = 1, й1 = -10.5, а2 = 10.5, Ь2 = -1, с2 = 1, й2 = 20.
Длина и ширина каждого робота заданы соответственно Ь = 4, Н = 2. Ограничения на управление были и- = -5, и+ = 5, и2- = -1, и2+ = 1. В результате решения задачи методом многослойного сетевого оператора была получена следующая система стабилизации:
И =
И-, if u < м-«1+, if i/1 > И+ ,
И — otherwise
м0 =
м-, if И2 < м-и+, if И2 > м+ , И2 — otherwise
где и1 = 3/2А, и2 = sgn(35 + в£п(Л)ехр(-|34)) х (ехр|3Я + 8§п(^)ехр(-|3^|)| - 1);
Cq4 + sgn(A1 )exp(-1 i | q1) 1 -exp(-Cq4) 3
A =-;-;-+-— + A3 ,■ •
1,i>
2 1 + exp(-Cq4)
B = Dcos(A1,i) + sgn(D)(exp|D| - 1) + G-1; C = ^A,; + q2A2, - qз^зA2.í;
Б = О + веп(0 веп^^,, д Д^^ Дм |) х (ехр | веп(Ам )q6 А у^д^Ц] I -1);
^ Д + Д Д з,/ \ д7Д1,, \ +1
О = д5Д2,/ + вЕп(Д2,/) +-77 Т т—■ А .;
^п(Ди д Дз,^^7 Д1,/1
д' = 10.218; д2 = 0.447754; д3 = 1.4932; д4 = 0.42098; д5 = 14.377441; д6 = 8.47973632; д7 = °.28297; А',/■ = - х1,,; А2,/ = - х2,,-; А3,, = х3,/ - х3,,.
Полученная система стабилизации позволяет роботам успешно достичь терминальных положений из разных начальных условий.
Во время движения роботы имели следующие приоритеты:
d = N - i, i = 1, ..., N.
(12)
Согласно заданным приоритетам если в процессе моделирования возникает вероятность столкновения роботов, то робот с меньшим приоритетом должен остановиться.
д) расстояние между 2 и 4 роботом
е) расстояние между 3 и 4 роботом
Рис. 4. Расстояния между роботами в процессе движения [Distance between robots]
На рисунке 4 приведены результаты моделирования полученной системы управления. На рисунке 4, а—е представлены наименьшие расстояния между роботами, когда они перемещаются из первого начального состояния до конечного состояния.
Из результатов моделирования видно, что полученная система управления позволила роботам переместиться из начальных условий до конечного состояния без столкновений.
В заключение отметим, что в настоящей работе проблема синтеза управления для группы роботов была решена методом многослойного оператора сети. Полученное управление является сложной функцией от координат пространства состояний. Метод нашел не только параметры, но и структуру этой функции управления. В отличие от традиционных методов синтеза управления, метод, который мы показали, позволяет решить задачу синтеза автоматически, а не просто оптимизирует некоторую заданную структуру.
© Дивеев А.И., Шмалько Е.Ю., 2017
БИБЛИОГРАФИЧЕСКИЙ СПИСОК/REFERENCES
[1] Arutyunov, A.V., Karamzin, D.Yu. andPereira, F.L. Maximum Principle in Problems with Mixed Constraints under Weak Assumptions of Regularity, J. of Optimization. Vol. 59. Issue 7. 2010. Pp. 1067—1083.
[2] Kaviczky T., Borelli F., Fregene K., Godbole D. and Balas G.J. Decentralized Receding Horizon Control and Coordination of Autonomous Vehicle Formations, IEEE Trans. on Cont. Syst. Tech., 2008. V 16, 1. Pp. 19—33.
[3] O'Neill, M. and Ryan, C. Grammatical Evolution. IEEE Trans. Evol. Comput. 5, 2001. Pp. 349— 358.
[4] Zelinka, I. Analytic programming by means of new evolutionary algorithms. In: Proceedings of 1st International Conference on New Trends in Physics'01, Brno, Czech Republic, 2001. Pp. 210— 214.
[5] Diveev, A.I. and Sofronova, E.A. Application of network operator method for synthesis of optimal structure and parameters of automatic control system. In: Proceedings of 17-th IFAC World Congress, Seoul, 2008, 05.07.2008 — 12.07.2008. Pp. 6106—6113.
[6] Diveev, A.I. and Sofronova, E.A. Numerical method of network operator for multi-objective synthesis of optimal control system. In: Proceedings of Seventh International Conference on Control and Automation (ICCA'09) Christchurch, New Zealand, December 9-11, 2009. Pp. 701— 708.
[7] Diveev, A.I. A Numerical Method for Network Operator for Synthesis of a Control System with Uncertain Initial Values. Journal of Computer and Systems Sciences International. 2012. Vol. 51. No. 2. Pp. 228—243.
[8] Koza, J.R., Keane, M.A., Yu, J., Bennett, F.H., Mydlowec, W., and Stiffelman, O. Automatic Synthesis of both the Topology and Parameters for a Robust Controller for a Non-Minimal Phase Plant and a Three-Lag Plant by Means of Genetic Programming In Proceedings of the 38 Conference on Decision & Control Phoenix, Arizona USA — December 1999. Pp. 5292—5300.
[9] Koza, J.R., Keane, M.A., Yu, J., Mydlowec, W., and Bennett, F.H. Automatic Synthesis of Both the Control Law and Parameters for a Controller for a Three-Lag Plant with Five-Second Delay using Genetic Programming and Simulation Techniques. In Proceedings of the American Control Conference Chicago, Illinois June 2000. Pp. 453—458.
[10] Yu, J., Keane, M.A., and Koza, J.R. Automatic Design of Both Topology and Tuning of a Common Parameterized Controller for Two Families of Plants using Genetic Programming. In Proceedings
of the 2000 IEEE International Symposium on Computer-Aided Control System Design Anchorage, Alaska, USA September 25-27, 2000. Pp. 234—242.
[11] Cpalka, K., Lapa, K, andPrzybyl, A. A New Approach to Design of Control Systems Using Genetic Programming. Information technology and control. 2015. V. 44. No. 4. Pp. 433—442.
[12] Diveev A.I. Small Variations of Basic Solution Method for Non-numerical Optimization. In Proceedings of 16th IFAC Workshop on Control Applications of Optimization, October 6th—9th, 2015. Garmisch-Partenkirchen. Pp. 28—33.
[13] Diveev, A.I. and Shmalko, E.Yu. Optimal Control Synthesis for Group of Robots by Multilayer Network Operator. In Proceedings of 3rd International Conference on Control, Decision and Information Technologies (CoDIT'16). St. Paul's Bay — Malta on April 6-8, 2016. Pp. 077—082.
[14] Diveev, A.I. and Shmalko, E.Yu. Optimal Motion Control for Multi-Robot System by Multilayer Network Operator. In Proceedings of the 11th IEEE Conference on Industrial Electronics and Applications (ICIEA 2016), 5—7 June 2016, Hefei, China. Pp. 2164 — 2169.
[15] Дивеев А.И., Софронова Е.А., Шмалько Е.Ю. Эволюционные численные методы решения задачи синтеза системы управления группой роботов // Информационные и математические технологии в науке и управлении. Иркутск: ИСЭМ СО РАН, 2016. № 3. С. 11—24. [Evolutsyonnye chislennye metody reshenia zadachi sinteza sistemy upravlenia gruppoi robotov = Evolutionary computational methods to solve problems of control system synthesis for groups of robots // Informacionnye i matematicheskie tehnologii v nauke i upravlenii = Information and mathematical technologies in science and management. Publ. Irkutsk: Melentiev Energy Systems Institute SB RAS, 2016. № 3. S. 11—24].
История статьи:
Дата поступления в редакцию: 5 декабря 2016 Дата принятия к печати: 22 января 2017
Для цитирования:
Дивеев А.И., Шмалько Е.Ю. Синтез управления для автономной группы роботов с фазовыми ограничениями методом многослойного сетевого оператора с расстановкой приоритетов // Вестник Российского университета дружбы народов. Серия: Инженерные исследования. 2017. Т. 18. № 1. С. 115-124.
Cвeдeния об авторах:
Дивеев Асхат Ибрагимович, доктор технических наук, профессор, заведующий сектором проблем кибернетики, Федеральный исследовательский центр «Информатика и управление», Российская академия наук, профессор департамента механики и мехатроники, Инженерная академия, Российский университет дружбы народов. Сфера научных интересов: вычислительные методы для решения задач управления. Контактная информация: e-mail: aidiveev@mail.ru.
Шмалько Елизавета Юрьевна, кандидат технических наук, старший научный сотрудник, Федеральный исследовательский центр «Информатика и управление», Российская академия наук. Сфера научных интересов: вычислительные методы для решения задач управления. Контактная информация: e-mail: e.shmalko@gmail.com.
SYNTHESIS OF CONTROL FOR GROUP OF AUTONOMOUS ROBOTS WITH PHASE CONSTRAINTS BY MULTI-LAYER NETWORK OPERATOR WITH PRIORITIES
A.I. Diveev12, E.Yu. Shmalko12
'Federal Research Center "Computer Science and Control" of RAS Vavilov str., 44, Moscow, Russia, 119333 2RUDN University, Engineering Academy Miklukho-Maklaya str., 6, Moscow, Russia, 117198
We consider a control system synthesis problem for the small group of autonomous robots with state constraints and several possible initial conditions. The main control task for team of robots is to move the robots out of some current position to the specified terminal position without colliding with each other. Typically, the control synthesis for the group of robots consists of two phases: stabilization of the robot with respect to some point of the state space and the design of optimal trajectories. The trajectories must ensure that the robots move from the initial states to certain states of the terminal set without collisions. To avoid collision, the control system uses priorities based, for example, on a distance between the robot and its end position. Since there are phase constraints, ordinary stabilization of robots cannot ensure the safe movement of robots from different initial conditions to the terminal positions. The paper presents our new approach to solving the stabilization problem with phase constraints by multi-layer network operator. We show an example of synthesis of control for the group of four robots.
Key words: synthesis of control, stabilization system, symbolic regression, evolutionary computation, groups of robots, phase constraints
Article history:
Received: 5 December 2016 Accepted: 22 January 2017
For citation:
Diveev A.I., Shmalko E.Yu. (2017) Synthesis of control for group of autonomous robots with phase constraints by multi-layer network operator with priorities. RUDN Journal of Engineering Researches, 18(1), 115-124.
Bio Note:
AskhatI. Diveev, Doctor of technical sciences, professor, chief of sector of Cybernetic problems, Federal Research Centre "Computer Science and Control" of Russia Academy of Sciences, professor of department Mechanics and mechatronics, Engineering Academy, Peoples' Friendship University of Russia (RUDN University). Research Interests: Computational methods for problems of control. Contact information: e-mail: aidiveev@mail.ru.
Elizaveta Yu. Shmalko, candidate of technical sciences, senior researcher, Federal Research Centre "Computer Science and Control" ofRussia Academy ofSciences. Research Interests: Computational methods for problems of control. Contact information: e-mail: e.shmalko@gmail.com.