УДК 681.51
УСТОЙЧИВОСТЬ МУЛЬТИАГЕНТНЫХ ЛИНЕЙНЫХ СКАЛЯРНЫХ СИСТЕМ И ЕЕ ЗАВИСИМОСТЬ ОТ ГРАФА СВЯЗЕЙ1 С.И. Томашевича
а Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО), Санкт-Петербург, Россия, [email protected]
Многоагентные системы в настоящее время находят все более широкое применение в различных областях техники, таких как энергетика, транспорт, робототехника, авиация и др. При организации многоагентных систем внимание обращается на два главных аспекта: непосредственно на динамику самих агентов и на способы их взаимодействия, которые определяются структурой информационных связей между агентами. Таким образом, выделяются ключевые точки исследования многоагентных систем - динамика индивидуальных агентов и вид графа информационных связей. Динамика формации в целом определяется совокупностью свойств агентов и графа связей. Рассматривается связь между динамикой агентов и матрицей Лапласа, используемой для задания графа связей. Для исследования используются результаты известной работы А. Факса и Р. Мюррея, 2004 г. Представлены иллюстративный пример, а также прикладная задача исследования динамики формации, состоящей из группы квадрокоптеров. Информационные связи между агентами заданы в работе некоторыми типовыми графами. Дана интерпретация условий устойчивости, предложен метод корректирования законов управления на их основе. В качестве примера применения методики взято движение группы квадрокоптеров по высоте полета. Проведено моделирование, результаты которого демонстрируют основные зависимости между видом графа (и, как следствие, собственными числами лапласиана, который этот граф описывает) и наличием устойчивости. Моделирование и рассмотрение связи кривой Найквиста с ключевыми точками позволяет судить об устойчивости системы и предпринять меры по изменению законов управления. На основе данного метода исследования получаются необходимые условия устойчивости формации. Результат работы позволяет формировать локальные законы управления агентами, обеспечивающие устойчивость движения группы при выбранной структуре информационных связей. С учетом вида кривой Найквиста и расположения ближайших точек, которые она не должна охватывать, можно корректировать локальный закон управления с помощью классических методов расчета для обеспечения требуемых запасов устойчивости. Ключевые слова: мультиагентные системы, лапласиан, квадрокоптер.
STABILITY OF LINEAR MULTIAGENT SCALAR SYSTEMS AND ITS DEPENDENCE ON CONNECTIVITY GRAPH1
S.I. Tomashevich а
а Saint Petersburg National Research University of Information Technologies, Mechanics and Optics (ITMO University), Saint Petersburg, Russia, [email protected]
Multiagent systems are now finding increasingly wide applications in various engineering fields such as energy, transportation, robotics, aviation and others. There are two main aspects to be focused on when organizing multiagent systems: the dynamics of the agents themselves and the ways of their interaction. This interaction is determined by the structure of information connections between agents. Thus, there are several key points of multiagent systems study: the dynamics of individual agents and shape of the information graph. Formation dynamics, in general, is determined by a set of properties of agents and connectivity graph. The paper deals with the relationship between dynamics of agents and Laplace matrix, which is used to set the graph connections. The present research is based on the results given in the known paper by A. Fax and R. Murray (IEEE Trans. AC, 2004). An illustrative example is given, and the application problem of studying the formation dynamics consisting of the group of quadrocopters is presented. Information exchange between agents is determined in the paper by means of the conventional set of graphs. The paper presents an interpretation of the stability conditions and the method of system performance improvement based on these conditions. Motion of quadrocopters group along the flight height is used as an example for methodology application. The simulation results demonstrate the basic dependencies between the information graph shape (and, consequently, the eigenvalues of the Laplacian, which describes this graph) and formation stability. Simulation and consideration of Nyquist diagram connection with the key points give an indication of the system stability and take steps to change the control laws. Necessary conditions for the formation stability are obtained on the basis of this research method. Research result makes it possible to create local control laws for agents to ensure the stability of motion in the selected structure of information connections. It is shown that the local control law can be adjusted by classical calculation methods ensuring prescribed stability margins in view of the Nyquist curve type and location of the closest points which should not be covered by it.
Keywords: multiagent systems, Laplacian, quadrocopter.
Введение
Особенностью управления сетевыми системами является то, что такие системы децентрализованы, и поэтому решения каждого узла основываются только на доступной ему информации. Одной из задач сетевого управления является синхронизация, т.е. обеспечение согласованного во времени поведения подсистем (агентов). Когда устройств, выполняющих одну и ту же задачу, несколько и они выполняют однотипные задачи, системы являются многоагентными, и поэтому необходимо учитывать взаимодейст-
1 Работа выполнена при государственной финансовой поддержке ведущих университетов Российской Федерации (субсидия 074-U01).
This work was partially financially supported by the Government of the Russian Federation (Grant 074-U01). 72 Научно-технический вестник информационных технологий, механики и оптики
72 Scientific and Technical Journal of Information Technologies, Mechanics and Optics
2014, №2 (90)
вие между агентами. Структура формации и направление информационных потоков в сети преимущественно описываются графом связей [1]. От него в первую очередь зависит поведение системы в целом, т.е. приход системы к консенсусу зависит от вида графа. Согласно [2], устойчивость системы в целом наблюдается тогда и только тогда, когда все собственные числа лапласиана удовлетворяют определенному условию. Таким образом, при работе с многоагентной системой необходимо выявить условия, при которых система функционирует. Этот результат используется для формирования законов управления каждого агента. В отличие от [1], где рассматриваются условия достижения цели управления непосредственно в законе управления, в настоящей работе исследуются необходимые условия для вида формации.
Как правило, существуют неконтролируемые возмущения для каждого из агентов, которые необходимо компенсировать, такой вопрос рассматривается в [3-5]. Мультиагентная система не всегда может иметь определенную структуру, поэтому возможны изменения связей. Если обращаться к структуре формации, то ее структуру и свойства задает лапласиан - матрица, описывающая имеющиеся связи между агентами. Лапласиан может быть представлен несколькими способами, но, как указано в [6], они теоретически эквивалентны и различаются только удобством использования. В данной работе используется лапласиан, аналогичный [6], другой вид можно найти в [7, 8]. В работах [9-12] рассматриваются муль-тиагентные системы с нелинейной динамикой, а также вопросы, связанные с реализацией обратных связей и управлением неидентичными агентами, что вносит свою специфику в построение формаций. В [13, 14] найдены критерии синхронизации поповского типа для нелинейных динамических сетей с агентами общего вида (в том числе бесконечномерными). Получен критерий достижения консенсуса в многоагент-ных сетях, агенты которых описываются уравнениями сверточного типа (например, уравнениями с запаздываниями), а связи между агентами нелинейны и неизвестны, предполагается лишь выполнение секторных неравенств и условий симметрии сети. Необходимые и достаточные условия сходимости нелинейных консенсусных протоколов для сетей с двунаправленной топологией рассмотрены в [15], где получен критерий достижения консенсуса в сетях агентов первого порядка (интеграторы с непрерывным временем) с переменным неориентированным графом, при этом связи между агентами могут быть как линейными, так и нелинейными.
В настоящей работе рассмотрены критерии устойчивости для агентов, описываемых передаточными функциями, и выделены граничные состояния формаций, которые обязывают агентов иметь ту или иную динамику.
Критерий устойчивости
Рассмотрим линейную систему, в которой уравнение каждого агента имеет вид
Х! = РАХ! + Рви1»и1 = к1У| + к2^, У1 = РС1Х1,21 = |7| Е РсА " ХД
где с [1, N] \1 и представляет множество агентов, движение которых учитывает 1-й агент. Условимся, что это множество - ненулевое, и каждый агент получает информацию от хотя бы одного другого, х., Хj - векторы состояния, РА - матрица состояния, и. - вектор управления, Р в - матрица управления, к1 и к2 - матрицы, формирующие общее входное воздействие, РСг - матрица, формирующая относительный выход, у. - вектор выхода. Также предположим, что РС1 - нулевая матрица выхода и матрица РА не
имеет значений в правой комплексной полуплоскости.
В [2] доказана следующая теорема: формация из N агентов устойчива тогда и только тогда, когда одновременно устойчивы с регулятором К все следующие системы:
Х1 = РЛ + Рв«1,
У! = Рс1Х1, (1)
z. = Х.Рс х.,
1 1 с2 1
где X, - собственные числа лапласиана для всех 1=1,.,п. Иначе говоря, все собственные числа должны удовлетворять этому условию, а z1 - вектор виртуальной связи, необходимый для дальнейшего понимания критерия.
При наличии циклов в формации некоторые собственные значения могут быть комплексными. Так как обратная связь z1 содержит собственные числа, то она также будет комплексной, но в данном случае она виртуальна и образуется не для построения, а лишь для получения следующих шагов. Тогда для изучения устойчивости необходимо рассмотреть систему (1), имея в виду, что z1 - обратная связь, содержащая коэффициент усиления X,.
Опираясь на теорему 4 из работы [2], рассмотрим критерий Найквиста для этого случая: допустим, что система состоит из регулятора К(я) и непосредственно самого объекта Р(я), образуя передаточную функцию Щя) = К(я)Р(я). Представим ее в виде
Щ (я) = (2)
С (я)
где В(я) и С (я) - характеристические полиномы системы. Тогда система, полученная из (2) добавлением отрицательной обратной связи, которая содержит собственное число X,, имеет вид
ад=_В+В_ (3)
1+ ХЩ (я) С (я) + В(я)Х,.
Введем дополнительную функцию и произведем преобразования в частотной области для исследования устойчивости системы (3):
= ^ + = (4)
X,. X Р(в)
Рассматривая функции (3) и (4) и повторяя для них аналогичные шаги, но уже для виртуальной обратной связи, получаем, что годограф исходной системы Щя) = К(я)Р(я) при я = /ю , /2 = -1, ю е (-да; +да) не должен охватывать точку -X-1. Таким образом, в случае простого древовидного графа (когда все собственные значения лапласиана равны 1, а значит, и -X-1 =-1) общая устойчивость всей формации зависит только от устойчивости каждого агента, так как неустойчивость всей формации появляется тогда и только тогда, когда годограф агента охватывает точку (-1/0), что равнозначно неустойчивости всей системы в целом.
Все возможные собственные значения -X лежат в пределах диска Перрона - круга единичного радиуса с центром в точке (1/0), поэтому значения искомых -X-1 лежат в следующих диапазонах: Re(-X-1) е (-да; -0,5] и Im(-X-1) е (-да; +да). Можно сделать вывод, что чем ближе инверсные собственные числа лапласиана к мнимой оси, тем ближе формация к потери устойчивости.
В итоге условие устойчивости формации можно трактовать следующим образом: если агент устойчив, то необходимо и достаточно, чтобы его амплитудно-фазовая частотная характеристика (АФЧХ) не охватывала точку -X-1, если же агент неустойчив, то необходимо и достаточно, чтобы АФЧХ разомкнутой системы охватывала точку -X-1 и при изменении частоты от 0 до да оборачивалась вокруг нее
против часовой стрелки на угол ф = п -2, где п - порядок дифференциального уравнения, описывающего
динамику агента. Из этого можно сделать следующий вывод: если агент устойчив и вещественная часть его годографа не становится меньше -0,5, то вся формация устойчива вне зависимости от ее вида, так как в таком случае годограф априори не охватывает ни точку (1/0), ни точки -X-1.
Этот результат легко распространить на более широкий класс систем, у которых матрицы связей -не обязательно лапласовские. Действительно, предполагая, что лапласиан Ь приводится к диагональному виду с помощью соответствующей невырожденной матрицы Р, выполним замену переменных: Ь = Рхdiag{X1,Х2,...,Хы}хР-1. Тогда из характеристического уравнения системы det(I + ЬЩ(я)) = 0 немедленно следует приведенное выше утверждение об устойчивости всей системы, где I - единичная матрица.
Иллюстративный пример
В качестве моделируемого агента возьмем апериодическое звено (как пример механической инерционной системы) с пропорционально-дифференциальным регулятором (ПД-регулятором) вида
Р(з) =-1-, (5)
0,35 + 1
10 8
К (я) = 0,05 . (6)
я
Объект описывается передаточной функцией (5), а ПД-регулятор - функцией (6). Рассмотрим пример графа, который содержит 6 вершин и в котором агенты выстроены последовательно, т.е. граф имеет вид, показанный на рис. 1, а.
6,
© ©:
4
а б в
Рис. 1. Виды рассматриваемых графов: а - дерево; б - цикл с двусторонними связями; в - цикл с двусторонними связями, содержащий ответвления
Для каждой формации будем рассматривать комплексную плоскость с расположенными на ней значениями -Х-1 и кривой Найквиста для одного агента. При выбранном последовательном соединении вершин в графе, как было указано выше, -Х-1 =-1, поэтому необходимо, чтобы каждый агент был устойчив сам по себе. Данный случай показан на рис. 2, а. Кружком на графике отмечаются расположения -Х-1, которые в данном случае все находятся в одной точке. Очевидно, что при таком значении собственного числа устойчивость формации зависит только от устойчивости каждого агента (напомним, что рассматривается система, у который все агенты являются идентичными).
Замкнем граф связью 6^1 и рассмотрим изменения. Сами собственные значения Х,. будут располагаться на границе диска Перрона, а полученные обратные отрицательные значения и кривая Найквиста примут вид, показанный на рис. 2, б. Все значения с границы этого круга единичного радиуса с центром в точке (-1,/0) на комплексной плоскости переносятся на вертикальную ось, сдвинутую на -0,5 относительно мнимой оси. Таким образом, происходит приближение собственных чисел к мнимой оси, и система теряет устойчивость. Два противоположных граничных случая (последовательный и циклический графы) показывают возможные крайние расположения чисел -Х-1. Можно сделать вывод, что цикличность в графах формаций нежелательна.
1 1
В 0
-1
-1
-1,5
-1
-0,5 Re а
0,5
-1,5
-1
-0,5 Re
0,5
б
Рис. 2. Значения -Х-1 и кривые Найквиста для графов с однонаправленными связями: а - для формации, граф которой изображен на рис. 1, а; б - для формации, граф которой изображен
на рис. 1, а, с добавленной связью 6^1
Для компенсации введем связь 1^6, организовав двунаправленное соединение этих агентов. Расположение обратных отрицательных собственных чисел, изображенных на рис. 3, а, показывает, что ситуация улучшается, но несколько значений остаются охваченными годографом.
Доведя данный случай до состояния, когда каждый агент формации влияет на два соседних, т.е. имеет по две двунаправленные связи (рис. 1, б), получим состояние, когда вся формация устойчива и все обратные отрицательные значения лежат на вещественной оси (рис. 3, б). Следует сделать вывод, что при наличии циклов в графе формации ввод двунаправленных связей помогает избежать потери устойчивости.
Известно, что симметричная матрица имеет вещественные собственные значения. Предельный случай лапласиана по наличию связей (двунаправленных для каждого агента и для каждого с каждым)
1
подразумевает следующий вид: единичная главная диагональ и все остальные элементы вида
n -1
где
п - порядок квадратной матрицы лапласиана L , т.е. число агентов. Для такого случая лапласиан будет
0
0
0
иметь вещественные значения X1 = 0 и X/ = (1 +--), где/=2,3,.,п. Тогда для случая с шестью агента-
п-1
ми собственные числа лапласиана имеют следующий вид:
С0,1 = 1;
(7)
X. =
[1,2,1 = 2,3,...,6.
Из (7) видно, что отрицательные обратные значения лежат на вещественной оси.
1
а о
-1
1
а о
-1
-1,5
-0,5 Re
-1,5
-1
о
о,5
-0,5 Re
а б
Рис. 3. Значения -X-1 и кривые Найквиста для графов с двунаправленными связями: а - для формации, граф которой изображен на рис. 1, а, с добавленными связями 6—1 и 1 —>6; б - для формации, граф которой изображен на рис. 1, б
Моделирование системы квадрокоптеров
Моделирование многоагентных систем происходит преимущественно с самыми простыми агентами. Рассмотрим более сложный и реалистичный пример, для чего возьмем модель квадрокоптера и закон управления из работы [16]. Движение будем осуществлять вдоль вертикальной оси. Построив модель, используя подобранные параметры и линеаризовав ее, получим передаточную функцию
Wq (s) =
3,96 -106 (s + 0,112)(s + 0,0853)
(8)
+ 3,191)
Исследуем полностью циклическую формацию. В данном случае нетрудно убедиться, что все обратные отрицательные собственные значения лапласиана не будут охватываться годографом, но крайние из них лежат близко к нему. Для наблюдения неустойчивой формации и подтверждения критерия устойчивости намеренно ухудшим закон управления, чтобы годограф мог охватывать нежелательные значения (рис. 4, а). Построим годограф системы с худшим управлением и изобразим на нем значения -X-1. Кривая в этом случае уже охватывает несколько значений, поэтому построенная формация должна быть неустойчива. Легко проверить, что результат совпадает с предположением.
Произведем изменения в графе, чтобы получить устойчивую формацию и проиллюстрировать использование критерия устойчивости. Представим формацию в виде, показанном на рис. 1, в, и получим годограф с отмеченными отрицательными обратными собственными значениями лапласиана (рис. 4, б). Видно, что ни одно из них не охватывается, поэтому формация должна быть устойчива. Убедимся в этом, рассмотрев графики переходных процессов для каждого из агентов (рис. 5).
1
-1
0
-1 -0,8 -0,6 -0,4 -0,2 0 0,2 -2,5 -2 -1,5 -1 -0,5 Re Re
а б
Рис. 4. Кривая Найквиста для модели, описываемой формулой (8) с измененным управлением и отмеченными значениями -X-1: а - для формации, граф которой изображен на рис. 1, а, с добавленной связью 6—1; б - для формации, граф которой изображен на рис. 1, в
Таким образом, зная вид кривой Найквиста и ее расположение относительно отрицательных обратных собственных значений, которые она не должна охватывать, можно корректировать локальный закон управления агентов с помощью классических методов расчета, например, логарифмических ам-
0
плитудных характеристик [17]. Достоинство такого подхода заключается в том, что закон управления корректируется исходя из вида формации, в которую объединены агенты.
h, м 5
0
-5
h, м 4 2 0
h, м 10 5 0
-5 -10
h, м
10 5
0
-5 -10
0
5 10 15 20 25 t, c 0 5 а
h, м
4 2 0
-2 -4
5 10 15 20 25 t, с 0 б
h, м
5 0
-5
5 10 15 20 25 U 0 5 в
15 г
t, c
15 д
15 е
Рис. 5. Изменение высоты полета каждого квадракоптера при совместном движении: а -б - агент 2; в - агент 3; г - агент 4; д - агент 5; е - агент 6
Заключение
агент 1;
Рассмотрено условие устойчивости формации для агентов, описываемых передаточной функцией. Достоинство такого метода состоит в том, что можно определить граничные значения для годографов агентов для конкретной формации и, исходя из них, производить настройку закона управления для агентов, чтобы сохранить устойчивость формации. Показано на примере, что метод применим для агентов различной сложности, необходима лишь его передаточная функция. Можно корректировать локальный закон управления, зная вид кривой Найквиста и расположение ближайших к ней отрицательных обратных собственных чисел лапласиана. Данный подход позволит наглядно изменять законы управления для достижения необходимых условий устойчивости формации.
Литература
1. Джунусов И.А., Фрадков А.Л. Синхронизация в сетях линейных агентов с обратными связями по выходам // Автоматика и телемеханика. 2011. № 8. С. 41-52.
2. Fax J.A., Murray R.M. Information Flow and Cooperative Control of Vehicle Formations // IEEE Transactions on Automatic Control, 2004. V. 49. N 9. P. 1465-1476.
3. Фуртат И.Б. Субоптимальное управление нелинейными мультиагентными системами // Научно-технический вестник информационных технологий, механики и оптики. 2013. № 1 (83). С. 19-29.
4. Фуртат И.Б. Консенсусное управление линейной динамической сетью по выходу с компенсацией возмущений // Мехатроника, автоматизация, управление. 2011. № 4. С. 12-18.
5. Фуртат И.Б. Робастная синхронизация динамической сети с компенсацией возмущений // Автоматика и телемеханика. 2011. № 12. С. 104-114.
6. Fax J.A. Optimal and Cooperative Control of Vehicle Formations. Ph.D. dissertation, California Inst. Technol., Pasadena, CA, 2002. 123 p.
7. Li Z., Duan Z.S., Chen G.R., Huang L. Consensus of multiagent systems and synchronization of complex networks: a unified viewpoint // IEEE Transactions on circuits and systems-I: Regular papers. 2010. V. 57. N1, P. 213-224.
8. Olfati-Saber R., Murray R.M. Consensus problems in networks of agents with switching topology and time-delays // IEEE Transactions on Automatic Control. 2004. V. 49. N 9. P. 1520-1533.
0
0
9. Fradkov A.L., Junussov I.A., Ortega R. Decentralized adaptive synchronization in nonlinear dynamical networks with nonidentical nodes // Proc. IEEE Multiconference on Systems and Control. St. Petersburg, Russia, 2009. P. 531-536.
10. Fradkov A.L., Junussov I.A. Output feedback synchronization for networks of linear agents // Proc. 7th European Nonlinear Dynamics Conference (ENOC 2011). Rome, Italy, 2011. P. 2.
11. Fradkov A.L., Junussov I.A. Synchronization of networks of linear systems by static output feedback // Proc. 50th IEEE Conf. Dec. Contr. Orlando, 2011. P. 8188-8192.
12. Fradkov A.L., Grigoriev G.K., Selivanov A.A. Decentralized adaptive controller for synchronization of dynamical networks with delays and bounded disturbances // Proc. IEEE Conference on Decision and Control. Orlando, USA, 2011. P. 1110-1115.
13. Proskurnikov A.V. Consensus between nonlinearly coupled delayed agents // Proc. International Physics and Control Conference PHYSCON-2013, San Luis Potosi, Mexico [Электронный ресурс]. Режим доступа: http://lib.physcon.ru/file?id=5e0716ecf017, свободн., яз. англ. (дата обращения 17.02.2014).
14. Proskurnikov A.V. The popov criterion for consensus between delayed agents? // IF AC Proceedings Volumes, V. 9. Part 1. P. 693-698.
15. Matveev A.S., Novinitsyn I., Proskurnikov A.V. Stability of continuous-time consensus algorithms for switching networks with bidirectional interaction // Proc. 2013 European Control Conference, ECC 2013. Zurich, Switzerland, 2013. P. 1872-1877.
16. Пыркин А.А., Мальцева Т.А., Лабадин Д.В., Суров М.О., Бобцов А.А. Синтез системы управления квадрокоптером с использованием упрощенной математической модели // Изв. вузов. Приборостроение. 2013. Т. 56. № 4. С. 47-51.
17. Бесекерский В.А., Попов Е.П. Теория автоматических систем. Изд. 4-е, перераб. и доп. СПб: Изд-во «Профессия», 2003. C. 355-361.
Томашевич Станислав Игоревич
Stanislav I. Tomashevich
Принято к печати 07.02.14 Accepted 07.02.14
студент, Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики (Университет ИТМО), Санкт-Петербург, Россия, [email protected]
student, Saint Petersburg National Research University of Information Technologies, Mechanics and Optics (ITMO University), Saint Petersburg, Russia, [email protected]