УДК 681.5 ББК 32.817
СЦЕПЛЕНИЕ КООРДИНАТ И ИЕРАРХИЧЕСКИЕ АЛГОРИТМЫ В ЗАДАЧЕ РАВНОУДАЛЕННОГО РАСПОЛОЖЕНИЯ АГЕНТОВ НА ОТРЕЗКЕ1
Парсегов С. Э.2
(ФГБУН Институт проблем управления им. В.А. Трапезникова РАН, Москва)
Предлагаются и изучаются новые стратегии равноудаленного расположения агентов на отрезке. Модификации стратегии включают в себя повышение порядка агентов, образующих систему, и сцепление координат агентов. Кроме того, рассматривается двухуровневая иерархическая схема, позволяющая управлять группами агентов.
Ключевые слова: управление формациями, сцепление координат, иерархические алгоритмы.
Введение
Теория управления мультиагентными системами является дальнейшим развитием классической теории управления. Особенностью мультиагентных систем является наличие не одного объекта управления, как в классической теории, а целой группы объектов, которые называют агентами. Теоретический аппарат этого нового направления базируется как на классических принципах и методах теории управления [8, 13], так и на положениях спектральной теории графов, необходимой для исследования структуры мультиагентных систем [1, 9, 15].
Особенностью мультиагентных систем является их децен-трализованность — управление всей системой осуществляется
1 Автор признателен П.С. Щербакову за ценные обсуждения содержания статьи.
2 Сергей Эрнестович Парсегов, аспирант ([email protected]). 264
без центрального регулятора, действующего на каждого агента. Достижение цели управления достигается за счет локального взаимодействия агентов. Платой за отсутствие централизованного управления является более высокая сложность задач управления мультиагентными системами. Однако по ряду причин применение такого подхода является более оправданным и многообещающим. Прежде всего — это наличие реальных физических ограничений, действующих на агентов, таких как пропускная способность каналов связи, ограниченная зона видимости, большое число взаимодействующих подсистем. К преимуществам распределенного подхода можно отнести робастность к отказу отдельных подсистем, надежность и гибкость [21].
Адекватность моделей мультиагентных систем, и, соответственно, их сложность определяется многими факторами: сложностью моделей агентов, входящих в систему, структурой, связывающей агенты между собой, типами этих связей [25].
Насколько известно автору, на настоящий момент не очень много работ, где были бы структурированы и отражены все аспекты этого направления, литература по данному вопросу весьма обширна и разнородна, а терминология часто варьируется. В качестве примера следует привести [21], где сделана попытка обобщить и изложить имеющиеся результаты по управлению мультиагентными системами. Можно выделить основные направления/задачи в области мультиагентных систем: задачи достижения консенсуса, распределенной оптимизации, распределенного оценивания, управления формациями и многие другие.
Вопросы, связанные с управлением формациями, занимают особое место в этой тематике. Распределенное управление формациями подразумевает определенное поведение агентов, при котором они образуют некоторые геометрические конфигурации в пространстве посредством локального взаимодействия. Алгоритмы такого рода применяются для управления группами колесных роботов, беспилотных летательных/подводных аппаратов
[2] и т.д. Управление системами, состоящими из большого числа мобильных объектов, является важной задачей из-за их ком-
мерческого и военного применения. В сравнении с автономными устройствами, выполняющими одиночные миссии, применение групп совместно работающих устройств открывает большие возможности. Можно привести лишь некоторые примеры потенциальных приложений таких групп автономных устройств: военное дело, системы наблюдения, системы метеослужб, погрузочноразгрузочные операции опасных материалов, распределенные сети сенсоров и т.п. Управление формациями включает в себя такие задачи, как получение формации (formation producing) и слежение формации (formation tracking) [21, 23]. В рамках задачи получения/образования формации группа агентов в пространстве образует некоторую геометрическую фигуру без какого-либо указания для группы (без лидера, виртуального или реального); в задаче слежения группа агентов достигает желаемого геометрического расположения и следит за задающим воздействием (следует за лидером).
Одной из типовых задач в этой области является задача равноудаленного расположения агентов на некотором фиксированном отрезке посредством локального взаимодействия [7, 10, 24]. Стратегия управления устроена следующим образом: каждому агенту в группе предписывается расположиться в середине отрезка, соединяющего его двух крайних по номерам соседей. Существующие алгоритмы равноудаленного расположения агентов на отрезке описываются дифференциальными уравнениями первого порядка, не учитывают возможную связь между пространственными координатами. Особенность рассматриваемой стратегии состоит в том, что она не является задачей достижения консенсуса.
В работе предлагаются различные обобщения задачи равноудаленного расположения на отрезке: усложняются модели агентов, связи между ними, предлагается и изучается двухуровневый иерархический алгоритм.
1. Основные понятия и постановка задачи
1.1. РАВНОУДАЛЕННОЕ РАСПОЛОЖЕНИЕ НА ОТРЕЗКЕ Одномерный случай
Рассмотрим линейный алгоритм перемещения п подвижных агентов для их равномерного расположения на заданном отрезке [ж0, жп+1 ]. Пусть положение каждого агента при £ ^ 0 обозначается через ж (£) Е М. Закон управления предполагает наличие информации о расстояниях между агентом и двумя его ближайшими по номерам соседями. Каждый агент движется в направлении середины отрезка, соединяющего его соседей. Векторно-матричное описание стратегии имеет вид [24]:
х 0 ' 0 0 0 0 . . . 0 хо
х 1 0.5 -1 0.5 0 . . . 0 х1
х 2 0 0.5 -1 0.5 . . . 0 х2
(1) =
х п 0 0.5 5. 0. 1 - хп
_х п+1_ 0 0 0 0 0 _хп+1_
Анализируя систему (1), можно сказать, что неподвижные агенты х0 и хп+1 являются лидерами формации. Целью этих лидеров является обеспечение правильного движения формации. Важно отметить, что крайние виртуальные агенты-лидеры не координируют движение формации централизованно, поскольку они не передают информацию о своем положении всем агентам. Подвижные агенты х^, і = 1,..., п, получают информацию только о расстояниях до своих крайних по номерам соседей хі-1 и хі+1 . Такую схему обмена информацией можно представить в виде ориентированного графа рис. 1.
•----—►................^-----------------•
Рис. 1. Ориентированный граф алгоритма равноудаленного расположения на отрезке
Замечание 1. Легко заметить, что матрица системы (1) имеет два нулевых собственных числа, а граф системы, представленный на рис. 1, не содержит ориентированного остовного дерева. Следовательно задача равноудаленного расположения агентов на отрезке не является задачей достижения консенсуса (см. [9, 21]).
С другой стороны, агенты в пределе выстраиваются на равных расстояниях (длины отрезков между точками стремятся стать равными), т.е. задача расположения на отрезке напоминает задачу согласования характеристик (консенсуса). К такой задаче можно перейти при помощи несложных преобразований [6]. Первое преобразование заключается в переносе одного из неподвижных агентов (границ отрезка) в начало координат. Второе преобразование является заменой координат: расстояния между отрезками рассматриваются как новые координаты системы. Преобразованная система удовлетворяет условиям теорем о согласовании характеристик и консенсус достигается.
Особенностью перехода к задаче консенсуса является понижение размерности системы («потеря» одного из неподвижных агентов) и утрата геометрического смысла [6]. Обобщения задачи равноудаленного расположения на отрезке, предлагаемые в работе, строятся в исходной системе координат.
Представим иной способ описания стратегии, отличный от
(1). Очевидно, что матрица системы (1) является вырожденной, работать с такими матрицами не всегда удобно. Кроме того, часто необходимо иметь независимое описание модели агента и управляющего закона (протокола управления), обеспечивающего требуемое движение мультиагентной системы.
С этой целью представим модель каждого агента в виде интегратора:
(2) хі = Пі, і = 1,..., п.
Тогда из (1) видим, что линейный протокол управления ПіЄШ имеет вид:
/лї хі+1 + хі— 1 •
(3) Пі = --------2-------хі, і = 1,...,П.
Пусть ж = [ж1, Ж2, ..., жп]Т — вектор состояния мультиагент-ной системы, тогда ее динамика может быть записана в компактной форме [7]
(4) ж = Аж + Ь,
где матрица А и вектор Ь имеют вид
(5)
A =
-1 0.5 0
0.5 -1 0.5
0 0 ... 0.5 -1
(6) Ь = [0,5жо, 0,..., 0,5жга+1]Т е Мп.
Матрица А является трехдиагональной, ее собственные значения имеют вид [3]
2
(7)
Ak = —2 sin
k = 1,...,n.
2(п + 1)’
Поскольку Лк < 0, к = 1,..., п, состояние ж* е Мп : ж* = — А-1Ь является устойчивым положением равновесия системы (4). При £ ^ то имеем: ж^ ^ ж0 + ^+1 (жп+1 — ж0), г = 1,..., п. Это в точности означает, что вне зависимости от начальных условий агенты стремятся расположиться равноудаленно на отрезке с зафиксированными концами ж0 и жп+1.
Легко показать, что для системы (4) справедлива оценка ||ж(£) — ж*|| ^ ел||ж(0) — ж*У, где ж(0) — вектор начального положения агентов. Величина Л характеризует скорость сходимости траекторий системы и равна
(8)
п
Л = max Ak = —2 sin . ..
k k 2(n + 1)
Двумерный случай
Покажем как можно обобщить стратегию равномерного расположения на двумерный случай. Произведем следующую группировку координат для каждого агента. Пусть положение i-го агента в момент времени t ^ 0 определяется вектором £j(t) = [xi(t), yi(t)]T е R2, i = 1,..., n; Co = |xo,yc]T и £ra+i = [xra+i, yn+1]T — координаты начала и конца отрезка соответственно. С учетом введенных обозначений динамика всей системы может быть записана в виде
(9) C = (A <g> /2)C + b,
где /2 — единичная матрица размера 2 х 2; 0 — символ произведения Кронекера; £ = [£Т, £Т,..., £Г] е М2п — сборный вектор координат агентов системы; Ь = [0,5£Т, 0,..., 0,5£П"+1]Т е М2п.
Можно сделать следующие выводы:
— как видно из формул (2)-(3), управление движением агентов происходит путем мгновенного изменения скорости. Такой алгоритм интересен с точки зрения изучения кинематики агентов, но, к примеру, не может быть реализован физически для механических систем. В соответствии со Вторым законом Ньютона, прикладывая силу к объекту, можно менять его ускорение, а не непосредственно скорость;
— в двумерном случае рассматривается по сути движение двух независимых подсистем — для координат ж и у. В реальности координаты могут быть связаны между собой. Такое сцепление координат приводит к изменению математической модели системы и траекторий ее движения;
В работе предлагаются новые стратегии равноудаленного расположения агентов на отрезке, развивающие и обобщающие изложенные выше положения. Прежде чем переходить к изучению новых модификаций, обсудим, как может меняться сложность моделей мультиагентных систем и от чего она зависит.
1.2. СЛОЖНОСТЬ МУЛЬТИАГЕНТНЫХ СИСТЕМ
Как известно, хорошая математическая модель — это модель, которая наиболее полно отражает свойства реального объекта. Обычно улучшение/уточнение модели, появление новых требований к модели приводит к ее усложнению. Поскольку муль-тиагентные системы состоят из подсистем-агентов, связанных некоторой структурой, сложность задач управления ими можно условно определить тремя факторами [25]:
1) сложностью математической модели агента;
2) сложностью сетевой структуры, связывающей агентов;
3) сложностью типов связей между агентами.
Условно можно считать, что каждый из этих факторов характеризует некоторое измерение в пространстве сложности мультиа-гентных систем [25]. Схематическая иллюстрация этого понятия приведена на рис. 2.
Рис. 2. Пространство сложности мультиагентной системы
Математические модели агентов могут быть как простыми линейными, так и сложными нелинейными, содержать запаздывания и нестационарные элементы. Наиболее простыми и, впрочем, наименее реалистичными моделями агентов являются интеграторы: в этом случае управление меняет непосредственно скорость агента. В этом случае решаются задачи кинематики. Самыми простыми динамическими моделями агентов являются двойные интеграторы.
Структура мультиагентной системы показывает, по каким направлениям распространяется информация в системе, т.е. какие выходы/состояния одних агентов доступны для измерения (поступают на входы) другим. Усложнение структуры может происходить по разным причинам, например, при введении дополнительных обратных связей, появлении уровней иерархии и т.д. Структура мультиагентной системы может быть представлена структурной схемой [8], графом [15] и т.п. Наиболее широкое применение теория графов получила для решения задач
Модель
Структура
консенсуса/синхронизации. Важные характеристики алгоритмов консенсуса связаны со спектральными свойствами лапласовских матриц графов, определяющих структуру системы [1, 15, 21].
Связи между агентами могут быть как идеальными (простейший случай), так и неидеальными, например, содержать запаздывание, нелинейности. Разрыв связей может приводить к тому, что некоторые агенты «покидают» систему, меняя структуру системы и уменьшая ее порядок. Если движение системы происходит в некотором m-мерном пространстве (например, на плоскости, m = 2), то изменение каждой из координат может происходить либо независимо — в этом случае мы имеем дело с m никак не связанными друг с другом подсистемами, — либо существуют связи между координатами. В линейном случае такая связь может определяться некоторой матрицей, например, матрицей поворота [19, 20]. В таких случаях говорят, что имеет место сцепление координат (coordinate coupling) [21].
Получение новых алгоритмов управления формациями предполагает как изменение модели агентов, так и изменение типов связей и структуры системы.
1.3. ЦЕЛЬ РАБОТЫ
В соответствии со схемой, представленной на рис. 2, предлагаются следующие обобщения задачи равноудаленного расположения агентов на отрезке:
1) усложнение модели агента: рассматриваются модели агентов в виде двойных интеграторов. Предлагается протокол управления, позволяющий управлять движением агентов посредством изменения ускорения;
2) усложнение структуры системы: предлагается двухуровневый иерархический алгоритм, позволяющий равноудаленно располагать на отрезке группы агентов;
3) усложнение типа связи: рассматриваются алгоритмы, учитывающие сцепление координат. Изучаются новые траектории движения агентов.
2. Равноудаленное расположения на отрезке со сцеплением координат
2.1. МОДЕЛИ АГЕНТОВ ПЕРВОГО ПОРЯДКА
Для начала рассмотрим стратегию равноудаленного расположения на отрезке со сцеплением координат для случая, когда модели агентов имеют вид интеграторов. Сцепление координат можно получить введением в выражение (9) матрицы более общего вида, чем единичная. Рассмотрим ситуацию, когда вектор скорости каждого агента смещен на одинаковый для всех агентов угол а е [—п,п], тогда соответствующая матрица имеет смысл матрицы поворота.
Наличие такой связи может быть обусловлено физическими ограничениями на действия агентов, к примеру необходимостью обходить препятствия мобильными роботами, либо наличием внешних возмущений, отклоняющих вектор скорости агента, и т.п. Для задач циклического преследования алгоритм, использующий матрицу поворота, был впервые предложен в [17, 18]. В рамках задач консенсуса с моделями агентов в виде интеграторов первого и второго порядка похожий подход рассматривался в [19, 20]. Введение матрицы поворота позволяет получить новые траектории системы. Воспользуемся этими идеями для задачи равномерного расположения точек на отрезке.
Итак, управление на входе г-го агента будет определятся следующей формулой:
(10) и = Д(а)(6+1 + 6-1 - , г = 1,...,п,
где Я(а) — матрица поворота, определяемая следующим выражением:
(11) R(a) =
cos a sin a
— sin a cos a
Система уравнений, описывающая динамику всей системы из n агентов, имеет вид
(12) £ = (A <g> R(a))£ + b*,
(13) b* = (/„ ® R(a))b е R2n.
Теорема 1 [4]. Система (12) устойчива тогда и только тогда, когда 0 ^ |а| < |. При этом £к ^ Со + П+х (Сп+і - Со),
і ^ то, к = 1,...,п, т.е. все агенты из любого начального положения стремятся выстроиться на отрезке с фиксированными концами С0 и Сп+1 на равном расстоянии друг от друга.
При п ^ то оценка скорости сходимости (12) определяется
^ 2
д ^ п 2ега°28а. Для значений угла 2 ^ |а| < п цель управления не достигается.
Доказательство теоремы использует свойство спектра произведения Кронекера А 0 Я(а), который равен прямому произведению множеств собственных чисел матриц А и Я(а) [14].
Замечание 2. Результаты, приведенные выше, легко обобщаются на трехмерных случай с вращением агентов относительно оси (0, 0,1)т [4].
Замечание 3. В общем случае в протоколе управления (10) может фигурировать не матрица поворота Я(а), а матрица более общего вида. Введение в уравнение движения матрицы Я(а) имеет определенный физический смысл: тем самым мы отклоняем вектор скорости. Кроме того, для Я(а) известна аналитическая запись спектра, что облегчает анализ задачи и ее обобщение на многомерные случаи. Если для сцепления координат применяется матрица общего вида, то вопросы трактовки ее физического смысла и вычисления спектра остаются открытыми.
2.2. МОДЕЛИ АГЕНТОВ ВТОРОГО ПОРЯДКА
Усложним также и модели агентов, учитывая при этом сцепление координат при помощи матрицы поворота Я(а). Пусть модель агента описывается двойным интегратором
(14) Х = «і, і = 1,..., п.
Выберем закон управления в следующем виде [16]:
(15) « = Д(а) ^ Сі+1 + Сі-1 — Сі — а£^ , і = 1,..., п, где а — некоторый настраиваемый параметр.
В таком случае система уравнений, описывающая динамику n агентов, будет иметь вид
(16) C = (A ® R(a))C — aR(a)C + b*,
где матрицы A и R(a) имеют вид (5) и (11) соответственно, b* =
(/„ <g> R(a)) [0,5СТ, 0,..., 0,5еП+1]Т е R2n
Справедлив следующий критерий устойчивости.
Теорема 2 [4, 16]. Система (16) устойчива тогда и только
тогда, когда
2 2 ПП 2
a cos a> 2 sin —--------- sin a, a> 0.
2(n + 1)
При этом ^ {о + ^+1 (Cn+1 — Со), t ^ to, k = 1,..., n, т.е. все агенты из любого начального положения стремятся выстроиться на отрезке с фиксированными концами Со и Сп+1 на равном расстоянии друг от друга.
Доказательство теоремы основано на использовании критерии устойчивости мультиагентных систем Поляка-Цыпкина и введенного в [8] понятия области устойчивости мультиагентой системы.
Замечание 4. Заметим, что протокол управления (15) отличается от (10) необходимостью знания скорости i-го агента. По сути, слагаемые —a{i, a > 0, имеют смысл отрицательных обратных связей, стабилизирующих систему.
Пример 1. В качестве примера рассмотрим систему из 5 подвижных агентов для двумерного случая. На рис. 3-7 представлены устойчивые траектории движения агентов для разных значений угла поворота a и настраиваемого параметра a (в случае алгоритма второго порядка). Начальные координаты агентов имеют вид: [ ]
x(0) = [0,31, 0,5, —0,83, 0,83, 0,65]Т , y(0) = [0,38, —0,1, —0,54, —0,7, 0,08]Т .
Рис. 3. Начальное положение и траектории агентов. Агенты первого порядка, угол а = 0
х
Рис. 4. Начальное положение и траектории агентов. Агенты первого порядка, угол а = п/4
Проанализируем полученные результаты. Во-первых, сцепление координат меняет траектории движения системы, в нашем случае введение матрицы поворота с а > 0 отклоняет траектории агентов вправо. С ростом угла смещения траектория искривляется сильнее. Во-вторых, скорость сходимости стратегий определяется выбором параметров а и а (в случае агентов второго порядка). Как и следовало ожидать, увеличение угла смещения а приводит к снижению скорости сходимости в обоих случаях. С другой стороны, системы (12) и (16) демонстрируют разную
Рис. 5. Начальное положение и траектории агентов. Агенты второго порядка, а = 0,6, а = 0
Рис. 6. Начальное положение и траектории агентов. Агенты второго порядка, а = 2, а = 0
скорость сходимости при одинаковых углах а в зависимости от выбора параметра а. Например, при а = 0 и а = 0,6 система (16) показывает более высокую скорость сходимости, чем (12), а при а = 2 — более медленную. Уменьшение параметра а приводит к увеличению колебательности переходных процессов в системе
(16).
Рис. 7. Начальное положение и траектории агентов. Агенты второго порядка, а = 2, а = п/6
3. Иерархический протокол управления
В данном разделе предлагается применение концепции иерархичности для алгоритма равноудаленного расположения групп агентов на отрезке. Рассмотрим следующую задачу: имеется пд групп мобильных агентов, по п агентов в каждой (общее число агентов N = п х пд); необходимо получить такой закон управления, чтобы центроиды — центры масс каждой из групп
— стремились равномерно расположиться на заданном отрезке [х0, хПд ], а агенты каждой группы стягивались к ее центроиду.
Для решения поставленной задачи предлагается протокол управления в виде двухуровневой иерархической схемы. На втором (высоком) уровне иерархии рассматривается движение пд групп агентов по закону равноудаленного расположения на отрезке, на первом (низком) — движение агентов внутри каждой из групп по алгоритму циклического преследования. Схема, иллюстрирующая идею алгоритма, представлена на рис. 8.
Идея линейного циклического преследования заключается в том, что скорость г-го агента равна (либо пропорциональна) расстоянию до следующего (г + 1)-го по модулю п агента, а вектор скорости направлен в его сторону. Такой закон был впервые описан в работе Ж.Г. Дарбу [11]. Простейший линейный протокол 278
Рис. 8. Двухуровневый алгоритм равноудаленного расположения агентов на отрезке
циклического преследования для моделей агентов в виде одиночных интеграторов (2) в непрерывном времени для системы из п агентов имеет следующий вид [22]:
(17) Щ = Х*+1 — Х*, Х* Е М, г = 1, . . . , п.
Легко заметить, что при таком алгоритме центроид формации остается неподвижным и равен среднему начальных условий агентов.
Рассмотрим алгоритм циклического преследования в М, в соответствии с которым каждый агент преследует следующего по модулю п агента со смещением [22]:
(18) Х * = (х*+1 + с*) — х*, г =1, ...,п. где с*, г = 1,..., п, — смещения.
Обозначим центроид группы агентов (18) через Х. Тогда справедливо следующее равенство [22]:
Отсюда следует, что выбирая должным образом величины смещений с*, можно обеспечить желаемое движение центроидов и прийти к иерархической схеме.
Введем следующие обозначения для агентов: хр,ч, где р = 1,... ,пд является индексом группы, а # = 1,...,п — индексом агента в группе. Тогда двухуровневая иерархическая схема может быть записана в виде [5]
(19)
*=1
группа 1 <
(20)
Ж 1,1 — Ж1,2 — Ж1,1 + ^1,1
Ж 1,2 — Ж1,3 — Ж1,2 + ^1,2
Ж 1,п — Ж1,1 Ж1,п + ^1,п
группа
Ж пд ,1 — Жпд ,2 Жпд ,1 + “пд ,1
— Жпд ,3 Жпд ,2 + ^пд ,2
Ж пд,2
Ж пд ,п
Жпд ,1 Жпд ,п + “пд ,п .
+
где ^р,д являются смещениями.
Потребуем, чтобы центроиды каждой группы двигались по закону равноудаленного расположения на отрезке:
(21) - Жр+1 + жр-1 _
(21) Жр = —--------------Жр, р = 1, ...,п,
где Жр — центроид р-й группы.
По определению центроид р-й группы описывается выражением [22]
(22)
Жр
п
1 £ Ж.
п
Р,9"
9=1
Возникает вопрос: как выбрать смещения для обеспечения желаемого движения центроидов (21)? Из (19) следует, что динамика центроида р-й гуппы имеет вид
(23)
£ “
9=1
'Р,9‘
В сочетании с (21) получаем /-0/1Л ^ л / Жр+1 + Жр-1
(24) 2^ ^ = п--------2---------ЖР
9=1 '
или
У. “р,9 9=1
п
Еп І V 'п
0=1 Жр+1,9 + 2_^0=1 Жр-1
ЖР,9
9=1
Выберем смещения ^р,д следующим образом:
жр+1,д + жр-1,д йр,д — — жр,9, р — 1 • • • , пд •
2 ~р,у; ^ од.
Последнее выражение означает, что д-й агент в р-й группе стремится расположиться в середине отрезка, соединяющего д-х агентов в (р — 1)-й и (р + 1)-й группах. Динамика всей системы из N агентов (20) с учетом (25) имеет следующий вид (26) Ж — Аж + Ь,
где X = [Ж1,1,Ж1,2, . . . , Ж1,5
> ЖПд ,1 ,
,Ж”
іТ
— сборный век-
тор координат всех агентов, а матрица системы имеет вид
(27)
А =
С + Б 0 /га.
Матрица С является циркулянтной [12]:
(28)
С =
(29)
Б
■-1 1 0 0
0 -1 1 0
1 0 0 -1
М”д хпд имеет вид
-1 0.5 0 0 '
0.5 -1 0.5 0
0 0 0.5 -1
Є М”
е М”э х ”з
и используется для описания движения центроидов групп. Вектор Ь — Ь ® 1, где 1 — [1,1, • • •, 1]Т £ Мп, и Ь € КПд определяется аналогично (6). Матрицы /п, /Пд — единичные матрицы соответствующих размерностей.
Учитывая тот факт, что матрица А € МмхМ является кроне-керовой суммой матриц С и Б: А — С ® Б, можно сформулировать следующую теорему.
Теорема 3. Система (26) устойчива, и множество собственных значений матрицы А является прямой суммой множеств собственных значений матриц С и Б. При этом жр,д ^ хо + п^(жПд+1 — жо), ^ ^ то,р — 1, • • •, пд, т.е. для любого начального положения каждый агент сходится к центроиду своей
д
д
группы, а центроиды групп в свою очередь стремятся расположиться равномерно на отрезке с фиксированными концами ж0 и Xng+1- Скорость сходимости алгоритма при ng ^ то определя-
\ ~ П2 ется Л w — .
Доказательство. Как было показано ранее, собственные числа матрицы D имеют вид Лр = —2 sin2 2^+Х) , Р = l,...,ng, и собственные числа матрицы C также известны и имеют вид Лд = e2njq/n — l, q = l,..., n [12]. Собственные числа матрицы A = Ing ®C+D = C ®D легко определяются из свойств кро-
некеровой суммы. Матрица C имеет единственное нулевое собственное число, остальные расположены в левой полуплоскости; все собственные числа матрицы D отрицательны. Отсюда следует, что матрица A гурвицева, т.е. (26) устойчива. Очевидно, что скорость сходимости для системы (26) при ng ^ то определяется
Замечание 5. Задача была рассмотрена в одномерном пространстве, но может быть легко обобщена на двумерный введением вектора координат агента и выкладками, аналогичными
(9).
Пример 2. Рассмотрим систему на плоскости, состоящую из
3 групп по 3 подвижных агентов в каждой. Начальные координаты агентов имеют вид:
ж(0) = [0,31, 0,5, -0,83, 0,83, 0,65, 0,99, -0,11, 0,92, 0,55]Т ,
у(0) = [0,38, -0,1, -0,54, -0,7, 0,08, -0,84, -0,8, -0,99, 0,63]Т .
На рис. 9 представлены траектории движения агентов.
Из полученных результатов видно, что агенты каждой группы быстро стягиваются к центроиду и, сильно сблизившись, стремятся равномерно выстроиться на отрезке. Отметим также, что скорость сходимости системы (26) зависит от числа групп агентов и не зависит от числа агентов в каждой из групп.
-0.5
2.5
0.5
1.5
-1
■"Г..........^ 11
-2
-1
Рис. 9. Иерархический алгоритм. Начальные условия агентов каждой из трех групп отмечены разными символами
4.. Заключение
В работе предложены и изучены новые обобщения типовой задачи управления формациями — задачи равноудаленного расположения агентов на отрезке, обобщающие и дополняющие существующие результаты. В качестве первого шага предложен протокол управления со сцеплением координат для мультиагент-ной системы с моделями агентов в виде интеграторов. В качестве матрицы, связывающей координаты, рассмотрена матрица поворота. Синтезирован протокол управления для агентов второго порядка, также учитывающий связь между координатами. Для каждой из полученных систем уравнений проведен анализ устойчивости и сделаны выводы по характеру движения агентов и скорости сходимости. В качестве последнего шага рассмотрена двухуровневая иерархическая схема управления, позволяющая располагать на отрезке группы агентов, внутри которых агенты движутся по закону циклического преследования. Таким образом, в соответствии со схемой на рис. 2 по каждому из направлений в «пространстве сложности» было сделано некоторое обобщение/усложнение стратегии равномерного расположения на отрезке.
Литература
1. АГАЕВ Р.П., ЧЕБОТАРЕВ П.Ю. Сходимость и устойчивость в задачах согласования характеристик (Обзор базовых результатов) // Управление большими системами. Специальный выпуск 30.1 «Сетевые модели в управлении», 2010. - С. 470-505.
2. АМЕЛИН К.С., ГРАНИЧИН О.Н. Мультиагентное сетевое управление группой легких БПЛА // Нейрокомпьютеры: разработка, применение. - 2011. - №6. - С. 64-72.
3. ВОЕВОДИН В.В., КУЗНЕЦОВ Ю.А., Матрицы и вычисления. - М.: Наука, 1984. — 320 с.
4. ПАРСЕГОВ С.Э. Обобщенные линейные алгоритмы управления формациями // Стохастическая оптимизация в информатике. - 2011. - Т. 7 (Вып. 1). - С. 186-203.
5. ПАРСЕГОВ С.Э. Некоторые новые иерархические алгоритмы управления формациями // Труды международной научно-практической конференции «Теория активных систем - 2011», Т. 3, Москва, 2011. - С. 238-241.
6. ПАРСЕГОВ С.Э. Равноудаленное расположение на отрезке как задача достижения консенсуса // Управление большими системами: Материалы IX Всероссийской школы-конференции молодых ученых. Том 1. Липецкий государственный технический университет. - Тамбов-Липецк: Изд-во Першина Р.В., 2012. - С. 79-84.
7. ПЕТРИКЕВИЧ Я.И. Линейные алгоритмы управления геометрическим расположением объектов в многоагентной системе // Управление большими системами. Специальный выпуск 30.1 «Сетевые модели в управлении», Москва, 2010. - С. 665-680.
8. ПОЛЯК Б.Т., ЦЫПКИН Я.З. Устойчивость и робастная устойчивость однотипных систем // Автоматика и телемеханика. - 1996. - №11. - С. 91-104.
9. ЧЕБОТАРЕВ П.Ю., АГАЕВ Р.П. Согласование характеристик в многоагентных системах и спектры лапласовских
матриц орграфов // Автоматика и телемеханика. - 2009 -№3 - С. 136-151.
10. ЩЕРБАКОВ П.С. Управление формациями: схема Ван Лоуна и другие алгоритмы // Управление большими системами. Специальный выпуск 30.1 «Сетевые модели в управлении», Москва, 2010. - С. 681-696.
11. DARBOUX J.G. Sur un probleme de geometrie elementaire // Bulletin des Sciences Mathematiques et Astronomiques. -1878. -№2(1). - P. 298-304.
12. GRAY R.M. Toeplitz and Circulant Matrices: A review // Foundations and Trends in Communications and Information Theory. - 2006. - №2(3). - P. 155-239.
13. HARA S., HAYAKAWA T. AND SUGATA H. Stability Analysis of Linear Systems with Generalized Frequency Variables and Its Applications to Formation Control // Proc. IEEE CDC. - 2007. - P. 1459-1466.
14. HORN R.A., JOHNSON C.R. Topics in matrix analysis. -Cambridge. Univ. Press, 1991.
15. OLFATI-SABER R., FAX J.A. AND MURRAY R.M. Consensus and Cooperation in Networked Multi-Agent Systems // Proceedings of the IEEE 2007. - №95(1). - P. 215— 233.
16. PARSEGOV S.E. Allocation of agents on a line: simple algorithm and generalizations // Proc. 14th Baltic olympiad on automatic control, Saint-Petersburg, Russia, Sep. 21-23,2011.-P. 119-125.
17. PAVONE M. AND FRAZZOLI E. Decentralized policies for geometric pattern formation and path coverage // ASME Journal of Dynamic Systems, Measurement, and Control. -2007. - №129(5). - P. 633-643.
18. RAMIREZ J.L., PAVONE M., FRAZZOLI E. AND MILLER D.W. Distributed Control of Spacecraft Formations via Cyclic Pursuit: Theory and Experiments // AIAA Journal of Guidance, Control, and Dynamics. - 2010. - №33(5). -P. 1655-1669.
19. REN W. Collective motion from consensus with Cartesian coordinate coupling - Part I: Single-integrator kinematics // Proc. IEEE CDC. - 2008. - P. 1006-1011.
20. REN W. Collective motion from consensus with Cartesian coordinate coupling - Part II: Double-integrator dynamics // Proc. IEEE CDC. - 2008 - P. 1012-1017.
21. REN W., CAO Y. Distributed Coordination of Multi-agent Networks: Emergent Problems, Models, and Issues. - London: Springer-Verlag, 2011.
22. SMITH S.L., BROUCKE M.E. AND FRANCIS B.A. A Hierarchical Cyclic Pursuit Scheme for Vehicle Networks // Automatica. - 2005. - №41(6). - P. 1045-1053.
23. VEERMAN J.J.P., LAFFERRIERE G., CAUGHMAN J.S., WILLIAMS A. Flocks and Formations // Journal of Statistical Physics. - 2005. - №121(5-6). - P. 901-936.
24. WAGNER I.A., BRUCKSTEIN A.M. Row straightening via local interactions // Circuits, Systems, and Signal Processing. - 1997. - №16(3). - P. 287-305,
25. WIELAND P. From static to dynamic couplings in consensus and synchronization among identical and non-identical systems: PhD Thesis. - Berlin: Logos Verlag, 2010.
COORDINATE COUPLING AND HIERARCHICAL ALGORITHMS IN UNIFORM ALLOCATION OF AGENTS ON A SEGMENT
Sergey Parsegov, Institute of Control Sciences of RAS, Moscow, Phd student ([email protected]).
Abstract: New control strategies of uniform allocation of agents on a segment are proposed. Different modifications of this typical formation control problem include double-integrator models ofagents and coordinate coupling. Moreover, a new two layer hierarchical scheme to provide equidistant allocation of groups of agents on a segment is designed.
Keywords: formation control, coordinate coupling, hierarchical algorithms.
Статья представлена к публикации членом редакционной коллегии П. С. Щербаковым