УДК 519.876 + 519.71
СВЕРХФИНИТНАЯ СТАБИЛИЗАЦИЯ МУЛЬТИАГЕИТНОЙ СИСТЕМЫ
С.Э. Парсегов
Рассмотрена задача равноудаленного выстраивания агентов на отрезке на основе локального взаимодействия. Синтезирован нелинейный закон управления, обеспечивающий стабилизацию мультиагентной системы за заданное фиксированное время. Для предложенного закона управления получена оценка времени установления, не зависящая от начальных условий. Представлена робастная модификация алгоритма с применением техники скользящих режимов. Дано обобщение задачи на случай многомерных агентов. Приведены числовые примеры.
Ключевые слова: мультиагентные системы, управление формациями, нелинейное управление, сверхфинитная устойчивость.
ВВЕДЕНИЕ
Различные задачи управления мультиагентны-ми системами находятся в центре внимания научного сообщества [1]. Особый интерес представляют проблемы управления формациями, в частности, — задачи построения агентами некоторых геометрических образов в пространстве. Примером типовой задачи в этой области может служить задача равноудаленного расположения агентов на некотором фиксированном отрезке посредством локального взаимодействия [2—5]. Закон управления устроен следующим образом: каждый агент в группе стремится расположиться в середине отрезка, соединяющего его двух ближайших по номерам соседей. Известные законы равноудаленного расположения на отрезке обеспечивают только асимптотическую сходимость, а время установления существенно зависит от начального расположения агентов. Практические постановки часто требуют предопределения времени переходных процессов.
Основная цель работы заключается в синтезе нового закона равноудаленного выстраивания на отрезке, обеспечивающего непрерывной мультиа-гентной системе свойство стабилизации за заданное (финитное) время вне зависимости от начального положения агентов. Синтезированный закон управления должен быть робастным по отношению к ограниченным внешним возмущениям, действующим на агентов.
Задачи финитной устойчивости и финитной стабилизации интенсивно исследуются [6—8]. Те-
ория автоматического управления рассматривает множество систем, которые обладают свойством финитности переходных процессов. Финитную стабилизацию системы управления в заданном положении обеспечивают алгоритмы управления на скользящих режимах высоких порядков [8—10]; регуляторы, реализующие такие законы управления, находят широкое применение в задачах управления механическими и электромеханическими системами [11]. Применение идеологии финитного управления в мультиагентных системах рассматривается в работе [7]. Предложены алгоритмы глобальной финитной стабилизации за заданное время вне зависимости от начальных условий [6, 12]. Такое свойство замкнутой системы получило название сверхфинитной устойчивости.
В работе представлены новые робастные алгоритмы управления полиномиального типа, обеспечивающие равноудаленное расположение агентов на отрезке за заданное время независимо от начального состояния мультиагентной системы.
1. ПОСТАНОВКА ЗАДАЧИ
Рассмотрим группу из п пронумерованных мобильных агентов. Пусть положение каждого агента
при ? 1 0 обозначается через хМ) е
I = 1,
а х0, хп + 1 обозначают зафиксированные концы отрезка. Динамическая модель каждого агента описывается интегратором:
XI = и. + йИ, х), I = 1,
(1)
п
п
где и. е [ — подлежащий выбору закон (протокол)
т
управления, х = [хр х2 ... хп] , х) — ограниченное внешнее возмущение Ц(?, х)| < ^шах, и предполагается, что неотрицательное число ^шах известно заранее.
В работе решается задача синтеза управления в виде обратной связи, которое:
— обеспечивает равноудаленное расположение агентов на отрезке за сверхфинитное время для любых начальных условий;
— использует информацию только о расстояниях между агентом и его ближайшими по номерам соседями таким образом, что
и = и/(х/ - 1 - ХР X + 1 - xi), ' = 1 ..., п (2)
— является робастным по отношению к ограниченным внешним возмущениям.
В обобщении протокола на случай многомер-
ных агентов х е
заключается одна из целей
работы.
2. РАВНОУДАЛЕННОЕ РАСПОЛОЖЕНИЕ НА ОТРЕЗКЕ: ЛИНЕЙНЫЙ ПОДХОД
Рассмотрим протокол управления
и = 2 (х - 1 - х) + 1 (Х+1 - xí),
/ = 1, ..., п. (3)
Чтобы показать основную идею протокола, перепишем его в виде
и. =
_ хг -1
+ х
г +1
2
х .
Отсюда следует, что каждый агент в группе стремится расположиться в середине отрезка, соединяющего его двух ближайших по номерам сот
седей. Пусть х = [х1, х2 ... хп] — вектор состояния мультиагентной системы, тогда динамика системы в компактной форме может быть записана в форме [3]:
х = Ах + Ь,
где
А =
-1 0,5 0 0,5 -1 0,5
0 0 ... 0,5 -1
Я п
(4)
(5)
(6)
Ь = [0,5х0 0 ... 0,5хп + е Г.
Матрица А трехдиагональная, ее собственные значения
,2 кп
Хк = -28т к 2(п + 1)
к = 1,
(7)
Поскольку Хк < 0, к = 1, ..., п, состояние х* е
х * = —А 1Ь является устойчивым положением равновесия системы (4), для которой при ? ^ да име-
х0), / = 1, ..., п. Это в
ем: х. ^ х0 + -- (хп + ,
г 0 п + 1 п + 1
точности означает, что вне зависимости от начальных условий агенты стремятся расположиться равноудаленно на отрезке с зафиксированными концами х0 и хп + 1. Легко показать, что оценка
||х(?) — х*|| < вх ||х(0) — х*|| справедлива для системы (4), где х(0) — вектор начального положения агентов, а
X = тах Хк = —28т'
2
(8)
к л 2 (п + 1)
Очевидно, протокол управления (3) удовлетворяет условию (2), но обеспечивает только асимптотическую сходимость, т. е. агенты не достигнут своих желаемых положений на отрезке за конечное время. Далее приводятся некоторые обозначения, важные определения и вспомогательные результаты, необходимые для дальнейшего изложения.
3. СВЕРХФИНИТНАЯ УСТОЙЧИВОСТЬ
Изложим коротко необходимые в дальнейшем теоретические результаты.
Рассмотрим систему вида
г = £(?, г), г(0) = г,,
(9)
где г е [['" и g: [+ х [п ^ [ — нелинейная функция (в общем случае разрывная). В этом случае решения системы управления (9) понимаются в смысле Филиппова. Пусть точка г = 0 является положением равновесия системы (9).
Определение 1. Нулевое положение равновесия системы (9) будем называть глобально финитно устойчивым, если оно глобально асимптотически устойчиво и каждое решение г(?, г0) системы (9) достигает его за конечное время, т. е. Уг0 е [п зТ(г0) 1 0: г(?, г0) = 0 V? 1 Т(г0), где
Т:
и {0} — функция времени установле-
ния [12]. ♦
Свойством финитной устойчивости могут обладать однородные системы с отрицательным показателем. Например, всякое решение системы
сходится к нулевому положению = 3 .
г = —г1/3, г е
равновесия за конечное время Т(г0) :=
•о/ ■ 2
Определение 2. Нулевое положение равновесия системы (9) будем называть сверхфинитно устойчивым, если оно глобально финитно устойчиво и
п
т
п
+
Ё
функция времени установления T(z0) ограничена, т. е. 3Tmax > 0:T(z0) < Tmax Vz0 e Rn [12]. ♦
Например, нулевое положение равновесия системы z = —3 — z3, z e R, является сверхфинитно устойчивым, и z(t, z0) = 0 для Vt l 2,5 и Vz0 e R.
Обозначим через D*f(t) верхнюю правую производную функции f(t), т. е.
Df(t) := lim supf( t + h,)- f(t).
h^ +0 h
Лемма 1. Если существует непрерывная радиаль-
но неограниченная функция V:
и {0}, та-
кая что V(z) = 0 о z = 0 и любое решение z(t) системы (9) удовлетворяет при всех 11 0 неравенству
D*V(z(t)) m -(aVp(z(t)) + eVq(z(t)))k для некоторых а, в, p, q, k > 0: pk < 1, qk > 1, то начало координат является глобально сверхфинитно устойчивым положением равновесия системы (9) и справедлива оценка [12].
T(Z0)
m
1
+
1
a (1 - pk) ßk( qk - 1)
VZ0 e
4. НЕЛИНЕИНЫИ СВЕРХФИНИТНЫИ ПРОТОКОЛ УПРАВЛЕНИЯ
Рассмотрим случай (1(1, х) = 0. Прежде чем синтезировать нелинейный протокол управления, введем функцию ф(5), 5 е 1Е, которая имеет вид
Ф(л) := а^1 + в^1, 0 < р < 1, д > 1, (10) где а, в некоторые положительные константы и
s[k] := sign(s)|s |k
(11)
Рассмотрим следующий нелинейный закон управления для каждого агента:
и1 = ф(2(х,-1 -х,) + 2(х, + 1 -х,)) . (12)
Динамика нелинейной мультиагентной системы, состоящей из п агентов, описывается уравнением
х = ф (Ах + Ь), (13)
где матрица А и вектор Ь имеют вид в (5) и (6) соответственно, а вектор-функция ф (г) := [ф(г1) ф(г2) ...
Ф(гп)]т], г = [*1 г2 ... zn]T е
Теорема. Пусть (.(?, х) = 0 и протокол управления щ имеет вид (12) с параметрами функции ф а > 0, в > 0, 0 < р < 1, д > 1. Тогда все агенты мультиа-гентной системы (1) располагаются равноудаленно
на отрезке за сверхфинитное время, которое глобально (для всех начальных условий) ограничено
+
2 n
q - 1 2
p + 1 q +
a( 1 -p)(21) 2 ß(q- 1)(2|) 2
i, (14)
где X имеет вид (8).
Доказательство. Для удобства анализа введем новую переменную г = Ах + Ь. Очевидно, что
z = Aф (z),
(15)
и начало координат является положением равновесия системы (15). Рассмотрим следующую функцию:
V(z) = 1- zTPz
с матрицей Р вида Р = —А 1. Легко увидеть, что Р является положительно определенной, поскольку все собственные числа А отрицательные (7). Найдем производную V вдоль траекторий системы:
V (г) = 2 (гТРг + гтРг) = 2- (-фт(г)г - гтФ(г)).
Принимая во внимание формулы (11) и г,- = вщп(г,)|г,-|, легко получить
п п
V = -а 2 г,-г[р] - р I ^ =
(16)
i = 1 i = 1 n n
= -a I IZiГ + 1 - ß liz,. i = 1 i = 1
q + 1
Следовательно, можно заключить, что нулевое положение равновесия системы (15) устойчиво. При г = 0 выполняется равенство х = —А-1Ь, что эквивалентно равенству х, = х0 + ——1 (хп + 1 — х0), г = 1, ..., п. Последнее
означает, что предложенный нелинейный протокол решает задачу равноудаленного расположения агентов на отрезке [х0, хп + 1].
Для нахождения оценки времени установления воспользуемся неравенством
^^ < 2 \пах(Р)11 г| 2 для функции Ляпунова (16) и неравенством для норм
111 m ikiir m n
i -1
- 11
для любого z e R" и l > r > 0.
Из неравенства
m
■Iip + 1
следует
I IzjP i = 1
+ 1 WI (p +1)/^ ( 2 V ^(p +1)/2 1 (I zl 2) 1
Vax( P)
+
n
2
n
где А,тах(Р) — максимальное собственное число матрицы Р. Таким же образом получаем
¿к,|"+1 > п(1 - ")/2 01412)(<г+/2 >
г = 1
> И(1 - «)/2 Г 2 V ^ (л +1)/2 Г^шах(РУ
В результате для полной производной функции Ляпунова V получаем оценку
п п
V = -а + 1 - р + 1 <
г = 1
г = 1
где
< - а V(р + 1)/2 - в V(<? + 1/2), (17)
2 ^ О +1)/2 в .= вя(1 - ?)/2 Г 2 ^(<? +1)/2
Р) > в .= вп Г р у
^шах( Р) ^шах( Р)
Таким образом, было показано, что функция Ляпунова (16) удовлетворяет условиям леммы 1, и справедлива оценка на время установления
Ттах . — + -
(18)
а( 1 -Р) в(Я - 1) Принимая во внимание соотношение
\пах(Р) = Чпах(-А-1) = Й-1
и подставляя а и в в оценку (18), получаем выражение (14). ♦
Теорема 1 дает довольно консервативную оценку времени установления, поскольку доказательство основано на результатах леммы 1. Более точная оценка может быть получена с помощью леммы, приведенной далее.
Рассмотрим особый случай: р = 1 — -1- и q =
2ц
= 1 + 2-, - > 1. 2ц
Лемма 2. Если существует непрерывная ради-ально неограниченная функция V : [п ^ [+ и {0}, такая что Р(г) = 0 ^ г = 0 и любое решение г(?) системы (9) удовлетворяет неравенству ^* Р(г(?)) < < —а^(г(?)) — в V*(г(?)) при некоторых а, в > 0,
р = 1 + , # = 1 + , - > 1, то начало координат 2ц 2ц
является глобально сверхфинитно устойчивым положением равновесия системы (9) и справедлива оценка:
Т := -Щ--, ^
тах /—— ' М
л/ав
Доказательство. Рассмотрим вспомогательное дифференциальное уравнение вида
у = -ау1 - 1/(2^) - ву1 + 1/(2^),
у > 0, а, в > 0, Ц > 1, (19)
с начальным условием у0 = у(0) > 0. Очевидно, у = 0 является точкой равновесия системы.
Применяя метод разделения переменных, перепишем уравнение (19) в виде
' = -1ГТТ
йу
- 1/(2 ц) п 1 + 1/(2ц)'
ау + ву
Введем замену переменных н> = у1/(2ц) и обратную ей
йw
у = w2ц. Тогда
, = -2ц Г „^ Ц - 1 , = -2ц Г-
^ 2ц -1 о 2ц +1 ^ „2
а w + в^ а + в^
Следовательно, решение уравнения (19) при ? > 0 имеет вид
аrctg Г/1 у1/(2ц)(0) = -г + Со,
Таз Ча у 0
где
Со = arctg (/ у1/(2ц) > 0) .
0 Таз Ча у
При I = С0 имеем у(() = 0, таким образом любое решение уравнения (19) достигает положения равновесия за финитное время. Более того, поскольку арктангенс является ограниченной функцией, можно получить следующую оценку на максимальное время установления.
Ттах = пц/ ТаР. Отсюда следует оценка на время установления для функции Ляпунова Р(г(г)). ♦
Следствие 1. Если соблюдены условия теоремы и константы р и q системы (13) выбраны следующим образом: р = 1 — 1/- и q = 1 + 1/-, - > 1, то оценка времени установления имеет вид
Т := п-п
Ттах =
1/( 4ц)
„ .♦ (20) 2 |х|тар
Доказательство следствия следует из неравенства (17) и леммы 2.
Формула оценки (20) приводит к важному заключению, а именно: для системы априори может быть задано любое время установления путем надлежащего выбора параметров -, а и в.
5. Р0БАСТНАЯ МОДИФИКАЦИЯ ПРОТОКОЛА УПРАВЛЕНИЯ
Для обеспечения робастности предлагаемого протокола управления по отношению к ограниченным внешним возмущениям рассмотрим следующую простую модификацию функции ф вида
:= а^1 + в*1*1 + ¿тах81Еп(5),
где 0 < р < 1, q > 1, а > 0, в > 0.
а .= а
п
е
Следствие 2. Пусть протокол управления
и, = у(2 (х, -1 - х,) + 2 (х, +1 - х,)) . (21)
Тогда для него справедливы положения теоремы и следствия 1 при наличии ограниченных возмущений в системе (1), т. е. (.(*, х) ф 0.
Доказательство. Аналогично доказательству теоремы введем новую переменную г = Ах + Ь и функцию
вида У(г) = 0,5гт(—А-1)г. Полная производная функции V вдоль траекторий системы (1) имеет вид
п п п п
г = -а I |г/ + 1 - в I |г,|в + 1 - ¿тах 11 г,-1 - I гЛ.
I = 1 I = 1 I = 1 I = 1
Принимая во внимание х)| < ¿тах, получим
пп
V < -а I |г,Г + 1 - в 1|г,|в + 1.
I = 1 I = 1
В остальном доказательство аналогично доказательству теоремы.
6. ОБОБЩЕНИЕ НА МНОГОМЕРНЫЙ СЛУЧАЙ
До настоящего момента рассматривались агенты, динамика каждого из которых описывалась скалярным дифференциальным уравнением. Получим обобщение предлагаемого протокола управления на случай, когда состояние каждого агента является многомерным. В такой постановке динамика мультиагентной системы описывается выражением
х = ф ((А 0 1т)х + Ь),
(22)
где х = [х 1 х2 ... хп ] е К , символ 0 обозна-
л т
чает произведение Кронекера, Ь = [0,5 х0 0 ...
пт и ф — векторная функция
0,5хт+ [ ]т е
ф (г) := [ф(гх> ф^) ... ф^)]7, г = [г! г2 ... г^У е ЛГ",
функция ф определяется выражением (10).
Из свойств произведения Кронекера следует, что матрица А 0 1т положительно определенная, ее собственные значения имеют вид (7) и кратность т. Следовательно, все полученные ранее результаты остаются справедливыми. Более того, поскольку система (22) может рассматриваться как совокупность т независимых подсистем, имеющих одинаковые оценки на время установления, зависимости (14) и (20) справедливы для любого т.
мультиагентную систему (1) с параметрами п = 3, х0 = 0, хп + 1 = 16, ¿,.(0 = 2ап(5*).
Для одинаковых начальных условий х1(0) = -5,
х2(0) = -5 72 , х3(0) = -5, на рис. 1 представлены результаты численного моделирования систем с использованием линейного и разработанного нелинейного протоколов управления для невозмущенного случая = 0); для сверхфинитного закона управления (12) были выбраны следующие значения параметров: а = 1, в = 1, р =1 - 1/ц, # = 1 + 1/ц, ц = 2.
Полученные результаты подтверждают доказанную теорему, демонстрируя сверхфинитное равноудаленное расположение агентов на отрезке в нелинейном случае. Время установления оказалось меньше теоретической оценки
= пцп
1/( 4ц)
п п
1/8
2 |£|л/ар |£|
12,3,
полученной в следствии 1.
Результаты анализа для возмущенного случая представлены на рис. 2.
Видно, что нелинейный протокол (21) обладает ро-бастными свойствами по отношению к внешним возмущениям, ограниченным константой ¿тах = 2. При этом система по-прежнему обладает свойством сверхфинитной устойчивости.
На рис. 3 показана функциональная зависимость реального времени установления от удаленности начального положения агентов от положения равновесия
х* = [4 8 12]
Время установления остается ограниченным даже для больших начальных условий, подтверждая сверхфинитную природу предложенного протокола управления. Важно отметить, что оценка (14) более консервативная, чем оценка (20). Этот факт становится особенно замет-
тах
7. ПРИМЕРЫ
Продемонстрируем эффективность предложенного сверхфинитного протокола управления. Рассмотрим
Рис. 1. Траектории системы без внешних возмущений при линейном (.....) и нелинейном (-) протоколах управления;
линии х0 = 0 и х4 = 16 — границы отрезка
Рис. 2. Траектории системы с внешними возмущениями при линейном (.....) и нелинейном (-) протоколах управления;
линии х0 = 0 и х4 = 16 — границы отрезка
Рис. 3. Время установления Т как функция от удаления начальных положений агентов от положения равновесия; штриховая ли-
ния — оценка T » 12,3 с
ным при большом числе агентов в системе. Так, при п = 50 вычисления показывают, что оценка из следствия 1 в четыре раза меньше, чем оценка (14).
ЗАКЛЮЧЕНИЕ
Поставлена и решена задача синтеза управления мультиагентной системой, обеспечивающего равномерное расположение агентов на известном отрезке за время, не превышающее заданное, вне зависимости от их начального расположения. Свойство сверхфинитной устойчивости, которым
обладают решения синтезированной системы, имеет ряд особенностей. Глобальная ограниченность времени попадания решения системы в положение равновесия более привлекательна, чем свойство финитной устойчивости: для системы можно заранее задавать ограничения на время установления, не привязываясь к начальным условиям. Однако для реализации таких систем необходимо увеличивать энергетические затраты на управление по мере удаления начального состояния системы от положения равновесия.
Идея сверхфинитной стабилизации выглядит многообещающей для решения многих задач, связанных с мультиагентными системами и управлением формациями. Прежде всего это касается обобщения разработанной техники на задачи консенсуса.
ЛИТЕРАТУРА
1. Ren W., Cao Y. Distributed Coordination of Multi-agent Networks: Emergent Problems, Models, and Issues. — London: Springer-Verlag, 2011.
2. Wagner I.A., Bruckstein A.M. Row straightening via local interactions // Circuits, Systems, and Signal Processing. — 1997. — Vol. 6, N 3. — P. 287—305.
3. Петрикевич Я.И. Линейные алгоритмы управления геометрическим расположением объектов в многоагентной системе // Управление большими системами. — 2010. — Вып. 30.1. — С. 665—680.
4. Щербаков П. С. Управление формациями: схема Ван Лоуна и другие алгоритмы // Управление большими системами. —
2010. — Вып. 30.1. — С. 681—696.
5. Parsegov S.E. Allocation of agents on a line: simple algorithm and generalizations // Proc. 14th BOAC, Saint-Petersburg, Russia, Sep. 21—23. — 2011. — P. 119—125.
6. Cruz-Zavala E, Moreno J.A., Fridman L.M. Uniform robust exact differentiator // IEEE Trans. on Automatic Control. —
2011. — Vol. 56, iss. 11. — P. 2727—2733.
7. Hui Q., Haddad W M., Bhat S.P. Finite-time semistability, Filippov systems, and consensus protocols for nonlinear dynamical networks with switching topologies // Nonlinear Analysis: Hybrid Systems. — 2010. — Vol. 4, iss. 3. — P. 557—573.
8. Polyakov A., Poznyak A. Lyapunov function design for finite-time convergence analysis: «twisting» controller for second order sliding mode realization // Automatica. — 2009. — Vol. 45, N 2. P. 444—448.
9. Utkin V.I., Guldner J., Shi J. Sliding Mode Control in Electro-Mechanical Systems. CRC Press, 2009.
10. Емельянов С.В., Коровин С.К. Новые типы обратной связи. Управление при неопределенности. — М.: Наука, 1997. — 352 с.
11. Черноусько Ф.Л., Ананьевский И.М., Решмин С.А. Методы управления нелинейными механическими системами. — М.: Физматлит, 2006. — 328 с.
12. Polyakov A. Nonlinear feedback design for fixed-time stabilization of linear control systems // IEEE Trans. on Automatic Control. — 2012. — Vol. 57, iss. 8. — Р. 2106—2110.
Статья представлена к публикации членом редколлегии
Ф.Т. Алескеровым.
Парсегов Сергей Эрнестович — ст. инженер,
Институт проблем управления им. В.А. Трапезникова РАН,
г. Москва, Ш (495) 334-90-49, И [email protected].