Научная статья на тему 'Субоптимальное управление нелинейными мультиагентными системами'

Субоптимальное управление нелинейными мультиагентными системами Текст научной статьи по специальности «Математика»

CC BY
196
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИАГЕНТНАЯ СИСТЕМА / MULTI-AGENT SYSTEM / РОБАСТНОЕ УПРАВЛЕНИЕ / ROBUST CONTROL / ДЕЦЕНТРАЛИЗОВАННОЕ УПРАВЛЕНИЕ / DECENTRALIZED CONTROL / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / OPTIMAL CONTROL / КОМПЕНСАЦИЯ ВОЗМУЩЕНИЙ / DISTURBANCES COMPENSATION

Аннотация научной статьи по математике, автор научной работы — Фуртат Игорь Борисович

Рассмотрена проблема робастного субоптимального управления мультиагентными системами, модель которых представлена дифференциальными уравнениями с липшицевой нелинейностью. При решении предполагается, что доступны измерению только скалярные выходы подсистем. Получен алгоритм децентрализованного управления, обеспечивающий компенсацию неопределенностей и субминимизацию интегрального критерия качества с заданной точностью.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Suboptimal control of nonlinear multi-agent systems

The article deals with the issue of robust suboptimal control for multi-agent systems which model is represented by differential equations with Lipschitz nonlinearity. It is assumed that only scalar subsystem outputs are available to measurement. An algorithm of decentralized control is obtained providing uncertainties compensation and subminimization of performance index with given accuracy.

Текст научной работы на тему «Субоптимальное управление нелинейными мультиагентными системами»

УДК 519.7

СУБОПТИМАЛЬНОЕ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ МУЛЬТИАГЕНТНЫМИ СИСТЕМАМИ 2 И.Б. Фуртат

Рассмотрена проблема робастного субоптимального управления мультиагентными системами, модель которых представлена дифференциальными уравнениями с липшицевой нелинейностью. При решении предполагается, что доступны измерению только скалярные выходы подсистем. Получен алгоритм децентрализованного управления, обеспечивающий компенсацию неопределенностей и субминимизацию интегрального критерия качества с заданной точностью.

Ключевые слова: мультиагентная система, робастное управление, децентрализованное управление, оптимальное управление, компенсация возмущений.

Введение

Задача компенсации неконтролируемых возмущений была и остается актуальной проблемой в теории управления. В настоящее время решение этой задачи имеет два основных направления. Первый подход основан на построении инвариантных систем управления, т.е. когда система управления малочувствительна или не реагирует на неконтролируемые возмущения. Такой подход получил широкое применение, например, в Я^-оптимизации [1] или в методе вложения систем [2]. Второй подход основан на динамической компенсации неизвестных воздействий. Суть данного подхода заключается в оценке возмущений и затем выборе структуры и параметров управляющего устройства с целью исключения влияния неопределенностей на объект управления. Так, в [3, 4] внешние возмущения представлены в виде системы дифференциальных уравнений, которые с помощью методов адаптивного и робастного управления компенсируются. В [5], на базе подхода [6], предложена схема робастного субоптимального управления с минимизаций интегрального критерия качества.

В настоящей работе рассматривается обобщение схемы [5] на случай робастного субоптимального децентрализованного управления нелинейными мультиагентными системами по выходу. Для выделения неконтролируемых возмущений и обеспечения субоптимального управления параллельно объекту предлагается ввести вспомогательный контур определенной структуры. Далее возмущения оцениваются и компенсируются с заданной точностью за конечное время. Приводятся результаты моделирования, подтверждающие аналитические выводы и расчеты.

Постановка задачи

Пусть управляемая и наблюдаемая мультиагентная система с перекрестными связями по состоянию задана дифференциальным уравнением

х, (*) = А,. (*)х, (*) + Б,. (*)и, (*) + (у,, (*), *) К,. (*) + £ Б,, (*)х. (*) + Б,. (*)(*),

1=1.« 1 (1)

у,. (*) = Ь,х, (*), х, (0) = х0,., ,= 1Д, где х,. (*) е Я" - вектор состояния ,-й подсистемы; и.. (*), ^ (*) и у1 (*) - скалярные вход, внешнее неизвестное ограниченное воздействие и выход соответственно; А 1 (*) е И"'х" , N 1 (*) е И"', Б, (*) е И"'х" ,

(У,.(?), *) е И"х" , Б,.(*) е И" , Б,.(?) е И" , ^ = [1, 0, ..., 0]; хш - известные начальные условия; к - количество подсистем. Необходимо синтезировать непрерывный закон управления, обеспечивающий перевод объекта (1) из начального положения у, (0) в конечное у, (*/,) за заданное время при этом минимизируя критерий качества

•, = К2С) + ^>02,.(*)), (2)

0

с малой погрешностью [5], > 0 и Г > 0 - весовые коэффициенты, функция и0,(*) определяет оптимальный закон управления [2].

Предположение 1. Элементы матриц А,(*), Б ,(*), N ,(*), Б ,(*) и Б ,(*) - неизвестные ограниченные функции. Известно множество Н возможных значений этих функций.

Предположение 2. Выполнены условия: А,. (*) = Ам + Б№с[ (*), Б,. (*) = Бм + Бмт,. (*),

Б ,. (*) = БМк1 (*), N.. (*) = Б№ю, (*), Б, (*) = Б№6, (*), где А№ е И"х" , Б№ е И" - известные матрицы, при-

2 Работа выполнена при поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы», государственный контракт № 11.519.11.4007.

чем собственные числа Ам не лежат в правой полуплоскости комплексной плоскости, с, (О е Я",

т, Ц) е Я, к,, У) е Я, ю, ^) е Я и 0,.. (^ е Я" - неизвестные функции.

Предположение 3. Неизвестные элементы матрицы Т. (у, ((), () удовлетворяют глобальному условию Липшица по у, ((), ограничены по t и являются гладкими функциями.

Предположение 4. Объект (1) - минимально фазовый, последние коэффициенты В ¿(0 и Вм - положительные функции и число.

Предположение 5. В системе управления доступны измерению только у, (() и и, ф.

Метод решения

С учетом предположения 2 преобразуем уравнение объекта (1) к виду

х, (0 = А № х,, ^) + В №и1 Ц) + В № Ф, ^), у (О = Ь, х,, ({), х,, (0) = х0,,, (3)

где ф, ^) = < «х, Ц) + т, (^щ Ц) + Т, (у, (0, t)ю, (О + £ 0; (t)x.. (О + к ^)X ^).

;=и *;

Рассмотрим номинальный объект (когда в (3) ф, (^ = 0):

х, (^ = А№х, ^) + В№и1 Ц), у (0 = Ь, х, (^, х, (0) = х0,. (4)

Для номинального объекта (4) критерий качества (2) и оптимальный закон управления и0, определятся в виде [7]

•Л = | ( а)0,х,(t) + Ц))Ж, и0,Ц) = Г"'В^222,,(t^)х,(t) + йш0), (5)

0

где = {1,0,..., 0}, (0 = пЪТн (2 2и (0 + 2 22,,■ (ф^ (?)2П1 (?)) х, ^.), 2,({) = [хТ ^), wT (О ]Т ,

211,, (Т) г12,,(Т)

Z, (т,) = т =

2 2и(Т, ) 2 22,,(Т )

w ^) = (3,х,V) - Амw ¡(t), 2,(t) = 0,2,а), Б, =

О,, -Ам

2, (0 = ^ (Т,)2, (^ ), Т, = t - ^ .

Добавим и вычтем в (3) и0¡(() из (5) и преобразуем уравнение (3) к виду

х, Ц) = А0, ^)х, Ц) + В№Й0, (t) + В№и 1. ^) + В№Ф„ ^), у, ^) = Ь,х, ^), х, (0) = х0,, (6)

где А0, ^) = А№ + Г- ВюВ^222,, (t)2-',, ^), ) = ф(?) - «).

Для выделения этих неопределенностей введем вспомогательный контур [5, 6] х а, ^) = А0,а )ха, ^) + В N,Uo,(t) + р, В №и, а), уа, (t) = Ь,ха, ^), ха, (0) = х0,, (7)

где р i > 0. Составим функцию а i(() = х,(() - ха,((), вычитая из (6) уравнение (7):

ст, ^) = А 0^ )а, а) + В № ф, а), С, ^) = Ь,а, ^), а, (0) = 0. (8)

Здесь а, ^) е Я, ф, ^) = (1 - р, )и, ^) + (^ . Преобразуем (8) к форме вход-выход:

00 (Р, t)С, ^) = Ям (Р)ф, ^), (9)

где 00, (р, (), Ям (р) - линейные дифференциальные операторы, полученные при переходе от (8) к (9) при фиксированном параметре t.

Для компенсации возмущений в (1) функцию иi(t) зададим в виде _ и1 ^) = -р-'Км)(р)00и(Р, С^), (10)

где С,^) - оценка С i(t). Для реализации алгоритма (10) рассмотрим наблюдатель [8]

(0 = ад« + Б0,((«-С,(0), с,« = (11)

"0 I п-1 0 0

Б0, =-[^1(ц-1, й?2,ц~2,..., ёп] , Л,, , выбираются из условия гурвицевости матрицы

= О0, -Б,Ь,, Б, = [Л„, Л2п ..., Лп,] , ц > 0 - малое число.

Введем вектор отклонений (^ = Г-1 (4,(0-0,(^), где Г, = diag{-1, ц"-2,..., ц, 1}, 0, ^) = [с, ^ \ С, (t),..., С () ] . Продифференцировав ^) по времени с учетом уравнения (11), получим: т], ^) = ц-1ОД. ^) + Ь,С(" +1' ^), А, ^) = ц"-1Ьд. (t). Преобразуем предпоследние уравнения к виду

11, V) = ц-1О,т, (0 + Ь,С,«), А (I) = ц"-1Ьт, (I). (12)

Здесь 4 , ^) е Я" , О0, =

I п-1 - единичная матрица порядка п, - 1,

Здесь -/ (*) = л/ (*) -"%-1)(*), 1 = 2," , -лк (*) и -/ (*) - /-е компоненты векторов -(О и (*), л1 (?) = л1 (*), Ь = [м-2-" ,0,..., 0] . Очевидно, что последние два уравнения эквивалентны относительно переменных (*) = (*). Принимая во внимание (11) и (12), преобразуем уравнение (10) к виду

х, (*) = А0, (*)х, (*) + Б№ц,, (*) + -1Ь,.gf А,.(*), у,. (*) = Ь,х, (*), (13)

л1(*), л ;(*),..., (-;(*)))

где A(t) =

g, - вектор, составленный из коэффициентов оператора Q0, (p, t) и

записанных в обратном порядке.

Утверждение. Пусть выполнены условия предположений. Тогда существует числа р, > 0 и ц0 > 0 такие, что при ц < ц0 система управления (7), (10), (11) обеспечивает переход объекта (1) из начального положения у, (0) в конечное у, (/) с субминимизацией критерия качества (2).

Пример

Рассмотрим мультиагентную систему, математическая модель которой имеет вид

xi(t) =

Озх1

I3

х,. (t) +

O

Si,

3x4

Озх1 n0¡

u ., (t) +

Озх4

Озх1 d 0Í

f (t) +

x, (t),

(14)

у,. (*) = [1 0 0 0] (*), ,, ] = 1,2, ],

где Ох - матрица размерности ,х] с нулевыми элементами. Класс неопределенности Н задан неравенствами: \ап\ < 10, / = 0, 1, 2, 3, , = 1, 2, 1 < г0, < 4, Щ < 10, /(*)\ < 10, ^ < 10, , = 1, 2. Предполагаются известными начальные условия х, (0) = [1, 1, 1, 1]т.

Цель управления - квазиминимизация интегрального критерия качества (2) и ограниченность всех сигналов в системе управления. Зададим следующие параметры в (2): = 1, Г = 1, / = 10 с, у, (0) = 1 и у, (10) = 2.

Сформируем уравнение номинального объекта управления (4) в виде

(15)

Го3, i, 1 Го3.1

x, (t) = 3x1 ¿ -1 -4 -6 -4 x, (t) + 3x1 1

,(*), ум (*) = [1,0,0,0] х,. (*).

Для (15) перепишем критерий (2) и сформируем оптимальное управление в виде

10

• , = | ((*{1,0, 0, 0} х(*) + и02,. (*)) Ж, 0

и0, (*) = [0, 0, 0, 1] [z22,,. (?. (*)х, (*) + (21,у (*) + z22,,. (¿К21, (*К, (*)) х,. (10)] .

Введем вспомогательный контур (7), где х, (10) = [2, 2, 2, 2]т и р, = 0,04. Тогда

1 0 0 0Ъ , ,

(z 21,,. (*) + z 22,,. СКу (*)) х,. (10) +

x,. (t) = A,,, (t) x, (t) +

Оз

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(16)

+0,04 [0, 0, 0,1f ut (t), y,. (t) = [1, 0, 0, 0]] (t), x, (0) = [1,1,1,1]T . Пусть в (11) D¡ = [20, 150, 500, 625]T, ц = 0,01. В результате наблюдатель определится в виде 11, (t) = -i^ (t) - 2 • 103 ( (t) - С, (t)), 12, (t) = Чз, (t) -1,5 • 106 (^ (t) - С, (t)), 13, (t) = -Í4, (t) - 5 • 108 (((t) - С, (t)), i4, (t) = -6,25 • 1010 ((t) - С (t)), (0) = 0. Используя наблюдатель (16), сигнал компенсации (10) можно записать в виде u, (t) = -25a04,¿ (t)i,, (t), где a04,, (t) = ([-1 - 4 - 6 - 4] - z^ (t)), a04,, (t) и z^ (t) - четвертые строки

матриц A0,(t) и z 22, (t )z-2, (t) соответственно.

На рисунке, а, приведены результаты моделирования по выходам первой подсистемы (14) и номинального объекта (15), на рисунке, б, - результаты моделирования по выходам второй подсистемы (14) и номинального объекта (15) при следующих данных:

- в первой подсистеме: a31 = 8 + sin t, a21 =-6 + cos t, an = 9 + sin2t, a01 = 8 + 2cos3t, r01 = 6, d01 = 2 + 2sint, s31 = 1 + siny1 + sint, s21 = cosyx, eu = 1 + ln(1 + \yx|), s01 = sin2y1; s31 = 5 + sint, s21 = 7 , = 3 , s01 = 15 , f1(t) = 2 + sin0,8t;

n01 = 1 + sin t,

во второй подсистеме:

a32 = 2 + sin t,

a22 = 6 - cos t.

a12 = -8 + 2sin t,

a02 = 5 - cos 3t, r02 = 5 ,

d02 = 5 + 2sin2t, n02 = -1 + 3sin t,

= 2 + sin 2 y2

s22 = cos y2, s12 = 2 + ln (3 + | y2\ + sin t), s02 = cos 2 y2

S32 =15

s22 = 9 + sin t, s12 = 9 - cos t,

s02 = 10 + cos2t, f2(t) = 1 + cos1,2t.

3,5 3

2,5 2

1,5 1

0,5

У1 (t)

/

yNyt) \

i ; i

3,5 3

2,5 2

1,5 1

0,5

........*.........

MO \ iii

0

2

4

6

8

t, c

0

2

4

6

8

t, c

б

Рисунок. Результаты моделирования: по у1(?) и ум(?) (а); по у2(?) и ум(?) (б)

Заключение

В работе рассмотрена схема децентрализованного робастного субоптимального управления нелинейными мультиагентными системами. При решении предполагалось, что измерению доступны только скалярные выходы локальных подсистем и запрещен обмен информации между ними. Для выделения неизвестных возмущений и обеспечения субоптимального управления предлагалось ввести вспомогательный контур параллельно объекту. Далее выделенные возмущения оценивались и компенсировались с заданной точностью за конечное время. Результаты аналитических выводов были подтверждены численным моделированием.

Приложение

Доказательство утверждения. Рассмотрим новую переменную е, (?) е И"', равную разности фазовых переменных (13) и (4), причем на вход номинального объекта (4) подано оптимальное управление (5). В результате получим

е,(?) = Аме ,(?) + Р-У'-1Ъ,§,Д,(0, е,(0) = 0 .

Преобразуем последнее уравнение и уравнение (12) к виду

s, (?) = AMs, (t) + ц" -1b,gД (t), ц,л , (t) = G л, (?) + ^ЬС, (t),

(П.1)

где ц = ц2 = Ц. Воспользуемся первой леммой [9], согласно которой рассмотрим систему (П.1) при ц2 = 0. Так как собственные числа матрицы ANi не лежат в правой полуплоскости комплексной плоскости (предположение 2) и G, гурвицева, то решение (П.1) при ц2 = 0 глобально устойчиво. Значит, согласно

[9], Л-(4 s ,'(t), Д(0 и С,-(t) ограничены. Доказательство ограниченности остальных функций аналогично

[5]. В соответствии с леммой [9] система (П.1) диссипативна. Значит, sup С,(t) <k1, sup|Д,.(t)| <k2,

t t

k < да, k2 < да. Однако диссипативность (П.1) не гарантирует ее асимптотическую устойчивость как сингулярно-возмущенной системы. Покажем, что при ц2 > 0 обеспечивается малость величины |s , (t)|. Выберем функцию Ляпунова в виде

V = sT (t)Ps, (t) +лТ (t)н,л, (t),

(П.2)

где Г, = РТ > 0, Н, = НТ > 0, и вычислим полную производную от нее вдоль траекторий (П.1) при

Ц1 = Ц2 = Ц0:

V = Ч (? ^е, (?)+2ц" Ч (? )рь<8 а (?) - ц о1лТ (? )О 2, л, (?)+2^0 лТ (?) н,ь,4 (?). (П.3)

Здесь А^Р + РАю = -01,, ОТН, + Н,О, = О2, , = ОТ > 0 , 02, = ОТ, > 0 . Оценим в (П.3) второе и четвертое слагаемые:

2ц"-1еТ (?)Р,%,Д, (?) < 2ц" -1еТ (?)Р,Ь,8, (Р,Ь^, )* е, (?) + 2ц"-1£2;

2ц0лТ(?)н,ЬД(?) < 2цлТ(?)НЬЬТНл,(?) + 2ц0

Воспользовавшись оценками, перепишем (П.3): V <-еТ (?)О3,е,(?) -лТ (?)О4,л,(?) + л,, где

Оз, = 01, -2ц0-1Р,Ь^, , О4, = О2,-ц2Н,Ь,ЬТН,, я,= 2ц0 (^ +ц"-2^2). Очевидно, что всегда

а

существует число ц0 > 0, обеспечивающее Q3i > 0 и Q4i > 0. Оценим производную функции Ляпунова в виде V <-%,V + ni, где та.. = min J (Qj' ), (Q4i) I. Решив последнее неравенство, получим

max(P ) ^max(H' ) J

V < e-m''V(0) + та-1 (l - e-m'' )я,. Тогда в силу структуры (П.2) |е, (')|2 <Xmm(P,.) (e-m''V(0) + (l - e-m'' )tn-4)

для ' e [0, f], причем значение правой части последнего неравенства зависит от величины ц0. Очевидно, что уменьшением числа ц0 можно уменьшить значение |Б'(')|, а значит, уменьшить погрешность, возникающую при субминимизации критерия (2), что подтверждено результатами моделирования.

Литература

1. Методы классической и современной теории автоматического управления. Теория оптимизации автоматического управления / Под ред. К. А. Пупкова и Н.Д. Егупова. - М.: Издательство МГТУ им. Н.Э. Баумана. - 2004. - Т. 4. - 744 с.

2. Буков В.Н. Вложение систем. Аналитический подход к анализу и синтезу матричных систем. - Калуга: Издательство научной литературы Н.Ф. Бочкаревой, 2006. - 720 с.

3. Никифоров В.О. Адаптивное и робастное управление с компенсацией возмущений. - СПб: Наука, 2003. - 282 с.

4. Бобцов А. А. Алгоритм робастного управления неопределенным объектом без измерения производных регулируемой переменной // Автоматика и телемеханика. - 2003. - № 8. - С. 82-96.

5. Фуртат И.Б. Робастное субоптимальное управление линейными нестационарными объектами по выходу // Мехатроника, автоматизация, управление. - 2009. - № 7. - С. 7-12.

6. Цыкунов А.М. Алгоритмы робастного управления с компенсацией ограниченных возмущений // Автоматика и телемеханика. - 2007. - № 7. - С. 103-115.

7. Теория автоматического управления. Ч. 2. Теория нелинейных и специальных систем автоматического управления / Под ред. А.А. Воронова. - М.: Высшая школа, 1986. - 504 с.

8. Atassi A.N., Khalil H.K. A separation principle for the stabilization of class of nonlinear systems // IEEE Trans. Automat. Control. - 1999. - V. 44. - № 9. - P. 1672-1687.

9. Брусин В.А. Об одном классе сингулярно возмущенных адаптивных систем. 1 // Автоматика и телемеханика. - 1995. - № 4. - С. 119-127.

Фуртат Игорь Борисович - Санкт-Петербургский национальный исследовательский университет ин-

формационных технологий, механики и оптики, кандидат технических наук, доцент, cainenash@mail.ru

УДК 519.7

ИССЛЕДОВАНИЕ УСТОЙЧИВОСТИ ДИНАМИЧЕСКИХ СИСТЕМ С ИСПОЛЬЗОВАНИЕМ СВОЙСТВ ПОТОКА ВЕКТОРА ФАЗОВОЙ! СКОРОСТИ ЧЕРЕЗ ЗАМКНУТУЮ ВЫПУКЛУЮ ПОВЕРХНОСТЬ3

И.Б. Фуртат

Проведено исследование устойчивости автономных динамических систем с использованием потока вектора фазовой скорости через замкнутую выпуклую поверхность. Получены условия на знак потока вектора фазовой скорости, обеспечивающие устойчивость динамических систем.

Ключевые слова: поток векторного поля, устойчивость, вторая теорема Ляпунова.

Введение

Одним из важных этапов при исследовании дифференциальных уравнений или системы дифференциальных уравнений является выяснение характера поведения траекторий их решений. При специальных структурах дифференциальных уравнений можно найти их точное решение [1, 2]. Однако чаще встречаются уравнения, точное решение которых получить достаточно сложно [3, 4]. Тогда для выяснения характера поведения можно использовать следующие методы: метод функций Ляпунова [1-4], метод функций Четаева [1], устойчивость по Лагранжу [1], метод абсолютной устойчивости [5], дивергентные условия устойчивости [6-8] и т.д. Наиболее распространенными из используемых методов являются методы функций Ляпунова и абсолютной устойчивости. Для линейных систем использование данных методов довольно хорошо изучено в [3-5], но для нелинейных систем это зачастую трудная задача.

3 Работа выполнена при финансовой поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы», государственный контракт № 11.519.11.4007.

i Надоели баннеры? Вы всегда можете отключить рекламу.