Научная статья на тему 'РОБАСТНОЕ СЕТЕВОЕ УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ СИСТЕМОЙ ПЕРЕМЕННОЙ КОНФИГУРАЦИИ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ'

РОБАСТНОЕ СЕТЕВОЕ УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ СИСТЕМОЙ ПЕРЕМЕННОЙ КОНФИГУРАЦИИ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ Текст научной статьи по специальности «Математика»

CC BY
23
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЕВОЕ УПРАВЛЕНИЕ / УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ / НЕОПРЕДЕЛЕННЫЕ ПАРАМЕТРЫ / РОБАСТНОЕ УПРАВЛЕНИЕ / СТОХАСТИЧЕСКИЕ СИСТЕМЫ / СИСТЕМЫ С ПЕРЕКЛЮЧЕНИЯМИ / ВЕКТОРНАЯ ФУНКЦИЯ ЛЯПУНОВА

Аннотация научной статьи по математике, автор научной работы — Копосов Антон Сергеевич

Рассматривается задача синтеза управления с итеративным обучением системой, состоящей из одинаковых подсистем (агентов), связанных информационной сетью переменной конфигурации. Агенты представляют собой дискретные линейные динамические объекты с аффинными моделями неопределенностей, работающие в повторяющемся режиме. Каждый объект находится под действием случайных возмущений, а выходные переменные объектов измеряются с шумами. Конфигурации информационной сети определяют группу функционирующих агентов и характер обмена информацией между ними. Смена конфигурации происходит в соответствии с определенными внешними правилами. Синтез управления основан на дивергентном методе векторной функции Ляпунова. Приводятся результаты моделирования полученного закона управления группой манипуляторов с гибким звеном.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ROBUST NETWORKED ITERATIVE LEARNING CONTROL OF A VARIABLE CONFIGURATIONSYSTEM UNDER RANDOM DISTURBANCES

The paper considers the iterative learning control design problem of a system, consisting of identical subsystems (agents) under changing the information network configuration. The agents represent discrete linear dynamic plants with affine model of uncertainty operating in a repetitive mode. Each plant is under the influence of random disturbances, and the output variables of the plants are measured in the presence of noises. The configurations of the information network determine the group of functioning agents and the type of information exchange between agents. The configuration change takes place in accordance with certain external rules. The control design is based on the divergent method of the vector Lyapunov function. The results of modeling the obtained control law for a group of manipulators with flexible single-links are presented.

Текст научной работы на тему «РОБАСТНОЕ СЕТЕВОЕ УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ СИСТЕМОЙ ПЕРЕМЕННОЙ КОНФИГУРАЦИИ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ»

РОБАСТНОЕ СЕТЕВОЕ УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ СИСТЕМОЙ ПЕРЕМЕННОЙ КОНФИГУРАЦИИ ПРИ СЛУЧАЙНЫХ ВОЗМУЩЕНИЯХ1

Копосов А. С.2

(Арзамасский политехнический институт (филиал) Нижегородского государственного технического университета им. Р.Е. Алексеева, Арзамас)

Рассматривается задача синтеза управления с итеративным обучением системой, состоящей из одинаковых подсистем (агентов), связанных информационной сетью переменной конфигурации. Агенты представляют собой дискретные линейные динамические объекты с аффинными моделями неопределенностей, работающие в повторяющемся режиме. Каждый объект находится под действием случайных возмущений, а выходные переменные объектов измеряются с шумами. Конфигурации информационной сети определяют группу функционирующих агентов и характер обмена информацией между ними. Смена конфигурации происходит в соответствии с определенными внешними правилами. Синтез управления основан на дивергентном методе векторной функции Ляпунова. Приводятся результаты моделирования полученного закона управления группой манипуляторов с гибким звеном.

Ключевые слова: сетевое управление, управление с итеративным обучением, неопределенные параметры, робастное управление, стохастические системы, системы с переключениями, векторная функция Ляпунова.

1. Введение

Управление с итеративным обучением (УИО) можно классифицировать как одно из направлений интеллектуального управления. Данный метод применяется к системам, функционирующим в повторяющемся режиме, и основан на идее о том, что при многократном выполнении системой одной и той же операции точность ее работы может быть повышена за счет информации,

1 Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований, проект № 19-08-00528 a.

2 Антон Сергеевич Копосов, аспирант (koposov96@yandex.ru).

полученной на предыдущих повторениях. Такой подход позволяет достичь требуемой точности при наличии параметрических неопределенностей, внешних возмущений и шумов измерений, которые могут проявляться во время фактической работы системы. УИО находит применение во многих робототехнических системах, и их активное развитие обуславливает повышенный интерес исследователей к данному методу.

В частности, УИО может эффективно применяться к сетевым системам, состоящим из одинаковых подсистем (агентов), связанных информационной сетью. В [1] рассматривалась задача сетевого УИО при наличии внешних возмущений и шумов измерений. В данной работе, в отличие от [1], дополнительно учитываются неопределенности моделей агентов и возможность изменения структуры сети, т.е. подключение и отключение агентов. Для уменьшения ошибки при изменении структуры сети предложено специальное правило переключения алгоритма УИО.

2. Синтез сетевого управления с итеративным обучением

2.1. ПОСТАНОВКА ЗАДАЧИ

Рассмотрим систему из N линейных систем (агентов) с неопределенными параметрами, функционирующих в повторяющемся режиме и имеющих возможность подключаться к сети и отключаться от нее. Конфигурация т сетевой системы определяет группу из Мт агентов, функционирующих в данной конфигурации. Динамика агента ¿, подключенного к сети в конфигурации т на повторении к, описывается следующей дискретной моделью в пространстве состояний:

(1) х{(к,р + 1) = А(81(р))х1(к,р) + В(81(р))и1(к,р) +

+Сш1(к,р),

(2) У1(к,р) = Сх1(к,р),

(3) Уу,1 (.К р) = у( (к, р) + VI (к, р),

I Е 0т, 0т = {н, 12.....1Мт}, к>0, 0<р<Т-1,

где (к, р) Е ЕПх - вектор состояния, щ (к, р) Е - вектор управления, ш^(к,р) Е - вектор шумов объекта,

У1 (к, р) 6 Жпу - вектор выходных переменных (профиль повторения), Уу^(к, р) 6 Жпу - вектор измеренных выходных переменных, VI (к, р) 6 - вектор шумов измерений, 0т - набор номеров агентов, доступных в конфигурации т, Т < ю - продолжительность повторения. Граничные условия х^(к, 0) и щ(0,р) будем считать известными.

Модель неопределенностей задается в виде

(4) А(51(р)) = А + Аа(Ь(р)) = А + Лп=18ип(р)Ап,

(5) В(51(р)) = В + Ва(51(р)) = В + Т}п=18ип(р)Вп,

где А и В - матрицы номинальной модели, Ап и Вп - постоянные матрицы соответствующих размеров. Множество неопределенных параметров 5^п(р) агента I определим как

Ь = & = ■■■ 5Ы]Т: Ьп 6 [З^Лп = 1, 2.....I},

а также определим конечное множество вершин многогранника ограничений агента I

= & = [кг ■ 5и]Т: кп 6 &,п,Ып = 1, 2.....I},

содержащее 21 элементов.

Предполагается, что шумы объекта р) и шумы измерений VI (к, р) представляют собой независимые гауссовские белые шумы с ковариационными матрицами

БшЛ = Е[ш1(к,р)ш1(к,р)], БуЛ = Е[у1(к,р)у'Т(к,р)] , где Е - символ математического ожидания.

Связи между агентами в конфигурации т представим в виде направленного графа = (Зт, £т), где £т £ 0тх Зт - ребра графа. Возможность доступа агента ] 6 0т к выходным данным агента I задается ребром, направленным от вершины I к вершине ] и обозначаемым упорядоченной парой (I, 6 Элементы матрицы смежности

^т(5т) =

dj ; & ;

1112

й; ; й; ;

1211 1212

■^Нт1!

а

задаются следующим образом: ^ > 0, если (]', I) 6 £т, = 0 в противном случае, йц = 0. В общем случае значения ненулевых

элементов отражают значимость тех или иных связей, в простейшем случае они равны единице.

Матрица Лапласа графа задается выражением

^¡ЕЭт^] "

^т(бт)

vrn

dlNmh diNml2 " ^j&rndiNm]i

Обозначим за yref(p) желаемый выходной сигнал и введем ошибку обучения еi (k, р) = yref (р) — (к, р). Агента, имеющего доступ к yref(p), назовем лидером, а остальные - ведомыми

системами. Возможность получения агентами информации о же-

Nm п=1'

где gi = 1, если агенту i имеет доступ к yref(p), и gt = 0 в противном случае.

Задача заключается в поиске такого управления (протокола) щ(к,р), при котором среднее значение ошибки монотонно не возрастает с увеличением числа повторений:

(6) E\ei(k + 1,p)\<E\ei(k,p)\, к>0, 0 <р <Т — 1,

при этом lim Е\\щ(к,р) — щ(ю,р)\\ = 0, lim E[\\e((fc,p)\\2] и

к^ю к^ю

lim Е[\\щ(к,р) —Ui(^,p)\2] ограничены, где Ui(^,p) - ограни-

к^ю

ченная переменная, называемая обученным управлением.

Для оценки векторов состояния и выходного сигнала используем фильтра Калмана с номинальными параметрами Xi(k,p + 1) = ÄXi (к, р) + Вщ (к, р) +

+Fi[yv,i(k,P) — Cxi(k,p)],

yt(k,p) = Сщ(к,р), где Xi (к, р) е ЕПх - оценка вектора состояния, уt (к, р) е -оценка выходного сигнала, Fi - матрица усиления наблюдателя. Ошибку оценивания определим как Xi (к, р) = Х[ (к, р) — Х[ (к, р).

Закон УИО для агента i на повторении к + 1 в случае, если он функционировал на повторении к, имеет вид

(7) щ(к + 1,р) = щ(к,р) +Ащ(к + 1,р), i = h, h, — ЛNr,

лаемом выходном сигнале задается матрицей Gm = diag[^ ]

где Ащ(к + 1,р) - корректирующая добавка для агента ¿, которую будем формировать в виде

(8) Ащ(к + 1,р) = КХг[ос1(к + 1,р) — %(к,р)] +

+К2,г [Ъ]^ (Ш, р + 1)-Ш,р + 1)) +

+91 (Уге/(Р + 1)-У((к,р + 1))], где К1г и К21г - матрицы протокола в конфигурации г, 0(,г = = {] 6 3Г1 (]', I) 6 £г} - множество агентов, информация о которых доступна агенту в этой конфигурации.

Если агенты подключаются к сети на повторении к3, то они получают управляющие сигналы от агентов, функционирующих на повторении к3 — 1, и продолжают свою работу на к3, т.е.

(9) щ(к3,р) = и](к3 — 1,р) + Аи](к3,р),

I = ^г+1,^г+2, , У 6 [¿1,

где Ы3 - количество подключаемых агентов на повторении к3. Конфигурацию сетевой системы, при которой управление хотя бы одним агентом происходит согласно закону (9), будем называть переходной конфигурацией, в противном случае - стандартной конфигурацией. После переходной конфигурации происходит переключение к стандартной с учетом новых агентов.

2.2. ПОСТРОЕНИЕ 2D-МОДЕЛИ

Введем в рассмотрение векторы приращений по переменной к оценки вектора состояния и ошибки оценивания + 1,р + 1) = щ(к + 1,р) — Ъ(к,р), ¡¡¿к + 1,р + 1) = %(к + 1,р) — %(к,р) соответственно, а также ошибку обучения относительно оценки выходного сигнала е 1 (к, р) = уге^ (р) — у^ (к, р). Динамика исходной системы в момент подключения к3 = к + 1 относительно введенных векторов описывается уравнениями

(10) ^ + 1,р + 1)= А&(к + 1,р)+ Р1С^1(к + 1,р) +

+ВАи](к + 1,р — 1) + р1АУ1~(к + 1,р — 1),

(11) !1(к + 1,р + 1)= Аа(51)^1(к + 1,р) +

+(А(51) — ЬСШк + 1,р)+ Ва(51)Аи^(к + 1,р — 1) +

+вА ш^к + 1,р — 1) — Р1Ау1(к + 1,р — 1),

(12) е £ к + 1,р) = —СА^(к + 1,р) — СВД^ + 1,р) +

+ёь(к,р) - СВ1и}(к + 1,р-1)- СР^у^к + 1,р - 1),

* = ^г+1,^г+2, ■■■,1мг+м5, У Е [*1, ^■Nr], а на остальных повторениях к

(13) ^ + 1,р + 1)= А^(к + 1,р)+ ЬСЬ(к + 1,р) +

+В1щ( к + 1,р- 1) + Р11(к + 1,р- 1),

(14) + 1,р + 1)= Аа&Шк + 1,р) +

+04($) - Р^Шк + 1,Р)+ Ва(31)Аи1(к + 1,р-1) +

+ащ(к + 1,р-1)- Р11у1(к + 1,р- 1),

(15) е¿к + 1,р) = -СА^(к + 1,р)- СР1С^1(к + 1,р) +

+е¿( к,р) - СВ1щ(к + 1,р-1)- СР^у^к + 1,р - 1), I = Н, 12, ,

где Мт = , если подключение новых агентов не происходит, Nт. = ^г + в противном случае. Обозначим

щ(к + 1,р) = [&(к + 1,Р) %(к + 1,р)]Т,

Е1(к + 1,р) = ё^к + 1,р),

+ 1,р) = 1щ(к + 1,р- 1),

щ (к + 1,р) = [1ш[(к + 1,р-1) АуТ(к + 1,р- 1)]Т, тогда системы (10)-(12) и (13)-(15) относительно данных векторов примут вид

(16) гц(к + 1,р + 1) = А11Л(81)гц(к + 1,р) + Аи£1(к,р) +

+ 1,Р) + Р1,№(к + 1,Р),

(17) £{(к + 1,р)= А2ищ(к + 1,Р) + А22*(к,р) +

+В2Р](к + 1,р) + Р2,м(к + 1,р),

I = ^г+1,^г+2, , У Е [¿1,

и

(18) т(к + 1,р + 1) = А1и(8дгц(к + 1,р) + А^Кр) +

+В1( 8М к + 1,р) + Рищ(к + 1,р),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(19) гь(к + 1,р)= А21,м(к + 1,Р) + А22^(к,р) +

В2У1(к + 1,р) + Р2,м(к + 1,Р),

I = Н, 12, ,

соответственно, где

А РС

АцМ) =

[Аа(8д А(81)-Р1С\

А12 = 0,

А21,1 = [—СА —СЬС],А22 = 1Пу ,Вг(51) = [Вт ВТ(3)Т, [0 Р

В2 = —СB, Р1,1 =

с —^

¿ = [0 — СР]

Объединим системы (16)-(17) и (18)-(19) относительно векторов

1л(р,к) = [и!1(р,Ю — И-Ъ&Ю^,

ф,к) = [л71(Р,к) — л7„т(Р,к)]

,т Г^ ьл ,.Т

Vm

-Тг„ „Т '

ф,к) = [£Т1(р,к) ... ^(рЛ)] с учетом (7)-(9) в следующую модель: 1(к + 1,р + 1) = (А11с,т(3с,т) +

+В1с,т(^с,т)К1с,тС0,т^1с,т)Л(^ + 1,Р) + + {А12с,т + В1с,т{рс,т)К2с,т^2с,т)£(к,Р>) +

+Р1с,т№ + 1,Р), £(к + 1,р) = (А21с,т + В2с,тК1с,тС0,т.Н1с,т)11(к + 1,Р) +

+ {,А22с,т + В2с,тК2с,т.Н2с,т)£(к,Р) + Р2с,т^(){ + 1,P),

где

А11с,т(8с,т) = diag[All,in(Sin)]Il^ ,А12с,т = ¡Мт®А12,

А21с,т = diag[A2l,in]I™ ,А22с,т = ¡Кт®А22,

:,т(ис,т) = ш^[п11,1п\°1п)]п=^ *12с,т ]п=1

В1с,т(Яс,т) = , В2с,т = INm®B2,

К1с,т = ¡Nm®К1,m, К2с,т = ¡Nm®К2,m,

Со,т = 1мт®Со, Со = [пх °],

Н1с,т. = Нт®Ьпх, Н2с,т = Нт(^т + Ст)®1Пу,

Р1с,т = diag[Fl,ín]I=l, р2с,т = diag[р2,^]^.

Здесь 8ст = [<5Т — ^(Тт] - расширенный вектор неопределенных параметров. При этом множество неопределенных параметров и конечное множество его 211т вершин определяются как Ас,т = А( и АсУ,т = соответственно.

Матрица Нт определяется следующим образом. Если новые агенты не подключаются к сети, содержащей Мг агентов, то Нт = 11г. В случае, когда Ы3 агентов подключается к сети, содержащей Мг агентов, то кц = 1, I = 1,..,,МГ, и = 1,

I = Ыг + 1, —, Ыг + Ы3 для некоторого } 6 [1,Мт], в остальных случаях элементы Нт равны нулю.

Полученная модель является стохастической 2D-моделью. В [2] показано, что экспоненциальная устойчивость детерминированной системы

(20) г](к + 1,р + 1) = (Ацс,^^) +

+^1с,т(^с,-т)К1с,т^0,тН1с,-т)11(к + 1,Р) +

+ {А12с,т + Blс,m{pс,m)К2с,mН2с,m)£(}<■,P),

(21) £( к + 1,р) = (А21с,ш + ^2с,т^1с,т^0,тН1с,т)^(к + 1,Р) +

+ {^22с,т + В2с,тК2с,тН2с,т)е(]1,Р) гарантирует выполнение условий сходимости (6).

2.3. РЕШЕНИЕ НА ОСНОВЕ ДИВЕРГЕНТНОГО МЕТОДА ВЕКТОРНЫХ ФУНКЦИЙ ЛЯПУНОВА

По аналогии с [1] определим понятие экспоненциальной устойчивости следующим образом.

Определение 1. Расширенная система (20)-(21) является экспоненциально устойчивой, если существуют действительные числа к > 0 и 0 < Л, < 1 такие, что 1г](к,р)12 + Нк,р)12 < кЛк+р.

Если система (20)-(21) экспоненциально устойчива, то условия сходимости (6) будут выполнены. Таким образом, при заданной структуре управления задача синтеза управления сводится к поиску матриц протокола К1т и К2т из условия экспоненциальной устойчивости. Для этого используем дивергентный метод векторной функции Ляпунова [4].

Определим векторную функцию Ляпунова как

\У1,т(г](к + 1,Р)}

(22) ут{г1(к + 1,р),£(к,р)) =

У2,т(£(к,Р))

где

УХт(г1(к + 1,р)) = г{Т(к + 1,р)Р1с ,т1(к + 1, Р), У2,т(£(к,Р)) = £Т(к,р)Р2с,т£(к,Р), Р1с,т = Р2с,т = ^т®Р2,т.

Дискретный аналог дивергенции функции (22) определяется в виде

(23) ттп(1(к + 1,р),£(к,р)) =

= АрУХт(1(к + 1,р)) + АкУ2,т(£(к,р)),

где

АрУХт(1(к + 1,р)) =

= У1,т(1(к + 1,р + 1)) — У1>т(1(к + 1,р)), АкУ2,т(£(к,р)) = У2,т(£(к + 1,р)) — У2,п(£(к,р)). Подставляя компоненты функции (22) в (23) с учетом (20) и (21), получим

ъут(1(к + 1,р-),£(к,рУ) = 1(к + 1,р)]Т

е(к,р)

(фт( 8с,т)Рс,тфт(^с,т)

Рс,т)

1(к + 1,р) £( к,р)

где

Рс,т = diag[Plс,^n Р2с,т]

фт( 8с,т) = Ас,т(^с,т) + Вс,т(рс,т)Кс,тСс,тНс,т, Ас,т(рс,т) =

А11с,т(^с,тп) А

а7

12с,т

А

121с,т

Вс,т(рс,т) = [Вутс,т(^с,т) В2с,т]

22с,т Т

Кст = [К1с,т К1с,т],

:,т(^с,т) ^2с,т] , Кс,т 1_'*1с,т Сс,т = diag[С0,m Ьт®^Пу], Нс,т = diag[Нlс,m Н2с,т]. Система (20)-(21) будет устойчива, если будут выполнены следующие линейные матричные неравенства:

(24) фт( 8с,т)Рс,тфт(8с,т) — Рс,т + Qm +

Т

+ (Кс,тСс,тНст) Рт(Кс,тСс,тНст) ^ 0, Рс,т > 0, где Qm > 0, Ят >0 - весовые матрицы, которые имеют вид Qm = diag[Ql,m Q2,m], Ql,m = ® Ql,

Q2,m = ^т ® Q2, Рт = ^т ® Р.

Используя лемму Шура о дополнении, сведем неравенства (24) к следующей системе матричных уравнений и неравенств:

Т

(25)

с,т

фт,т(^с,т) Хс,т (Ус,тСс,тНс,т)

х,

фс,т(^с,т) Хс,т Ус,т Сс,тНс,т

с,т 0 0

0

Q-

0

0

п-1 Лт

1

(26) ХС:П > 0,

(27) Сс,тНс,тХс,т = 'с,тСс,т^с,т, где

фс,т(8с,т) = Ас,т(8с,т)Хс,т + Вс,т(8с,тУУс,тСс,т^с,т,

Хс,т = &^[Х1с,т Х2с,т] = Рс,т, Х1с,т = & Х1т

Х2с,т = & Х2т Ус,т = [У1с,т У2с,т] = Кст^ст

У1с,т = & ^гт У2с,т = &

'с,т = diag['^1с,m ^2с,т], %1с,т = & ^гт

'2с,т = & '2,т •

Поскольку неравенства (25)-(26) невыпуклые, их стоит проверять только для 8ст 6 Асут. Таким образом, полученный результат можно обобщить в виде следующей теоремы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теорема 1. Если система (25)-(27) разрешима относительно Хг т, Х2 т, У1 т, У2 т, '1 т и '2 т для 8с т 6 Асу т, то закон управления (7), (9) с корректирующей добавкой (8) и матрицами протокола К1т = У^^-т и К2т = У2,т'2т гарантирует экспоненциальную устойчивость системы (1)-(3) и обеспечивает сходимость выходного сигнала к желаемой траектории при любых значениях неопределенных параметров, удовлетворяющих (4)-(5), т.е. является робастным по отношению к заданным неопределенностям.

3. Пример

В качестве агентов будем рассматривать одинаковые манипуляторы с гибким звеном [3], момент инерции каждого манипулятора меняется в зависимости от массы перемещаемого груза и задан в виде аффинной модели. Динамика движения манипулятора в этом случае описывается следующей моделью в пространстве состояний: Х1(к,0 = Ас(81)х1(к,у) + ВсЩ (к, О + СсШ^к,^, у((к,Ь) = СсХ1 (к, О,

УуЛ(к,0=У1(к,0+У1(к,0,

где х = [о а 6 а]Т, 6 - угол поворота сервопривода, а - угол отклонения звена, и = г - крутящий момент, приложенный к основанию гибкого звена,

Ас(81) = Ас + Ас,а(80 =Ас + 81ЛАЪ

Ас =

6

0 0

1 0

5

] eq

К5(]1+1ед) _

]еqJl ]еq

5(]1+1ед) ^{¿1+^)

0 5

0 —

-Ве± 0

] е q

в,

eq

А1 =

0

Кв()1+]ес)

0 0 0

0 0 0

JeqJl

]eqh

JeqJl

JeqJl

в,

=\

0

0 ±

Jeq Jeq

6 с = I пх-

Сс = [1 0 0 0],

К3 - жесткость звена, ]еч - момент инерции сервопривода, Вея -коэффициент вязкого трения сервопривода, ]] - момент инерции звена относительно центра масс, /г = /г + А]г, ]г = + А]г.

Были приняты следующие значения параметров однозвен-ных гибких манипуляторов: К3 = 1,3 Н-м/рад, = 2,08 X

X 10-3 кг-м2, Вес1 = 0,004 Н-м/(рад/с), ]1 = 0,0038 кг-м2, А]1 = —0,13]1, А]1 = 0,13]1. Интенсивности шумов Qп = 10-31Пх

и Яп = 10-4 для всех агентов, требуемая точность е* = 0,05 рад. Продолжительность цикла повторения составляет 3 с. При переходе к дискретной модели использовался метод Эйлера с шагом Т3 = 0,01 с. Желаемая траектория выходного сигнала

п(рТ5)2 п(рТ5)3

Уге/(Р) = 0<р<Т

6 27

1, Т = 300.

В данном примере СВ = 0, однако разработанная теория предполагает, что СВ Ф 0. Для обхода этого затруднения воспользуемся тем, что для данной системы у^ (к, Ь) = Сс%1 (к, Ь) = = С1сХ1(к, 0 и ууЛ(к, 0 = С1сХ1(к, 0 + Ьь(к, 0, где С^ = = [0 0 1 0]. Тогда, применяя метод Эйлера, для решения задачи синтеза будем использовать следующую дискретную модель в пространстве состояний:

х1(к,р + 1) = А(51)х1(к,р) + В(51)и1(к,р) + СШ1(к,р), У1(к,р + 1) = С1Х1(к,р), Уу,1(к,Р + 1) = У{(к,р + 1) + у^к,р + 1), где А(8д = ТзАс(8д + 1пх, В(5Ь) = ТзВс(5ь), С = ТзСс, С1 = = Т3 С1, + Сс .

т

В данном случае введем ошибку обучения как £((к,р) = = Уге/(р + 1) — У((к,р + 1). Тогда динамика УИО на стандартной и переходной конфигурациях будет описываться уравнениями (16)-(17) и (18)-(19) соответственно с матрицами

А Р£с

[Аа(8д А(8д — ЬСс\ А21,1 = [—С1А —С1Р£с1 А22 = 1Пу,

АцЛ(8д =

А12 = 0,

В1 = [^ В2 = —С^В, р ; =

0 Р С —Ри

Р2,1 = [0 —С^].

>2 = С1В, Р 1,1

Будем рассматривать сетевую систему из трех одинаковых агентов с одним лидером и двумя ведомыми системами, получающими от лидера информацию о желаемом выходном сигнале. Рассмотрим последовательное и одновременное подключение агентов. Такие сценарии соответствуют производственной системе с изменением объема производства. Когда объем производства увеличивается, происходит подключение новых агентов, при уменьшении - отключение лишних.

При последовательном подключении сценарий работы системы определяется следующими конфигурациями:

1. Работает только лидер.

2. Подключается первая ведомая система и получает управляющий сигнал от лидера.

3. Лидер и первая ведомая система работают самостоятельно, получая доступную им информацию о выходном сигнале.

4. Подключается вторая ведомая система и получает управляющий сигнал от лидера.

5. Все агенты работают самостоятельно, получая доступную им информацию о выходном сигнале.

Решая задачу максимизации ^ [Хст] при ограничениях (25)-(27), задавая весовые матрицы Q1 = 10~512Пх, Q2 = 105, Я = 10, и учитывая 2Шт комбинаций параметров 8ц, были получены следующие матрицы протокола:

К1Л = [—15,2673 0,054 —0,3625 —0,0175],

К21 = 8,3708,

КХ2 = [—0,109 —0,0476 —0,0105 —0,0035],

К22 = 0,0234,

К%3 = [—18,4099 0,0471 —0,4042 —0,0228], К2:з = 6,763,

к14 = [—0,1177 —0,0565 —0,0133 —0,0047], К24 = 0,0005,

К%5 = [—20,1069 0,0192 —0,4255 —0,0264], К25 = 6,1906.

На рис. 1 представлен график изменения среднеквадратиче-ских ошибок выходных сигналов. Неопределенный параметр лидера задан номинальным значением, а первая и вторая ведомые системы находятся на нижней и верхней границе соответственно. Подключения первой и второй ведомых систем происходят на повторениях 15 и 30 соответственно. В данном случае выходной сигнал лидера достигает требуемой точности за 4 повторения, первой ведомой системы - за 2 повторения, а ошибка второй ведомой системы не превышает значения в 0,05 рад на всем интервале времени своего функционирования. В моменты подключения агентов наблюдается возрастание ошибок функционирующих систем, но их величина находится в рамках требуемой точности.

О 10 20 30 40 50 60 70 80 90 100

Номер повторения к

Рис. 1. Изменение среднеквадратических ошибок агентов при последовательном подключении (логарифмический масштаб)

Конфигурации при одновременном подключении:

1. Работает только лидер.

2. Подключаются ведомые системы и получают управляющий сигнал от лидера.

3. Все агенты работают самостоятельно, получая доступную им информацию о выходном сигнале.

Для данного сценария были получены следующие матрицы протокола:

= [-15,2673 0,054 -0,3625 -0,0175],

К2Д = 8,3708,

= [-0,0384 -0,0217 -0,0046 -0,0016],

^22 = 0,0003,

^,3 = [-20,1069 0,0192 -0,4255 -0,0264],

^2,3 = 6,1906.

Моделирование данного сценария (см. рис. 2) было проведено с теми же значениями неопределенных параметров и с использованием тех же моделей шумов, что и в рассмотренном выше случае.

Рис. 2. Изменение среднеквадратических ошибок агентов при одновременном подключении (логарифмический масштаб)

Подключение ведомых систем происходило на повторении 15. Была достигнута аналогичная скорость сходимости агентов, за исключением первой ведомой системы, которая достигла требуемой точности за 3 повторения. В данном случае также наблюдается незначительное влияние переключения конфигурации на работу функционирующих систем. После 24 повторения среднеквадратические ошибки агентов не превышали значения в 0,01 рад.

4. Заключение

В данной работе с использованием дивергентного метода векторной функции Ляпунова получен закон УИО группой стохастических систем с неопределенными параметрами, связанных информационной сетью переменной конфигурации. Как и в [1], результаты моделирования показали эффективность полученного таким образом закона управления. Этот закон является ро-бастным по отношению к заданным неопределенностям, обеспечивает высокую скорость сходимости выходного сигнала к желаемой траектории и позволяет снизить влияние изменения конфигурации сети на точность работы агентов. Однако причина возрастания ошибки в момент подключения агентов все еще вызывает интерес и требует дополнительных исследований.

Литература

1. ПАКШИН П.В., КОПОСОВ АС, ЕМЕЛЬЯНОВА Ю.П.

Управление с итеративным обучением мультиагентной системой в условиях случайных возмущений // Автоматика и телемеханика. - 2020. - №3. - С. 132-156. - DOI 10.31857/ S0005231020030083.

2. ПАКШИН П.В., ЕМЕЛЬЯНОВА Ю.П, ЕМЕЛЬЯНОВ М.А., ГАЛКОВСКИЙ К., РОДЖЕРС Э. Стохастическая устойчивость некоторых классов 2D-систем // Автоматика и телемеханика. - 2018. - №1. - С. 113-129.

3. APKARIAN J., KARAM P., L'EVIS M. Workbook on Flexible Link Experiment for Matlab/Simulink® Users: Instructor Workbook. - Quanser Inc. - 2011.

4. PAKSHIN P., EMELIANOVA J., ROGERS E., GALKOWSKI K.

Repetitive process based stochastic iterative learning control design for linear dynamics // Systems & Control Letters. - 2020. -Vol. 137. - P. 104625. - DOI 10.1016/j.sysconle.2020.104625.

ROBUST NETWORKED ITERATIVE LEARNING CONTROL OF A VARIABLE CONFIGURATION SYSTEM UNDER RANDOM DISTURBANCES

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Anton Koposov, Arzamas Polytechnic Institute of R.E. Alekseev, Nizhny Novgorod State Technical University, Arzamas, postgraduate student (koposov96@yandex.ru).

Abstract: The paper considers the iterative learning control design problem of a system, consisting of identical subsystems (agents) under changing the information network configuration. The agents represent discrete linear dynamic plants with affine model of uncertainty operating in a repetitive mode. Each plant is under the influence of random disturbances, and the output variables of the plants are measured in the presence of noises. The configurations of the information network determine the group of functioning agents and the type of information exchange between agents. The configuration change takes place in accordance with certain external rules. The control design is based on the divergent method of the vector Lyapunov function. The results of modeling the obtained control law for a group of manipulators with flexible single-links are presented.

Keywords: networked control, iterative learning control, uncertain parameters, robust control, stochastic systems, systems with switches, vector Lya-punov function.

УДК 62-50

ББК 32.965.02

DOI: 10.25728/ubs.2021.94.3

Статья представлена к публикации членом редакционной коллегии П. С. Щербаковым.

Поступила в редакцию 29.07.2021.

Опубликована 30.11.2021.

i Надоели баннеры? Вы всегда можете отключить рекламу.