Научная статья на тему 'Экспоненциальная устойчивость повторяющихся процессов с нарушениями. Ii – приложение к синтезу управления с итеративным обучением'

Экспоненциальная устойчивость повторяющихся процессов с нарушениями. Ii – приложение к синтезу управления с итеративным обучением Текст научной статьи по специальности «Математика»

CC BY
150
41
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
2D СИСТЕМЫ / ВЕКТОРНЫЕ ФУНКЦИИ ЛЯПУНОВА / VECTOR LYAPUNOV FUNCTIONS / УСТОЙЧИВОСТЬ / STABILITY / УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ / ITERATIVE LEARNING CONTROL (ILC) / СЕТЕВОЕ УПРАВЛЕНИЕ / НАРУШЕНИЯ / 2D SYSTEMS / NETWORKED CONTROL / FAILURES

Аннотация научной статьи по математике, автор научной работы — Емельянова Ю. П.

На основе условий устойчивости, полученных в первой части работы, решается задача синтеза алгоритма сетевого управления с итеративным обучением линейными системами с неопределенными параметрами и информационными нарушениями. Эффективность алгоритма продемонстрирована на примере упрощенной модели динамики вертикального канала группы портальных роботов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EXPONENTIAL STABILITY OF REPETITIVE PROCESSES WITH FAILURES. II – APPLICATION TO ITERATIVE LEARNING CONTROL

The stability conditions obtained it the first part of the paper are applied to iterative learning control design of linear uncertain systems controlled over a network with possible transmission failures. The effectiveness of proposed algorithm is demonstrated on simplified model of vertical channel dynamics of gantry robots group.

Текст научной работы на тему «Экспоненциальная устойчивость повторяющихся процессов с нарушениями. Ii – приложение к синтезу управления с итеративным обучением»

УДК 681.51

Ю.П. Емельянова

аспирант, кафедра прикладной математики, Арзамасский политехнический институт (филиал) ФГБОУ ВПО «Нижегородский государственный технический университет им. Р.Е. Алексеева»

ЭКСПОНЕНЦИАЛЬНАЯ УСТОЙЧИВОСТЬ ПОВТОРЯЮЩИХСЯ ПРОЦЕССОВ С НАРУШЕНИЯМИ.

II - ПРИЛОЖЕНИЕ К СИНТЕЗУ УПРАВЛЕНИЯ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ

Аннотация. На основе условий устойчивости, полученных в первой части работы, решается задача синтеза алгоритма сетевого управления с итеративным обучением линейными системами с неопределенными параметрами и информационными нарушениями. Эффективность алгоритма продемонстрирована на примере упрощенной модели динамики вертикального канала группы портальных роботов.

Ключевые слова: 2D системы, векторные функции Ляпунова, устойчивость, управление с итеративным обучением, сетевое управление, нарушения.

J.P. Emelianova, Nizhni Novgorod State Technical University (Arzamas Branch)

EXPONENTIAL STABILITY OF REPETITIVE PROCESSES WITH FAILURES. II - APPLICATION TO ITERATIVE

LEARNING CONTROL

Abstract. The stability conditions obtained it the first part of the paper are applied to iterative learning control design of linear uncertain systems controlled over a network with possible transmission failures. The effectiveness of proposed algorithm is demonstrated on simplified model of vertical channel dynamics of gantry robots group.

Keywords: 2D systems, vector Lyapunov functions, stability, iterative learning control (ILC), networked control, failures.

Введение

Принцип управления с итеративным обучением был защищен патентом еще в 1971 году [1], но получил широкую известность только после выхода в свет статьи [2]. В настоящее время теории и приложениям этого принципа посвящено колоссальное количество работ, о чем свидетельствуют обзорные статьи [3, 4]. Принцип управления с итеративным обучением завоевал широкую популярность благодаря своей простой и понятной логике: в тех случаях, когда процесс управления повторяется многократно, естественно на его текущем повторении использовать информацию с предыдущего повторения с целью повышения точности и других показателей, подобно тому, как все мы на основе собственного опыта совершенствуем выполнение каких-либо действий.

В данной работе рассматривается группа систем, каждая из которых в повторяющемся режиме должна воспроизводить с требуемой точностью заданную траекторию движения (например, манипуляторы, устанавливающие детали в заданные позиции). Для достижения этой цели предполагается применить алгоритм управления с итеративным обучением и связать обучаемые системы информационной сетью, чтобы за счет обмена информацией между ними повысить качество управления и надежность. Такая постановка задачи является естественной, поскольку существует большое количество производственных систем, в которых объекты должны согласованно в повторяющемся режиме выполнять одинаковые операции. Для выбора параметров алгоритма, обеспечивающих сходимость процесса обучения в условиях возможных информационных нарушений, моделируемых цепью Маркова [5-7], используются результаты первой части работы.

Синтез сетевого управления с итеративным обучением в условиях информационных нарушений

Рассматривается множество линейных дискретных систем с неопределенными параметрами:

х,. (t +1) = Д (S)x, (t) + B, (S)u,. (t), У( (t) = CXi (t), i = 1,2.....N,

где e Rn - вектор состояния i-й системы, ui e Rm - вектор управления i-й системы, yi e Rp - вектор

выходных переменных i-й системы, S e R' - вектор неопределенных параметров, A, B, C - действительные постоянные матрицы параметров системы, i - номер системы, N - число систем.

Для описания неопределенностей используется аффинная модель [8]

A(S) = A + t SjAj, в,.(S) = в,. +£SB, j=1 j=1

где S e A = {S = (S1.....S,): Sj e S,Sj]}, Sj,Sj - нижняя и верхняя граница элемента б;, Aj, B,j - известные

матрицы, i=1,2,...,N, j=1,2,...,'.

Обозначим

А = {5 = 8.....8,): Sj е {Sj,Sj}}, j = 1,2.....l.

Множество А в отличие от А содержит все возможные последовательности верхних и нижних границ интервалов длины l, в которых изменяются неопределенные параметры, и является конечным множеством из 2 элементов.

Системы (1) работают в повторяющемся режиме на заданном конечном интервале времени [0,7] с известными начальными условиями. Задача состоит в обеспечении повторения заданной траектории движения yref(t) всеми системами на конечном интервале t е [0,7] с ошибкой не более £ > 0.

При этом предполагается, что только одна из систем (лидер или ведущий) получает информацию о заданной траектории непосредственно, остальные получают эту информацию от лидера (ведомые). Если по причине возможных нарушений какая-либо ведомая система теряет связь с лидером, она начинает получать информацию от другой доступной ведомой системы. При восстановлении связи с лидером система вновь переключается на получение информации от него.

Следуя концепции итеративного обучения входную переменную (управление) на (^+1)-м повторении (шаге) для i-й системы зададим в виде

u,. (t, k +1) = u,. (t, k) + Au,, (t, k +1), (2)

где Au(t,k+1) - корректирующая добавка к управлению i-й системы на текущем k-м шаге для формирования управления для следующего (к+1)-го шага.

Таким образом, система (1) с законом управления (2) может быть представлена как 2D система

х,. (t + 1,k) = Д (8 )x , (t, k) + B,. (5)u, (t, k),

y,.(t, k) = CXi (t, k), i= 1,2.....N

со следующими граничными условиями

X (0, k) = x0, k = 0,1..... u .. (t,0) = 0, t = 0,1.....7.

Введем в рассмотрение вектор ошибки с координатами

e,(t, k) = yref (t, k) - y1(t, k), e,. (t, k) = yllp(t )](t, k) - y , (t, k), . = 2,3.....N,

где e1 - ошибка обучения ведущей системы, y1 - вектор выходных переменных ведущей системы, e. -ошибка обучения /-ой ведомой системы, y. - вектор выходных переменных /-ой ведомой системы, l/[p(t)] -индекс коммуникационной структуры сети, который может принимать любые значения от 1 до N, исключая свое собственное состояние г, это означает, что при потере связи с лидером на вход .-ой системы поступает выходной сигнал любой другой системы, связь с которой ей доступна. Состояние связей между лидером и ведомыми системами описывается марковской цепью p(t) с конечным числом состояний N = {1.....v} и известными вероятностями перехода

P [p(t +1) = q p(t) = r ] = жгч.

Очевидно, что для достижения требуемой точности корректирующая добавка к управлению hu(t,k+1) должна выбираться из условия сходимости алгоритма управления (2):

lim | e:(t,k)|= 0, lim | ц(t,k) -u,(t,<»)|= 0.

С учетом стохастического характера системы введем следующее определение сходимости.

Определение 1. Алгоритм управления с итеративным обучением (2) называется сходящимся в среднем квадратическом, если для любых начальных условий х.0 е R" и для любой начальной управляющей последовательности {u((t,0)} он задает такую последовательность u(t,k) для системы (1), что E[|ej(t,k)|2] ^ 0 при t=[0,7], М,...,^ где E - оператор математического ожидания.

Условия сходимости алгоритмов управления с итеративным обучением

Для дальнейшего анализа введем следующие вспомогательные переменные:

77,.(t + 1,k +1) = х!(t, k +1) - x(t, k), . = 1,2.....N .

В терминах переменных r| и e система (1) опишется моделью с двумерной динамикой в стандартной форме линейного дискретного повторяющегося процесса:

r](t + 1,k +1) = Ä11(S)^(t,k +1) + Ä12(S)e(t,k) + B1(S)Au(t - 1,k +1), e(t, k +1) = Ä21(S, p(t))n(t, k +1) + Ä22e(t, k) + B2(S, p(t))Au(t -1,k +1), (4)

где A11 = diag[A1 AN], Д22 = .l, B1 = diag[B1^BN],, Д2 - нулевая матрица соответствующего размера, матрицы A21, B2 имеют случайную структуру, определяемую нарушениями. В частности, когда каждая система получает информацию от лидера, эти матрицы имеют вид

А21 -

-О1Л1 0 0. 0 0

О1Л1 -О2Л2 0. 0 0

0 0 -ОзЛз . 0 0

В,

_ О1Л1 0 0

-О1В1 0 0

О1В1 -О2В2 0

0 0 -ОзВз

о -С„А„ 00 00 00

-CNBN.

(6)

С1В1 о о ... о

где зависимость от б для компактности записи не указана. При нарушениях элементы -О/Л, и -О/В, будут оставаться на своих позициях, а другие элементы будут менять значения и позицию на соответствующей строке в зависимости от значения //[р(0].

Рассмотрим случай, когда переменные состояния доступны измерению и сформируем корректирующую поправку в виде

Аи( - 1,к +1) - ^(г)^, к +1) + F2(r)eí(t, к), если р(0 - г, г е N. (5)

где F1(r), F2(r) - матрицы усиления.

Тогда уравнения замкнутой системы (4), (5) запишутся следующим образом:

^ + 1,к +1) -(Лцт)) + В^))Fl(р(t)))^(t,к +1) + (Л,2 + ^(8^))F2(р(t)))e(t,к), е(^ к +1) - (Л^т), р^)) + В2(8^), р^щр)))ф,к +1) + (Л22 + В^зу), р(t))F2(р(t))) e(t, к)

Очевидно, что если поправка (5) обеспечивает экспоненциальную устойчивость по профилю повторения системы (6), то это будет гарантировать сходимость алгоритма управления (2).

Для получения условий устойчивости воспользуемся теоремой из первой части статьи, взяв в качестве компонент векторной функции Ляпунова

V - к + 7к +1), V - ет(^ к)Р2р))е^, к), где Р^р)) - ¿¡ад[Рц...Рш], Р2р)) - ¿¡адр^.р].

В результате вычисления оператора D вдоль траекторий системы (6) с последующим использованием теоремы о дополнении Шура [8], условия устойчивости запишутся в виде системы линейных матричных неравенств и уравнений относительно этих переменных.

" Мц(г) М 12(8, г) М1з(г)■ М]2(8,г ) М22(г) 0 0

О

М[з(г)

Мзз(Г)

>0,

где Ху) - ¿¡ад[Х„(г) ... М22(г) - ¿¡ад[Хц Х2(г) X!

X(г) - ¿¡ад[Х1(г) Х2(г)] > 0, г е N , Хш(г)], Х2(г) - ¿¡ад[Х21(г) ... X2N(г)],

(7)

Мц(г) - Х(г), М1з(г) - [Х(г) Ут(г)],

Х2(г)

Х„ Х2(г)],

Мзз(г) - ¿¡ад[0->) R>)],

М12(Г ) =

(Лц(8) Х1(г) + В1(8)У1(г Ж1;

(Л,2(8) Х2(г) + В1(8)У2(г )Х2

.(Л21(8, г )Х1(г) + В2(8,г )У1(г Ж1'2 (Л22(8)Х2(г) + В2(8,г )У2(г Ж

(А18) Х1(г)+Вууу ж1;

(А28) Х2(г) + В1(8)У2(г ж1;

( Л21(8,Г )Х1(г) + В2(8,г )Уу Ж1'2 (Л22(8)Х2(г) + В2(8,г )У2(г Ж1' У (г) - УУ) У2(г)], У1(г) - ^(г) Х1(г), У2(г) - F2(r )Х2(г). Таким образом, справедливо следующее утверждение.

Теорема. Предположим, что линейные матричные неравенства (7) и разрешимы относительно переменных Х1(г), Х2(г), У1(г), У2(г). Тогда закон управления с итеративным обучением (2), (5) сходится

и ^(г) - Уу )Х-1(г), F2(r) - У2(г)Х2У), г е N .

В частном случае, когда вероятности перехода неизвестны, полагая матрицы компонент векторной функции Ляпунова Р1 и Р2 постоянными, как следствие из теоремы, получим, что закон управления с

т

т

итеративным обучением вида (2), (5) будет сходиться, если выполняются следующие линейные матрич ные неравенства

" X (А(8,г )Х + В(8,г )У )т X

А(8,г) X + В(8, г )У X 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где

А(8,г)=

X

Ац(8) А,2(8) (А21(5,г) А22(8)

, В (8, г) =

0

3(8)" .В2(8,г)_

О

30, X > 0, 81 А, rlN,

(8)

, X = diag [Р;1 РД У = FX, F = [F, F2].

Если система (8) разрешима, то постоянные в этом случае матрицы F1 и F2 вычисляются по формулам

F1 = У^X-1,F2 = У2 X21. (9)

Численный пример

С использованием полученных результатов был осуществлен синтез управления с итеративным управлением без переключения и проведено моделирование для упрощенной модели динамики вертикального канала группы портальных роботов. Эти роботы установлены в Университете Саутгемптона, Великобритания и данные о них были предоставлены коллегой. На рисунке 1 представлена фотография робота, на рисунке 2 - желаемая траектория робота вдоль вертикальной оси.

Будем предполагать, что таких роботов три, и они связаны между собой так, что могут обмениваться информацией друг с другом. При этом один из роботов (лидер или ведущий) получает информацию о заданной траектории непосредственно, остальные либо от лидера, либо друг от друга в случае потери связи с лидером.

Ведущая система имеет следующие матрицы параметров -0.002961 1 0

, В1 =[0 0 0.01563]', С1 =[0.0003718 0.007077 0.02335].

А

-0.0008363 -0.002961 00

0.03035 1

Матрицы параметров ведомых систем А2,В2,С2,А3,В3,С3 имеют отклонения в пределах 10% от матриц параметров ведущей системы Д, В1,С1.

Рисунок 1 - Портальный робот

Рисунок 2 - Желаемая траектория на выходе вдоль вертикальной оси В результате моделирования были получены следующие графики (рис. 3). На рисунке 3а представлен процесс обучения ведущей системы. Из графиков видно, что за достаточно небольшое число шагов ведущая система монотонно достигла желаемой выходной траектории вдоль вертикальной оси Oz. На рисунках 3б и 3в представлены процессы обучения первой ведомой и второй ведомой систем в случае, когда первая ведомая учится у лидера, а вторая ведомая учится у первой ведомой системы. В этих случаях скорость сходимости ошибки обучения первой ведомой системы меньше, чем у лидера, второй ведомой системы меньше, чем у первой ведомой, что вполне естественно и ожидаемо.

На рисунках 3г и 3д представлен случай, когда обе ведомые системы берут информацию у лидера. Первая ведомая система теряет связь с лидером с 5-го по 7-й шаг и на этом интервале берет информацию у второй ведомой. Вторая же ведомая система теряет связь с 10-го по 15-й шаг и на этом интервале берет информацию у первой ведомой. Из графиков видно, что сходимость сохраняется, но в случае потери связи с лидером и замене при этом информации от лидера информацией от другой ведомой системы, скорость сходимости снижается. В случае потери связи с лидером нарушается и монотонность убы-

вания ошибки, чего не наблюдается в случае, если связь с лидером не теряется.

а) выходной сигнал (слева) и ошибка обучения (справа) в виде боковой проекции трехмерного графика ведущей системы

б) выходной сигнал (слева) и ошибка обучения (справа) в виде боковой проекции трехмерного графика первой ведомой системы

в) выходной сигнал (слева) и ошибка обучения (справа) в виде боковой проекции трехмерного графика второй ведомой системы

г) выходной сигнал (слева) и ошибка обучения (справа) в виде боковой проекции трехмерного графика первой ведомой системы при потере связи с лидером с 5-го по 7-ой шаг

д) выходной сигнал (слева) и ошибка обучения (справа) в виде боковой проекции трехмерного графика второй ведомой системы при потере связи с лидером с 10-го по 15-й шаг

Рисунок 3 - Результаты моделирования упрощенной модели динамики вертикального канала группы портальных роботов

Заключение

В этой части статьи теоретические результаты, полученные в первой части, применены к задаче синтеза сетевого управления с итеративным обучением группой портальных роботов. Было проведено моделирование такой системы, которое показало, что в случае отсутствия коммуникационных нарушений ошибка обучения ведомых систем сходится монотонно и, что вполне естественно, имеет меньшую скорость сходимости, чем ведущая система, но при наличии информационных нарушений и рассматриваемого консервативного закона управления с постоянной обратной связью, ошибка сходится немонотонно. Поскольку немонотонный характер сходимости в задачах итеративного обучения крайне нежелателен, дальнейшие исследования будут направлены на построение алгоритма управления, обеспечивающего монотонную сходимость ошибки при наличии информационных нарушений. Вероятно, такие алгоритмы должны быть переключаемыми (т.е. переключаться на другой режим управления в случае возникновения нарушения) и содержать прогнозирующие составляющие. Таким образом, моделирование подтвердило эффективность предложенного подхода и определило направление дальнейших исследований. В настоящий момент ведется работа по решению задачи сетевого управления с обратной связью по выходу.

Список литературы:

1. Garden, M. Learning control of actuators in control systems. -U.S. Patent 3555252, 1971.

2. Arimoto, S. Bettering operation of robots by learning / S. Arimoto, S. Kawamura, F. Miyazaki // J. Robot. Syst. -1984. - V. 1. - P. 123-140.

3. Hyo-Sung, A. Iterative Learning Control: Brief Survey and Categorization // Hyo-Sung Ahn, Yang Quan Chen, Kevin L. Moore. - IEEE Transactions on systems, man, and cybernetics - part C: Applications and reviews. - 2007. - Vol. 37, № 6. - P. 1099-1121.

4. Bristow, D.A. A survey of iterative learning control / D. A. Bristow, M. Tharayil, A. Alleyne // IEEE Control Systems Magazine. - 2006. - V. 26. - P. 96-114.

5. Пакшин П.В. Линейно-квадратичная параметризация стабилизирующих управлений в дискретных системах с двумерной динамикой / Пакшин П.В., Галковский К., Роджерс Э. // Автоматика и телемеханика. - 2011. - № 11. - С. 157-173.

6. Емельянова, Ю.П. Алгоритмы управления с итеративным обучением системами с неопределенными параметрами и возможными нарушениями // Навигация и управление движением: Материалы докладов XIII конференции молодых ученых «Навигация и управление движением». - СПб.: ГНЦ РФ ОАО «Концерн ЦНИИ «Электроприбор», 2011. - 434 с.

7. Pakshin, P., Emelianova J. Iterative Learning Control under Parameter Uncertainty and Failures / P. Pakshin [et al.] // IEEE Multi-conference on Systems and Control, Croatia, October 3-5, 2012.

8. Boyd, S. Linear Matrix Inequalities in System and Control Theory / S. Boyd, L. El Ghaoui, E. Feron, V. Balakrishnan. - Philadelphia: SIAM, 1994.

i Надоели баннеры? Вы всегда можете отключить рекламу.