НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА
НАУКА и ОБРАЗОВАНИЕ
Эл № ФС77 - 48211. Государственная регистрация №0421200025. ISSN 1994-0408
электронный научно-технический журнал
Устойчивость нелинейных повторяющихся процессов
с возможными нарушениями
# 04, апрель 2014
DOI: 10.7463/0414.0704664
Емельянова Ю. П.
УДК 62-50
Россия, АПИ НГТУ им. P.E. Алексеева EmelianovaJulia@gmail.com
Введение
В современной теории управления и ряде ее приложений получил распространение и широко исследуется класс систем, в котором переменные состояния являются функциями двух независимых переменных [22, 23]. Они получили название двумерных или 2D систем; первое название, хотя и получило распространение, является неудачным, поскольку так же называются системы второго порядка в пространстве состояний. Далее будем использовать второй термин — 2D системы; при этом в сравнительном контексте обычные системы, в которых переменные состояния являются функциями одной переменной, обычно называют 1D системами [22]. Наиболее наглядным примером являются системы управления с итеративным обучением; здесь одной из независимых переменных служит время на текущем шаге обучения, вторая представляет собой номер шага обучения. Другими примерами могут служить производственные процессы, связанные с повторением однородных операций: конвейерное производство, многопроходное лазерное напыление металла и т.д.
Теорию 2D систем не удается построить как простое обобщение известных результатов теории 1D систем, в которых единственной независимой переменной является время. Даже в тех частных случаях, когда удается построить эквивалентную 1D модель, наблюдается катастрофическое возрастание размерности задачи, что приводит к серьезным техническим трудностям. В общем случае построение такой эквивалентной модели невозможно, и для изучения 2D систем развиваются специфические методы и подходы.
Среди 2D систем выделился ряд моделей, которые можно считать классическими в данной области. Это модель Роессера [21], связанная с задачами обработки изображений, модель Форназини — Маркезини [13, 12], появившаяся в связи с задачами построения двумерных
цифровых фильтров и модель в форме повторяющегося процесса [22, 23] близкая к модели Роессера, связанная с задачами итеративного обучения в робототехнике.
Подавляющее большинство работ в рассматриваемой области посвящено исследованию линейных 2Б систем с постоянными параметрами. Эти исследования систематизированы в монографии [22], в которой также представлен обширный список литературы. Как и для других динамических систем, здесь важнейшей характеристикой является устойчивость. Для систем Роессера и Форназини — Маркезини устойчивость обычно понимается как ограниченность выходного сигнала при ограниченном входном сигнале. Для повторяющихся процессов, принципиальной особенностью которых является то, что одна из независимых переменных изменяется на конечном интервале, вводится, учитывающее этот факт, понятие устойчивости вдоль повторений [22], формализуемое в виде ограниченности линейного оператора в банаховом пространстве.
Работы, связанные с изучением устойчивости нелинейных 2Б систем, стали появляться лишь совсем недавно. В [17, 18] рассматривались системы Форназини — Маркезини, в [24] — системы Роессера и в [11] — повторяющиеся процессы. Понятие устойчивости в классе линейных повторяющихся процессов основано на свойствах линейного оператора в банаховом пространстве [22] и поэтому не может быть непосредственно перенесено на нелинейные системы. В связи с этим в данной работе вводится новое понятие устойчивости для класса нелинейных повторяющихся процессов — экспоненциальная устойчивость по профилю повторения. На основе нестандартного развития метода векторных функций Ляпунова получены условия экспоненциальной устойчивости по профилю повторения нелинейных повторяющихся процессов с возможными нарушениями в терминах этих функций.
Эффективной областью применения 2Б моделей в форме повторяющихся процессов является управление с итеративным обучением. В работах [1, 19] рассматривались линейные дискретные системы с неопределенными параметрами и возможными нарушениями и решалась задача синтеза управления с итеративным обучением для случая обратной связи по состоянию и по выходу для одного объекта. В работах [2, 10] результаты обобщались на случай сетевого управления с итеративным обучением множеством систем с возможными информационными нарушениями в коммуникационной структуре сети. В обоих случаях при возникновении нарушения наблюдался немонотонный характер сходимости к нулю ошибки обучения. Немонотонный характер сходимости в задачах итеративного обучения нежелателен. В данной работе на основе полученных условий устойчивости строится алгоритм управления, снижающий отклонение от монотонной сходимости ошибки при возникновении информационных нарушений.
1. Экспоненциальная устойчивость нелинейных повторяющихся процессов с возможными нарушениями
Рассмотрим нелинейный повторяющийся процесс с возможными нарушениями, описываемый следующей моделью в пространстве состояний
| хк+1 ц+1) = ^l(xk+l{t),yk{t),r{t)), 1 Ук+1 (¿) = <^2(хк+1 (£),Ук (t),r(t)), где к — номер повторения; £ — дискретное время на к-м повторении; хк (£) € — вектор состояния текущего повторения; ук(£) € — вектор, который в литературе получил название «профиль повторения» [22, 23]; и — нелинейные функции, такие, что для любых г € N (0, 0,г) = 0, (0, 0,г) = 0; г(£), £ > 0, — однородная марковская цепь с конечным числом состояний N = {1, ..., V} и вероятностями перехода
Р(г(£ +1)= з | г(£) = г)= пгз, (2)
которая моделирует возможные нарушения.
Будем предполагать, что граничные условия заданы в виде последовательности начальных значений вектора состояния текущего повторения и начального профиля повторения:
Хк+1(0) = 4+1, к > 0, уо(*)=| / ^ 0 -1- Т; (3)
[0, £ > Т,
где ^к+1 € и /(£) € — известные векторы.
Предположим, что граничные условия ^к+1 и /(£) удовлетворяют неравенствам
|/(£)|2 - Mf, |4+1|2 - к^1, к = 0, 1,..., (4)
где Mf > 0, ка — некоторые действительные числа и 0 < < 1. Число определяет скорость сходимости последовательности начальных значений вектора состояния.
В теории линейных повторяющихся процессов эффективно используется понятие устойчивости вдоль повторений [22]. Как уже отмечалось во введении, оно не может быть использовано для нелинейных систем, поэтому необходимо ввести новое понятие устойчивости. Определим норму вектора профиля повторения как
% не
\
Т -1
Е V |ук(£)|2, (5)
4=0
где Е — оператор математического ожидания (выполнение аксиом нормы для (5) легко проверяется непосредственно).
Определение 1. Система (1), (2) называется экспоненциально устойчивой по профилю повторения в среднем квадратическом, если для любых граничных условий (3), удовлетворяющих (4) существуют постоянные к> 0 и 0 < 2 < 1, такие, что
нУкне - К2к. (6)
Далее в работе будет показано, что в линейном случае условия экспоненциальной устойчивости по профилю повторения совпадают с условиями устойчивости вдоль повторений, т.е. вводимое понятие согласуется с известным и широко используемым в линейной теории.
Как было отмечено в [11, 16], для изучения устойчивости 2Б систем, в силу того, что их модели явно задают лишь частные приращения переменных, естественным является метод векторных функций Ляпунова [5], в котором вместо производной скалярной функции в силу системы используется дивергенция векторной функции или ее дискретный аналог [3, 20].
Следуя этой концепции для получения условий экспоненциальной устойчивости по профилю повторения в среднем квадратическом процесса (1), (2), рассмотрим следующую векторную функцию Ляпунова
V (xfc+i(i),yfc (t),r(t))
Vi(xfc+i(i),r(i)) V2 (yk (t),r(t))
(7)
где Vi(x, r) > 0, x = 0, V2(y, r) > 0, y = 0, V1 (0, r) = 0, Уг(0, r) = 0.
Введем разностные операторы Dt и dk вдоль траекторий системы (1):
dtV(C,n,i) = E[Vi(xk+i(t + 1),r(t +1)) - Vi(xk+i(t),r(t)) | xk+i(t) = С, Ук(t) = nk, r(t) = i],
dkV(C,n,i) = E[V2(yk+i(t), r(t)) - V2(nk,ï) | xk+i(t) = Ck+i, yk(t) = nk, r(t) = i]
и определим оператор d как стохастический аналог оператора дивергенции векторной функции V :
DV(С, n, i) = dtV(С, n, i) + dkV(С, П, i). (8)
Справедливо следующее утверждение.
Теорема 1. Рассмотрим нелинейный повторяющийся процесс (1), (2) с граничными условиями (3), удовлетворяющими условиям (4). Предположим, что существуют такие положительные постоянные ci, c2, c3, что функция (7) и ее оператор d (8) вдоль траекторий системы (1), (2) удовлетворяет неравенствам
CilCi2 < Vi(C,i) < c2|C|2, (9)
ci|n|2 < V2(n,i) < C2|n|2, (10)
DV(C,n,i) < -Сз(|С|2 + ln|2), (11)
i g N. Тогда повторяющийся процесс (1), (2) экспоненциально устойчив по профилю повторения в среднем квадратическом.
Доказательство. Из(9)-(11) следует, что
E[Vi(xk+i(t + 1)] < AE[Vi(xk+i(t))] + E[AV2(yk(t)) - V>(yk+i(t))], (12)
где A = 1 - - g (0,1).
C2
Решая неравенство (12) относительно Vi(xk+i (t)), получаем
t-i
E[Vi(xfc+i(t))] < Б[У1(хк+1(0))]Л4 + ^E[AV2(yfc(p)) - V2(yfc+i(p))]At-p-i. (13)
p=0
Обозначим
"t-1
E^y* (t)) ,p=0
At-p-i.
Як (£) = Е Тогда из (9), (13) следует
Як+1(£) - ЛЯк(£) + Л4Е[У1(хк+1 (0))] - ЛЯк(£) + л^к^1. (14)
Решая неравенство (14) с учетом граничных условий (3), (4), получаем
к-1
Як(£) - ЛкЯо(£) + Л4С2Ка V 4Лк--1. (15)
г=1
В завершение, мажорируя правую часть (15), приходим к неравенству
Як (£) - 2к (Яо + ^) , (16)
1 - Z
где z = max {Л, Z}, Z = z2, z = max {zd, A}.
Полагая t = T с учетом (10), легко убеждаемся, что выполняется (6). Теорема доказана.
Рассмотрим частный случай линейной системы с нарушениями:
Г xfc+i(t + 1) = Aii(r(t)) xfc+i(t) + Ai2(r(t)) yfc(t), (17)
1 yk+i(t) = Ai2(r(t)) Xk+i(t) + A22(r(t)) yfc(t),
где Aj(r(t)), i, j = 1, 2, — матрицы соответствующих размеров, элементы которых могут скачкообразно изменяться в зависимости от нарушений; остальные обозначения соответствуют принятым ранее. Выберем элементы векторной функции Ляпунова V в виде квадратичных форм
Vi(Xk+i(t),r(t)) = xT+i(t) Pi(r(t)) Xk+i(t), V>(yfc(t),r(t)) = yT(t) P2(r(t)) yfc(t),
где Pi(r) и P2(r), r g N, — положительно определенные симметричные матрицы. Тогда, вычисляя оператор dV вдоль траекторий системы (17), получаем, что эта система будет экспоненциально устойчива по профилю повторения в среднем квадратическом, если разрешима система матричных неравенств
P(i) = diag [Pi(i) P2(i)] > 0, AT(i) ^ Hi(j) A(i) - P(i) + Q(i) < 0, i g N, (18)
j=i
где
ВД) = ) Р2(г)], ^(г) = ^т(г) > 0, ¿(г)
Ап(г) А12(г) А21(г) А22(г)
г, 3 е N.
В случае системы с постоянными параметрами неравенства (18) сводятся к 2Б неравенству Ляпунова [22]
"¿11 ¿12 т Р1 0 "¿11 ¿12 Р1 0 0 0
— <
,¿21 ¿22 _ 0 Р2 ^ ¿21 ¿22 _ 0 Р2 0 0
разрешимость которого относительно матрицы Р = ё1а§ [Р1 Р2] > 0 гарантирует устойчивость вдоль повторений, т.е. известные ранее результаты линейной теории [22] вытекают из доказанной теоремы как частный случай.
2. Приложение к синтезу управления с итеративным обучением
Принцип управления с итеративным обучением был защищен патентом еще в 1971 году [14], но получил широкую известность только после выхода в свет статьи [7]. В настоящее время теории и приложениям этого принципа посвящено значительное количество работ, о чем свидетельствуют обзорные статьи [9, 15]. Принцип управления с итеративным обучением завоевал широкую популярность благодаря своей простой и понятной логике: в тех случаях, когда процесс управления повторяется многократно, естественно на его текущем повторении использовать информацию с предыдущего повторения с целью повышения точности и других показателей, подобно тому, как все мы на основе собственного опыта совершенствуем выполнение каких-либо действий.
В данном разделе рассматривается линейная система, подверженная информационным нарушениям, которая должна в повторяющемся режиме воспроизводить с требуемой точностью заданную траекторию движения. Чтобы обеспечить эту точность, предполагается применить алгоритм управления с итеративным обучением. Общая концепция управления с итеративным обучением состоит в следующем.
Пусть целое число к обозначает номер итерации (повторения, шага), а ик (£), хк (£) и ук (£) — вектор управления, вектор состояния и выходной вектор соответственно в момент времени £ на к-й итерации. Обозначим уге/(£), £ б [0,Т], желаемый выходной сигнал системы. Тогда ек (£) = уге/ (£) — ук (£) представляет собой ошибку на к-й итерации. Задача состоит в построении такого изменения стратегии управления на текущем шаге управления на основе информации текущего и предшествующего шагов, при которой выходной сигнал системы воспроизводит заданный сигнал уге/(£) с требуемой точностью е > 0, т.е. |ек(£)| < е для всех £ б Т начиная с некоторого к = к*. Необходимым условием разрешимости поставленной задачи является сходимость ошибки воспроизведения заданного сигнала:
Иш К(£)| = 0,
к—>оо
Иш |«к(£) — и^>(£)| = 0. к
(19)
Эти условия являются основой для построения алгоритмов. В рассматриваемом конкретном случае система описывается следующей моделью в пространстве состояний:
x(t + 1) = Ax(t) + Bu(t), y(t) = C (r(t)) x(t), t = 0, 1, 2,..., (20)
где x £ Rn — вектор состояния; u £ Rm — входной вектор управления; y £ Rp — выходной вектор; r(t) — однородный марковский процесс, который моделирует возможные нарушения. Этот процесс имеет конечное число состояний N = {1, ..., v}, соответствующих числу возможных нарушений с вероятностями перехода, определяемыми соотношениями (2).
Предположим, что к системе (20) применен закон управления с итеративным обучением. Тогда динамика системы (20) опишется следующим образом:
Xfc(t +1) = Axfc(t) + Bufc(t), yfc(t) = C(r(t) Xk(t) (21)
с граничными условиями
uo(t) = 0, t £ [0, T]; xfc(0) = Xo, k = 0, 1, ... (22)
Следуя концепции итеративного обучения управление на k-й итерации (повторении) зададим в виде
Ufc+1 (t) = ufc (t) + Aufc+1 (t), (23)
где Auk+1 (t) — корректирующая добавка к управлению на текущем k-м шаге для формирования управления для следующего (k + 1)-го шага.
С учетом стохастического характера системы введем следующее определение сходимости.
Определение 2. Закон управления с итеративным обучением (23) называется сходящимся в среднем квадратическом, если для любых начальных условий x0 £ Rn и любой начальной последовательности {u0(t)} существует ограниченная функция u^(t), такая, что для всех t £ [0, T] E |efc(t)|2 = E |yre/(t) - yfc(t)|2 ^ 0 иЕ |ufc(t) - u^(t)|2 ^ 0 при k ^ ro.
Для выбора параметров алгоритма, обеспечивающих сходимость процесса обучения в условиях указанных информационных нарушений, используем результат теоремы 1. Введем вспомогательную переменную:
Ufc+1 (t) = xfc+i(t) - xfc(t).
Тогда в терминах переменных uk(t) и ek (t) система (20) c законом управления (23) будет представлена как 2D система в стандартной форме линейного дискретного повторяющегося процесса
I Uk+1 (t + 1) = Auk+1 (t) + BAufc+1(t - 1), 1 ek+1(t) = -C(r(t)) Auk+1 (t) + ek(t) - C(r(t)) BAuk+1(t - 1).
Предположим, что измерению доступен вектор z (t) £ вида
z(t) = D(r(t)) x(t), (25)
где D(r), r £ N, — матрица соответствующего размера, имеющая полный ранг.
(24)
В этом случае корректирующую поправку сформируем в виде
Дик+^Н ^\(г) Д^к+1(^ + 1) + ^(г) вк(£ + 1), если г(£) = г.
где Д^к+1(£ + 1) = ^к+1(£) — 2к(г).
Тогда, если (26) гарантирует экспоненциальную устойчивость по профилю повторения (24), то, принимая во внимание определение 2, приходим к выводу, что закон управления с итеративным обучением сходится в среднем квадратическом.
Таким образом (26) может рассматриваться как стабилизирующее управление, которое должно обеспечивать экспоненциальную устойчивость по профилю повторения в среднем квадратическом системы (24). Для нахождения матриц усиления Р1(г),Р2(г), г € М, воспользуемся условиями теоремы 1.
Выберем векторную функцию Ляпунова в виде (7), где
И(ик+1(*),г(*))) = иТ+1(£) Р1(г(£)) ик+1(£), V(вк(£)г(£)) = вТ(£) Р2(г(£)) вк(£).
Стохастический оператор дивергенции v функции (7) в этом случае должен удовлетворять (11). Вычисляя этот оператор вдоль траекторий системы (24), (26), получим следующие достаточные условия экспоненциальной устойчивости по профилю повторения в среднем квадратическом:
Р(г) = ^ [Р1(г) Р2(г)] > 0,
¿Т(г) Е п.ВД^^г) — Р(г) + ^(г) < 0, г е М,
.7 = 1
(27)
где
¿с(г)
¿ + (г)
ВД(г)
— С (г^ — С (г)ВД(г) I — С (г)ВД(г)
д(г) = дт(г) > 0, ВД) = diag [ВД) Р2«].
Обозначая X(г) = Р-1(г) и вводя дополнительные переменные У1(г), У"2(г), ^1(г), как показано ниже, после простых, но громоздких вычислений условия устойчивости можем записать в виде системы линейных матричных неравенств и уравнений относительно этих переменных:
^ц(г) ^12(г) ^1э(г)
<Мг) 0
^Тэ(г)
^зэ(г)
> 0; X(г) > 0, г е М; Х>(г)Х1(г) = ^(г)Х1(г),
(28)
0
где
5*12(2) = [£121(2) ... £12^(г)],
-С (а )Аад) - С а )ВУШ Ш ЗД) - С ШЯВД ) _ , ^ц (г) = ^ [Х1(г) Х^)], £13 = ^ [^(2) Х^)], 522(2) = [Х1(1) Х2(г) Х(2) Х2 (2) ... ) Х^)], 5зз(г) = д-1(2), У1(2) = *\(2) ад), ад) = ^2(2) Х1, Ут(2) = ад) Я(2)
и, таким образом, справедливо следующее утверждение.
Теорема 2. Рассмотрим систему (21) с граничными условиями (22) и законом управления с итеративным обучением (23), (26). Предположим, что линейные матричные неравенства (28), 2 € N разрешимы. Тогда закон управления с итеративным обучением (23), (26) сходится и ад) = ад)£-1(2), ^2(2) = ад)Х2-1(2), 2 € N.
Замечание 1. Если Д (г) = 0, то корректирующая поправка к управлению будет иметь вид Дмк+1(£) = Р2(2)вк(¿), если г(£) = 2. В этом случае Р1(2) = 0, а матрица Р2(2) находится из решения линейных матричных неравенств (28), которые, очевидно, в этом случае будут иметь более простую форму.
(2)
П
2.1 Пример
На основе полученных теоретических результатов был проведен синтез управления с итеративным обучением в рамках упрощенной модели динамики вертикального канала портального робота (рис. 1). Данные о параметрах робота были предоставлены лабораторией университета Саутгемптона профессором Эриком Роджерсом [22, 23]. На рис. 2 представлен желаемый выходной сигнал вдоль вертикальной оси Ог с периодом дискретизации 0.01 с.
Рис. 1. Портальный робот Рис. 2. Желаемый выходной сигнал
Динамика портального робота описывается системой (20) со следующими матрицами параметров:
-0, 002961 1 0 0
А = -0,0008363 -0, 002961 0,03035 , в = 0
0 0 1 0, 01563
С = [0, 0003718 0, 007077 0, 02335].
Рассмотрим случай, когда возможны два режима работы рассматриваемой системы. В первом режиме ^(1) = I, во втором Д(2) = 0.
Нарушения моделируются однородной марковской цепью г(£) с двумя состояниями, соответствующими двум возможным режимам. Условная вероятность того, что система будет находиться в первом режиме пц = 0.95, во втором п22 = 0.05. С физической точки зрения это означает, что информация о переменных состояния в течение короткого периода времени может быть недоступна и на этот период в системе сохраняется только обратная связь по ошибке.
Далее, пользуясь результатами теоремы 2 и замечания 1, получим следующие матрицы усиления стабилизирующего управления для первого и второго режимов работы:
¿1(1) = [-0,0096 - 0,2814 -51,9], ¿2(1) = [922,9],
(29)
¿1(2) = [0 0 0], ¿2(2) = [7,38].
Ниже представлены результаты моделирования. В случае, когда нарушения отсутствуют, ошибка сходится к нулю монотонно и скорость ее сходимости достаточно высока (рис. 3, б). В случае возникновения информационного нарушения (пропадание сигнала) монотонность убывания ошибки нарушается (рис. 4, б). Подобного рода скачки крайне нежелательны для
Выходной сигнал *
Ошибка обучения
Рис. 3. Случай без нарушений: а — выходной сигнал, б — ошибка обучения (боковая проекция)
а б
Рис. 4. Ошибка обучения (боковая проекция) в случае возникновения нарушения на 10-м шаге: а — с переключением управления; б — без переключения управления
задач итеративного обучения. Амплитуду скачка можно уменьшить, если в момент возникновения нарушения совершить переключение алгоритма управления в соответствии с (29). На рис. 4, а продемонстрирован случай, когда в момент возникновения нарушения на 10-м шаге было совершено переключение, на рис. 4, б случай, когда переключения управления произведено не было.
Далее, для получения более общего представления о поведении системы в рассматриваемых условиях, промоделированы случаи возникновения нарушения на 5-м и 15-м шагах. В случае, если нарушение произошло в самом начале обучения на 5-м шаге, монотонность сходимости ошибки обучения существенно нарушится (рис. 5). При этом даже в случае переключения алгоритма управления значительного нарушения монотонности сходимости ошибки избежать не удается, что видно на рис. 6. Если же нарушение произошло в сере-
Рис. 5. Возникновение нарушения на 5-м шаге без переключения управления: а — выходной сигнал; б — ошибка обучения (боковая проекция)
Выходной оигнал
Бремя И' I
аб Рис. 6. Возникновение нарушения на 5-м шаге с переключением управления: а — выходной сигнал; б — ошибка обучения (боковая проекция)
аб Рис. 7. Возникновение нарушения на 15-м шаге с переключением управления: а — выходной сигнал; б — ошибка обучения (боковая проекция)
аб Рис. 8. Возникновение нарушения на 15-м шаге без переключения управления: а — выходной сигнал; б — ошибка обучения (боковая проекция)
дине процесса обучения на 15-м шаге и совершено переключение алгоритма управления, монотонность сходимости ошибки почти не нарушается (рис. 7). Если переключения алгоритма управления не произвести, монотонность по-прежнему будет существенно нарушена (рис. 8).
Заключение
Полученные условия устойчивости по форме близки к классическим результатам H.H. Красовского [4], относящимся к построению функций Ляпунова, удовлетворяющим оценкам, характерным для квадратичных форм, но в классе 2D систем они, не всегда гарантируют экспоненциальный характер сходимости в отличие от случая обычных (1D) систем. Здесь принципиальную роль играют требования, предъявляемые к характеру граничных условий. Использование стохастического дискретного аналога дивергенции вместо полного приращения функции Ляпунова оказалось достаточно эффективным и согласуется с качественным предположением о том, что отрицательность дивергенции, векторного поля, определямого функцией Ляпунова на плоскости, гарантируя отсутствие источников, должна обеспечивать в том или ином смысле устойчивый характер поведения траекторий системы. В данном случае конкретный тип устойчивости определяется принятым определением. Следует отметить, что идея использования понятия дивергенции в задачах устойчивости была известна ранее, но использовалась либо для нелинейных 1D систем в совершенно другом аспекте [3, 20], либо для линейных 2D систем в рамках поведенческих моделей Роессера [16].
Полученные теоретические результаты были применены к задаче синтеза управления с итеративным обучением. Проведено моделирование рассматриваемой системы, которое показало, что в случае отсутствия нарушений ошибка обучения системы сходится к нулю монотонно, но при наличии нарушений и консервативного закона управления с постоянной обратной связью, ошибка сходится немонотонно. Поскольку немонотонный характер сходимости в задачах итеративного обучения крайне нежелателен, предлагается использование переключающихся алгоритмов управления, которые существенно снижают отклонения от монотонности в процессе сходимости ошибки при наличии информационных нарушений. Результаты моделирования оказались также вполне закономерными и отвечающими принципам управления с итеративным обучением — чем раньше в процессе обучения происходит нарушение, тем больше процесс изменения ошибки обучения во времени отклоняется от монотонного. Таким образом, моделирование подтвердило эффективность предложенного подхода.
Список литературы
1. Емельянова Ю.П. Алгоритмы управления с итеративным обучением системами с неопределенными параметрами и возможными нарушениями // XIV конференция молодых
ученых «Навигация и управление движением»: Материалы докладов. СПб.: ГНЦ РФ ОАО «Концерн «ЦНИИ «Электроприбор», 2012. С. 484-490.
2. Емельянова Ю.П. Построение алгоритмов сетевого управления с итеративным обучением на основе моделей с двумерной динамикой // XV конференция молодых ученых «Навигация и управление движением»: Материалы докладов. СПб.: ГНЦ РФ ОАО «Концерн «ЦНИИ «Электроприбор», 2013. С. 357-363.
3. Жуков В.П. Полевые методы в исследовании нелинейных динамических систем. М.: Наука, 1992. 140 с.
4. Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: ГИФМЛ, 1959. 211 с.
5. Матросов В.М. Метод векторных функций Ляпунова: Анализ динамических свойств нелинейных систем. М.: Физматлит, 2001. 381 с.
6. Пакшин П.В., Галковский К., Роджерс Э. Линейно-квадратичная параметризация стабилизирующих управлений в дискретных системах с двумерной динамикой // Автоматика и телемеханика. 2011. № 11. С. 157-173.
7. Arimoto S., Kawamura S., Miyazaki F. Bettering operation of robots by learning // J. Robot. Syst. 1984. Vol. 1. P. 123-140.
8. Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. Philadelphia: SIAM, 1994. 193 p.
9. Bristow D.A., Tharayil M., Alleyne A.G. A survey of iterative learning control // IEEE Control Systems. 2006. Vol. 26, no. 3. P. 96-114. DOI: 10.1109/MCS.2006.1636313
10. Emelinova J., Pakshin P., Galkowski K., Rogers E. Stability and Stabilization of Nonlinear 2D Markovian Jump Systems with Applications // Proceedings of the 11th IF AC International Workshop on Adaptation and Learning in Control and Signal Processing (ALC0SP'2013), Caen, France, 03-05 July, 2013. P. 695-700.
11. Emelianova J., Pakshin P., Galkowski K., Rogers E. Stabilization and H^ Control of nonlinear 2D Systems // Proceedings of the 8th Int. Workshop on Multidimensional Systems (nDS'13), Erlangen, Germany, Sep. 9-11, 2013. VDEVerlag. Berlin, 2013. P. 1-6.
12. Fornasini E., Marchesini G. Stability analysis of 2-D systems // IEEE Transactions on Circuits and Systems. 1980. Vol. 27. P. 1210-1217. DOI: 10.1109/TCS.1980.1084769
13. Fornasini E., Marchesini G. Doubly indexed dynamical systems: state models and structural properties //Mathematical Systems Theory. 1978. Vol. 12. P. 59-72.
14. Garden M. Learning control of actuators in control systems: patent 3555252 US. 1971.
15. Hyo-Sung A., Chen Y.Q., Moore K.L. Iterative learning control: brief survey and categorization // IEEE Trans. on Systems, Man, and Cybernetics, Part C: Applications and Reviews. 2007. Vol.37, iss.6. P. 1099-1121. DOI: 10.1109/TSMCC.2007.905759
16. KojimaN., RapisardaP., TakabaK. Lyapunov Stability Analysis of Higher-Order 2-D Systems // Multidimensional Systems and Signal Processing. 2011. Vol.22, iss.4. P. 287-302. DOI: 10.1007/s11045-010-0124-1
17. Kurek J.E. Stability of nonlinear time-varying digital 2-D Fornasini-Marchesini system // Multidimensional Systems and Signal Processing. 2014. Vol.25, iss. 1. P. 235-244. DOI: 10.1007/s11045-012-0193-4
18. Liu D. Lyapunov Stability of Two-Dimensional Digital Filters with Overflow Nonlinearities // IEEE Trans. on Circuits and Systems I: Fundamental Theory and Applications. 1998. Vol. 45, iss. 5. P. 574-577.
19. Pakshin P., Emelianova J., Galkowski K., Rogers E. Iterative Learning Control under Parameter Uncertainty and Failures //2012 IEEE International Symposium on Intelligent Control (ISIC), October 3-5, 2012. P. 1249-1254. DOI: 10.1109/ISIC.2012.6398268
20. Rantzer A. A dual to Lyapunov's stability theorem // Systems & Control Letters. 2001. Vol. 42. P. 161-168.
21. Roesser R.P. A discrete state-space model for linear image processing // IEEE Transactions on Automatic Control. 1975. Vol. AC-20, iss. 1. P. 1-10. DOI: 10.1109/TAC.1975.1100844
22. Rogers E., Galkowski K., Owens D.H. Control Systems Theory and Applications for Linear Repetitive Processes. Springer Berlin Heidelberg, 2007. 466 p. (Ser. Lecture Notes in Control and Information Sciences; vol. 349.). DOI: 10.1007/978-3-540-71537-5
23. Rogers E., Owens D.H. Stability Analysis for Linear Repetitive Processes. Springer Berlin Heidelberg, 1992. 201 p. (Ser. Lecture Notes in Control and Information Sciences; vol. 175.). DOI: 10.1007/BFb0007165
24. Yeganefar Nima, Yeganefar Nader, Ghamgui M., Moulay A. Lyapunov Theory for 2D Nonlinear Roesser Models: Application to Asymptotic and Exponential Stability // IEEE Transactions on Automatic Control. 2013. Vol.58, iss. 5. P. 1299-1304. DOI: 10.1109/TAC.2012.2220012
SCIENTIFIC PERIODICAL OF THE BAUMAN MSTU
SCIENCE and EDUCATION
EL № FS77 - 48211. №0421200025. ISSN 1994-0408
electronic scientific and technical journal
Stability of nonlinear repetitive processes
with possible failures
# 04, April 2014
DOI: 10.7463/0414.0704664
Emelianova J. P.
Arzamas Polytechnical Institute of R.E. Alekseev Nizhny Novgorod State Technical University
105005, Moscow, Russian Federation EmelianovaJulia@gmail.com
Nonlinear discrete-time repetitive processes with Markovian jumps are considered. For such processes stability analysis is developed and this result is then applied to iterative learning control design.
Stability of nonlinear repetitive processes has not been developed previously in the current literature. This paper proposes and characterizes a stability theory for nonlinear repetitive processes that includes stability along the pass of linear examples as a special case.
For considered systems the second Lyapunov method cannot be used. Because repetitive processes belong to a class of 2D systems in which state variables are depend on two independent variables and cannot be solved using all first differences of state variables. It is not allow us to find a first difference of Lyapunov function along the trajectory of the system without finding solution of a system of equations that fully excludes a main advantage of second Lyapunov method. At the same time the use of vector Lyapunov functions and discrete-time counterpart of the divergence operator of this function along the trajectories of system instead of first difference allow us to obtain constructive results.
In this paper based on vector Lyapunov function approach sufficient conditions for pass profile exponential stability are obtained which in the linear case are obtained in terms of linear matrix inequalities and in the linear case without failures these conditions are reduced to known conditions of stability along the pass
A major application area where repetitive process stability theory can be used is Iterative Learning Control (ILC). The idea of ILC is following.
If the system repeats the same finite duration operation over and over again, it is reasonable to use the input and output variables on the current pass for improving accuracy of performance of operations on the next pass.
The new theoretical stability results are applied to ILC design under possible information failures. The ILC law convergence reduces to pass profile stability analysis. Computation and
modeling of the system have been carried out using a simplified model of a vertical axis dynamics of a gantry robot.
Publications with keywords: stability, 2D systems, vector Lyapunov functions, iterative learning control
References
1. Emel'yanova Yu.P. [Iterative learning control algorithms for systems with uncertain parameter uncertainty and possible failures]. 14 konferentsiya molodykh uchenykh "Navigatsiya i upravlenie dvizheniem": Materialy dokladov [Proc. of the 14th Young Scientist Conference "Navigation and Motion Control"]. St. Petersburg, Publ. of the State Research Center of the RF — Concern CSRI Elektropribor, JSC, 2012, pp. 484-490. (in Russian).
2. Emel'yanova Yu.P. [Iterative learning networked control law design based on 2D system]. 15 konferentsiya molodykh uchenykh "Navigatsiya i upravlenie dvizheniem": Materialy dokladov [Proc. of the 15th Young Scientist Conference "Navigation and Motion Control"]. St. Petersburg, Publ. of the State Research Center of the RF — Concern CSRI Elektropribor, JSC, 2013, pp. 357-363. (in Russian).
3. Zhukov V.P. Polevye metody v issledovanii nelineynykh dinamicheskikh system [Field methods for nonlinear dynamical systems investigations]. Moscow, Nauka Publ., 1992. 140 p. (in Russian).
4. Krasovskii N.N. Nekotorye zadachi teorii ustoychivosti dvizheniya. Moscow, GIFML Publ., 1959. 211 p. (English translation: Krasovskii N.N. Stability of motion; applications of Lyapunov 's second method to differential systems and equations with delay. Stanford University Press, Stanford, CA, 1963.).
5. Matrosov V.M. Metod vektornykh funktsiy Lyapunova: Analiz dinamicheskikh svoystv ne-lineynykh system [Vector Lyapunov Functions Method: Nonlinear Analysis of Dynamical Properties]. Moscow, FizmatlitPubl., 2001. 381 p. (in Russian).
6. Pakshin P.V., Galkovski K., Rogers E. [Linear-quadratic parametrization of stabilizing controls in discrete-time 2D systems]. Avtomatika i telemekhanika, 2011, no. 11, pp. 157-173. (English translation: Automation and Remote Control, 2011, vol.72, iss. 11, pp. 2364-2378. DOI: 10.1134/S0005117911110117).
7. Arimoto S., Kawamura S., Miyazaki F. Bettering operation of robots by learning. J. Robot. Syst., 1984, vol. 1, pp. 123-140.
8. Boyd S., El Ghaoui L., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. Philadelphia, SIAM, 1994. 193 p.
9. Bristow D.A., Tharayil M., Alleyne A. A survey of iterative learning control. IEEE Control Systems, 2006, vol. 26, no. 3, pp. 96-114. DOI: 10.1109/MCS.2006.1636313
10. Emelinova J., Pakshin P., Galkowski K., Rogers E. Stability and Stabilization of Nonlinear 2D Markovian Jump Systems with Applications. Proceedings of the 11th IFAC International
Workshop on Adaptation and Learning in Control and Signal Processing (ALCOSP'2013), Caen, France, 03-05 July, 2013, pp. 695-700.
11. Emelianova J., Pakshin P., Galkowski K., Rogers E. Stabilization and H^ Control of nonlinear 2D Systems. Proceedings of the 8th Int. Workshop on Multidimensional Systems (nDS'13), Erlangen, Germany, Sep. 9-11, 2013, VDEVerlag. Berlin, 2013, pp. 1-6.
12. Fornasini E., Marchesini G. Stability analysis of 2-D systems. IEEE Transactions on Circuits and Systems, 1980, vol. 27, pp. 1210-1217. DOI: 10.1109/TCS.1980.1084769
13. Fornasini E., Marchesini G. Doubly indexed dynamical systems: state models and structural properties. Mathematical Systems Theory, 1978, vol. 12, pp. 59-72.
14. Garden M. Learning control of actuators in control systems. Patent US, no. 3555252, 1971.
15. Hyo-Sung A., Chen Y.Q., Moore K.L. Iterative learning control: brief survey and categorization. IEEE Trans. on Systems, Man, and Cybernetics, Part C: Applications and Reviews, 2007, vol.37, iss. 6, pp. 1099-1121. DOI: 10.1109/TSMCC.2007.905759
16. KojimaN., RapisardaP., TakabaK. Lyapunov Stability Analysis of Higher-Order 2-D Systems. Multidimensional Systems and Signal Processing, 2011, vol.22, iss. 4, pp. 287-302. DOI: 10.1007/s11045-010-0124-1
17. Kurek J.E. Stability of nonlinear time-varying digital 2-D Fornasini-Marchesini system. Multidimensional Systems and Signal Processing, 2014, vol.25, iss. 1, pp. 235-244. DOI: 10.1007/s11045-012-0193-4
18. Liu D. Lyapunov Stability of Two-Dimensional Digital Filters with Overflow Nonlinearities. IEEE Trans. on Circuits and Systems 1: Fundamental Theory and Applications, 1998, vol. 45, iss. 5, pp. 574-577.
19. Pakshin P., Emelianova J., Galkowski K., Rogers E. Iterative Learning Control under Parameter Uncertainty and Failures. 2012 IEEE International Symposium on Intelligent Control (ISIC), October 3-5, 2012, pp. 1249-1254. DOI: 10.1109/ISIC.2012.6398268
20. Rantzer A. A dual to Lyapunov's stability theorem. Systems and Control Letters, 2001, vol. 42, pp. 161-168.
21. Roesser R.P. A discrete state-space model for linear image processing. IEEE Transactions on Automatic Control, 1975, vol. AC-20, iss. 1, pp. 1-10. DOI: 10.1109/TAC.1975.1100844
22. Rogers E., Galkowski K., Owens D.H. Control Systems Theory and Applications for Linear Repetitive Processes. Springer Berlin Heidelberg, 2007. 466 p. (Ser. Lecture Notes in Control and Information Sciences; vol. 349.). DOI: 10.1007/978-3-540-71537-5
23. Rogers E., Owens D.H. Stability Analysis for Linear Repetitive Processes. Springer Berlin Heidelberg, 1992. 201 p. (Ser. Lecture Notes in Control and Information Sciences; vol. 175.). DOI: 10.1007/BFb0007165
24. Yeganefar Nima, Yeganefar Nader, Ghamgui M., Moulay A. Lyapunov Theory for 2-D Nonlinear Roesser Models: Application to Asymptotic and Exponential Stability. IEEE Transactions on Automatic Control, 2013, vol. 58, iss. 5, pp. 1299-1304. DOI: 10.1109/TAC.2012.2220012