Научная статья на тему 'Экспоненциальная устойчивость нелинейных дискретных 2D-систем'

Экспоненциальная устойчивость нелинейных дискретных 2D-систем Текст научной статьи по специальности «Математика»

CC BY
413
99
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНЫЕ СИСТЕМЫ / ДИСКРЕТНЫЕ СИСТЕМЫ / 2D-СИСТЕМЫ / СИСТЕМЫ ФОРНАЗИНИ–МАРКЕЗИНИ / ПОВТОРЯЮЩИЕСЯ ПРОЦЕССЫ / УСТОЙЧИВОСТЬ / ВЕКТОРНАЯ ФУНКЦИЯ ЛЯПУНОВА / ИНФОРМАЦИОННЫЕ НАРУШЕНИЯ / УПРАВЛЕНИЕ С ИТЕРАТИВНЫМ ОБУЧЕНИЕМ / NONLINEAR SYSTEMS / DISCRETE SYSTEMS / 2D-SYSTEMS / FORNASINI-MARCHESINI MODEL / REPETITIVE PROCESS / STABILITY / VECTOR LYAPUNOV FUNCTION / INFORMATION FAILURES / ITERATIVE LEARNING CONTROL

Аннотация научной статьи по математике, автор научной работы — Емельянова Юлия Павловна

Работа посвящена развитию метода векторных функций Ляпунова как единого подхода к анализу различных видов устойчивости нелинейных дискретных 2D-систем. Получены достаточные условия экспоненциальной устойчивости нелинейных дискретных 2D-систем, описываемых моделью Форназини–Маркезини, и достаточные условия экспоненциальной устойчивости по профилю повторения для нелинейных 2D-систем в форме повторяющегося процесса. Результаты обобщаются на случай нелинейных повторяющихся процессов с возможными нарушениями, моделируемыми марковской цепью с конечным числом состояний. В линейном случае эти условия выражаются в терминах линейных матричных неравенств. Приводится пример синтеза управления с итеративным обучением в условиях информационных нарушений для простейшей модели динамики портального робота.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Exponential stability of nonlinear discrete 2d systems

The paper develops the method of vector Lyapunov function as a unified approach to stability analysis of nonlinear discrete-time 2D systems. We derive sufficient conditions of exponential stability for nonlinear Fornasini-Marchesini systems and sufficient conditions of pass profile exponential stability for nonlinear repetitive processes. These results are extended to the nonlinear repetitive processes with random failures modeled by Markov chain with finite set of states. In the linear case these conditions are expressed in the form of linear matrix inequalities. Finally, we describe an application to iterative learning control design for the simplest model of gantry robot under information failures.

Текст научной работы на тему «Экспоненциальная устойчивость нелинейных дискретных 2D-систем»

УДК 62.50 ББК В161.84я43

ЭКСПОНЕНЦИАЛЬНАЯ УСТОЙЧИВОСТЬ НЕЛИНЕЙНЫХ ДИСКРЕТНЫХ 2D-СИСТЕМ1

Емельянова Ю. П.2,

(Арзамасский политехнический институт Нижегородского государственного технического университета им. Р.Е. Алексеева, Арзамас)

Работа посвящена развитию метода векторных функций Ляпунова как единого подхода к анализу различных видов устойчивости нелинейных дискретных 2Б-систем. Получены достаточные условия экспоненциальной устойчивости нелинейных дискретных 2Б-систем, описываемых моделью Форназини-Маркезини, и достаточные условия экспоненциальной устойчивости по профилю повторения для нелинейных 2Б-систем в форме повторяющегося процесса. Результаты обобщаются на случай нелинейных повторяющихся процессов с возможными нарушениями, моделируемыми марковской цепью с конечным числом состояний. В линейном случае эти условия выражаются в терминах линейных матричных неравенств. Приводится пример синтеза управления с итеративным обучением в условиях информационных нарушений для простейшей модели динамики портального робота.

Ключевые слова: нелинейные системы, дискретные системы, системы, системы Форназини-Маркезини, повторяющиеся процессы, устойчивость, векторная функция Ляпунова, информационные нарушения, управление с итеративным обучением.

1 Работа выполнена при финансовой поддержке РФФИ (проект № 13-08-01092_а).

Автор выражает благодарность проф. П.В. Пакшину, проф. К. Галков-скому и проф. Э. Роджерсу за ценное обсуждение содержания статьи.

2Юлия Павловна Емельянова, аспирантка, (607227, г. Арзамас, ул. Калинина, д.19, АПИ НГТУим. Р.Е. Алексеева, кафедра прикладной математики, [email protected]). 18

Введение

В середине 70-х годов прошлого века в связи с задачами обработки изображений была предложена дискретная модель [24], в которой в качестве независимых переменных вместо времени рассматривались две пространственные координаты - вертикальная и горизонтальная. С этими координатами связывались векторы, представляющие информацию об изображении в вертикальном и горизонтальном направлениях соответственно, и процесс обработки изображения рассматривался как динамический процесс изменения этих векторов в зависимости от вертикальной и горизонтальной координат. Эта модель вызвала широкий теоретический и прикладной интерес и получила название модели Роессера по имени автора [24]. Она положила начало исследованию нового класса динамических систем, в которых независимая переменная является векторной, в отличие от общепринятого скалярного времени. Такие системы получили название пЭ-систем, где п - размерность вектора независимых переменных; используется также термин «многомерные системы», который менее удачен в связи с тем, что так ещё называют обычные системы с векторными входными и выходными переменными. Другой класс линейных дискретных 2Э-систем составляют системы Форназини-Маркезини [13,14], которые появились в задачах исследования двумерных цифровых фильтров, в этих системах вектор состояния не делится на вертикальную и горизонтальную компоненты, как в системах Роессера.

Значительный всплеск интереса к 2Э-системам возник после появления работы [8], где с целью повышения точности выполнения операций роботами были предложены метод и алгоритмы управления с итеративным обучением. Здесь следует отметить, что сама идея управления с итеративным обучением появилась раньше и была защищена патентом США [15], далее появилась работа [27], которая была опубликована на японском языке. Эти работы в силу их ограниченной доступности не смогли привлечь внимания широкого круга исследователей и не произвели такого

эффекта, как [8]. К настоящему времени, как показывают обзорные статьи [11,18], задаче управления с итеративным обучением посвящено огромное количество работ и интерес к ней не ослабевает.

Управление с итеративным обучением применимо в системах, многократно повторяющих однородные операции, например, портальный робот, перемещающий грузы из одной точки в другую по заданной траектории. Суть такого управления заключается в том, что информация с предыдущего выполнения операции используется на следующем выполнении с целю улучшения точности. В этом случае с одной стороны имеется динамический процесс выполнения отдельной операции, с другой стороны - динамический процесс улучшения выполнения операций от одного повторения к другому. Двумерный характер динамики процессов управления с итеративным обучением быстро был замечен в ряде работ [16,20], что послужило серьезной мотивацией к дальнейшему интенсивному изучению 2D- и nD-систем.

Ещё один широкий класс 2D-систем составляют так называемые повторяющиеся процессы [25,26]. Модели в форме повторяющихся процессов формально отличаются от моделей Роессе-ра тем, что вместо горизонтальной и вертикальной переменной рассматриваются переменные, называемые вектором состояния текущего повторения и вектором профиля повторения. Принципиальное же отличие состоит в том, что вектор профиля повторения всегда задан на конечном промежутке времени. В частности, в связи с этим для данного класса систем понятие устойчивости вводится иначе, чем для систем Роессера и Форназини-Маркезини [26].

Исследование устойчивости и стабилизации 2D-систем в подавляющем большинстве работ проводилось в рамках линейных моделей. Для систем Роессера и Форназини-Маркезини устойчивость понимается как ограниченность выходной переменной при условии ограниченности входной переменной (BIBO stability) [4,5,7,17,23]. Полученные здесь необходимые и достаточные условия устойчивости выражаются в терминах расположения

корней полинома от двух переменных [7], и универсальных конструктивных методов для проверки этих условий не существует. Указанные условия выражаются также в терминах разрешимости частотно-зависимого (или 1D-) уравнения Ляпунова [4], их также не удалось выразить в конструктивной форме. Конструктивные условия можно выразить в терминах разрешимости обычного уравнения (неравенства) Ляпунова в классе блочно-диагональных матриц (ID-уравнение Ляпунова), но эти условия являются лишь достаточными, хотя совпадают с необходимыми в некоторых частных случаях [7]. Другие интересные результаты в этом направлении можно найти в [6,9]. Для линейных повторяющихся процессов в силу их особенностей, указанных выше, вводится понятие устойчивости вдоль повторений (stability along the pass). Достаточно полное и подробное изложение полученных результатов представлено в [3,25,26].

Работы, связанные с изучением устойчивости нелинейных 2D-систем, стали появляться лишь совсем недавно. B [21,22] рассматривались системы Форназини-Маркезини, в [28] - системы Роессера и в [12] - повторяющиеся процессы. Как было отмечено в [12,19], для изучения устойчивости 2D-систем, в силу того, что их модели явно задают лишь частные приращения переменных, естественным является метод векторных функций Ляпунова [2]. Данная работа развивает этот метод для исследования экспоненциальной устойчивости нелинейных систем Форназини-Маркезини и нелинейных повторяющихся процессов. В силу отмеченных особенностей этих систем понятия устойчивости для них определяются по-разному. Для повторяющихся процессов результаты обобщаются для моделей, учитывающих возможные нарушения, описываемых марковской цепью с конечным числом состояний. Указана область возможного применения полученных результатов в задачах управления с итеративным обучением в условиях возможных информационных нарушений и приводится простой численный пример.

1. Экспоненциальная устойчивость нелинейных систем Форназини-Маркезини

Рассмотрим нелинейную дискретную 2Э-систему, описываемую моделью Форназини-Маркезини

(1) = /1(^+1) + /2(жк+м), к, £ = 0,1,...,

где х - п-мерный вектор состояния; /1, /2 - нелинейные векторные функции, удовлетворяющие требованию /1(0) = 0, /2(0) = 0.

Предполагается, что граничные условия хк,о и хо,4 удовлетворяют одному из следующих требований:

1) существуют положительные числа К и Т такие, что

(2) хм < Мк, к < К; хо,4 < М4, £ < Т, () хк, о = 0, к ^ К; хо,4 = 0, £ ^ Т;

2) существуют положительные числа К1, К2 и 0 < £ < 1 такие, что

(3) |хо,412 < к^; |хк,о|2 < К2^к, где | ■ | означает евклидову норму.

Определение 1. Система (1) называется экспоненциально устойчивой, если для любых граничных условий хо,^ и хк,о, удовлетворяющих (2) или (3), существуют положительные постоянные в> 0, 0 < а < 1 такие, что

(4) |хм| < вак+

Согласно этому определению норма вектора состояния, рассматриваемая вдоль прямой к + £ = N стремится к нулю не медленнее некоторой экспоненты.

Рассмотрим векторную функцию Ляпунова:

(5) ТТ(х х ) I" ^1(хк,*+1)

где V! (х) и У2 (х) - положительно определённые скалярные функции, У1(0) = 0, У2(0) = 0, х е Мга

Для этой функции определим оператор V в силу системы (1) следующим образом

(6) VI/0x^+1, Ж*;+М) = У1(ЖА;+М+1) + ^2(Жй+1,4+1)-

- ^1(Жй,4+1) - Р2(Жк+М), Этот оператор является дискретным аналогом дивергенции векторного поля V в декартовых координатах к и Ь.

Задача состоит в нахождении условий экспоненциальной устойчивости системы (1).

Следующая теорема даёт достаточные условия экспоненциальной устойчивости в терминах векторной функции Ляпунова (5).

Теорема 1. Пусть существуют положительные скаляры с1, с2 и сз такие, что функция (5) и её оператор V (6) вдоль траекторий системы (1) удовлетворяют соотношениям

(7) С1 (|жМ+1|2) ^ Vl(xk,t+l) ^ С2(|ж^+1|2),

(8) С1 (|Хй+М|2) ^ V2(Xfc+l,t) ^ С2(|Хй+М|2),

(9) VV(xfc,t+l,xfc+l,t) ^ -сз(1x^+1^ + ^+м|2) Тогда система (1) экспоненциально устойчива.

Доказательство. Из неравенств (7), (8), (9) получим

(10) V! ^+1^+1) + V2(xfc+l,t+l) ^ АУ^^) + где А = 1 - е (0,1).

Изменяя в этом неравенстве к от 0 до N и Ь от N до 0 и учитывая, что к + Ь = N, имеем:

^^^+1) + V2(Xl,N+1) ^ АУ^о,.+1) + ^^^^),

(X2,N) + V2(X2,W) ^ АУ^,.) + -1),

У^з,.-1) + V2(xз,w-1) ^ АУ^,.-1) + V2(Xз,N-2), VI-2) + Уг^,.-2) ^ АУ^з,.-1) + У2-2),

У^.^) + V2(XW,2) ^ АУ^.-1,2) + Уг^д),

Складывая эти неравенства между собой, учитывая очевидные равенства

^1(жо,м+2) + ^2(жо,м+2) = ^1(жо,м+2) + ^2 (жо,м+2),

^1(жМ+2,о) + ^>(жМ+2,о) = V (жМ+2,о) + Ыж^+2,о) и добавляя их к обеим частям, получим

N+2

)+ ^

,N+2-j) ^

j=0

N+1

j,N+1-j ) + +1-j ) +

j=0

+ Жжо^+2) + V2(жо,N+2) +

+ +2,о) + V2(ЖN+2,о )]

или

N+1

(11) £ Ыж

j,N+1 —

) + V2(Жj

,N+1—') ^

^=о

N

j,N-j ) + -j ) +

^=о

+ Жжо^+1) + Ыжо^+1) +

+ ^^+1,о) + Ыж^1,о)].

Обозначая V (ж) = У1(ж) + У"2 (ж) и мажорируя очевидным образом правую часть (11), перепишем (11) в виде

N+1 N

£ V (ж

+ 1 —

) < (V(ж

j,N-j ) + V (ж0,N +1) + V (жN +1,о)).

^=о ^=о

Решая это неравенство относительно переменной

з =

Е*=о[у(з-з)], полУчим

n

(12) Е V(з-з) < \пУ(хо,о)+ 3=о

N -1

+ Е (Д3 V(^-з) + V(зд-3,о)). 3=о

Рассмотрим первое слагаемое под знаком суммы. С учётом граничных условий получим

N-1 N-1

(13) Е Д3 V-з) < С2 Е К1ZN-3. 3=о 3=о

Определим ( = л/Л, тогда N-1 N-1

(14) С2 Е Л3K1ZN-з = С2К1 Е (СС)зzN-з =

з=о з=о

N -1

= С2К1 Е с3с3^-з.

з=о

Учитывая, что |г| < 1, и выбирая г = шах{(", г}, имеем N-1 N-1

(15) С2К1 Е (зСзzN-з < С2К1 Е (згзzN-з =

з=о з=о

N-1

= С2К1^ Е (з = ^zN = з=о ^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где в = т-" > 0, а = г, к + £ = N. Таким образом, система экспоненциально устойчива.

Для граничных условий более общего вида справедливо следующее утверждение.

Теорема 2. Если граничные условия удовлетворяют неравенству

2

(16) Е[|хоз|2 + Ы2] <

з=о

и выполняются соотношения (7)—(9), то

(17) lim |xM| = 0.

k+t^<ro

Доказательство. Суммируя неравенства (12) по N и мажорируя правую часть, получим

M N

(18) ЕЕV(xj,N-j) <

n=0j=0

"M -1

e V(xo,N) + v(xn,o) + V(xo,o)

N=0

TO

< Е

В силу (16), (7), (8)°

M -1

12

e(V(x°,N) + V(xn,°)) ^ C2 e (|x°,N|2 + |XN,o|2) < TO. j=0 N=o

Тогда согласно (16) и (18)

NN

Е |Xj,N-j |2 < f Е V(Xj,N-j) ^ 0

j=o 1 j=o

при N ^ то.

Таким образом, правая часть неравенства (18) ограничена при M ^ то и ряд в левой части неравенства (18) сходится при

N ^ то:

N

Е V(xjN-j) ^ 0, N ^ то.

j=o

Следовательно,

(19) lim |xM| = 0,

k+t^TO

что и требовалось доказать.

2. Экспоненциальная устойчивость нелинейных повторяющихся процессов

Рассмотрим нелинейный повторяющийся процесс, описываемый следующей моделью в пространстве состояний

Хк+1 + 1) = Л(Хк+1(Ь),Ук (Ь)),

(20) Ук+1 = /2(Жк+1(*),Ук (Ь)),

0 ^ Ь < Т, к = 0,1,2,...,

где к - номер повторения; Ь - дискретное время на к-м повторении; Хк (Ь) £ - вектор состояния текущего повторения; ук (Ь) £ МПу - вектор профиля повторения; /1 и /2 - нелинейные функции такие, что /1(0, 0, 0) = 0, /2(0, 0, 0) = 0.

Граничные условия предполагаются заданными в виде последовательности начальных значений вектора состояния текущего повторения и начального профиля повторения:

Хк+1(0) = ^к+1, к ^ 0,

(21) Уо(Ь) = /(Ь), 0 < Ь < Т, уо(Ь) = 0, Ь > Т,

где йк+1 и / (Ь) - известные векторы размерности пх х 1 и пу х 1 соответственно.

Предположим, что граничные условия йк+1 и / (Ь) удовлетворяют неравенствам

(22) |/(Ь)|2 < М,, Мк+1|2 < к^1, к = 0,1,...,

где Mf > 0, к4 - некоторые конечные действительные числа и 0 < < 1. Число 24 определяет скорость сходимости последовательности начальных значений вектора состояния.

В теории линейных повторяющихся процессов эффективно используется понятие устойчивости вдоль повторений [25]. Это понятие основано на свойствах линейного оператора в банаховом

пространстве и поэтому не может быть непосредственно перенесено на нелинейные системы. В связи с этим введем новое понятие устойчивости, которое, как будет показано далее, в линейном случае гарантирует устойчивость вдоль повторений.

Определим норму вектора профиля повторения как

Е |Ук (£)|2

т

(23) ||ук|| = А

и введем следующее понятие устойчивости

Определение 2. Система (20) называется экспоненциально устойчивой по профилю повторения, если для любых граничных условий, удовлетворяющих (22),

(24) ||ук|| < кхк, 0 <х< 1,

где к зависит от длины профиля повторения Т и х зависит от

Чтобы найти условия экспоненциальной устойчивости по профилю повторения системы (20), вновь используем метод векторных функций Ляпунова.

Рассмотрим векторную функцию

^(хк+1 (£)) ^2(ук (£))

где У1(х) > 0, х = 0, У2(у) > 0, у = 0, У1(0) = 0, Р2(0) = 0.

Для этой функции определим оператор дивергенции в силу системы (20) следующим образом:

(26) РУ(хк+1(£),ук(£)) = Д*У1(хк+1(£)) + Ак^2(ук(£)),

где А4У1(хк+1(£)) = Ыхк+1(*+1))-У1(хк+1 (£) и Ак^(ук(£)) = ^2(Ук+1(£)) - ^2(Ук (£).

Теорема 3. Рассмотрим систему (20) с граничными условиями, удовлетворяющими (22), и предположим, что существуют положительные константы с1, с2, с3 такие, что функция (25)

(25) У (хк+1(£),Ук (£)) =

и её оператор V (26) вдоль траекторий системы (20) удовлетворяют неравенствам

(27) С11x^+1 (Ь)|2 < У^к+^Ь)) < C2|xfc+l(í)|2,

(28) С1 |ук(Ь)|2) < У2(Ук(Ь)) < С2^(Ь)|2,

(29) VV^+1^),^(Ь)) < -Сз(^+1(Ь)|2 + |ук(Ь)|2).

Тогда система (20) экспоненциально устойчива по профилю повторения.

Доказательство. Из (27), (28) и (29) следует, что

(30) У^+^Ь + 1) < АУ^!(Ь)) + АУ>(ук(Ь)) - У2(Ук+1 (Ь)), где А = 1 - е (0,1).

Решая неравенство (30) относительно У!^^! (Ь)), получим

t-l

(31) ^+1^)) < ^+1(0)^ + ^[АУ>(ук(р))-

р=0

- V2(yk+l(p))]Аt-p-1.

Обозначим

t

Нк (Ь) = £ У2(ук (Ь))А^Р. р=0

Тогда из (31), (27) и (22) следует, что

(32) Нк+1(Ь) < АНк(Ь) + А^У^^О)) <

< АНк (Ь) + Атс2К^+!.

Решая неравенство (32), получим

к

(33) Нк(Ь) < АкНо(Ь) + А^к* £ г^Ак-\

г=1

Мажорируя правую часть (33), получим

(34) Нк (Ь) < гк (Яо + ,

где г = шах{А, (}, £ = г 1, г = тах{г^, А}.

Обозначая Ь = Т и с учетом (28) легко убеждаемся, что выполняется (24). Теорема доказана.

3. Экспоненциальная устойчивость нелинейных повторяющихся процессов с возможными нарушениями

В этом разделе результаты обобщаются на случай нелинейных повторяющихся процессов с возможными нарушениями.

Нарушения моделируются однородной марковской цепью с конечным числом состояний, и нелинейный повторяющийся процесс описывается следующей моделью:

(35) жй+1(£ + 1) = ^1(жй+1(^),Уй

Ук+1 (£) = ^2(жк+1(£),Ук (¿),г(£)),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где г(£) (£ ^ 0) - однородная марковская цепь с конечным числом состояний N = {1,..., V} и вероятностями перехода

(36) Р(г(£ + 1) = з | г(£) = г) = п

У >

где <1 и <2 - нелинейные функции такие, что для любых г € N <1(0, 0, г) = 0, <£>2(0, 0, г) = 0.

Остальные обозначения соответствуют принятым в разделе 2. Граничные условия предполагаются заданными в виде последовательности начальных значений вектора состояний и начального профиля повторения (21) и удовлетворяют требованиям (22). Выбор модели нарушений (36) мотивирован тем фактом, что переменная £ - время на текущем повторении, а переменная к - номер повторения, и естественно считать, что процесс нарушений представляет собой стационарный марковский процесс, развивающийся во времени. Определим норму вектора профиля повторения как

(37)

Е =

\

Т

Е £ Ь(£)|2,

4=о

где Е - оператор математического ожидания. Введем следующее определение экспоненциальной устойчивости по профилю повторения в среднем квадратическом повторяющегося процесса (35).

Определение 3. Система (35) называется экспоненциально устойчивой по профилю повторения в среднем квадратическом, если для любых граничных условий (21), удовлетворяющих (22), существуют постоянные к > 0 и 0 <2< 1 такие, что (38) ||Ук||е < К2к.

Для получения условий экспоненциальной устойчивости по профилю повторения в среднем квадратическом повторяющего процесса (35), рассмотрим следующую векторную функцию Ляпунова

У1(хк+1 (Ь),г(Ь)) ^2(ук (Ь),г(Ь))

где У1(х,г) > 0, х = 0, Р2(у,г) > 0, у = 0, У1(0,г) = 0, ^2(0, г) = 0.

Введем операторы V и Рк вдоль траекторий системы (35):

АУ(С, п, г) = Е[У1(хк+1(Ь + 1), г(Ь + 1) - У1(хк+1(Ь), г(Ь)) |

Хк+1(Ь) = С, Ук(Ь) = Пк, г(Ь) = г],

(39) V (хк+1(Ь),Ук (Ь),г(Ь)) =

РкУ(С, П, г) = Е[У2(Ук+1(Ь), г(Ь)) - У2(пк, г) |

хк+1(Ь) = Ск+1,Ук (Ь) = Пк ,г(Ь) = г]

и определим оператор V как стохастический аналог оператора дивергенции раздела 2:

(40) (С, П, г) = (С, П, г) + РкV(С, п, г).

Справедливо следующее утверждение. Теорема 4. Рассмотрим нелинейный повторяющийся процесс (35), (36) с граничными условиями (21), удовлетворяющими (22). Предположим, что существуют положительные постоянные с1, с2, с3 такие, что функция (39) и ее оператор V (40) вдоль траекторий системы (35), (36) удовлетворяет неравенствам

(41) С1|С|2 < ЫС,г) < С2|С|2,

(42) С1|п|2) < V2(n,г) < С2|п|2,

(43) (С, П, г) < -сз(|С|2 + |П|2),

г е N. Тогда повторяющийся процесс (35), (36) экспоненциально устойчив по профилю повторения в среднем квадратическом. Доказательство. Из (41), (42) и (43) следует, что

(44) Е[У!(жк+1(* + 1)] < ЛЕ[^х(хй+1(^))] + Е[Л^(Ук(Ь))-

- ^2(Ук+1 (Ь))],

где Л = 1 - е (0,1).

Решая неравенство (44) относительно У1(хк+1 (Ь)), получим

4-1

(45) Е[У1(хк+1(Ь))] < Е[р1(ж^+1(0))]Л4 + ЕЕ[Л^(Ук(р))

р=0

- ^>(ук+1(р))]Л4-р-1.

Обозначим

I

Н (Ь) = Е

р=0

Тогда из (45),(41) получим

(46) Нк+1(Ь) < ЛНк(Ь) + Л4+1Е[^1(хк+1(0))] <

< ЛНк(Ь) + Л4+1С2К^^к+1. Решая неравенство (46) с учётом граничных условий (21), (22), получим неравенство (33), и остальная часть доказательства аналогична доказательству теоремы 3.

4. Стабилизация линейных систем Форназини-Маркезини

Рассмотрим линейную дискретную систему Форназини-Маркезини

(47) Жк+м+1 = ^1Жк,4+1 + А>Жк+м + £1«м+1 + В2«к+м, где х - п-мерный вектор состояния; и - т-мерный вектор входных переменных; к - номер итерации; Ь - время на к-й итерации; Аг, Вг, г = 1, 2 - действительные матрицы соответствующих размеров.

Поставим задачу найти управление с обратной связью по состоянию:

¡л о\ = ,

(48) т?

обеспечивающее экспоненциальную устойчивость системы (47).

Уравнение системы (47) с управлением (48) запишется в виде

(49) Жк+1,4+1 = [А + £1^\]жм+1 + [А + В2*Ь]жк+м. Для решения воспользуемся результатами теоремы 1. Выберем векторную функцию Ляпунова (5) в виде

(50) ^ = [ в^Н^ где а + в = 1.

Вычислим разностный оператор V этой функции вдоль траекторий системы (49):

(51) VV = ахТ+м+1Яхк+м+1вхТ+м+1Ях;+м+1-

- ажТ,4+1Яж^+1 - вхТ+1,4Яжй+1,4 =

= [(А + В1^1)Жк,4+1 + (А + В2^2)Хй+1,4]Т ■ Н■

■ [(А + В1^1)Жк,4+1 + (А + В2^2)Жк+1,4]-

- ажТ,4+1Нжй,4+1 - вхТ+1,4НЖй+1,4 =

= [(А + Я1^1)жМ+1 + (А + £2^2)^+м]Т ■ Н■

■ [(А + В1 )Жк,4+1 + (А + В2^2)Жк+1,4)]-

- ажТ,4+1Нжй,4+1 - вжТ+1,4НЖк+1,4. После очевидных преобразований правой части получим, что условия теоремы 1 будут выполнены, если существует положительно определённое решение Н = НТ матричного неравенства

(52) АТНАт -

< 0,

аН 0 0 вН

где Ас = [А + 1 А2 + Д^].

Умножая обе части этого неравенства слева и справа на матрицу diag[X X], где X = Н-1 > 0, и применяя теорему о дополнении Шура [10], получим, что неравенство (52) эквивалентно

33

следующему линейному матричному неравенству относительно переменных X > 0 и У1, У2:

Если неравенство (53) разрешимо относительно указанных переменных, матрицы усиления стабилизирующего управления находятся по формулам = У1Х-1, = У2X-1.

5. Синтез алгоритма управления с итеративным обучением в условиях информационных нарушений

В данном разделе результаты, полученные в разделе 3, применяются к задаче управления с итеративным обучением в условиях информационных нарушений. Пусть целое число к обозначает номер итерации (повторения, шага), а ик(£),хк(£) и ук(£) -входной вектор управления, вектор состояния и выходной вектор соответственно в момент времени £ к-ой итерации или повторения. Обозначим уге/(£),£ € [0,Т] - желаемый выходной сигнал системы. Тогда вк (£) = уге/ (£) — у к (£) ошибка на к-й итерации. Задача состоит в построении такого изменения стратегии управления на текущем шаге управления на основе информации текущего и предшествующего шагов, при которой выходной сигнал системы воспроизводит заданный сигнал уге/ (£) с требуемой точностью е > 0, т.е. начиная с некоторого к = к* |вк(£)| < £ для всех £ € Т. Необходимым условием разрешимости поставленной задачи является сходимость ошибки воспроизведения заданного сигнала:

Динамика такой системы может быть описана следующей моделью в пространстве состояний:

аХ 0

(53) 0 вХ

[А + В1У1] [А + В2У2 ]

[А + ЯЛР " [А + В2У2]Т > 0. X

(54) 11ш |вк(£)| = 0, 11ш |ик(£) — и<»(*)| = 0.

к^те

к^те

(55)

х(£ + 1) = Ах(£) + Ви(£),

у(£) = С (г(£))х(г), £ = 0,1,2,...,

где x G Rn - вектор состояния; u G Rm - входной вектор управления; y G Rp - выходной вектор; r(t) - однородный марковский процесс, который моделирует возможные нарушения. Этот процесс имеет конечное число состояний N = {1,..., v}, соответствующих числу возможных нарушений, с вероятностями перехода, определяемыми соотношениями (36).

Предположим, что к системе (55) применен закон управления с итеративным обучением. Тогда динамика системы (55) опишется следующим образом:

xfc (t + 1) = Axfc (t) + Bufc (t), (56) yfc (t) = C (r(t)xfc (t)

с граничными условиями

uo(t) = 0, t G [0,T], 1 ' xfc(0) = xo, k = 0,1,... .

Следуя концепции итеративного обучения управление на k-м повторении (шаге) зададим в виде (58) ufc+i(t) = ufc (t) + Aufc+i(t),

где Aufc+i(t) - корректирующая добавка к управлению на текущем k-м шаге для формирования управления для следующего k + 1-го шага.

С учётом стохастического характера системы введем следующее определение сходимости.

Определение 4. Закон управления с итеративным обучением (58) называется сходящимся в среднем квадратическом, если для любых начальных условий x0 G Rn и любой начальной управляющей последовательности {u0 (t)} он задаёт такую последовательность {uk(t)} для системы (56), что E|ek(t)|2 = Ejyre/(t) - yfc(t)|2 ^ 0 при k ^ те, t G [0,T].

Для дальнейшего анализа сходимости введем вспомогательную переменную:

Ufc+i(t) = xfc+i(t) - xfc(t).

Тогда в терминах переменных (£) и (£) система (55) с законом управления (58) будет представлена как 2Э-система в стандартной форме линейного дискретного повторяющегося процесса:

(59)

Ш+1(* + 1) = А^+1 (£) + В Дик+1(£), ек+1(£) = -С(г(£))АиЛ+1(£) + ек(£) - С(г(*))ВДи*+1(*). Рассмотрим случай, когда переменные состояния доступны измерению, и зададим вектор ¿(¿) € М9 в виде

(60) г(*) = Дг(£))ж(£),

где Я(г), г € N - матрица соответствующего размера, имеющая полный ранг.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В этом случае корректирующую поправку сформируем в виде

(61) Ди^СО = ^1(г)^к+1(£) + ^2(г)еЙ(£), если г(£) = г.

Тогда, если (61) гарантирует экспоненциальную устойчивость по профилю повторения (59), из теоремы 4 следует, что закон управления с итеративным обучением сходится.

Для нахождения матриц усиления стабилизирующего управления ^\(г),^2(г), г € N воспользуемся условиями устойчивости теоремы 4.

Выберем векторную функцию Ляпунова в виде (39), где ^(жк+1 (£),г(£))) = жТ+1(£)Р1(г(£))жк+1(£) и V2(^(*)г(*)) = ут(*)Р2(Г(£)ь (£).

Стохастический оператор дивергенции V функции (39) в этом случае должен удовлетворять (43). Вычисляя этот оператор вдоль траекторий системы (59), (61), получим следующие достаточные условия экспоненциальной устойчивости по профилю повторения в среднем квадратическом:

Р(г) = ^[Л(г) Рг(г)] > 0,

А + В*1(г) В*2(г)

-С(г)А - С(г)В^1 (г) I - С(г)В*Ь(г) О(г) = ОТ(г) > 0,Яг(з) = ^[Р1(з) Р2(г)]. 36

(62) А?(г) £5=1 п лВД)Ас(г) - Р(г) + О(г) < 0, г € N,

где Ас(г) =

1

п 2

Обозначая X(г) = Р-1(г) и вводя дополнительные переменные У1(г), У2(г), ^1(г), как показано ниже, после простых, но громоздких вычислений условия устойчивости запишутся в виде системы линейных матричных неравенств и уравнений относительно этих переменных:

£п(г) ^12(г) ЗДг) " £?2(г) ^22(г) 0 > 0, £3(г) 0 5зэ(г) . (63) X(г) > 0, г е N,

Д(г)Х1(г) = (г)Х1(г),

где ^12(г) = [^121 (г)... £12^(г)], £12?(г) =

АХ1 (^) + ВУ1Д(?-) ВВД)

-С)АХ1(;) - С(;)ВУШ(;) Х2С/) - С(;)ВВД) £ц(г) = ^[Х1(г) Х2(г)], £13 = diag[Xl(г) Х2(г)], ЗД) = diag[Xl(1) Х2(г) Х1(2) Х2(г).. .Х^) Х2(г)], £зз(г) = д-1(г), У1(г) = ^(г)^(г), У2(г) = ^(г)Хь Уш(г) = ^1(г)^(г) и, таким образом, справедливо следующее утверждение.

Теорема 5. Рассмотрим систему (56) с граничными условиями (57) и с законом управления с итеративным обучением (58), (61). Предположим, что линейные матричные неравенства (63), г е N. разрешимы. Тогда закон управления с итеративным обучением (58), (61) сходится и ^1(г) = У1(г)^-1(г), *2(г) = У2(г)Х-1(г), г е N.

Заметим, что в случае без нарушений неравенство (62) сводится к 2Э-неравенству Ляпунова, которое гарантирует устойчивость относительно повторений [25] рассматриваемого повторяющегося процесса. Этим устанавливается связь введённого определения устойчивости с традиционным в линейной теории повторяющихся процессов.

Замечание 1. Если ^(г) = 0, то корректирующая поправка к управлению будет иметь вид

Аик+1(Ь) = ^2(г)вк(Ь), если г(Ь) = г.

В этом случае ^1(г) = 0, а матрица ¿2(г) находится из решения линейных матричных неравенств (63), которые, очевидно, в этом случае будут иметь более простую форму.

5.1. ЧИСЛЕННЫЙ ПРИМЕР Рассмотрим систему (55) при

А =

-0, 002961

1

0

-0, 0008363 -0, 002961 0, 03035

0

0

1

В = [ 0 0 0,01563 , С = [ 0, 0003718 0, 007077 0, 02335 ] .

Предположим, что нарушения моделируются однородной марковской цепью г(Ь) с двумя состояниями, соответствующими двум возможным режимам. В первом режиме ^(1) = /, во втором ^(2) = 0 (что соответствует пропаданию сигнала на короткий период времени). Вероятность того, что система находится в первом режиме п11 = 0, 95, во втором п22 = 0, 05. Далее воспользуемся результатами теоремы 5 и замечания 1. Решая линейные матричные неравенства из теоремы 5 и вычисляя матрицы усиления стабилизирующего управления, получим

¿1(1) = [ -0, 0096 -0, 2814 -51, 9 ] , (1) = [922, 9]; (64) ¿1(2) = [ 0 0 0 ] , ¿2(2) = [7,38] .

Ниже представлены результаты моделирования. На рис. 1а представлен желаемый выходной сигнал с периодом дискретизации 0,01 с. В случае, когда нарушения отсутствуют, скорость сходимости ошибки достаточно высока (см. рис. 2). В случае возникновения информационного нарушения (пропадание сигнала) монотонность убывания ошибки нарушается (см. рис. 3). Подобного рода скачки крайне нежелательны для задач итеративного обучения. Такого резкого скачка можно избежать, если знать момент возникновения нарушения и в этот момент совершить переключение алгоритма управления в соответствии с (64). На рис. 3а 38

а) Желаемая траектория

Рис. 1. Выходной сигнал

б) Выходной сигнал (в случае без нарушений)

а) Сходимость ошибки обучения (в случае без нарушений)

б) Сходимость ошибки обучения (в случае без нарушений, вид сбоку)

Рис. 2. Ошибка обучения

продемонстрирован случай, когда в момент возникновения нарушения было совершено переключение, на рис. 3б, напротив, случай, когда переключения управления произведено не было.

а) Сходимость ошибки обучения с б) Сходимость ошибки обучения с

непереключающимся законом управления переключающимся законом управления при

при потере сигнала на 10-м шаге потере сигнала на 10-м шаге

(вид сбоку) (вид сбоку)

Рис. 3. Ошибка обучения (в случае с нарушениями)

6. Заключение

В данной работе метод векторных функций Ляпунова развивается как единый подход к анализу различных видов устойчивости 2Б-систем. Полученные условия устойчивости по форме близки к классическим результатам Н.Н. Красовского [1], относящимся к построению функций Ляпунова, удовлетворяющим оценкам, характерным для квадратичных форм, но в классе 2D-систем они, как показывает теорема 2, не всегда гарантируют экспоненциальный характер сходимости в отличие от случая обычных (1D-) систем. Использование стохастического дискретного аналога дивергенции вместо полного приращения функции Ляпунова оказалось достаточно плодотворным. Это подтверждает физическая интерпретация. В самом деле, векторное поле с отрицательной дивергенцией по крайней мере не должно иметь источников, следовательно, обобщённая энергия должна убывать в направлении возрастания координат на плоскости независимых переменных. В ближайшей перспективе представляет интерес попытаться по аналогии с [1] построить обращения указанных теорем; в работах [19,28] уже сделаны определённые шаги в данном направлении. В области приложений представляет существенный 40

интерес применение полученных результатов к синтезу управления с итеративным обучением в рамках нелинейных моделей.

Литература

1. КРАСОВСКИЙ Н.Н. Некоторые задачи теории устойчивости движения. - М.: ГИФМЛ, 1959. - 211 с.

2. МАТРОСОВ В.М. Метод векторных функций Ляпунова: Анализ динамических свойств нелинейных систем. - М.: Физматлит, 2001. - 381 с.

3. ПАКШИН П.В., ГАЛКОВСКИЙ К., РОДЖЕРС Э. Линейно-квадратичная параметризация стабилизирующих управлений в дискретных системах с двумерной динамикой // Автоматика и телемеханика. - 2011. - №11. -С. 157-173.

4. AGATHOKLIS P., JURY E.I., MANSOUR M. Algebraic Necessary and Sufficient Conditions for the Stability of 2-D Discrete Systems // IEEE Trans. on Circuits and Systems. II: Analog and Digital Signal Processing. - 1993. - Vol. 40. -P. 251-258.

5. AGATHOKLIS P., JURY E.I., MANSOUR M. The discrete-time strictly bounded-real lemma and the computation of positive definite solutions to the 2-D Lyapunov equation // IEEE Trans. Circuits Syst. - 1989. - Vol. 36. - P. 830-837.

6. AGATHOKLIS P. The Lyapunov equation for n-dimensional discrete Systems // IEEE Trans. Circuits Syst. - 1988. -Vol. 35. - P. 448-451.

7. ANDERSON B.D.O., AGATHOKLIS P., JURY E.I. AND ETC. Stability and the matrix Lyapunov equation for discrete 2-D systems // IEEE Trans. Circuits Syst. - 1986. - Vol. 33. -P. 261-267.

8. ARIMOTO S., KAWAMURA S., MIYAZAKI F. Bettering operation of robots by learning // J. Robot. Syst. - 1984. -Vol. 1. - P. 123-140.

9. BLIMAN P.-A. Lyapunov Equation for the Stability of 2-D Systems // Multidimensional Systems and Signal Processing. -2002. - Vol. 13. - P. 201-222.

10. BOYD S., EL GHAOUI L., FERON E. Linear Matrix Inequalities in System and Control Theory. - Philadelphia: SIAM, 1994. - 193 p.

11. BRISTOW D.A., THARAYIL M., ALLEYNE A. A survey of iterative learning control. // IEEE Control Systems Magazine. - 2006. - Vol. 26. - P. 96-114.

12. EMELIANOVA J., PAKSHIN P., GALKOWSKI K. ET AL. Stabilization and H,, Control of 2D Systems // Proc. 8th Int. Workshop on Multidimensional Systems (nDS'13), Erlangen, Germany, Sep. 9-11, 2013. - VDE-Verlag. Berlin. 2013. -P. 1-6.

13. FORNASINI E., MARCHESINI G. Doubly indexed dynamical systems:state models and structural properties // Mathematical Systems Theory. - 1978. - Vol. 12. - P. 59-72.

14. FORNASINI E., MARCHESINI G. Stability analysis of 2D systems // IEEE Transactions on Circuits and Systems. -1980. - Vol. 27. - P. 1210-1217.

15. GARDEN M. Learning control of actuators in control systems. - U.S. Patent 3555252, 1971.

16. GENG Z., JAMSHIDI M. Learning control system analysis and design based on 2-D system theory // J. Intell. Robot. Syst. - 1990 - Vol. 3. - P. 17-26.

17. HINAMOTO T. 2D Lyapunov Equation and Filter Design Based on the Fornasini-Marchesini Second Model // IEEE Trans. Circuits Syst.-I: Fundamental Theory and Application. - 1993. - Vol. 40. - P. 102-110.

18. HYO-SUNG A., CHEN Y.Q. AND MOORE K.L. Iterative learning control: brief survey and categorization // IEEE Trans. Circuits Syst.-I: Fundamental Theory and Application. - 2007. - Vol. 37. - P. 1099--1121.

19. KOJIMA C., RAPISARDA P., TAKABA K. Lyapunov Stability Analysis of Higher-Order 2-D Systems //

Multidimensiomal Systems and Signal Processing. -2011. - Vol. 22. - P. 287-302.

20. KUREK J.E., ZAREMBA M.B. Iterative Learning Control Synthesis Based on 2-D System Theory // IEEE Transactions on Automatic Control. - 1993. - Vol. 38. - P. 121-125.

21. KUREK J.E. Stability of nonlinear time-varying digital 2-D Fornasini-Marchesini system // Multidimens. Syst. Signal Proc. - 2012. - Vol. 23. - [Электронный ресурс]. - URL: http://link.springer.com/article/10.1007/s11045-012-0193-4 (дата обращения: 17.01.2014).

22. LIU D. Lyapunov Stability of Two-Dimensional Digital Filters with Overflow Nonlinearities // IEEE Trans. Circuits Syst. I: Fundamental Theory and Application. - 1998. - Vol. 45. -P. 574-577.

23. LU W.S., LEE E.B. Stability Analysis for Two-Dimensional Systems via a Lyapunov Approach // IEEE Transactions on Circuits and Systems. - 1985. - Vol. 32. - P. 61-68.

24. ROESSER R.P. A discrete state-space model for linear image processing // IEEE Transactions on Automatic Control. -1975. - Vol. AC-20. - P. 1-10.

25. ROGERS E., GALKOWSKI K., OWENS D.H. Control Systems Theory and Applications for Linear Repetitive Processes // Lecture Notes in Control and Inform. Sci. -2007. - Vol. 349. - 466 p.

26. ROGERS E., OWENS D.H. Stability Analysis for Linear Repetitive Processes // Lecture Notes in Control and Inform. Sci. - 1992. - Vol. 175.-201 p.

27. UCHIYAMA M. Formation of high-speed motion pattern of a mechanical arm by trial // Trans. Soc. Instrument Contr. Engineers. - 1978. - Vol. 14. - P. 706-712.

28. YEGANEFAR N., YEGANEFAR N., GHAMGUI M. ET AL. Lyapunov Theory for 2-D Nonlinear Roesser Models: Application to Asymptotic and Exponential Stability // IEEE Transact. Automat. Control. - 2013. - Vol. 58. - P. 12991304.

EXPONENTIAL STABILITY OF NONLINEAR DISCRETE 2D SYSTEMS

Julia Emelianova, Arzamas Polytechnical Institute of R.E. Alekseev Nizhny Novgorod State Technical University, Arzamas, postgraduate student, ([email protected]).

Abstract: The paper develops the method of vector Lyapunov function as a unified approach to stability analysis of nonlinear discrete-time 2D systems. We derive sufficient conditions of exponential stability for nonlinear Fornasini-Marchesini systems and sufficient conditions ofpass profile exponential stability for nonlinear repetitive processes. These results are extended to the nonlinear repetitive processes with random failures modeled by Markov chain with finite set of states. In the linear case these conditions are expressed in the form of linear matrix inequalities. Finally, we describe an application to iterative learning control design for the simplest model of gantry robot under information failures.

Keywords: nonlinear systems, discrete systems, 2D-systems, Fornasini-Marchesini model, repetitive process, stability, vector Lyapunov function, information failures, iterative learning control.

Статья представлена к публикации членом редакционной коллегии Б. Т. Поляком

Поступила в редакцию 06.11.2013. Опубликована 31.01.2014.

i Надоели баннеры? Вы всегда можете отключить рекламу.