ОБЗОРНАЯ СТАТЬЯ
УДК 681.51.015
АДАПТИВНОЕ УПРАВЛЕНИЕ ПО ВЫХОДУ: ПРОБЛЕМАТИКА, ПРИКЛАДНЫЕ ЗАДАЧИ И РЕШЕНИЯ1 А.А. Бобцов, В.О. Никифоров
Бобцов Алексей Алексеевич, доктор технических наук, профессор НИУ ИТМО, декан факультета компьютерных технологий и управления. Специалист по системному анализу, управлению и обработке информации в технических системах. Автор более 200 печатных работ, из которых более 80 - в международных журналах. Автор девяти монографий и учебных пособий, обладатель двух патентов. Действительный член Академии навигации и управления движением, член Научного совета РАН по теории управляемых процессов и автоматизации. Член научно-технического совета ассоциации авиаприборостроителей, член двух технических комитетов Международной федерации по автоматическому управлению. Председатель Совета молодых ученых и специалистов при Правительстве Санкт-Петербурга. Член редколлегии журнала «Научно-технический вестник информационных технологий, механики и оптики».
Никифоров Владимир Олегович, доктор технических наук, профессор, проректор НИУ ИТМО, заместитель генерального директора - технический директор ОАО «ЛОМО». Область научных интересов - нелинейные и адаптивные системы автоматического управления, методы компенсации внешних возмущений, адаптивные наблюдатели. Автор более 120 печатных работ, в том числе более 40 - в зарубежных изданиях. Действительный член Академии навигации и управления движением. Автор пяти монографий и шести учебных пособий. Председатель диссертационного совета. Член Санкт-Петербургской региональной группы национального комитета по автоматическому управлению РАН. Главный редактор журнала «Научно-технический вестник информационных технологий, механики и оптики» и российского издания журнала «Control Engineering».
Рассматривается проблема адаптивного управления по выходу параметрически и функционально неопределенными объектами. Наряду с математической постановкой задачи представлены прикладные примеры, иллюстрирующие практические применения обсуждаемой в статье теории. Приведен краткий обзор методов адаптивного управления по выходу как линейными, так и нелинейными системами, представлена обширная библиография, в которой читатель сможет найти детальное описание конкретных алгоритмов и их свойств. Подробно рассмотрен новый подход к задаче управления по выходу - метод последовательного компенсатора.
Ключевые слова: адаптивное управление, робастное управление, управление по выходу, сложные динамические системы, нелинейные системы.
Введение
Задача адаптивного и робастного управления параметрически и функционально неопределенными объектами в условиях возмущений и запаздывания относится к фундаментальным и актуальным проблемам современной теории и практики автоматического управления. Идеализирующие предположения о линейности объекта управления, стационарности его параметров, возможности измерения всех переменных состояния, отсутствии запаздывания и возмущающих воздействий постепенно уходят из рассмотрения в рамках современной теории управления [1-41].
В статье особое внимание уделяется методам адаптивного и робастного управления по выходу, т.е. без измерения производных выходной переменной или всех переменных состояния объекта. Мотивация данных исследований обусловлена тем, что управление по выходу позволяет уменьшить затраты на проектирование, разработку и изготовление датчиков, которые, в свою очередь, могут вносить дополнительные погрешности, связанные с ошибками измерений. Кроме того, для ряда реальных систем не удается обеспечить непосредственное измерение всех переменных состояния объекта управления.
1 Работа выполнена при финансовой поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (государственный контракт № 11.519.11.4007)
К настоящему времени получены решения многих важных задач адаптивного и робастного управления по выходу, часть из которых доведена до инженерных методов синтеза. Однако большинство известных методов адаптивного и робастного управления отличается сложностью процедур синтеза, а также сложностью структуры и высоким динамическим порядком получаемого регулятора. Таким образом, разработка новых методов адаптивного и робастного управления, позволяющих получить более простые и малоразмерные регуляторы, является актуальной задачей современной теории управления.
Целью данной статьи является представление широкому кругу специалистов проблематики адаптивного и робастного управления по выходу параметрически и функционально неопределенными объектами. Будут сформулированы строгие постановки задач управления, а также предложены различные примеры систем управления, в которых актуальна данная проблематика. Также читателю будет представлен краткий обзор методов адаптивного управления по выходу и предложен для более подробного знакомства один из современных подходов - «метод последовательного компенсатора», базирующийся на теореме о пассификации А.Л. Фрадкова [42-45], которая, в свою очередь, расширяет фундаментальный результат теории автоматического управления - лемму Якубовича-Калмана [4, 46].
Задачи адаптивного и робастного управления по выходу линейными объектами
Представим математическую постановку задач адаптивного и робастного управления по выходу линейными объектами в условиях возмущений.
Постановка задачи. Рассматривается линейный стационарный объект управления, представленный математической моделью в форме «вход-выход»
а(Р) У« = 6ЯР( Р)[«(0 +5(/)], (1)
где р = ё / Ж - оператор дифференцирования; и(/) - управление; у(/) - выходная переменная и 5(/) -ограниченное возмущающее воздействие; Ьт - постоянный коэффициент; а(р) и Р(р) - нормированные полиномы с неизвестными постоянными коэффициентами а1 и ^, такие что
а(р) = р" + ап_1 р"_' + ап_2р"_2 +... + ар + а0,
ЬтР( р) = Ьт Рт + Ьт _1 рт _' + ... + ¿1 р + V
Как правило, задача адаптивного управления по выходу решается при следующих допущениях (см. например, [4-6, 9]).
Допущение Д1. Полином Р(р) гурвицев.
Допущение Д2. Знак коэффициента Ьт является известным (без потери общности будем считать, что Ьт > 0).
Допущение Д3. Прямым измерениям доступна только выходная переменная у(/), но не ее производные.
Допущение Д4. Известны степени полиномов а(р) и Р(р) - п и т, соответственно.
Допущения (Д1)-(Д4) широко используются в литературе и поэтому получили название стандартных допущений. Решение задачи адаптивного управления по выходу при нарушении стандартных допущений (например, при неизвестном знаке коэффициента Ьт, неизвестных степенях полиномов а(р) и Р(р), доступности измерениям зашумленного выходного сигнала и т.п.) является предметом современных исследований.
Наряду с объектом управления рассмотрим эталонный сигнал у *(), задающий желаемый характер изменения регулируемой переменной у(/) и удовлетворяющий условию
\а'у */ж'\ < с0 , (2)
где I = 0, р , р = п _ т - относительная степень объекта управления (1). Обычно у *() формируется в виде выхода эталонной модели к
у* (') = £('), (3)
а *(р)
где к - постоянный коэффициент; а *(р) - гурвицев полином степени р; g(/) - ограниченный командный сигнал. Отметим, что использование эталонной модели (3) гарантирует выполнение условий (2).
Теперь сформулируем цели управления.
Цель управления 1 (адаптивное управление). При условии, что внешнее неизмеряемое возмущение отсутствует (т.е. при 5(t) = 0), требуется найти такой закон управления в форме обратной связи по выходной переменной u = u (y, y*), чтобы для объекта (1) выполнялось целевое условие lime(t) = 0 ,
где
s(t) = y *(t) - y (t) (4)
- ошибка слежения.
Другими словами, при отсутствии внешнего возмущения может быть поставлена и решена задача асимптотического слежения за эталонным сигналом. Наличие неизмеряемого возмущения 5(t) в общем
случае не позволяет решить задачу асимптотического слежения. При этом даже обеспечение устойчивости замкнутой параметрически неопределенной системы становится нетривиальной задачей, решение которой может быть достигнуто с использованием специальных методов робастного управления [4, 9, 17].
Цель управления 2 (робастное управление). При наличии ограниченного возмущения 5(t) требуется найти такой закон управления в форме обратной связи по выходной переменной u = u (y, y*), чтобы для объекта (1) выполнялось целевое условие
|y *(t) - y (t)| <A для всех t > t1, (5)
где A - заданная разработчиком точность управления.
Основные проблемы адаптивного управления по выходной переменной. Даже в условиях отсутствия внешних возмущений задача синтеза адаптивного управления по выходной переменной является нетривиальной, что связано с двумя принципиальными проблемами.
Первая проблема - математическая модель объекта управления должна быть соответствующим образом параметризована, т.е. приведена к специальному виду, позволяющему использовать универсальные алгоритмы адаптации, разработанные для широких классов канонических моделей.
Например (подробнее - см. [4, 9, 23]), с использованием вспомогательных фильтров U = Ли1 + eM-1u, (6)
i> 2 = Ли2 + e„-i У, (7)
где и и2 - (п -1)-мерные векторы состояния фильтров (6), (7); Л - сопровождающая матрица произвольного гурвицева полинома степени (п -1); e,. - единичный вектор с единицей на i -м месте, модель ошибки слежения (4) (при 5(t) = 0) может быть представлена в виде
e(t) = —^ ( (t)Ö + u), (8)
а*(p)v '
где фТ = [и[,и^,y,g] - вектор известных функций (регрессор); 0 - 2п -мерный вектор неизвестных параметров. Тогда, выбирая управление u = -фТ (t )0(t),
где 0(t) - вектор настраиваемых параметров, генерируемый алгоритмом адаптации, для уравнения (8) получаем замкнутую параметризованную модель вида
e(t) = —^ ФТ (t )0 (t), (9)
а *(p)
которая представляет собой линейную регрессионную модель, хорошо изученную в задачах идентификации и адаптации линейных систем (здесь 0 (t) = 0 - 0(t) - вектор параметрических ошибок). Альтернативный подход предусматривает использование вспомогательных фильтров:
4п = А^п + ку ,
4п = АЕ4п + еп-,У, 0 < i < п -1,
vi = Ae v,. + еп_tu , 0 < i < m ,
где 4п, 4, и V,- - п -мерные векторы состояния фильтров, а вектор коэффициентов обратных связей к выбран так, что матрица АЕ = Е - ке[ является гурвицевой.
Тогда выходная переменная может быть представлена в виде
у = 4иД + фт (/, (10)
где ф(0 = ф(4,, V,) - (п + т +1)-мерный вектор известных функций, а у - вектор неизвестных параметров (подробнее - см. [4, 9, 17]). Управление в явном виде не представлено в модели (10) и появляется только в выражении для р -ой производной выходной переменной. В связи с этим для модели (10) не могут быть использованы универсальные алгоритмы адаптации, что потребовало разработки специальных итеративных процедур синтеза алгоритмов адаптивного управления - так называемого метода обратного обхода интегратора [4, 9, 14, 16, 17, 27].
Вторая проблема адаптивного управления по выходу - высокая относительная степень объекта управления, что связано с измерением только выходной переменной, а не всего вектора состояния (или производных выходной переменной).
Для пояснения проблемы высокой относительной степени представим замкнутую параметризованную модель ошибки (9) в пространстве состояний:
п = Гп+ерфг (09 (о, (11)
Т
6 = ет п,
Ь т / \ —1
где п - Р -мерный вектор состояния модели (11), --— = ет (/>1 — Г1 ер. Предполагая временно, что
а *(р)
вектор состояния п доступен прямым измерениям, выберем стандартный алгоритм адаптивной настройки параметров регулятора:
9 = уфер Рп, (12)
где у - произвольный положительный коэффициент (коэффициент адаптации), а симметрическая положительно определенная матрица Р является решением уравнения
гт Р + рг = —о (13)
с произвольной симметрической положительно определенной матрицей О . Свойства устойчивости замкнутой системы доказываются с использованием функции Ляпунова вида
У(п, 9) =1 пт Рп+—9т 9,
2 2у
производная которой по времени в силу уравнений замкнутой системы удовлетворяет неравенству
V(п, 9) =1 пТ (ГтР + РГ)п + 9тферРп —19т 9 = —1 пТОп ^ 0 .
2 У 2
Из последнего выражения следует устойчивость по Ляпунову замкнутой системы и выполнение целевого условия п ^ 0 при t ^го .
Исследуем теперь условия применимости базового алгоритма адаптации (12) в случае недоступности прямым измерениям вектора состояния параметризованной модели п . Легко видеть, что данный алгоритм применим, если удастся выбрать матрицу Р таким образом, что
етР = ет . (14)
В этом случае алгоритм адаптации принимает вид
9 = уфб (15)
и является физически реализуемым, так как в нем используются только измеряемые сигналы.
Таким образом, условием применимости алгоритма адаптации вида (15) является существование симметрической положительно определенной матрицы Р, удовлетворяющей одновременно двум уравнениям (13) и (14). В свою очередь, такая матрица может быть найдена не для всех моделей ошибки (9), а только для моделей со строго положительно вещественной (СПВ) передаточной функцией.
Лемма Якубовича-Калмана [46]. Симметрическая положительно определенная матрица Р , являющаяся решением одновременно двух уравнений (13) и (14), существует только в том случае, если передаточная функция модели ошибки (9) является СПВ.
Рассмотрим произвольную передаточную функцию вида + -1 + - + Ь0
H (s) =■
Л Т-----TUg
где s - комплексная переменная. Передаточная функция H(s) является СПВ функцией только в том случае, если:
(У1) она не имеет полюсов в области Re[s] > 0 ; (У2) Re[H('ю)] > 0 для всех —да<ю<да; (У3) limю2 Re[H('ю)] > 0 при ю^ да.
Для пояснения приведенного критерия рассмотрим передаточную функцию апериодического звена первого порядка
k
Ha (s) = ^Г7 , (16)
Ts +1
где k > 0 - коэффициент усиления, а T > 0 - постоянная времени. Покажем, что передаточная функция (16) удовлетворяет условиям (У1)-(У2). Действительно, единственный полюс функции (16) s = —1/T лежит вне области Re[s] > 0 . Как известно, частотный годограф апериодического звена первого порядка полностью лежит в четвертом квадранте комплексной плоскости, что гарантирует выполнение условия (У2). Наконец, рассмотрим частотную передаточную функцию звена
H ( ) k k ' kT ю
Ha ('ю) ="T = ^P2 2 , i — J^P2 2 , Л , JTю +1 T ю +1 T ю +1
где ю - угловая частота. Тогда
lim ю2 Í—4-1= -k- > 0,
ю^да 1T2 ю2 +1) T2
что означает выполнение условия (У3).
Таким образом, можно сделать вывод, что СПВ функции обладают почти такими же частотными свойствами, что и звено первого порядка. Так, их частотные годографы лежат в правой полуплоскости (а значит, фазовый сдвиг, вносимый динамическим звеном с такой передаточной функцией, не превышает 90°). Кроме того, скорость убывания вещественной части частотной передаточной функции при ю ^да не быстрее, чем у 1/ю2.
Насколько ограничительным является требование строгой положительной вещественности? Для ответа на этот вопрос учтем, что СПВ передаточная функция не может иметь относительную степень выше единицы (что определяется требованием предельного фазового сдвига в 90°). Очевидно, что класс динамических систем с единичной относительной степенью является достаточно узким, и в него не попадают математические модели большинства реальных технических устройств. Таким образом, стандартный алгоритм адаптации по выходу (15) может быть использован только в частных случаях, и необходимо получение универсальных алгоритмов адаптации, применимых ко всему классу моделей вида (9). Для объектов с произвольной относительной степенью должны использоваться специальные методы синтеза алгоритмов адаптации или адаптивного управления в целом.
Методы адаптивного и робастного управления линейными стационарными объектами по выходу. На сегодняшний день можно уверенно говорить о том, что задачи адаптивного и робастного управления линейными стационарными объектами в условиях неопределенности параметров математической модели и действии неизвестных возмущений решены. За последние 30 лет опубликовано достаточное число работ, в которых представлены разнообразные методы, позволяющие решать задачу адаптивного управления по выходу. Большинство методов обсуждались в обзоре [5], ряд новых подходов рассмотрен в монографиях [4, 9]. Среди основных методов управления линейными стационарными неопределенными объектами по выходу можно выделить:
— метод расширенной ошибки или схема Монополи [5, 21, 47];
— алгоритм высокого порядка или метод Морза [22];
- использование итеративных процедур синтеза [9, 14, 16, 17, 27, 30];
- метод шунтирования [2];
- робастная модификация алгоритма высокого порядка [4, 9, 26];
- робастная модификация итеративных процедур синтеза [4, 9].
Каждый из указанных методов имеет преимущества и недостатки по сравнению с аналогами. Общее достоинство данных методов заключается в том, что они позволяют синтезировать управление в случае, когда относительная степень исходной модели (1) больше единицы. Однако данные методы имеют два существенных недостатка:
- высокая размерность регулятора;
- сложность практической реализации.
Задачи адаптивного и робастного управления по выходу нелинейными объектами
В данном разделе будет сформулирована математическая постановка задачи адаптивного и робастного управления по выходу нелинейными объектами в условиях возмущений и запаздывания. Будет дан краткий обзор методов адаптивного управления по выходу нелинейными объектами. Постановка задачи. Рассмотрим нелинейную систему (рис. 1) вида
х = Ах + ^ О,.ф, + Ем + Еw ,
(17)
У = Их , (18)
где х е Я" - вектор переменных состояния; А, Е, О,, И - неизвестные матрица и векторы соответственно; w(t) - неизвестное гладкое ограниченное возмущение, т.е. )| < ; ф, = ф, (у(/ -т)) - неизвестная функция, где т> 0 - неизвестное постоянное запаздывание, у($) = ф(д) для Уд е [-т, 0]. Прежде чем формулировать цель управления, рассмотрим ряд допущений (например, [4, 9]). Допущение Д 5. Передаточная функция Ж (р) = И(р1 - А)-1 Е = Ь(р)/а(р) - минимально-фазовая, т.е. полином Ь(р) гурвицев.
Допущение Д6. Относительно неизвестной нелинейности ф, будем полагать, что она:
- либо ограничена для любых значений у(/ - т), т.е.
|Ф,| < С,, (19)
- либо выполнено секторное ограничение вида
|ф,| < С0|у(/ -т)|, (20)
- либо относительно нелинейности задана мажоранта вида
|ф,| < СМу(/ -т)),
где число С0 > 0 для всех случаев неизвестно, а у(у(/ - т)) - известная функция.
(21)
Рис. 1. Структурная схема системы управления (17), (18) Теперь для представленных допущений сформулируем цели управления.
1=1
Цель управления 3 (адаптивное управление). Пусть неизвестное возмущение w(t) = 0 и выполнены условия (20), (21). Для системы (17), (18) требуется найти закон управления в форме обратной связи по выходу м = м( у), обеспечивающий выполнение целевого условия
Шп| у(/)| = 0. (22)
Цель управления 4 (робастное управление). Пусть неизвестное возмущение w(t) является гладкой ограниченной функцией и (или) выполнено условие (19). Требуется найти закон управления в форме обратной связи по выходу м = м( у), обеспечивающий выполнение целевого неравенства
\у(г)| < А при t > t1, (23)
где число А задается разработчиком системы управления.
Краткий обзор методов адаптивного и робастного управления по выходу нелинейными неопределенными объектами в условиях возмущений и запаздывания. Отличительной особенностью задач управления нелинейными системами является невозможность указать универсальные пути их решения. Именно этим вызван неугасающий рост публикаций в области нелинейного управления. Большинство методов обсуждались в обзоре [48] и работах [2, 4, 9, 10, 17]. Особую нишу занимают задачи адаптивного и робастного управления по выходу нелинейными неопределенными объектами. Среди основных методов управления нелинейными объектами можно выделить:
- методы, предусматривающие поиск функции Ляпунова [3, 4, 10, 49, 50];
- геометрические методы, связанные с точной линеаризацией и поиском диффеоморфного преобразования координат [3, 4, 9, 14, 37-40, 48];
- частотные методы, предусматривающие использование критерия Попова, кругового критерия и т. д. [2, 35, 36, 48, 50, 51];
- методы, предусматривающие поиск так называемой управляющей функции Ляпунова [48, 52];
- методы теории пассивных систем [4, 44, 48, 53, 54];
- итеративные процедуры синтеза [3, 16, 28, 48, 55].
Естественно, что перечисленными методами анализа и синтеза не ограничивается современный уровень развития нелинейной теории. Однако указанные методы являются наиболее распространенными при решении многих теоретических и практических задач управления нелинейными объектами.
Также как и при анализе методов адаптивного и робастного управления по выходу линейными стационарными неопределенными объектами, можно говорить о том, что рассмотренные выше методы анализа и синтеза нелинейных систем имеют два существенных недостатка:
- высокая размерность и сложность построения регуляторов;
- сложность практической реализации.
Некоторые прикладные задачи адаптивного и робастного управления
Для широкого круга читателей, не являющихся специалистами в области математической теории управления, авторы предлагают ряд практических примеров адаптивного управления по входу различными классами технических и физических систем.
Адаптивное управление по выходу двигателем постоянного тока. Запишем математическую модель двигателя постоянного тока в виде [19, 20, 56] С а
3 — = - ¥ (1 )ю + К, - Т (1), Ж
сИ
Ь— = -КЬю- Я(1). + м, Ж
где а - угол поворота выходного вала (регулируемая переменная); ю - угловая скорость вращения выходного вала; . - ток обмотки возбуждения; м - напряжение якоря (сигнал управления), все или некоторые физические параметры Ь , Я(1), 3, Т(1), ¥(1) и К1 изменяются во времени и могут быть неточно заданы. Во многих электроприводах переменные ю и . не измеряются.
Легко видеть, что данная модель двигателя постоянного тока при некоторых допущениях соответствует математическим моделям (1) или (17), (18). Следовательно, задачи управления и методы их решения, представленные выше, могут быть распространены на данный технический объект.
Адаптивное управление углом либрации спутника. В современной отечественной и зарубежной литературе можно найти довольно много работ по исследованию угловых колебаний космических
аппаратов (спутников) и управлению ими [57-59]. В последнее время, помимо традиционных задач управления космическими конструкциями, внимание ученых стали привлекать задачи, связанные с хаотическими колебаниями спутниковых систем. В частности, является актуальной задача управления углом либрации спутника (например, [60, 61]). Математическая модель угла либрации ф(/) спутника в плоскости орбиты имеет вид
Сф + сф + 3ю2 (Б - А^т фсозф + цт/7г-3 (2зт фзт юct + соз фсозюс/) = Mс (?), где с - коэффициент собственного демпфирования спутника; юс - значение угловой скорости движения спутника по орбите; А, Б - главные моменты инерции спутника (Б > А ); - магнитная постоянная; I - величина магнитного момента спутника; г, i - радиус и наклонение орбиты; Мс (?) - значение управляющего момента.
Легко показать, что данная математическая модель соответствует, рассмотренной ранее обобщенной математической модели (17), (18).
Адаптивная стабилизация хаоса в цепи Чуа. Одним из классических примеров дифференциальных моделей, описывающих хаотические процессы в электрических и электронных схемах, является система Чуа [60, 62-64], предложенная специалистами по электронным цепям Л. Чуа и Т. Мацумото. В тоже время математическая модель хаотической системы Чуа эквивалентна математической модели (17), (18). Цепь Чуа описывается уравнениями
= С ^ (и 2 - и )-ф(и.)],
dU2
dt C2
= C~ [G (U, - U2)+i],
í=L i-u2- *л-
где G = — и ф(и,) = GbU, +—(Ga + Gb)(|U, + E| -|U, -E|) - характеристика нелинейного диода Чуа.
R 2
Управление однозвенным роботом-манипулятором с гибкими связями и незначительным демпфированием. Рассмотрим простой однозвенный робот-манипулятор [65], круговое движение выходного звена которого осуществляется посредством эластичного соединения звена и исполнительного механизма (силового привода). Эластичным соединением между исполнительным механизмом и звеном во многих практических задачах нельзя пренебречь, и опыт показывает, что роботы-манипуляторы, в которых движение передается посредством длинных валов или ременных передач, в которых исполнительный механизм является гармоническим приводом, обладают резонансным поведением в той же области частот, что и частоты, используемые для управления. Эффекты эластичного соединения между исполнительными механизмами и звеньями, на которые обычно ссылаются как на эластичные связи, могут быть смоделированы включением линейной торсионной пружины в каждом соединении между валом исполнительного механизма и концом звена, вокруг которого осуществляется вращение (рис. 2). Используя q, и q2 для обозначения угловых положений вала исполнительного механизма и руки робота-манипулятора соответственно по отношению к фиксированной системе координат, уравнение исполнительного механизма можно записать в следующем виде: Iq, + MgLsinq, + k(q, -q2) = 0 ,
Jq2 - k(q, - q2) = u ,
где q, и q2 - угловые позиции; u - момент, возникающий на оси исполнительного механизма; k - постоянная упругости торсионной пружины, которая представляет эластичное соединение, а физические параметры I, M , g, L и J являются положительными и постоянными.
Легко видеть, что представленная выше математическая модель робота-манипулятора соответствует обобщенной математической модели нелинейного объекта вида (17), (18).
Адаптивное управление двухэтапным химическим реактором. Еще один не типовой для задач механики и мехатроники объект представлен в данном подразделе. Рассмотрим задачу стабилизации двухэтапного химического реактора, модель которого может быть, например, найдена в работе [66]:
, , - R
Z, (t) =--z, (t) - o,z, (t) +—Z2 (t) ,
?! V,
, R R F
Z2(t) =--z2(t)-O2Z2(t) + V,Z,(t- t) + V2Z2(t- t) + V1 u ,
у(1) = ^),
где (1) и г2 (1) - состав резервуаров; Я1, Я2, ^, и,. и ¥2 - некоторые параметры, связанные с химическими процессами в резервуарах и У1 - объем резервуара.
Работая с данной математической моделью, можно обнаружить запаздывание, а после ряда несложных математических преобразований получить систему вида (17), (18).
Торсионная
Редуктор
Рис. 2. Однозвенный робот-манипулятор с гибкими связями
Адаптивное управление системой впрыска для инжекторных двигателей внутреннего сгорания. В соответствии с результатами, опубликованными в работах [67-73], усредненная математическая модель системы впрыска имеет следующий вид: х2 = -а2 х2 + Ь2 м1,
у =—(СА + С1м1),
Т, X, + Х, = Х(1 -т,),
где х1 =ю - скорость вращения выходного вала [об/мин]; х3 = Рт - давление во впускном коллекторе [Па]; х2 = цд- - масса топливной пленки на стенках впускного коллектора; у = X - соотношение воздух/топливо; X, - значение соотношения воздух/топливо, выдаваемое датчиком кислорода; м1 = Цд -количество впрыснутого в цилиндр топлива [кг]; т, - запаздывание, связанное с расположением датчика кислорода в выпускном коллекторе.
Сформулируем цель управления как решение задачи синтеза регулятора, обеспечивающего выполнение неравенства
|у(1) - у* (1)| <8, (24)
где у * (1) = 1, а 8 - некоторое, в общем случае малое, число, которое может быть уменьшено за счет выбора закона управления. Физический смысл цели управления (24) заключается в поддержании заданного соотношения воздух/топливо в горючей смеси, впрыскиваемой в цилиндр. Легко видеть, что цель управления вида (24) соответствует представленной ранее задаче управления по выходу линейными стационарными параметрически неопределенными объектами (условие (5)).
Таким образом, все шесть прикладных примеров удовлетворяют обобщенным математическим моделям, рассмотренным в постановочной части.
Метод последовательного компенсатора
Большинство из сформулированных задач (и относящихся к ним приложений) может быть решено с использованием ставших уже классических методов адаптивного управления, рассмотренных подробно в обзорах [3, 5] и монографиях [2, 4, 9]. В данной статье авторы не видят смысла повторять работы [25, 9] и предлагают читателю достаточно новый подход к адаптивному управлению по выходу - «метод последовательного компенсатора», базирующийся на теореме о пассификации А. Л. Фрадкова [42-45].
Для простоты рассмотрения ограничимся задачей стабилизации нелинейного объекта управления вида (17), (18) в отсутствии возмущения и запаздывания. Более подробно с данным методом и различными его вариациями можно познакомиться в монографии [61]. Представим нелинейную систему (17), (18) в форме вход-выход
у = Ш м + ^ ф(у), (25)
а(р) а(р)
где измеряется выходная переменная у = у(/), но не ее производные; Ь(р) = Ьтрт +... + Ь1 р + Ь0, с(р) = сгрг + сг-1 рг-1 +... + с1 р + с0 и а(р) = рп + ап-1р"-1 +... + а1 р + а0 - полиномы с неизвестными параметрами; г < п -1; передаточная функция Ь(р)/ а(р) имеет относительную степень р = п -т ; полином Ь(р) гурвицев, коэффициент Ьт > 0 ; неизвестная функция ф(у) удовлетворяет неравенству (20). В качестве цели управления зададимся обеспечением условия (22) (в случае возмущенного движения необходимо было бы выполнить неравенство (23)).
Как и в [45], выберем закон управления следующим образом:
и = -а( р)(ц + к) у, (26)
где число ц > ц0 и полином а(р) степени р -1 выбираются из соображений гурвицевости полинома а(р) + цЬ(р)а(р), положительный параметр к предназначен для компенсации неопределенности ф(у), а функция у(/) является оценкой выхода у(/) и формируется алгоритмом вида
= СТ| 2 ,
= СТ^
(27)
= ст(-кЛ -к^2 -...-кр-^р-, + кгy), у = ^1, (28)
где число ст > ц + к, а коэффициенты к1 рассчитываются из требований асимптотической устойчивости системы (27) при нулевом входе у .
Очевидно, что закон управления (26)-(28) является практически реализуемым, так как содержит известные или измеряемые сигналы.
Подставляя (26) в уравнение (25), получаем
у = ^[-а(р)(ц + к)у] + ^ф(у) = ^[-а(р)(ц + к)у + а(р)(ц + к)в] + ^ф(у). (29)
а(р) а(р) а(р) а(р)
Проводя несложные преобразования, для (29) имеем
а(р)у + ца(р)Ь(р)у = Ь(р)а(р)[(ц + к)е - ку] + с(р)ф(у),
принимая обозначения у(р) = а(р) + ца(р)Ь(р) и Р(р) = а(р)Ь(р), для системы (29) получаем
у = ^4 [-ку + (ц + к)е] + ^ ф( у), (30)
у(р) у(р)
где невязка (функция отклонений) равна
е = у - у.
Теперь представим модель вход-выход (30) в виде модели вход-состояние-выход X'= Лх' + Ь(-ку + (ц + к)е) + qф(y), (31)
у = сТх', (32)
где х' е Я" - вектор переменных состояния модели (32); Л , Ь, q и с - соответствующие матрицы перехода от модели вход-выход к модели вход-состояние-выход, причем можно указать симметрическую положительно определенную матрицу Р, удовлетворяющую двум следующим матричным уравнениям (подробнее см. [45]):
ЛТ Р + РЛ =0!, Рь = с,
где = ОТ - положительно определенная матрица, причем ее значения зависят от параметра ц и не зависят от параметра к .
Перепишем (27), (28) в векторно-матричной форме
4 = ст(Д + йк1 у), у = ИТ§ ,
где
" 0 1 0 . . 0 " "0" "1"
0 0 1 . . 0 0 0
Г = 0 0 0 .. . 0 , <1 = 0 и Ь = 0
-к -к2 -к3 . . -V. _ 1 0
Введем в рассмотрение вектор отклонений п = Ьу - 4, тогда в силу структуры матрицы И невязка е примет вид
е = у - у = ЬтЬу - Ьт 4 = Ьт (Ьу-I) = Ьт п. Для производной от п получим
^п = Ьу - ст(Г(Иу - п) + у) = ку + стГй - ст^к + ГИ) у. Так как йк1 = -ГИ (проверяется подстановкой), то
п = Ьу + стГп , (33)
е = Ьт п, (34)
где матрица Г в силу расчета коэффициентов к модели (27) имеет собственные числа с отрицательной вещественной частью и удовлетворяет уравнению Ляпунова
Гт N+кГ = -02,
где N = N и = Qт - положительно определенные матрицы.
Условия применимости закона управления (27)-(29) для стабилизации системы (31), (32), (33), (34) приведены в следующей теореме.
Теорема. Пусть полином Ь( р) гурвицев, порядок полинома с( р) г < п -1, число ц выбрано
так, что передаточная функция 0(р) = р) СПВ и функция ф(у) удовлетворяет следующим допуще-
У( Р)
ниям:
ф(0) = 0,
-С0 < ф(у) < С0 для любых у Ф 0 , у
где число С0 > 0 . Тогда существует число ст >ц + к такое, что система (31), (32), (33), (34) экспоненциально устойчива.
Доказательство теоремы приведено в [45]. Из экспоненциальной устойчивости системы (31), (32) следует выполнение цели управления 1 ип| у(( )| = 0.
Теперь дадим рекомендации по настройке параметров регулятора. Возможным вариантом настройки коэффициентов к, ц, ст является их увеличение до тех пор, пока не будет выполнено целевое условие следующего вида (например, [61]): |у(/)| <Д при Г >
где число Д задается разработчиком системы управления. Для реализации этой идеи можно воспользоваться алгоритмом настройки вида
Щ) = |х(т)^ х,
где к = к + ц, а функция ) рассчитывается следующим образом:
ш) = 1х0 пРи 1у(/) > Д
и [ 0 при |у(/)| < Д, где число X0 > 0 .
Выберем ст следующим образом:
ст = ст0к2,
где число ст0 > 0. Работоспособность данного алгоритма обоснована в монографии [61].
Заключение
Авторы надеются, что им удалось хотя бы частично осветить проблематику адаптивного управления по выходу для различного типа сложных динамических систем. Теоретические методы и алгоритмы управления, представленные в рамках данного обзора, на взгляд авторов, имеют широкие перспективы для их практического использования. Однако современные технические приложения не позволяют ограничиться представленными в статье методами управления. Одной из наиболее серьезных и не имеющих, на взгляд авторов, успешных решений является задача синтеза адаптивного регулятора в условиях, когда сигнал управления содержит запаздывание, т.е. u = u(t -т). Для линейных стационарных асимптотически устойчивых параметрически неопределенных объектов эта задача решена, но для неустойчивых и нелинейных систем проблема в целом остается открытой. Другая не менее важная прикладная задача это адаптивное и робастное управление в условиях помех измерений выходной переменной, т.е. рассматривается объект вида (17), (18)
г
x = Ax + ^ G j ф; + Bu + Bw, y' = y + % = Hx + %,
i=1
в котором измеряется не переменная y = Hx, а некоторый сигнал y' = y + % , содержащий помехи измерения %.
Литература
1. Андерсон Б., Битмид Р., Джонсон К. и др. Устойчивость адаптивных систем. - М.: Мир, 1989. - 263 с.
2. Андриевский Б.Р., Фрадков А.Л. Избранные главы теории автоматического управления с примерами на языке MATLAB. - СПб: Наука, 1999. - 467 с.
3. Дружинина М.В., Никифоров В.О., Фрадков А.Л. Методы адаптивного управления нелинейными объектами по выходу // Автоматика и телемеханика. - 1996. - № 2. - С. 3-33.
4. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. - СПб: Наука, 2000. - 549 с.
5. Никифоров В.О., Фрадков А.Л. Схемы адаптивного управления с расширенной ошибкой. Обзор // Автоматика и телемеханика. - 1994. - № 9. - С. 3-22.
6. Никифоров В.О. Адаптивная стабилизация линейного объекта, подверженного внешним детерминированным возмущениям // Известия РАН. Теория и системы управления. - 1997. - № 2. - С. 103-106.
7. Никифоров В.О. Нелинейная система управления с компенсацией внешних детерминированных возмущений // Известия РАН. Теория и системы управления. - 1997. - № 4. - С. 69-73.
8. Никифоров В.О. Робастное управление линейным объектом по выходу // Автоматика и телемеханика.
- 1998. - № 9. - С. 87-99.
9. Никифоров В.О. Адаптивное и робастное управление с компенсацией возмущений. - СПб: Наука, 2003. - 282 с.
10. Слита О.В., Никифоров В.О. Ушаков А.В. Управление в условиях неопределенности: неадаптивные и адаптивные алгоритмы. - Saarbrucken: LAP LAMBERT Academic Publisher, 2012. - 292 с.
11. Цыкунов А.М. Робастное управление нестационарными объектами // Автоматика и телемеханика. -1996. - № 2. - С. 117-125.
12. Egart B. Stability of adaptive controllers. - NY: Springer-Verlag, 1979.
13. Feuer A., Morse A.S. Adaptive control of single-input, single-output linear systems // IEEE Trans. Automat. Contr. - 1978. - V. 23. - № 4. - P. 557-569.
14. Kanellakopoulos I., Kokotovich P.V., Morse A.S. Systematic design of adaptive controllers for feedback linearizable systems // IEEE Trans. Automat. Contr. - 1991. - V. 36. - P. 1241-1253.
15. Kreisselmeier G. Adaptive control of a class of slowly time varying plants // Syst. Control Lett. - 1986. -V. 8. - № 2. - P. 97-103.
16. Krstic M., Kanellakopoulos I., Kokotovich P.V. Adaptive nonlinear control without overparametrization // Syst. Control Lett. - 1992. - V. 19. - P. 177-185.
17. Krstic M., Kanellakopoulos I., Kokotovic P. Nonlinear and adaptive control design. - NY: John Weley and Sons Inc., 1995.
18. Krstic M., Kokotovic P. Adaptive nonlinear output-feedback schemes with Marino-Tomei controller // IEEE Trans. Automat. Contr. - 1996. - V. 41. - № 2. - P. 274-280.
19. Marino R., Tomei P. Robust adaptive regulation of linear time-varying systems // IEEE Trans. Automat. Contr. - 2000. - V. 45. - № 7. - P. 1301-1311.
20. Marino R., Tomei P. Adaptive control of linear time-varying systems // Automatica. - 2003. - V. 39. - № 4.
- P. 651-659.
21. Monopoli R.V. Model reference adaptive control with an augmented signal // IEEE Trans. Automat. Contr. 1974. - V. 19. - № 5. - P. 474-484.
22. Morse A.S., Isidori A. and T.J. Tarn. High-order parameter tuner for the adaptive control of linear and nonlinear systems // Systems, Models and Feedback: Theory and Applications. - Basel: Birkhauser. - 1992. - P. 339-364.
23. Narendra K.S., Annaswamy A.M. Stable Adaptive Systems. - Englewood Cliffs, NJ: Prentice-Hall, 1989. -236 p.
24. Narendra K.S., Valavani L.S. Stable adaptive controller design - direct control // IEEE Trans. Automat. Contr. - 1978. - V. 23. - № 4. - P. 570-583.
25. Nikiforov V.O. Adaptive non-linear tracking with complete compensation of unknown disturbances // European Journal of Contr. - 1998. - V. 4. - № 2. - P. 132-139.
26. Nikiforov V.O. Robust high-order tuner of simplified structure // Automatica. -1999. - V. 35. - № 8. - P. 1409-1415.
27. Nikiforov V.O., Voronov K.V. Nonlinear adaptive controller with integral action // IEEE Trans. Automat. Contr. - 2001. - V. 46. - № 12. - P. 2035-2037.
28. Qian С. and Lin W. Output feedback control of a class of nonlinear systems: a nonseparation principle paradigm // IEEE Trans. Automat. Contr. - 2002. - V. 47. - № 10. - P. 1710-1715.
29. Tsakalis K.S., Ioannou P.A. Adaptive control of linear time-varying plants // Automatica. - 1987. - V. 23. -№ 4. - P. 459-468.
30. Tsakalis K.S., Ioannou P.A. Adaptive control of linear time-varying plants: A new model reference controller structure // IEEE Trans. Automat. Contr. - 1989. - V. 34. - № 10. - P. 1038-1047.
31. Tsakalis K.S., Ioannou P.A. A new indirect adaptive control scheme for time-varying plants // IEEE Trans. Automat. Contr. - 1990. - V. 35. - № 6. - P. 697-705.
32. Tsakalis K.S., Ioannou P.A. Linear time varying systems: control and adaptation. - Upper Saddle River, NJ: Prentice-Hall, 1993. - 270 p.
33. Zang Z., Bitmead R.R. Transient bounds for adaptive control systems // IEEE Trans. Automat. Contr. - 1994.
- V. 39. - № 1. - P. 171-175.
34. Zhang Y., Fidan B., Ioannou P.A. Backstepping control of linear time-varying systems with known and unknown parameters // IEEE Trans. Automat. Contr. - 2003. - V. 48. - № 11. - P. 1908-1925.
35. Arcak M., Kokotovic P. Feasibility conditions for circle criterion design // Systems and Control Letters. -2001. - V. 42. - № 5. - Р. 405-412.
36. Arcak M., Larsen M., Kokotovic P. Circle and Popov criteria as tools for nonlinear feedback design // Automatica. - 2003. - V. 39. - № 4. - P 643-650.
37. Byrnes C.I., Isidori A. Asymptotic stabilization of minimum phase nonlinear systems // IEEE Trans. Automat. Contr. - 1991. - V. 36. - № 10. - P. 1122-1137.
38. Isidori A. A remark on the problem of semiglobal nonlinear output regulation // IEEE Trans. Automat. Contr.
- 1997. - V. 42. - № 12. - P. 1734-1738.
39. Isidori A. A tool for semi-global stabilization of uncertain non-minimum-phase nonlinear systems via output feedback // IEEE Trans. Automat. Contr. - 2000. - V. 45. - № 10. - P. 1817-1827.
40. Isidori A., Byrnes C.I. Output regulation of nonlinear systems // IEEE Trans. Automat. Contr. - 1990. -V. 35. - № 2. - P. 131-140.
41. Земляков С.Д., Рутковский В.Ю., Силаев А.В. Настраиваемая функциональная работоспособность адаптивных систем с эталонной моделью // Автоматика и телемеханика. - 1997. - № 6. - С. 125-134.
42. Фрадков А. Л. Синтез адаптивной системы стабилизации линейного динамического объекта // Автоматика и телемеханика. - 1974. - № 12. - С. 96-103.
43. Фрадков А. Л. Квадратичные функции Ляпунова в задаче адаптивной стабилизации линейного динамического объекта // Сиб. мат. журн. - 1976. - № 2. - С. 436-446.
44. Fradkov A.L. Passification of nonsquare linear systems and Yakubovich-Kalman-Popov Lemma // European Journal of Control. - 2003. - № 6. - P. 573-582.
45. Бобцов А. А., Николаев Н.А. Синтез управления нелинейными системами с функциональными и параметрическими неопределенностями на основе теоремы Фрадкова // Автоматика и телемеханика. 2005. - № 1. - С. 118-129.
46. Гелиг А.Х., Леонов Г. А., Якубович В. А. Устойчивость нелинейных систем с неединственным состоянием равновесия. - М.: Наука, 1978. - 400 с.
47. Никифоров В.О. Адаптивное управления без измерения производных выходного сигнала. Часть I. Процедура синтеза // Изв. вузов. Приборостроение. - 1996. - № 8-9. - С. 50-56; Часть II. Результаты моделирования // Изв. вузов. Приборостроение. - 1997. - № 4. - С. 28-33.
48. Kokotovic P., Murat A. Constructive nonlinear control: a historical perspective // Automatica. - 2001. -V. 37. - № 5. - P 637-662.
49. Бобцов А.А. Алгоритмы адаптивного управления нелинейными динамическими объектами с неопределенностями по входу // Известия РАН. Теория и системы управления. - 2003. - № 1. - С. 35-39.
50. Первозванский А.А. Курс теории автоматического управления. - М.: Наука, 1986. - 615 с.
51. Попов В.М. Гиперустойчивость автоматических систем. - М.: Наука, 1970. - 453 с.
52. Bobtsov A.A., Efimov D.V. On robustness property of dynamical systems feedback connection with respect to multiplicative disturbances // IFAC Symposium NOLCOS 2004. - Stuttgart, Germany, 2004. - P. 14571462.
53. Полушин И.Г., Фрадков А.Л., Хилл Д. Д. Пассивность и пассификация нелинейных систем. Обзор // Автоматика и телемеханика. - 2000. - № 3. - С. 3-37.
54. Fradkov A., Hill D. Exponential feedback passivity and stabilizability of nonlinear systems // Automatica. -1998. - V. 34. - № 6. - P. 697-703.
55. Колесников А. А. Синергетическая теория управления. - М.: Энергоатомиздат, 1994. - 344 с.
56. Мирошник И.В., Бобцов А. А. Линейные системы автоматического управления. - СПб: СПб ГИТМО (ТУ), 2000. - 245 с.
57. Белецкий В.В. О либрации спутника // Сборник «Искусственные спутники Земли». - М.: АН СССР, 1959. - № 3. - С. 13-31.
58. Белецкий В.В. Движение искусственного спутника относительно центра масс. - М.: Наука, 1965. -416 с.
59. Белецкий В.В. Движение спутника относительно центра масс в гравитационном поле. - М.: МГУ, 1975. - 308 с.
60. Андриевский Б.Р., Фрадков А.Л. Управление хаосом: методы и приложения. Часть 2. Приложения // Автоматика и телемеханика. - 2004. - № 4. - С. 3-34.
61. Бобцов А. А. Адаптивное и робастное управление неопределенными системами по выходу. - СПб: Наука, 2011. - 174 с.
62. Амоскин И.В., Арановский С.В., Бобцов А.А., Николаев Н.А. Адаптивная стабилизация хаоса в цепи Чуа // Изв. вузов. Приборостроение. - 2005. - № 12. - С. 8-13.
63. Mascolo S., Grassi G. Controlling chaotic dynamics using backstepping design with application to the Lorenz system and Chua's circuit // International Journal of Bifurcation and Chaos. - 1999. - V. 9. - № 7. -P. 1425-1434.
64. Yang T., Chua L.O. Generalized synchronization of chaos via linear transformations // International Journal of Bifurcation and Chaos. - 1999. - V. 9. - № 1. - P. 215-219.
65. Spong M.W., Vidyasagar M. Robot dynamics and control. - New York: Wiley, 1989. - 336 p.
66. Nguang S.K. Robust stabilization of a class of time-delay nonlinear systems // IEEE Trans. Automat. Contr. 2000. - V. 45. - № 4. - P. 756-762.
67. Герасимов Д.Н., Мигуш С.А., Никифоров В.О. Разработка математической модели инжекторного двигателя // Научно-технический вестник СПбГУ ИТМО. - 2003. - Вып. 10. - С. 10-18.
68. Герасимов Д.Н., Джавахериан Х., Ефимов Д. В., Никифоров В.О. Инжекторный двигатель как объект управления. Часть I: Схема двигателя и синтез математической модели // Известия РАН. Теория и системы управления. - 2010. - № 5. - С. 125-137; Часть II: Задачи автоматического управления двигателем // Известия РАН. Теория и системы управления. - 2010. - № 6. - С. 170-181.
69. Azzoni P., Moro D., Ponti F. Engine and load torque estimation with application to electronic throttle control. - SAE technical paper, 1998. - № 980795.
70. Hendricks E., Chevalier A., Jensen M. Event based engine control: practical problems and solutions. - SAE paper. - 1995. - № 950008.
71. Hendricks E., Jensen M., Chevalier A., Vesterholm T. Conventional event based engine control. - SAE paper. - 1994. - № 940377.
72. Kim Y.-W., Rizzoni G., V. Utkin Automotive engine diagnostics and control via nonlinear estimation // IEEE Control Systems. - 1998. - V. 18. - № 5. - P. 84-99.
73. Stotsky A., Kolmanovsky I. Application of input estimation techniques to charge estimation and control in automotive engines // Control Engineering Practice. - 2002. - № 10. - P. 1371-1383.
Бобцов Алексей Алексеевич - Санкт-Петербургский национальный исследовательский университет ин-
формационных технологий, механики и оптики, доктор технических наук, профессор, декан, [email protected]
Никифоров Владимир Олегович - Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, доктор технических наук, профессор, проректор, [email protected]