Научная статья на тему 'Стабилизация неизвестного минимально-фазового объекта с липшицевой неопределенностью и ограниченным внешним возмущением'

Стабилизация неизвестного минимально-фазового объекта с липшицевой неопределенностью и ограниченным внешним возмущением Текст научной статьи по специальности «Математика»

CC BY
162
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБАСТНОЕ УПРАВЛЕНИЕ / АДАПТИВНОЕ УПРАВЛЕНИЕ / ИДЕНТИФИКАЦИЯ / ЛИПШИЦЕВА НЕОПРЕДЕЛЕННОСТЬ / ВЕРИФИКАЦИЯ МОДЕЛИ / ROBUST CONTROL / ADAPTIVE CONTROL / IDENTIFICATION / LIPSCHITZ UNCERTAINTY / MODEL VALIDATION

Аннотация научной статьи по математике, автор научной работы — Соколов В. Ф.

Рассматривается задача стабилизации неизвестного минимально-фазового объекта с липшицевой неопределенностью и ограниченным внешним возмущением с неизвестной верхней границей. Предлагаемый конечно-сходящийся алгоритм онлайн оценивания неизвестных параметров объекта, липшицевой неопределенности и верхней границы возмущения обеспечивает стабилизацию неизвестного объекта и онлайн верификацию его модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STABILIZATION OF UNKNOWN MINIMUM-PHASE PLANT UNDER LIPSCHITZ UNCERTAINTY AND BOUNDED EXTERNAL DISTURBANCE

The paper addresses to problem of adaptive stabilization of unknown minimum-phase plant under Lipshitz uncertainty and bounded external disturbance. The nominal model of the plant is taken in the form of autoregressive moving average (ARMA) discrete-time system with unknown coefficients from a known bounded convex prior set. All the models from the prior set are minimum-phase, that is, input of any model is guaranteed to be bounded under bounded output. No upper bound on the external disturbance is assumed to be known to controller designer. Xie L.L. and Guo L. showed in 2000 that, in the case of the Lipshitz uncertainty that depends on the previous value of the output only, the particular value 3/2 + y/2 of the Lipshitz constant L is critical for the simplest dynamical plant: any plant with L > 3/2 + V2 can not be surely stabilized by any causal feedback while any plant with L < 3/2 + V2 can be surely stabilized with the use of nonparametric online estimation of the unknown Lipschitz uncertainty. C. Huang and L. Guo have generalized this result to the stabilization of unknown minimum-phase plant under known upper bounds on the Lipshitz uncertainty and the external disturbance with the use of the exhaustive method over sufficiently small grid in the prior set of unknown coefficients of the nominal model. In the present paper, stabilization of unknown plant with L < 3/2 + \/2 and unknown upper bound on the external disturbance is achieved with the use of the Yakubovich’s method of recurrent objective inequalities for synthesis of adaptive control. This method allows to construct a simple finitely-convergent projecting estimation algorithm that guarantees not only the stabilization of the closed loop system but online model validation as well.

Текст научной работы на тему «Стабилизация неизвестного минимально-фазового объекта с липшицевой неопределенностью и ограниченным внешним возмущением»

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

УДК 517.977+ 62-50

СТАБИЛИЗАЦИЯ НЕИЗВЕСТНОГО МИНИМАЛЬНО-ФАЗОВОГО ОБЪЕКТА С ЛИПШИЦЕВОЙ НЕОПРЕДЕЛЕННОСТЬЮ И ОГРАНИЧЕННЫМ ВНЕШНИМ ВОЗМУЩЕНИЕМ

В.Ф. СОКОЛОВ

Отдел математики Коми НЦ УрО РАН, г. Сыктывкар sokolov@dm.komisc.ru

Рассматривается задача стабилизации неизвестного минимально-фазового объекта с липшицевой неопределенностью и ограниченным внешним возмущением с неизвестной верхней границей. Предлагаемый конечно-сходящийся алгоритм онлайн оценивания неизвестных параметров объекта, липшицевой неопределенности и верхней границы возмущения обеспечивает стабилизацию неизвестного объекта и онлайн верификацию его модели.

Ключевые слова: робастное управление, адаптивное управление, идентификация, липшицева неопределенность, верификация модели

V.F. SOKOLOV. STABILIZATION OF UNKNOWN MINIMUM-PHASE PLANT UNDER LIPSCHITZ UNCERTAINTY AND BOUNDED EXTERNAL DISTURBANCE

The paper addresses to problem of adaptive stabilization of unknown minimumphase plant under Lipshitz uncertainty and bounded external disturbance. The nominal model of the plant is taken in the form of autoregressive moving average (ARMA) discrete-time system with unknown coefficients from a known bounded convex prior set. All the models from the prior set are minimum-phase, that is, input of any model is guaranteed to be bounded under bounded output. No upper bound on the external disturbance is assumed to be known to controller designer. Xie L.L. and Guo L. showed in 2000 that, in the case of the Lipshitz uncertainty that depends on the previous value of the output only, the particular value 3/2 + ^/2 of the Lipshitz constant L is critical for the simplest dynamical plant: any plant with L > 3/2 + yp2 can not be surely stabilized by any causal feedback while any plant with L < 3/2 + \/2 can be surely stabilized with the use of nonparametric online estimation of the unknown Lipschitz uncertainty. C. Huang and L. Guo have generalized this result to the stabilization of unknown minimum-phase plant under known upper bounds on the Lipshitz uncertainty and the external disturbance with the use of the exhaustive method over sufficiently small grid in the prior set of unknown coefficients of the nominal model.

In the present paper, stabilization of unknown plant with L < 3/2 + \[2 and unknown upper bound on the external disturbance is achieved with the use of the Yakubovich's method of recurrent objective inequalities for synthesis of adaptive control. This method allows to construct a simple finitely-convergent projecting estimation algorithm that guarantees not only the stabilization of the closed loop system but online model validation as well.

Key words: robust control, adaptive control, identification, Lipschitz uncertainty, model validation

1. Введение

В самых общих словах под адаптивным понимается управление, обеспечивающее достижение цели за счет оценивания тех или иных неопределенностей (параметров) в системе управления по данным измерений [1]. Под робастным понимается управление, обеспечивающее достижение цели для всех объектов с неопределенностями из определенного допустимого множества без оценивания

неопределенности по данным измерений [2]. При этом неопределенности разных видов могут оказаться эквивалентными с точки зрения теории робаст-ного управления. Например, в 1\-теории робастного управления условия робастной устойчивости и оценки качества одинаковы для трех типов неопределенностей с ограниченными коэффициентами усиления: линейных нестационарных, нелинейных стационарных и нелинейных нестационарных [3,4]. Од-

нако с точки зрения адаптивного управления стационарные неопределенности существенно отличаются от нестационарных, допуская потенциальную возможность их онлайн оценивания с целью повышения качества управления.

Потенцильные возможности обратной связи, основанной на оценивании по данным измерений непараметрической нелинейной стационарной неопределенности, удовлетворяющей условию Липшица, были впервые исследованы в статье [5] для простейшей динамической модели объекта управления вида

уг+1 = /(уг) + иг + иг+1 , г = 0,1, 2,

(1)

где вещественные числа уг,иг,иг обозначают соответственно выход объекта, управление и неизвестное ограниченное возмущение в момент г. Неизвестная функция / : К ^ К описывает липшицеву неопределенность в системе:

\/(XI) - /(Х2)| < Ь\Х! - Х2\ УХ1 ,Х2 е К •

В работе [5] было показано, что значение постоянной Липшица Ь = 3/2 + л/2 является критическим. Если Ь > 3/2 + л/2, то для любой обратной связи, т.е для управления вида

иг = иг(уо,... ,уг,ио,... ,иг-1), г = 0,1, 2,..., (2)

с любыми функциями иг, и любой ограниченной последовательности возмущений и найдется липшице-ва функция /, при которой выход замкнутой системы (1), (2) будет неограниченным. В [5] была также построена обратная связь с бесконечной памятью, основанная на оценивании липшицевой неопределенности поданным измерений и гарантирующая асимптотически оптимальное отслеживание любого заданного ограниченного командного сигнала при любой неопределенности с постоянной Липшица Ь < 3/2 + у/2 и любом ограниченном возмущении и.

В работах [6,7] рассматривалась более общая динамическая модель объекта управления, содержащая в правой части уравнения(1)дополнительный линейный член ауг с неизвестным коэффициентом а из известного ограниченного множества, и была решена задача асимптотически субоптимального слежения со сколь угодно малым сужением класса допустимых липшицевых неопределенностей.

В статье [8] рассматривалась более общая модель минимально-фазового динамического объекта с липшицевой неопределенностью и ограниченным возмущением, содержащая неизвестный вектор параметров из известного ограниченного множества. Было предложено [8] адаптивное управление с бесконечной памятью, обеспечивающее стабилизацию объекта с неизвестными параметрами при известной верхней границе величины возмущения и и известной постоянной Липшица Ь < 3/2 + \72. Алгоритм адаптации заключался в последовательном переборе и проверке данными измерений векторов параметров из конечной ¿-сети априорного множества допустимых параметров при достаточно малом значении выбираемого параметра 6 > 0. Проверка приемлемости текущей оценки ^ неизвестного вектора

параметров £ осуществлялась проверкой соблюдения определенных границ для выходов и управлений, вытекающих из априорных предположений о модели и неравенства £ - £\ < 6.

В настоящей работе рассматриваются минимально-фазовые объекты управления со стандартной номинальной моделью в виде уравнения авторегрессии и скользящего среднего

уг+1

ао уг +----+ ап уг-п + Ьо иг +-----+ Ьтщ-т+

+/(уг) + иг+1 с неизвестным набором коэффициентов

£ = (ао,... ,ап,Ьо,

,Ьт

Предполагаются известными выпуклое ограниченное множество, содержащее вектор £, и верхняя оценка Ьтах < 3/2+^2 постоянной Липшица Ь. Верхняя граница возмущения и предполагается неизвестной. Для обеспечения адаптивной стабилизации объекта базовый алгоритм оценивания неопределенности, предложенный в [5], дополняется простым алгоритмом проекционного типа для оценивания неизвестного вектора £ и верхней границы возмущения и. Как и в работах [6,7], предлагаемый алгоритм адаптивной стабилизации имеет конечную память и обеспечивает онлайн верификацию используемой для управления модели.

Обозначения: N = {0,1,2, ...} - множество натуральных чисел; К - поле вещественных чисел;

— (Хр, Хр+1>

I - отрезок вещественной после-

довательности х = (хо,х1 ,...);

|Хр\ = шахр<й<д \хк |;

\ф\ - евклидова норма вектора ф;

= Л +=о \дк\ для устойчивой передаточной функции С(А) = Е+=о 9кАк.

2. Постановка задачи

Пусть объект управления описывается моделью

уг+1 = а(д-1 )уг + Ь(д-1)иг + / (уг)+ иг+1 , г е N , (3)

в которой последовательности у, и, и обозначают соответственно выход объекта, управление и неизвестное ограниченное возмущение. Неизвестная функция / : К ^ К удовлетворяет условию Липшица

\/(Х1) - /(Х2) < Ь\Х1 - Х2\ УХ1 ,Х2 е К (4)

и называется липшицевой неопределенностью в модели (3). Априорная информация о неизвестной постоянной Липшица Ь заключается в неравенстве

Ь < Ьт

< § + ^

(5)

с известной верхней границй Ьтах. Операторные полиномы а(д-1) и Ь(д-1), характеризующие номинальную модель объекта, т.е. модель без неопределенности и возмущения, определяются формулами

а(я-1)уг = аоуг +-----+ апуг-п ,

Ь(д-1 )иг = Ьо иг +----+ Ьт иг-т .

Х

р

Таким образом, номинальный объект описывается стандартным уравнением авторегрессии и скользящего среднего. Априорная информация о неизвестном наборе коэффициентов £ полиномов а и Ь имеет вид включения

£ = (ao, ...,an ,bo,... ,bm

e ^,

(6)

в котором известное априорное множество коэффициентов 5 является выпуклым, замкнутым и ограниченным и включает только минимально-фазовые модели, т.е. для любого вектора £ е 5 соответствующий полином Ь(Л) = Ь0 + Ь1Л +-----+ ЬтХт устойчив (не имеет корней в замкнутом единичном круге комплексной плоскости |Л| < 1).

Априорная информация о неизвестном возмущении и заключается в его ограниченности:

Ш = вир 1иг I < ,

и верхняя граница Ш предполагается неизвестной.

Требуется построить обратную связь с конечной памятью, стабилизирующую замкнутую систему управления, т.е. гарантирующую ограниченность выхода у и управления и.

3. Стабилизация объекта с известной номинальной моделью

Рассмотрим сначала объекты управления с известной номинальной моделью, т.е. с известным вектором коэффициентов £ е 5 и опишем стабилизирующую обратную связь с конечной памятью для таких объектов. Выберем произвольное число е > 0, параметр алгоритма стабилизации и разобьем вещественную ось на полусегменты длины е:

R = У [ке, (к + 1)е) .

kez

(7)

Для любой выбранной обратной связи вида (2) обозначим через

(Уко ,Ук1 ,Ук2 >•••)

подпоследовательность выходов, попадающих в содержащий их полусегмент разбиения первыми:

Ук3 е [ке, (к + 1)е) Щ уг $ [ке, (к + 1)е).

Для каждого ь = 1,2,... положим

it = argmin \yt - ykj \ .

{kj | kj <t}

(8)

В силу (8) значение yit является ближайшим к уг из известных к моменту ь элементов подпоследовательности (у ко ,Ук1,...):

Ы - Ун1 = т^п У - Ук61 .

В каждый текущий момент времени ь оценка неизвестного значения /(уг) липшицевой неопределенности / вычисляется следующим образом:

ft (yt) = yit + 1 - a(q X)yit - b(q Из уравнения модели (3) следует равенство

ft (yt) = f (yit) + Wit + 1 ,

1

(9)

объясняющее смысл и происхождение используемой оценки липшицевой неопределенности. Заметим, что для вычисления правой части (9) необходимо, наряду с каждым элементом ykj, запоминать данные yk6-n,...,ykj+1 и uk^-т,...,ukj. Разбиение вещественной оси на полусегменты и запоминание только одного выхода в каждом полусегменте разбиения позволит обеспечить конечную память алгоритма стабилизации.

Введем обозначения для рекуррентно вычисляемых минимального и максимального к моменту времени t значений выхода

yt = min yi = min {yt-1 ,yt} ,

—t r—t— 1 1

y = max yi = max {y ,yt} .

iCt

Управление в момент времени ь определяется формулой

Ь(я-1 )иг = -/г (Уг )-а(д-1 )уг + +Уг), Ь = 1, 2,... ,

(10)

с начальными значениями и-т+1 = • • • = и0 = 0.

Устойчивость замкнутой системы управления (3), (10) гарантируется следующей теоремой.

Теорема 1. Пусть полином Ь(Л) устойчив и Ь < 3 + \/2. Тогда при любом е > 0 и любых начальных значениях у-п,...,у0 выход и управление в замкнутой системе управления (3), (10) ограничены.

Теорема 1 является простым следствием основного результата, теоремы 2 из раздела 5, и приводится для облегчения понимания закона управления для объекта с неизвестной номинальной моделью.

4. Верификация модели

Возвратимся к рассмотрению объекта управления с неизвестным вектором коэффициентов £. Алгоритм стабилизации (10) будет использоваться для объекта с неизвестным £ путем замены этого вектора его оценкой £г, вычисляемой рекуррентным алгоритмом адаптации по данным измерений. Поскольку верхняя граница возмущения Ш и постоянная Липшица Ь предполагаются неизвестными, они также будут оцениваться.

Полная информация в момент времени ь + 1 о неизвестных значениях £,Ь,Ш, согласованных с дан-

ными измерений y

t+1 t

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-m+1

и априорной информа-

цией об объекте управления, без учета неравенства (5) и включения (6), заключена в неравенствах

1

^+1 - а(д ^ - Ь(д -)щ-(Уз+1 - а(я-1 )у,- - Ь(д-1 и)| = I!У) + ^+1 - (/у) + и,-+1)| < ЬУ - уз I +2Ш,

(11)

0 < з < г < ь. Ниже будет установлено, что для стабилизации объекта с неизвестной номинальной моделью не обязательно проверять для текущих оценок (£г,Ьг,Шг) набора неизвестных параметров (£,Ь,Ш) все неравенства вида (11) и достаточно ограничиться

n

проверкой только одного из этих неравенств

\Vt+l - at(q-1)yt - bt(q-1 )ut-

(Vit+1 - at(q-1)Vit - bt (q-1 )uit)\ < Lt\yt - Vit \ + W ,

(12)

в котором полиномы at и bt соответствуют вектору коэффициентов Ct и индекс it определен в (8). Другими словами, для онлайн верификации модели управляемого объекта достаточно обеспечить справедливость при всех достаточно больших t только неравенств (12). Описанный подход к верификации модели лежит в рамках метода рекуррентных целевых неравенств, предложенного В.А Якубовичем в начале 1960-х гг. для решения задач адаптивного управления при ограниченных возмущениях с известной верхней границей [1].

5. Стабилизация объекта с неизвестной номинальной моделью

В этом разделе описано решение поставленной в разделе 2 задачи c помощью простого с вычислительной точки зрения конечно-сходящегося алгоритма оценивания проекционного типа. Обозначим через

в = (C,L,W)

вектор-строку всех неизвестных параметров модели (3). Априорная информация о векторе в имеет вид

в € © = { (C,L,W) I С € Н , 0 < L < Lmax ,W > 0 } .

(13)

В качестве начальной оценки неизвестного вектора в выбирается вектор

во = (Со, 0,0)

с любой начальной строкой коэффициентов Со £ Н.

Выберем достаточно малое число S > 0, характеризующее размер мертвой зоны при обновлении оценок (ограничение на 5 указано в теореме 2), и введем обзначения

Фt = (yt,... , yt-n ,Ut ,...,Ut-m)T nt = sign [yt+1 - Ct Фt - (yit + 1 - Ct Фн)] Фt = (nt Ф - Фи)T, \yt - yit \, 2)T et = nt (yt+1 - yit + 1).

Благодаря этим обозначениям

a(q-1 )yt + b(q-1 )ut = CФt , и неравенство (12) эквивалентно неравенству

\yt+1 - CtФt - (yit+1 - ^Фп )\ < Lt\yt - yit \ + 2Wt

и неравенству

öt Фг > et

для текущей оценки вг = ,Ьг). Вектор вг рекур-рентно обновляется в момент времени ь + 1 по формуле

öt, если et < вгфг + 5\фг|,

öt+i

Pre

et - ötipt ,т

öt+ пФТ"Ф

Формула (14) имеет простую геометрическую интерпретацию. Неравенство (12) для вектора 0t представляет собой пару линейных неравенств, из которых только одно может нарушаться для текущей оценки et. Именно это линейное неравенство задает полупространство

Qt+i = { в = (i,L,W) | вф£ > et } .

Текущая оценка 9t изменяется только в том случае, если расстояние от вектора 9t до полупространства Qt+i больше 5. В этом случае вычисляется ортогональная проекция et на полупространство Qt+i и, если эта проекция оказывается вне априорного множества ©, производится дополнительное проектирование на это множество. Получившийся вектор становится оценкой 0t+i.

Полезные для адаптивного управления свойства алгоритма оценивания (14) устанавливаются в следующей лемме.

Лемма 1. Пусть объект управления описывается моделью (3) с неизвестным вектором коэффициентов С е Н, множество Н выпуклое, и управление осуществляется произвольной обратной связью вида (2). Тогда для любого параметра 5 > 0 число изменений векторов et не превосходит числа

\в - 0012 = У\С - Со|2 + L2 + W2 (15) 52 = 52 (15)

и для достигаемого за конечное время предельного значения

вж = ,W™) = lim 0t

при всех достаточно больших t выполнены неравенства

\yt+i-Сжфг-(VitФи)\ < Lw\yt-Vit\+2Ww +5\ф£\.

(16)

Доказательство. Из выпуклости априорного множества коэффициентов Н следует выпуклость определенного в (13) множества ©. Поэтому если при изменении вектора 0t имеем

Ы a I et - 0t^t ,Т л ^

0t+i = 0t + \2 Фг е © ,

то в силу выпуклости ©

вг+1 - в\ < |вг+1 - в\.

Заметим, что вф£ > ег при всех ь, поскольку каждое такое неравенство является одним из двух линейных неравенств (12) для вектора в. Из определения в£+1 следует равенство в£+1ф£ = ег и, следовательно, (в£+1 -в)фг < 0. Т.к. при каждом изменении оценок в£ выполнено неравенство ег - в£ф£ > 5 \фг\, то

I

\ öt - ö\2 = ,(öi+i - ö) -

et - 1

\ Фt \2

Ф! I = \ öt+1 - ö \2-

в противном случае, (14)

где Ртэ обозначает оператор ортогонального проектирования на множество ©.

ога> / е£ - вгфг 1 е£ - вгфг т1 а,2 . х2

2(в£+1 -в)фг \^\2 +1 ф2 ф I > 1 вг+1-в 1 +5 ■

Из последнего неравенства тотчас следует искомая верхняя оценка (15) для числа возможных изменений оценок в£ и справедливость неравенств ег < вжфг + 5\фг\2 для достигаемого за конечное время предельного значения вто. Остается заметить, что в

2

силу данных выше определений фг и ег из неравенств вытекающими из определения обозначений фг, фг и

et < фг + 5\^t\z следуют неравенства (16). □

Управление неизвестным объектом (3) осуществляется с помощью регулятора вида (9), (10), в котором неизвестные операторные полиномы a(q-1) и b(q-1) заменены операторными полиномами аг(q-1) and bt(q-1), соответствующими текущей оцен-

ке набора коэффициентов £t:

ft Ы) = Vit+1 -

(17)

Ьг (я 1)иг = -1г(уг) - а (я 1 )уг + 2У + У ) ,ь = 1 2,....

(18)

Устойчивость замкнутой системы управления гарантируется следующей теоремой.

Теорема 2. Пусть объект управления описывается уравнением (3) с неизвестным вектором коэффициентов ^ е 5, априорное множество коэффициентов 5 является выпуклым, замкнутым и ограниченным, и известны постоянные С1, С2 и С3 такие, что

1

|| < Сь ||а(Л)|| < С,

< Сз V с е н. (19)

Пусть постоянная Липшица Ь неопределенности 1 удовлетворяет неравенству (5), и параметр 6 > 0 алгоритма оценивания (14) выбран достаточно малым так, что

3 1

Ьтах + В6< 2 + ^2 - 4В6 , В6< 2 ,

где постоянная Б определена в (26). Тогда алгоритм оценивания (14) гарантирует сходимость оценок вг за конечное время, и адаптивный регулятор (17)-(18) обеспечивает ограниченность выхода и управления в замкнутой системе управления.

Доказательство. Докажем сначала основное вспомогательное неравенство (25), на которое опирается доказательство устойчивости замкнутой системы.

Из леммы 1 следует, что существует момент времени ь* такой, что при всех ь > ь* выполнены неравенства (16). В силу (17) и равенства аг (я-1 )уг + Ъг(д-1)иг = фг для всех ь > ь* адаптивный регулятор (18) можно представить в виде

Сто фг = -(Уи+1 - Сто фгь) + 2(У + У) У ь ^ ь* ■ Используя это представление в (16), получаем

\Уг+1 - 2(уг + У*)! < Ьто\уг-уи\ + 2ИГО + 6\фг\ Vь > ь* .

(20)

Воспользуемся следующими обозначениями из [5, 7, 8] (заменив для большей наглядности букву В буквой У) для ь > -п + 1:

Уг = [уг,уг], ДУг = У, \ У— , ДУ_„ = У-п , \У\ = уг - уг, \ДУг\ = \Уг\ - \У-1 \ ■

Для получения верхней оценки величины \фг\ в неравенстве (20) воспользуемся неравенствами

\ < V2\фt - фit |2 +22 - Фit \ +2 <

V2(y/2(n + 1)\Yt\ + \ut\ + V2m +1 \и^-1\) + 2 ,

\Yt\. Верхняя оценка для

t1

может быть получена

следующим образом. Для системы

хг = С(я-1 )уг, ь е N ,

с устойчивой передаточной функцией С(А) для всех ь справедливо неравенство \хг\ < НСЩ^о\. Тогда уравнение управляемого объекта

Ъ(я-1 )иг = уг+1 - 1(уг) - а(я—)уг - wг+l с устойчивым полиномом Ъ(А), неравенства

\уг\ < \Уг\ + \уо\,

\1(уг)\ < \1(уг) - 1 (уо)\ + \1(уо)\ < Ь\уг - уо\ + \1(уо)\

и условие теоремы || ¡¡щ || < С1 обеспечивают для всех ь верхнюю оценку

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

\иг\ < С1 [\Уг+1\ + уо\ + Ь\Уг\ +

\1 (уо)\ + Ца(АЖ\Уг\ + \уо\) + Щ ■ (22)

Используя условие теоремы ||а(А)|| < С2 и неравенство \Уг-1\ < \Уг\ при всех ь, из неравенства (22) получаем

\и0-1\ = тах \ик \ < С1 (1 + Ьтах + С2)\Уг\ + о<к<г—1

С1 [(1 + С2)\уо\ + \1 (уо)\ + Щ] ■ (23)

Для получения верхней оценки на слагаемое \иг\ в правой части (21) воспользуемся уравнениями адаптивного регулятора (17) и (18):

\иг\ = Ш[-ун+1 + Ая-1)(уи - уг) + Ъ\я—)ич +

Ъо

2^ + УгЪ1иг-1-----Ътиг-т] \ ■

Отсюда, учитывая включения Сг е 5, условия теоремы (19), неравенство 12(уг + уг) - Уг,< \Уг\ и неравенство

I 2 I I 2 III 2 II

Щ1 ^ Щ1 11 + Ъ/ЪОА + Ъ*т/Ъ*0Ат 1 =

1

П/0+ Ь\Л + + Ь*тЛт

< С1 ;

получаем

\иг\ < С1[(1 + С2)\Уг\ +2Сз\иг-1\] ■ (24)

Используя неравенство (23) в (24) и оба этих неравенства - в (21), получаем верхнюю оценку для \фг\. Воспользовавшись полученной оценкой в (20), приходим после небольших вычислений к неравенствам

\Уг+1 - 1(У + У' )\ < Ьто \уг - Уг, \ +2Щто + 5(В\Уг, \ + Б{)

2

(25)

при всех ь > ь*, где

В = 2^П+1 + ^2С1 (1 + С2)+

(V2m+T +2^2С'1 Сз)С1 (1 + Ьтах + С2) , (26)

В1 = (У2т+Г + 2^2С1 С3 )С1 х

[(1 + С2)\уо \ + \1 (уо )\ + Щ ] + 2 ■

Перейдем к доказательству ограниченности выхода замкнутой адаптивной системы, из которой в

силу неравенства (22) следует также ограниченность управления. Приводимое ниже для полноты изложения доказательство ограниченности выхода является небольшой модификацией доказательства ограниченности в теореме 2.1 [8], которое, в свою очередь, является модификацией доказательств ограниченности выхода в работах [5-7]. В основе доказательства лежит неравенство (25) и следующая лемма.

Лемма 3.2 ([8]) Пусть 0 < Ь< 3/2 + л/2 и число 5 > 0 таково, что 6 < 1/2 и Ь+5 < 3/2 +V2 - 45. Пусть для некоторых й > 0 и п0 > 0 неотрицательная последовательность [Ни} удовлетворяет при всех п > п0 неравенствам

hn+1 < ^L 0max hi - Q; - ¿¿) + dj

где (ж)+ = max{x, 0}. Тогда +=0 hn <

(27)

Из определения обозначений |ДУ4\ = У\ -\Уг—1\ и индекса ч в (8) следуют неравенства

\уг - Уг, | < тах \ДУь \ + е ШЬ > 1. Нетрудно также видеть, что при всех ь

= тах {\уг+1 - 1(у4 + у1 )| - \У\, 0} .

Тогда из (25) и гарантированного априорными ограничениями неравенства Ь< Ьтах для всех ь > ь* следует

(

\AYt+i\< Lmax max jAYi |-

(2 - ¿Dj \Yt\ + 2WTO + ¿Di + eL max i .

(28)

Неравенство (28) совпадает с неравенством (27) при Нг = \ДУ^, Ь = Ьтах, й = 2WlX + 5В1 + еЬтах и В5 вместо 5. Из леммы 3.2 [8] следует, что частичные суммы \Уг\ = ^\=—и+1 \ДУг\ ограничены и, следовательно, последовательность выходов [уг} ограничена. Теорема доказана. □

6. Заключительные комментарии

В заключение дадим несколько комментариев к рассмотренной задаче адаптивной стабилизации и ее решению.

1. Любая задача адаптивного управления решается при тех или иных априорных предположениях об управляемой системе. В частности, в задачах адаптивного робастного управления обычно предполагаются известными верхние границы неопределенности и возмущения. При этом задача онлайн верификации модели, в частности задача верификации используемых верхних границ, не рассматривается и тем более не решается (за исключением решений в рамках метода рекуррентных целевых неравенств). Алгоритм оценивания (14) попутно решает задачу онлайн верификации модели, гарантируя выполнение уравнений модели (3) для предельного вектора оценок Однако при этом ни в какой

момент времени нельзя гарантировать, что текущии вектор оценок является предельным.

2. При решении задачи адаптивной стабилизации нет необходимости в оценке неизвестного значения постоянной Липшица L и можно исключить ее из списка оцениваемых неизвестных параметров, заменив ее в неравенствах (12) известной верхней оценкой Lmax. Утверждения Леммы 1 и Теоремы 2 остаются справедливыми после внесения соответствующих поправок в алгоритм оценивания (14).

3. Вопрос о поведении той или иной адаптивной системы управления в случае, когда объект управления не описывается используемой для построения управления моделью, обсуждается еще реже проблемы онлайн верификации модели. Применительно к рассмотренной в настоящей статье задаче, можно, например, задать вопрос, что будет, если постоянная Липшица L не меньше критического значения 3/2 + у/2? Из этого неравенства вовсе не следует, что замкнутая система управления обязательно будет неустойчивой, т.к. неопределенность f в управляемом объекте в общем случае не является "наихудшей". Например, если значение постоянной Липшица больше критического значения 3/2 + V2 только на каком-то неизвестном ограниченном подмножестве R, то такую неопределенность можно "переопределить" с использованием меньшей постоянной Липшица, отнеся возникающую неточность к ограниченному возмущению. Алгоритм оценивания (14) проделает эту процедуру автоматически. В то же время этот алгоритм позволяет дать следующий достаточно конструктивный ответ на поставленный в начале этого комментария вопрос. Если текущая верхняя оценка Wt нормы возмущения не превышает некоторого разумного порогового значения в конкретной реальной задаче управления, модель (3) может считаться приемлемой; в противном случае модель требует улучшения. Заметим, что если модель или априорная информация о ней, использованные в работе [8], неприемлемы для описания реально управляемого объекта, то алгоритм стабилизации, предложенный в [8], сможет свидетельствовать об этом только после полного безуспешного перебора всех значений & из ¿-сети априорного множества параметров S.

Литература

1. Фомин В.Н., Фрадков А.Л., Якубович ВА. Адаптивное управление динамическими объектами. М.: Наука, 1981.

2. Zhou K., Doyle J.C., Glover K. Robust and optimal control. Prentice-Hall Inc. Upper Saddle River. N.J., 1996.

3. Khammash M., Pearson J.B. Performance robustness of discrete-time systems with structured uncertainty // IEEE Trans. Autom. Control. 1991. Vol. 36. No. 4. P. 398-412.

4. Соколов В.Ф. Робастное управление при ограниченных возмущениях. Сыктывкар: Коми научный центр УрО РАН, 2011. 219 c.

5. Xie L. L., Guo L. How much uncertainty can be dealt with by feedback? // IEEE Transactions

on Automatic Control. 2000. Vol. 45. P. 22032217.

6. Соколов В.Ф. Адаптивное субоптимальное слежение для объекта первого порядка с липши-цевой неопределенностью // АиТ. 2003. № 3. С.124-136.

7. Sokolov V.F. Adaptive Suboptimal Tracking for the First-Order Plant with Lipschitz Uncertainty // IEEE Transactions on Automatic Control. 2003. Vol. 48. P. 607-612.

8. Huang C., Guo L. On feedback capability for a class of semiparametric uncertain systems // Automatica. 2012. Vol. 48. P. 873-878.

References

1. Fomin V.N., Fradkov A.L., Yakubovich VA. Adaptivnoe upravlenie dinamicheskimi objektami [Adaptive control of dynamic plants]. Moscow: Nauka, 1981.

2. Zhou K., Doyle J.C., Glover K. Robust and optimal control. Prentice-Hall Inc. Upper Saddle River. N.J., 1996.

3. Khammash M., Pearson J.B. Performance robustness of discrete-time systems with struc-

tured uncertainty // IEEE Trans. Autom. Control. 1991. Vol. 36. № 4. P. 398-412.

4. Sokolov V.F. Robastnoe upravlenie pri ograni-chennykh vozmushcheniyakh [Robust control under bounded disturbances]. Syktyvkar: Komi nauchny tsentr UrO RAN [Komi Science Centre Ural Br. RAS], 2011. 219 p.

5. Xie L. L., Guo L. How much uncertainty can be dealt with by feedback? // IEEE Transactions on Automatic Control. 2000. Vol. 45. P. 22032217.

6. Sokolov V.F. Adaptive suboptimal tracking for a first-order object under lipschitz uncertainty // Automation and Remote Control. 2003. Vol. 64. № 3. P. 457-467.

7. Sokolov V.F. Adaptive Suboptimal Tracking for the First-Order Plant with Lipschitz Uncertainty // IEEE Transactions on Automatic Control. 2003. Vol. 48. P. 607-612.

8. Huang C., Guo L. On feedback capability for a class of semiparametric uncertain systems // Automatica. 2012. Vol. 48. P. 873-878.

Статья поступила в редакцию 15.10.2014.

i Надоели баннеры? Вы всегда можете отключить рекламу.