Научная статья на тему 'Моделирование системы робастного слежения при неизвестных верхних границах возмущений и помехи измерений. Ч. П. Синтез управления и численное моделирование'

Моделирование системы робастного слежения при неизвестных верхних границах возмущений и помехи измерений. Ч. П. Синтез управления и численное моделирование Текст научной статьи по специальности «Математика»

CC BY
166
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБАСТНОЕ УПРАВЛЕНИЕ / ЗАДАЧА СЛЕЖЕНИЯ / ОГРАНИЧЕННОЕ ВОЗМУЩЕНИЕ / НЕОПРЕДЕЛЕННОСТЬ / ПОМЕХА ИЗМЕРЕНИЙ / ROBUST CONTROL / TRACKING PROBLEM / BOUNDED DISTURBANCE / UNCERTAINTY / MEASUREMENT NOISE

Аннотация научной статьи по математике, автор научной работы — Соколов В. Ф.

В статье приводится описание и результаты численного моделирования задачи робастного слежения для объекта управления с дискретным временем при неизвестных верхних границах возмущений. Передаточная функция номинальной модели управляемого объекта предполагается известной, а верхние границы внешнего возмущения, помехи измерений и операторных возмущений по выходу и управлению считаются неизвестными. Алгоритм робастного слежения базируется на ослабленной верификации оценок верхних границ в замкнутом контуре и использовании соответствующего такой верификации показателя качества задачи слежения в качестве идентификационного критерия. Во второй части статьи дается описание рекуррентного алгоритма оценивания верхних границ и построения управления. Приведенные результаты численного моделирования иллюстрируют эффективность предлагаемого метода синтеза управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELLING OF ROBUST TRACKING SYSTEM UNDER UNKNOWN UPPER BOUNDS ON PERTURBATIONS AND MEASUREMENT NOISE. PART II: CONTROL SYNTHESIS AND SIMULATIONS

This paper presents an algorithm for robust synthesis in the ℓ1 setup in tracking problem under incomplete prior information. Nominal model in the form of linear discrete-time single-input single-output system is assumed to be known and the upper bounds on exogenous disturbance, measurement noise and coprime factor perturbations to be unknown to controller designer. Robust synthesis is based on relaxed model validation and treating the associated control criterion as the identification criterion. The second part of the paper presents a recurrent algorithm for estimation of the upper bounds and control synthesis. The efficiency of the proposed robust synthesis is illustrated by simulations.

Текст научной работы на тему «Моделирование системы робастного слежения при неизвестных верхних границах возмущений и помехи измерений. Ч. П. Синтез управления и численное моделирование»

ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ

УДК 517.977+ 62-50

МОДЕЛИРОВАНИЕ СИСТЕМЫ РОБАСТНОГО СЛЕЖЕНИЯ ПРИ НЕИЗВЕСТНЫХ ВЕРХНИХ ГРАНИЦАХ ВОЗМУЩЕНИЙ И ПОМЕХИ ИЗМЕРЕНИЙ. 4.II. СИНТЕЗ УПРАВЛЕНИЯ И ЧИСЛЕННОЕ МОДЕЛИРОВАНИЕ

В.Ф. СОКОЛОВ

Отдел математики Коми НЦ УрО РАН, г. Сыктывкар [email protected]

В статье приводится описание и результаты численного моделирования задачи робастного слежения для объекта управления с дискретным временем при неизвестных верхних границах возмущений. Передаточная функция номинальной модели управляемого объекта предполагается известной, а верхние границы внешнего возмущения, помехи измерений и операторных возмущений по выходу и управлению считаются неизвестными. Алгоритм робастного слежения базируется на ослабленной верификации оценок верхних границ в замкнутом контуре и использовании соответствующего такой верификации показателя качества задачи слежения в качестве идентификационного критерия. Во второй части статьи дается описание рекуррентного алгоритма оценивания верхних границ и построения управления. Приведенные результаты численного моделирования иллюстрируют эффективность предлагаемого метода синтеза управления.

Ключевые слова: робастное управление, задача слежения, ограниченное возмущение, неопределенность, помеха измерений

V.F. SOKOLOV. MODELLING OF ROBUST TRACKING SYSTEM UNDER UNKNOWN UPPER BOUNDS ON PERTURBATIONS AND MEASUREMENT NOISE. PART II: CONTROL SYNTHESIS AND SIMULATIONS.

This paper presents an algorithm for robust synthesis in the l\ setup in tracking problem under incomplete prior information. Nominal model in the form of linear discrete-time single-input single-output system is assumed to be known and the upper bounds on exogenous disturbance, measurement noise and coprime factor perturbations to be unknown to controller designer. Robust synthesis is based on relaxed model validation and treating the associated control criterion as the identification criterion. The second part of the paper presents a recurrent algorithm for estimation of the upper bounds and control synthesis. The efficiency of the proposed robust synthesis is illustrated by simulations.

Key words: robust control, tracking problem, bounded disturbance, uncertainty, measurement noise

Во второй части данной статьи используются многочисленные обозначения, определения, понятия и формулы из ее первой части [1]. Поэтому для понимания второй части статьи читателю необходимо иметь перед глазами и ее первую часть. Ссылки на формулы из первой части имеют вид (п-1), где п -номер формулы.

1. Синтез регулятора при неизвестных верхних границах возмущений

При непосредственном использовании наилучшей согласованной с измерениями оценки $(ь) = (6в(£),6у(ь),<и(ь)) неизвестного набора < управление и(ь) в момент времени ь следует вычислять исходя

из оценки Suit). Для сокращения объема вычислений в задачах (30-I) можно учесть, что к списку неравенств, задающих множество D(t - 1), добавляется новое неравенство (19-I), соответствующее моменту времени t. При этом некоторые неравенства, задающие множество D(t - 1), могут оказаться лишними.

Эффективный алгоритм добавления нового линейного неравенства с отбрасыванием лишних был предложен в работе [2]. Благодаря применению этого алгоритма число линейных ограничений, задающих множество D(t), может оказаться существенно меньшим теоретически возможного максимального значения t + 4. Однако гарантировать ограниченность этого числа с ростом времени представляется

невозможным, поэтому использовать множества D(t) для синтеза управления в замкнутом контуре тоже невозможно.

В этом разделе множества D(t) будут заменены множественными оценками S(t), задающимися только частью неравенств (19-I) благодаря введению “мертвой зоны” при обновлении оценок. Этот метод использовался в [3] в контексте задачи регулирования и может без существенных изменений применяться к рассматриваемой задаче слежения. Это позволит гарантировать ограниченность числа ограничений при оценивании верхних границ в замкнутом контуре, сходимость оценок за конечное время и субоптимальность синтезированного управления.

Перейдем к описанию алгоритма построения управления и основного результата. Выберем положительное число ез > 0 (этот достаточно малый параметр алгоритма оценивания будет характеризовать размер мертвой зоны при обновлении множественных оценок Sit)) и в качестве начальной множественной оценки неизвестного набора S выберем множество

S(-1)-.= { S | S=(Se,Sy,Su) > 0 }. (1)

Новая информация о неизвестном наборе <5, получаемая в момент времени t, имеет вид линейного неравенства

la(q-1 )z(t) - q-db(q-1)u(t)l < Se + Sypz(t) + SuPu(t) (2)

(неравенства (19-I), соответствующего моменту времени t). Введя обозначения

e(t) ■= la(q-1)z(t) - q-db(q-1)u(t)l ,

ф(t - 1) ■= (1,Pz (t),pu(t)) ,

перепишем неравенство (2) в виде

S € tt(t) = { S l е(т) < 5ф(т - 1) } ,

где набор S5 понимается как вектор-строка из трех чисел. Пусть S(t-1) и 5(t-1) обозначают соответственно множественную и векторную оценки набора S5 в момент времени t - 1. Положим

{S(t - 1), если e(t) < S(t - 1)ф^ - 1)+

+ез m - 1)l2,

S(t - 1) n Q(t), в противном случае,

(3)

где l^l2 - евклидова норма вектора. Алгоритм обновления множественных оценок S(t - 1) имеет простую геометрическую интерпретацию: изменение множественной оценки S(t - 1) заключается в добавлении неравенства (2) и происходит в том и только в том случае, когда расстояние от оценки S(t - 1) до полупространства Q(t) больше е3.

Далее векторная оценка S(t-1) и текущее значение Qt-1 параметра Q изменяются только в случае изменения множественной оценки S(t-1) и вычисляются по формулам:

Sk (t) ■ = argmin J (Qk ,S), к = 0,...,N, (4)

SeS(t)

k(t) ■ = argmin J(Qk,Sk(t)). (5)

ke{0,...,N }

S(t)-.= Sk(t) , Qt ■= Qk(t) . (6)

Единственное отличие формул (4)-(6) от соответствующих формул (30-I)-(32-I) в том, что множество D(t) из (30-I) заменено в (4) множественной оценкой

S(t).

Наконец, управление объектом (1-I) в момент времени t осуществляется регулятором

u(t) ■= (K(Qt)z)(t), (7)

где K(Qt) - регулятор (9-I), соответствующий вычисленному в (6) параметру Qt.

Для формулировки утверждения о качестве построенного закона управления введем обозначение

Jcq (S)= Ы J(Q,S), (8)

II Q II ^CQ

где инфимум, как и в задачах (27-I), вычисляется на множестве полиномиальных передаточных матриц Q(X) с нормой, ограниченной постоянной Cq. В работе [4] показано, что значение JCq (S) сходится к оптимальному значению Jopt(S) задачи (24-I) монотонно сверху при Cq ^ +то:

Jcq (S) \ Jopt(S) при Cq ^ +Ж . (9)

Рекомендации по выбору Cq для получения желаемой точности приближения приведены в [4, 5].

Свойства построенного закона управления (7) сформулированы в следующей теореме.

Теорема 1. Пусть объект управления удовлетворяет уравнениям и неравенствам (1-I)-(6-I) с неизвестным набором верхних границ S = (Sw ,Sy ,Su, Sm), и управление объектом осуществляется регулятором (7). Тогда для измеряемого выхода объекта z(t) при любых начальных данных в этой системе управления справедливо неравенство

sup sup sup ||z - r||ss <

Ai,A2 ||w||^dw ||m||^dm (10)

^ J Cq (S) + O(e1 + е2 + е3) (е1,е2,е3 ^ 0) >

где S = (Se, Sy, Su), Se = Sw + Sm ||a|| + SySm. При этом при любых реализациях возмущений число изменений множественных оценок S(t), векторных оценок S(t) и параметров Qt конечно.

Теорема приводится без доказательства.

2. Комментарии

В этом разделе приводится несколько поясняющих комментариев к предложенному решению задачи робастного слежения при неизвестных верхних границах возмущений.

Для объекта управления, описываемого моделью (1-I)-(6-I) с набором верхних границ возмущений

S = (Sw,Sy,Su,Sm) и управляемого некоторым стабилизирующим регулятором K = K(Q) вида (9-I), имеем цепочку неравенств для измеряемой ошибки слежения z(t) - r(t):

||z - r||ss < J»(K, S) < J(K, S) < J(K, (S, 0)) = J(Q, S) ,

(11)

где5 = (Se,Sy,Su), Se = Sw +SmHaH+SySm. Подчеркнем, что при неизвестных верхних границах S ни одним из

неравенств цепочки (11) воспользоваться невозможно.

1. Первое неравенство не улучшаемо в силу определения (8-1) показателя качества .3^ как наихудшего асимптотического значения ошибки слежения в рассматриваемом классе операторных возмущений с ограниченной памятью ц.

2. Вычисление показателя 3^(К,5) - нерешенная проблема, и второе неравенство в цепочке (11) дает его наилучшую известную в теории робастного управления верхнюю оценку 3(К,5). Эта оценка является асимптотически точной при ц ^ и при достаточно естественном дополнительном предположении о поведении задающего сигнала г (см. подробности в [6,7]).

Из сказанного следует, что конструктор системы управления может выбирать память возмущений ц в модели управляемого объекта (1-1)-(5-1) сколь угодно большой, не ухудшая при этом единственную доступную в теории оценку качества слежения в виде 3(К,5). Однако при увеличении памяти ц необходимо сохранять в памяти компьютера более длинные отрезки данных измерений для вычисления Рг (Ь) и Рп(ь). Заметим, что при ц = указанные величины легко вычисляются рекуррентно без запоминания предыдущих измерений, однако в этом случае второе неравенство в цепочке (11) становится неверным при ненулевых начальных данных в замкнутой системе.

3. Показатель качества 3(К,5) является точным (те. наименьшей верхней границей) для операторных возмущений с конечной или затухающей памятью. Однако такие возмущения не допускают верификации модели объекта управления и непригодны в задачах управления с неполной априорной информацией и подразумевающих оценивание неизвестных параметров по данным измерений (см. подробности в [8, 9]). В то же время операторные возмущения с конечной памятью предоставляют возможность верификации модели данными измерений.

4. Последнее неравенство в цепочке (11) проистекает из метода верификации модели управляемого объекта, основанного на включении помехи измерений в состав внешнего возмущения и описанного в разделе 3 первой части статьи. Консерватизм, вносимый такой верификацией в оценку качества слежения, оценивается разностью

А3 := 3(К, 5) — 3(К, 5) =

1 — 5у

5п

' а

X 25 У +

X

а ^1|а|| — 5п ав ) — аа (1 — 5п п в )1

X X ) X X

+

“Главный” вклад в оценку консерватизма вносит слагаемое из множителя в квадратных скобках

N1

а а а —

X X

> 0 ,

не содержащее относительно малого множителя в виде одной из верхних границ операторных возмущений (см. подробности в [7]).

5. При неизвестных верхних границах 5 ни одним из неравенств (11) воспользоваться невозможно. Ослабленная верификация и теорема 1 из первой части статьи открывают возможность для оценки качества используемой модели управляемого объекта по данным измерений при неизвестных верхних границах возмущений 5. Консерватизм, вносимый ослабленной верификацией при наличии помех измерений, является платой за возможность оценки качества модели и настройки регулятора по данным измерений.

6. Главный содержательный результат настоящей работы изложен в разделах 3 и 5 первой части статьи и заключается в описании алгоритма приближенного вычисления наилучшего согласованного с измерениями на промежутке [0, Ь] значения 3 £рг показателя качества 3 и регулятора, соответствующего этому значению. Важным достоинством алгоритма является то, что он применим при любом управлении объектом на промежутке [0,Ь]. Возможность эффективного приближенного решения задачи (29-I) обусловлена рядом специфических особенностей этой задачи, указанных в первой части статьи. Заметим, что менее консервативные методы верификации модели (1-1)-(6-1), основанные на использовании неизвестных значений помехи измерений в качестве вспомогательных переменных, не применимы в рассмотренной задаче синтеза управления с неполной априорной информацией в силу неприемлемой вычислительной сложности соответствующих таким методам оптимальных задач (см. подробности в [7]).

7. Рекуррентный алгоритм построения управления объектом с неизвестными верхними границами, изложенный в разделе 1, обновляет при необходимости оценки верхних границ и используемый регулятор и гарантирует при этом ограниченность числа обновлений за счет использования мертвой зоны. Главное достоинство предложенного алгоритма управления заключено в его субоптимальности относительно показателя качества 3(К,5). Эта субоптимальность проистекает по существу из постановки и приближенного рекуррентного решения задачи (29-I) и отражена в неравенстве (10), в котором правая часть неизвестна конструктору системы управления в силу неизвестности набора 5. Одно из достоинств алгоритма заключается в вычислении в замкнутом контуре значений 3(<^г,5(Ь)), не превосходящих правой части неравенства (10) и являющихся наилучшими согласованными с множественными оценками Я(Ь) значениями показателя качества 3. Количество обновлений всех оценок ограничено и зависит от реализаций возмущений. Алгоритм этого раздела следует общей схеме синтеза адаптивного субопти-мального управления, предложенной в [10,11].

8. При классической постановке задачи управления, те. при известных верхних границах возмущений, считается естественным оценивать качество замкнутой системы управления (1-1)-(6-1), (9-1) в терминах “настоящего” неизмеряемого выхода модели у(Ь). Т.е. показателем качества замкнутой системы служит показатель (8-1), в котором измеряемый выход г(Ь) заменен не измеряемым, но “настоящим” выходом у(Ь). Поясним на простейшем примере, поче-

му при неизвестных верхних границах возмущений оценка качества модели в терминах “настоящего” выхода у невозможна (по существу это пояснение в равной мере относится и к классической постановке).

Рассмотрим простейшую модель управляемого объекта вида

y(t) = u(t- 1)+ w(t) , z(t) = y(t)+ m(t) , r(t) = 0 , (12)

где внешнее возмущение w и помеха измерений m удовлетворяют ограничениям (3-I) и (6-I) с неизвестными 6W и 5т. Пусть для простоты u(-1) = 0 и отсутствуют операторные возмущения: 6у = 6и = 0. Рассмотрим ситуацию, когда нам дано единственное измерение z(0). Что можно сказать о настоящем выходе у(0) на основании этой информации? Очевидно, ничего более, чем у(0) е R. Ровно то же самое справедливо и в случае модели управляемого объекта (1-I)—(6-I). Для любого набора вещественных чисел у° и любых данных измерений (z°,п0~1) существует такой набор верхних границ 6 с достаточно большими компонентами, что для этого набора верхних границ и модельных помех измерений m(s) : = z(s) - y(s), s = 0,... ,t справедливы уравнения и неравенства (1-I)-(6-I). Другими словами, значения у° могут рассматриваться как неизмеряемый выход модели (1-I)-(6-I) с указанными достаточно большими верхними границами 6.

3. Пример численного моделирования

В этом разделе приведены результаты численного моделирования, свидетельствующие об эффективности предложенного решения задачи субоп-тимального робастного слежения при неизвестных верхних границах возмущений, и проиллюстрированы некоторые особенности задачи, проистекающие из ее минимаксной постановки.

Пусть объект управления моделируется уравнением

у(t) - 2,9089у(t - 1) + 3,1211у(t - 2) - 1,2484у(t - 3) =

2u(t - 2) + 0,4u(t - 1)+ v(t). (13)

Неустойчивый полином a(X) уравнения (13) имеет корни 0,8 ± 0,5i и 0,9, а устойчивый — Ь(Х) имеет корень -5, так что объект управления является неустойчивым и минимально фазовым с запаздыванием d = 2. В качестве неизвестного конструктору набора верхних границ используется набор

6 = (0,1 0,03 0,1 0,05) , а задающий сигнал предполагается постоянным:

r(t) = 20 V t.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Описанное в разделе 4 первой части статьи семейство субоптимальных робастных регуляторов для объекта (13) вычислялось с параметрами N = 100, е2 = 0,0001, CQ = 10max{||a°||, ||в°||}, где а0 и в° — полиномы из параметризации (21-I), (22-I). Соответствующая этому семейству компромиссная кривая изображена на рис. 1. Заметим, что число суб-оптимальных регуляторов, равное в рассматриваемом случае 16 (на рисунке две точки не отличимы от соседних ввиду их малого невидимого отличия),

как правило, оказывается существенно меньшим количества аппроксимирующих направлений N+1 и не возрастает при увеличении N. Заметим также, что замена коэффициента 10 на коэффициент 50 в вышеприведенной формуле для верхней границы Од приводит к различиям в нормах передаточных матриц порядка 10-7.

12

= 8

§

3

CD

= 4

0

о 10 II вуу (О) II 3° 40

Рис. 1. Компромиссная кривая для объекта (13). Точками отмечены 16 субоптимальных пар

(||Оуи(ф)||, \\Guv(ф)||), кружком - оптимальная пара для показателя качества 3(К, 5) и 5и = 0.1.

Моделирование процессов управления проводилось для двух типов возмущений: случайных и с максимальной амплитудой. Случайные возмущения формировались в виде

у(г) = £,1(£)5-ш + Ь(Ь)5уРу(г) + Ь(£)5пРп(Ь),

т(г) = %4(г)5т ,

где все ^(г) - независимые равномерно распределенные на отрезке [—1,1] последовательности псевдослучайных величин, а ру(г) и рп(г) (см. (15-1) вычислялись при ц = 10. Начальные значения у(0),... ,у(й — 1) были случайными, равномерно распределенными на отрезке [—5ш,5Ш].

Во всех описываемых далее численных экспериментах использовалась передаточная функция ■у(Х) = 1/Ъ(Х), гарантирующая равенство Оут — 1 = 0, те. нулевую ошибку слежения для системы без возмущений и помех.

Эксперимент 1. В первом эксперименте объект (13) на всем промежутке [0,1000] управлялся линейным стационарным регулятором К = К^0), которому соответствует нулевая начальная оценка неизвестной верхней границы 5п. Регулятор К^0) является приближенным решением задачи

д \\Oyv

и называется ^-оптимальным регулятором для объекта (13) [12]. Этому регулятору соответствует пара (\\OyvШ, \\OnvШ) на левом верхнем конце компромиссной кривой. Отметим, что для ^1-оптималь-ного регулятора нарушено условие робастной устойчивости (12-1):

0,03^^о)Н + 0,1||0ТОШН = 1,1774 > 1. (14)

На рис. 2 представлен типичный график ошибки слежения г — г замкнутой системы с

^-оптимальным регулятором. И хотя для этого регулятора не выполнено условие робастной устойчивости, поведение системы не позволяет заподозрить возможность ее дестабилизации при более неблагоприятных возмущениях.

в

■8-----------------------1---------------------1---------------------1--------------------1---------------------

0 200 400 600 800 1000

t

Рис. 2. График ошибки слежения z - r в системе с li-оптимальным регулятором и случайными возмущениями.

Эксперимент 2. В этом эксперименте объект (13) на всем промежутке [0,1000] управлялся субоп-тимальным робастным регулятором Kopt, минимизирующим показатель качества J(K,5) при известном наборе верхних границ 6:

J (Kopt,6) = 18,226 = Jopt := inf J (K (Q),6). (15)

Q

Заметим, что для этого регулятора определенное в (11-I) значение J(Kopt,6) равно 15,0486, и относительные потери в качестве слежения, связанные с методом ослабленной верификации, равны

J (Kopt, S) - J (Kopt, 6) = 18,226 - 15,0486 ^

J (Kopt ,6) = 15,0486 = . .

На рис. 3 представлен типичный график ошибки слежения z - r для объекта (13), замкнутого субоптимальным робастным регулятором Kopt.

Рис. 3. График ошибки слежения z і r в системе с субоптимальным относительно J робастным регулятором и случайными возмущениями.

Приведем несколько типичных цифр, относящихся к алгоритму оценивания верхних границ (1)-(6). Параметр алгоритма є3, характеризующий размер мертвой зоны при обновлении множественных оценок и гарантирующий сходимость оценок за конечное время, был выбран равным 0,0001. Обновление множественных оценок S{t) и векторных оценок S{t) общим числом 14 происходило для данной реализации возмущений в моменты времени З, 4, 5, 8, 9, 14, 16, 17, 22, ЗО, З1, ЗЗ, 201, 668. Установившемуся для t > 668 значению S{t) = {0,9031, 0, 0,0823) соответствовал регулятор из семейства вычисленных субоптимальных регуляторов, совпадающий с

субоптимальным регулятором задачи (15). Это означает, что с момента времени t = 668 объект (13) управлялся субоптимальным относительно показателя J регулятором (что, напомним, всегда остается неизвестным конструктору). Число неравенств, задающих множественную оценку S(t) при t > 668, равнялось 7, включая 3 неравенства неотрицательности верхних границ. Другими словами, всего 4 неравенства из 1000 неравенств вида (19-I) дали достаточную для выбора наилучшего регулятора информацию о множестве согласованных с измерениями оценок верхних границ. Заметим, что в многочисленных экспериментах со случайными возмущениями указанного вида число входящих в описание S(t) неравенств оказывалось всегда равным 3 или 4. Столь малое число полезных информационных неравенств существенно упрощает вычисления. Отметим также, что хотя при значении параметра £3 = 0 теоретически нельзя гарантировать ограниченности (при t +то)

числа информационных неравенств вида (2), входящих в описание множественных оценок S(t), в десятках численных экспериментов это число не превосходило 5, очень редко оказываясь равным 6 на промежутках времени до 5 тыс. тактов. Общее время на моделирование процесса управления на промежутке времени [0, 1000] составляло около 5 сек. на ноутбуке с процессором Intel Core Duo CPU T7300 2.00 GHz.

Эксперимент 3. В данном эксперименте объект (13) управлялся регулятором (7), использующим алгоритм оценивания неизвестных верхних границ (1)-(6). На рис. 4 представлен графикошибки слежения z - r для этой замкнутой системы.

Рис. 4. График ошибки слежения z - r в системе с регулятором (7) и случайными возмущениями.

Напомним, что для объекта (13) и выбранного для экспериментов набора 6 неизвестные конструктору оптимальные значения показателей качества, входящие в цепочку неравенств (11), равны:

inf J(K,6) = 15,0486 ,

K

inf J(K(Q),6) ^ inf J(K(Q), 6) = 18,2260.

Q IIQIKCq

Алгоритм оценивания (1)-(6) в момент обновления оценок вычисляет с точностью порядка £1 + £2 + £3 значение показателя качества JCq (S(t)), являющееся наилучшим среди согласованных с неравенствами вида (2), задающими множественную оценку S(t). Это значение показателя качества заведомо не превосходит значения Jfopt, определенного в (29-I), и остается согласованным с измерениями до следующего обновления оценки 6(t), если таковая произойдет Например, оценка 6(1000) и соответствующее ей

значение

JCq (5(l000)) ^ S,774S

согласованы с измерениями на промежутке времени [66S, lOOO] и с некоторыми измерениями до момента времени 668. Если в дальнейшем произойдет обновление оценки 5(l000), то с момента обновления начнется новый тестовый интервал, на котором новая оценка верхних границ и соответствующая ей оценка ошибки слежения будут согласованы с текущими измерениями. Значительная разница в показателях качества

JCq (5(l000)) = S,774S < inf JCq (K(Q),S) = lS,2260 Q

отражает то обстоятельство, что случайные возмущения являются далеко не наихудшими возмущениями, на которых и реализуется верхняя оценка infq JCq(K(Q),5) = lS,2260. Теорема 1 гарантирует, что установившаяся за конечное (но неизвестное) время оценка показателя качества J CQ (5(t)) будет согласована со всеми будущими измерениями, т.е. будет истинной. При этом она заведомо не будет превосходить оценки JCq (5) с точностью порядка

£i + £2 + £3.

Заметим, что несмотря на то, что оценке 5(l000) соответствовал субоптимальный регулятор относительно показателя качества J (K, 5 ), нельзя гарантировать, что эта оценка не изменится и не повлечет изменение регулятора. Например, во втором эксперименте c использованием этого субоптималь-ного регулятора на всем интервале времени [0, lOOO] параллельно был запущен алгоритм оценивания (1)-(6) с начальной оценкой 5(—l) = (0,l, 0, 0,l). Векторная оценка обновилась трижды, в моменты времени 22, 25 и 92, и последний рекомендуемый алгоритмом оценивания регулятор имел номер 2 и был очень близок к ^-оптимальному регулятору первого эксперимента.

Результаты экспериментов 1-3 свидетельствуют о том, что ошибка слежения при случайных возмущениях далека от своей верхней оценки J(K, 5), мало чувствительна к выбору субоптимального регулятора, и алгоритм оценивания, как правило, рекомендует для управления субоптимальный регулятор из семейства, соответствующий значению верхней границы возмущений по управлению из промежутка [0,5u].

В следующих трех численных экспериментах для таких же замкнутых систем помеха измерений оставалась случайной, а внешние и операторные возмущения имели максимальную амплитуду:

v(t) = ±(5Ш + 5yPy(t) + 5uPu(t)) при t> ц, (16)

где знаки + и — выбирались случайным образом с вероятностью l/2 каждый. Хотя такое суммарное возмущение v(t) не является наихудшим (на котором реализуется максимум модуля ошибки слежения), оно на определенных промежутках времени оказывается близким к наихудшему при соответствующей случайной реализации знаков.

Эксперимент 4. На рис. 5 представлен типичный график ошибки слежения г — r замкнутой системы из эксперимента 1 с ^-оптимальным регулятором, не гарантирующим робастной устойчивости.

Во всех экспериментах с возмущениями вида (16) проявлялась неустойчивость замкнутой системы, иллюстрирующая последствия нарушения условия робастной устойчивости (см. неравенство (14)). Немонотонное возрастание модуля ошибки слежения связано именно с тем, что возмущение у(ь) только временами аппроксимирует наихудшее возмущение.

Рис. 5. График ошибки слежения г — г в системе с ^-оптимальным регулятором и возмущениями максимальной амплитуды.

Эксперимент 5. На рис. 6 представлен типичный график ошибки слежения г — г замкнутой системы из эксперимента 2 с субоптимальным относительно показателя качества 7(К, 6) регулятором К0р1. График отражает, во-первых, существенное отличие субоптимальной замкнутой системы от системы с ^-оптимальным регулятором и, во-вторых, то обстоятельство, что реализация возмущения (16) в типичных случаях далека от наихудшей для показателя качества 7(К,5). Напомним, что при неизвестных верхних границах 5 конструктору неизвестно, управляется ли объект субоптимальным регулятором.

30--------1--------1--------1--------1--------

20 -

-20 -

-30---------1--------1--------1--------1--------

0 200 400 600 B00 1000

t

Рис. 6. График ошибки слежения г — r в системе с субоптимальным относительно J робастным регулятором и возмущениями максимальной амплитуды.

Эксперимент 6. В этом эксперименте объект (13) управлялся регулятором (7), использующим алгоритм оценивания неизвестных верхних границ (1)-(6). На рис. 7 представлен типичный график ошибки слежения г — r для этой замкнутой системы.

Как видно из графика, качество слежения, обеспечиваемое регулятором (7), мало отличается от качества, обеспечиваемого субоптимальным робастным регулятором из эксперимента 5. Основное отличие заключается в относительно небольшом типичном всплеске, амплитуда которого зависит от реализации случайных величин, задействованных в формировании возмущений. Приведем опять некоторые цифры, относящиеся к алгоритму оценивания (1)-(6), применявшегося с теми же параметрами, что и в эксперименте 3. Единственное отличие экспериментов 3 и 6 заключалось в виде возмущения v(t) в

объекте (13).

Обновление множественных оценок Я(ь) происходило на промежутке [0,1000] 26 раз, последнее из которых - в момент времени 501. Установившееся для ь > 501 значение $(ь) = (0,4844, 0,0281 0,0967) достаточно близко к неизвестному конструктору значению $ = (0,5154, 0,03, 0,1), и поэтому оценке $ (ь) соответствовал регулятор из семейства вычисленных субоптимальных регуляторов, совпадающий с суб-оптимальным регулятором задачи (15). Таким образом, с момента времени ь = 501 объект (13) управлялся субоптимальным относительно показателя І регулятором (как и в эксперименте 3). Число неравенств, задающих множественную оценку Я(ь) при ь > 501, равнялось 13, включая 3 неравенства неотрицательности верхних границ.

Рис. 7. График ошибки слежения г — r в системе с регулятором (7) и возмущениями максимальной амплитуды.

Интересно отметить, что в этом эксперименте для установившегося с момента времени 501 наилучшего значения показателя качества JCq (<5(1000)), согласованного с неравенствами, задающими S(1000) (в частности, с измерениями на промежутке [501,1000]), имело место неравенство

JCq (S(t)) = 16,0083 > inf J(K, S) ^ 15,0486 ,

K

несмотря на то, что

max \z(t) — r|

501<t<1000

11,3167.

Результаты численных экспериментов для алгоритма оценивания (1)-(6) с параметром е3 = 0 (те. при ликвидации мертвой зоны при обновлении оценок) не отличаются от экспериментов с параметром е3 = 0,0001. Количество неравенств, задающих множественную оценку 5(1000), ни разу не превысило 15, а количество обновлений оценок, как правило, не превосходило 30.

Отчетливо наблюдавшееся отличие результатов вычислений в условиях экспериментов 3 и 6, те. для управления объектом (13) при неизвестных верхних границах возмущений при случайных возмущениях и возмущениях максимальной амлитуды, заключается в увеличении числа неравенств, задающих множественные оценки 5(ь), при возмущениях максимальной амплитуды. При этом оценки $(ь) оказываются более точными, и, как следствие, в качестве используемого для управления регулятора К(<^1) чаще и быстрее устанавливается оптимальный робастный регулятор задачи (15), реже изменяющийся при обновлении оценок £(ь).

В залючение заметим, что в рассматриваемой минимаксной детерминированной задаче управления нельзя гарантировать сходимости оценок S(t) к “истинному” значению S (сходимость оценок является целью всех классических методов идентификации, базирующихся на предположениях о стохастических свойствах возмущений). В то же время близость этих оценок к “истинному”значению в эксперименте 6 можно объяснить следующими общими соображениями. При возмущениях максимальной амплитуды (включая помеху измерений) набор S находится на границе всех неравенств (2). Одновременно с этим возмущения максимальной амплитуды обеспечивают большую вариативность регрессионных векторов ф(t) (возможно, при этом играет роль и случайность знаков возмущений). В то же время регрессионные векторы ф(t) остаются недостаточно вариативными в установившемся режиме (все они близки к одному вектору), что является причиной малого числа неравенств, входящих в описание множественных оценок S(t).

4. Заключение

Рассмотрена задача синтеза робастного регулятора слежения при неизвестных верхних границах операторных возмущений, внешнего возмущения и помехи измерений. Основные достоинства предложенного решения заключаются в следующем. Синтез робастного регулятора слежения в условиях неполной априорной информации осуществляется строго в рамках ^i-теории робастного управления без привлечения дополнительных предположений о возмущениях. Синтезированное управление является суб-оптимальным относительно показателя качества, порожденного методом верификации модели в замкнутом контуре и играющего роль идентификационного критерия при оценивании неизвестных верхних границ возмущений.

Работа выполнена при поддержке Программы фундаментальных исследований УрО РАН, проект № 12-П-1-1013.

Литература

1. Соколов В.Ф. Моделирование системы робастного слежения при неизвестных верхних границах возмущений и помехи измерений. 4.I: Оценивание верхних границ // Известия Коми НЦ УрО РАН. 2012. Выпуск 3(15). С. 4-11.

2. Walter E, Piet-Lahanier H. Exact recursive polyhedral description of the feasible parameter set for bounded error // IEEE Trans. Autom. Control. 1989. Vol. 34. P. 911-915.

3. Соколов В.Ф. Асимптотически субоптимальное робастное управление дискретным объектом при неизвестных весах возмущений // Доклады АН. 2010. Т. 431. № 1. С. 32-35.

4. Khammash M.H., A new approach to the solution of the li control problem: the scaled-Q method // IEEE Trans. Autom. Control. 2000. Vol. 45. P. 180-187.

5. Sokolov V.F. li Optimal Robust Controller for SISO Plant under Coprime Factor Perturbations

0

200

400

600

800

// IEEE Trans. Autom. Control. 2000. Vol. 45. No. 12. P.2339-2345.

6. Соколов В.Ф. Асимптотическое робастное качество дискретной системы слежения в li-метрике // Автомат. и телемех. 1999. № 1. С. 101112.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Соколов В.Ф. Оценка качества робастной системы управления при неизвестных верхних границах возмущений и помехи измерений // Автомат. и телемех. 2010. № 9. С. 3-18.

8. Соколов В.Ф. Робастное управление в li -постановке: верификация модели и оценивание весов возмущений // Автомат. и телемех. 2003. № 11. С. 138-151.

9. Sokolov V.F. Control-Oriented Model Validation and Errors Quantification in the li Setup // IEEE Trans. Autom. Control. 2005. Vol. 50. No. 10. P. 1501-1509.

10. Соколов В.Ф. Адаптивное субоптимальное управление в случае ограниченной помехи // Автомат. и телемех.1985. № 9. С. 78-86.

11. Sokolov V.F. Adaptive suboptimal control of a linear system with bounded disturbances // Syst. Control Lett. 1985. Vol. 6. P. 93-98.

12. Барабанов A.E. Синтез минимаксных регуляторов. СПб.: Изд-во С.-Петербургского ун-та, 1996. 222 с.

Статья поступила в редакцию 23.07.2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.