оделирование систем
УДК 007(061.3)
СИСТЕМЫ УПРАВЛЕНИЯ С ИДЕНТИФИКАТОРОМ Ч. II
А. Л. Бунич
Институт проблем управления им. В. А. Трапезникова, г. Москва
Рассмотрены задача идентификации в условиях нормальной эксплуатации и задача синтеза основного контура системы управления. Основное внимание уделено проблеме предельно достижимого быстродействия идентификатора и предельно достижимой в установившемся режиме точности регулирования в задаче синтеза основного контура.
ВВЕДЕНИЕ
В первой части1 настоящей статьи было показано, что идентификационный подход к задаче синтеза позволяет определить эффективно реализуемые стратегии, аппроксимирующие оптимальные стратегии для задач синтеза с большим горизонтом. Вместе с тем применение идентификатора не ограничивается собственно целью синтеза и целесообразно для решения важных вспомогательных задач обслуживания систем управления, а также для исследовательских целей. Алгоритмы оценивания параметров объекта в режиме нормальной работы после некоторых модификаций могут использоваться также и для построения идентификатора в системах с настраиваемыми обратными связями.
1. ИДЕНТИФИКАЦИЯ В РЕЖИМЕ НОРМАЛЬНОЙ ЭКСПЛУАТАЦИИ
Изменение во времени статистических характеристик процессов в системе управления с идентификатором обусловлено как дрейфом параметров объекта, так и перенастройкой параметров регулятора. Если же объект близок к стационарному, а темп перенастройки регулятора мал из-за малого шага алгоритма идентификатора, то задача идентификации сближается по постановке с задачами статистического оценивания по однородной выборке наблюдений, а разработанные алгоритмы идентификации объекта в режиме нормальной работы служат основой для решения более сложных задач идентификации объектов в замкнутых системах с настраиваемыми обратными связями. Как и при общей постановке
1 Бунич А.Л. Системы управления с идентификатором. Ч. I.
// Проблемы управления — 2005. — № 5. — С. 83—91.
Памяти И. В. Прангишвили посвящается
задачи идентификации, вопрос о предельно достижимой скорости сходимости является центральным.
Проблему предельного быстродействия идентификатора рассмотрим применительно к задаче оценивания скалярного параметра - е . по однородной независимой выборке наблюдений у1 = (у1, ..., уТ) объема Т из абсолютно непрерывного распределения "- с плотностью В-(у) (по мере Лебега). В рамках асимптотического подхода предполагается, что Т — “большой параметр”. На каждом такте Р = 1, 2, ..., Т идентификатор формирует по наблюдениям у1 оценку параметра (статистику)
-Р = -Р (у1) где -Р( у1) — измеримая функция наблюдений. Качество оценки определяется по Вальду риском Е-кТ (-Т, -) с заданной неотрицательной функцией wТ, где Е- — математическое ожидание, вычисляемое в предположении, что истинное значение параметра равно - (далее рассматриваются задачи оценивания с квадратичной функцией потерь ^(-т, -) = Д-т _ -) ) Для
а. н. оценок 4Т (-Т - -) а #{0, а2(-)), где а2(-) — дисперсия предельного распределения нормированной ошибки. Трудности сравнения качества оценок очевидны: результат сравнения зависит от значения параметра
- и сравнение ограничено рамками асимптотического подхода, часто неадекватного приложениям из-за медленных параметрических дрейфов квазистационарных объектов.
Пусть параметр задан как функционал - = # (Р) от распределения Р е 3 из заданного класса распределений 3 (функционал # (Р) часто задают в неявной форме, например, как корень уравнения регрессии). Универсальным методом оценивания является метод подстановки (эмпирического распределения РТ), который состоит в замене неизвестного распределения эмпирическим рас-
пределением, т. е. оценка методом подстановки имеет вид -Т = #(РТ) (если РТ £ 3 то используют подстановку сглаженного эмпирического распределения [1]). Аналогично определяется и метод подстановки при решении задачи оценивания многомерного параметра, причем априорная информация о параметре в форме включения - е Л с заданным компактным выпуклым множеством Л учитывается проецированием - на Л (в этом случае говорят о сужении метода подстановки).
При некоторых предположениях регулярности в силу информационного неравенства Крамера—Рао 2 ________________________1
liminftT.fi- (-Т — -) ] О I (-) для асимптотически неТ О №
, 2
смещенных оценок -Т, где %(-) = Е-{ (1пр)-} — информация Фишера, а усреднение производится относительно наблюдения при значении параметра -. Нижняя граница неравенства достигается для а. э. (по Фишеру) оценок, к которым относятся ОМП. Информация Фишера характеризует также максимальное уклонение нормированной ошибки ОМП: Нтвир^ — -)2Т1(-)/21п1пТ =
Т
= 1 п. н. [1]. Различные версии матричного неравенства Крамера—Рао установлены для задачи идентификации линейного динамического объекта
у = [1 — а(У)]у + Ъ(")и{ + [с(У) — 1]ор + V, а(1) = 1 + а11 + ... + ап£, Ъ(г) = Ъ11 + ... + Ъп1п, с(г) = 1 + с1г + ... сд1ч,
- = со1(—а1, ..., —ап, Ъ1, ..., Ъп, с1, ..., с?)
с обновляющим возмущение процессом с независимыми значениями V™. Для несмещенных оценок -Т параметра -нижняя граница ковариационной матрицы предельного распределения нормированной ошибки имеет мультипликативную структуру У(р11, -) = [Др^Д-, стV (Р„)—1], где скалярный множитель 1( рv) — информация Фишера,
22 а матрица Д-, ^ (рv) аффинно зависит от ^ (рекуррентные алгоритмы оценивания, для которых ковариационная матрица достигает нижней границы, названы в работе [2] абсолютно оптимальными).
Отвлекаясь от обсуждения адекватности асимптотического подхода приложениям, отметим, что использование нижней границы Крамера — Рао в качестве характеристики предельного быстродействия идентификатора требует обоснований.
Прежде всего, эта граница зависит от неизвестных статистику значения параметра и распределения возмущения. Кроме того, для нерегулярных задач можно построить алгоритмы оценивания со значительной (по порядку выборки наблюдений) более высокой скоростью
сходимости по сравнению с порядком 0(Т 1/2) для регулярных задач [1, 3—5]. В ряде случаев нерегулярность можно создать искусственно вмешательством статистика в условия проведения эксперимента [1, с. 178—180]. Предельное распределение соответствующим образом нормированной ошибки в нерегулярных задачах, как правило, не является нормальным и выбор класса а. н. оценок не является обоснованным. Кроме того, и в регулярных задачах, вообще говоря, порядок предельной
скорости сходимости 0( Т 1/2) допускает улучшение (например, в задаче идентификации авторегрессионного объекта, если возмущение имеет бесконечную дисперсию). Далее, для некоторых значений параметра, образующих так называемое множество суперэффективности М можно построить смещенные оценки, для кото-2 ______________1
рых v (-) P I (-) причем для - е М неравенство является строгим (как показывает известный пример Ходжеса, улучшение нижней границы Крамера—Рао возможно уже в задаче оценивания скалярного параметра сдвига в гауссовском шуме). Для устранения сложностей, связанных с суперэффективностью, используют модификации информационного неравенства, например, в форме sup Е (-т — m)2 O [я2е 2 + Т sup I(m)] 1
M € (а - е, а + е) м е (а - е, а + е)
для любого интервала (а — е, а + е), е > 0 [1] (из этого неравенства следует, что множество суперэффективности довольно бедное, и порядок длины интервала из М не выше 0(Т_1/2)).
Наконец, реализация ОМП в идентификаторе требует исследования чувствительности качества оценивания к вариациям распределения возмущения, поскольку в приложениях полная информация о распределении статистику недоступна. Кроме того, с учетом требования реализации идентификатора в системах реального времени необходимо построить рекуррентные аналоги алгоритмов оценивания.
Необходимо подчеркнуть все же, что выдвинутая Фишером программа построения асимптотически оптимальных оценок в значительной степени завершена в современной статистике: свойство а. э. в смысле Фишера обобщено на класс нерегулярных задач с достаточно широким классом функций потерь, а в регулярном случае к классу а. э. оценок относятся ОМП [5].
Один из первых рекуррентных аналогов ОМП (при достаточно жестких ограничениях, обеспечивающих свойство а. э. оценок) был предложен Сакрисоном [6]. Применительно к задаче оценивания скалярного параметра сдвига алгоритм Сакрисона представляет собой стандартную процедуру стохастической аппроксимации с программным выбором шага: -t = -t — 1 + ytf(yt — -t — 1),
f = —р'р 1, yt = [tI(p)] 1, где р — заданная симметричная унимодальная плотность распределения возмущения, удовлетворяющая некоторым условиям регулярности (ограничения на р можно существенно ослабить гладкой аппроксимацией характеристики f [7]).
При выяснении предельных возможностей идентификатора представляют интерес нерегулярные задачи. Для некоторых ограниченных возмущений, функция распределения которых F имеет граничные особенности, в работе [4] была предложена процедура оценивания “зона нечувствительности” и исследована ее сходимость для ряда задач идентификации. В частности, для задачи оценивания скалярного параметра сдвига и непрерыв-
Принятые сокращения:
а. н. — асимптотически нормальный; а. э. — асимптотически эффективный;
МНК — метод наименьших квадратов;
ОМП — оценка максимального правдоподобия; п. н. — почти наверное; п. ф. — передаточная функция; с. в. — случайная величина.
ной функции распределения помехи, сосредоточенной на заданном отрезке [—3, 3] и удовлетворяющей условию
1 — < р(8 — ^ И Р 8 с некоторыми константами
р, а > 0 для рекуррентной оценки -р = -р — 1 + /(у — -р — 1),
_ [ V - 8signг при IV >8
f (v) = i с нелинейностью f “зона
[0 при |V < S
нечувствительности” получена степенная мажоранта Е(- — -t)2 = 0(t_2/a) (аналогичная мажоранта получена и для задачи оценивания параметров линейной регрессии). В частности, для помех с равномерным распределением (а = 1) скорость сходимости по порядку величины совпадает с оценкой Питмена [5] и существенно выше предельно достижимой в регулярных задачах.
Поскольку идентификатор использует данные измерений, то желательна защита оценок от “выбросов” из-за отказов измерительных устройств, обеспечивающая грубость (робастность) оценок по отношению к вариациям плотности распределения помехи р е ЭТ в заданном классе ЭТ На примере оценивания параметра сдвига нетрудно убедиться, что качество оценки, определяемое дисперсией предельного распределения нормированной ошибки, высокочувствительно к “хвостовой части” плотности распределения помехи и, например, выборочное среднее (ОМП для случая гауссовской помехи) существенно хуже выборочной медианы, если плотность распределения помехи имеет “тяжелые хвосты”. “Огрубление” ОМП и их рекуррентных аналогов [2] на основе подхода Хубера к робастному оцениванию применительно к задаче оценивания сдвига сводится к следующему. Пусть ЭТ — выпуклый класс регулярных плотностей распределений помехи vt, в котором разрешима вариационная задача I(p) o inf причем плот-
Р € ЭТ
ность р* = arg minI(p) унимодальна, и FT — эмпириче-
Р € ЭТ
ская функция распределения наблюдений yt = - + vt М-оценка Хубера -т определяется корнем уравнения |ф(х — y)dFr(y) = 0 с некоторой нечетной монотонной
абсолютно непрерывной функцией ф и является а. н.
2 2 _1 оценкой, -т ~ N(0, а (р, ф)}, а (р, ф) O I (р). Как установлено Хубером [8], при ф = —(1пр*)' М-оценка -т равномерно не улучшаема в ЭТ в смысле дисперсии предельного распределения нормированной ошибки, т. е. робастная (минимаксная) оценка получается применением вычислительной схемы ОМП для “наихудшей” в ЭТ плотности р* Подчеркнем, что схема робастного оценивания Хубера обосновывается исключительно в рамках асимптотического подхода.
В монографии [2] рекуррентные аналоги робастных оценок построены для задач идентификации линейных динамических объектов. Робастные оценки предпочтительнее стандартной оценки МНК для некоторых классов ЭТ плотностей с “легкими хвостами”, в частности, для ограниченных помех [9]. Наихудшая плотность распределения для заданного класса ЭТ определяется решением вариационной задачи ЛрЯс-, + с*а (р)] o inf ,
1 2 р € ЭТ
с1 2 O 0, где а (р) — дисперсия возмущения. Условие а(р) < “ существенно, поскольку для авторегрессионных объектов и возмущений с бесконечной дисперсией
достижима точность оценивания (в среднеквадратическом смысле) порядка о(Т_1/2) [10, 11]. Построение рекуррентных аналогов робастных оценок (помимо ограничений регулярности и унимодальности) связано с определенными техническими трудностями, поскольку в прямом аналоге шаг алгоритма (матричный или скалярный коэффициент усиления ур зависит от неизвестного распределения помехи и в реализуемой версии вместо ур используются эмпирические оценки. Необходимо отметить консервативность минимаксного подхода, что является платой за обеспечение робастности. Так, в задаче оценивания сдвига при переходе от унимодальных к многомодальным плотностям распределений возможен резкий рост информации Фишера, что подтверждается прямым вычислением [12].
В связи с проблемой предельного быстродействия идентификатора возникает вопрос о достижимости нижней границы Крамера—Рао для задач оценивания с неизвестным распределением помехи (из некоторого априорно заданного класса), которое можно рассматривать как бесконечномерный мешающий параметр. Оценки, для которых нижняя граница достижима, называются адаптивными (по отношению к неизвестному распределению помехи). Гипотеза о существовании адаптивных оценок была высказана Стейном, и для задач оценивания линейной регрессии (с симметрично распределенной помехой) такие оценки построены в работе [13].
Для объектов с параметрической неопределенностью
существование 4Т -состоятельных оценок и их рекуррентных аналогов устанавливается при достаточно широких предположениях. Оказывается, что для объектов с неопределенной характеристикой из заданного непараметрического класса ( например, непараметрической регрессии заданной гладкости, порядок предельно достижимой равномерно по ( скорости сходимости +(Т_1/2) недостижим, а более точные оценки скорости определяются гладкостью восстанавливаемой характеристики [5]. Аналогичная ситуация имеет место и в задачах адаптивного управления объектами с непараметрической неопределенностью при выяснении предельно достижимого качества переходного процесса, определяемого нижними границами информационных неравенств. В частности, для задачи оптимальной стабилизации объекта нелинейной авторегрессии первого порядка у( = /(у — 1) + и( — 1 + vt с нелинейностью / из класса Гельдера ( информационное неравенство для равномерно по / е ( не улучшаемой среднеквадратичной ошибки
2
стабилизации Е(у — V) получено в работе [14].
Как известно, точность оценивания можно повысить, когда статистик имеет возможность управлять наблюдениями с учетом ограничений на их стоимость или длительность, а также в различных задачах оптимального сочетания управлений и наблюдений [15, гл. 12]. Естественно ожидать, что наличие управляющего параметра расширяет возможности идентификатора благодаря подбору такого его значения, при котором на данном такте наиболее выгодно производить наблюдение. Пусть выход статического объекта имеет плотность распределения (относительно некоторой меры на Я1) /(у|-, и), которая зависит от управляющего параметра и е Я1, удовлетворяющего заданному интервальному ограниче-
нию, и неизвестного параметра объекта - е Я1, оцениваемого на такте Р Р Т по наблюдениям уР = (ур ..., у). Качество оценки параметра -р(уР, ир(уР)) для фиксирован-
t Т
ного плана эксперимента {и,(у)} Р = 1 определяется показателем Е(-Т — -)2 Задача оптимального планирования в принципе допускает точное решение на основе байесовского подхода, когда параметр - представляет с. в. с заданным априорным распределением. Асимптотическая постановка задачи планирования позволяет устранить “априорную трудность” и упростить вычислительную реализацию плана. Рекуррентные а. э. оценки (в смысле нижней асимптотической границы для
Е(-Т — -)2 были предложены в работе [6]. В частности, получен рекуррентный асимптотически оптимальный план для сформулированной А. А. Фельдбаумом задачи управления параболическим объектом [16].
2. ПОСТРОЕНИЕ ИДЕНТИФИКАТОРА МЕТОДОМ ПРОГНОЗИРУЮЩЕЙ МОДЕЛИ
Стандартные схемы пассивной либо активной идентификации с использованием, например, гармонических тестовых воздействий имеют низкую производительность и, кроме того, область их применения жестко ограничена требованиями нормального режима работы, исключающими эксперименты с неустойчивым объектом. Более общая постановкам задачи идентификации состоит в оценивании по наблюдениям “вход—выход” параметров объекта, замкнутого некоторым стабилизирующим регулятором с известными настройками. Качество идентификации измеряется точностью прогноза выхода объекта, представляющего выход прогнозирующей модели, а точность настройки модели определяется функционалом невязки (ошибки прогноза) [2, 17, 18]. Точка минимума этого функционала (в предположении ее единственности) в неявной форме задает оцениваемый параметр объекта как функционал от распределения наблюдений, который для эргодической помехи аппроксимируется эмпирическим функционалом, а оценка параметра вычисляется методом подстановки.
Уравнение скалярного линейного объекта с конечно-зависимым возмущением представим в форме обновления
у, = [1 - =(У)]у, + Ы")и, + [с(У) - +
(1)
Рис. 1. Прогнозирующая модель объекта в замкнутой системе
поскольку значения параметра - е /, для которых характеристический полином с = аа — р> неустойчив, недопустимы. Кроме того, ограничением является и условие идентифицируемости объекта в замкнутом контуре, которое может нарушаться, если разностный порядок объекта больше порядка регулятора.
Далее ограничимся рассмотрением установившегося режима функционирования.
Для определения структуры модели с двумя входами и,, уг и выходом у1 отбросим в правой части уравнения
(1) независимую от предыдущих слагаемых с. в. vt, параметр - заменим его оценкой -т, а прошлые возмущения vк, к < Р — невязками ек = ук — ут. После элементарных преобразований получим уравнение модели
?т("И = =т(") У, — >т(")и,, (2
где непостоянные коэффициенты полиномов ат, Ьт, ст, ат(0) = ст(0) = 1 образуют настройку модели -т, вычисляемую идентификатором (рис. 1). Обычно предполагается, что прогнозирующая модель устойчива, т. е. устойчив полином стО) При точной настройке (-т = -) в
где уг — измеряемый без помех выход, и1 — управление, установившемся режиме £Р = V, поэтому %(-т) = Е0(ер),
vt — обновляющий возмущение процесс с независимыми значениями и унимодальной симметричной плотностью распределения, V — оператор однотактовой задержки, полиномы (а, Ь) порядка п взаимно просты, полином с(г) устойчив. Объект (1) замкнут стабилизирующим регулятором а(")и, = Е(")ур с известными настройками. Необходимо построить алгоритм идентификатора, обеспечивающий состоятельное оценивание параметра объекта -, компонентами которого являются неизвестные коэффициенты полиномов а, Ь и с по наблюдениям “вход — выход” у 1, и 1.
Отметим, что постановка задачи неявно включает ограничения на множество неопределенности объекта /
где Е — математическое ожидание, а 0 — неотрицательная четная функция потерь, достигает минимального значения. В предположении единственности стационарной точки функционала невязки для ее оценивания можно использовать алгоритмы стохастической аппроксимации, градиентные или псевдоградиентные по отношению к этому функционалу. Варьирование функции потерь позволяет придать оценкам свойство робастности по отношению к распределению обновляющего процесса [2].
Примеры. Для белошумного возмущения, с(г) = = ст(*) = 1, модель представляется в регрессионной
и, - п)
с настройкой -т, а минимизация эмпирического функционала сводится к алгоритму МНК. Для коррелированного возмущения МНК приводит к смещенным оценкам и для настройки модели используется МНК с расширенным регрессором = со1(—yt — 1, ..., — yt — п, yt — 1, ..., ut—п, st — 1, ..., st — q), q = deg с. Для расширенного МНК модель (2) нелинейна относительно -т и называется моделью псевдолинейной регрессии [18], так как расширенный регрессор нелинейно зависит от -т. Обоснование алгоритма идентификации (расширенного МНК и его модификаций без использования процедуры рекуррентного обращения матриц) осложняется требованием устойчивости прогнозирующей модели, для чего применяется искусственное замедление темпа идентификации
[17]. Замедление темпа коррекции оценок позволяет при исследовании сходимости корректно использовать принцип “замороженных коэффициентов”. В алгоритме предусматривается проецирование оценок на априорно заданное компактное выпуклое множество Л содержащее оцениваемый параметр. При идентификации устойчивого объекта (1) с конечно-зависимым возмущением в разомкнутом контуре состоятельность оценок расширенного МНК и его модификаций устанавливается в условиях достаточного богатства спектра входного сигнала (условие постоянного возбуждения) и строгой вещественной положительности для фильтра с п. ф. с 1(v) — 1/2
[18]. i
Метод прогнозирующей модели применяется для решения задач адаптивного управления минимально-фазовыми объектами [17, 19—23]. Используется идентификационная версия регулятора Астрема, а в качестве алгоритма идентификатора применяются различные версии МНК. Идентифицирующее свойство стратегии управления обеспечивается различными схемами рандомизации, в частности, предложенной Кэйнсом рандомизацией отслеживаемого эталонного сигнала yP* белошумным тестовым воздействием. Допустимость неупреждающих стратегий понимается в смысле предельного
Т
— 1 2 2 неравенства 1im sup Т V Е(yt + ut) < ^ п. н. При
Тош t=1
некоторых предположениях о множестве неопределенности объекта (1) (включая условие строгой вещественной положительности для порождающего возмущение предфильтра) устанавливается идентифицирующее свойство стратегии и определяется качество слежения
Т
1im sup Т—1 V Е[yt + — y*+ р)2|Fp) = I* + p2 п. н., где о-ал-Тош t=1
гебра F‘ порождена совокупным возмущением (тестовым сигналом и возмущением в объекте (1)), р — запаздывание в объекте по управлению, I* — минимум критерия качества для задачи оптимизации в условиях полной априорной информации, а константа р2 определяется мощностью тестового сигнала и может быть выбрана сколь угодно малой. При отсутствии рандомизации (р = 0) условия сходимости алгоритма идентификатора не выполняются, и оценки -t сходятся к сфере случайного радиуса с центром -. Совмещение идентифицирующего свойства стратегии и предельной оптимальности обеспечивается использованием тестового
воздействия с достаточно медленно убывающей мощностью.
Как уже отмечалось в первой части работы, задача оптимального синтеза существенно упрощается, если не требовать состоятельного оценивания параметра. Аналогичная ситуация имеет место и при синтезе локально оптимального управления (в смысле заданной квадратичной целевой функции состояния) минимальнофазовым объектом (1) [22, 23]. При использовании нерасширенной версии МНК усредненная по быстрым фазовым переменным (у,, и) замкнутая система, описывающая динамику медленных переменных (оценок -, и элементов информационной матрицы), имеет глобальный аттрактор, каждой точке которого соответствует один и тот же закон локально оптимального управления. Таким образом, несмотря на смещенность оценок -, для коррелированного возмущения и предельное вырождение информационной матрицы, настройки локально оптимального регулятора идентифицируемы. В работе [24] рассматривается задача непрямого управления минимально-фазовым объектом (1) с белошумным возмущением на основе МНК. Установлена предельная оптимальность стратегии управления и получена оценка скорости переходных процессов в замкнутой системе.
В работах [25, 26] для оценивания параметра объекта с ограниченным возмущением (IV, | Р 8)
у = М0 - + vt,
М0 = С01(—у — 1, ..., —у — пг, и,_ 1, ..., и, _ п), (3)
замкнутого линейной обратной связью а (V) и, = РС")у, + е( с фиксированными настройками и независимым относительно возмущения в объекте (3) белошумным тестовым сигналом е,, используется алгоритм идентификации “зона нечувствительности”:
-, = -, — 1 + /(у, — ут )ф,/11фр112,
0 - &щпг при IV >8, у.. = мТ - (4)
0 при IV < 8
Алгоритм (4) представляет собой стохастический аналог релаксационной процедуры Моцкина решения систем линейных неравенств. Специальная процедура генерирования тестового сигнала, обеспечивающего большое отношение сигнал/шум, позволяет установить сильную состоятельность рекуррентной оценки (4) при достаточно широких предположениях о возмущении в объекте. Механизм обеспечения состоятельности оценок (4) принципиально иной по сравнению с уменьшением шага в стандартных процедурах стохастической аппроксимации и различных версиях МНК: идентификатор “ждет” большого по норме значения регрессора, направленного в “нужную сторону” (последнее возможно в предположении перемешивающих свойств возмущения в объекте).
Отметим, что из-за неполноты априорной информации о возмущении какие-либо оптимальные свойства прогноза при использовании алгоритма настройки модели (4) не гарантируются даже в предположении состоятельности оценки. Естественной границей качества прогноза (в смысле среднеквадратической ошибки) яв-
ляется величина 8 и пример бернуллиевской последовательности V, = + 8 показывает, что без дополнительной информации о возмущении эта граница качества прогноза не допускает улучшения.
3. СИНТЕЗ ОСНОВНОГО КОНТУРА СИСТЕМЫ УПРАВЛЕНИЯ
Предельные возможности систем управления с идентификатором во многом определяются на этапе синтеза основного контура. Для линейно-квадратичных гауссовских систем оптимальный регулятор линеен и определяется по стандартной методике, однако для негауссовских возмущений оптимальная обратная связь, вообще говоря, нелинейна [27, 28], и сложности оптимального синтеза очевидны. С другой стороны, класс линейных стратегий достаточен для вырожденных задач синтеза, когда требуемое качество регулирования в установившемся режиме обеспечивается некоторым стабилизирующим регулятором достаточно высокого порядка.
На простом примере звена чистого запаздывания с аддитивным возмущением видно, что условие вырож-денности связано с предсказуемостью (сингулярностью) возмущения. Распространенное представление об исключительности свойства сингулярности ошибочно. В самом деле, как установлено в работе [29], при естественной метризации класса спектральных плотностей их подмножество, соответствующее сингулярным процессам, достаточно массивно (является множеством второй категории Бэра). Далее, внутренние модели предсказуемых (волновых) возмущений традиционно применялись в автоматическом регулировании, в частности, в теории селективно-инвариантных систем В. С. Кулебакина и в дискретных аналогах метода "/^-изображений [30]. Широкий класс вырожденных задач для объектов с по-лигармоническими возмущениями рассматривается в работе [31]. Наконец, условия вырожденности представляют интерес в связи с поставленной Г. В. Щипановым задачей обеспечения желаемых свойств проектируемой системы управления (в частности, инвариантности) посредством сложных (“многостепенных” [32]) регуляторов.
Задачу стабилизации будем рассматривать применительно к типовой структуре “стандартный объект —
стандартный регулятор” (рис. 2) [33]. Все переменные (управление и^ возмущение V, измеряемый выход у^ и стабилизируемая переменная w^ принимают значения в евклидовых пространствах соответствующей размерности, объект 3 представлен блочной передаточной функцИей (3). у. = 1, 2:
W =
Wll Wl2
W21 W22.
(З)
Рис. 2. Система управления стандартным объектом
Передаточные функции системы управления от возмущения r к соответствующим переменным обозначаются Ww, Wy и Wu. Реализация объекта (5) в пространстве состояний удовлетворяет условиям стабилизиру-емости и детектируемости, допустимыми считаются любые внутренне стабилизирующие регуляторы по выходу u = Ky. Возмущения предполагаются центрированными стационарными в широком смысле процессами, спектр которых (носитель спектральных мер) расположен на заданном симметричном относительно начала собственном замкнутом множестве А с [—s, s], причем выполняется ограничение на интенсивность tr coy(yp) P С с ограничивающей константой С > 0 Качество управления в установившемся режиме определяется показателем I(K) = tr coy(wp). Если при любом уровне качества H > 0 для некоторого допустимого регулятора K = KH и всех возмущений рассматриваемого класса выполняется неравенство I(K£) < е, то задача синтеза регулятора называется вырожденной.
Так как включение А с [—s, s] является по предположению строгим, то возмущение сингулярно (допускает безошибочный линейный прогноз в смысле среднеквадратической ошибки), и при некоторых дополнительных предположениях задача синтеза вырожденна. Суть процедуры синтеза состоит в “вытеснении” полосы пропускания системы в лакуну возмущения (интервал частот нулевой спектральной меры), что и доказывает свойство вырожденности.
Одно из препятствий к вырожденности задачи синтеза для многомерного объекта заключается в факторе “дефицита размерности управления” (dimu < dim w). Задача синтеза может быть невырожденной и при наличии в объекте собственных шумов, статистически независимых с помехами в канале измерения. Ограничимся рассмотрением частного случая задачи синтеза для устойчивого стандартного объекта (5) с квадратными блоками (Wy)/ j = 1 2 одинаковой размерности п х п (более общая задача синтеза рассматривается в работе [34]).
Следуя методике Щипанова, найдем сначала условия компенсации возмущения без ограничения допустимости регулятора: Wu = — 3121 W11. Передаточная функция от возмущения к выходу получается из уравнения стандартного объекта Wy = W2l — W22 3121 Wn откуда получаем передаточную функцию идеального регулятора, построенного методом “динамической компенсации”:
Кид = Wu Wy1. Как легко проверить, в случае объекта (5) общего положения в системе “стандартный объект — идеальный регулятор” действительно выполняется условие полной компенсации. Однако из-за операции обра-
щения 312* идеальный регулятор, вообще говоря, не является допустимым. Чтобы преодолеть эту трудность и построить реализуемый регулятор, заменим точное обращение приближенным с использованием матричного аналога классической теоремы Рунге о равномерной аппроксимации полиномами аналитических функций на компактном множестве В плоскости комплексной переменной со связным дополнением [35].
Положив В = ехр(/Д) и обозначив через 3/2 ^ полиномиальную аппроксимацию рациональной функции
3121 построим систему управлении объектом (5) с передаточными функциями 3и = — 311, 3у = 31 —
— 3223х(2-1) 311 и допустимым регулятором К = Зи Зу-1. Благодаря достаточно точной полиномиальной аппроксимации обеспечивается сколь угодно высокое качество управления равномерно по классу возмущений фиксированной интенсивности, т. е. задача синтеза действительно вырожденна (применение теоремы Рунге корректно при условии невырожденности на В матричной функции 312(г)). Заметим также, что для высокоточной стабилизации требуется аппроксимация полиномами достаточно высокого порядка, т. е. требуемое качество регулирования в полном соответствии с идеей Щипа-нова реализуется “многостепенным” регулятором [32]. Кроме того, оказывается, что такой многостепенный регулятор является итеративным по структуре и реализуется последовательным добавлением (итерациями) новых звеньев так, что точность регулирования растет экспоненциально по числу итераций [34].
Выбор регуляторов высоких порядков не только усложняет вычислительную реализацию системы управления, но и повышает ее чувствительность к немоделируе-мой динамике составных звеньев.
Пример. Пусть скалярный объект (1) с измеряемой стабилизируемой переменной и белошумным возмущением, а(г) = 1, Ъ(г) = V, замкнут расчетным (по приближенным оценкам неизвестных проектировщику параметров объекта) регулятором а((У)и, = Р(У)у,, а(г) =
= 1 +(гп — 1)/[п3/4(г — 1)], Р(г) = (гп — 1)/[п3/4(г — 1)]. Такой регулятор допустим и в силу соотношения
||3и|| 2 = 0(1/п ), где || 3112 — $2 — норма передаточной функции от возмущения к управлению, при п > 1 близок к оптимальному а(г) = 1, Р(г) = 0 в смысле принятого критерия качества. С другой стороны, при замыкании расчетным регулятором структурно возмущенного объекта (1) с а(х) = 1, Ъ(х) = (1 + п 1/4)г устойчивость замкнутой системы не сохраняется (ее характеристический полином имеет корень V = 1. ♦
Итеративность по структуре позволяет проектировщику решать задачу синтеза цифровых регуляторов в интерактивном режиме, определяя компромисс между сложностью регулятора и желаемым качеством управления.
ЗАКЛЮЧЕНИЕ
Идентификаторы в качестве датчиков параметрических возмущений широко применяются для решения задач проектирования систем управления и обработки ин-
формации в реальном времени. В условиях дефицита априорной информации о характеристиках объекта и внешних возмущений идентификационный подход к задаче синтеза на основе разделения задачи на синтез идентификатора и синтез основного контура позволяет построить эффективно реализуемые стратегии для большого горизонта управления. Качество управления определяется конструкцией основного контура и быстродействием идентификатора.
ЛИТЕРАТУРА
1. Боровков А. А. Математическая статистика. — М.: Наука, 1984.
2. Цыпкин Я. 3. Информационная теория идентификации. — М.: Наука, 1995.
3. Jurechkova J. Asymptotic behaYior of M-estimators of location in nonregular cases // Statist. and Decis. — 1983. — Vol. 1, N. 4—5. — P. 323—340.
4. Бунич А. Л., Бахтадзе Н. Н. Синтез и применение дискретных систем управления с идентификатором. — М.: Наука, 2003.
5. Ибрагимов И. А., Хасьминский Р. 3. Асимптотическая теория оценивания. — М.: Наука, 1979.
6. Невельсон М. Б., Хасьминский Р. 3. Стохастическая аппроксимация и рекуррентное оценивание. — М.: Наука, 1972.
7. Невельсон М. Б. Об асимптотическом эффективном рекуррентном оценивании параметра сдвига // Теор. вероят. и ее примен. — 1980. — Т. XXV, вып. 3. — С. 577—587.
8. Хубер П. Робастность в статистике. — М.: Мир, 1984.
9. Hjalmarsson Н. Optimally Robust System Identification of Systems Sunject to Amplitude-Bounded Stochastic Disturbunes // IEEE Trans. on Aut. Contr. — 1998. — Vol. 43, N. 7. — P. 947—953.
10. Неппап Е. J., Kanter M. Autoregressive processes with infinite Yariance // J. Appl. Probab. — 1977. — Vol. 14. — P. 411—415.
11. Болдин М. В., Штуте В. О. О знаковых тестах в ARMA модели с возможно бесконечной дисперсией // Теория вероятностей и ее применения. — 2004. — Т. 49, вып. 3. — С. 436—460.
12. Вильчевский Н. О., Шевляков Г. Л. Робастное оценивание параметра сдвига при ограниченной дисперсии помехи // Автоматика и телемеханика. — 1984. — № 11. — С. 104—109.
13. Koul Н. L, Susarla V. Adaptive estimation in linear regression // Statistics and desisions // 1983. — Vol. 1, N. 4-5. — P. 379—400.
14. Juditsky A., Nazm A. On minimax approah to non-parametric adaptive control // Int. J. Adapt. Control &Signal Process. — 2001. — N. 15. — P. 153—168.
15. Афанасьев В. Н., Колмановский В. Б., Носов В. Р. Математическая теория конструирования систем управления. — М.: Высшая школа, 1998.
16. Фельдбаум А. А. Основы теории оптимальных автоматических систем. — М.: Наука, 1966.
17. Фомин В. Н. Методы управления линейными дискретными объектами. — Л.: ЛГУ, 1985.
18. Ljrng L. System Identification — ТКеоцу for User. — New Jer-sy: Prentice-Hall, 1999.
19. BekkerA. Н., Kumar P. R., Wey Ch. Z. Adaptive Control with the Stochastic Approximation algorithm: Geometry and Conver-gense // IEEE Trans. on Aut. Contr. — 1985. — Vol. AC-30, N. 4. — P. 330—338.
20. ^еп Н. F., Guo L. Asymptotically optimal adaptive control with consistent parameter estimates // SIAM J. Contr. & Optimization. — 1987. — Vol. 25. — P. 558—575.
21. Guo L. Futher results on least-squares based adaptive minimum variance control // SIAM J. Control & Optimization. — 1994. — Vol. 32. — P. 187—212.
22. Коган М. М., Неймарк Ю. ^Идентификация рекуррентным методом наименьших квадратов при невыполнении условий теоремы Гаусса — Маркова // Изв. РАН. Техн. кибернетика. — 1993. — № 4. — С. 29—34.
23. Коган М. М., Неймарк Ю. И. Идентифицируемость локально-оптимальных адаптивных законов управления при косвенных наблюдениях // Автоматика и телемеханика. — 1990. — № 1. — С. 65—75.
24. Барабанов А. Е. Критериальная сходимость МНК в адаптивной системе управления // Доклады АН СССР. — 1982. — Т. 358, № 1. — С. 32—34.
25. Бунич А. Л. Пассивная и активная идентификация линейного дискретного объекта с ограниченной помехой // Автоматика и телемеханика. — 2003. — № 11. — С. 60—73.
26. Бунич А. Л. Идентификация дискретных линейных объектов с большим отношением сигнал/шум // Автоматика и телемеханика. — 2001. — № 3. — С. 53—62.
27. Казаринов Ю. Ф., Фомин В. Н. Линейно-квадратичная задача стохастического управления. Часть III. Нелинейные оптимальные регуляторы // Автоматика и телемеханика. — 1993. — № 5. — С. 94—99.
28. Якубович В. А. Оптимизация и инвариантность линейных стационарных систем управления // Автоматика и телемеханика. — 1984. — № 8. — С. 5—45.
29. Олевский А. МПредставление функций экспонентами с положительными частотами // Успехи мат. наук. — 2004. — Т. 59, вып. 1 (355). — С. 169—178.
30. Цыпкин Я. 3. Скользящая аппроксимация и принцип поглощения // Доклады РАН. — 1997. — Т. 357, № 6. — С. 750—752.
31. Лундквист А., Якубович В. А. Универсальные регуляторы для оптимального отслеживания сигналов в линейных дискретных системах // Доклады РАН. — 1998. — Т. 361, № 2. — С. 177—180.
32. Г. В. Щипаное и теория инвариантности / Под ред. Э. М. Солнечного. — М.: Наука, 2004.
33. Методы классической и современной теории автоматического управления / Под ред. К. А. Пупкова и Н. Д. Егупо-ва. — М.: Из-во МГТУ им. Баумана, 2004. — Т. 3. Синтез регуляторов систем автоматического управления.
34. Бунич А. Л. Вырожденные задачи синтеза системы управления линейным дискретным объектом // Автоматика и телемеханика. — 2005. — № 11. — С. 35—45.
35. Хермандер Л. Введение в теорию функций нескольких комплексных переменных. — М.: Мир, 1968.
в (495) 334-87-59
E-mail: [email protected] □
УДК 62-50
РЕШЕНИЕ ЗАДАЧИ ИДЕНТИФИКАЦИИ СТРУКТУРЫ СТОХАСТИЧЕСКОГО ПРОЦЕССА
С. В. Соколов(1), В. А. Погорелов(2)
(1) Ростовский государственный университет путей сообщения; (2) Ростовский военный институт Ракетных войск, г. Ростов-на-Дону
Предложено решение задачи идентификации текущей структуры стохастического нелинейного многоструктурного процесса при измерениях его вектора состояния. Проанализирована возможность практической реализации предложенного подхода, приведен численный пример, иллюстрирующий его эффективность.
ВВЕДЕНИЕ
Изменение этапов жизненного цикла подвижных объектов различного назначения, работающих в условиях действия как внутренних, так и внешних возмущений, приводит к априорно неопределенным трансформациям структуры уравнений их состояния. Как правило, число возможных работоспособных структур объекта
ограничено и известно. Данное множество структур обусловлено либо нормальными процессами “жизнедеятельности” подвижного объекта, например, отделением ступеней ракет, сбросом обтекателя, раскрытием антенн, либо возникающими неисправностями. Возникает проблема идентификации структуры объекта из совокупности структур, известных априори. Существующие методы непараметрической идентификации обеспечивают решение задачи определения на заданном интер-