Научная статья на тему 'Системы управления с идентификатором'

Системы управления с идентификатором Текст научной статьи по специальности «Математика»

CC BY
528
166
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАТОР / РЕКУРРЕНТНОЕ ОЦЕНИВАНИЕ / ПРОГНОЗИРУЮЩАЯ МОДЕЛЬ / СИНГУЛЯРНЫЕ ВОЗМУЩЕНИЯ / IDENTIFIER / RECURSIVE ESTIMATION / PREDICTIVE MODEL / SINGULAR PERTURBATION

Аннотация научной статьи по математике, автор научной работы — Бунич Александр Львович

Представлен обзор работ по адаптивным системам управления с идентификатором (АСИ) дискретными объектами с параметрической и непараметрической неопределенностью на основе метода прогнозирующей модели. Основное внимание уделено связи между спектральными характеристиками внешних возмущений и предельно достижимым качеством управления и быстродействию идентификатора. Выделен класс стационарных возмущений с априорно известной локализацией спектра, в котором разрешима задача синтеза систем предписанной точности регулирования по критерию дисперсии установившейся реакции и исследуется чувствительность системы управления к вариациям спектрального состава возмущений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper overviews the literature on predictive model-based adaptive control systems with identifier (ASI) for discrete objects with parametric and nonparametric uncertainties. It focuses on the relationship between the spectral characteristics of external perturbations and maximum achievable control performance as well as identifier speed. A class of stationary external perturbations with the known spectrum localization is established with the solvable problem of synthesizing the systems of prescribed control precision subject to the criterion of minimum steady-state response variance. The sensitivity of the control system to variations of the spectral composition of disturbances is investigated.

Текст научной работы на тему «Системы управления с идентификатором»

УДК 62.50 ББК 32.817

СИСТЕМЫ УПРАВЛЕНИЯ С ИДЕНТИФИКАТОРОМ

Бунич А. Л.1

(Учреждение Российской академии наук Институт проблем управления РАН, Москва)

Представлен обзор работ по адаптивным системам управления с идентификатором (АСИ) дискретными объектами с параметрической и непараметрической неопределенностью на основе метода прогнозирующей модели. Основное внимание уделено связи между спектральными характеристиками внешних возмущений и предельно достижимым качеством управления и быстродействию идентификатора. Выделен класс стационарных возмущений с априорно известной локализацией спектра, в котором разрешима задача синтеза систем предписанной точности регулирования по критерию дисперсии установившейся реакции и исследуется чувствительность системы управления к вариациям спектрального состава возмущений.

Ключевые слова: идентификатор, рекуррентное оценивание, прогнозирующая модель, сингулярные возмущения.

1. Предпосылки идентификационного подхода к задаче синтеза регулятора

«Разница между типами систем в значительной мере определяется уровнем накапливаемой информации и отсюда наличием более или менее развитой иерархии частей управляющего устройства» [54, с. 581].

Под объектом управления понимается модель наблюдений (в эконометрике - механизм порождения данных, data

1 Александр Львович Бунич, доктор технических наук, профессор, ведущий научный сотрудник ([email protected]).

generating process [37]) со структурированной неопределенностью из заданного класса х = Si х х2, индексированного абстрактным параметром J, где х1 - неопределенность собственно объекта, а х2 - неопределенность возмущения. Выделим особо случай х = {J} - «полностью определенного объекта», для которого задача синтеза регулятора решается методами классической теории управления.

Регулятор (обратная связь) представляет собой неупреж-дающую зависимость изменяемых переменных (управлений) от наблюдений, а объект с присоединенным к нему регулятором называется системой управления. Цель синтеза регулятора определяется подлежащим минимизации функционалом стоимости управления в заданном классе допустимых обратных связей ^ Нижняя грань стоимости управления по классу ^ называется ценой управления. Синтез оптимального (субоптимального) регулятора состоит в построении системы, для которой стоимость управления совпадает с ценой (превосходит цену на не более чем заданный порог) для любого объекта из х.

Управление неопределенным объектом включает снижение неопределенности его начального описания в процессе обработки результатов наблюдений. Снижение неопределенности реализуется настраиваемой (подобранной, fitted) моделью, а точность настройки (подгонки под наблюдения [27, 29]) характеризуют функционалом невязки выходных переменных объекта и настраиваемой модели.

Возможны различные способы описания и снижения неопределенности объекта. Для снижения неопределенности объектов с детерминированной неопределенностью используют средства интервального анализа [23], гарантированного оценивания, основанного на методе описанных эллипсоидов [35]. В рамках статистического описания неопределенности принципиальное значение имеет тот факт, что функционалы от эмпирического распределения с увеличением объема выборки наблюдений сближаются с соответствующими «теоретическими» значениями, что позволяет состоятельно оценивать характеристики объекта методом подстановки и его модификациями [5].

Пусть {xt }T=1 - выборка объема T независимых однородных наблюдений из генеральной совокупности с неизвестным распределением P, а неопределенный параметр объекта J задан как функционал от распределения: J = G(P). Метод подстановки рекомендует в качестве оценки параметра выбрать статистику JT = G(PT) где PT - эмпирическое распределение. Если функционал G(P) определен на гладких распределениях, то вместо PT используют подстановку сглаженного эмпирического распределения. К оценкам подстановки относятся, например, ОМП (оценки максимального правдоподобия) [25, с. 51], M-оценки Хубера [57], оценки методом моментов К. Пирсона. Идею подстановки использует и метод идентификации, основанный на построении настраиваемой прогнозирующей модели объекта. Параметр J определен (в неявной форме) условием минимума функционала невязки выходов объекта и модели, а выборочная оценка параметра определяется минимизацией эмпирического функционала (полученного заменой в функционале невязки ансамблевого усреднения выборочным средним). Алгоритм вычисления оценок в реальном времени (алгоритм идентификатора) определяется процедурой стохастической аппроксимации, градиентной или псевдоградиентной относительно эмпирического функционала, [55, 83]. Настройку модели интерпретируют как идентификацию (буквально - отождествление при T ® ¥, от лат. identifico - отождествлять) настраиваемой модели с точной, параметр которой совпадает с параметром объекта. Идентификация относится к обратным задачам динамики - восстановления неизвестных характеристик объекта по наблюдениям. Теоретические результаты идентификации подкреплены программным обеспечением в рамках системы MATLAB (пакет System Identification Toolbox) на основе известных методов идентификации, в частности, разработанных Л. Льюнгом [81, 82].

Метод подстановки подсказывает иерархическую структуру адаптивной системы управления с идентификатором (АСИ), адекватно отражающую разделение темпов процессов в системе на быстрые (координатные) и медленные (параметрические) возмущения (рис. 1) [19, 41]. АСИ включает настраиваемый ре-

гулятор, структура которого определена на этапе синтеза основного контура, и (поисковый или беспоисковый) идентификатор, управляющий настройками регулятора.

Рис. 1. Структурная схема АСИ

Предположим, что задача синтеза основного контура решена, и управления и при известном параметре Ф формируются по закону и0 = и0(у0, Ф), их = Щи'-1,ух, Ф), X = 1, 2..., с известными функциями прошлых наблюдений (управлений и и измеряемых выходов объекта у) их(*). Для формирования управлений неопределенным объектом произведем подстановку Фх = Фх(их 1, У 1) ^ Ф, где оценки параметра Фх на соответствующих тактах определяются идентификатором, и построим реализуемую стратегию управления с обратными связями ио = ио(уо, Ф), щ = Щи1-1,У, Ф), X = 1, 2.

Естественно предположить, что при состоятельном оценивании параметра неопределенность начального описания объекта несущественна в смысле предельного по Т ® ¥ функционала стоимости управления

Т

4 = Пшвир Т 4 £ 4 ® inf, 4 = Е^ (Ух, их, V',Ф)

с функциями потерь дх(*), X = 1, 2, ..., Еи - математическое ожидание по стратегической мере, которая соответствует случайному управляемому процессу, порожденному стратегий и е

Кроме того, идентификатор в качестве датчика параметрических возмущений может использоваться не только при проектировании АСИ, но также и при решении важных задач обслуживания систем управления, например, для прогнозирования медленных отказов, а также в исследовательских целях.

Впервые промышленная система с идентификатором в цепи обратной связи, используемым для настройки компенсатора, была внедрена в системе управления точностью прокатки труб [39, 47].

Очевидно, изложенная схема синтеза регулятора может быть обоснована лишь в рамках асимптотической постановки задачи («решение неасимптотических задач оценивания, хотя и весьма важное само по себе, как правило, не может являться объектом достаточно общей математической теории», [25, с. 7]). Действительно, заморозим идентификатор на некотором фиксированном такте t = Т >> 0: $ = $Т при t > Т Устойчивость замкнутой системы представляет статистическую гипотезу по ограниченной выборке наблюдений, которая не может быть достоверной с вероятностью единица. Таким образом, построенная система управления имеет ограниченную надежность, не обеспечивая достижения даже наиболее слабой (стабилизационной) цели синтеза.

Попытка решения задачи синтеза в неасимптотической постановке на основе байесокого подхода осложняется так называемой «априорной трудностью» - неадекватным реальным условиям предположением о том, что случайный параметр $ имеет известную априорную плотность распределения. Переход от априорной к апостериорным плотностям распределения (относительно прошлых наблюдений при фиксированной регулярной стратегии управления V) по правилу Байеса

Ри($У) = Ри( $/У-1) р(у /$ У-1)/р(у /у-1),

локализация и темп локализации этих плотностей в окрестности «истинного» значения параметра зависит (для систем с активным накоплением информации) от выбора стратегии и интерпретируется как «изучение» объекта [54]. Более формально неопределенный объект с состоянием х рассматривается как полностью определенный с расширенным состоянием X = (х, $),

параметр - как ненаблюдаемая компонента состояния X, а задача синтеза - как задача стохастического оптимального управления полностью определенным объектом по неполным данным. При конечном горизонте управления оценки чувствительны к априорной плотности распределения и зависимость ослабевает лишь при Т ® ¥ («принцип асимптотической инвариантности байесовских оценок» по отношению к априорной плотности, [25, с. 35]). Таким образом, в реальных задачах (когда априорное распределение неизвестно) «априорная трудность» преодолевается введением большого параметра Т. При этом вопрос о состоятельности оценок параметра объекта в замкнутом контуре требует специального рассмотрения (мартингал Леви Е(Ф|ух) сходится п.н. при X ® ¥ однако сходимость к Ф определяется условными моментами второго порядка и зависит от выбора стратегии управления).

Обоснование идентификационного подхода сопряжено со значительными трудностями. Прежде всего, допущение о состоятельности оценок параметра представляет ограничение на класс стратегий управления и относится к цели синтеза, а не к исходной постановке задачи. Кроме того, условие состоятельности необходимо согласовать с операцией ансамблевого усреднения в функционале стоимости. Далее, на больших временных интервалах предположение о стационарности объекта неадекватно реальной ситуации (износ инструмента, старение катализатора - типичные примеры медленных параметрических возмущений с неизвестной динамикой). Во-вторых, предельно-оптимальные стратегии существенно различаются по скорости переходных процессов (скорости сходимости временных средних к пределу в определении функционала стоимости), и практически важный вопрос об оптимизации стратегий по качеству переходного процесса требует специального рассмотрения. В третьих, остаются открытыми вопросы оптимального синтеза основного контура и алгоритма идентификатора (идентификация объекта в замкнутом контуре, когда оценки параметра используются при формировании управлений, специфична, не сводится к известным из статистики процедурам состоятельного оценивания и может потребовать принятия специальных мер по

обогащению спектра процесса управления). Наконец, для проектирования АСИ необходимо рассмотреть важные вопросы эффективной вычислительной реализации стратегии управления в системах реального времени.

Малая вариативность управлений и требование устойчивости замкнутой системы стимулировали прогресс в рекуррентном оценивании [55, 62,69, 73, 74, 77, 85, 89, 90, 92] и активной идентификации (с использованием поисковых процедур и тестовых сигналов). Однако реализация активных стратегий осложнена ограничениями режима нормальной эксплуатации [61] и трудностями оценки потерь на поиск [49], поэтому вопрос о выборе активной или пассивной идентификации не имеет универсального ответа.

Для некоторых классов объектов эффективное управление возможно и без снижения неопределенности [45], либо на основе «функциональной идентификации» [17, 56], когда идентифицируется объект из того же или близкого класса адаптивности, на основе общего решения адаптивной минимаксной задачи в терминах систем совместимых моделей [2], посредством прямого подхода (более простого в реализации, особенно для систем с малой размерностью вектора настраиваемых параметров регулятора). Наконец, условия состоятельного оценивания в АСИ могут быть избыточны по отношению к построению предельно - оптимальной стратегии, например, при использовании в идентификаторе МНК в случае предельного вырождения информационной матрицы [1, 28].

Для иллюстрации трудностей проектирования систем управления объектами со стохастической неопределенностью рассмотрим задачу компенсации постоянного возмущения. Скалярный объект описывается уравнением ух = Ф + их + Vх с дискретным временем X = 1, 2, ..., центрированной стационарной помехой V, управлением и, неизвестным параметром Ф и стабилизируемым на нулевом уровне измеряемым выходом у. Цель управления (ЦУ) - асимптотическая по времени стабилизация - реализуется регулятором их = -Фх_1( у[-1), X > 1, и1 = 0, где Фх_1( у[-1) - состоятельная оценка параметра сдвига по измерени-

ям {у!"1}. Таким образом, каждой состоятельной оценке параметра соответствует некоторая стратегия управления, и естественно классифицировать оценки по скорости затухания переходного процесса в идентификаторе, измеряемой, например, асимптотикой с.к. ошибки стабилизации О^ ($) = Е($ — $)2.

Такой выбор критерия качества естественен для класса асимптотически нормальных оценок — $) ~ ^(0, ^($))) с

дисперсией предельного распределения нормированной ошибки 0($). Точная нижняя граница (граница Рао-Крамера) дисперсии 0($) достигается, например, для оценок ММП (метод максимального правдоподобия), а оценки, для которых достигается эта граница, называются асимптотически эффективными по Фишеру. Намеченная Фишером программа состояла в построении асимптотически оптимальных оценок (для которых дисперсия предельного нормального распределения минимальна равномерно по оцениваемому параметру) и обосновании ММП.

Обоснование программы Фишера в последующие десятилетия потребовало значительных усилий многих статистиков. Во-первых, программа Фишера охватывала лишь регулярные задачи (с конечной информацией Фишера Д$)). В нерегулярных же задачах, как правило, не выполняется условие асимптотической нормальности нормированной соответствующим образом ошибки, а асимптотическая скорость сходимости О2 ($) при t ® ¥

может быть существенно (по порядку объема выборки) выше, чем в регулярном случае (пример: ММП для помехи с равномерным распределением). Во-вторых, и в регулярных задачах для некоторых значений параметра 0($).меньше нижней границы Г1($) (впервые пример такой суперэффективной оценки построил Ходжес) и оценок с минимальной дисперсией не существует [25]. В третьих, более адекватна приложениям задача оценивания, в которой распределение помехи известно с точностью до некоторого класса, т.е. оценки параметра должны быть «адаптивными» [34] по отношению к неопределенности помехи, обеспечивая такую же дисперсию предельного распределения нормированной ошибки, как ММП при заданном распределении помех.

Наконец, для построения АСИ представляют интерес именно рекуррентные аналоги алгоритмов оценивания, позволяющие использовать идентификатор в системах реального времени.

Перечисленные затруднения (даже в узких рамках асимптотического подхода) дают некоторое представление о масштабе проблемы проектирования АСИ с учетом существенно более сложных (по сравнению с рассмотренным тривиальным примером) условий реальных задач синтеза, в которых стабилизируемая переменная необязательно наблюдаема, объект многомерный динамический, а вопрос об оптимальном синтезе основного контура требует специального рассмотрения.

Ограничимся лишь довольно кратким перечнем результатов математической статистики, используемых при построении АСИ.

2. Статистическое оценивание (основные вехи)

Современная постановка задачи оценивания и общее условие состоятельности оценок ММП (метод максимального правдоподобия) принадлежат Вальду (1939, 1943, 1949), а состоятельность байесовских оценок установлена Ле Камом (1953).

Видимо, первый пример ММП привел Даниил Бернулли (1777): оценивание параметра сдвига В-распределения. В частных случаях ММП применялся Гауссом. Ему принадлежит и рекуррентная версия МНК (1821).

Метод моментов предложил К. Пирсон (1894).

Общий ММП с исследованием асимптотики дал Р. Фишер: (1912, 1925), обоснованием ММП занимались Дуб, Вольд, Воль-фовиц, Крамер (30-40 гг).

Минимаксные оценки введены Борелем (1921) и Дж. Нейманом (1928).

Неравенство информации получено (независимо) Р. Фишером (1925), Фреше (1943), Рао (1945), Крамером (1946).

Нерегулярные задачи оценивания: Даниил Бернулли (1777), Ибрагимов иХасьминский (1972), Ермаков (1977) по наст. вр.

Непараметрическое оценивание: Парзен, Розенблатт, Стейн, Левит, Невельсон, Ибрагимов (50г. по наст. вр.)

Метод стохастической аппроксимации: Роббинс и Монро, (1951), Блум (1954), Кифер и Вольфовиц (1952), Сакрисон (1964,

1966), Фабиан (1960-1968), Цыпкин (1968), Айзерман, Бравер-ман и Розоноэр (1970), Невельсон и Хасьминский (1972) по наст. вр.

Устойчивость статистических решений и робастная идентификация: Тьюки, Ходжес, Леман, Хьюбер, Цыпкин и др. (70-е гг. по наст. вр.)

Некорректность задачи статистического точечного оценивания (как обратной задачи теории вероятностей): Ченцов Н.Н. (1981) [60].

3. Отслеживание динамики нестационарного объекта

В [4] решена задача состоятельного отслеживания детерминированного дрейфа для нестационарного объекта (1), в котором изменяющиеся коэффициенты операторных полиномов образуют параметр $ь $т = Н$ь матрица Н известна, начальное значение $0 не определено. При некоторых предположениях, включая предельную ограниченность процесса и, построена рекуррентная сильно состоятельная оценка $*(у0, и10) параметра $

Для отслеживанеия случайного дрейфа используются: алгоритм Качмажа [15] и его модификации [46], оценивание на скользящем временном интервале [40], взвешенный МНК (с дисконтированием) [83].

Для линейных объектов хт = At(Jt)хt + Bt(Jt)ut + (в регрессионной форме =Ф$ + ум) с обратными связями по выходу и = и (у) достаточно общего типа задача отслеживания линейного марковского дрейфа параметра $ = + wt+l) рассмотрена в [55, §5.2]. При независимых гауссовских бело-шумных возмущениях (в уравнениях дрейфа и объекта) и линейных матричных функциях А$), В$) с.к. оптимальные оценки на каждом такте t в классе произвольных статистик от данных наблюдений х\ ut-1 дает фильтр типа Калмана-Бьюси (в отличие от стандартного фильтра Калмана-Бьюси матрица состава измерений Фt случайная и зависит от и прошлых измерений выхода у^1. Рассматривается асимптотическая точность

слежения при стационарном дрейфе (Ft = F) и с.к. малых возмущениях W на основе непрерывности в малом решения уравнения Риккати относительно свободного члена.

В [86] отслеживается медленное случайное блуждание Jt = Jt-1 + gwt параметра регрессии yt= Jj xt+vt с независимыми

белошумными процессами v, w. Алгоритм слежения (SLAMS, smoothed average LMS) использует последовательное усреднение стандартных LMS-оценок посредством скользящего усреднения и экспоненциального сглаживания с матричным коэффициентом S. В представлении U = gU0 + o(g) для асимптотической ковариационной матрицы ошибки слежения U получена нижняя граница для U0 и для гауссовских возмущений установлено достижение этой границы оценками SLAMS при оптимальном выборе коэффициента S.

4. Метод прогнозирующей модели

Для идентификации линейного объекта (1) a(V)yt = b(V)u + vt, a(0) = 1, Ь(0) = 0

с возмущением vt = c(J, V)et, где параметр J представляет набор неизвестных коэффициентов полиномов в (1), c( J, 0) = 1, а e - обновляющий процесс, используют настраиваемую (прогнозирующую) модель с входом (y, и), выходом y* = xj J , настройкой модели J и расширенным регрессором xt=col( yll, ul'n, £t-m x et = yt - y*\ m = deg c.

Точность настройки модели определяется функционалом невязки I (J*) = limsup Ej (e ) с выпуклой функцией потерь je),

j(0) = 0. В режиме нормальной работы схема наблюдений стационарна и I( J) = E j(et). При некоррелированном возмущении c(J, z) = 1 модель с регрессором xt = col(ytt-n,utt-ln) называется регрессионной.

Структура модели [55, 58, 83]. Пусть полином

c(J, z),

J е x с устойчив, а (1) представлено в форме обновления a(J*, V)yt = {Ь( J*, V)ut + [c( J*, V) - 1]}et + et при J* = J, где пер-

вое слагаемое (в фигурных скобках) определяется предысторией (yt-1, Mt-1), а последнее слагаемое от предыстории не зависит Регрессионная модель получается отбрасыванием последнего (обновляющего) слагаемого et. Для коррелированного же возмущения модель имеет структуру

(2) c(J*, V) y* = [c( J*, V) - a(J*, УМ + b(j\ V)ut.

Для симметрично распределенных с.в. et точно настроенная модель (2) отслеживает обновление (et — et» 0 при t >> 1) и I(J*) > I(J) = Eje) Метод прогнозирующей модели относится к методам подстановки [5]: в функционале J = arg min 1(т) от

тех

распределений наблюдений производится подстановка 1эмп(Т) ® 1(т). Идентификатор определяется выбором градиентной или псевдоградиентной относительно функционала невязки процедуры стохастической аппроксимации (например, для квадратичного функционала - расширенный МНК, а для более медленно растущих функций потерь j(*)- различные алгоритмы робастного оценивания).

Исследование сходимости существенно усложняется, если оценки параметра используются при формировании управлений. Из-за нестационарности АСИ для исключения параметрического резонанса приходится снижать темп перенастройки регулятора по сравнению с темпом идентификации (использованием кусочно-стационарных стратегий с увеличивающимися циклами идентификации на интервалах стационарности и перестройкой параметров в начале каждого цикла [55, 76, 90]). Состоятельное оценивание требует, вообще говоря, рандомизации управления широкополосным (обычно белошумным) тестовым сигналом. Требования к мощности тестового сигнала противоречивы, что отражает двойственность управления, «в известной мере изучающего и одновременно направляющего» [54, с. 390].

Для минимально-фазовых n х n объектов (1) с конечно-зависимым возмущением и заданной равномерно ограниченной программной траекторией y настраиваемый регулятор (адаптивная версия регулятора Астрема [64]) описывается уравнением Jj xt = У*+1 + wt, cov(w) = Rw, с расширенным регрессором xt и

рандомизирующим управление белошумным тестовым сигналом wt, независимым от возмущения в объекте vt = c(J, V)et, Re c^(J , z) > 1/2 при \z\ = 1. В идентификаторе используется упрощенная версия МНК (схема Гудвина). Стратегия управления -идентифицирующая при невырожденной матрице Rw, и выполняются соотношения:

lim sup T -1 £ (IM2 +\\ U \\2) <¥,

T t=1

lim sup T-1 £ T=1 (y, - y,*)(y( - y*) = Rw п.н.

T

Идея рандомизации высказана Фишером [72] (рандомизированное планирование эксперимента). Пробное воздействие (информирующую обратную связь) предлагал Винер [13, с. 178]. Состоятельность оценок в алгоритмах с рандомизацией обеспечивается при достаточно широких предположениях о возмущении [14]. Алгоритмы с возмущением на входе» [50, 55] (поисковые алгоритмы стохастической аппроксимации) широко использовались в задачах идентификации объекта в замкнутом контуре и адаптивного управления. О применении алгоритмов с рандомизацией см. на сайте http://www.jhuapl.edu/SPSA).

В [55] рассмотрена задача синтеза для объекта (1) с заданным компактным выпуклым множеством X, vt = c(J, V)et, Re c(J, z) > p = const > 0 при \ z \= 1, J*ex; пара полиномов

a( J*, z), b(J*, z) стабилизируема при J*e X. Обновление e и бе-лошумное тестовое воздействие w в канале обратной связи (3) независимы в совокупности, причем

Ewt = 0, lim Ew4 = 0, Ewf > c /ln t, c > 0.

t

Стоимость управления J[U¥ (*)] = limsup T-1 £=1 q(X, U) с

T

заданной неотрицательной квадратичной формой q(x, y), xt = col( ytt-n-1, uti:--1n-1) Пусть J (J) - цена управления, достигаемая (нереализуемой) линейной стратегией для объекта (1) с параметром Je X. Построена реализуемая идентифицирующая стратегия U¥(*), для которой выполняется условие J[U"(*)] = J (J) независимо от начальных данных и параметра

объекта $ е X. Стратегия и°(*) порождена рандомизированной настраиваемой обратной связью (3) а($, V)«, = УЪ +

где для вычисления оценок параметра $ используется упрощенная версия расширенного МНК с проектированием оценок на X. Убывание мощности тестового сигнала необходимо для исключения роста стоимости управления из-за рандомизации, а ограничение на скорость убывания требуется для состоятельного оценивания.

Значительный прогресс достигнут в исследовании скорости сходимости. Видимо, впервые проблема оптимизации алгоритмов адаптивного управления по скорости сходимости была поставлена в [36]: для линейных систем была установлена асимптотическая нижняя граница и построен алгоритм идентификатора, который при определенных условиях обеспечивает достижение этой границы.

Для многомерного объекта (1) с возмущением мартингал-разность в [66] установлен порядок скорости сходимости п.н. оценок МНК: || $ - $ ||2 = 0(1п/). Для более широкого класса возмущений порядок скорости сходимости МНК исследуется в [96].

При проектировании АСИ полезен методический прием введения обобщенного настраиваемого объекта (ОНО), включающего собственно объект управления, измерительную систему, исполнительные механизмы и управляющие устройства с настраиваемыми параметрами [51]. Сингез ОНО представляет первый этап решения задачи синтеза основного контура, структура которого определяет зависимость управлений от параметра объекта.

Идентификатор как датчик параметрических возмущений позволяет использовать в АСИ принцип регулирования по возмущению.

Пример идентифицирующей стратегии рассмотрим на примере модели, использованной в АСИ точностью прокатки труб2

2 За внедрение адаптивной системы управления точностью прокатки труб группа сотрудников лаборатории идентификации ИПУ РАН была удостоена Государственной премии СССР.

[46, 47]: yt = x]j + kut + vt с наблюдаемым возмущением x е Rn

помехой v измерения выхода y е R1 управлением u е R1 и неизвестным параметром Je X = Rn, коэффициент усиления по управлению k Ф 0 известен. По предположению (x, v) -га-независимый стационарный центрированный процесс, Ext = 0,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

E||xt|| < ¥, |vt| < S п.н. c известной константой S> 0 с.в.; xt имеет

плотность распределения p(x) > 0, x е Rn.

В схеме АСИ на рис. 1 структурированное возмущение включает помеху измерения выхода и наблюдаемое (векторное) возмущение с каналами прохождения, обозначенными штриховыми линиями. Предельно-оптимальная стратегия Ц0 (*) определяется условием lim E ¥ (yt - vt )2 = 0 "j eX . В соот-J ■ J,и0 (*) t

ветствии с идентификационным подходом к синтезу регулятора стратегия U0° (*) порождается настраиваемым компенсатором ut = -к ^xjfi^ с оценками неизвестного параметра, вычисляемыми идентификатором посредством алгоритма «зона нечувствительности» [7, 11, 12]:

J = J-1 + f (yt -ки, -XtTJt-,)X II Xt ||-2, Jo s R", (z) =i 0 при M£ 3

[z - 3 sign (z) при I z I > 3.

Алгоритм «зона нечувствительности» - стохастическая версия релаксационной процедуры Моцкина (1951) решения систем линейных неравенств. Геометрическая интерпретация коррекции оценки - проектирование в бесконечную прямоугольную полосу, толщина которой определяется амплитудой помехи (при отсутствии помех полоса вырождается в плоскость, а алгоритм превращается в итерационную процедуру Качмажа решения системы линейных уравнений).

В АСИ с объектом (1) эффект большого отношения сигнал/шум создается искусственно рандомизацией управления тестовым сигналом убывающей средней мощности, но принимающего на редких тактах большие значения (именно такой

прием, увеличивающий невязку, избавляет от остановки алгоритма при достаточно точной оценке параметра объекта).

Интерпретация. Идентификатор «дожидается» длинного и повернутого в нужную сторону наблюдаемого возмущения», что гарантируется приведенными ограничениями на помеху и наблюдаемые возмущения, обеспечивающими эффект большого отношения сигнал/шум. Именно этот эффект увеличивает невязку выходов объекта и модели, исключая прекращение коррекции оценок в малой окрестности истинного значения параметра.

Для некоторых классов ограниченных помех измерений с граничными особенностями получены неасимптотические оценки скорости с.к. сходимости по степенному закону со сколь угодно большим (в зависимости от типа особенности) степенным показателем [11].

Алгоритм «зона нечувствительности» применен в системе статического управления кислородно-конвертерной плавки стали для прогноза температуры и содержания углерода [68]. «Зона нечувствительности» применяется во многих алгоритмах оценивания, в частности, в модификации МНК, использующей конструкцию вписанных эллипсоидов [70].

5. Идентификация и управление объектами с непараметрической неопределенностью

Для статических объектов с непараметрической неопределенностью предельно достижимая скорость сходимости определяется достижимыми нижними границами информационных неравенств и зависит по порядку величины от гладкости восстанавливаемой характеристики [24, 25].

Для объекта нелинейная авторегрессия - скользящее среднее у( = /(у, х\_п ) + с независимыми в совокупности возмущениями х, V в [21] построены рекуррентные состоятельные оценки нелинейности парзеновского типа. Оптимизация непараметрических оценок по скорости сходимости (с применением к задаче томографии) рассматривается в [30].

В [79] отслеживается программное движение y (известная детерминированная равномерно ограниченная последовательность) для объекта yt = JT f (ytt_ln ) + ut-1 + vt с белошумным возмущением v, класс неопределенности х={/:||f||<Cj+C^|y||b}, b > 0. Стратегия управления порождается обратной связью ut= _ Jj ft(y^)+ yj+1, где для вычисления оценок Jt используется МНК. При b < 4 получена оценка качества слежения

T

£(yt _ y* _ vt)2 = O(lnT) при T ® да, а при b > 4 установлена

t=i

неустойчивость системы (нарушение условия предельной ограниченности п.н. средней мощности).

В [76] рассматривается задача стабилизации объекта нелинейной авторегрессии первого порядка yt = —fyt-1) + ut-1 + vt, где стационарное возмущение v - центрированный процесс с независимыми значениями и достаточно гладким распределением, f eS, где х - класс Гель-дера с показателем S. Допустимы селекторы и = U/yt0), t - 0 удовлетворяющие условию равномерной устойчивости supt>0supfeS Eyf < ¥. Стратегия адаптивна, если выход следит за возмущением:

T

lim sup T_ £ E(yt _ vt )2 = 0 "f e S.

T t=i

Цель состоит в оптимизации адаптивных стратегий по скорости переходного процесса (сходимости к нулю с.к. ошибки слежения).

Идентификатор определяет по наблюдениям локально-полиномиальные оценки f(*) неизвестной характеристики f а управления формируются регулятором ut = ft(yt). Перестройка регулятора производится лишь на тактах, расстояние между которыми (во времени) растет экспоненциально. Установлено информационное неравенство (без ограничения равномерной устойчивости):

limsup t2*/|>+1) sup E(yt _ vt)2 - C(S) (C(S) > 0).

t®¥ feH

Если стратегия управления удовлетворяет условию равномерной устойчивости, то

liminf t2s/(2s+1) sup E(yt - vt )2 > C(X).

t®¥ feZ

Таким образом, установлена минимаксная нижняя граница ошибки стабилизации для равномерно устойчивых стратегий. Получено информационное неравенство (с усреднением по времени), справедливое без ограничения равномерной устойчивости:

lim inf T2s/(2s+1) sup T- YE(yt -vt)2 > (2s + 1)C(X).

T®¥ feZ 1=1

Построена адаптивная стратегия, для которой верхняя граница с.к. ошибки стабилизации совпадает с нижней границей с точностью до зависящей от s мультипликативной константы. Порядок скорости сходимости с.к. ошибки стабилизации O(t-2s/(2s1) такой же, как и в задаче оценивания непараметрической регрессии [25].

6. Задача синтеза основного контура

Предельные возможности проектируемой системы (в смысле критерия стоимости) во многом определяются на этапе синтеза основного контура. Для «стандартных» возмущений (гаус-совских с известной рациональной спектральной плотностью) можно ограничиться классом линейных стратегий, порожденных допустимыми (стабилизирующими объект) регуляторами [56]. Ограничения «стандартности» существенны: для негаус-совских возмущений оптимальная стратегия управления линейным объектом порождается, вообще говоря, нелинейными обратными связями [26], а рациональность спектральной плотности обеспечивает разрешимость задачи оптимизации в классе допустимых регуляторов (напомним, что допустимы лишь регуляторы конечной глубины памяти).

Ограничения стандартности часто аргументируют простотой вычислительной реализации винеровских регуляторов, однако для многомерных систем процедура факторизации матричных полиномов требует значительных вычислительных затрат.

Еще более существенны принципиальные возражения против условий стандартности и даже еще более широкого условия линейной регулярности возмущений, необходимых для применимости метода факторизации. Действительно, регулярность возмущения представляет нетривиальное предположение о физических процессах во внешней среде - гипотезу обновления, согласно которой функционирование системы управления сопровождается стационарным притоком новой (обновляющей возмущение) информации. Эта гипотеза не выполняется, например, для возмущений с конечным спектром частот, когда задача синтеза решается элементарными средствами (на основе «принципа поглощения» [59]). Интересно, что именно автор метода факторизации приводит пример [14, с. 268]) процесса с типичным признаком сингулярности - «исчезновением спектра» в некотором частотном диапазоне (вблизи частоты 9,05 Гц при исследовании энцефалограмм). Наконец, стандартные модели возмущений не охватывают широкий класс процессов с «длинной зависимостью» (long-range dependence), широко распространенные в гидрологии и геофизике, анализе сетевого трафика, в области телекоммуникаций и финансовой математике

[53, 80, 84, 88, 91, 95]. Учет особенностей моделей возмущений, в частности, фрактальных процессов позволяет предложить более эффективные регуляторы по сравнению по сравнению с типовыми [43, 44] (см. авторский сайт: http://www.potapov-fractal.com). С учетом изложенного можно заключить, что именно формирование «банка упрощенных моделей представляет препятствие, о которое спотыкается теория управления на практике» [22, с.13].

Напомним, что управление с прогнозом (predictive control) восходит к идее Винера замены принципа предварения Понселе прогнозирующими фильтрами в цепи обратной связи, не имеющей отношения к обоснованию метода факторизации. Регуляторы с экстраполяцией используются, например, при управлении энергетическими объектами [32].

Естественна попытка описания достаточно массивного класса неопределенности X, для которого жесткие требования к точности регулирования совместимы с эффективной реализацией регулятора. Основные вопросы сводятся к следующему:

1. Существуют ли задачи синтеза с нулевой ценой управления? (далее такие задачи назовем вырожденными).

2. Каковы ограничения на возмущения, обеспечивающие вырожденность задачи синтеза?

3. Насколько велико увеличение стоимости управления, когда характеристики возмущений не удовлетворяют ограничениям п.2?

Возмущение с конечным спектром или с непрерывным спектром, имеющим «мертвую зону» (типа приведенного Винером примера) дают положительный ответ на вопрос п.1. Предположим, что расположение «мертвой зоны» (интервала частот нулевой спектральной меры, называемого далее лакуной) известно (именно такова ситуация, когда возмущение имеет конечный спектр частот, известных с малыми погрешностями). Тогда можно построить допустимый (стабилизирующий объект (1)) без использования дополнительной (помимо расположения лакуны А) информации о возмущении [38]. Приведем более точные формулировки.

Пусть х - класс центрированных стационарных возмущений {v} с фиксированной дисперсией D и лакуной А с [-p, p], Iv(K) -стоимость управления объектом (1) с регулятором K. Тогда (4) inf sup Iv (K) = 0.

КеЭТ veH

Наличие лакуны «почти достаточно» для вырожденности задачи синтеза (независимо от п.ф. объекта по управлению): вырожденность задачи синтеза возможна только для линейно-сингулярных возмущений (напомним критерий сингулярности [48, с. 86]: ln 5 g Ll[-p, p] где 5 - плотность абсолютно непрерывной компоненты спектральной меры возмущения).

Сингулярность процесса (в соответствии со значением термина singular) ассоциируют с некоторой особенностью, нетипичностью. Естественно возникает вопрос об универсальности метода факторизации в смысле его применимости к возмущениям «общего положения». При положительном ответе (и при неадекватном реальным задачам синтеза требовании полной информации о возмущении) вырожденные задачи синтеза можно было бы отнести к исключительным, нетипичным.

Строгое определение нетипичности естественно в терминах бэровских категорий для пространства M спектральных плотностей с ¿'-метрикой. В частности, именно такой подход к определению типичности использовался в работе [38].

Напомним, что класс R с M спектральных плотностей всех регулярных возмущений с абсолютно непрерывным спектром характеризуется условием ln s е Z1. Таким образом, точная формулировка гипотезы типичности свойства регулярности такова: является ли семейство R множеством второй категории Бэра (дополнением в M некоторого множества первой категории)? Как видно из следующего утверждения, гипотеза типичности свойства регулярности ошибочна.

Лемма. Множество R представляет множество первой категории Бэра в пространстве M

¥

Доказательство. R = U(n_1Q), Q = {s еM : l(s) > 0}.

и=1

Достаточно доказать, что Q* = 0, Q* = IntQ, где Q - замыкание O. Если Q* ^ 0, то Q содержит некоторый шар, поэтому

s е Q, где s £ M равна нулю на некотором малом интервале А (плотности, обращающиеся в нуль на интервалах, плотны в M).

Из s е Q следует s = limn®¥ sn с некоторыми sn е Q . В силу вогнутости логарифмической функции имеем: (Ь{(тА)-1 fsndA} > (тА)-1 Jlnsnd1), lim Jlnsnd1 ® -¥,

А А А

p

jsndÄ > j ln sndÄ = j ln snd1 - j ln snd1 > - j ln snd1 ® ¥ при

Ас Ас -P А А

n ® ¥, где Ас = [-p, p] \ А. Следовательно, lim J snd1 = ¥ во-

n®¥ J

Ас

преки s = limn®¥ sn, предположение Q* ^0 ошибочно и лемма доказана.

Таким образом, получен исчерпывающий ответ на вопрос из п.2, предположение об исключительности вырожденных за-

дач синтеза не имеет оснований, а проблема построения систем с предписанной стоимостью управления не сводится к «исключительным» частным примерам и требует специального рассмотрения.

Рассмотрим вопрос о грубости (п.3). Пусть «истинное» возмущение v имеет спектральную меру S, S(Ac) < e с малым e > 0 и не принадлежит классу X. Заметим, что неравенство S(Ac) < e выполняется, если спектральная мера S достаточно близка к спектральной мере некоторого возмущения v е X в смысле топологии сходимости спектральных мер по вариации [6, с. 176].

Для системы управления с некоторым допустимым регулятором K стоимость управления удовлетворяет неравенству

Iv(K) < d+|\w\|2 e , поэтому Iv(K) < d для достаточно малого e.

II y 1lo>

Таким образом, регулятор K гарантирует предписанный уровень стоимости управления d также для возмущений, спектр которых в основном сосредоточен в априорно заданном диапазоне частот А. Однако с уменьшением уровня d резко растет равномерно -частотный показатель || W ||¥ и сохранение целевого неравенства Iv(K) < d возможно лишь при достаточно малых e.

Система с ^-оптимальным регулятором обладает гораздо более сильным свойством грубости, поскольку определенный уровень стоимости управления d гарантируется независимо от спектрального состава возмущения. С другой стороны, использование информации о локализации спектра возмущения позволяет гарантировать предписанный уровень стоимости управления d << d, когда минимаксный подход приводит к консервативным результатам, преувеличивая неопределенность описания возмущений. Отчасти этот недостаток сглаживают модификацией критерия с введением весовых функций (частотно-зависимых множителей Cu(l), выделяющих наиболее значимые диапазоны частот [3]). Используем аффинную параметризацию класса п.ф. системы управления функциональным параметром f из класса 3 устойчивых д.р.ф., и рассмотрим экстремальную задачу

(5) sup ie[p,p]{|C\y |2 + | C2\u|2} ® inf .

Решение задачи (5) существенно зависит от выбора весовых функций, который естественно связать с априорной информацией о локализации спектра возмущений. При решении задачи синтеза системы с предписанной точностью управления в качестве весовой функции c выбирается индикатор спектра А и С2 ° 0. Аналогично, в задаче стабилизации с предписанными расходами на управление следует выбрать С2- индикатором А (при ci ° 0).

Для многомерных объектов (1) общего положения препятствием к вырожденности задачи (в смысле критерия следа ковариационной матрицы установившейся реакции) является фактор дефицита размерности по управлению. Действительно, если dim u < dim y, то матрица In - aWy = -bWu вырождена, что несовместимо с вырожденностью задачи синтеза регулятора.

При одинаковой размерности управления и стабилизируемой переменной и (покомпонентно) лакунарных возмущениях задача синтеза вырождена, а методика построения систем с предписанным уровнем стоимости управления описана в [8, 9] и в [10] для систем с непрерывным временем.

Схема решения. Пусть объект (1) стабилизируется некоторым опорным регулятором K0. Предположим временно, что возмущение на каждом такте доступно наблюдению в прошлом, настоящем и будущем. Построим комбинированную систему (рис. 2) с законом управления ut = K0yt + yvt, определенным условием полной компенсации [33, 52]: у = -b4.

n

* объект

*

u

опорный регулятор

корректор

Рис. 2. Структурная схема системы управления с опорным регулятором и корректором

Для сингулярного возмущения V = оо1(у\ ..., у") выход физически нереализуемого фильтра с п.ф. Ь"1 допускает с.к. аппроксимацию реакциями фильтров с полиномиальными п.ф. д(^). После исключения возмущений в силу уравнения объекта (1) комбинированную систему заменим системой с обратной связью по выходу

(6) щ = Ку, К = (I" — дЬ)-\Ко - да), д » Ь(-1). 1

Операция приближенного обращения полинома д = Ь(1) в (6) определяется соотношением Ь(ч) = аф(Ь)[!^е! Ь](-1), где второй множитель представляет собой диагональную матрицу diag(p1, ..., Р"), а элемент р, - результат ранее определенного приближенного обращения для скалярного возмущения V. Допустимость регулятора (6) и достижение (для аппроксимирующего матричного полинома д достаточно высокого порядка) предписанной стоимости управления проверяется непосредственным вычислением п.ф. замкнутой системы от возмущения к выходу.

Множитель (I" — дЬ)-1 в (6) играет роль селективно (по гармоникам из спектра возмущения) «большого коэффициента усиления», выбор которого согласован с требованием устойчивости замкнутой системы. Возможность операции приближенного обращения Ь(ч) в классе каузальных фильтров обусловлена именно сингулярностью возмущения и может рассматриваться в качестве приближенного метода «динамической компенсации». Предписанная стоимость управления обеспечивается регулятором, итеративным по структуре, в которой каждая итерация К0 ® К задается полиномом д, причем для фиксированного полинома д скорость снижения цены управления экспоненциальна относительно порядка регулятора.

7. Заключение

Ряд важных вопросов проектирования обсужден слишком фрагментарно или даже вообще не затронут. Применительно к задаче синтеза основного контура этот пробел восполняют монографии [16, 20].

АСИ имеют более чем полувековую историю, и структура таких систем обсуждалась разными авторами еще до первого

конгресса ИФАК [65], однако строгие результаты относительно предельной оптимальности и идентифицирующих свойств адаптивных стратегий были получены лишь на рубеже 70-80 годов. Проблемы предельно достижимого качества управления (в смысле асимптотики с. к. ошибки стабилизации) и предельного быстродействия идентификатора относятся к центральным.

Предельные возможности быстродействия идентификатора (по порядку степенной асимптотики с.к. сходимости оценок параметра объекта) в нерегулярных задачах оценивания зависят от типа особенности распределения возмущения, что показано в [7] для алгоритма «зона нечувствительности» в случае ограниченных возмущений. В [11] этот алгоритм использован для построения минимаксной прогнозирующей модели, а в [12] область применимости алгоритма была расширена посредством использования эффекта большого отношения сигнал/шум (при пассивной идентификации статического объекта и активной идентификацией динамического объекта с рандомизацией управления специальным тестовым воздействием).

Стандартная (аффинная) параметризация п.ф. системы управления описывает класс п.ф. системы управления без ограничения порядка. Параметризация системы управления с регуляторами заданного порядка рассматривалась в [75].

Проблемы каузальности, предсказуемости и случайности привлекали всеобщее внимание от глубокой древности (греческие богиня судьбы Мойра и случая, удачи Тихэ) до формирования мощного направления современной теории автоматического регулирования «predictive control» [71, 74], обсуждения границ предсказуемости и безошибочной фильтрации [31, 38, 42].

Напомним, что именно противоречие с причинностью выдвигалось критиками идеи полной компенсации Г.В. Щипанова [67, 93]. Однако в предсказуемых средах физически нереализуемое упреждение эквивалентно точному прогнозу по наблюдениям и противоречие с причинностью устраняется. Для некоторых классов линейно-сингулярных возмущений прогноз заданной точности эффективно реализуем и требуемая стоимость управления лимитируется только ограничениями на порядок регулятора. Методика синтеза систем с предписанной стоимостью

управления распространяется на объекты с непрерывным временем и возмущениями, спектральная мера которых удовле-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

¥

творяет условию Крамера ^вхн8(<И) < ¥ для всех достаточно

—¥

близких к нулю к. В частности, для возмущений с ограниченным спектром алгоритм синтеза систем с предписанной стоимостью управления предложен в [78]. Предложенная методика может рассматриваться и как этап синтеза основного контура АСИ с более массивным классом неопределенности, включающего неопределенность передаточной функции объекта по уп-рвлению.

Не рассмотрена проблема некорректности точечного оценивания как обратной задачи теории вероятностей, аналогичной некорректности нетривиальных задач математической физики [60]. Априорная информация о порядке идентифицируемого объекта (с параметрической неопределенностью) или гладкость восстанавливаемой характеристики (например, непараметрической регрессии) играет роль регуляризатора, превращающего «черный» ящик в «серый» и снижающего чувствительность оценок к вариациям параметров задачи.

Не рассмотрены методы построения адаптивных оценок (с такой же асимптотикой скорости сходимости, как нижняя граница Рао-Крамера при известном распределении возмущений, т.е. оценок, «адаптирующих себя» к неизвестному распределению). Возможность построения адаптивных оценок была высказана Стейном (1956) и впоследствии адаптивные оценки были построены для достаточно широких классов гладких распределений, включая оценивание параметра сдвига и регрессии [67, 78, 93]. Робастному оцениванию (для регулярных задач идентификации динамических объектов) посвящена монография [58].

Проблематика идентификации объекта в замкнутом контуре рассматривается в обзорной работе [94].

В настоящее время в действующих системах управления весьма велика (по некоторым данным около 90%) доля эмпирически построенных регуляторов малых порядков с 1-3 настраиваемыми параметрами (как правило, ПИ- и ПИД-регуляторов [18, 63, 87], предложенных еще в начале прошлого

века), не обеспечивающих требований к новой технике, прежде всего требований к точности регулирования). Именно ориентация на «сформировавшийся часто в ущерб реальности, но в угоду теории, банк упрощенных моделей» [22, с. 13], в частности, моделей внешних возмущений препятствует практическому использованию рекомендаций современной теории регулирования.

Автор благодарит Н. Г. Волчек за помощь при подготовке рукописи к печати.

Список некоторых обозначений и сокращений АСИ - адаптивная система управления с идентификатором МНК (ЬМЛ) - метод наименьших квадратов ОМП - оценка максимального правдоподобия П.ф. - передаточная функция П.н. - почти наверное С.в. - случайная величина

С.к. - сходимость - сходимость в среднем квадратическом

Е— математическое ожидание

хО" - совокупность значений (х0, ..., хТ)

Л— спектральная мера (спектральная функция) возмущения, Ь2(Л)- пространство функций с интегрируемым квадратом модуля по мере Л с нормой || * || г „)

ь (Л )

х- класс неопределенности объекта

класс п.ф. допустимых регуляторов V- оператор сдвига на такт назад (по времени) * - эрмитово сопряжение

Литература

1. БАРАБАНОВ А.Е. Критериальная сходимость МНК в адаптивной системе управления // Докл. Академии Наук СССР. - 1982. - Т. 358, №1. - С. 32-34.

2. БАРАБАНОВ А.Е. Синтез адаптивных Н¥ -оптимальных регуляторов // Автоматика и телемеханика. - 1999. - №3. -С.55-71.

3. БАРАБАНОВ А.Е., ПЕРВОЗВАНСКИЙ А. А. Оптимизация

по равномерно-частотному критерию (Н-теория) // Автоматика и телемеханика. - 1992. - №9. - С. 3-32.

4. БОНДАРЕНКО М.В., ПОЗНЯК АС. Сходимость алгоритмов оценивания нестационарных параметров регрессионно - авторегрессионных объектов при помехах типа скользящего среднего // Автоматика и телемеханика. -1993. - №8. - С. 90-108.

5. БОРОВКОВ А. А. Математическая статистика. - М.: Наука, 1984. - 472 с.

6. БУЛИНСКИЙ А.В., ШИРЯЕВ А Н. Теория случайных процессов. - М.: Физматлит, 2005. - 404 с.

7. БУНИЧ А.Л. Быстросходящийся алгоритм идентификации линейного объекта с ограниченной помехой // Автоматика и телемеханика. - 1983. - №8. - С. 101-107.

8. БУНИЧ А.Л. Вырожденные задачи синтеза систем управления линейными дискретными объектами // Проблемы управления. - 2009. - №5. - С. 2-8.

9. БУНИЧ А.Л. Вырожденные задачи синтеза системы управления линейным дискретным объектом // Автоматика и телемеханика. - 2005. - №11. - С. 35-45.

10. БУНИЧ А.Л. Высокоточные системы управления с сингулярными возмущениями // Автоматика и телемеханика. -2007. - №7 - С. 3-17.

11. БУНИЧ А.Л. Минимаксная прогнозирующая модель в системе управления с идентификатором // Автоматика и телемеханика. - 2006. - №7. - С. 120-132.

12. БУНИЧ А.Л. Пассивная и активная идентификация линейного дискретного объекта с ограниченной помехой // Автоматика и телемеханика. - 2003. - №11. - С. 60 73.

13. ВИНЕР Н. Кибернетика, или управление и связь в животном и машине. - М.: Сов. Радио, 1968. - 326 с.

14. ГРАНИЧИН О Н., ПОЛЯК Б.Т. Рандомизированные алгоритмы оптимизации при почти произвольных помехах. -М.: Наука. 2003.

15. ГРОП Д. Методы идентификации систем. - М.: Наука, 1979. - 336 с.

16. ГУДВИН Г.К., ГРЕБЕ С.Ф., САЛЬГАДО М.Э.. Проектирование систем управления. - М.: Лаборатория базовых зна-

ний, 2004. - 912 с.

17. ГУСЕВ С.В. Конечно-сходящийся алгоритм восстановления функции регрессии и его применение в задачах адаптивного управления // Автоматика и телемеханика. - 1989. - №3. -С. 99-108.

18. ДЕНИСЕНКО В.В. ПИД-регуляторы: принципы построения и модификации // Современные технологии автоматизации. - 2006. - № 4. - С. 66-74; 2007. - №1. - С. 78-88.

19. ДЕРЕВИЦКИЙ Д.П., ФРАДКОВ А Л. Прикладная теория дискретных адаптивных систем управления. - М.: Наука. 1981. - 216 с.

20. ДОРФ Р., БИШОП Р. Современные системы управления. -М.: Лаборатория базовых знаний, 2002. - 832 с.

21. ДУКАН П., ЦЫБАКОВ А.Б. Непараметрическое рекуррентное оценивание в нелинейных ARX-моделях // Пробл. передачи информации. - 1993. - Т. 29, вып. 4. -С. 24-34.

22. ЕМЕЛЬЯНОВ С В., КОРОВИН С.К. Новые типы обратной связи: Управление при неопределенности. - М.: Наука. Физ-матлит, 1997. - 352 с.

23. ЖОЛЕН Л., КИФЕР М., ДИДРИ О., ВАЛЬТЕР Э. Прикладной интервальный анализ (2-е изд). - Москва-Ижевск: Изд-во НИЦ «Регулярная и стохастическая динамика», 2007. -468 с.

24. ИБРАГИМОВ И.А. Об оценке многомерной регрессии // ТВП. - 2003. - Т. 48:2. - С. 301-320.

25. ИБРАГИМОВ И.А., ХАСЬМИНСКИЙ Р.З. Асимптотическая теория оценивания. - М.: Наука, 1979. - 528 с.

26. КАЗАРИНОВ Ю.Ф., ФОМИН В Н. Линейно-квадратичная задача стохастической оптимизации. III. Нелинейные оптимальные регуляторы // Автоматика и телемеханика. -1993. - №5. - С. 94-99.

27. КАШЬЯП Р., Рао А. Построение динамических стохастических моделей по экспериментальным данным. - М.: Наука, 1985. - 384 с,

28. КОГАН М.М., НЕЙМАРК Ю.И. Идентификация рекуррентным методом наименьших квадратов при невыполнении условий теоремы Гаусса-Маркова // Изв. РАН. Техн.

кибернетика. - 1993. - №4. - С. 29-34.

29. КОНЕВА Е.С. Выбор моделей для реальных временных рядов. Обзор // Автоматика и телемеханика. - 1988. - №6. -С. 3-18.

30. КОРОСТЕЛЕВ А П., ЦЫБАКОВ А.Б. Оптимальные скорости сходимости оценок в вероятностной постановке задачи томографии // Пробл. передачи информации. - 1991. -Т. 27, вып. 1. - С. 92-103.

31. КРАВЦОВ Ю.А. Случайность, детерминированность, предсказуемость // Успехи физических наук. - 1989. -Т. 158, вып. 1. - С. 93-122.

32. КРАСОВСКИЙ А.А., МИСРИХАНОВ М.Ш. Самоорганизующиеся регуляторы с экстраполяцией для энергетических объектов, история и перспективы // Автоматика и телемеханика. - 2006. - №5. - С. 48-53.

33. ЛЕЗИНА З.М., ЛЕЗИН В.И. Г.В. Щипанов и теория инвариантности (труды и документы). - М.: Физматлит, 2004. - 428 с.

34. ЛЕМАН Э. Теория точечного оценивания. - М.: Наука, 1991. - 448 с.

35. НАЗИН С.А., ПОЛЯК Б.Т. Параметрическое оценивание методом эллипсоидов в линейных многомерных системах с неопределенным описанием модели // Автоматика и телемеханика. - 2009. - №6. - С. 67-80.

36. НЕМИРОВСКИЙ А.С., ЦЫПКИН ЯЗ. Об оптимальных алгоритмах адаптивного управления // Автоматика и телемеханика. - 1984. - №12. - С. 64-77.

37. НОСКО В .П. Эконометрика. - М.: ИЭПП, 2004. - 501 с.

38. ОЛЕВСКИЙ А.М. Представление функций экспонентами с положительными частотами // Успехи матем. наук. -2004. - Т. 59, вып. 1 (355). - С. 169-178.

39. Основы управления технологическими процессами / Под ред. Н С. Райбмана. - М.: Наука, 1978. - 368 с.

40. ПЕРЕЛЬМАН И.И. Оперативная идентификация объектов управления. - М.: Энергоиздат, 1982. - 336 с.

41. ПЕТРОВ Б.Н., РУТКОВСКИЙ В.Ю., ЗЕМЛЯКОВ С.Д. Адаптивное координатно-параметрическое управление нестационарными объектами. - М: Наука, 1980.

42. ПИНСКЕР М.С., ПРЕЛОВ В В. О безошибочной фильт-

рации некоторых стационарных процессов // Успехи матем. наук. - 1997. - Т.52, вып. 2 (314). - С. 109-118.

43. ПОТАПОВ А.А., ЧЕРНЫХ В.А. Дробное исчисление А.В. Летникова, теория фракталов и скейлинг / Под ред. А.А. Потапова. - М.: Физматлит, 2009. - 820 с.

44. ПОТАПОВ А.А., ГИЛЬМУТДИНОВ А.Х., УШАКОВ П.А. Системные принципы и элементная база фрактальной радиоэлектроники. Ч. I. Этапы становления и состояние // Радиотехника и электроника. - 2008. - Т. 53, № 9. - С. 1033— 1080; Ч. II. Методы синтеза, модели и перспективы применения // Радиотехника и электроника. - 2008. - Т. 53, №11. -С. 1347-1394.

45. ПЯТНИЦКИЙ Е.С. Управление черным ящиком механической природы // Автоматика и телемеханика. - 1999. - №3. -С.202-212.

46. РАЙБМАН Н.С., ЧАДЕЕВ В.М. Адаптивные модели в системах управления. - М.: Советское радио, 1966. - 160 с.

47. РАЙБМАН Н.С., ЧАДЕЕВ В.М. Построение моделей процессов производства. - М.: Энергия, 1975. - 374 с.

48. РОЗАНОВ Ю.А. Стационарные случайные процессы. - М.: Наука, 1990. - 272 с.

49. РОТАЧ В.Я. Адаптация в системах управления технологическими процессами // Промышленные АСУ и контроллеры. - 2005. - №1. - С. 4-10.

50. САРИДИС ДЖ. Самоорганизующиеся стохастические системы управления. - М.: Наука, 1980. - 448 с.

51. Справочник по теории автоматического управления // Под ред. А.А. Красовского. - М.: Наука, 1987. - 712 с.

52. Труды научного семинара «70 лет теории инвариантности» / Под ред. С.Н. Васильева. - М.: ЛКИ, 2008. - 256 с.

53. ФЕДЕР Е. Фракталы. - М.: Мир, 1991. - 254 с.

54. ФЕЛЬДБАУМ А.А. Основы теории оптимальных автоматических систем. - М.: Наука, 1966. - 624 с.

55. ФОМИН В.Н. Методы управления линейными дискретными объектами. - Ленинград: Изд-во ЛГУ, 1985. - 336 с.

56. ФОМИН ВН., ФРАДКОВ А.Л., ЯКУБОВИЧ В.А. Адаптивное управление динамическим объектами. - М.: Наука. 1981. - 448 с.

57. ХЬЮБЕР П. Робастность в статистике. - М.: Мир, 1984. - 304 с

58. ЦЫПКИН Я.З. Информационная теория идентификации. -М.: Наука, 1995. - 336 с.

59. ЦЫПКИН Я.З. Скользящая аппроксимация и принцип поглощения // Докл. РАН. - 1997. - Т.357, №6. - С. 750-753.

60. ЧЕНЦОВ Н.Н. О корректности задачи статистического точечного оценивания // Теория вероятностей и ее применения. - 1981. - Т.26, №1. - С. 15-31.

61. ШТЕЙНБЕРГ Ш.Е., ЗАЛУЦКИЙ И.Е. Адаптация стандартных регуляторов к условиям эксплуатации в промышленных системах регулирования // Промышленные АСУ и контроллеры. - 2003. - №4. - С. 11-14.

62. ANDERSON B.D., GEVERS M. Fundamental problems in adaptive control // In D. Normand-Cyrot, editor, Perspectives in Control Theory and Application. - Springer-Verlag, Berlin, 1998. P. 9-21.

63. ANG K.H., CHONG G., LI Y. PID-control system analysis, design, and technology // IEEE Trans. on Control Syst. Tech. -July 2005. - Vol. 13, No.4. - P. 559-576.

64. ASTROM K.J., WITTENMARK B. Adaptive Control. -Addison-Wesley Publishing Company, 1989.

65. BELLMAN R., KALABA R. Dynamic programming and adaptive control processes: Mathematical foundations // IRE Trans. on Automatic Control. - 1960. - Vol. AC-5. - P. 5-10.

66. BERCU B., VAZQUEZ V. Further results for ARX models in adaptive tracking // Pr. 47th IEEE Conference on Decision and Control Cancun, Mexico, Dec. 9-11, 2008. - ThC15.1. -P. 5571-5575.

67. BICKEL P.J. On adaptive estimation // Ann. Statist. - 1982. -Vol. 10, No.3. - P. 647-671.

68. BUNICH A.L. Adaptive control of Oxygen-Converter Steel Melting // Pr. IV-th IFAC Symp. on Automation in Mining, Mineral and Metal Processing, Helsinki. - Pergamon Press, London, 1983. - Vol. 2. - P. 251-253.

69. CHEN H.F. Recursive system identification and adaptive control by use of the modified least squares algorithm // SIAM J. Control and Optimization. - 1984. - V. 22, No.5. - P. 758-776.

70. EVANS R.J., ZHONG C., SOH Y.G. Bounded-Error estimation using dead zone and bounded ellipsoid // Int. J. of System Processing. - 1994. - Vol. 8. - P. 31-42.

71. FARMER J.D., SIDOROVICH J.J. Predicting chaotic time series // Phys. Rev. Lett. - 1987. - Vol. 59, No.8. - P. 845-848.

72. FISHER R.A. The Design of Experiments. - Edinburg: Oliver and Boyd, 1935.

73. GEVERS M. Identification for control: from the early achievements to the revival of experiment design // European Journal of Control. - 2005. - Vol. 11(4-5). - P. 335-352.

74. GOODWIN G.C., SIN K.S. Adaptive Filtering: Prediction and Control. First edition. - Prentice Hall, 1984.

75. HSIEH C., SKELTON R.E. All covariance controllers for linear discrete - time systems // IEEE Tranc. Automat. Contr. 1990. -Vol. 35, No.8. - P. 908-915.

76. JUDITSKY A., NAZIN A. On minimax approach to nonparametric adaptive control // Int. J. Adapt.Control & Signal Process. - 2001. - Vol. 15. - P. 153-168.

77. KOSUT R., ANDERSON B., MAREELS I. Stability theory for adaptive systems: Method of averaging and persistency of excitation // IEEE Transactions on Automatic Control. - 1987. -No.32(1). - P. 26-34.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

78. KOUL H.L., SUSARLA V. Adaptive estimation in linear regression // Statistics and Decision. - 1983. - Vol. 1, No.4-5. -P. 379-400.

79. LEI GUO. On Critical Stability of Discrete-Time Adaptive Nonlinear Control // IEEE Tranc. on Aut. Contr. - 1997. -Vol. 42, No.11. - P. 1488-1499.

80. LELAND W.E., WILSON D.V. "High Time-Resolution Measurement and Analysis of LAN Traffic: Implications for LAN interconnection" // Proc. of the IEEE INFOCOM-91. Bal Harbour, FL. - 1991. - P. 1360-1366.

81. LJUNG L., GLAD T.. Modeling of Dynamic Systems. - Prentice Hall, Englewood Cliffs, N.J, 1994.

82. LJUNG L. System Identification Toolbox User's Guide. Computation. Visualization. Programming. Version 5. The Math. Works, Inc., 2000.

83. LJUNG L. System identification. Theory for user. - Prentice

Hall, Upper Saddle River, N.J., 2nd edition, 1999. - 609 p.

84. MANDELBROT B. The variation of certain speculative prices // Journal of Business. - 1963. - Vol. XXXVI. -P.392-417.

85. NARENDRA K.S., ANNASWAMY A.M. Stable Adaptive Systems. - Prentice Hall, New Jersey, USA, 1988.

86. NAZIN A.V., LJUNG L. Asymptotically optimal smoothing of averaged LMS estimates for regression parameter tracking // Automatica. - 2002. - Vol. 38. - P. 1287-1293.

87. QIN S.J., BADGWELL T.A. A survey of industrial control technology // Contr. Eng. Practice. - 2003. - No.11. -P. 733-764.

88. ROGERS C. Arbitrage with fractional Brownian motion // Math. Finance. - 1997. - No. 7. - P. 95-105.

89. SASTRY S., BODSON M. Adaptive Control: Stability, Convergence, and Robustness. - Prentice Hall, 1994.

90. SKELTON R.E. Model error concepts in control design // Int. J. Control. - 1989. - Vol. 49. - P. 1725-1753.

91. SOTTINEN T. Fractional Brownian motion, random walks and binary market models // Finance and Stochastics. - 2001. -Vol. 5. - P. 343-355.

92. STEFANOVIC M., WANG R., SAFONOV M.G. Stability and convergence in adaptive systems // In Proceedings of American Control Conference, Boston, MA, July 2004.

93. STONE C. Adaptive maximum likelihood estimation of a location parameter // Ann. Statist. - 1975. -Vol. 3, No.2. -P. 267-284.

94. VAN DEN HOF P.M.J., SCHRAMA R.J.P. Identification and control: Closed-loop issues // Automatica. - 1995. - No.31(12). P. 1751-1770.

95. WILLINGER W., TAQQU M., TEVEROVSKY V. Long range dependence and stock returns // Finance and Stochastics. -1999. - Vol. 3. - P. 1-13.

96. XIAO-LI HU, LJUNG L. New Convergence Results for Least Squares Identification Algorithm //Technical report from Automatic Control at Linkopings universitet. Division of Automatic Control, 13th May 2009. Report no.: LiTH-ISY-R-2904.

CONTROL SYSTEMS WITH IDENTIFIER

Aleksandr Bunich, Institute of Control Sciences of RAS, Moscow, Professor, Phd ([email protected]).

Abstract: The paper overviews the literature on predictive modelbased adaptive control systems with identifier (ASI) for discrete objects with parametric and nonparametric uncertainties. It focuses on the relationship between the spectral characteristics of external perturbations and maximum achievable control performance as well as identifier speed. A class of stationary external perturbations with the known spectrum localization is established with the solvable problem of synthesizing the systems of prescribed control precision subject to the criterion of minimum steady-state response variance. The sensitivity of the control system to variations of the spectral composition of disturbances is investigated.

Keywords: identifier, recursive estimation, predictive model, singular perturbation.

Статья представлена к публикации членом редакционной коллегии Н.Н. Бахтадзе

i Надоели баннеры? Вы всегда можете отключить рекламу.