Научная статья на тему 'Активно-адаптивное управление стохастическими объектами в пространстве состояний'

Активно-адаптивное управление стохастическими объектами в пространстве состояний Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
100
20
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — О В. Адонин, Е В. Бодянский, С В. Котляревски, И П. Плисс

Предлагается локально-оптимальный активноадаптивный регулятор, реализующий компромисс между процессами управления и идентификации с помощью дополнительного контура адаптации параметра критерия. Данный регулятор является обобщением локально-оптимального и псевдодуального алгоритмов управления объектами с неизвестными параметрами, предложенных в [1,2].

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — О В. Адонин, Е В. Бодянский, С В. Котляревски, И П. Плисс

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Пропонується локально-оптимальний активно-адаптивний регулятор, що реалізує компроміс між процесами керування та ідентифікації за допомогою додаткового контуру адаптації параметру критерія. Цей регулятор є узагальненням локально-оптимального та псевдодуального алгоритмів керування об'єктами з невідомими параметрами, що запропоновано в [1,2].

Текст научной работы на тему «Активно-адаптивное управление стохастическими объектами в пространстве состояний»

Ш.УПРАВЛ1ННЯ

УДК 517.977

АКТИВНО-АДАПТИВНОЕ УПРАВЛЕНИЕ СТОХАСТИЧЕСКИМИ ОБЪЕКТАМИ В ПРОСТРАНСТВЕ СОСТОЯНИЙ

О.В.Адонин, Е.В.Бодянский, С.В.Котляревский, И.П.Плисс

Предлагается локально-оптимальный активно-

адаптивный регулятор, реализующий компромисс между процессами управления и идентификации с помощью дополнительного контура адаптации параметра критерия. Данный регулятор является обобщением локально-оптимального и псевдодуального алгоритмов управления объектами с неизвестными параметрами, предложенных в [1,2].

Пропонуеться локально-оптимальний активно-адаптивний регулятор, що реал1зуе компром1с м1ж процесами керування та 1дентифтацп за допомогою додаткового контуру адаптацп параметру критер1я. Цей регулятор е узагальненням локально-оптимального та псевдодуального алгоритм1в керування об'ектами з нев1домими параметрами, що запропоновано в [1,2].

The locally-optimal active-adaptive controller that provides the compromise between the control and identification processes with the criterion parameter adaptation in additional loop is proposed. The given controller is considered as generalization of locally-optimal and pseudo-dual control algorithms for the plants with unknown parameters that are suggested in [1,2].

ВВЕДЕНИЕ

В задачах управления стохастическими объектами с неизвестными параметрами широкое распространение получил подход, при котором неопределенность, вызванную незнанием параметров, уменьшают с помощью адаптивного идентификатора, работающего в реальном масштабе времени и уточняющего модель объекта по результатам измерения входных и выходных сигналов. Отсутствие дуального эффекта управления в таких системах является причиной низкого качества работы идентификатора в замкнутом контуре и приводит к затягиванию процесса управления.

Преодоление этого недостатка связано с применением адаптивных дуальных регуляторов [3], которые, однако, существенным образом используют информацию о характеристиках действующих на объект помех. Поскольку в общем случае такой информации нет, весьма актуальной является задача синтеза адаптивных дуальных алгоритмов управления, функционирующих в условиях априорной неопределенности как о параметрах объекта так и действующих возмущениях.

Пусть управляемый динамический объект описывается уравнением

хи + ! = Ахп + Сип + ^ , п = 0, 1, 2, ... , (1)

где хп - (г X 1) вектор состояния объекта в дискретный

момент времени п , ип - (I X 1) вектор управляющих

воздействий, %п - (г X 1) вектор независимых случайных

возмущений (помех) таких, что М{%п} = 0 ,

М(||у2 } = о2 <~ , М{= р% ; А и С - (г X г) и

(г X I) матрицы параметров объекта, которые априорно неизвестны, причем относительно объекта (1) принимаются те же допущения, что в [1].

Цель управления задается одношаговым критерием вида.

1Сп+1 = м{|Хп+ц 22+Ы1}, (2)

где Q и Я - (г X г) и (I X I) положительно определенные симметрические весовые матрицы критерия.

Используя методику локальной оптимизации [1], несложно получить локально-оптимальный закон управления объектом (1) в виде

и* = -(СТ0С + Я)-1 CTQAxn = Б-1 Ехп , (3) при этом критерий (2) принимает значение

!сп + 1 (и* ) = хТАТ0,АХп + и*ТСТЦСи*п + 2х1АТйСи*п + + и*ТЯи*п + ^ЧрдР^ = хТАТ0Ахп + ^рбР^ + + хпТ(ЕТБ-1 (СТ0С + Я)Б-1 Е- 2А ТдСП-1Е)хп = = хТАТаАхп + Брйр1 - хТЕТБ-1 Ехп = хТАТаАхп + + БрОР% - и*ТЯи* . (4)

(Здесь Бр и Т - символы следа матрицы и транспонирования соответственно).

Поскольку в общем случае параметры объекта, входящие в матрицы А и С, неизвестны, их приходится уточнять в реальном масштабе времени, для чего перепишем уравнение объекта (1) в виде

хп + 1 = В~?п + %п (5)

и поставим ему в соответствие уравнение настраиваемой модели

с , 1 = В г = Ах + В и , (6)

п + 1 п п п п п п ' 4 7

где В = (А : С) - (г х(г + I)) - составная матрица параметров, Вп = (Ап : Сп) - (г х(г + I)) - составная

матрица оценок, гТ = (хЩ : иТ) - (г + I) х 1 -

обобщенный вектор входов.

Параметры модели (6) будем настраивать с помощью рекуррентного метода наименьших квадратов в форме

Вп + 1 = Вп + Г + 1 -в п п2ШГп, В0 = Ва,

1 + г„

Г г гТГ

Р = р п п п п

п +1 М^ТгГ

(7)

Го = У-11

где Ва

априорная оценка матрицы В ,

причем они тем больше, чем выше уровень зондирующих сигналов и чем больше оценки отличаются от истинных значений параметров. Кроме того, поскольку можно судить только об асимптотической сходимости алгоритма идентификации (7) [1], то использовать стохастически эквивалентный закон управления целесообразно только тогда, когда оценки достаточно близки к истинным значениям.

1. ПОСТАНОВКА ЗАДАЧИ

Улучшить качество управления можно, используя так называемые осторожные регуляторы [3].

Вводя в рассмотрение матрицу ошибок оценивания

вп = В - Вп

и взвешенную ковариационную матрицу

(12)

гЩ = (хЩ : (ип + Уп)Т) - обобщенный вектор возмущенных входов, V п - (I х 1) - вектор независимых случайных возмущений (зондирующих сигналов), искусственно вводимых в канал управления с целью улучшения качества процесса идентификации [1,4,5], таких, что

М{уп} = 0 , М{\\Уп\2} = о2 < - , М{УпУЩ} = ру,

М{ Уп Ф =

Тогда в соответствии с принципом разделения, заменяя истинные параметры объекта их оценками, приходим к стохастически эквивалентному закону управления [1,3-6]

и п = -(СТТаСп + я )-1сТоАпХп = Р-1 СпХп- (8)

рп =м {вта^п} =

рА рт гп г'

Рп Р

(13)

с учетом свойств алгоритма идентификации (7) можно представить критерий в форме

2т =

Е + 1 = М{||(Вп + вп)*п + Ц\ 2 + }

= ~4В1аВпгп+~2 прп2 п+иТ^п + ярар^ = = хТ(А1аА+рА )хп+иТ( с1асп+я+рсп) ип +

,Т( А пп 4-О Т

+ 2хТ (Ап2Сп + р Т) ип + Зрар^.

(14)

Минимизация (14) по ип приводит к осторожному закону управления [2]

Несложно убедиться, что алгоритм (8) доставляет минимум не критерию (2), а целевой функции

/п+1=м{|хп+ц а+кц ь

(9)

и п = -(С1аСп+я+рп )-1( СТаАп+рп )хп =

= -нп1 ^

при этом

(15)

критерий же 1П +1 с учетом влияния зондирующих сигналов принимает значение

!П + 1 (ип) = хТАТ2Ахп + Брар% + Бр( СТ2С + Я)ру + + хТОТр-п 1 СТаСрп1 Опхп -2хТА ТаСрп1 спхп + +хТТор1 яр-1 Опхп = хТАТаАхп+Брар^+ + БрВру + хТ( ОТ^1 БР-п1 Оп - 2 ^1 Оп)хп = =хТАТ2Ахп +Брар^+ЯрПру+иТБип- 2и^Б^. (ю)

1п+1 (и п) = хТ(А1аАп+рА) хп+Зрар^+ярНпру+ +и ТНпи п + 2хТкТи п= хТ(А1аАп+рА) хп+ъар%+

+ $рНпрч + хТОТр-п1 Нпрп1 °пхп - 2хТК^п1 О пхп =

= хКА1аАп+рА )хп+$рар^+ярнпру+и Тнпип --2иТНип. (16)

Очевидно, что потери, возникающие при использовании алгоритма управления (8) вместо закона (3), определяются соотношением

1Сп + 1 (ип) - 1П + 1 (иI) = БрВру + иТБип - 2и*1Вип + + и*ТБи * = БрБру + 1 \и п - и *||Б > о, (11)

1п+1 (ип) = хТ(А1аАп+рА) хп+$рар^+иТНпип + +2 хТКТип = хТ(А1аАп+рА) хп++ +иТНпип-2 иТНпип = хТ(А1аАп+рА) хп+$рар^ -

-иТНпип.

(17)

и

Выигрыш в управлении, обеспечиваемый осторожным регулятором, составляет

!Сп + 1 (ип) - ^ + 1 (ип) = SPHnPv + иТ^ип - 2иТАип +

+ иТ^ип = SPHnPv + 11ип - иЛя .

(18)

Следует отметить, однако, что осторожные регуляторы не получили распространения по двум основным причинам. Первая связана с необходимостью знания на каждом такте управления матрицы Pn , что не позволяет использовать алгоритм идентификации (7), а требует применения специальных процедур типа алгоритма Калмана-Мейна [7] или его модификаций, учитывающих влияние весовой матрицы Q [8]. Использование таких процедур, в свою очередь, требует знания матрицы р% , которая чаще всего также неизвестна, как и матрица параметров Б . Во-вторых, при значительных уровнях неопределенности возникает так называемый эффект запирания [3,6], когда вырабатываемые управляющие воздействия настолько малы по амплитуде, что процесс идентификации вообще не идет.

Преодоление последней из причин связано с использованием адаптивных дуальных регуляторов, синтезированных на основе комплексных критериев, учитывающих как цели управления, так и цели идентификации. Эти регуляторы можно разделить на два класса: адаптивные инновационные регуляторы [2,8-12] и активно-адаптивные регуляторы [13-15]. Первый класс связан с оптимизацией комплексного критерия

1п + 1 1'п + 1 - ^ + 1

(19)

и! = -(рП)-1 рnxn .

(21)

и по структуре практически совпадают с инновационными.

Кроме проблем, связанных с выбором весового множителя X, при синтезе адаптивных дуальных регуляторов сохраняются трудности с определением матрицы Pn . Решению этих вопросов посвящена предлагаемая ниже процедура синтеза активно-адаптивных регуляторов.

2. АКТИВНО-АДАПТИВНЫЙ РЕГУЛЯТОР

Пусть в общем случае матрица неизвестна и уточнение оценок в контуре идентификации производится с помощью рекуррентного метода наименьших квадратов (7), при этом можно показать, что между матрицами Pn и Гп существует однозначная связь.

Гп =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г А Гп

Гп г С

р„

SpQP%

= крп .

(23)

Используя известное соотношение

¿е!Гп + - = (1 + гТГ г )"Че! Гп ,

п + 1 п п п п

вводя критерий активно-адаптивного управления

1п +1

" ^ е! Гп

=1п - хае1г~

+ х„

п+1

+11 ^ + 1 КИЯ-

- Х(1 + ^п) = х^Апхп + и^Спип +

+ 2хТ^Спи„ + иТЯип - х - ххТГАхп -

где X - весовой множитель, Iп + 1 - критерий идентификации, который может быть задан, например, в виде

11п + 1 = М{|хп + 1 - хп + 11Q } = х^пхп +

+ 2и^пхп + иТ^ип + SpQрl. (20)

Необходимо отметить, что цели управления и идентификации вступают в противоречие друг с другом, поскольку первая компонента критерия (19) оптимизируется алгоритмом (15), а вторая - идентифицирующим сигналом [15,16]

- ХиТгСип-2ХхТГпип

(24)

и минимизируя его по ип , получаем закон управления

ип = -(С^Сп + Я - ХГпС)-1(С^Ап - ХГп)хп = = ^пХБпхп.

(25)

Компромисс достигается путем варьирования весового множителя, которое обычно осуществляется эмпирическим путем. Активно-адаптивные регуляторы синтезируются путем минимизации критерия

1п + 1 = /п + 1 - Х/(рп), (22)

где /(.) - некоторая неотрицательная выпуклая функция,

Несложно убедиться, что при больших значениях X регулятор работает в режиме идентификации, при этом основной упор делается на уточнение оценок, при X = -SpQP% регулятор работает в режиме осторожного

управления, а X = 0 соответствует традиционному стохастически эквивалентному управлению.

В принципе, параметр X можно изменять программно, однако в этом случае потери на управление могут быть достаточно велики. Поэтому естественно попытаться найти такие значения X, при которых процесс идентификации не сопровождался бы существенным ухудшением качества управления. Записав значение критерия (2), доставляемое законом управления (25), в виде

п

1Сп + 1 (ип) = хТ(^Ап + рА )хп + SPQP% + иТНпип +

+ 2хТКТип = хЦА^Ап + рА )хп + +

+ х№п'нпрп' Бпхп-Кк^ ^ = хТ( ^Ап +

+ рА)хп + SPQP% + иТНпип - 2иТНпи,

(26)

можно видеть, что выигрыш от использования активно-адаптивного регулятора

1Сп + 1 ( и п )- 1Сп + 1 ( ип ) = SPHnPv + и ТНпи п-2 и Тнпи п-

-иТНпип + 2 и ТНпип = SPHnPv +

II- ~ 112

- и„-и "2

ип-ипн

*п\\н„

положителен при

\\ип ищн

< SPHnPv + ип-и

п||Н„

(27)

(28)

I = ¿е!Гп

1п + 1

¿е!Г

(29)

+1

11Q -Ах, ЫЯ -Аи.

(30)

Эрроу-Гурвица-Удзавы [17] позволяет записать закон управления в явном виде

ип = -(Пп^Сп + РпЯ - ГпС)-1%nnCnTQAn - Г

Пп + 1 = Пп + Д'пПпА-1(|| ^п + 11Q-Ах), 0 <Д'п < 1,

Рп + 1 = Рп + КРпАи1(|\ип\\Я~Аи) ,

! 0 <ц'п < 1.

(32)

т.е. существуют такие X, при которых активно-адаптивный регулятор лучше стохастически эквивалентного.

3. АКТИВНО-АДАПТИВНЫЙ РЕГУЛЯТОР С

НАСТРАИВАЕМЫМИ ПАРАМЕТРАМИ

Выражения (27), (28) говорят лишь о существовании оптимального весового множителя в (24), однако не позволяют найти его в аналитической форме, тем более, что его значения изменяются на каждом такте по мере уточнения оценок. В связи с этим в системе управления необходимо кроме контура адаптивной идентификации предусмотреть наличие контура адаптации весового множителя. Для этого сформулируем задачу следующим образом.

Пусть на каждом такте управляющий сигнал должен оптимизировать критерий идентификации

Несложно видеть, что первое соотношение (31) по структуре совпадает с алгоритмом (25), а второе и третье являются контурами адаптации весовых матриц критерия Qn = и Яп = рпЯ . Работу алгоритма целесообраз-

но начинать с малых значений П0 и достаточно больших р0 , при этом алгоритм работает в идентифицирующем режиме

;1п ~ -(ГпС - РпЯ)-1 Гпхп .

(3)

Отличие (32) от (21) состоит в том, что допустимая амплитуда управляющих воздействий регулируется путем изменения множителя Лагранжа Рп , при этом в режиме акселеризации на объект не подаются слишком большие по амплитуде воздействия. Заметим также, что первое соотношение в (31) с учетом введенных обозначений может быть переписано в виде

йп = -(С^пСп + Яп - ГпС)-1 [С^пАп - Гп(хп (34)

при дополнительных ограничениях на состояния и на управляющие воздействия, задаваемых в форме целевых неравенств [4,5]

В такой постановке возникает стандартная задача нелинейного программирования, для решения которой сформируем лагранжиан

1п + 1 =- ¿¿Г " + хп + 11 Q-Ах) + Р(||ип\\Я-Аи) =

ие11 п + 1

= - 1 -х^хп - иТп-2хТпГ 1ип + Ц(хТпА^Апхп +

+ <^Спип + 2хТА^Спип-Ах) + Р(иТЯип- Аи) , (31)

где п и р - неопределенные неотрицательные множители Лагранжа. Оптимизация (30) с помощью процедуры

при этом, матрицы Qn и Яп перестраиваются на каждом такте, обеспечивая алгоритму требуемые идентифицирующие свойства при сохранении заданного качества управления.

Вместе с тем в процессе настройки множителя Лагран-жа по ходу процесса управления в отдельные моменты времени могут возникать недопустимые перерегулирования фазовых переменных или даже неустойчивые режимы, избежать которых можно, вводя итерации в ускоренном времени так, что между двумя соседними тактами реального времени п и п + 1 , может производиться N машинных итераций ускоренного времени.

Алгоритм управления при этом работает следующим образом:

1. Задаются достаточно малое пп и большое рп , что соответствует режиму идентификации при "зажатых" управлениях.

2. По первому соотношению (31) вычисляются й 0 = Ф^дм) и х0 +1 = Фи0, р0 ).

3. Если х0 + 1 2 -Ах ,

п + 11 Q■ Рп = Р°■

012

Я2 - Аи , то полагается

Пп = Пп0 . управление подается на объект.

й п = й

вычисленное

п +

4. Если ||х0 + Ц а > Дх , || й п°||| <Ди , то производится уточнение

при этом при достижении условий ||х0 + Ц 2 < Дх, || й О Я < Ди , полагается пТ = Пп , рТ = Рп и сигнал

= пО + К пОД-Ч||х0 +11 а -Дх). (35) й п = и п подается на объект (1).

5. Если |х° + Ца <Дх , ||

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

й п||я >Ди , то производится

уточнение

р1 = рО + К р0Дих(\и 012 - Ди)

(36)

: 012

одновременное уточнение

ПРИМЕР

В качестве примера рассмотрим двумерную систему со следующими параметрами:

О, 5 0, 1 О 1-0,75

то производится А= 1 0 , С =

0, 2 1

рТ = П0 + ДТ п0Дх-1 (||х 0 + Ц а-Дх),

1рТ = ро+к р0Дих(\ №-Ди).

р =

0,001 0 0 0,001

(37)

7. По первому соотношению (31) вычисляется

й Т = ф(хп'Пп,Рп) и хПг + 1 = ¥й п'Пп,Рп) и производится проверка, начиная с пункта 3.

В общем случае управление на п -м такте реального времени можно записать в виде

пп = пп-1 + К пп-1 Дх-1ФТ+Ц а-Дх),

рТ = РП-1 + К РП-1VIIй П~ III-Ди) ,

й п = -(пТСТаСп + рТ1-)-1'<С1аАп-тп)хп,

t = 0, 1, ..., N (38)

Исходные значения переменных х0 и матриц Г0 следующие:

хТ = (0,1), г0 = г 11, у = 0,01, а = I = I

Количество тактов моделирования равно 150, причем на каждом пятидесятом такте выполняется присвоение

хп = х0.

Стохастически эквивалентный алгоритм управления (8) не обеспечивает приемлемого качества управления (рис.1), поскольку оценки параметров системы недостаточно точны, особенно велика погрешность оценок элементов матрицы С .

+

Рисунок 1

Рисунок 2

Рисунок 3

Значительного повышения качества управления можно добиться с помощью алгоритма (25) при \ = 0, 0097 (рис.2), обеспечивающего более точные оценки парамет-

ров системы. Варьирование \ показало, что при его уменьшении алгоритм (25) приближается по своим свойствам к алгоритму (8), а увеличение \, несмотря на

улучшение идентифицирующих свойств, не улучшает качества управления, так как увеличивает диапазон изменения управлений.

Результаты моделирования работы алгоритма (32) при Аи = 1 , Ах = 0, 1 , П0 = 50 и р0 = 400 приведены на рис.3. Как и ожидалось, он обеспечивает лучшее качество идентификации параметров системы, но качество регулирования при этом не выше, чем у алгоритмов (8) и (25). Дело в том, что при достаточно долгом пребывании переменных хп и ип в пределах области, определяемой

ограничениями (30), значения величин ЦnCTQCn и рпЯ становятся слишком малыми из-за того, что пп и рп стремятся к 0 с ростом п . Это может приводить к "всплескам" значений управляющих переменных, когда

параметры уже определены достаточно точно и

ГС ^ 0

(п.5) Pn - -J-n—-

SpQP^ + zlpnzn

Отсюда следует, что

f a\ D - D x n + 1 ~ B nZ n tu (п 6) Bn + 1 - Bn + 0 ^ „ , T„ ZnPn.

Pn + 1 - Pn +

SPQP\ + zTPnZn P„zzTP

n n n n

Избежать этого можно, ограничив снизу значения параметров пп и рп .

Полученные результаты подтверждают, что предлагаемые алгоритмы более эффективны по сравнению со стохастически эквивалентным законом управления, поскольку обеспечивают более точные оценки параметров управляемой системы.

SPQP\ + zlPnzn

(п.7) Bn + 1 - Bn + *n + + "ВТ Z" ^zTk-1 Г

k ( 1 + ZnTrnZn)

k-2 Г z ZTr

J_ _ _n n n n

k Tn + 1 - k Tn - , _1 - - , Tr

k 1 (1 + ZnTrnZn )

Несложно видеть, что при k - (SpQP-1

(п.8) rn - kPn

или

ПРИЛОЖЕНИЕ

Докажем справедливость равенства (23). Необходимость знания матрицы рп при реализации алгоритма (15) не позволяет применить в контуре идентификации процедуру рекуррентного метода наименьших квадратов. Поэтому рассмотрим процедуру настройки параметров вида

(п1) Бп + 1 = Бп + (хп + 1 - Бп?п)4рп или относительно ошибки оценивания

(п.2) бп + 1 = 9п - (вп?п + %п)гТрп

где рп - матричный коэффициент усиления, подлежащий определению.

Записывая уравнение эволюции ковариационной матрицы

„.рп + 1 = рп -рп2п2прп -рп -рп2п2прп +

(п3) + + гТрпгп)рпгп4рп,

вводя функцию Ляпунова

(п.4) Ырп + 1 -/п) _= тК^Рп^^ + 4рп?п) -

-рп2п4рп -рп2п2прп)

и оптимизируя ее по рп , получим оптимальное значение коэффициента усиления

ПЕРЕЧЕНЬ ССЫЛОК

1. Кельманс Г.К., Позняк А.С., Черницер А.В. Локально-оптимальное управление объектами с неизвестными параметрами // Автоматика и телемеханика. - 1982. -№10. - С. 80-93.

2. Бодянский Е.В., Борячок М.Д. Локально-оптимальное псевдодуальное управление объектами с неизвестными параметрами //Автоматика и телемеханика. - 1992. - №2. - С. 90-97.

3. Wittenmark B. Stochastic adaptive control methods: a survey // Int. J. Contr. - 1975. - 21. - №5. P. 705-730.

4. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. - М.: Наука, 1981. -448 с.

5. Деревицкий Д.П., Фрадков А.Л. Прикладная теория дискретных адаптивных систем управления. - М.: Наука,

1981. - 216 с.

6. Astrom K.J. Theory and applications of adaptive control // Automatica.-1983.-19.-№5.-P. 471-486.

7. Гроп Д. Методы идентификации систем. - М.: Мир, 1979. -302 c.

8. Бодянский Е.В., Плига И.П. Проектирование многомерных стохастических адаптивных субоптимальных дуальных регуляторов // Изв. высш. учебн. завед. СССР. Приборостроение. - 1989. - №11. - С. 16-19.

9. Milito R., Padilla C.S., Padilla R.A., Cadorin D. An innovation approach to dual control // IEEE Trans on Autom. Contr.-

1982.-27.-№.1.- P. 132-137.

10. Chan S. Zarrop H. A suboptimal dual controller for stochastic systems with unknown parametrs // Int. J. Contr. - 1985. -41. - №2. - Р. 507-524.

11. Ishihara T., Abe K.I., Takeda H. Extensions of innovations dual control // Int J. Syst. Sci. - 1988. - 19. - №4. - Р. 653667.

12. Бодянский Е.В. Синтез субоптимального регулятора с активным накоплением информации // Автоматика и телемеханика. - 1988. - №8. - С. 47-51.

13. Goodwin G., Payne R. Dynamic system identification. Experiment design and data analysis.- N.Y.: Academic Press, 1977.- 320 p.

14. Ishihara T., Abe К., Takeda H. Active adaptive control based on ARX model with randomly varying coefficients // Trans. Soc. Instrum. and Contr. Eng. - 1985. - 21. - №7. - P. - 698705.

15. Krolikowski A. Application of input-signal design in system identification for adaptive control // Int. J. Syst. Sci.-1986. -17. - №2. - Р. 305-318.

16. Цьпкин Я.3. Основы информационной теории идентификации. - М.: Наука. 1984. - 320 с.

17. Поляк Б.Т. Введение в оптимизацию. - М.: Наука. 1983. -

i Надоели баннеры? Вы всегда можете отключить рекламу.