Научная статья на тему 'Об одной модификации рекуррентного метода наименьших квадратов'

Об одной модификации рекуррентного метода наименьших квадратов Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
128
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об одной модификации рекуррентного метода наименьших квадратов»

УДК 681.3

В.А. ТИМОФЕЕВ, канд. техн. наук, ХНУРЭ (г. Харьков)

ОБ ОДНОЙ МОДИФИКАЦИИ РЕКУРРЕНТНОГО МЕТОДА

НАИМЕНЬШИХ КВАДРАТОВ

Розглядається задача ідентифікації динамічного об’єкту в припущенні, що відомим є тільки рівень вади. Досліджено існуючі алгоритми. Розроблено рекурентний алгоритм ідентифікації, що має супремальні властивості та властивості МНК-оцінок, виконано оцінку його збіжності. Перевагою розробленого алгоритму є простота його використання в задачах контроля та керування.

The problem of dynamical object identification is considered under suggestion that only noise level is known. A survey of existing algorithms is given. Recurrent identification algorithm is developed, having supremal properties of LSM-estimations and it’s convergence is analyzed. The dignity of developed algorithm is simplicity it’s application to the problems of monitoring and control.

Введение. На сегодня проблема управления техническим объектом в условиях неопределенности - одна из центральных проблем современной теории управления. Адекватным математическим аппаратом для решения этой проблемы является теория адаптивных систем управления, а широкое распространение микропроцессорной техники привело к развитию дискретных адаптивных систем управления [1 - 16].

К настоящему времени сформировался ряд относительно независимых направлений в теории адаптивных систем. Здесь, прежде всего, следует выделить адаптивные регуляторы с минимальной дисперсией (основополагающая работа [17]), адаптивные регуляторы с обобщенной минимальной дисперсией (основополагающие работы [18, 19]), адаптивные системы с требуемым размещением нулей и полюсов (основополагающие работы [19 - 21]), системы с адаптивными упредителями (основополагающая работа [22]).

Во всех этих подходах предполагается, что возмущения, действующие в системе, имеют стохастическую природу, причем это, как правило, белый шум с нулевым математическим ожиданием и ограниченной дисперсией. В практических ситуациях статистические предпосылки являются надуманными, в связи с чем гораздо более реальными представляются допущения лишь об ограниченности шума или его разностей по амплитуде. В этих условиях использование методов идентификации, основанных на квадратичных критериях и, прежде всего, рекуррентного метода наименьших квадратов явно неэффективно. Возникающие затруднения частично могут быть преодолены в рамках адаптивных робастных систем управления [ 23 -26], в которых, тем не менее, все равно «спрятаны» определенные статистические предпосылки.

В связи с этим представляется целесообразным осуществить синтез теории адаптивного и критического управления, что приведет к созданию адаптивных супремальных методов контроля, идентификации и управления динамическими объектами, функционирующими в условиях существенной неопределенности о характеристиках объекта и окружающей среды.

Целью настоящей работы и является разработка рекуррентного метода идентификации, обеспечивающего получение оценок, обладающих супремальными свойствами, которые не зависят от статистических характаристик сигналов и помех, и свойствами МНК-оценок.

Постановка задачи. Рассмотрим динамический объект, функционирующий в замкнутой системе управления 8^ (Р, С), описываемый разностным уравнением

Л(д) у(к) = д'ёБ(д)и(к) + м>(к), (1)

где полиномы Л(д) е Я[д, п] с а0 = 1, Б(д) е Я[д, т]; ё - время чистого запаздывания ё е N+; у ,и и w - выходной, управляющий и возмущающий сигналы соответственно.

Относительно возмущений предполагается ограниченность их первых разностей.

В случае, если параметры объекта априори известны и неизменны, задача критического управления может быть решена с помощью супремального регулятора, т.е.

ДЕ(д)Б(д)и (к) = -Е(д)у(к), (2)

где полиномы Е(д) е Я[д, ё -1] с /0 = 1 и Е(д) е Я(д, п) задаются уравнением

ДЛ(д)Е (д) + д~ёЕ(д) = 1.

В том случае, если параметры объекта неизвестны, можно воспользоваться тем или иным методом идентификации, а затем применить закон управления (2), в котором истинные значения параметров объекта заменены их оценками. В этом и состоит суть адаптивного подхода к проектированию систем управления объектами, функционирующими в условиях неопределенности. Как правило, в качестве процедур идентификации применяются те или иные модификации рекуррентного метода наименьших квадратов либо проекционные алгоритмы, так или иначе связанные с квадратичными критериями. При использовании критериев, отличных от квадратичных, например, модульных, хотя и получают робастные процедуры, статистический смысл задачи идентификации тем не

менее сохраняется. Естественно, что такие алгоритмы идентификации не могут быть использованы в критических системах управления.

В связи с этим возникает необходимость синтеза адаптивных алгоритмов идентификации, не связанных ни с какими статистическими предпосылками, обладающих высокой скоростью сходимости, вычислительной простотой и пригодных для работы в реальном времени в контуре критической системы управления динамическим объектом.

Алгоритмы идентификации, применяемые в критических системах.

Введем в рассмотрение полином

О(д) = 1- Д4(д), (3)

где О(д) = g1q -1 + g 2 д -2 +...+ д~п-1, и перепишем уравнение объекта (1) в виде

у (к) = 0Т у( к -1) + 1\м>(к), (4)

где 0 = g2,...gn+1,Ъ0,Ь1,...рт)Т ;

¥(к -1) = (у (к -1), у (к - 2),... ,у(к - п -1);

Ди(к - й), Ди(к - й -1),... ,Ди(к - й -т))Т;

Ди(к) = и(к) - и(к -1);

Ди^к) = w(k) - w(k -1).

Тогда задача идентификации с позиции теории критических систем сводится к нахождению оценок неизвестного вектора параметров 0 таких, что

Е(©) = {©: |у(к) -©Т - Т(к -1)| <8, У к є И}. (5)

л

Здесь © - оценка параметра © .

К настоящему времени сложился ряд подходов к задаче идентификации, связанной с неравенством (5). Это, прежде всего, подход Фогеля-Хуанга [27], в основе которого лежат некоторые геометрические построения. Известна также процедура Лозано-Лила-Ортеги [28], синтезированная как на геометрических предпосылках, так и исходя из условий устойчивости процесса сходимости. Нельзя не отметить также алгоритм Канудас де Вита-Каррильо [29], являющийся некоторой модификацией экспоненциально взвешенного рекуррентного МНК. Несмотря на эффективность этих процедур, их использование в критических системах наталкивается на серьезные затруднения.

P \k) =

Так, оптимальный алгоритм Фогеля-Хуанга настолько сложен с вычислительной точки зрения, что не может быть и речи о его использовании в режиме реального времени. Эта сложность обусловлена, прежде всего, необходимостью отыскания на каждой итерации глобального минимума многоэкстремальной функции n + m + 2 переменных, что само по себе

является достаточно сложной проблемой.

В алгоритме Лозано-Лила-Ортеги, имеющем вид

0(k) = 0(k -1) +------------aP(k -1)V(k -1)-(| e(k) | -51sign e(k), a є (0,1); (6)

І + у (k -1)P(k -1)y(k -1)

P-1(k-1) +-------- aP(k - 1)^(k -1)--------(| e(k)|-S1) x

(І + уг (k - 1)P(k -1) y( k - 1)e(k)

x sign e(k), | e(k) | > 5j; (7)

P-1(k-1), | e(k) |< 5j;

S1 = ^/ 1 + a5; (8)

л г

e(k) = y(k) - 0 (k -1)V(k -1), (9)

априори предполагается ограниченность значения уг (k - 1)P(k - 1)y(k -1), из которого следует условие сходимости

lim | e(k) |= V1 + a 5, a є (0,1), k

т.е. ошибка идентификации e(k) никогда не может быть по модулю меньше

заданных ограничений 5 .

В алгоритме Канудас де Вита-Каррильо

0(k) = 0(k -1) + a(k)P(k -1Mk -1) (| e(k) | -5)slgne(k); (10)

уг (k -1) P(k -1)v(k -1)

P(k) = X-1( P(k - 1) - a( k )P(k-1Mk -І)Уг (k - 1) P(k -І) (1 ));

у (k -1)P(k - 1)y(k-1) | e(k)| (11)

X є (0,1];

[і, | e(k)> 5 или уг(k -1)P(k -1)y(k -1) = 0; a(k) = ] (12)

[0,| e(k) <5,

где e(k) определяется соотношением (9),

е(к) = у(к) -0 (к -1)у(к -1).

В ситуации, когда | е(к) |> 5 и значение уТ (к -1)Р(к -1)у(к -1) близко к нулю, возникает режим неустойчивости, поскольку компоненты вектора

Р(к - 1)у(к - 1)(уТ (к - 1)Р(к - 1)у(к -1))-1

могут неограниченно возрастать. Кроме того, в случае, когда а(к) = 0,

невозможно гарантировать выполнение условия I е(к) |< 5 в предположении,

что уТ (к-1)Р(к-1)у(к-1) ограничено.

Модифицированный алгоритм идентификации и оценивание его сходимости. Объединяя достоинства рассмотренных процедур, можно ввести комбинированный алгоритм, являющийся своеобразной комбинацией рекуррентного МНК и процедур (6) - (8) и (10) - (12).

Рассмотрим алгоритм вида

0(к) = 0(к -1) +----а(к)Р(к -1Жк -1)------(| е(к) | -5)sign е(к); (13)

1 + уТ (к -1)Р(к -1)у(к -1)

Р(к) = Р(к-1)- а(к)Р(к- 1)У(к-1)¥Т(к-1)Р(к-1) ( е(к)\ -5); (14)

| е(к)| +(2| е(к) - 5)уТ (к)Р(к - 1)у(к -1) 1 1

Г1, если | е(к) |> 5, а( к) = ] (15)

[0, если | е(к) |< 5.

где е(к) определяется в соответствии с (9) и проанализируем его сходимость.

Введем в рассмотрение вектор уклонений оценок от истинных значений параметров

~ л

0(к) = 0 - 0(к)

и функцию Ляпунова

~ Т ~

V(к) = 0 (к)Р-1(к) 0(к).

Объединяя (4) с (13) - (15), получаем

а(к)(| е(к) | -5)

V (к) = V (к = 1) +

(1 + уТ (к -1)Р(к - 1)у(к -1)) | е(к) |

х (д^ _ (1 + ¥Т (к-1)Р(к- 1)у(к-1))|е(к) |3

| е(к) + (2 | е(к) | -5)уТ (к -1)Р(к - 1)у(к -1)

С учетом ранее введенного условия w е ,0(0,5) несложно переписать (16) в виде неравенства

а( к )(| е(к) I - 5)

V (к) <¥ (к -1) +

(1 + ут (к - 1)Р(к - 1)у(к -1)) | е(к) |

„2 (1 + УТ (к -1)Р(к - 1)у(к -1)) | е(к)| 3 ч

х (5---------------------------г------------------------) -

| е(к) | +(2 | е(к) | -5)ут (к - 1)Р(к - 1)у(к -1)

- V (к -1} - а( к)(|е(к)|-5) „

(1 + у т (к - 1)Р(к -1)у(к -1)) | е(к) |

(| е(к) |3 -2 | е(к) | 52 + 53)(1 + ут (к - 1)Р(к - 1)у(к -1)) + (| е(к) | -5)52

| е(к) | +(2 | е(к) | -5)ут (к - 1)Р(к - 1)^(к -1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^ пк 1} а(к)(| е(к) | -5)(| е(к) |3 -2 | е(к) | 52 + 53)

(| е(к) | +2 | е(к) | -5)ут (к -1)Р(к - 1)^(к -1) | е(к) | которое справедливо в случае | е(к) | > 5. Кроме того, поскольку в этом случае

2 2 53

е (к) - 25 + .. . >| е(к) | (| е(к)| -5)

| е(к) |

несложно видеть, что

V(k) <У(к -1)-------а( кХ1е(кЖ|е(к)1-5>2 , (17)

2(1 + ут (к-1) Р(к-1)у(к-1)

откуда

,.т ----- а(к)( | е(к)|-5)2---- о, (18)

к 1 + ут (к -1) Р(к-1)у(к -1)

что свидетельствует о критериальной сходимости алгоритма (13) - (15).

Л

Перенеся в левую часть (13) ©(к -1) и возведя обе части полученного выражения в квадрат, получаем

Л

©(к) - 0(к -1)

- а(к)ут (к - 1)Р2(к -1)у(к -1) (| е(к) |-52) <

V (к) (1+ут (к -1) Р(к -1Мк -1))2

< а(к)Хтах(Р(к-1)) (|е(к)| -52),

1 + ут (к -1) Р(к - 1)у(к -1)

где ^тах(Р(к -1)) - максимальное собственное значение матрицы Р(к -1). Из (14) очевидно следует условие

^тах(Р(к)) <^тах(Р(к-1)) <•••<^тах(Р(0)Х

позволяющее переписать (19) в виде

л

л

0(к) - 0(к -1)

< а( к )* шах(Р(0))"

(| е(к) | -5)2

V (к)

'■шах^ Т 1ЧГ)/7 1Ч п 1Ч

1 + у (к -1)Р(к - 1)у(к -1)

который вместе с выражением (18) свидетельствует об аргументной сходимости алгоритма.

Далее, используя лемму об обращении матриц, запишем

Р 1 (к) = Р х(к-1) +

откуда следует неравенство

(1

5

а(к)у(к -1)у (к -1)

1 + уТ(к-1)Р(к-1)у(к-1) ' |е(к)|

т),

Хт1п(Р '(к)) >Хт1п(Р '(к-1)) > •••>!(0)),

где (Р _1(к)) - минимальное собственное значение матрицы Р-1(к).

Это неравенство совместно с (17) приводит к тому, что

V (к) ^ (0)

0(к )

< * шах(Р (к)

V (к)

0(0)

V (к)

откуда можно записать выражение

2

0(к) <-

* шах(Р (к))

V (к)

* шіп(Р “Ч0»

0(0)

V (к)

определяющее скорость сходимости введенного алгоритма.

Выводы. В работе предложена модификация рекуррентного МНК, обладающая супремальными свойствами. Так как основой данного алгоритма является рекуррентный МНК, трудностей с его практической реализацией не возникает. Полученная оценка скорости сходимости предложенного алгоритма свидетельствует о том, что эта скорость в значительной мере

определяется свойствами ковариационной матрицы наблюдений Р 1(к) соотношением ее максимального и минимального собственных чисел). Кроме того, входящая в алгоритм величина 8 зачастую известна лишь приближенно, поэтому необходимо в процессе идентификации осуществлять оценивание

191

2

и

2

2

2

(уточнение) этой величины и подставлять полученные оценки в алгоритм идентификации.

Список литературы: 1.Isermann R. Practical aspects of process identification // Automatica. - 1980.

- 16. - P. 575-597. 2. Evans R. J., Betz R. E. New results and applications of adaptive control to classes of nonlinear systems // Ricerche di Automatica. - 1982. - 13. - № 2. - Р. 277-297. 3. Tsypkin Y. Z. The theory of adaptive and learning systems // Cybern.: Theory and Appl. - Washington, D. C., 1983. -P. 59-89. 4. Astr6m K. J. Theory and Applications of adaptive control - a survey // Automica, 1983. -

19. - № 5. - Р. 471^86. 5. Цыпкин Я. 3., Кельманс Г. К. Дискретные адаптивные системы управления // Итоги науки и техники. Техн. кибернетика. - Т. 17. - М.: ВИНИТИ, 1984. - С. 3-73. 6. Navendra К. S., Annaswamy A. M. Recent trends in adaptive control theory // J. Soc. Instrum. and Control Eng. - 1984. - 23. - № 5. - P. 27-34. 7. Kumar P. R. A survey of some results in stochastic adaptive control // SIAM J. Control and Optim. - 1985. - 23. - № 3. - Р. 329-380. 8. Unbehauen H. Theory and application of adaptive control // Ргос. 7th IFAC/ IMACS Conf. - Vienna. - 1985. - P. 1-17. 9. Иванов В. А., Шапировский M. P. Адаптивные системы управления с моделями // Итоги науки и техники. Техн. кибернетика. - Т. 18. - М.: ВИНИТИ, 1986. - С. 210-240. 10. King-Sun Fu. Learning control systems - Review and outlook // IEEE Trans. on Pattern Anal. and Mach. Intel. - 1986. - 8.-№ 3. - P. 327-342. 11. De Keyser R. M. C. Applying adaptive control problems and solutions // Journal A. - 1986. - 27. - № 3. - Р. 111-119. 12. Martin Sanchez J. M. Adaptive control for time - variant processes // Int. J. Contr. - 1986. - 44. - № 2. - Р. 315-329. 13. Кунцевич В.М. Адаптивное управление: алгоритмы, системы, применение. - К.: Выща шк., 1988. - 64 с. 14. Александров А. Г. Оптимальные и адаптивные системы. - М.: Высш. шк., 1989. - 263 с. 15. Романенко В. Д., Игнатенко Б. В. Адаптивное управление технологическими процессами на базе микроЭВМ. - К.: Выща шк., 1990. - 334 с. 16. Astr6m К. J., Wittenmark В. On self-tuning regulators // Automatica. -1973. - 9. - P.185-199. 17. Clarke D. W., Gawthrop P. J. Self-tuning controller // Proc. IEE. - 1975. -122. - P. 929-934. 18. Wellstead P. E., Edmunds М. J., Prager D., Zanker P. Self-tuningpole / zero assignment regulators // Int. J. Contr. - 1979. - 30. - № 1. - Р. 1-26. 19. Wellstead P. E., Prager D., Zanker P. Pole assignment self-tuning regulator // Proc. DEE. - 1979. - 126. - D. - P. 781-787.

20. Astrom K. J., Wittenmark B. Self-tuning controllers based on pole-zero placement // Proc. IEE. -1980. - 127. - D. - P. 120-130. 21. Kreisselmeier G., Narendra K. S. Stable MRAC in the presence of bounded disturbances // IEEE Trans. on Autom. Contr. - 1982. - 27. - P. 1169-1175. 22. Clarke D. W., Mohtadi C., Tuffs P. S. Generalized predictive control. Tue basis algorithm // Automatica. - 1987. - 22.

- № 2. - P. 137-148. 23. Samson С. Stability analysis of adaptively controlled systems subject to bounded disturbances // Automatica. - 1983. - 19. - P. 81-89. 24. Narendra K. S., Annaswamy A. М. Robust adaptive control in the presence of bounded disturbances // IEEE Trans. on Autom. Contr. -1986. - 31. - № 4. - P. 306-315. 25. 0rtega R., Lozano-Leal R. A note on direct adaptive control of systems with bounded disturbances // Automatica. - 1987. - 23. - № 2. - P. 253-254. 26. Fogel E., Huang Y. F. On the value of information in system identification - bounded noise case // Automatica. -1982. - 18. - № 2. - Р. 229-238. 27. Lozano-Leal R., Ortega R. Reformulation of the parameter identification problem for system with bounded disturbances // Automatica. - 1987. - 23. - № 2. -P. 245-257. 28. Canudas de Wit C.C., Carrilo J. A modified EW - RLS algorithm for systems with bounded disturbances // Automatica. - 1990. - 26. - P. 599-606. 29. Фомин В. Н. Математическая теория обучаемых опознающих систем. - Л.: Изд. ЛГУ, 1976. - 235 c.

Поступила в редакцию 17.04.04

i Надоели баннеры? Вы всегда можете отключить рекламу.