Регуляризованный алгоритм адаптивной идентификации объектов управления

Холходжаев Боходир Асатуллевич; Тошев Шахриёр Дониёрович

ТЕХНИЧЕСКИЕ НАУКИ

РЕГУЛЯРИЗОВАННЫЙ АЛГОРИТМ АДАПТИВНОЙ ИДЕНТИФИКАЦИИ ОБЪЕКТОВ УПРАВЛЕНИЯ Холходжаев Б.А.1, Тошев Ш.Д.2 Email: [email protected]

1Холходжаев Боходир Асатуллевич - старший преподаватель, кафедра высшей математики; 2Тошев Шахриёр Дониёрович - студент, Геологоразведочный факультет, Ташкентский государственный технический университет им. Ислама Каримова, г. Ташкент, Республика Узбекистан

Аннотация: в настоящее время существует большое число методов решения поставленной задачи, основанных, как правило, на методе регуляризации, предложенном А.Н. Тихоновым. Основным недостатком метода регуляризации является необходимость решения сложных вариационных задач, требующих разработки громоздких алгоритмов численного нахождения решений для каждого частного случая задачи. В работе приводится регуляризованный алгоритм адаптивной идентификации объектов управления в условиях априорной неопределенности.

Ключевые слова: регуляризованный алгоритм, адаптивная идентификация объектов, управления.

THE REGULARIZED ALGORITHM OF ADAPTIVE IDENTIFICATION OF CONTROL OBJECTS Kholkhodjaev B.A.1, Toshev Sh.D.2

1Kholkhodjaev Bokhodir Asatullaevich - Senior Lecturer, DEPARTMENT OF HIGHER MATHEMATICS; 2Toshev Shakhriyor Doniyorovich - Student, GEOLOGICAL PROSPECTING FACULTY, TASHKENT STATE TECHNICAL UNIVERSITY NAMED AFTER ISLAMKARIMOV, TASHKENT, REPUBLIC OF UZBEKISTAN

Abstract: currently, there are a large number of methods for solving the problem, based, as a rule, on the regularization method proposed by A.N. Tikhonov. The main disadvantage of the regularization method is the need to solve complex variational problems that require the development of cumbersome algorithms for the numerical finding of solutions for each particular case of the problem. The paper presents a regularized algorithm for adaptive identification of control objects under conditions of a priori uncertainty. Keywords: regularized algorithm, adaptive object identification, control.

УДК: 62-503.5

В многочисленных задачах управления необходимо иметь в распоряжении модель системы, способную работать в реальном масштабе времени. При этом модель не должна основываться на будущих измерениях. Необходимость в формировании таких моделей обычно возникает из-за того, что модель нужна для вынесения некоторых суждений о системе во время ее функционирования. Методы, предназначенные для решения подобных задач с использованием настраиваемых моделей некоторого типа, обычно называются адаптивными [1, 2]. В этом смысле говорят об адаптивном управлении, адаптивной фильтрации, адаптивной обработке сигналов и адаптивном предсказании.

Вычисление результатов работы модели в реальном масштабе времени должно производиться таким образом, чтобы обработка измерений на каждом шаге всегда завершалась до начала следующего шага. В противном случае, построенная модель не сможет справиться с потоком информации.

Методы идентификации, удовлетворяющие этому требованию, называют рекуррентными методами идентификации, поскольку измеряемые входо-выходные данные обрабатываются рекуррентно или последовательно, в порядке их поступления. Часто для таких методов используют также термины идентификация в реальном масштабе времени или по текущим данным, адаптивное оценивание параметров или последовательное оценивание параметров.

Как известно [3, 4], общий метод идентификации постулируется как отображение множества данных 2' в пространство параметров:

§г=Р(1,2% (1)

где функция Р может быть задана явно, например, как аргумент, минимизирующий некоторую функцию. Такого рода общее выражение (1) не может быть использовано в рекуррентном алгоритме, поскольку подсчет значения функции Ж может включать необозримое количество вычислений, которые, возможно, не будут завершены до начала следующего шага. В противоположность этому рекуррентный алгоритм должен подчиняться следующим соотношениям:

х(0 = н{г,х(г - 1),у(0,и(1)), (2) в{ = /1(х(0).

здесь Х(Ъ) - вектор фиксированной размерности, представляющий некоторое «информационное состояние»; функции Н и И заданы явным образом, и их значения могут быть вычислены посредством конечного числа вычислительных операций, известного априори. Таким образом, можно быть уверенным, что в1 вычкслится до началахледующего шага алгоритма.

Так как информация, содержащаяся в последней паре измерений уф,и(1), обычно мала по сравнению с информацией, полученной в результате обработки предыдущих измерений, алгоритм (2), как правило, принимает более конкретный вид: ^ = е<_1 + гШ^,уЮ,и(1), (3)

х(0 = Х(! -1) + ь<гх(х(! - 1),у(0.м(0).

где у и ^ - малые числа, отражающие относительное количество информации в последних измерениях.

В большинстве процессов управления или многошаговых процедур принятия решения в технических системах имеют место присущие им неопределенности. Эти неопределенности не позволяют точно оценить влияние управляющих воздействий и, следовательно, использовать теорию детерминированного управления. Неопределенности, существующие как в самой системе, так и в наблюдениях, во многих задачах могут быть представлены как «стохастические» процессы. К каким задачам применимы методы стохастического управления [5].

Оценивание, основанное на методе наименьших квадратов, используется в задачах определения первого и второго моментов состояния, шума, состояния и шума измерений в дискретной линейной динамической стохастической системе. При этом, чем точнее известны указанные статистические характеристики, тем точнее оценки состояния системы по методу фильтра Калмана. Точные и быстро сходящиеся оценки этих статистических характеристик раньше получали с помощью сложных алгоритмов оценивания при заданных статистических характеристиках шума в системе и ограничениях относительно изменений моментов по времени. Оценивание методом наименьших квадратов позволяет устранить эти ограничивающие условия. Однако при этом для достижения точности оценивания, близкой к оптимальной, приходится использовать фильтры такого же порядка сложности, как и фильтр Калмана.

Будем рассматривать модельную структуру

у(о = <рти)в + m,

где рт - матричный оператор размерности (I х d), в — d-мерный вектор-столбец. Модель процесса, соответствующего рассматриваемой задаче, определяется уравнениями:

в (t + 1 ) = в (t) + w (t), (4) у (t + 1 ) = рт (t + 1 ) в (t + 1 ) + v (t + 1 ), (5)

где в ( t + 1 ) - вектор параметров объекта в момент времени t + 1 ,у (t + 1 ) - вектор измерений, рт ( t + 1 ) - матрица измерений; w ( t) и v ( t + 1 ) - нормально распределенные возмущающие воздействия с нулевыми средними и неотрицательно определенными ковариационными матрицами Q(t) и R(t + 1 ) соответственно.

Для оценивания вектора состояния в (t) динамической системы (4), (5) обычно используются традиционные уравнения фильтра Калмана.

êm = e(t\t - d + K(t)[y(t) - cpT{t)ê{t)\t - D],

e(t\t - 1) = 0(t - l\t - 1 ),K(t) = P(t\t - 1 )(p(t)Ga(D(t)), Ga (D (t)) = [D (t)+R (t) + al] -1, D (t) = рт (t)P (t \ t — 1 )р (t), (6) P(t\t - 1) = K(t - l)M(v(t)vT(t))KT(t - 1) + P(t - 1), P(t) = P(t\t - 1) - P(t\t- l)cp(t)Ga(D(t))cpT(t)P(t\t - 1), где G a (D (t) ) порождающая система функций для метода регуляризации, a -параметр регуляризации,

Точность оценивания вектора состояния в ( t) на основе калмановского фильтра существенно зависит от точности задания ковариационных матриц Q (t) и R (t + 1 ) шума состояния и помехи измерений. В процессе функционирования объекта управления ковариационные матрицы Q (t) и R (t + 1 ) могут изменяться во времени. Весьма эффективной является концепция идентификационного подхода [6,7], которая заключается в оценивании в процессе функционирования фильтра априорно неизвестных параметров и последующего их использования в алгоритме динамической фильтрации. В соответствии с этим методом уравнение для вектора состояния, содержащего неизвестные параметры ковариаций и линейно изменяющегося во времени, можно записать в виде:

вс(1 + 1) = ec(t) + wc(t),9cT(t + 1) = [PT(t + l\t)QT(t + 1 )RT(t + 1)], wcT ( t) = Wт ( t) wR т( t) ]. (7) В (7) - вектор состояния для фактической матрицы дисперсий

прогнозируемой оценки состояния, матрицы дисперсий шума состояния и матрицы дисперсий шума измерений; - вектор шума состояния параметров ковариаций.

Модель измерений ковариаций в рассматриваемом случае можно принять в виде

с (t + 1) = ртс (t + 1 ) вс (t + 1 ) + Ac (t + 1 ) , (8) где и могут быть определены из векторов невязки в

субоптимальном фильтре.

Располагая теперь выражениями (4)-(7) и априорными значениями их параметров для оценивания вектора состояния объекта и параметров ковариаций можно применить один фильтр типа (6) к исходной системе (4), (5), а другой - к системе уравнений для ковариаций (7), (8), используя невязки первого фильтра как данные для оценки параметров ковариаций в исходной системе.

Для оценивания вектора состояния в (t) можно также использовать метод расширения. В соответствии с этим методом формируются уравнения вида:

da(t + 1) = é»a(t) + ra(t)wa(t),y(t + 1) = (pTb(t + l)da(t + 1) + Âv(t + 1),

eaT = [eTwTvT],waT = [Âwrw>|],

Оценки векторов в (t) ,w (t) и v (t) здесь также можно получить по методу наименьших квадратов с помощью одного фильтра и оценки матриц Q (t) и R (t + 1 ) с

помощью другого фильтра, поскольку шумы расширенного состояния и измерений имеют теперь нулевые средние значения.

При решении рассматриваемой задачи возможна ситуация, когда возмущающие воздействия могут быть коррелированы между собой. В этой связи возникает необходимость разработки алгоритмов вычисления вектора состояния при

взаимно коррелированных шумах в рамках рассматриваемой двухуровневой схемы динамического оценивания. Будем предполагать, что выполняются следующие помехо-сигнальные условия: М{ (в0 — в0^т(с)} = Кв^ш(1), М{(в0 — в0)ут (ь)} =

и условия аппроксимации вида:

I I у — у* I I < 5, где рт и у* истинные значения матрицы рт и вектора у.

Тогда, следуя [6,8], можно показать, что в сформулированных выше условиях задача оценивания вектора состояния в (в -й момент времени эквивалентна задаче решения следующей системы линейных алгебраических уравнений:

[р(0) (к) 1 (к) р(0)т (к)\вУ (к) = р(0 (к) 1 (к)у (0)(к), (9)

где

<рт(к + 1)

у(°)(к)

у(к+1)

IV (к -Ь 1) =

у{к+1)

, И/(/с) =

, у(0\к + 1) =

- точностной вектор.

В (9) предполагается, что матрица Ш~1 (к) существует.

При решении системы (8) необходимо использовать методы регуляризации [9 -12]. Это обусловлено тем обстоятельством, что непосредственное решение уравнения (9) приводит к его численной неустойчивости, проявляющуюся в том, что малые погрешности в исходных данных могут вызвать конечные, но неприемлемые по величине ошибки решения. Это и заставляет при решении (9) использовать регулярные методы.

Традиционный способ регуляризации решения уравнения (9) состоит в том, что вместо (9) решается система алгебраических уравнений вида:

[р^{^~1{к)р^т{к) + сс1]ва*(к) = р^{^~1{к)у^{к).

Матрица этой системы положительно определена для и поэтому для любого

вектора измерений у(0 (к) существует единственная оценка в а,У (к). Параметр регуляризации а в рассматриваемом случае может быть определен, например, на основе принципа обобщенной невязки [9,13].

В предположении, что корреляционная матрица шума измерения Ш (к) задана и вектор шума измерения нормально распределен, параметр регуляризации а может быть вычислен как корень нелинейного уравнения:

гапк^ = 5р [(<р№(/с)И/-1(/с)<Р(0):г(/с) + а/)'1] + (у(0)Ч/с),у(0)Ч/с)).

В случае если корреляционная матрица Ш (к) шума измерения неизвестна, то целесообразно при выборе параметра регуляризации использовать метод перекрестной значимости [14]. В соответствии с этим методом рассматривается функционал вида:

иа = ^-2-, (10)

0 ^ 5р[Ф(а)]Д2 ' у '

где - индекс следа матрицы.

В качестве параметра регуляризации, определяемого обобщенным методом взаимной значимости, принимается значение аи, доставляющее минимум функционалу (10).

В случае, когда дисперсия шума измерения неизвестна, но его корреляционная матрица известна с точностью до дисперсии а2, т.е. Ш (к) = а2V(к), где V (к) -нормированная корреляционная матрица. В этом случае параметр регуляризации а может быть вычислен на основе уравнения вида

а2 = {,Sp[D] + (ва*(к), (о-2Co)(fc)W-1**(fc)ç»co)r(Л) + a/)~V^(/c)) -

-2 G"* (к)) + (yw(k),W-14>(k)yw(k))}/Ny,

где D = p (0)(k) W~19 (к) p (0) г (k) (a~ 2p (0)(k) W~1 9 (к) <p(0 )T (k) + al) ~1 . Таким образом, при построении регуляризованного решения уравнения (9) имеется возможность выбрать тот или иной способ определения параметра регуляризации в зависимости от полноты и формы задания априорной информации о шуме измерения.

Приведенные выше соотношения позволяют адаптировать алгоритмы оценивания вектора состояния динамических объектов к реальным помехосигнальным условиям, обусловленным априорной неопределенностью, и тем самым повысить точность определения вектора настроек регулятора.

Список литературы /References

1. Справочник по теории автоматического управления // Под ред. А.А. Красовского. М.: Наука, 1987. 712 с.

2. Ядыкин И.Б., Шумский В.М., Овсепян Т.А. Адаптивное управление непрерывными процессами. М.: Энергоатомиздат, 1985. 240 с.

3. Лыонг Л. Идентификация систем. Теория для пользователя: Пер. с англ. // Под ред. Я.З. Цыпкина. М.:Наука, 1991. 432 с.

4. Кашьяп Р.А., Рао А.Р. Построение динамических моделей по экспериментальным данным. Пер. с англ. М.: Наука, 1983. 384 с.

5. Сысоев Л.П. Рекуррентное оценивание параметров и ковариаций наблюдений в многомерных системах при специальной структуре ковариаций // АиТ. № 9, 2000. С. 60-72.

6. Фильтрация и стохастическое управление в динамических системах // Под ред. Леондеса К.Т. Пер. с англ. М.: Мир, 1980. 407 с.

7. Богуславский И.А. Полиномиальная аппроксимация для нелинейных задач оценивания и управления. Изд-во: Физматлит, 2006. 371 с.

8. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. Пер. с англ. М.: Мир, 1972. 544 с.

9. Васильев Ф.П. Методы оптимизации. Изд-во: Факториал Пресс, 2002. 824 с.

10. Бакушинский А.Б., Кокурин М.Ю. Итерационные методы решения нерегулярных уравнений. М.: Ленанд, 2006. 214 с.

11. Морозов В.А. Регулярные методы решения некорректно поставленных задач. М.: Наука, 1987. 240 с.

12Алифанов О.М., Артюхин Е.А., Румянцев С.В. Экспериментальные методы решения некорректных задач. М.: Наука, 1988. 288 с.

13. Петров Ю.П., Сизиков B.C. Корректные, некорректные и промежуточные задачи с приложениями. Изд-во: Политехника, 2003. 261 с.

14. Самарский А.А., Попов Ю.П. Разностные методы решения задач газовой динамики. Изд-во: УРСС, 2004. 424 с.

Регуляризованный алгоритм адаптивной идентификации объектов управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Холходжаев Боходир Асатуллевич, Тошев Шахриёр Дониёрович

Похожие темы научных работ по математике , автор научной работы — Холходжаев Боходир Асатуллевич, Тошев Шахриёр Дониёрович

Текст научной работы на тему «Регуляризованный алгоритм адаптивной идентификации объектов управления»