Научная статья на тему 'Устойчивость, оценка состояния и управление в одной нелинейной системе'

Устойчивость, оценка состояния и управление в одной нелинейной системе Текст научной статьи по специальности «Математика»

CC BY
64
31
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Блинов Е. Н., Соколов Б. М.

Рассматривается управляемая система нелинейных обыкновенных дифференциальных уравнений. В этой системе выделена нестационарная линейная часть, часть линейно зависящая от управления, и нелинейность, которая обращается в нуль на стационарном решении и удовлетворяет условию Липшица. Помимо этого существуют ограничения на управление. Вначале рассматривается простая модель и решается задача стабилизации с использованием стационарного состояния. Предполагается, что известны все параметры объекта (в том числе значение компонент состояния в начальный момент времени, коэффициенты правых частей уравнений системы) и также значения, полученные экспериментальным путем. Управление находится из условия получения заданного стационарного значения состояния. Для этого начальное значение управления проектируется на пересечение некоторого линейного подпространства и выпуклой области ограничений на управление. Это подпространство получено приравниванием нулю правой части системы. Доказана теорема о стабилизации, опирающаяся на теорему И. Г. Малкина об устойчивости при постоянно действующих возмущениях. Предполагается, что часть параметров неизвестна, а состояние объекта не измеряется. Для одновременного оценивания неизвестных параметров и состояния объекта используется разработанный В. А. Якубовичем метод рекуррентных целевых неравенств. Решается покомпонентно за конечное число шагов бесконечная система линейных неравенств относительно оценок неизвестных параметров. Доказывается теорема о сходимости метода оценивания и достижении цели управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Stability, estimation of state and control in a certain nonlinear system

The controlled system of nonlinear ordinary differential equations is considered. In this system the non-stationary linear part, the part linearly dependent on the control, and the nonlinearity vanishing on the stationary solution and satisfying the Lipschitz condition are allocated. Besides, there are restrictions on the control. In the beginning the simple model is considered, and the problem of stabilization with use of a stationary condition is solved. It is supposed that all parameters of the object are known (such as the value of a state at the initial moment of time, coefficients of right-hand sides of the system equations) and its state is measured. The control is calculated from the condition of obtaining the given stationary value of a state. For this purpose the initial value of the control is projected on the crossing of some linear subspace and the convex area of restrictions on the control. This subspace is obtained by equating the right-hand side of the system to zero. The theorem of stabilization basing on the I. G. Malkin theorem of stability for permanent disturbances is proved. Then it is supposed, that some parameters are unknown, and the state of object is not measured either. For simultaneous estimation of unknown parameters and the state of the object the method of recurrent target inequalities developed by V. A. Yakubovich is used. The infinite system of linear inequalities is solved component-wise in the final number of steps with respect to estimations of unknown parameters. The theorem of convergence of the method of estimation and attainment of the target of control is proved.

Текст научной работы на тему «Устойчивость, оценка состояния и управление в одной нелинейной системе»

Е. Н. Блинов, Б. М. Соколов

УСТОЙЧИВОСТЬ, ОЦЕНКА СОСТОЯНИЯ И УПРАВЛЕНИЕ В ОДНОЙ НЕЛИНЕЙНОЙ СИСТЕМЕ

1. Введение

Рассматриваемая далее математическая задача является естественным обобщением многих математических задач управления кислородно-конвертерной плавкой стали. Часть этих задач основана на математических моделях, описанных в библиографии к данной статье.

В работе [1] была рассмотрена математическая модель управления конвертерной плавкой стали, состоящая из двух дифференциальных уравнений, одно из которых было нелинейным. Управление процессом осуществлялось с помощью изменения расхода кислорода при дутье. Идентификация неизвестных параметров проводилась из расчета получить в конце плавки минимальное отклонение обеих компонент состояния от их значений, полученных экспериментальным путем. Эта же модель была рассмотрена и в работах [2-5] и других. Учет температуры был рассмотрен в работе [6]. В этих работах зависимость от времени линейной части системы не учитывалась, но она была учтена в работе [7].

В настоящей работе математическая модель модифицируется для учета индифферентных (химически не реагирующих) добавок (не только охлаждающих, как в работе [7], но и нагревающих). Скорость внесения этих добавок становится управляющим параметром, при этом расход кислорода не изменяется в процессе дутья. В данной работе рассмотрен случай, когда матрица А(£) в линейной части уравнений объекта зависит от времени, а также, в отличие от работы [7], рассмотрен случай с входящими линейно неизвестными коэффициентами, в частности, с неизвестными коэффициентами матрицы А(£). Последнее обстоятельство позволяет считать, что данная работа является развитием работы [5].

2. Постановка задачи

Рассматривается класс объектов, описываемых следующей системой дифференциальных уравнений:

= Ах + ч<р(х) + ЪЬо(и), у = <р(х). (1)

Здесь М(£) = ^1а§[1,1,..., 1 , Мп(£)], Мп(£) = т0 + т(£) > 0, т0 —постоянная, т(£) — скалярная непрерывная известная функция, х € Д”, х = со1[х1, Х2,..., хп], А = diag{ —к\, —&2, ..., — кп}, к” = кпто + а(£) а(£) —известная функция времени, ц = [ц1,ц2, ...,к”]* —постоянный вектор, кп = Цпто, к* > 0, г = 1, 2, ...,п, «*» —знак транспонирования, Ь = [0, 0,..., 0,1]*, у>(х) —скалярная непрерывная функция состояния х, Ьа(п) —линейная однородная функция управления и € Дь, состояние х(£) не измеряется, у — выход объекта, £ € [0, то). Такими системами могут быть описаны процессы выплавки стали при конвертерном производстве (см. приложение 1).

© Б.Н.Блинов, Б.М.Соколов, 2008

Целью выбора управления является стабилизация объекта (1) при известных его параметрах, а также при линейно входящих неизвестных параметрах (адаптивная стабилизация).

3. Выбор управления при известных параметрах и известном состоянии

Как будет показано в теореме 1, при выполнении условий этой теоремы система (1) близка к некоторой упрощенной системе. Управление будем определять из условия получения заданных стационарных значений х* состояния упрощенной системы

^ = Ах + с[(р(х) + ЪЬ0{и),

где А = diag[—кь —к2,..., —к”], к = [91, 92, ..., 9п]*, Ь = [0, 0, ..., 1/то]*, при предположении существования указанных стационарных значений и выполнения равенства ^(х*) = 0. Уравнения статики упрощенной системы имеют вид

Ах* + к^(х*) + ЬЬ0(и) = 0. (2)

Так как ф(х*) = 0, х*^ = 0 (г = 1, 2, ...,п — 1). В системе (2) остается последнее уравнение в + и * г = 0, где в = —кпх*,п + цп^(х*), а и*г = Ь0(и)/то, г — постоянный известный вектор. Здесь и*г — скалярное произведение векторов.

Пользуясь алгоритмом проектирования, найдем выражение для управления и. Алгоритм выглядит следующим образом. Задаем произвольный вектор ио = {ио,®}|=1 и определяем вектор и по формуле

и = ио — {Кг + в]г} / ||г||2. (3)

Следует учитывать, что компоненты вектора управления в прикладной задаче (см. Приложение 1) должны быть неотрицательными. Если же при проектировании управление оказывается отрицательным, то, решая совместно систему линейных уравнений и неравенств

и^+1 = Раик, где Ра —проектор на множество О (О = {и&|, и^г + в = 0, и^ > 0}),

добиваемся того, чтобы управление и было неотрицательным, предполагая, что пересечение указанных множеств в Еь не пусто.

Преобразуем уравнения системы (1) к стандартному виду:

— = А(г)х + В(г)д<р(х) + Ь(г)Ь0(и), у = <р(х). (4)

о£

Здесь А(£) = diag[—к1, —к2,..., — кп(£)], кп(£) = [кпто + а(£)]/Мп(£), В(£) = diag[1,

1,..., 1,1/Мп(£)], Ь(£) = [0,0,..., 1/Мп(£)]*. Предполагается, что Мп(£) > 0 и а(£) > 0.

Цель дальнейшего исследования — получение условий устойчивости решения системы при постоянно действующих возмущениях, когда малому отклонению в начальных условиях и малому во все моменты времени возмущению отвечает малая величина результата решения уравнения объекта. На параметры матрицы системы А(£) будут наложены естественные ограничения, связанные с малостью коэффициентов т(£) и а(£) по сравнению с коэффициентом то. Далее, матрица А(£) будет приближенно заменена суммой постоянной матрицы и матрицы, содержащей нестационарные малые возмущения.

4. Адаптивное управление

Будем теперь считать, что элементы матрицы А(4) линейной части системы (4) неизвестны, а также неизвестны коэффициенты ц при нелинейности у>(ж). Рассмотрим уравнение адаптивной модели:

Йх ______

— = Ах + В^Щу + Ъ(г)Ь0(и), у = <р(х), аі

(5)

где А = diag[—а1, — а2,..., — ап] и а = со1[—(/1, -</2, •••, ап] —диагональная матрица и вектор (опорные элементы), а* > 0, г = 1,2, ...,п, В(4), <£>(•), Ь(4), и Ьо(м) —известные функции из уравнения (4). Преобразуем разность векторов А(4)ж и Аж, чтобы получить уравнение для ошибки е = ж — а : А(4)ж — Аж + Аж — Аа = [А(4) — А]ж + А(ж — а). Аналогично, цу — /а = (ц — а)У + а(У — а). Вычтем из уравнения объекта (4) уравнение модели (5):

— = Ае+[А(г) - А]х+(д-с[)у + с[(у-у). (6)

Так как вектор-функция [А(4)—А]ж является непрерывной функцией времени, ее можно разложить в тригонометрический ряд Фурье, предварительно продолжив периодически с достаточно большого промежутка времени, большего промежутка времени переходного процесса. Также можно ограничиться конечной суммой этого ряда, считая, что норма остатка в разложении 1-ой компоненты {[А(4) — А(4)]ж}(1) = ^7=1 $*' (4) мала,

где 1 = 1, 2, ...,п, ^1 - постоянная, (4) —либо синус, либо косинус.

Далее, считаем ^*,0 = е(0), $*(4) = [А(4) — А(4)]ж и $*, 7 +1 = ц — а новыми неизвестными параметрами. Используя формулу Коши, решение уравнения (6) можно представить в виде

е(4) = Щ X' (4)$*,' + Х7+1(4).

5 = 0

Базисные функции Х'(4) (? =0,1,..., J +1) удовлетворяют уравнениям

(7)

<1хо сИ = Ахо + Вф - у) Хо(0) = I,

Лхз (И = АХі + к3, Хі (0) т—н 0,

dXJ+1 <а = АХ/+і + уй, Х/ +1(0) = 0.

Здесь I — единичная матрица, а ! = со1[1,1,..., 1]. Будем решать бесконечную систему неравенств

ХДі (і)^' + Х/+і(і)

< £

(8)

относительно неизвестного вектора где є > 0 — заданное число. Эти неравенства рассматриваются покомпонентно.

Неравенства (8) удобно решать, используя разработанный В. А. Якубовичем алгоритм решения бесконечных систем линейных неравенств за конечное число шагов, названный им алгоритмом «Полоска» (см. [8], с. 58). В моменты времени £&+1, когда на-

рушаются неравенства (8), оценки $^+1 вектора неизвестных параметров $* пересчитываются по формулам

гРхГ+1 , к = 1,2,3,... .

(и) ,,2ЛЙ+1

(9)

тирования (если значения вектора параметров выходят за границы выпуклой области 0, внутри которой находится неизвестный параметр $*, этот вектор параметров проектируется строго внутрь области 0). В приложении 2 проверяются условия, при выполнении которых такой алгоритм будет сходиться за конечное число шагов.

5. Основные утверждения

Теорема 1. Пусть в системе (4) все коэффициенты известны и значение состояния ж измеряется, функция у>(ж) удовлетворяет условию Липшица в точке ж* с постоянной е^, для которой выполнено неравенство е^ < Ад/(2||ц||Л#), где Ад и Лн — наименьшее и наибольшее собственные числа матриц Б = Б* > 0 и Н = Н* > 0 соответственно, связанных уравнением Ляпунова А*Н + НА = —Б, А = diag[—&1, — ^2, ..., —кп] —матрица упрощенного уравнения из п°2. Также пусть а = т(0)-18ир4>о т(4) > 0 — достаточно малое число и выполнено неравенство

Тогда управление (3) делает стационарное решение системы (4) устойчивым по Ляпунову при постоянно действующих возмущениях.

Теорема 2. Для алгоритма адаптивного управления (3), (5) и (9), где базисные функции определяются уравнениями (7), для решений ж(4) системы (4) выполняется целевое условие

где ж* — заданное стационарное решение уравнения (4), є > 0 — число, заданное в неравенствах (8). Неравенство (10) выполнено для любой матрицы А С N и вектора ц С независимо от значений ж(0), ж(0) и $(0).

Доказательство обеих теорем приведено в приложениях 2 и 3 соответственно.

6. Результаты имитационных экспериментов

На компьютере проводились имитационные эксперименты по моделированию управления сталеплавильным конвертером с использованием рассмотренной адаптивной модели (см. приложение 1). Использовались следующие значения модельных параметров объекта и адаптивной модели: к^ = кс = кт = 1; кОО® = к^ = 1; Е =1; Д = 2; /о2 = 2; ж(0) = [0.1,0.2, 3]; ж(0) = [0.2, 0.3, 4]. Были взяты две добавки (охлаждающая и нагре-

|а(і)| < Іт(і)|.

1іш^то|ж(і) - ж* І < є,

(10)

вающая) с параметрами ТО = 0,01; сі = 0,1; С2 = 0, 2; Л = 1. Параметры содержимого конвертера — со = 1; то = 10.

Для упрощения вычислений неизвестным параметром был только вектор ц. Две первые компоненты вектора ц могли находиться в промежутке [-1.5, -0.5], последняя компонента — в промежутке [0.5,1.5]. Объект и адаптивная модель интегрировались на промежутке длиной 10 с шагом подачи управления 0,01. Результаты проведенных экспериментов показали практическую работоспособность рассмотренного алгоритма адаптивного управления сталеплавильным конвертером.

7. Заключение

В работе рассмотрен специальный класс нелинейных управляемых систем. Их особенностью является наличие нестационарных коэффициентов в линейной части, каждый из них является суммой двух чисел, одно из которых постоянно, а другое зависит от времени, но мало по сравнению с первым. Эта особенность позволяет свести исходную задачу к задаче устойчивости упрощенной системы при постоянно действующих возмущениях. Также рассмотрен случай, когда неизвестны некоторые линейно входящие коэффициенты. Построен алгоритм адаптивного управления, использующий метод рекуррентных целевых неравенств В. А. Якубовича. Доказаны теоремы об устойчивости и о диссипативности решений в адаптивном варианте. Приведены результаты имитационных экспериментов на математической модели.

8. Приложение 1.

О математической модели кислородно-конвертерной плавки стали

Вывод уравнений с управлением N охлаждающими и М нагревающими индифферентными добавками мало отличается от вывода уравнений при наличии только охлаждающих добавок, а потому здесь не приводится. Сами уравнения имеют вид

= -квгРвг + дзі<РІх),

- = —ксрс + ясф{х), (пі)

с1Т —[кт — дт<р{х)]сото — ПС(Т, ис) + Пк(Т, ик)

Л сото + сос(ис) — сок(ик)

Здесь и рс —концентрации, соответственно, кремния и углерода в ванне конвертера; Т — абсолютная температура; к^®, кс, кт —положительные постоянные; < 0, цс < 0, цт > 0. Функция у>(ж) —скорость реакции горения, ж = [рбч,рс, Т]*, у>(ж) = Н(р)м(Т), р = со1[р5г,рс], Н(р) = «і«2/(«і + «2), «і = 2(/о2 - к^ряі), «2 = кСрс, к^й и кО —положительные постоянные, /о2 —постоянный расход кислорода на дутье; у«(Т) = ехр{-Е/(ДТ)}, Е > 0 — эффективная энергия активации, Д > 0 — универсальная газовая постоянная; сото —теплоемкость ванны конвертера до внесения добавок; ПС(Т, мс) = ^і==і [сС(Т - То,®) + Л®]иС, П^(Т, м^) = І]М1і с^(Т - То,^)м^, верхний индекс с относится к охлаждающим добавкам, а верхний индекс Н — к нагревающим, ^с(мс) = ^^=і с°т°(і, мс) и ^^(м^) = ^^і с^т^(і, м^) —теплоемкости охлаждающих и нагревающих добавок соответственно в момент і.

В знаменателе величина сото является существенно преобладающей при любом м. Теплоемкость ванны конвертера вместе с добавками определяется величиной Св (і) =

Св(0) + Са(^), где Св(0) = Сото, Са(4) = ^^=1 ст^) - ^^=1 С?(4) — теплоемкость всех подаваемых вместе взятых добавок в момент времени 4, а т*(£) = /о* и(т)^т — массы добавок, поданных к этому моменту. Заметим также, что 0 < а (4) < т(4).

Преобразуем уравнение (П1), выделив в выражениях для Пс и слагаемые с Т и объединив их с первым слагаемым числителя. В третьей строке матрицы линейной части получим элемент — к^ = — ктсото — а(4), а(4) > 0. Здесь Са(4) и а (4) являются величинами достаточно малыми по сравнению с величиной Св (0) —теплоемкостью содержимого ванны конвертера до внесения добавок. Кроме указанного преобразования заменим еще и интеграл т*(£) = ^ и(т)йт, стоящий в знаменателе, на достаточно

близкий к нему интеграл т*(£) = /о* Л* и(т)^т, где Д4 — достаточно малая величина. При такой замене математическая модель процесса практически не изменится, зато это дает возможность рассматривать указанные интегралы просто как функции времени. Таким образом, получаем уравнение вида (4).

9. Приложение 2. Доказательство теоремы 1

Доказательство утверждения использует уравнения статики (4). Рассмотрим в уравнении (4) последний элемент кп(£) диагональной матрицы А(4): кп(£) = [кпто + а(£)]/М„(£). Разлагая кп(£) в ряд по степеням т(£)/то, ограничиваясь линейными членами в предположении малости величины г/ в условиях теоремы, для величины кп(£) получаем

к (€)= к + _ «(*)™(*) (тЦ)

п\ ) п -Г то т2 -Г I то

Здесь величина о(т(4)/то) является бесконечно малой по отношению к величине т(£)/то. Объединяя третье слагаемое с последним и учитывая, что М„(£) = то + т(£), получаем

м*) = кп + а(^тМ+о(^

Так как по условию |а(4)| < |т(4)|, а = [а(4) — кпт(£)]/то — малая величина. В линейной части уравнения (4) остается постоянная матрица А = diag[—к1, — к2,..., — кп]. Аналогичные рассуждения годятся также для матрицы В(4) и вектора 6(4). Уравнение (4) примет вид

С^Ж — —

— = Ах + + ЪЬо(и) + г(ж), (П.1)

от

где ц = [ц1, Ц2, ..., 9п]*, 6 = [0, 0, ..., 0, 1/то]*, г(ж) = [а + о(т(4)/то)]Ж — постоянно действующее возмущение и г(ж) ^ 0 при Ж ^ 0.

Рассмотрим вспомогательное уравнение без возмущения

^ = Ах + с[(р(х) + ЪЬ0(и),

полученное из (П.1) исключением возмущения г(ж). Запишем его в отклонениях от стационарного решения ж* , удовлетворяющего уравнению статики (2):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-=Аг + д<р(г). (П.2)

Здесь г = Ж — ж*, А = diag[—к1, — к2,..., — кп], ^(г) = <^>(ж — ж*). Учли, что и = и*.

Докажем устойчивоть нулевого решения уравнения (П.2). Используя решение H > 0 уравнения Ляпунова A * H + HA = — D с гурвицевой матрицей A и заданной матрицей D > 0, для производной функции V(z) = z*Hz получаем

--= —z*Dz + 2 (p(z)z* Hq.

dt

Из условия Липшица для функции y>(z), а также из оценки для квадратичных форм Ая||z||2 < z*Hz < Лн||z||2 получим неравенство

^<-[XD-2cJq\\AH]\\z\\2.

Так как по условию теоремы cv < Ад/(2||д||Л#), dV/dt < 0 и нулевое решение вспомогательного уравнения (П.2) асимптотически устойчиво по Ляпунову (экспоненциально).

В [9, с. 301-305] доказана устойчивость по Ляпунову нулевого решения системы типа (П.1 ) с постоянно действующими возмущениями. В терминах рассматриваемой в [9] задачи кроме существования функции Ляпунова требуется также ограниченность производной dV(z)/dz на решениях вспомогательного уравнения (П.2). В нашем случае указанная частная производная ограничена, так как dV(z)/dz = 2Hz, а z(t) ^ 0 при t ^ то. Как следует из примечания к теореме, доказанной в [9], при сколь угодно малых возмущениях в системе (П.1) ее решения будут сколь угодно мало отличаться от нулевого решения уравнения (П.1). Следовательно, нулевое решение системы (П.1) устойчиво при постоянно действующих возмущениях. Теорема 1 доказана.

10. Приложение 3. Доказательство теоремы 2

Для доказательства сходимости алгоритма «Полоска» необходимо выполнение двух основных условий (см. [8], с. 58):

1) неравенства (8) выполняются с запасом р (0 < р < 1/2) для некоторого решения $*:

|(x(tfc),$*)+ XJ+i(tfc)| < ер, k = 1, 2, 3,...; (П.3)

2) базисные функции Xj (j = 0,1, 2,..., J) должны быть ограничены. Первое условие заведомо выполнено, так как при $ = $* ($* — вектор истинных значений неизвестных параметров) вместо неравенства (П.3) будет иметь место равенство. Второе условие выполнено, поскольку в правые части уравнений для базисных функций (7) входят ограниченные функции Zj (t), которые и определяют направляющий вектор к плоскости

EJ=o Xj$j + XJ+1 = °.

Итак, через конечное число исправлений алгоритм (9) стабилизируется в некоторый момент времени tTO, так как параметры перестанут изменяться и примут некоторые значения $то, а сами неравенства примут вид |e(tTO)| = |(x(tTO),$TO) + XJ+i(tTO)| < е. Так как справедливо неравенство

|x — x* | = |x — ж + ж — x* | < |e| + |ж — x* | < е + |ж — x* |

и 5T(t) ^ x* при t ^ то в силу выбора управления, справедлива оценка (10).

Литература

1. Widlund D., Medvedev A., Gyllenram R. Towards model based closed-loop control of the basic oxigen steelmaking process // Preprint of the 9-th IFAC Symposium «Automation in Mining, Mineral and Metal Processing», Cologne (Germany) 1998. P. 112-120.

2. Sokolov B. M., Shepeljavyi A. I., Medvedev A. V. The control of the top blown converter process // 5-th IFAC Symposium «Nonlinear control systems» (Nolcos’01). Saint-Petersburg, (Russia). 2001. P. 1408-1412.

3. Medvedev A., Johansson A., Birk W., Widlund D., Johansson R. Model-based Estimation of Molten Metal Analysis in the LD-Converter. Experimental Results // IFAC World Congress, Barcelona (Spain), 2002 (Available on CD).

4. Johanson A., Medvedev A. An Observer for Systems with Nonlinear Out Map // Automatica, 2003. Vol. 39. P. 909-918.

5. Соколов Б. М., Шепелявый А. И., Медведев А. В. Адаптивное управление конвертeрной плавкой стали // Вестн. С.-Петерб. ун-та. Сер 1. 2003. Вып. 2 (№9). C. 58-65.

6. Sokolov B. M., Shepeljavyi A. I., Medvedev A. V. Adaptive Control of the Top Blown Converter Process Considering Temperature and Unknown External Disturbances // International Conference «Physics and Control». Saint Petersburg (Russia), 2003. (Available on CD.) P. 324-328.

7. Sokolov B. M., Shepeljavyj A. I., Medvedev A. V. Steel Converter Process Control with Cooling Additives // Preprints N0LC0S’2004 «6-th IFAC Sympos. Nonlinear Control Syst.» Stuttgart (Germany), 2004. (Available on CD.) P. 1529-1533.

8. Фомин В.Н., Фрадков А. Л., Якубович В. А. Адаптивное управление динамическими объектами. М., 1981. 448 с.

9. Малкин И. Г. Теория устойчивости движения. M., 1966. 532 с.

Статья поступила в редакцию 10 февраля 2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.