Адаптивное управление конвертерной плавкой стали

Соколов Б. М.; Шепелявый А. И.; Медведев А. В.

УДК 62-50 Вестник СПбГУ. Сер. 1, 2003, вып. 2 (№9)

Б. М. Соколов, А. И. Шепелявый, А. В. Медведев

АДАПТИВНОЕ УПРАВЛЕНИЕ КОНВЕРТЕРНОЙ ПЛАВКОЙ СТАЛИ1

1. Введение. Метод кислородного дутья используется в сталелитейной промышленности уже на протяжении 50 лет и сегодня является преобладающим при выплавке стали. Шестьдесят процентов всей стали в мире выплавляется с использованием этого метода. Цель рассматриваемого процесса — уменьшение содержания углерода, кремния и других примесей в горячем металле, поступающем из доменной печи, а также добавляемом с металлоломом. Основным критерием качества конечного продукта является содержание в нем углерода и кремния. Желательно так управлять процессом, изменяя расход кислорода, чтобы содержание углерода было заданным, а кремния не было совсем.

Для обеспечения качества стали, минимизации потребляемых ресурсов и во избежание повторения процесса продувки важно уметь достаточно точно оценивать состав металла, особенно — содержание в нем углерода. Для этого естественно использовать математическую модель процесса. В данной работе будет использована математическая модель, разработанная в кооперации между факультетом металлургии Королевского института технологии в Стокгольме и Control Engineering Group, Lulea University of Technology и, как показано в [1], адекватно отражающая процессы, протекающие в конвертере при постоянной температуре.

Процесс плавки кратко можно описать так. В конвертер загружаются металлический лом и горячий металл, а также подаются шлакообразующие вещества. Другое необходимое сырье, такое как кокс и охлаждающие вещества в форме окислов железа, может подаваться на всем протяжении процесса дутья. Кислород (O2) вдувается со сверхзвуковой скоростью на поверхность металла и окисляет его составляющие, в основном, железо (Fe), кремний (Si), марганец (Mn) и углерод (C). Окиси вместе с металлическими каплями образуют пенистый шлак, в котором еще большее количество углерода будет вступать в реакцию с окислами и образовывать окись углерода (CO). В комбинации с кислородом некоторое количество окиси углерода образует двуокись углерода (CO2).

Ход процесса контролируется оператором, который оценивает состояние металла, основываясь на ряде измерений, например, на измерении уровня звука и на анализе выходных газов [1]. Состав выходных газов дает информацию о скорости декарбонизации, в то время как уровень звука дает информацию о толщине слоя пенящегося шлака. Обычно используются и другие измерения — температура выходных газов и вибрационные пики. Имеется также возможность получить измерения температуры и уровня кислорода в жидком металле, используя пиковый датчик. Пиковые датчики также дают и информацию о содержании углерода, однако эти измерения могут быть проведены только в дискретные моменты времени, обычно один раз за продувку.

Оператор прекращает процесс, когда, основываясь на доступных ему измерениях, признает содержание углерода в металле удовлетворяющим установленным нормам.

1 Работа выполнена при частичной финансовой поддержке гранта НШ-257.2003.1 Совета по грантам Президента РФ и государственной поддержке ведущих научных школ, а также Королевской академии наук Швеции в рамках программы сотрудничества между Швецией и странами бывшего СССР.

Кроме измерений оператор может также следить визуально за уровнем пламени над горловиной конвертера. Таким образом, качество конечного продукта сильно зависит от опыта и адекватности мнения конкретного оператора о ходе процесса кислородного дутья.

В данной работе приведен алгоритм стабилизации процесса варки стали при наличии некоторых неизвестных параметров математической модели. Алгоритм основан на применении метода рекуррентных целевых неравенств, разработанного В. А. Якубовичем [2], а также — на алгоритмах оценки состояний, изложенных в работах [3] и [4]. В приложениях даны доказательства сформулированных утверждений.

2. Постановка задачи. Математическая модель процесса представляет собой систему двух нелинейных дифференциальных уравнений

dp

— = Ар + Bw + Eh(p,u), y = h(p, u).

Здесь p = [psi,pcj* — вектор состояния (определяет содержание кремния и углерода в металле).

А _ ( -k + ksi), 0 \ R_ Л, 0, 1

A V 0, -fcj, B = ^0, 1, 0

> 0, ksi > 0 — постоянные коэффициенты. Вектор w(t) определяет вклад C и Si из металлического лома и других добавок. Предполагается, что эти добавки растворяются с постоянной скоростью

w¿(t)

I mi/Ti, ti < t < ti + Ti,

I 0, для других значений t,

где t^ — момент времени, когда добавляется количество то; (Б1, С) ¿-той добавки, а T^ — время, которое требуется добавке, чтобы полностью раствориться, г = 1, 2,..., I. С некоторого момента времени Ь* эти добавки перестают поступать, а потому = 0 при t >tФ. Е = [0, -1]*.

Функция Л.(р, и) называется скоростью декарбонизации:

!г(р, и) = —, VI = 2(и - А^РэО, у2 = кс(рс ~ Рс*),

VI + «2

и — расход кислорода на дутье (управляющий параметр), кс > 0 (кэ; и кс — постоянные коэффициенты, пропорциональные молярному весу кремния и углерода соответственно), рс* — заданное значение содержания углерода в металле, которое желательно получить к концу дутья. Вектор р измерить невозможно; измеряются только значения функции у = Л.(р, и) — выхода объекта. Цель управления

пт ||р(^ - р*ц = о, (2)

где р* = со1[0,рс*].

3. Построение алгоритма управления. Обозначим Вад^) = соЦб^), 62^)]. В системе (1) сделаем замену д = рс — рс*. В случае, если = 0, матрица А — гурвицева и управление выбираем из условия —к$рс* + 62 = ^(р, и). Управление получаем в виде

(62 — к^рс*)(2кв1р81 — ксд) — 2кскв1рв1д

u =

2(62 - ktfpe* - kcq)

(3)

В формуле (3) при выполнении условия Ъ-2 < к$рс* и малом q (малая скорость поступления добавок) знаменатель не обращается в ноль. Верно утверждение.

Теорема 1. Если в системе (1) к& > 0, состояние p и функция b2(t) измеряются, а b\(t) = 0 при t > t*, то управление (3) стабилизирует 'решение системы (1), т. е. p(t) ^ p* при t ^ ж, где p* = col[0, pa*]-

Доказательство теоремы 1 дано в приложении.

Если вектор состояния не измеряется и к$ > 0, можно построить наблюдатель типа Люенбергера вида

^=Ap + Bw + Ey + L{y-y). (4)

Здесь y = y(p,u), y = h(p,u). При определенном выборе вектора L и выполнении ограничений на функцию h(p, u) будет иметь место предельное равенство

lim p(t) = p(t), (5)

точнее, справедливо утверждение.

Теорема 2. Пусть к$ > 0, функция h(p, u) удовлетворяет условию Липшица

\h(p',u) — h(p'',u)\< ch\\p' — p"|| (6)

при любом u € U, где U — некоторая область, ch — известная постоянная, вектор L удовлетворяет неравенству

где Xq и Лн — наименьшее собственное число матрицы Q и наибольшее собственное число матрицы H, соответственно. Эти матрицы связаны уравнением Ляпунова

AH + HA* = —Q, (8)

в котором матрица Q > 0 задается, матрица H > 0 является его решением. Тогда для решения уравнения (4) при произвольном начальном векторе p0 = p(t0) справедливо предельное соотношение (5), причем сходимость — экспоненциальная. Теорема 2 доказана в приложении.

Рассмотрим теперь случай, когда к# = 0. Второе уравнение системы (1) после подстановки q = pa — pa* запишем в виде q = —kaq — h(p,u) + Ъ2 + kaq, где ка > 0 — произвольный параметр такой, что ка > ка. Управление u будем выбирать из уравнения Ъ2 + кaq = h(p, u). Тогда оно будет иметь вид

_ (62 + kaq)(2käipäi - kcq) - 2käikcpäiq

2[b2 + (ка - kc)q] • 1 j

Так как b2 > 0, при выполнении условия ка > ка знаменатель в формуле (9) не обращается в нуль нигде, кроме точки q = 0. При q ^ 0 функция u(q) ведет себя как однородная линейная функция (см. приложение).

В формуле (9) используются оценки состояния, полученные по алгоритму оценивания, изложенному в работе [4]. Приведем формулировку утверждения, доказанного в этой работе.

Лемма. Пусть для системы вида

^ = Ах + д{у,и), у = к{х,и)

Л.(х, и) — непрерывна по и и дважды дифференцируема по х, а вещественные части собственных чисел матрицы А порядка п в системе (1) неположительны, ад^) = 0. Рассмотрим алгоритм оценивания

—— = Ах + q(y, и) + К dt yvy' 7

dh(X, u)

dx

(y - y), y = h(x, u), (10)

где матрица К — положительно определенное решение уравнения Ляпунова А* К 1 + К-1А = —В, а заданная матрица В положительно полуопределена с гапк(В) > п — 1 и пара (А, В 2) наблюдаема. Тогда х{Т) —>• ж(£) при £ —>• оо.

Справедливо утверждение.

Теорема 3. Если в системе (1) =0, ка > кс и вектор ад^) = 0, управление вычисляется по формуле (9) с 62^) = 0, а вектор состояния р^) оценивается с использованием наблюдателя (10), то для 'решения системы (1) справедливо предельное соотношение

р^) ^ р* при t ^ то. (11)

=*=

Доказательство теоремы приведено в приложении.

4. Адаптивное управление. Будем теперь считать, что элементы матрицы A линейной части системы (1) неизвестны, но известна выпуклая область П, в которой они могут находиться. Рассмотрим уравнение адаптивной модели

^=Âp + Bw + E[h(p,u)-kaq\, (12)

где A = diag[-qsi, — ka], qsi > 0 —произвольное число, ka > 0 — выбранная постоянная в формуле (9), а q = pc - pc*-

Преобразуем разность векторов Ap и Ap, чтобы получить уравнение для ошибки e = p - p.

Ap - Ap + Ap - Ap = (A - A)p + A(p - p) = Cp + Aïe, с = A - A.

Вычтем из уравнения объекта (1) уравнение модели (12)

de

-=Ae + Cp + E[kaq+(y-y)i (13)

где Cp — неизвестный вектор, а y = h(p,u). Будем считать e(0) = â*,o и Cp = â*(t) новыми неизвестными параметрами.

Так как параметр â* (t) зависит от времени и является непрерывной функцией времени, то его можно разложить в тригонометрический ряд Фурье, предварительно продолжив периодически с достаточно большого промежутка времени, большего промежутка времени переходного процесса. Также можно ограничиться конечной суммой этого ряда, считая, что норма остатка в разложении мала: â*i)(t) = Zj(t),

(1 = 1, 2), где —постоянная, ^—либо синус, либо косинус. Используя формулу Коши, решение уравнения (13) можно представить в виде

N

0(1) /2)

*,3

е(£) = хо9

0 + Е Хзв *,3 + '>(N+1, 9*,з 3 = 1

Матричные базисные функции Хз(^) (з =0,1,N +1) удовлетворяют уравнениям

Хо(0) = I,

(14)

<хо 7

-ж = Лхо>

^=АХ]+11С3, Хд(0) = о, Сз

dXN +1

А(1) а(2)

ч , ч

<и

AхN+l + Е[(у — у) + кад, XN+l(0)

з 0,

: 1, •

11

(1, о, 0)*.

(15)

Здесь I — единичная матрица.

Будем решать бесконечную систему неравенств

N

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Е

=о

хз9з + XN +1

< £

(16)

г, =0

£ > 0 — заданное число. Эти

относительно неизвестного вектора 9 = •^931), неравенства рассматриваются покомпонентно.

Неравенства (16) удобно решать, используя разработанный В.А.Якубовичем алгоритм решения бесконечных систем линейных неравенств за конечное число шагов, названный им алгоритмом «Полоска» (см. [2], пункт 2.1). В моменты времени ¿к+1, когда нарушаются неравенства (16), оценки 9к вектора неизвестных параметров 9 пе-ресчитываются по формулам

9&+1 = Ре

9к+1 = Ре

9к + вк

'к+1 + вк

1

п(1)

к+1

Кк + 1 1

11хк1) "2

Х(1) Хк+1

^к+1 п(2)

к+1

Кк + 1

Нхк+Л2,

(2) хк+1

(17)

, к = 1, 2, 3,

В остальные моменты времени оценки не изменяются. Здесь Кк —число измене-

ний вектора оценок 9к к моменту 1к+1, 0 < в < 2, пк+1 = £ —

к+1

(0 хк+1

со1

(1) (1) х0,к+1, х1 ,к+1,

(0

, XN,k+1

(0 к

х(1)(1к), 1 = 1, 2. Ре —оператор проектирования (если значения вектора параметров выходят за границы выпуклой области ©, внутри которой находится неизвестный параметр 9, этот вектор параметров проектируется строго внутрь области ©). В приложении проверяются условия, при выполнении которых такой алгоритм будет сходиться за конечное число шагов. Введем множество П матриц вида А = diag[—«1, —02], «1 > 0, а2 > 0. Справедливо утверждение.

Теорема 4. Для алгоритма адаптивного управления (9), (12) и (17), где базисные функции определяются уравнениями (15), для решений р(£) системы (1) выполняется

целевое условие

Иш |р(£) — р*| < £,

Ь^оо

*

где р* = со1[0,рс*], а е > 0 —число, заданное в неравенствах (16). Неравенство (18) выполнено для любой матрицы А € О, независимо от значений р(0), р(0) и $0. При этом предполагается, что вектор ад^) измеряется.

Теорема доказана в Приложении.

Замечание. Если вектор и>^) не измеряется, то можно построить наблюдатель, аналогичный наблюдателю (12), разлагая вектор по некоторой системе базис-

ных функций, как это делалось в теореме 4 для вектора Ср^), и подстраивая коэффициенты этого разложения по алгоритму «Полоска», наряду с рассмотренными выше неизвестными коэффициентами.

2. Описание экспериментов.

Были проведены имитационные компьютерные эксперименты по адаптивному управлению процессом конвертерной плавки при следующих значениях параметров математической модели, алгоритма управления и алгоритма оценивания:

Время интегрирования равнялось 5, шаг интегрирования - 0.01, шумы w(t) отсутствовали, число N базисных функций Zj менялось от пяти до двадцати, при этом результаты экспериментов мало менялись.

Результаты экспериментов показали работоспособность предложенного алгоритма адаптивного управления конвертерной плавкой стали.

Литература

1. Widlund D., Medvedev A. and Gyllenram R. Towards model based closet-loop control of the basic oxygen steelmaking process // Preprint of the 9th IFAC Symposium Automation in Mining, Mineral and Metal Processing. 1998. P. 11-22.

2. Фомин В.Н., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М., 1981.

3. Sokolov B.M., Shepeljavyi A.I. and Medvedev A. The control of the top blown convertor process // 5th IFAC Symposium "Nonlinear control systems" (NOLCOS'01). St.Peterburg, Russia. 2001. P. 1408-1412.

4. Jahansson A. and Medvedev A. Nonlinear observer for estimation of metal analysis in steel convertors // 5th IFAC Symposium "Nonlinear control systems" (N0LC0S'01). St.Peterburg, Russia. 2001. P. 1402-1407.

kSi = 0.1; fctf =0.05; kC =0.1;

hSi = 0.2; he = 0.07; hC = 0.1;

£ = 0.001; в = 1; p(0) = [0.1, 0.1]*;

Pc* = 0.001; ka =0.2; p(0) = [0.2,0.2]*.

ПРИЛОЖЕНИЕ

1. Доказательство теоремы 1. Запишем систему (1) в виде

= + kSi)psi + bi,

^ = -k$q - k-opc* + Ъ2 - h'(p', и),

где p' = col[psi,q], h'(p',u) = h(p,u) при v2 = kcq. Независимо от значения управления u первая компонента вектора p' (psi) будет стремиться к нулю, если bi(t) ^ 0 при t ^ œ.

Будем выбирать управление из условия

—кцрс* + Ъ2 = h' (p',u). (П.1)

Выразим функцию h'(p',u) явно через управление и состояние р':

h'(p', и) = = 2{U ~ . (П-2)

vi + V2 2(u - ksipsi) + kcq

После подстановки этого выражения в предыдущее равенство (П.1) для управления u получим выражение (3). В формуле (3) знаменатель равен нулю при q = (Ъ2 — p*)/kc. При Ъ2 (t) < k$p* q будет отрицательным. Это противоречие показывает, что знаменатель в формуле (3) не может обращаться в ноль, если скорость подачи добавок (b2(t)) достаточно мала.

2. Доказательство теоремы 2. Вычтем из уравнений объекта (1) уравнения наблюдателя (4)

— =Ae-L(y-y), е=р-р.

Введем квадратичную функцию V = (e)* He, где матрица H > 0 удовлетворяет уравнению Ляпунова (8) с заданной матрицей Q > 0. Вычислим производную функции V вдоль решений системы для ошибки e Учитывая неравенство (6), получим

dV

— = е*(АН + АН*)е + 2е*H{-L[h(p,u) - h(p,u)}} <

< — AQ||e||2 + 2ен\\е\\2Лн||L|| < (—Aq + 2енЛн||L||)||e||2.

При выполнении для матрицы L неравенства (7) получаем отсюда экспоненциальную сходимость p(t) ^ p(t) при t ^ œ.

3. Доказательство теоремы 3. В случае, когда = 0, систему (1) запишем в виде

dpsi , , , —— = -ksiPsi + »1, dt

^- = -h'(p', u) + b2 + kaq - kaq. На этот раз управление будем выбирать из уравнения

b2 + kaq = h' (p',u). (П.3)

Подставляя, как и при доказательстве теоремы 1, выражение для функции h'(p',u) из формулы (П.2) в равенство (П.З), для управления u получим формулу (9). При ka > kc и b2 =0, учитывая, что второе слагаемое числителя при t ^ œ является бесконечно малой величиной по сравнению с q, а psi (t) ^ 0 экспоненциально, для управления получим выражение u = kakcq/[2(ka — kc)]. Отсюда следует, что u(t) ^ 0 при q ^ 0.

4. Доказательство теоремы 4. Для доказательства сходимости алгоритма «Полоска» необходимо выполнение двух основных условий (см. [2], стр. 68): 1) неравенства (16) должны выполняться с запасом p (0 < p < l) для некоторого решения ê*:

I(x,ê* )+ XN+1I< ep, (П.4)

2) базисные функции Xj (j =0, l, 2,..., N) должны быть ограничены. Первое условие заведомо выполнено, так как при ê = ê* (ê* — вектор истинных значений неизвестных параметров) вместо неравенства (П.4), будет иметь место равенство. Второе условие выполнено, поскольку в правые части уравнений для базисных функций (15) входят ограниченные функции Zj (t) (здесь рассматриваются только две первые строки формулы (15), которые и определяют направляющий вектор к плоскости Xjêj + XN+1 = 0).

Итак, через конечное число исправлений алгоритм (17) стабилизируется, так как параметры êk перестанут изменяться и примут некоторые значения êœ, а сами неравенства примут вид IeœI = I(x, êœ) + XN+1I < e. Так как справедливо неравенство

Ip — p* I = Ip — p + p — p* I < I e I + Ip — p* I < e + Ip — p* I и p(t) ^ p* при t ^ œ в силу выбора управления, то справедлива оценка (18). Summary

Sokolov B.M., Shepeljavyi A.I., Medvedev A. V. Adaptive control of convertor fusible steel.

The algorithm of adaptive control based on a method of recurrence target inequalities of V. A. Yakubovich and on a special algorithm of nonlinear estimation is considered.

Статья поступила в редакцию 13 июня 2002 г.

Адаптивное управление конвертерной плавкой стали Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Соколов Б. М., Шепелявый А. И., Медведев А. В.

Похожие темы научных работ по математике , автор научной работы — Соколов Б. М., Шепелявый А. И., Медведев А. В.

Adaptive control of convertor fusible steel

Текст научной работы на тему «Адаптивное управление конвертерной плавкой стали»