Научная статья на тему 'УПРАВЛЕНИЕ РЕАКТОРОМ С НЕПРЕРЫВНЫМ ПЕРЕМЕШИВАНИЕМ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И С УЧЕТОМ ОГРАНИЧЕНИЙ НА ФАЗОВЫЕ ПЕРЕМЕННЫЕ И УПРАВЛЕНИЯ'

УПРАВЛЕНИЕ РЕАКТОРОМ С НЕПРЕРЫВНЫМ ПЕРЕМЕШИВАНИЕМ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И С УЧЕТОМ ОГРАНИЧЕНИЙ НА ФАЗОВЫЕ ПЕРЕМЕННЫЕ И УПРАВЛЕНИЯ Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
43
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЗЕРВУАРНЫЙ РЕАКТОР С НЕПРЕРЫВНЫМ ПЕРЕМЕШИВАНИЕМ (РРНП) / ЗАДАЧА СЛЕЖЕНИЯ / БЛОЧНЫЙ ПОДХОД / НАБЛЮДАТЕЛЬ СОСТОЯНИЙ И ВОЗМУЩЕНИЙ / ОГРАНИЧЕНИЯ НА ФАЗОВЫЕ ПЕРЕМЕННЫЕ И УПРАВЛЕНИЕ

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Гулюкина С.И., Уткин В.А.

Рассматривается задача синтеза управления, обеспечивающего поддержание температуры в рубашке резервуарного реактора с непрерывным перемешиванием. Стандартная математическая модель, описывающая работу реактора, расширена с помощью введения динамики исполнительного устройства. Проблема учета ограничений на компоненты вектора состояния и управление решается путем нелинейной замены переменных исходной модели объекта управления с использованием линейных функций с насыщением. В преобразованной системе синтез обратной связи «автоматически» учитывает заданные ограничения. Применение при синтезе обратной связи блочного подхода позволило осуществить линеаризацию по обратной связи в результате последовательного решения подзадач синтеза первого порядка. В условиях неполной информации о векторе состояния и при воздействии внешних возмущений синтезирован наблюдатель состояний и возмущений, позволяющий получить оценки неизвестных сигналов с заданной точностью, что обусловлено наличием внешних возмущений. Предложенные алгоритмы показали высокую эффективность при моделировании в системе Matlab-Simulink.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Гулюкина С.И., Уткин В.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A BLOCK APPROACH TO CSTR CONTROL UNDER UNCERTAINTY, STATE-SPACE AND CONTROL CONSTRAINTS

This paper designs a control law to maintain the temperature in the jacket of a continuous stirred tank reactor (CSTR). The standard mathematical model describing the reactor operation is extended by introducing the actuator’s dynamics. The state-space and control constraints are considered by a nonlinear change of the variables of the plant’s initial model using linear sat functions. In the transformed system, these constraints are considered by feedback control law design. The block approach allows linearizing the feedback control law by sequentially solving the first-order design subproblems. Under incomplete information on the state vector and the effect of exogenous disturbances, an observer of the state vector and disturbances is constructed to estimate the unknown signals with a given accuracy. The effectiveness of the proposed approach is illustrated by simulating the CSTR-DC motor system in MATLAB.

Текст научной работы на тему «УПРАВЛЕНИЕ РЕАКТОРОМ С НЕПРЕРЫВНЫМ ПЕРЕМЕШИВАНИЕМ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И С УЧЕТОМ ОГРАНИЧЕНИЙ НА ФАЗОВЫЕ ПЕРЕМЕННЫЕ И УПРАВЛЕНИЯ»

АНАЛИЗ И СИНТЕЗ СИСТЕМ УПРАВЛЕНИЯ

УДК 62-501.2 DOI: http://doi.org/10.25728/pu.2021.5-4

УПРАВЛЕНИЕ РЕАКТОРОМ С НЕПРЕРЫВНЫМ ПЕРЕМЕШИВАНИЕМ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ И С УЧЕТОМ ОГРАНИЧЕНИЙ НА ФАЗОВЫЕ ПЕРЕМЕННЫЕ И УПРАВЛЕНИЯ1

С.И. Гулюкина, В.А. Уткин

Аннотация. Рассматривается задача синтеза управления, обеспечивающего поддержание температуры в рубашке резервуарного реактора с непрерывным перемешиванием. Стандартная математическая модель, описывающая работу реактора, расширена с помощью введения динамики исполнительного устройства. Проблема учета ограничений на компоненты вектора состояния и управление решается путем нелинейной замены переменных исходной модели объекта управления с использованием линейных функций с насыщением. В преобразованной системе синтез обратной связи «автоматически» учитывает заданные ограничения. Применение при синтезе обратной связи блочного подхода позволило осуществить линеаризацию по обратной связи в результате последовательного решения подзадач синтеза первого порядка. В условиях неполной информации о векторе состояния и при воздействии внешних возмущений синтезирован наблюдатель состояний и возмущений, позволяющий получить оценки неизвестных сигналов с заданной точностью, что обусловлено наличием внешних возмущений. Предложенные алгоритмы показали высокую эффективность при моделировании в системе МайаЪ^шиИпк.

Ключевые слова: резервуарный реактор с непрерывным перемешиванием (РРНП), задача слежения, блочный подход, наблюдатель состояний и возмущений, ограничения на фазовые переменные и управление.

_ВВЕДЕНИЕ_

Резервуарный реактор с непрерывным перемешиванием (РРНП, англ. continuous stirred tank reactor, CSTR) широко используется в химической промышленности. Динамика реактора с непрерывным перемешиванием обычно описывается двумя нелинейными дифференциальными уравнениями первого порядка [1,2], которые часто используются в качестве эталонной модели для применения и тестирования новых алгоритмов управления.

Совершенствование управления реактором с непрерывным перемешиванием является в настоящее время актуальной проблемой, которая привлекает внимание многих специалистов по теории и практике управления [3-8].

'Работа выполнена при поддержке РФФИ (20-01-00363 А).

Большое количество публикаций на эту тему основывается на использовании техники скользящих режимов [9-16], поскольку последняя позволяет обеспечить робастные свойства замкнутых систем и инвариантность к внешним возмущениям, действующим в каналах управления. Отметим, что часто в работах с использованием скользящих режимов в качестве управления принимаются переменные объекта управления, которые физически не могут быть разрывными функциями, например, скорость потока охлаждающей жидкости в рубашке РРНП. Это существенно снижает практическую значимость использования техники скользящих режимов при автоматизации различных технологических процессов.

В целях получения информации о компонентах вектора состояния и возмущениях широко используются наблюдатели состояния на основе теории скользящих режимов и в рамках систем с глубокими обратными связями [17-21]. Отметим, что в присутствии возмущений решение задачи получе-

48

CONTROL SCIENCES No. 5 • 2021

ния оценок как собственно компонент вектора, так и возмущений, по-видимому, возможно только в рамках указанных подходов.

Недостаточно изученной в теории управления представляется проблема учета физических ограничений на компоненты вектора состояния и управления. Например, в работах [22-24] учитываются ограничения только на управления.

В настоящей работе предложено комплексное решение задач управления РРНП, развивающее предложенный в работе [25] метод решения задач управления механическими системами с учетом ограничений. В качестве методологической основы применяется блочный подход в управлении [26], позволяющий декомпозировать задачи высокой размерности на независимо решаемые подзадачи меньшей размерности при синтезе обратной связи и наблюдателей состояния. Трактуя в качестве фиктивных управлений компоненты вектора состояний для каждой из этих подзадач, прежде всего, с этой точки зрения выполняются условия согласования возмущений (принадлежность возмущений пространству управлений). Кроме того, использование при синтезе локальных обратных связей функций с насыщением обеспечивает ограниченность координат вектора состояния и управлений.

Работа имеет следующую структуру. В § 1 кратко описывается принцип работы РРНП, формируется математическая модель и дается постановка задачи. В § 2 синтезируется наблюдатель вектора состояния и возмущений с разрывными и непрерывными корректирующими воздействиями с большими коэффициентами. В § 3 разработаны алгоритмы синтеза обратной связи с использованием синтеза локальных обратных связей в виде непрерывных функций с насыщением и разрывного управления напряжением якоря двигателя постоянного тока (ДПТ). В § 4 работоспособность предложенных алгоритмов подтверждается с помощью моделирования в среде МайаЬ^шиПпк.

1. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОБЪЕКТА УПРАВЛЕНИЯ. ПОСТАНОВКА ЗАДАЧИ

Резервуарный реактор с непрерывным перемешиванием представляет собой ключевой элемент оборудования, необходимый для завершения химических реакций во многих отраслях химической и биохимической промышленности. В РРНП происходит сложная химическая реакция, напри-

мер, превращение опасных химических отходов (реагента) в приемлемое химическое вещество (продукт). Принципиальная схема реактора приведена на рис. 1.

Рис. 1. Реактор РРНП (CSTR)

Предполагается, что в резервуаре происходит необратимая экзотермическая реакция первого порядка Л^Б + АН, где А - реагент; Б - продукт; АН - тепловой эффект химической реакции (энтальпия реакции).

Предполагается, что объем резервуарного реактора с непрерывным перемешиванием равен V. На вход реактора со скоростью потока д подается реагент, имеющий концентрацию СА/, температуру Т] и плотность р.

Температура в реакторе поддерживается на определенном уровне с помощью задания температуры жидкости в рубашке Тс путем управления скоростью потока охлаждающей жидкости. Выходящий из реактора продукт характеризуется температурой Т, концентрацией СА и, исходя из условия постоянства объема вещества в реакторе, скоростью потока д.

В предположениях о неизменности объема вещества в реакторе, идеальном перемешивании и постоянстве плотности вещества в реакторе в соответствии с законом сохранения массы и законом сохранения энергии может быть сформулирована динамическая модель РРНП [16]:

Са(0 = (О - СА(0) ~ к0СА(Г)е-Е1т'\

= + (1) * гС р

ил

Описание параметров модели (1) приведено в табл. 1.

Таблица 1

Параметры модели РРНП, их значения и единицы измерения

Обозначение Единицы измерения

Значение

Са Концентрация продукта В Кмоль/м3

T Температура в реакторе и температура продукта К

q Скорость потока реагента м3/мин

V Объем реактора м3

Caf Концентрация реагента Кмоль/м3

k0 Постоянная скорости реакции первого порядка мин-1

E Энергия активации Дж/моль

R Универсальная газовая постоянная Дж/(моль-К)

Tf Температура реагента К

AH Энтальпия реакции Кал/Кмоль

P Плотность реагента г/м3

Tc Температура охлаждающей жидкости К

Cp Удельная теплоемкость реагента кал/(К-г)

U Коэффициент теплопередачи Вт/(м2-К)

A Площадь поверхности теплоотдачи м2

Цель управления РРНП заключается в регулировке температуры охлаждающей жидкости Тс путем изменения скорости потока охлаждающей жидкости таким образом, чтобы температура в реакторе T соответствовала желаемым значениям.

Предполагается, что подача охлаждающей жидкости в реактор обеспечивается насосом с ДПТ. Система уравнений, описывающая работу ДПТ [27], имеет вид:

х3 (t) = а21 (gx4 (t) - mL (/)),

¿4 (t) = a32 (u2 (t) - gx3 (t) - a31x4 (/)), где x^it) - частота вращения вала двигателя; x4(t) - ток якоря; u2(t) - напряжение якоря; g = const -магнитный поток; mL (t) - момент нагрузки; atj = const > 0 - конструктивные параметры двигателя.

Ставится задача слежения относительно выходной переменной T(t) за заданной температурой охлаждающей жидкости в рубашке Td (t), являющейся функцией времени:

e2(t) = T (t) - Td (t) ^ 0.

В предположении о «насосной» нагрузке mL = mx3 (t), m = const, и в предположении, что

температура в рубашке пропорциональна скорости потока охлаждающей жидкости Tc (t) - T(t) = x,(Tco - T(t)), где Tco = const > 0 -температура охлаждающей жидкости на входе рубашки, запишем модель объекта управления (1), (2) в новых переменных:

Ху (t) = -сщ (t) -f1(x2)x1(t) + ^1 (t),

¿2 (t) = -ае2 (t) + bfy (x2 )хг (t) + +Px3 (Tc0-Td(t)-e2) + b(t), (3)

x3(t) = a21(gx4(t)-mx32(t)), x4 (t) = a32 (u2 (t) - gx3 (t) - a31x4 (0), где xl(t) = CA(t), x2(t) = T(t), e2(t) = x2(t)-Td(t), № = aCAf (t), ^2(t) = a(Tf -Td) - Td, f1(x2) =

= k0e-y'x2(t), a = ^ ,y = E ,b = ^ , p = _UL 0 v R cpP 1 pvcp

Относительно модели процесса управления (3) предполагается, что для измерения доступны выходная переменная y(t) = e2(t) и ток якоря Х4 .

Возмущение ^ (t), зависящее от концентрации входного реагента CAf (t), в режиме реального времени измерить проблематично, в то время как температуру поступающего реагента Tf (t) измерить сравнительно просто. Будем далее полагать, что возмущение ^1(t) недоступно для измерения, а значение сигнала £,2 (t) измеряется.

С учетом особенностей технологического процесса на переменные системы накладываются ограничения вида

X е[0,Xt],i = 2,3;|хА\ < X4;

u2 < U, Xi ,U = const > 0.

(4)

Проблема учета ограничений на компоненты вектора состояния и управления в настоящее время недостаточно изучена в теории управления. В данной работе предложено учесть эти ограничения в математической модели объекта управления с помощью введения замены переменных в виде линейной функции с насыщением (см. § 3).

Цель управления заключается в поддержании температуры и концентрации выходного продукта в соответствии с заданными значениями. При этом в качестве управления в контуре поддержания температуры выходного продукта рассматривается напряжение и2 на якоре ДПТ. В контуре поддержания концентрации выходного продукта в качестве управления рассматривается скорость подачи реагента в реактор q . Далее основное внимание уделяется синтезу контура управления

q

температурой в реакторе, а величина a = — полагается известной. В следующем разделе решается задача получения оценок переменных вектора состояний и возмущений в системе (3).

2. СИНТЕЗ НАБЛЮДАТЕЛЯ СОСТОЯНИЙ И ВОЗМУЩЕНИЙ

Рассмотрим задачу получения оценок вектора состояния и возмущений в системе (3) по измеряемым выходным переменным e2, x4 в предположении, что сигналы q, измеряются.

Наблюдаемость системы (3) относительно выходных переменных e2, x4 устанавливается исходя из следующих соображений (а синтез наблюдателя осуществляется именно в указанной ниже последовательности):

• Модель ДПТ (два последних уравнения системы (3)) не зависит от переменных модели реактора (первые два уравнения системы (3)) и ее наблюдаемость относительно переменной x4 очевидна в силу того, что она имеет блочную форму наблюдаемости [28]. В результате синтеза наблюдателя с использованием модели ДПТ имеем оценку переменной x3 .

• Применительно к модели реактора с учетом того, что далее переменные e2, x3, £,2 доступны для измерения, ее структура совпадает с блочной формой наблюдаемости с учетом возмущений [21] и, как следствие, также является наблюдаемой.

Сформулируем результаты теории систем с глубокими обратными связями, которые используются в дальнейшем изложении.

Лемма. Пусть дана система первого порядка 8 (t) = u + Qt), (5)

где s(t), u(t), £,(t) е R - переменные состояния, управление и возмущение соответственно, ^ Е = const, < Ё = const, Vt > О .

Тогда существует управление

u(t) = -as(t), a = const > 0, такое, что для любых

заданных Д0 ,Д0,a,a = const > 0за конечное время

t0 > 0 выполняются соотношения:

1) |s(t)| < Д0,

2) |s(f)|<A0,

3) |as - < Д0.

Д о к а з а т е л ь с т в о.

1) Вопрос о сходимости переменной состояния системы (5) s в заданную окрестность нуля Isl < Д0

решается путем выбора кандидата функции Ляпунова в виде V = 0,5е2. Определим коэффициент обратной свя-

Е

зи в виде a0 =

An

Тогда условие V = её = е(-а0е + < |е| (-а0 |е| + Е) < < 0 ^-а0|е| + Е < 0 выполняется вне области Е

а < — = А0. При этом для случая |е(0)| < А0 переменно

ная не выходит за пределы заданной окрестности нуля |е(?)| < А0, Уг> 0, а для случая |е(0)| >А0 может неограниченно приближаться извне к этой окрестности. Исходя из этих утверждений, следует, что выбор параметра, удовлетворяющего неравенству а > а0 , гарантирует сходимость переменной состояния в заданную окрестность |е(г)| < А0 за конечное время. ДействиЕ Е

тельно, в силу А = — < А0 = — переменная будет а а0

оставаться в новой окрестности нуля |е(?)| < А, V? > 0, если |е(0)| < А , и неограниченно приближаться к новой окрестности нуля, если |е(0)| > А, а значит, за конечное

Е

время окажется в окрестности А0 < — . Из оценки ре-

шения системы

(5) |s(t)| < |s(0)e-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

t j eaT^ (т)

t) dt

< |s(0)|

димости в область |s| < Д0, Vt > t0, где t0 определяется

e н— (1 - e ) получаем оценку времени схо-a

так:

(|s(0)| -A)e'at + Д = Д0 ^ t0 = -ln

|s(0)| - Д V Д0 -Д .

|е(0)| > А0.

2) Аналогичный результат справедлив и для производной переменной состояния применительно к системе ё = -аё + 4 • получаемой в результате дифференцирования обеих частей уравнения (5). Пусть задана

1-1 т Е „ ^ окрестность £ < Ап = —. Выберем параметр из нера-

" ао

_ _ Е - Е

венства а > а0 и обозначим А = — < А0 = —. Тогда за

а ап

конечное

время

выполняется соотношение

(I

|ё| < А0, г > г0, где t() = —In

в(0)|-А v А0-А

Л

|е(0)|>А0.

3) Наконец, в силу равенства (5) с учетом пункта 2) справедлива оценка вида |ае(г) - < А0, V? > Т0 . Следовательно, можно получить оценку возмущения с заданной точностью: ае(г) = ф) + 5(г), 5(г) < А0, V? > г0. Отметим, что для случая постоянных возмущений си-

0

0

стема ё = -аё + 4 1 = 0. имеет решение вида ё = е(0)с и, следовательно, имеем асимптотически сходящуюся оценку возмущения ав ^ ? ^ да.

Выбор значения параметра а из условия а > тах{Е/А0 ,Е/А0 } гарантирует выполнение условий леммы, сходимость переменной в(?) и ее производной е(?) в заданные области 1) |е(г)|<Д0, 2) |ё(г)|<Д0, 3) |ов(?) -< А0, V? > тах{?0, 70}.

Лемма доказана. ♦

Для решения задачи оценивания вектора состояний системы (3) синтезируем наблюдатель вида

¿1 ="[« + /¡(*2)]ч

¿2 = -яг2 + Рг3 (Тс0-Та-е2) + £2+у2, ¿з=а2^х4+у3,

¿4 = а32(и2-а31г4) + у4,

где V; - корректирующие воздействия наблюдателя, определяемые далее.

Запишем систему в невязках вг = хг - , г = 1, 3, 4, в2 = е2 - г2 с учетом формул (3) и (6):

тическое стремление переменной в нуль:

(6)

¿1 = ~(а + fx (х, »Sj + ^ (?) - Vj, s2 = -ае2 + (3(7;,, -Td-e2)е3 + bfx(х2)xl(t)-v2,

— \ V3?

в^ ^32^31^4 ^32 № ^4*

(7)

Приведем пошаговую процедуру построения наблюдателя состояния и возмущений (7) в рамках каскадного синтеза наблюдателей [28].

1. Выбором корректирующего воздействия в последней подсистеме системы (7) в виде разрывной функции v4 = l4sign(s4) (где l4 = const > > |a32 gx3|) обеспечивается скользящий режим по прямой s4 = 0 . При этом среднее (эквивалентное) значение разрывного сигнала равно v 4eq = -a32 gx3.

Отметим, что на практике эквивалентное значение разрывного управления может быть получено с выхода фильтра первого порядка pt = -T + v4,

М- > 0, v4eq ~ х [28].

2. Используя полученное эквивалентное значение (с учетом x3 = -v4eq / (a32g)), построим корректирующее воздействие в третьей подсистеме системы (7) в виде v3 = -a21m х

x(v4eq / (a32 g))2 + l3[ - V4eq / (a32 g) - Z ] . В итоге

третья система (7) примет вид s3 = -^3 и выбором коэффициента l3 > 0 обеспечивается асимпто-

— 0 ^ Z3 — x3.

3. В предположении s3

■0:

>x3 второе

уравнение системы (7) принимает вид в2 = -ае2 +bf1(x2)x1 - v2.

Выбор корректирующего воздействия в виде v2 = l2sign(s2), l2 = const > bf1 (x2 )x1, гарантирует возникновение скользящего режима по плоскости s2 = 0 . При этом среднее значение разрывного сигнала равно v2eq = bf1 (x2) x1.

4. На

последнем

(

шаге

положим

v- = (- fi (x2 ) + l-)

"2eq

\

■Zi

= (-fi (x2) + li )s-.

ЬМ Х2)

Тогда первое уравнение системы (7) принимает вид в1 =-(а + /1)в1 + ^ и в предположении

— Ех, <Е, согласно лемме справедливы

Е

соотношения

Iе 1 <■

■=Д1

и

а + 1г 1 *' а + 1г

Таким образом, выбором коэффициента 11 > 0 обеспечивается за конечное время заданная точность стабилизации переменной |в:| < Ах и, как следствие, получение оценки х1(?) = + 51 (?), |5Х (?) < , а также оценки возмущения с заданной точностью £,х(?) = (а + 11)в1 (?) + 51 (?), |§1(?) < Ах.

Отметим, что с ростом коэффициента усиления 11 ^да точность полученных оценок неограниченно возрастает: 81; 81 ^ 0.

Таким образом, решена задача получения оценок компонент вектора состояния системы (3) и возмущения ^ (?).

В представленной выше процедуре синтеза наблюдателя вектора состояния и возмущений использовались как разрывные, так и непрерывные корректирующие воздействия. Как видно, синтез на основе скользящих режимов проще с вычислительной точки зрения, но следует помнить, что средние (эквивалентные) значения корректирующих воздействий получаются на выходе фильтров первого порядка [28], что приводит к динамическому расширению пространства состояний исходной модели. Техника линеаризации уравнений в невязках (7) с помощью непрерывных корректирующих воздействий, продемонстрированная выше на четвертом шаге процедуры синтеза наблюдателя, может быть использована по аналогии на всех других шагах. При этом принцип каскадного синтеза [28] позволяет декомпозиро-

вать процедуру синтеза наблюдателя на последовательно решаемые подзадачи размерности один с наперед заданной точностью получаемых оценок без расширения пространства состояний замкнутой системы.

Далее разрабатывается процедура синтеза управления в системе (7) при наличии полной информации (с учетом полученных в этом разделе оценок вектора состояния и возмущения).

3. СИНТЕЗ ОБРАТНОЙ СВЯЗИ

Представим решение задачи в общем виде в рамках блочного подхода в условиях полной информации о компонентах вектора состояния и возмущений, получаемой с помощью наблюдателя (6). Приведем схему пошаговой процедуры синтеза обратной связи при наличии полной информации о векторе состояния и возмущениях на основе блочного подхода [21] и с учетом ограничений на компоненты вектора состояния и управление (4).

Шаг 1. Перепишем второе уравнение системы (3) в виде

¿2 =-ae2(t) + ßd(t)x3 +12(0, (8)

где I2 = bf (х2 + §2, d(t) = Тсо - Td (t) - e2 (t) < 0, |d| ^ D = const.

В системе (8) в качестве управляющего воздействия рассматривается частота вращения вала двигателя x3. Учитывая, что при насосной нагрузке частота вращения вала двигателя положительна, введем замену переменной

e3 = ßd(t)x3 + M3sat+ (s3), (9)

где s3 = k2e2 + . Решение задачи стабилизации переменной e3 = ßd (t )x3 + M 3sat + (s3) = 0 позволяет учесть ограничение (4) на переменную x3 е [0, X3 ] выбором 0 < M3 < ßDX3.

Определение. Пусть M = const > 0, b = const. Тогда Msat(s) = min (M, |s|) sign(s), Msat + (s) = = Msat(s)0,5[i + sign(s)].

После подстановки суммы (9) в формулу (8) второе уравнение системы преобразуется к виду

¿2 = -ае2 + е3 - M3sat+ (s3) + . (10)

При попадании переменной s3 в линейную зону 0 < s3 < M3 уравнение (10) описывается выражением

ё2 =-(а + к2)е2 + е3, где выбор параметра k2 > 0 определяет сходимость переменной данной подсистемы в заданную

м - ~У\

-М /\

1 у 1 / 1 / М s

М

Рис. 2. К определению Msat(s)-функции

Рис. 3. К определению Msat+(s)-функции

окрестность нуля, определяемую согласно Лемме выражением |e2| < А3 /(a + k2) в предположении

|e3| < А3 = const.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Условия попадания в линейную зону определяются выбором амплитуды М3 исходя из соотношений \3,v3 <0 в нелинейной зоне s3<í(0,M3) (см. рис. 3). Запишем уравнение относительно переменной í3 :

s3 = ~{as3 -\) + %2 + к2[-М3sat+ (s3) + е3 + Ъ>2\.

Следующий анализ позволяет определить параметры M3 и k2 функции M3sat + (s3) .

• При s3 е [M3, да] и, следовательно, —M3sat+(s3) = — М3 должно выполняться неравенство л. = -ais-, - \2) + \2 + к2[-М3 + e-, + \ \ < 0.

откуда следует неравенство на выбор амплитуды k2

• При s3 е (-да,0) и, следовательно, M3sat+ (s3) = 0 должно выполняться неравенство s3 = -a(s3 - ) +£,2 + к21 е3 +¿j,2 | > 0. откуда в предположении e3 + 42 > 0 и |e31 < А3 = const следует ограничение на выбор коэффициента

2 + %i

k2 >

e3 + ^2

. Отметим, что требование

e3 =

= Ь/у (х2 )х! + а(Ту (г) - Тл) - Тл + е3 > 0 в силу Ъ/1 (х2) х + а(Т^ (г) - Тё) > 0 накладывает ограничение на заданную точность стабилизации переменной |в3| < Л3 (решаемую на следующем шаге) и на скорость изменения задания окрестности А, <)

bf,{x2)xi +a(Tf(t)-Td{t)), \fd(t)\ <bf1(x2)xi

+

+ a (Tf (t) - Td (t)) - A3. С точки зрения физики, последнее неравенство ограничивает скорость изменения задания окрестности до уровня, когда задача слежения имеет решение.

Шаг 2. На втором шаге обеспечим попадание переменной e3 из уравнения (10) в окрестность

нуля |e3| < A3. Согласно равенству (9), уравнение, описывающее поведение переменной e3, имеет вид:

ез = ßd(t)a2XgxA + ^. (11)

Рассматривая переменную x4 в системе (11) в качестве фиктивного управления, положим его равным

е4 = ßd (t)a21gx4 + M4sat(s4), (12)

где M4sat(s4) = min(M4,|s4|)sign(s4) (см. рис. 2), s4 = к3е3 + £,3. Решение задачи стабилизации переменной е4 ^ 0 решает задачу учета ограничения |x4| < X4 с помощью выбора амплитуды из соотношения M4 < ßDa21gX4.

Уравнение (11), «замкнутое» локальной обратной связью (12), имеет вид

ё3 =<?4-M4sat(,s4) + §3

и при функционировании в линейной зоне (ls4l < < M4 ^ M4sat(s4) = s4) преобразуется к виду

ё3 — к3е3 + е4.

Выбор амплитуды M4, обеспечивающей попадание переменной s4 в линейную зону, определяется на основе второго метода Ляпунова. Запишем производную функции s4 в виде

s4 = к3 [-M4sat(s4) + ф4 (.)] + 4з» d2

где = 2|3da2lmx3x3 н—— | /V/3sat (л, )|. ср4 = е,+.

dt

+pda21mx3 +—[M3sat + (s3)]. dt

Выберем кандидата на функцию Ляпунова V = 0,5^4 . Тогда требование V = л4л4 < 0 вне линейной зоны |s4| > M 4 дает производную функции Ляпунова вида V = s4{£3[-M4sign(,y4) + ф4(.)] + +£,3}<0, откуда следует выражение для выбора амплитуды М4 > Ф4 + Е3 / к3 , где |£3| < Е3 = const

и |ф4| < Ф4 = const.

Шаг 3. На последнем шаге решается задача стабилизации переменой (12), описываемой уравнением вида

ё4 = Р da2l ga32u2 +1,4, (13)

где = $d(t)a2lgx4 -fid(t)a21ga32(gx3 + а31х4) +

+d [M 4sat(s4)].

dt

Выберем управление в виде разрывной функции

u2 = M2sign(e4). (14)

В случае выполнения условия существования

4 4

Pda21 ga32

(13) за конечное время возникает скользящий режим по плоскости e4 = 0.

Для наглядности выпишем уравнения движения системы (5) в скользящем режиме: хх = -сщ - fx (Td + (t),

скользящего режима M2 >

в системе

= -(a + к2)е2 + e3, e3 = -k3e3, e4 = 0.

(15)

В системе (15) осуществляется последовательное асимптотическое стремление к нулю переменных в4 = 0 ^ в3 ^ 0 ^ в2 ^ 0, в то время как первая подсистема представляет собой уравнение нулевой динамики. Первое уравнение системы (15), описывающее нулевую динамику, устойчиво в силу ЪТ) > 0.

Таким образом, выбор управления разрывным (см. формулу (14)) за конечное время обеспечивает скользящее движение по плоскости в4 = 0, ко-

2

торое описывается устоичивои системой линейных дифференциальных уравнений (15).

Отметим, что если для стабилизации подсистемы (13) использовать непрерывную обратную связь

eda21ga32u2 + ^ = -к4е4 ^ и2 = - 5* + ^ ,

pda2lga32

последнее уравнение системы (15) примет вид ё4 = ~к4е4 и устойчивость замкнутой системы

также будет обеспечена. Дополнительными требованиями к реализации такого непрерывного управления будут необходимость получения информации о переменной £,4 и использование устройства широтно-импульсной модуляции для управления инвертором напряжения ДПТ. Отметим, что для реализации разрывного управления (14) требовалась лишь оценка сверху переменной 4| < —4 = const .

Первая подсистема (15), рассматриваемая как уравнение нулевой динамики, согласно лемме

имеет ограниченное решение |х| <-—1- при

a + fi(Td)

(t)| = aCAf < — = const . В частности, в предположении = —1, x2 = Td, — ,Td = const, согласно

t ^ qCAf лемме имеем (с учетом a = — ) x ^---.

' V 1 q + Vf1(Td)

Полагая параметр q в качестве управления в контуре поддержания концентрации выходного продукта, имеем предельные соотношения q ^ да ^

■ca ^ CAf и q

•о ^ с.

>0. Значит, задавая

разумные границы изменения концентрации выходного продукта СА е[СА1, СА2], можно поддерживать концентрацию выходного продукта в данном диапазоне с помощью изменения скорости его подачи в реактор.

Видно, что с ростом скорости поступления реагента в реактор концентрация выходного продукта уменьшается, а с уменьшением - увеличивается.

Рассмотрим три набора параметров, в которых значения СА^ = 0,9 и д = 0,9 неизменны, а желаемая температура варьируется: 1) Тл = 350, 2) Тл = 380, 3) Тл = 400 . Согласно приведенному

дСА/

выше соотношению x ^

для каждого

q+vfx(Td)

из наборов параметров получим: 1) x1 ^ 0,3251; 2) х ^ 0,3214; 3) x1 ^ 0,3192.

Таким образом, с увеличением температуры в реакторе концентрация продукта уменьшается, что согласуется с результатами моделирования из § 4 (см. рис. 10).

4. РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ

Эффективность предложенного подхода проверена посредством численного моделирования системы «реактор с непрерывным перемешиванием - двигатель постоянного тока» в системе Ма^аЬ^шиПпк. При моделировании системы (3), наблюдателя (6) и управления (14) были выбраны параметры из табл. 2.

Таблица 2

Параметры модели

Группа Значения параметров

параметров

Параметры РРНП (С8ТЯ) q = 0,9, V = 1, в = 0,003,у = 80, b = 5, к0 = 2, Tc0 = 300, CAf = 0,9 + 0,005 sin(0,03ntt, Tf = 395 + 0,01sin(0,05nt).

Параметры ДПТ a21 = 0,8, g = 0,7, m = 0,0001, «31 = 12,5, «32 = 2

Начальные условия и задание x(0) = 0,3, (0) = 400, x3(0) = 100, x4(0) = 20

Сценарий моделирования Td (0) = 350 при t £ [0, ij], Td (t1) = 380 при t £ (tx, да],tx = 75

Параметры наблюдателя z, (0) = 0, i = 1,4, 1 = 100, l2 = 3, l3 = 100, l4 = 500

Параметры контроллера M2 = 400, M3 = 50, M4 = 170, k2 = 0,5, k3 = 0,1

Физические ограничения на фазовые переменные Ca £ [0,1], T £ [0,400], x3 £ [0,100], |x4| < 150, u2 = ±400

Предполагается, что в объекте для измерения доступны температура в рубашке реактора х2, ток якоря х4, скорость поступающего реагента д и его

температура Т^ . Для получения полной информации о фазовых переменных объекта РРНП-ДПТ и о действующих на него внешних возмущениях был построен наблюдатель состояния (6), позволяющий получить оценки неизвестных сигналов с заданной точностью.

На рис. 4-7 представлены ошибки наблюдения

= X - ^, I = 1,4.

На рис. 8 представлен график внешнего возмущения ^ = 0,9(0,9 + 0,005 яп(0,03та)), восстановленного с помощью наблюдателя (6). Прерывистая линия соответствует реальным значениям

возмущения, сплошная - восстановленным. На рис. 9 показан график изменения температуры в рубашке реактора.

20 15

10

5 0

\

: .5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(,5 0

¿2 0.03 0,04 0,05 0.06 0Хр

50 100

мин

150

Рис. 7. Ошибка наблюдения г4(Т)

Рис. 4. Ошибка наблюдения г^Т)

40

- 2 1 Э Р|

"к "л 20 Л 0 \

0

1,8 IX) 90 100 но у

20 -40

3 1

1

0 50 100 150

г, М11Н

Рис. 5. Ошибка наблюдения г2(Т)

30 25 ■у * 20 в 1 15 «? 10

^815 0,81 1,805 V N

Г \ А

\ J

0 10 20 30 40 у

0

0 50 100 150 и мин

Рис. 8. Внешнее возмущение ¡¡¡(Т)

400 390 380 370

и 53

360 -

350 -

0 50 мин 100 150

Рис. 9. Температура в рубашке х2(Т)

Рис. 6. Ошибка наблюдения г3(Т)

На рис. 10-13 представлены графики зависимости от времени концентрации продукта х^(г), угловой частоты вращения вала двигателя х3 (г) , тока якоря х4(г) и напряжения якоря и2(г) соответственно.

Рис. 10. Концентрация продукта xi(i)

Рис. 11. Угловая частота вращения вала двигателя x3(t)

500

" 0

-500

50 t, MIIH 100 150

Рис. 13. Напряжение якоря u2(t)

ЗАКЛЮЧЕНИЕ

Математическая модель резервуарного реактора с непрерывным перемешиванием была расширена с помощью введения динамики исполнительного устройства - двигателя постоянного тока, что вполне обоснованно позволило применять теорию скользящих режимов путем переключения ключей инвертора напряжения.

Для получения информации о неизмеряемых компонентах вектора состояния и возмущениях разработан наблюдатель со смешанными корректирующими воздействиями (разрывными и непрерывными).

В предложенной схеме синтеза обратной связи учитывается тот факт, что как в реальном скользящем режиме, так и при использовании глубоких обратных связей оценивание реальных сигналов с помощью наблюдателя осуществляется лишь с заданной точностью. Ключевой особенностью данной работы является синтез обратной связи с использованием методологии блочного подхода, позволяющий учесть ограничения на фазовые переменные и управление применительно к реактору с непрерывным перемешиванием.

Работоспособность предложенного алгоритма подтверждена как аналитически, так и с помощью моделирования в системе Ма^аЬ^шиПпк.

ЛИТЕРАТУРА

Рис. 12. Ток якоря x4(t)

Saravanathamizhan, R., Paranthaman, R., and Balasubrama-nian, N. Tanks in Series Model for Continuous Stirred Tank Electrochemical Reactor // Industrial & Engineering Chemistry Research. - 2018. - No. 47(9). - P. 2976-2984. Flores-Tlacuahuac, A., and Grossmann, I.E. Simultaneous Cyclic Scheduling and Control of a Multiproduct CSTR // Industrial & Engineering Chemistry Research. - 2006. -No. 45(20). - P. 6698-6712.

АНАЛИЗ И СИНТЕЗ СИСТЕМ УПРАВЛЕНИЯ

3. Li, S., Sun, H., Yang, J., and Yu, X. Continuous Finite-Time Output Regulation for Disturbed Systems under Mismatching Condition // IEEE Trans. Autom. Control. - 2015. - No. 60(1). - P. 277-282.

4. Lagos, B., and Cipriano, A. Performance Evaluation of a Distributed MPC Strategy Applied to the Continuous Stirred Tank Reactor // IEEE Latin America Transactions - 2015. -No. 13(6). - P. 1921-1926.

5. Delbari, M,. Salahshoor, K., Moshiri, B. Adaptive Generalized Predictive Control and Model Reference Adaptive Control for CSTR Reactor // 2010 Intelligent Control and Information Processing (ICICIP). - Dalian, China, 2010. - P. 165-169.

6. Al-Jehani, N.A., Nounou, H.N. and Nounou, M.N. Fuzzy Control of a CSTR Process // Mechatronics and its Applications, 2012. - P. 1-6.

7. Antonelli, R., and Astolfi, A. Continuous Stirred Tank Reactors: Easy to Stabilise // Automatica. - 2003. - No.39 (10). - P. 1817-1827.

8. Graichen, K., Hagenmeyer, V., and Zeitz, M. Design of Adaptive Feedforward Control under Input Constraints for a Benchmark CSTR Based on a BVP solver // Computers and Chemical Engineering. - 2009. - No. 33(2). - P. 473-483.

9. Chiu, C.S. Derivative and Integral Terminal Sliding Mode Control for a Class of MIMO Nonlinear Systems // Automatica. - 2012. - No. 48(2). - P. 316-326.

10. Zhao, D., Zhu, Q., and Dubbeldam, J. Terminal Sliding Mode Control for Continuous Stirred Tank Reactor // Chemical Engineering Research and Design. - 2015. - No. 94. - P. 266274.

11. Ma, H., Wu, J., and Xiong, Z. A Novel Exponential Reaching Law of Discrete-Time Sliding-Mode Control // IEEE Transactions on Industrial Electronics. - 2017. - No. 64(5). -P. 3840-3850.

12. Ma, H., Wu, J., and Xiong, Z. Discrete-Time Sliding-Mode Control with Improved Quasi-sliding-mode Domain // IEEE Transactions on Industrial Electronics. - 2016. - No. 63(10). -P. 6292-6304.

13. Yan, X.-G., Spurgeon, S.K. and Edwards, C. State and Parameter Estimation for Nonlinear Delay Systems Using Sliding Mode Techniques // IEEE Transactions on Automatic Control. - 2013. - No. 58(4). - P. 1023-1029.

14. Boudjellal, M., and Illoul, R. High-Order Sliding Mode and High-Gain Observers for State Estimation and Fault Reconstruction for a Nonlinear CSTR // 6th International Conference on Systems and Control (ICSC). - Batna, Algeria, 2017. - P. 231-236.

15. Ignaciuk, P. Nonlinear Inventory Control with Discrete Sliding Modes in Systems with Uncertain Delay // IEEE Transactions on Industrial Informatics. - 2014. - No. 10(1). -P. 559-568.

16. Ma, L., Zhao, D, and Spurgeon, S.K. Disturbance Observer Based Discrete Time Sliding Mode Control for a Continuous Stirred Tank Reactor // 15th Workshop on Variable Structure Systems, 2018. - P. 372-377.

17. Chen, W.H., Yang, J., Guo, L., and Li, S. Disturbance-Observer-Based Control and Related Methods: An Overview // IEEE Transactions on Industrial Electronics. - 2016. -No. 63(2). - P. 1083-1095.

18. Rios, H., Efimov, D., Moreno, J.A., and Perruquetti, W. Time-Varying Parameter Identification Algorithms: Finite and Fixed-Time Convergence // IEEE Transactions on Automatic Control. - 2017. - No. 62(7). - P. 3671-3678.

19. Уткин В.А., Уткин А.В. Задача слежения в линейных системах с параметрическими неопределенностями при неустойчивой нулевой динамике // Автоматика и телемеханика. - 2014. - № 9. - С. 62-81. [Utkin, V.A., Utkin, A. V. Problem of Tracking in Linear Systems with

Parametric Uncertainties under Unstable Zero Dynamics //Autom. Remote Control. - 2014. - Vol. 75, no. 9. - P. 15771592].

20. Krasnova, S.A., and Utkin, A.V. Sigma Function in Observer Design for States and Perturbations // Automation and Remote Control. - 2016. - No. 77(9). - P. 1676-1688.

21. Краснова С.А., Уткин В.А., Уткин А.В. Блочный подход к анализу и синтезу инвариантных нелинейных систем слежения // Автоматика и телемеханика. - 2017. - № 12. -С. 26-53. [Krasnova, S.A., Utkin, V.A., Utkin, A.V. Block Approach to Analysis and Design of the Invariant Nonlinear Tracking Systems // Autom. Remote Control. - 2017. -Vol. 78, no. 12. - P. 2120-2140].

22. Han, J.S., Bahn, W., and Kim,T.I. Decoupled Disturbance Compensation under Control Saturation with Discrete-Time Variable Structure Control Method in Industrial Servo Systems // The 16th International Conference on Control, Automation and Systems. - Gyeongju, Korea, 2016. -P. 1453-1457.

23. Wu, W. Nonlinear Bounded Control of a Nonisothermal CSTR // Industrial and Engineering Chemistry Research. - 2000. -No. 39(10). - P. 3789-3798.

24. Уткин А.В., Уткин В.А. Синтез систем стабилизации при односторонних ограничениях на управляющие воздействия // Проблемы управления. - 2020. - № 3. - С. 3-4. [Utkin, A.V., Utkin, V.A.The Synthesis of Stabilization Systems under One-Sided Restrictions on Control Actions // Control Sciences. - 2020. - No. 3. - P. 3-14. (InRussian)].

25. Антипов А.С., Краснова С.А. Блочный синтез системы слежения для двухроторной электромеханической системы при ограничениях на переменные состояния // Прикладная маткматика и механика. - 2021. - № 85(1). -С. 3-20. [Antipov, A.S., Krasnova, S.A. Block-Based Synthesis of a Tracking System for a Twin-Rotor Electromechanical System with Constraints on State Variables // Mech. Solids. 2021. - Vol. 56, no. 7. - Р. 43-56.].

26. Дракунов С.В., Изосимов Д.Б., Лукьянов А.Г. и др. Принцип блочногоуправления. I // Автоматика и телемеханика. - 1990. - No. 5. - С. 3-13. [Drakunov, S.V., Izosimov, D.B., Luk'yanov, A.G., et al. The Block Control Principle. I // Automation and Remote Control. - 1990. -Vol. 51, no. 5. - P. 601-609].

27. Чиликин М.Г., Ключев В.И., Сандлер А. С. Теория автоматизированного электропривода. - М.: Энергия, 1979. [Chilikin, M.G., Klyuchev, V.I., Sandler, A.S. Teoriya avtomatizirovannogo ehlektroprivoda. - M.: Energiya, 1979. (InRussian)].

28. Краснова С.А., Уткин В.А. Каскадный синтез наблюдателей состояния динамических систем. - М.: Наука, 2006. -272 с. [Krasnova, S.A., Utkin, V.A. Cascade Synthesis State Observer of Dynamical System. - M.: Nauka, 2006. - 272 p. (In Russian)].

Статья представлена к публикации членом редколлегии

В.Н. Афанасьевым.

Поступила в редакцию 24.05.2021, после доработки 28.07.2021.

Принята к публикации 24.08.2021.

Гулюкина Светлана Игоревна - мл. науч. сотрудник

Hgulyukina.s.i@mail.ru,

Уткин Виктор Анатольевич - д-р техн. наук

H vicutkin@ipu. ru,

Институт проблем управления им. В.А. Трапезникова РАН,

г. Москва.

АНАЛИЗ И СИНТЕЗ СИСТЕМ УПРАВЛЕНИЯ

A BLOCK APPROACH TO CSTR CONTROL UNDER UNCERTAINTY, STATE-SPACE AND CONTROL CONSTRAINTS

S.I. Gulyukina1 and V.A. Utkin2

Trapeznikov Institute of Control Sciences, Russian Academy of Sciences, Moscow, Russia gulyukina.s.i@mail.ru, 2Hvicutkin@ipu.ru

Abstract. This paper designs a control law to maintain the temperature in the jacket of a continuous stirred tank reactor (CSTR). The standard mathematical model describing the reactor operation is extended by introducing the actuator's dynamics. The state-space and control constraints are considered by a nonlinear change of the variables of the plant's initial model using linear sat functions. In the transformed system, these constraints are considered by feedback control law design. The block approach allows linearizing the feedback control law by sequentially solving the first-order design subproblems. Under incomplete information on the state vector and the effect of exogenous disturbances, an observer of the state vector and disturbances is constructed to estimate the unknown signals with a given accuracy. The effectiveness of the proposed approach is illustrated by simulating the CSTR-DC motor system in MATLAB.

Keywords: CSTR, tracking problem, block approach, observer of state vector and disturbances, statespace and control constraints.

Funding. This work was supported by the Russian Foundation for Basic Research, project no. 20-01-00363 A.

i Надоели баннеры? Вы всегда можете отключить рекламу.