Исследование оптимального и скользящего режимов управления с релейным элементом, охваченным обратной связью

Шилин Александр Анатольевич; Букреев Виктор Григорьевич

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2014 Управление, вычислительная техника и информатика № 3 (28)

УДК 681.5.01:62-50

А.А. Шилин, В.Г. Букреев

ИССЛЕДОВАНИЕ ОПТИМАЛЬНОГО И СКОЛЬЗЯЩЕГО РЕЖИМОВ УПРАВЛЕНИЯ С РЕЛЕЙНЫМ ЭЛЕМЕНТОМ,

ОХВАЧЕННЫМ ОБРАТНОЙ СВЯЗЬЮ

Рассматривается метод синтеза оптимального управления линейным объектом второго порядка в системе с релейным элементом, охваченным обратной связью. Получено необходимое условие возникновения скользящего режима. Созданный алгоритм управления обладает робастным свойством при интервальных изменениях параметров объекта. Результаты подтверждаются математическим моделированием и экспериментальными исследованиями на действующей теплообменной системе промышленного типа.

Ключевые слова: релейный элемент с обратной связью; оптимальное управление по быстродействию; скользящий режим.

Статья посвящена развитию методов синтеза систем с релейным элементом, охваченным обратной связью, при решении задач конструирования оптимального управления различными техническими системами. Один из вариантов практического применения релейного регулятора для линеаризованных систем рассматривается в [1], где предлагается аппроксимация характеристик релейного элемента линейным уравнением. Работоспособность такого подхода подтверждается промышленной эксплуатацией распространенных аналоговых регуляторов Р-21, Р-29, РП-4, теория синтеза которых достаточно полно представлена в литературе [2, 3]. Использование многофункциональной нелинейной обратной связи в структуре релейного элемента промышленных регуляторов создает предпосылки повышения качества управления сложными динамическими объектами [4, 5].

Определенный теоретический интерес представляют системы с разрывным управлением, функционирующие в скользящем режиме и учитывающие изменение реальных характеристик релейного регулятора (С.В. Емельянов, В.И. Уткин, В.А. Уткин и др.). В классическом исполнении моменты переключения релейного элемента не являются изолированными, и количество переключений регулятора теоретически стремится к бесконечности. Уменьшение количества переключений возможно путем введения гистерезиса в релейную характеристику или запаздывания управляющего воздействия [6]. Другим эффективным способом уменьшения количества переключений является выбор пары управляющих сигналов (-1,0) или (0,1) вместо классической пары (-1,1) при условии, что фазовые траектории для данных пар сигналов направлены к траектории скольжения. Авторами реализован релейный метод управления в скользящем режиме без зоны нечувствительности [7], позволяющий получить минимальное количество переключений для объекта второго порядка:

Г х = х2,

\ 1 (1)

[х2 = -к(х) • х2 + g(х) • и(1),

где функции к(х) = к0(х)/Т0ъ, g(x) = кр(х)/Трг являются положительными и определяются состоянием системы к0(х) и кр(х); ТоЬ и Трг - постоянные времени объекта и исполнительного привода.

Такая модель часто применяется для объектов в теплоэнергетике с трехпозиционным электромеханическим клапаном в качестве исполнительного устройства и управлением и е (-1,0,1). Отметим особенность управления, где вместо функции sign(x) используется скалярная функция, обладающая свойством гистерезиса:

sign(х), если |Х > 5, у = ^(х,5) = <! 0, если (х ■ х_х) < 0, (2)

у_х, если ((х■ х_х) > 0) л (|х| <5).

Значение у_1 определяется на предыдущем шаге вычисления, так как характеристика гистерезиса предполагает запоминание прошлого состояния. Длительность дискретизации вычисления должна быть значительно меньше постоянной времени объекта. Значение управления определяется выражением

и ^) = г\(а1 ■х^) + х2(0,5). (3)

На рис.1, а представлены фазовые траектории а,Ъ,е,с1,е для различных значений функции g(x), и для выделения характера управления в виде пары сигналов (0,1) введён фрагмент траекторий а и е.

Рис. 1. Результаты моделирования в скользящем режиме с подстройкой а1

Отметим, что фазовая траектория е объекта имеет свойство притяжения к траектории скольжения при втором ее пересечении. Следовательно, возможно предположение, что для заданного положения объекта (1) в фазовой плоскости (х1(^0), х2(^0)) существует такое значение параметра траектории скольжения а! в (3), при котором второе пересечение фазовой траектории объекта будет в малой окрестности точки равновесного состояния. В этом случае, при стремлении 5^0, имеет место одно переключение на противоположный знак управления вне окрестности точки равновесного состояния, что соответствует оптимальному управлению по быстродействию. Практический интерес представляют методы управления, обладающие робастными свойствами в скользящем режиме и оптимальными по быстродействию при некоторых стационарных условиях функционирования объекта. Так, в работе [8] рассматриваются алгоритмы, совмещающие скользящий режим с оптимальным управлением в форме отрицательной обратной связи, а в работе [9] получена аппроксимация параметра а^х^), х2(^0), к, g) для стационарного линейного объекта. Результаты моделирования, представленные на рис. 1, Ъ, подтверждают существование параметра траектории скольжения а1 для стационарных условий, где g и к известны и неизменны, что обеспечивает оптимальную по быстродействию траекторию движения объекта из заданных точек на фазовой плоскости. Таким образом, есть основание полагать, что управление (3) с вычислением параметра а^х^), х2(^0)) для стационарного объекта гарантирует оптимальное управление по быстродействию. В остальных же случаях, когда выполняется неравенство g(x) > g или к(х) > к, следует скользящий режим. В частности, на рис. 1, Ъ выделена окрестность в точке равновесия, где наблюдается скользящий режим, вызванный погрешностью вычисления параметра а\. Следует отметить, что реализация управления (3) на микроконтроллерах с

Ъ

а

малой разрядностью аналого-цифрового преобразователя (АЦП) вызывает большие затруднения при необходимости оценки производной измеренного значения х^).

1. Постановка задачи

Рассмотрим замкнутую систему управления для объекта (1) с регулятором на релейном элементе и обратной связью, структуру которого можно представить в виде уравнений

и = ^(х3 - х1,5),

Г-а3 • х3, если и = 0, (4)

х3 =-

-к3 • и, если и Ф 0,

где дополнительная переменная х3 описывает динамические свойства обратной связи релейного элемента с учетом положительности значений параметров а3 и к3. Синтез управления не предполагает использование переменной х2, следовательно, не требуется оценка производной от измеренного значения х\. Таким образом, в системе (4) наблюдается контур с отрицательной обратной связью, где организуется стремление переменной х3 к переменной х! при активном управлении и Ф 0 . Очевидно, этот контур будет устойчивым при любых к3>0, так как имеет первый порядок и при отсутствии управления и = 0 переменная х3 стремится к нулю. Параметры модели объекта и звена обратной связи в общем случае могут быть нелинейными и нестационарными, представленными соответствующими функциями к(х, 1), g(x, 1), а3(х, 1), к3(х, 1). Рассмотрим возможность реализации для объекта (1) с управлением (4) скользящего режима, а также оптимального управления по быстродействию в случае линеаризованного стационарного объекта.

2. О существовании скользящего режима

Утверждение. Для замкнутой системы (1) и (4) возможно существование траектории скольжения вида

5 = ах (1, х(^))■ х + х2 = 0, (5)

где а5 (1, х(10)) > 0У1 е (1 > 10), если выполняются необходимые условия

| х1(10) = (6)

I а3 > а5 (1).

Доказательство. Предположим, что 5 > о, где о - бесконечно малое положительное число, но не равное нулю. Введем функцию

4(1) = ----, (7)

Т(иФ0) + Т(и=0)

которая представляет собой скважность активного управления при заданных временных отрезках, соответствующих одному периоду автоколебания, вызванного наличием гистерезиса со значением 5. Предел этой функции Ншд(1) ^ г(1) стремится к конечному числу г, которое принимает значения в

5^а

диапазоне (0,1) и может рассматриваться в качестве эквивалентного управления [6]. Тогда модель замкнутой системы для х1(10) > 0 можно записать в виде дифференциальных уравнений

х = х2 = _а^ (1) ■ х1,

х2 =-к( х) ■ х2 +g (х) -4( х), (8)

х3 = -а3 ■ (1 - д( 1)) ■ х1 + к3 ■ д( 1).

Дифференциальные уравнения (8) при заданных начальных значениях фазовых переменных х3(10) = х1(10) = с1, х2(10) = а5 (10) ■ с2 имеют единственное решение относительно функции а5(1) на основе предположения, что функция 4(1) является эквивалентным управлением (4), которое обеспечивает выполнение условия режима скольжения |х3 _х^ <с . Следовательно, при бесконечно малом о и равенстве х! = х3 из уравнения а5 (1) ■ х1 = а3 ■ (1 - 4(1)) ■ х1 - к3 ■ 4(1) можно получить условие

а3 - а5 (1)

4(1) = 3 / < 1,

а3 + к3 / х1

где решение относительно х\(1) имеет положительное значение на всей траектории скольжения. Аналогичным образом для условия х!(10)<0 можно записать дифференциальные уравнения замкнутой системы в виде

' х = х2 = -а, (1) ■ х1,

< ^2 = -к(х) ■ х2 - g(х) ■ 4(х), (9)

х3 = ~а3 ■ (1 - 4( 1)) ■ х1 - к3 ■ 4( 1).

Решение системы дифференциальных уравнений (9) позволяет записать

а3 - а5 (1)

4(1) = 3 / < 1,

а3 - к3 / х1

где переменная состояния х^О имеет отрицательные значения по всей траектории скольжения. Таким образом, для рассматриваемых случаев можно записать равенство

а3 - а (1)

4(1) = 3 , л I < 1.

а3 + к3 / х^

Следовательно, выполнение условия (6) предполагает положительно определенные значения 4(1) на интервале [0...1]. Отметим, что выбор значения а3 определяется условиями существования классического скользящего режима [6], и утверждение (6) свидетельствует о том, что скользящий режим (5) в системе (4) будет косвенно определяться параметрами объекта. Следовательно, о робастных свойствах системы можно говорить только с точки зрения асимптотической устойчивости.

3. Реализация оптимального управления по быстродействию

Апробацию предложенного алгоритма оптимального управления рассмотрим на основе стационарного линейного объекта (1) при условиях g(x) = g, к(х) = к. Предположим, что до момента появления возмущающего воздействия система была установлена в нулевой точке равновесного состояния. При появлении возмущений в системе переменная х1 принимает некоторое положительное значение х1 (10) = С\ и в соответствии с уравнениями (4) управление будет равно и = -1. Решение дифференциального уравнения замкнутой системы определяется выражениями (1), (4) и отражает встречное движение переменных х1 и х3 до момента переключения знака управления, в результате чего переменная х2 становится равной некоторому значению. Предположим, что параметр к3 подобран таким образом, что в первоначальной точке переключения управления выполняется неравенство |х2| > к3. Это означает, что после первого переключения управляющего сигнала в системе не будет возникать скользящий режим и на определенном интервале времени выполняется равенство и = +1. Повторное достижение фазового состояния системы траектории скольжения в точке равновесия является условием завершения переходного процесса. Следовательно, актуальной задачей является определение значения параметра к3, обеспечивающее оптимальное управление по быстродействию. Рассмотрим оптимальное управление на примере модели объекта (1), полученное на основе принципа максимума Понтрягина. Переходный процесс представлен на рис. 2, а.

Рис. 2. Переходный процесс переменных состояния в системе с оптимальным регулятором

Переходный процесс переменной х3, определяемый вторым дифференциальным уравнением с управлением (4), организуется таким образом, чтобы момент переключения 11 соответствовал первому уравнению (4). При условии и() Ф 0 коэффициент к3 характеризует скорость изменения переменной х3, которая функционально зависит от знака сигнала оптимального управления, например:

к3(и = -1) = 0,29/85 = 3,4 •10-3(1/ с), к3(и = +1) = 0,29 / 43 = 6,7 • 10-3(1/ с).

При моделировании переходных процессов в функции от других начальных условий

х1(10)е (0,2;0,4;0,6;0,8;1) обнаружилось, что скорость изменения переменной х3 будет определяться

знаком произведения sign(x1(t)•u(t)) и начальными значениями х^0) = Сь В этом случае уравнения регулятора (4) принимают вид

и = ^(х3 - хх, 5),

-а3 • х3, если и = 0,

-1 (10) -и • (Тр1 (С)) , если sign(u • х1) < 0,

-и • (Тр2(С ))-1, если sign(u • хх) > 0.

Причина возникновения такого явления и методы вычисления зависимостей (10) исследовалась авторами статьи в [9]. Получение в аналитической форме отображения параметров , к, С1) объекта в параметры регулятора (ТрЬ Тр2) остается открытой задачей, поэтому рассмотрим аппроксимацию данных функций, построенных на результатах частных решений, например методом Фельдбаума (см. рис. 2, Ь):

С = к • а • к-1

^шах л’тх <5 п ?

Тр2 = (кр20 + кр21 • Сшах/С1 ) ' Т , (11)

Тр1 = (кр10 + кр11 • С1/Сшах ) ' Тр2,

где ктх, кр10, крц, кр20, кр21 - коэффициенты аппроксимации. Для экспериментального объекта с параметрами а = 1,35°С/с, к = 30-1 с-1 функции (11) принимают явный вид

Сшах = 4,49 • 1,35 • 30 = 7,68,

Тр2 = 2,66 + 7,68/Си

Тр! =(1,28 + 0,036 • С1 )-Тр 2.

Значение коэффициента а3 в оптимальном регуляторе для стационарного объекта непосредственно не влияет на переходный процесс, однако он определяет робастные свойства и режим скольжения по траектории (5) при изменении параметров объекта. Влияние запаздывания т«10 с по

управлению и (^ -т) приводит к возникновению скользящего режима в конце переходного процесса (рис. 3, а). На рис. 3, Ь приведены результаты моделирования для объекта, где значение Трг увеличено в три раза, что эквивалентно уменьшению коэффициента усиления в системе [10].

2 *1 *3 ^

“1 1 *3 Г [

V

А г, С

0 20 40 60 80 100 120

а

2 Х3 и,

0 20 40 60 80 100 120

Ъ

Рис. 3. Переходные процессы в скользящем режиме

В этом случае параметры регулирования не будут соответствовать оптимальным значениям, однако наблюдается скользящий режим и обеспечиваются робастные свойства предлагаемого метода синтеза регулятора.

Результаты моделирования стационарного объекта при начальном условии |х1 (^0)| = 10°С представлены в виде переходных процессов на рис. 4, а.

а Ь

Рис. 4. Результаты моделирования и эксперимента оптимального управления:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 - сплошная линия хі(ґ); 2 - штрихованная х3(ґ); 3 - пунктирная и(ґ); 4 - штрих-пунктирная х1РЮ(ґ) - переходный процесс, полученный для ПИД-регулятора в форме отрицательной обратной связи по состоянию полностью наблюдаемой системы

В частности, для начального значения х^) = -10°С управление соответствует принципу максимума Понтрягина, длительность переходного процесса составляет не более 30 с. Экспериментальные исследования выполнены на контроллере ВЭСТ-01М [11] действующей теплообменной системы, в котором реализованы метод управления (10) и средства сохранения усредненных значений временных рядов хь х3, и. Результаты исследования отражают присутствие в измеряемой х! случайной составляющей и значительные ошибки дискретизации схемы измерения (рис. 4, Ь). При этом качество управления системой практически не изменилось и можно предположить, что метод синтеза оптимального управления (10) имеет необходимый ресурс для организации управления системами с запаздыванием и помехами в канале измерения.

Таким образом, можно сделать вывод, что отображение параметров (а, к, С1) объекта управления в параметры (ТрЬ Тр2) регулятора (10) по аппроксимирующим формулам (11) гарантирует в стационарных условиях оптимальный по быстродействию переходный процесс для начальных условий х1 = С1, х2 = х3 = 0, где С1 е (0, Сшах).

Заключение

Для рассмотренного метода синтеза управления с релейным элементом, охваченным обратной связью (10), эффективно реализуемого на микропроцессорных устройствах, предложено функциональное преобразование (11) параметров объекта в параметры регулятора, что позволяет обеспечить настройку замкнутой системы по экспериментально полученным переходным процессам. Для объекта с известными и стационарными параметрами обеспечивается оптимальное управление по быстродействию без вычисления кривой переключения в фазовом пространстве (см. рис. 4). Метод обладает робастными свойствами при изменении параметров объекта в определенных пределах (см. рис. 3, Ь) и не требует оценки производной измеренного сигнала. В случае транспортного запаздывания в системе рассматриваемый релейный регулятор формирует квазиоптимальное управление со скользящим режимом (рис. 3, а). Метод реализован на недорогом 8-разрядном процессоре с 10-разрядным АЦП на контроллере ВЭСТ-01 М и успешно используется в регуляторах температуры теплообменных систем.

ЛИТЕРАТУРА

1. Стефани Е.П. Основы расчета настройки регуляторов теплоэнергетических процессов. М. : Энергия, 1972. 376 с.

2. Клюев А.С. и др. Проектирование систем автоматизации технологических процессов. М. : Энергоатомиздат, 1990. 464 с.

3. Новиков С.И. Оптимизация автоматических систем регулирования теплоэнергетического оборудования. Ч. 2 : Аналого-

вые регулирующие устройства и реализация АСР : учеб. пособие. Новосибирск : Изд-во НГТУ, 2006. 84 с.

4. Пат. РФ N 1798764, G 05 В 11/14, 1992 г.

5. Пат. RUN 2150726, С1 G05B11/14, 2000 г.

6. Уткин В.И. Скользящие режимы и их применение в системах с переменной структурой. М. : Наука, 1974. 240 с.

7. Шилин А.А., Букреев В.Г. Исследование трехпозиционного релейного регулятора температуры в скользящем режиме ра-

боты // Доклады ТУСУРа. 2012. № 1 (часть 2). С. 251-257.

8. RongXu, B.S. Optimal sliding mode control and stabilization of under-actuated systems: Dissertation PhD. The Ohio State Uni-

versity, 2007. 153 с.

9. Шилин А.А., Букреев В.Г. Динамическое определение траектории скольжения при релейном управлении нелинейным объ-

ектом // Проблемы управления. 2013. № 5. С. 22-28.

10. Шилин А.А., Букреев В.Г., Койков К.И. Математическая модель нелинейной теплообменной системы с запаздыванием // Приборы и системы. Управление, контроль, диагностика. 2013. № 6. С. 15-22.

11. НПО ВЭСТ Автоматический регулятор теплопотребления ВЭСТ-01М. URL: http://npowest.ru/6-instrukcii-po-ekspluatacii-priborov.html

Шилин Александр Анатольевич, канд. техн. наук, доцент. E-mail: [email protected] Букреев Виктор Григорьевич, д-р техн. наук, профессор. E-mail: [email protected]

Томский политехнический университет Поступила в редакцию 1 июня 2014 г.

Shilin Alexander A., Bukreev Viktor G. (Tomsk Polytechnic University, Tomsk, Russian Federation).

Research and optimal sliding mode control switching element covered feedback.

Keywords: relay element with feedback; speed optimal control; sliding mode.

This paper considers the organization of optimal and sliding modes in control system for non-stationary second order object with parameters that change on some interval. The main object of the control system is the three-position relay controller with feedback and defined area of the hysteresis. The article proves the optimal control problem for stationary objects on stage of achieving slip trajectory when there is a pair of control signals (-1, 0) or (0, 1).

The proposed functional transformation of the object parameters into the controller parameters allows setting up closed system using the experimental transients. The method provides time-optimal control without calculating the switching curve in the phase space for an object with known and stationary parameters. The method has robust properties when object parameters vary within certain limits and does not require estimates of the derivative of the measured signal. In case of transport delay in the system, the relay controller generates a quasi-optimal control with sliding mode. The necessary condition for the existence of a sliding mode indicates indirect dependence of sliding trajectory parameters from the object parameters and robust properties of the system in terms of asymptotic stability.

Time-optimal control is confirmed by modeling and experiments on the existing heating system of industrial type. The presence of delay and object transfer coefficient triple modification lead to the sliding mode with a pair of signals (-1, 0) or (0, 1).

REFERENCES

1. Stefani Ye.P. Osnovy rascheta nastroyki regulyatorov teploenergeticheskikh protsessov [Basis of calculation of heat and power

regulators setting processes]. Moscow: Energiya Publ., 1972. 376 p.

2. Klyuev A.S. Proektirovanie sistem avtomatizatsii tekhnologicheskikh protsessov [Design process automation systems]. Moscow:

Energoatomizdat Publ., 1990. 464 p.

3. Novikov S.I. Optimizatsiya avtomaticheskikh sistem regulirovaniya teploenergeticheskogo oborudovaniya. Ch. 2: Analogovye

reguliruyushchie ustroystva i realizatsiya ASR [Optimization of automatic control systems of thermal power equipment. Part 2. Analog regulating device and the ACP]. Novosibirsk: NSTU Publ., 2006. 84 p.

4. Patent RF N 1798764, G 05 В 11/14, 1992.

5. Patent RF N 2150726, С1 G05B11/14, 2000.

6. Utkin V.I. Skol'zyashchie rezhimy i ikh primenenie v sistemakh s peremennoy strukturoy [Slide modes and their application in

systems with variable structure]. Moscow: Nauka Publ., 1974. 240 p.

7. Shilin A.A., Bukreev V.G. Research of three-position relay control the temperature in the sliding mode. Doklady TUSURa, 2012,

no. 1 (pt. 2), pp. 251-257. (In Russian).

8. Rong Xu.B.S. Optimal sliding mode control and stabilization of under-actuated systems: Dissertation PhD. The Ohio State Uni-

versity, 2007. 153 p.

9. Shilin A.A., Bukreev V.G. Dynamic determination of sliding trajectory in relay control of nonlinear oject. Problemy upravleniya -

Control Science, 2013, no. 5. pp. 22-28. (In Russian).

10. Shilin A.A., Bukreev V.G., Koykov K.I. Mathematical model of the nonlinear heat transfer system with delay. Pribory i sistemy. Uprav-lenie, kontrol', diagnostika - Instruments and Systems: Monitoring, Control, and Diagnostics, 2013, no. 6, pp. 15-22. (In Russian).

11. NPO VEST. Automatic control of heat consumption VEST-01M. Available at: http://npowest.ru/6-instrukcii-po-ekspluatacii-priborov.html

Research and optimal sliding mode control switching element covered feedback

Текст научной работы на тему «Исследование оптимального и скользящего режимов управления с релейным элементом, охваченным обратной связью»