Динамическое определение траектории скольжения при релейном управлении нелинейным объектом

Шилин Александр Анатольевич; Букреев Виктор Григорьевич

А

нализ и синтез систем управления

УДК 681.5:513.52

ДИНАМИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ТРАЕКТОРИИ СКОЛЬЖЕНИЯ ПРИ РЕЛЕЙНОМ УПРАВЛЕНИИ НЕЛИНЕЙНЫМ ОБЪЕКТОМ

A.A. Шилин, В.Г. Букреев

Предложен метод перенастройки параметра траектории скольжения при релейном управлении нелинейным объектом. Показана однозначная зависимость данного параметра от начального положения объекта управления на фазовой плоскости для двух методов синтеза: согласно одному из них — оптимальным образом обеспечивается область притяжения, согласно другому — выполняются условия оптимального по быстродействию управления с помощью принципа максимума Понтрягина.

Ключевые слова: нелинейный объект, релейное управление, траектория скольжения.

ВВЕДЕНИЕ

Динамическое движение многих нелинейных объектов управления с релейным управлением может быть представлено системой дифференциальных уравнений второго порядка

х 1 (t) = x2(t), х2 (t) = h(x) + g(x)u(t),

(1)

где хД?) и х2(?) — переменные состояния объекта;

А(х) и £(х) нелинейные положительные функции; т

х = [хр х2] — вектор-строка переменных состояния объекта управления; и(?) — управляющее воздействие, формируемое как

u(t) = —signs(t), s(t) = fl1x1(t) + x2(t) = 0,

(2)

где функция ^(х) описывает траекторию скольжения в фазовом пространстве; ах — параметр, позволяющий сформировать траекторию для выполнения условий скользящего режима [1].

Для построения релейного управления данными объектами применяются два метода синтеза: организация скользящего режима [2, 3] и оптимальное по быстродействию управление, синтезированное на основе принципа максимума Л.С. Понтрягина

[4, 5]. Рассматривая коэффициент ах в качестве подстраиваемого параметра и полагая, что существует гладкая функция с ограничением вида

а1 = f(x1, х2, h, g) > 0,

(3)

можно предположить, что уравнения (2) будут соответствовать оптимальному управлению по быстродействию. Для выполнения условия оптимизации или его оценки необходимо иметь решение системы (1) во всем пространстве изменения переменных состояния, позволяющее вычислить функцию (3). В аналитическом виде получить функцию вида (3) достаточно сложно, даже если предположить, что А(х) и £(х) — линейные стационарные функции.

Кроме того, при организации скользящего движения появляются робастные, по отношению к функциям А(х) и £(х) свойства, где функция (3), определяющая траекторию скольжения, замещается константой аг Известно [1], что значение константы ах должно удовлетворять неравенству:

а1 х2 (t) + h (х)

g (х)

< 1 Vx е ^

2

(4)

Учет условия (4) предполагает знание априорного значения параметра ах, которое может определяться максимальным значением |х2(?)|. Очевидно, что в условиях малых отклонений от точки

равновесного состояния, когда максимально возможное значение |х2(?)| стремится к нулю, ограничение сверху для значений параметра ах также ослабляется. Из этих рассуждений можно сделать выводы:

— значение параметра ах может выбираться, исходя из положения объекта управления на фазовой плоскости;

— для любого значения ах существует область в окрестности точки (х1(/) = 0; х2(?) = 0}, где однозначно обеспечивается притяжение к траектории скольжения.

1. ПОСТАНОВКА ЗАДАЧИ

Рассмотрим устойчивый объект с управлением вида (2), математическая модель которого представляется системой уравнений

х1 (?) = х2(?), х2 (?) = —й(х)х2(?) + £(х)м(?), (5)

где й(х) = 1/То(х); £(х) = £0(х)/Г0(х) и ^(х), То(х) — коэффициент передачи и функция инерции объекта управления. Такой моделью описывается, например, значительный класс теплообменных систем с электроприводом регулирующего клапана расхода теплоносителя в качестве исполнительного устройства [6]. Организуя релейное управление вида (2), можно использовать коэффициент иДх) в качестве подстраиваемого параметра траектории скольжения для обеспечения максимального быстродействия. В случае необходимости выполнения требований по быстродействию и организации ро-бастного управления в реальном времени возникает задача динамического определения траектории скольжения в пространстве фазовых переменных состояния объекта.

2. АЛГОРИТМ РЕЛЕЙНОГО УПРАВЛЕНИЯ С ОПРЕДЕЛЕНИЕМ ПАРАМЕТРА ТРАЕКТОРИИ СКОЛЬЖЕНИЯ

Полагая, что в рамках переходного процесса параметр иДх) не изменяется, для обеспечения скользящего режима при движении изображающей точки с управлением вида (5) достаточно выполнить ограничения:

*!(*) = =Х# < ^(х) + ^ (Х)

Х1( ?) — |*2 (?)|

А1(Х)Х1(?) + Х2(?) = 0.

(6)

Минимальные значения функций йт1п(х) и &тш(-*) соответствуют предельным значениям параметров объекта управления.

На основании неравенства в системе (6) отметим, что для обеспечения скользящего режима во всем фазовом пространстве достаточным условием является выполнение неравенства иДх) < йтп(х), поскольку £т1п(х) — положительное число и второе слагаемое, по крайней мере, больше нуля.

В случае непосредственного измерения переменной состояния х2(?) появляется возможность динамической оценки параметра а1(-2) в реальном времени. Характерными для условия (6) являются точки в фазовом пространстве, где траектория движения объекта управления приближается к траектории скольжения. Наиболее адекватную оценку параметра а1(-2) можно получить при достижении траекторией объекта управления конкретной точки на кривой скольжения (второе уравнение системы (6)). Такое решение в динамике можно получить только последовательным приближением, кроме того, точность вычисления а1(-2) сильно зависит от качества измерения х2(?) (наличие помех, возмущений в измерительном канале). Этот вариант требует не только периодического изменения знака управления для проверки равенства иДх) = — --2 (?)/--1 (?) во время переходного процесса, но и значительных вычислительных ресурсов. Другим, наиболее эффективным вариантом, является определение а1(-1) при равенстве х2(?) = 0. В этом случае в течение одного переходного процесса в замкнутой системе значение а1(-1) не изменяется и равно постоянной величине. Для иллюстрации этого варианта рассмотрим область фазового пространства объекта управления (рис. 1) (выделена серым цветом), где для заданного значения х2(?) удовлетворяющего условию (6), обеспечивается притяжение к траектории скольжения. Правомерность условия (6) очевидна: касательная к траектории движения при управлении и(?) = —81§т(?) в характерной точке притяжения параллельна траектории скольжения.

Утверждение. Для минимальных значений функций £т-п(х) и йт1п(х), характеризующих объект управления (5), существует однозначное соответствие параметра и1(х) для точки в фазовом пространстве {х1(?) = х10(?), х2(?) = 0}, где х10(?) — значение переменной х1(?) состояния при условии х2(?) = 0, в которой выполняется неравенство (6).

На основании данного утверждения можно вычислить значение и1(х) как функцию и1(х) = /(х1(?),

Х\

1,5-

1,0-

0,5-

\ и = / и = С -1 \ 2, 0]

а\ X] [ + х2 = 0

-0,04 -0,02

0,02

0,04

х2

Рис. 1. Область притяжения при релейном управлении

Рис. 2. Зависимость траекторий скольжения от начальных условий

х2(/) = 0, Ат1п(х), ^^(х)) с известными граничными параметрами ^т1п(х) и Ат]п(х), позволяющее однозначно определить момент пересечения траектории объекта управления с траекторией скольжения на фазовой плоскости (рис. 2).

Алгоритм определения зависимости ^(х) = = Дх^О, х2(0 = 0, Ат1п(х), £т1п(х)) предполагает выполнение следующих этапов.

1. Решается дифференциальное уравнение (5) с заданными значениями ^т1п(х), ^т]п(х) и несколькими начальными условиями {х^О = х10/(0, х2(0 = 0}, где х10/(0 — /-е значение переменной х1(^) состояния при условии х2(0 = 0. В результате определяются криволинейные траектории, отражающие движение объекта управления в фазовом пространстве и соответствующие числу начальных условий.

2. На полученных криволинейных траекториях из неравенства (6) находятся такие значения параметра а1(х), для которых существуют точки пересечения фазовых траекторий и траекторий скольжения.

3. Определяются промежуточные значения а1(х) между значениями а1(х10/) с помощью интерполяционных методов. Исходя из предположения, что функция а1(х) гладкая и монотонная, предлагается использовать экспоненциальную функцию вида

а 1 (х)

С2(1

е"С3 Х1),

(7)

12

где с1, с2 и с3 — коэффициенты интерполяционной функции, вычисляемые в результате решения системы алгебраических уравнений по методу наименьших квадратов при фиксированных значениях £т1п(х) и ¿т!п(х).

Для проверки адекватности экспоненциальной функции (7) и зависимости а1(х) = f(х^/), х2(0 = 0, Лт1п(х), gmJx)) рассмотрим иллюстративный пример, в котором £т1п(х) и ^т1п(х) имеют следующие значения ^т1п(х) = 0,05 и ^т1п(х) = 0,01. Вычисленные методом наименьших квадратов коэффициенты с1, с2 и с3 функции (7) при этом принимают значения 2 = 0,0481, с2 = 0,0268, с3 = 0,575. В табл. 1

Таблица 1

Результаты вычисления значений параметра а1(х) и его оценки а г (х)

1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 10,0

а1/(х1)-10-3 3,66 2,91 2,6 2,42 2,32 2,24 2,19 2,15 2,12 2,1

а! (х)-10-3 3,64 2,98 2,6 2,39 2,28 2,21 2,17 2,15 2,14 2,13

Рис. 3. Дискретная подстройка параметра «1г(хх) Рис. 4. Иллюстрация робастных свойств релейного регулятора

приведены дискретные значения а1/(х1), полученные в результате решения дифференциального

уравнения (5), и оценки а 1 (х), полученные путем вычисления интерполяционной функции (7).

Сравнительный анализ результатов вычислений показывает хорошую точность аппроксимации значений а1/(х1) интерполяционной функцией (7), максимальная погрешность составляет не более 2,5 %.

Моделирование работы релейного регулятора (2) для объекта управления (5) отражает корректность вычисления параметра а1(х1) для каждого начального положения объекта управления на оси х1 и характеризует его способность динамически подстраивать траекторию скольжения для увеличения быстродействия. Видно (рис. 3), что для меньшего начального положения х1 параметр а1(х1) увеличивается, что соответствует меньшему времени переходного процесса.

При моделировании процессов выбрано начальное положение объекта управления в фазовом пространстве: {х10(?) = 8, х20(?) = 0}, которому соответствует значение параметра а1/(х1) (см. табл. 1).

Предполагается, что изменения параметров объекта управления приводят к возрастанию функций £(х) и Л(х) по некоторому закону (табл. 2).

Робастные свойства метода синтеза управления при изменениях параметров объекта управления подтверждаются результатами моделирования, позволяющими сделать заключение, что выбранный параметр а1{х10(?) = 8, х20(?) = 0} обеспечивает притяжение к траектории скольжения для всех Л(х) и £(х), удовлетворяющих условиям (рис. 4):

Л(х) > ^тт^^ £(х) > £тт(х).

3. АЛГОРИТМ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ОПРЕДЕЛЕНИЕМ ПАРАМЕТРА ТРАЕКТОРИИ СКОЛЬЖЕНИЯ ПО ПРИНЦИПУ МАКСИМУМА

Применяя теорему принципа максимума Пон-трягина о числе переключений к объекту управления вида (5), можно утверждать, что число воздействий будет равно двум с одной точкой переключения сигнала управления [5]. Предполагается, что для любого положения объекта управления на оси х1 фазового пространства имеется такое значение а1(х) для траектории скольжения, на ко-

Область изменения параметров д(х) и Л(х)

Таблица 2

Номер кривой 1 2 3 4 5 6 7 8 9 10

£(*) ■ 10-2 5 5,55 6,17 6,85 7,62 8,46 9,41 10,4 11,6 12,9

Н(х) ■ 10 2 1 1,11 1,23 1,37 1,52 1,69 1,88 2,09 2,32 2,58

Рис. 5. Фазовые траектории оптимального управления Рис. 6. Интерполяционная функция (8)

торой расположена точка переключения, соответствующая оптимальному управлению по быстродействию. Это означает, что возможно решение обратной задачи: определение параметра а1(х) траектории скольжения в зависимости от положения объекта управления на оси х1 фазового пространства.

Алгоритм вычисления соответствия а1(х) и х1

отличается от рассмотренного, поскольку в реализации принципа максимума функция переключения определяется по результатам вычисления фазовой траектории в обратном времени [7], и состоит из следующих этапов.

1. Решается система дифференциальных уравнений (5) с начальными условиями [0, 0] в обратном времени при значении и(/) = —1.

2. Для фазовой кривой из некоторого семейства в фиксированной точке [х1р, х2р] изменяется знак

управления и(/) и решается система дифференциальных уравнений (5) при управлении и(7) = 1 при условии пересечения с осью х1.

3. В момент пересечения фазовой кривой с осью ординат фиксируется значение х1 и устанавливается соответствие а1(х) = |х2р |/|х1р |.

Этапы 1—3 выполняются для различных точек кривой переключения, реализующей принцип максимума.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На рис. 5 дано графическое пояснение принципа и результаты вычислений.

Интерполяционная функция для вычисления параметра а1(х) достаточно сложного вида функции (рис. 6) может быть представлена выражением

а 1 (х1) = с1 + с2/х1 + с3х1 + с4 х

1

(8)

где с1, с2, с3 и с4 — ее коэффициенты, вычисляемые аналогично предыдущему случаю. Для рассмотренного в § 2 иллюстративного примера с параметрами объекта управления £т1п(х) = 0,05 и Лт1п(х) = 0,01 коэффициенты функции (8) принимают значения с1 = 0,0489360, с2 = 0,0139168, с3 = -0,0040255, с4 = 0,0002369.

Для реализации скользящего режима применялся алгоритм трехпозиционного управления [8] без зоны нечувствительности, обеспечивающий минимизацию числа переключений исполнительного устройства. Результаты моделирования показали, что притяжение траектории объекта управления к траектории скольжения обеспечивается со второго раза. В случае, если координаты точки пересечения с траекторией скольжения соответствуют значениям (х1(^) = 0, х2(/) = 0), то синтезируемое управление будет оптимальным по быстродействию. На рис. 7 приведены траектории оптимального управления, где наличие скользящего режима в окрестности точки |х1(^) = 0, х2(/) = 0} свидетельствует о неточном вычислении параметра с помощью а1(х) интерполяционной функции (8). Данный метод управления также обладает ро-

Рис. 7. Оптимальное управление двумя воздействиями

Рис. 8. Робастные свойства по отношению к А(х) и

бастными свойствами (рис. 8) при изменении параметров объекта управления или функций Л(х) и £(х) в ограниченной области.

Преимущество управления вида (2) с алгоритмами перенастройки параметра траектории скольжения демонстрируется результатами моделирования переходных процессов замкнутой системы во временной области. Так, на рис. 9 и 10 представлены переходные процессы переменной состояния х1(?), отражающие эффективность предлагаемых алгоритмов в смысле быстродействия.

Эффективность алгоритма релейного управления, предусматривающего определение параметра траектории скольжения, подтверждается моделированием на тестовом примере с данными реального объекта (см. рис. 9). Кроме того, управление с перенастройкой траектории скольжения, синтезированное на основе максимума Понтрягина, обладает более высоким быстродействием по

Рис. 9. Переходный процесс при релейном управлении: без вычисления .......и с вычислением-параметра а ^

Рис. 10. Сравнительная оценка регуляторов: .......— с вычислением оптимального параметра а I (х), обеспечивающего

режим скольжения;--с вычислением параметра а 1 (х) в

соответствии с принципом максимума Понтрягина

сравнению с релейным способом регулирования (см. рис. 10).

При определенных условиях предложенные алгоритмы управления можно применить в реальном времени протекания процессов в объектах вида (5). В частности, один из вариантов такого алгоритма заключается в следующем.

1. Предварительно, на основе априорных знаний о свойствах объекта управления, определяются диапазоны изменения его параметров и вычисляются значения функций £т1п(х) и йт{п(х).

2. Для ограниченного набора известных данных {х1(?) = хш(?), х2(?) = 0} решается система уравнений (5) и формируется ряд значений

а1г'(х) = Мо/^ х2(?) = 0 ^тт(х):' £тт(х)).

3. В соответствии с методом синтеза управления м(?) = —81§т(?) используется интерполяционная функция вида (7) или (8) и для вычисленного ряда значений а1г(х) определяются соответствующие коэффициенты данных функций путем решения системы алгебраических уравнений методом наименьших квадратов.

4. Последовательно вычисляются значения составляющих закона управления: интерполяционной функции а 1 (х), функции а также непосредственно управляющего воздействия м(?).

В зависимости от информационных ресурсов системы управления объектом все вычисления могут быть обеспечены в реальном времени протекающих процессов х1(?) и х2(?) непосредственно микропроцессорным контроллером или вычислительным устройством на нижнем уровне иерархии системы управления.

На этапе моделирования различных объектов управления все необходимые вычисления можно выполнить, например, в среде 8с1ЬаЪ, исходный код программ для необходимого исследования доступен в виде электронного ресурса [9].

ЗАКЛЮЧЕНИЕ

Рассмотренный метод формирования оптимального по быстродействию и робастного по отношению к изменениям характеристик объекта управления предполагает целенаправленную перенастройку параметра траектории скольжения релейного регулятора.

Применение интерполяционных функций позволяет построить релейное управление с определе-

нием параметра траектории скольжения по значениям {х1(?) = х1Ш(?), х2(?) = 0} в реальном времени. Работоспособность и эффективность алгоритма релейного управления с определением параметра траектории скольжения подтверждается исследованиями на тестовых примерах с данными реального нелинейного объекта. Перенастройка параметра траектории скольжения обеспечивает улучшение динамики процесса, что особенно важно для организации систем управления с быстрой реакцией на возмущающие воздействия.

ЛИТЕРАТУРА

1. Халил Х.К. Нелинейные системы. — Ижевск: НИЦ «Регулярная и хаотическая динамика», Институт компьютерных исследований, 2009. — 832 с.

2. Теория систем с переменной структурой / под ред. С.В. Емельянова. — М.: Наука, 1970. — 592 с.

3. Уткин В.И. Скользящие режимы в задачах оптимизации и управления. — М.: Наука, 1981. — 368 с.

4. Клюев А.С., Колесников А.А. Оптимизация автоматических систем управления по быстродействию. — М.: Энергоиз-дат, 1982. — 240 с.

5. Пупков Н.Д., Фалдин А.В., Егупов Н.Д. Теория оптимизации систем автоматического управления. Т. 1: Методы синтеза оптимальных систем автоматического управления. — М.: Изд-во МГТУ, 2000. — 512 с.

6. Панько М.А. Выбор математических моделей объекта управления по экспериментальным данным // Теплоэнергетика. — 2006. — № 10. — C. 20—23.

7. Фельбаум А.А. Основы теории оптимальных автоматических систем — М.: Наука, 1966. — 624 с.

8. Шилин A.A., Букреев В.Г. Исследование трехпозиционного релейного регулятора температуры в скользящем режиме работы // Доклады ТУ СУР. — 2012. — № 1 (ч. 2). — С. 251—257.

9. Шилин А.А. Материалы к статье: Динамическое определение траектории скольжения при релейном управлении нелинейным объектом. [Электронный ресурс]. — Режим доступа: http://portal.tpu.ru/SHARED/s/SHILIN/tethiss/Tab3 (дата обращения: 20.08.2013).

Статья представлена к публикации членом редколлегии

В.Ю. Рутковским.

Александр Анатольевич Шилин — канд. техн. наук, доцент,

® (3822) 56-34-50, И [email protected],

Виктор Григорьевич Букреев — д-р техн. наук, профессор,

® (3822) 56-34-50, И [email protected],

Национальный исследовательский Томский политехнический

университет.

Текст научной работы на тему «Динамическое определение траектории скольжения при релейном управлении нелинейным объектом»