УДК 62-544
Е. Д. Агафонов
НЕПАРАМЕТРИЧЕСКИЙ АЛГОРИТМ УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ С ИСПОЛЬЗОВАНИЕМ
СКОЛЬЗЯЩИХ РЕЖИМОВ
Предложен алгоритм управления нелинейными динамическими системами с применением скользящих режимов, в которых объект управления с одним входом и одним выходом представлен конечно-разностной непараметрической моделью в пространстве состояний. Даны рекомендации по настройке и оптимизации алгоритма. Разработанный алгоритм реализован в пакете МЛТЬЛВ, приведены результаты управления движением обратного маятника.
Ключевые слова: нелинейная динамическая система, разностная модель, непараметрический регулятор, устойчивость по Ляпунову, метод скользящих режимов.
Проблемы, связанные с созданием систем управления динамическими объектами, актуальны по нынешний день в силу сложности математического описания объектов управления и синтеза соответствующих управляющих алгоритмов.
Наиболее развита теория управления линейными стационарными системами. Во-первых, известны подходы к синтезу алгоритмов управления, когда объект управления описывается системой линейных дифференциальных или разностных уравнений [1]. Во-вторых, разработаны алгоритмы управления в случае описания линейной системы в классе обобщенных функций с использованием интеграла Дюа-меля или уравнения Винера-Хопфа [2; 3]. В случае недоступности точного описания объекта управления отыскивают его модель, опираясь на априорную информацию о виде и структуре уравнений, законах распределения помех измерений входных и выходных величин и т. д. Принято говорить, что первому и второму вариантам описания объектов в стохастической постановке задачи соответствуют параметрические и непараметрические алгоритмы управления для линейных динамических систем.
Теория управления для нелинейных систем в настоящее время активно развивается. Среди эффективных подходов к разработке алгоритмов управления можно выделить подход с использованием регуляторов со скользящими режимами [4-6], обладающих высокими динамическими показателями и свойством грубости (робастности) по отношению к параметрическим и координатным возмущениям. Управляющее воздействие в методе скользящих режимов синтезируется из условий устойчивости, заданных условиями теоремы устойчивости Ляпунова. Метод имеет следующие особенности:
- применим для нелинейных динамических систем;
- управляющее воздействие отыскивается в классе разрывных функций;
- метод требует знания модели объекта управления (в общем случае модель в пространстве состояний);
- для функционирования регулятора требуется информация о значениях переменных состояния;
- метод устойчив к ошибкам идентификации модели объекта управления и ошибкам измерения переменных состояния.
Постановка задачи. Пусть объект управления задан дифференциальным уравнением, линейным относительно входного воздействия:
Х^ = f ( X, X,..., X ) + ф ( X, X' ,..., х(п_1) | и ,
где х = х (/) - траектория движения объекта, его реакция на входной процесс и = и ^); функции ф- х, х' ,..., х^п_1)) и f -х, х ',..., х^п_1)) - в общем случае нелинейные и разрывные, потребуем также выполнения условия ф- х, х ',..., х -п_1))ф 0.
Определим цель управления как х* = 0 . В ином случае, если х* Ф 0, корректируем функции ф и f так,
чтобы цель управления стала х* = 0 .
Вводится понятие поверхности скольжения, изменяющейся со временем поверхности в пространстве состояний, обеспечивающей устойчивость движения системы. Поверхность скольжения задается скалярным уравнением
5 - х, х' ,..., х(”-1), t) = 0 .
В общем случае для системы порядка п поверхность скольжения определяется выражением
5 - х, х ',..., х^”_1), t ) = ^ + у^ х , у> 0.
Управление объектом осуществляется в два этапа: вывод процесса на поверхность скольжения и скользящий режим - движение процесса по поверхности скольжения до состояния равновесия. Для обеспечения устойчивости движения к поверхности скольжения вводится функция Ляпунова
V = 152.
2
Условие устойчивости имеет вид
V ' < 0,
где
V ' = | ^ s I = ss' = s
d Y d
— + Y | —x
dt I dt
= s (f + фu + у);
y = y (x',..., ^,y) = (n -1) у x^ +
+ (n -1)(n - 2) y2x<n-2V2! +... + уnx' .
Устойчивость движения обеспечивается выбором управляющего воздействия:
<Р, s > 0, u < = Р, s = 0,
>Р, s < 0,
где
Р = -
f + у ф
Метод скользящих режимов доказал свою эффективность для широкого круга практических приложений. Однако, для его использования необходима модель нелинейного объекта управления. Поэтому синтез алгоритма предваряется решением задачи идентификации объекта управления, в частности, в нашем случае, необходимо идентифицировать функции ф и f На практике не всегда возможно отыскать модель в виде уравнения, известного с точностью до вектора параметров, с последующей его оценкой, так как в теории не существует универсального алгоритма идентификации структуры объекта. В работе предлагается отыскивать модель нелинейного объекта управления в классе непараметрических моделей.
Алгоритм решения задачи. Обобщим описание объекта управления:
(”) / ! (”-1) \
х1 ; = ф(х, х ,..., х1 ;,и) .
Линейность уравнения относительно входного воздействия не требуется. Первая производная функции Ляпунова имеет вид
V' = 55' = 5 (ф( х, х',..., х1'” 1), и ) + у ( х',..., х1'” 1), у)) .
Для устойчивости движения управляющее воздействие и выбираем так, чтобы обеспечивалось выполнение следующих условий:
ф( х, х ',..., х1”-1, и ) + у ( х' ,..., х (”-1), у) > 0 , если 5 < 0 ,
ф( х, х ’ , х (”-1), и ) + у (х ’,..., х (”-1), у) = 0 , если 5 = 0 , ф( х, х ',..., х(”-1), и ) + у ( х' ,..., х (”-1), у) < 0 , если 5 > 0 .
Преобразуем условия устойчивости к следующему виду:
ф( х, х ',..., х(”-1), и ) = а - у (х' ,..., х (”-1), у) , если 5 < 0 , ф( х, х',..., х(”-1), и ) = -у (х',.--, х(”-1), у) , если 5 = 0 , ф( х, х' ,..., х(”-1), и ) = -а - у ( х' ,..., х(”-1), у) , если 5 > 0 .
где a = const > 0. Решением задачи будет обратная зависимость значений входного процесса от переменных состояния и вспомогательной величины +a - у :
u = q (x, x' ,..., x(n-1), +a - у) .
Для синтеза модели перейдем к конечноразностному представлению:
ud = qd (x(t), x(t -1)., x (t- n +1), +a - у (t)) .
Здесь аргумент t представляет собой дискретную величину: t = 1,2,... Для перехода к дискретной модели используем аппроксимацию производной по времени в виде конечной разности с первым поряд-
dx (t) Ax (t) x (t)- x (t -At)
ком аппроксимации —— и —— = ——-------------------------
dt At At
либо с использованием других более сложных схем
[7]. Для удобства записи переименуем переменные:
z1 = x (t) , z2 = x (t -1) , z3 = x (t - 2) , ... ,
Zn-1 = x (t - n +!), zn = +a - у (t) .
В результате получили модель в виде
us = qs (z1•••, z„).
Проблема построения модели динамического процесса сводится к решению проблемы идентификации статического объекта, входными воздействиями которого становятся состояния в текущий и предыдущие моменты времени, а также введенная ранее вспомогательная величина.
Во время функционирования объекта накапливаем выборку {zk [i], u[i]} , k = 1, 2, ...n , i = 1, 2, ...s . Полученная выборка используется для построения непараметрической модели Надарая-Ватсона [2; 3]:
±u [і]ІП Ф
i=1 k=1
- zk[i]
zk- z. C.,
ХПф
- zk [i]
C
В случае равенства нулю знаменателя дополняем модель:
= О, если sn Ф
- zk[i ]
C„,
= О.
Параметры Cs удовлетворяют условиям сходимо-
сти:
Cs > 0 , lim Cs = 0, lim sCs = ж,
£^да £^да
а ядерная функция Ф приобретает вид
-1 (Ф
C
CC
s -да V s
t - T
lim
Cs ^О
1 да — |ф^) Ф
C
V s -да
t - T
C
dt = 1 , dt
= ф^).
us =
u
s
Перед использованием модели необходимо провести процедуру оптимизации относительно вектора параметров С5 ={С51, С52,..., Ст} совместно с параметром а. Предлагается использовать критерий оптимизации, минимизирующий средний квадрат отклонения выходного процесса от желаемого. Критерий опт имизации принимает вид
T 2
Ё[x (us (Cs,a), t)] ^ mm.
Указанная форма критерия обусловлена равенством нулю желаемого выхода процесса.
Результаты моделирования. Тестирование алгоритма проводилось на задаче управления положением обратного маятника, совершающего колебания на плоскости, т. е. имеющего одну степень свободы. Требовалось привести маятник в вертикальное положение из некоторого начального состояния, заданного пользователем, а в дальнейшем сохранять это положение. Была взята физическая модель маятника -тонкого невесомого стержня с заданной массой, закрепленной на его верхнем конце. Во время перемещения в пространстве груз испытывает сопротивление окружающей среды. Управляющее воздействие представляло собой момент сил, приложенный к маятнику в точке его опоры - «нижнем шарнире». Движение маятника описывается системой нелинейных дифференциальных уравнений:
а = ю,
l
kFl
ю =^- sin а—— ю sign ю + -
m
M
~mf2
где I - длина маятника; т - масса груза; g - ускорение свободного падения; М - момент сил, действующих на маятник, - управляющее воздействие; kF - коэффициент сопротивления окружающей среды; а - угол отклонения маятника от вертикального положения; ю - угловая скорость маятника.
Управляющее устройство включено в цепь обратной связи, оно получает информацию о состоянии
объекта управления и генерирует управляющее воздействие. Физическая модель объекта управления устройству управления недоступна. Информация об объекте заключена в выборке измерений переменных состояния и вспомогательной величины, накопленных заранее в процессе функционирования объекта управления. Необходимо отметить, что во время накопления выборки объект управляется с использованием каких-либо других регуляторов, вручную оператором либо, если это допустимо, претерпевает «неудачные» попытки управления в разомкнутой схеме, в том числе, например, реагирует на случайное, хаотическое управляющее воздействие.
Алгоритм управления реализован в пакете MATLAB версии 7 с применением визуальной системы моделирования динамических процессов Simulink (рис. 1).
Блок Inverted Pendulum содержит физическую модель обратного маятника. На вход блока подается значение начального угла отклонения маятника от вертикального положения Initial Angle, а также входное воздействие u(t), которое генерируется управляющим элементом Controller. Входная информация для элемента управления: переменные состояния x (t)
и x'(t), вспомогательная величина +a - у (t), параметры размытости c1, c2 и c3, коэффициенты а и у . Блок Supplement вычисляет значение вспомогательной величины на каждом такте управления.
Как отмечалось ранее, перед использованием алгоритма должна осуществляться процедура оптимизации с применением среднеквадратического критерия. Оптимизация проводилась методом сопряженных градиентов с мультистартом по параметрам, обозначенным на схеме k1, k2 и k3. Из практических соображений эти параметры были выбраны следующим образом: k1 = c1, k2 = c2 = c3, k3 = a .
Результаты одного из экспериментов приведены ниже (рис. 2).
Рис. 1. Модель Simulink, реализующая алгоритм управления
Рис. 2. Тестовое управляющее воздействие и реакция маятника в разомкнутой схеме
Момент времени, когда процессы прерываются, соответствует падению маятника на условную горизонтальную плоскость, т. е. х (/) = к/2 . Объем обучающей выборки 5 = 218, выборочные значения поступают через равный временной интервал Д/ = 0,01 и не содержат случайных ошибок.
Начальное положение маятника было принято х (0 ) = -к/8 «-0,39. Это значение лежит вне диапазона обучающей выборки, в этом нетрудно убедиться, взглянув на рис. 2. Остальные параметры I = 1 м, т = 1 кг, kF = 0, у = 1. В результате оптимизации были вычислены следующие значения параметров устройства управления: с1 = 0,8 , с2 = с3 = 1,7,
а = 0,7 . Результат управления маятником изображен на рис. 3.
Рис. 3. Входное воздействие и (/) и результирующий
*)
отклик маятника х (
Выход на поверхность скольжения 5 = х ^) + х ' (t) = 0 происходит со второй попытки.
Осцилляция во время процесса скольжения наблюдается в области значений производной выходного процесса.
Нетрудно заметить, что входной процесс и (/) состоит из двух составляющих: гладкой и осциллирующей. Они соответствуют двум стадиям работы регулятора: выводу на скользящую поверхность и режиму скольжения (рис. 4).
Рис. 4. Траектория управляемого движения маятника в пространстве состояний
Таким образом, использование непараметрического подхода к идентификации позволяет осуществить метод скользящих режимов в управлении нелинейным динамическим объектом, модель которого невозможно получить с точностью до набора параметров. Генерация управляющего сигнала в классе разрывных функций позволяет свести к минимуму негативный эффект ошибок (как ошибок идентификации, так и влияния случайных ошибок измерений) в осуществлении процесса управления.
В настоящей работе была предпринята попытка построения эффективного непараметрического алгоритма управления, информация для функционирования которого заключена в обучающей выборке. Выборка должна быть известна заранее, до начала процесса управления. В дальнейшем необходимо совершенствование предложенного алгоритма управления и создание его адаптивной модификации.
4. Уткин В. И. Скользящие режимы и их применения в системах с переменной структурой. М. : Наука, 1974.
5. Kjaer M. A. Sliding Mode Control. Dept. of Autom. Control // Lund Institute of Technology, Sweden, 2004.
6. Slotine J.-J. E., Li W. Applied Nonlinear Control. Englewood Cliffs : Prentice-Hall, 1991.
7. Самарский А. А. Теория разностных схем. М. : Наука, 1989.
E. D. Agafonov
NONPARAMETRIC CONTROL ALGORITHM FOR NONLINEAR DYNAMIC SYSTEMS USING SLIDING MODES
The paper deals with a new control algorithm designed for nonlinear dynamic systems with the use of Sliding Mode control approach. The SISO object is represented by its nonparametric finite differences model in state space. The paper gives recommendations for tuning and optimization of the control algorithm. The proposed control algorithm is implemented in MATLAB/Simulink technical computing software. As an illustrative example we presrnt results of control process of inverted pendulum.
Keywords: nonlinear dynamic system, finite difference model, nonparametric control, Lypunov stability, sliding mode control.
© Агафонов Е. Д., 2010
Библиографические ссылки
1. Воронов А. А., Титов В. К., Новогранов Б. Н. Основы теории автоматического регулирования. М. : Высш. шк., 1977.
2. Медведев А. В. Адаптация в условиях непараметрической неопределенности // Адаптивные системы и их приложения : сб. науч. тр. / Новосибирск : Наука, 1978. С. 4-34.
3. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983.
UDC 519.234
K. Zablotskaya, S. Walter, S. Zablotskiy, W. Minker
DETERMINATION OF VARIABLES SIGNIFICANCE USING ESTIMATIONS OF THE FIRST-ORDER PARTIAL DERIVATIVE
In this paper we describe and investigate a method which allows us to detect the most informative features out of all data extracted from a certain data corpus. The significance of input features is estimated as an average absolute value of the first-order partial derivative. The method requires the values of the objective function at the certain assigned points. If there is no possibility to calculate these values (the object is not available for experiments), we use nonparametric kernel regression to approximate them. The algorithm is tested on different simulated objects and is used for investigation of the dependency between linguistic features of spoken utterances and speakers ’ capabilities.
Keywords: non-parametric kernel regression, first-order partial derivative.
In our research we try to investigate if there is a dependency between spoken utterances of a person and his capabilities. For this purpose we collected a corpus of monologues and dialogues of different speakers [1]. Their verbal intelligence was measured with an intelligence test [2]. Dealing with the corpus, we try to extract relevant information enough for clustering, classification, regression, or other data mining tasks. There are normally lots of different features which could be extracted from the monologues and dialogues, but their importance or relevance is not always obvious. Most of them are noise fields, which make the analysis of data increasingly difficult. When working with high dimensional spaces, the computational effort required by data analysis tools may be tremendous. It is therefore essential to detect ir-
relevant or weakly correlated features and exclude them out of consideration.
There exist different solutions to this problem. One of them is the use of Pearson’s coefficient or the coefficient of multiple correlation. However, if Pearson’s coefficient is close to 0, it does not mean that the output and input variables are not correlated. It just shows that there is no linear dependency between them. Such features should not be excluded out of consideration without additional analysis. Another approach to decrease the number of features is Principal Component Analysis. This method involves a mathematical procedure that transforms correlated variables into a smaller number of uncorrelated ones called principal components. But it does not determine the contribution of a certain feature to an objective function.