мненно, что исследования по применению функций чувствительности в оценках допусков на реализацию управления в автоматических системах могут оказаться перспективными благодаря развитому аппарату вычислений в теории чувствительности.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. М. : Наука, 1979. 430 с.
ш
2. Справочник по теории автоматического управления / под ред. А.А. Красовского. М. : Наука, 1987. 711 с.
3. Огородников Ю.И. Расчёт допусков на реализацию программного управления в стационарных непрерывных системах // Современные технологии. Системный анализ. Моделирование. 2011. № 4 (32). С. 102-107.
4. Константинов Г.Н. Нормирование воздействий на динамические системы. Иркутск : Изд-во Иркут. гос. ун-та, 1983. 188 с.
УДК 519.21.75 Сизых Виктор Николаевич,
профессор кафедры управления техническими системами, Иркутский государственный университет путей сообщения, тел. 89148830351, email: [email protected]
Мензянов Алексей Олегович, аспирант кафедры управления техническими системами, Иркутский государственный университет путей сообщения, тел. 89647543025, email: [email protected]
НЕЙРО-НЕЧЕТКОЕ УПРАВЛЕНИЕ ТИПОВЫМ ТЕХНОЛОГИЧЕСКИМ МОДУЛЕМ НА ОСНОВЕ ПРЯМОГО МЕТОДА ЛЯПУНОВА ИССЛЕДОВАНИЯ АБСОЛЮТНОЙ УСТОЙЧИВОСТИ
V. N. Sizykh, A. O. Menzyanov
NEURAL-FUZZY CONTROL FOR TYPICAL TECHNOLOGICAL MODULE BASED ON LYAPUNOV'S DIRECT RESEARCH METHOD OF ABSOLUTE STABILITY
Аннотация. Рассматривается задача нейро-нечеткого управления физическим объектом с параметрической неопределенностью. Предлагается новая архитектура организации технологического процесса через параллельное взаимодействие технологических модулей (агентов) - однослойных нейронных сетей. На основе прямого метода Ляпунова и метода скоростного градиента в классе абсолютно устойчивых систем разработан нелинейный алгоритм оперативного обучения и управления. Разработанный алгоритм адаптации позволяет ускорить сходимость нейро-нечеткого управления через обучение нейронной сети в реальном времени, осуществить предварительное обучение и применить эффективные процедуры инициализации ее параметров. За счет дополнительной обратной связи по управлению и организации скользящих режимов в окрестностях особых точек нелинейного безынерционного преобразователя обеспечивается свойство нечувствительности системы к внешним и параметрическим возмущениям. В отличие от традиционного адаптивного подхода при организации нейропо-добных структур условие гурвицевости матрицы при векторе состояния линейной части замкнутой системы может не выполняться, а областью допустимых значений параметра регулятора является все множество действительных чисел.
Ключевые слова: технологический процесс, нейронная сеть, управление, адаптация.
Abstract. The problem of physical object neural-fuzzy control with parametric uncertain is considered. The architecture to organizations of the technological process through parallel interaction of technological modules (agents) similar one-layer neural-fuzzy control is offered. On base of the of Lyapunov's direct research method of absolute stability and speed gradient method both a nonlinear algorithm of the operative education and control is designed. The developed algorithm of adaptation allows accelerating a convergence neural-fuzzy control through the neural network training in real time, carrying out preliminary procedures training and to apply effective ways of its parameters initialization. Through the additional feedback on control and the sliding modes organization about artificial neuron special points both the invariance property to external andparametrical object noise is provided. At the organization similar neural network structures the Gurvitz 's state matrixes condition for system linear part can't be carried out. Besides, area of admissible values of regulator 's parameter is all set of real numbers.
Keywords: technological process, neural network, control, adaptation.
1. Постановка задачи нейронного управления
Одной из ключевых проблем современного развития транспортной инфраструктуры России является проблема управления транспортными системами на всех этапах их жизненного цикла
(проектирование, производство, эксплуатация). Проблема управления транспортными системами, в свою очередь, сводится к решению задач управления техническими (организационно-техничес-
иркутским государственный университет путей сообщения
кими) системами и технологическими процессами [1].
Рассмотрим технологический процесс (ТП), состоящий из l взаимодействующих технологических модулей (ТМ). ТМ имеют общую, известную заранее структуру и отличаются только переходами от j -го входа к i -му выходу ТП. Полагаем, что каждый ТМ выполняет определенную функцию сложного ТП и описывается последовательным соединением линейной дифференциальной системы (линеаризованной на интервале дискретизации (наблюдения) нелинейной системы обыкновенных дифференциальных уравнений) объекта и нелинейного безынерционного преобразователя (НБП) - однослойного персептрона (искусственного нейрона). Такие ТМ образуют класс абсолютно устойчивых нелинейных систем [2].
Уравнения j -го ТМ ( j = 1, l ) имеют вид
х = Ax + B(u + o(t,z,u)) + Ç, (1) z = cT x, (2)
u = L z. (3)
Индекс j для краткости записей переменных и параметров системы уравнений (1)-(3) опускаем. В дальнейшем полагаем, что система (1) должна удовлетворять требованиям существования и единственности решения; n -мерный вектор неконтролируемых возмущений Ç = 0 .
В формулах (1)-(3) обозначено: x = (xx,x2, ...,xn ) - n -мерный вектор состояния
j -го ТМ, x G Rn ; u - управление j -м ТМ (измеряемый скалярный вход системы (1)), u g U œ C1 ; z - наблюдение j -м ТМ (измеряе-
ШШШ
мый скалярный выход системы (1)), 2 е Я1 ; А - постоянная параметрически неопределенная матрица Якоби размерности п х п; В = (В, В2, ..., Ви) - постоянный вектор настраиваемых параметров НБП размерности пх1; с = (сх,с2..., сп) - вектор-столбец задаваемых параметров наблюдения (регрессии) размерности 1х п; Ь - скалярный параметрический регулятор; о(1, х, 2) - скалярная функция активации (ФА) однослойного персептрона, получаемая нелинейным преобразованием у -го управления и и у -го наблюдения 2 .
Структура однослойной нейронной сети, параметрически адаптированной под у -й ТМ, представлена на рис. 1. Сплошными линиями обозначена структура однослойной НС с нелинейностью в «прямой цепи». Предлагаемая структура отличается от традиционной схемы адаптивного регулятора (АР) наличием НБП и положительной жесткой обратной связи по скалярному выходу 2 . Данная структура НС добавлена пунктирной линией и сумматором - «цепью внутренней обратной связи» по скалярному входу и [2].
2. Свойства функции активации
ФА определяет архитектуру НС. Однозначных рекомендаций по выбору ФА в настоящее время не существует. В режиме обучения о$[-Ипе наиболее эффективен алгоритм обратного распространения ошибки сигнала и следующие ФА: гиперболическая тангенциальная, линейная и логическая сигмоидальная функции активации [1].
В режиме оп-Ипе (оперативное обучение и управление), когда НС работает в реальном времени
Однослойный персептрон
Blj\
фаззификатор
В B2j Физический
1 Bnj объект
1
Параметрический регулятор Lj
Алгоритм
адаптации
Алгоритм обучения Lj=F(z,Lj)
Рис. 1. Структура однослойной нейронной сети, параметрически адаптированной под j -й ТМ
а
ш
и выполняет функции адаптивного регулятора, будем полагать, что ФА удовлетворяет условиям [2]
0 < гис < ~а г 2+~2Р и 2 , (4)
где г е (-да; да), ~2 е [0,1], ~ = 1 - ~2, а е]0, а ], в е [0, в ]; ~, ~ - корректируемые
на интервалах наблюдения нечеткие коэффициенты, определяющие перераспределение сигналов от входа к выходу и от выхода к входу (режим работы НС); а, в - весовые коэффициенты соответствующей физической размерности (ед.) при переменных в правой части ограничений на о.
НБП о(•) определяется правой частью выражения (4)
о(х, г, и) = ~а — + ~2в — . (5)
и и
Функция (5) имеет две особые точки: z = 0; u = 0. Предварительно будем считать их изолированными [3]. Так как наблюдение — и уравнение и - скалярные функции, то с учетом (3) НБП (5) можно представить в виде
а
a(t, z,u) = c(Z) = qx — + q2fiL.
или
L^-0-
L = -
q а
~2 ß
точку
L = L+
V
q а
~2 ß
принимает значения:
. В точках экстремума функция о
о„
о„
о = -2
"2V~i~2aß ,
о + = 2^1 ~ ~2 aß .
4. Имеет нечетно-симметрическую форму: ¿о > 0 при Ь Ф 0. Действительно, эта функция изменяет знак только при условии ги Ф 0. При Ь< 0 (ги < 0) функция <(•) определяется в III
квадранте рис. 2 и отрицательна: < < 0. При Ь > 0 ФА вычисляется в I квадранте и положительна: < > 0 . Параметр Ь Ф 0, так как г = 0, и = 0 - особые точки.
5. При Ь > 1Ь и Ь < Ь функция о() близка к линейной с коэффициентами наклона прямых
±
1
q а
~2ß
в первом и третьем квадранте рис. 2.
(6)
Зависимость c(-) = c(L) при фиксированных ~ , q~ показана на рис. 2.
Исследуя свойства функции с(-) (формулы (5), (6)), можно заметить, что функция с(-) :
1. Знакоопределенная: с(-) > 0 при zu > 0 (z < 0, u < 0 или z > 0, u > 0); ст(-) < 0 при zu < 0 (z > 0, u < 0 или z < 0, u > 0) .
2. Имеет особую точку z = 0, L = 0, в которой происходит разрыв первого рода
lim с(L) = -да, lim c(L) = да,
lim c(t, z, u) =-да, lim c(t, z, u) = да . 3. Имеет две точки экстремума: точку максимума
L
минимума
НБП В(и + о) (формула (1)) для у -го ТМ в теории НС и нечетких множеств называется однослойным персептроном с ненулевым смещени-
т
ем или фаззификатором, вектор-строка c - ре-грессором или дефаззификатором [1].
При адаптивном подходе считается, что существует устойчивая внутренняя структура физического объекта [3], но неизвестны его параметры (коэффициенты матрицы А). Относительно нелинейности указаны частичные свойства характеристики <(•). Кроме того, неизвестен вектор В настраиваемых весовых коэффициентов однослойного персептрона.
Требуется осуществить оперативное управление у -м ТМ с помощью адаптивного параметрического нейрорегулятора Ь .
В основу предлагаемого подхода положена параллель со схемой адаптивного управления с самонастройкой: НС настраивает параметры управления, задающие работу обычного контроллера, таким образом, чтобы выходной сигнал у -го ТМ поддерживался как можно ближе к желаемому: Нтх(Х) = х = 0 . Такое управление у -м ТМ
называется стабилизирующим [3]. Задача синтеза адаптивного параметрического нейрорегулятора решается в три этапа [2]: исследуется выбранный класс нелинейных систем на устойчивость; синтезируется стабилизирующее управление и , обеспечивающее цель адаптации: Нт х(Х) = 0; по условиям
устойчивости инициализируются параметры НС.
Зе eh си ы ость ста dt L
1 1 1 1
1 1
1 1 1 1 1
1 1 II
1 С*
L" 1
■ ■1 с Л*
с- ,
1
1 \ 1 1 1
1 1 1 1
1 1
о Е
з
О
Рис. 2. Зависимость функции активации от значений регулируемого параметра при различных q1, q2 и а = 1 (ед.), в = 1 (ед.).
3. Устойчивость системы по Ляпунову
Устойчивость рассматривается как свойство свободного движения системы (1) после ее начального отклонения, вызванного какими-либо
причинами. Невозмущенное движение x = 0 определяется нулевым решением системы (1).
Аналитическое определение понятия устойчивости по Ляпунову формулируется следующим образом [4].
Определение. Нулевое решение системы (1) устойчиво, если при заданном сколь угодно малом е > 0 существует такое д > 0, зависящее от е, что при начальных условиях \x(0)\< д ,i = 1, n , для решения на интервале 0 <t < да выполняется условие \x (t)\< е ,i = 1, n.
Если условия определения соблюдены и выполняется условие limx(t) = x = 0, то нулевое t ^^
решение системы (1) асимптотически устойчиво.
Зависимость а(■) = a(L) при фиксированных ~, ~ представлена на рис. 2.
Теорема. Если для системы уравнений (1)-(3) существует положительная знакоопределенная функция V(t,z,u) = qlaz2 +~2ßu2 , то при НБП вида (6) производная V от этой функции является
тоже знакоопределенной, но противоположного знака, если одновременно выполняются условия
zz < 0, LL < 0. (7)
При этом решение системы (1) асимптотически устойчиво: lim x(t) = x = 0 .
t ^^
Доказательство. Выбираем в качестве функции Ляпунова правую часть неравенства (4):
V(t,z,u) = qlaz2 +q2ßu2 . С учетом уравнения регулятора (3) определим производную функции Ляпунова
V = 2 qazz + 2q2 ßuu =
= 2[( qxa + q2 ßL2) zz + q2 ßz2 LL].
Анализ последнего выражения показывает, что ~a + q2ßL > 0, q2ßL2 > 0. Тогда для отрицательной знакоопределенности V обязательно выполнение условий (7) теоремы. Условия устойчивости (7) не зависят от конкретной нечетно-симметрической формы НБП а {L). Поэтому они одновременно являются условиями абсолютной устойчивости системы (1)-(3) [4]. Вследствие того, что V < 0, функция Ляпунова будет монотонно убывающей функцией с нижним пределом
lim V(t,z,u) = 0 . Следовательно, имеет место до-
t ^^
ш
статочное условие асимптотической устойчивости: lim x(t) = x» = 0 .
t ^да
Поскольку точки z = 0, u = 0 - особые точки, то достаточное условие асимптотической устойчивости приближенно выполняется в некоторой области, ограниченной вертикальными L± и горизонтальными с± асимптотами функции c(L) (рис. 2). Эта область называется областью
скользящих режимов [5]. При L > L+ и L < L функция о(L) близка к линейной зависимости, и, следовательно, параметрический регулятор L в этих областях изменения аргумента является квазилинейным.
В области скользящих режимов необходимо обеспечить выполнение условий (7) теоремы. Первое условие устойчивости в (7) на практике реализуется через измерение выходной величины z и её производной. Второе условие в (7) выполняется через алгоритмически организованную процедуру параметрического синтеза стабилизирующего управления методом скоростного градиента.
4. Параметрический синтез стабилизирующего управления методом скоростного градиента
Подстройка НС под эталонную модель (желаемый выходной сигнал) j -го ТМ может осуществляться различными градиентными методами. В качестве эффективного алгоритма обратного распространения в статье предлагается использовать метод скоростного градиента (МСГ) [3].
Формулировка задачи синтеза стабилизирующего управления по МСГ сводится к следующему.
Состояние j -го ТМ - x е Rn, управление u - скалярное, наблюдается скалярная величина z = cTx е R1. Эволюцию j -го ТМ описывает
1*
дифференциальная система (1 ), где измеряемая кусочно-дифференцируемая функция c(t, z, u) является аддитивной добавкой к скалярному управлению u и подчинена ограничению вида (4), B - постоянный n -мерный вектор настраиваемых входных параметров. Управление линейно зависит от наблюдаемой величины: u = Lz .
Матрица A и вектор B заранее неизвестны. Вектор c, учитывающий «вклады» переменных состояния x в наблюдение z , задается.
Требуется синтезировать параметрический регулятор L = L(t) .
Цель управления - выполнение условия lim x(t) = 0 - соответствует минимизации в пределе локального функционала J(t) = 0,5 xTHx, где H - положительно определенная, симметрическая матрица размерности n х n .
Для синтеза нелинейного параметрического регулятора применим схему МСГ в дифференциальной форме [6].
Для этого определим полную производную от локального функционала
J (t) = 0,5 (xT Hx + xT Hx) =
= xT H [( A + LBcT ) x + B(ß^ + ~ ßL)] и вычислим градиент по параметру L
VlKx, L) = xTHB(z - ^ + ~2ß).
По схеме МСГ синтезируемый в дифференциальной форме нелинейный скалярный регулятор имеет вид
L = -rVLp(x, L). (8)
Для системы (1), (2), (3) при ограничениях на ФА типа (4) алгоритм адаптации (обучения) j -го ТМ записывается в виде
L = -r xT HB( z - ^^+~2ß),
(9)
где r > 0 - положительное число, определяющее скорость убывания градиента по параметру L .
По постановке задачи процедура управления должна зависеть только от наблюдаемой величины z (рис. 1). Поэтому в (9) потребуем соблюдения равенства
HB = c. ( 1 0)
Тогда с учетом того, что cT = BT H, в окончательном виде получим алгоритм адаптации j -го ТМ
f 'q1a ~ (11)
LL = -r( z + q2ß) z,
где q е [0, 1], q = 1 - q - параметры, определяющие режим работы НС.
5. Инициализация начальных условий
Реализация условия устойчивости нулевого решения уравнений j -го ТМ (условие б) теоремы
1 [2]) для достижения цели адаптации lim x(t) = 0
t^-да
сводится к инициализации начальных условий алгоритма адаптации (11).
Воспользуемся равенством (10). Матрицу H в локальном функционале J и в формуле (9)
иркутским государственный университет путей сообщения
рекомендуется выбирать таким образом, чтобы выполнялось неравенство [3, с. 331]
HA + ATH < 0 ( 1 2)
где A = A + LBcT - задаваемая при некотором c = c желаемая гурвицева матрица замкнутой регулятором L системы (1), (2), (3). Матрица A может быть предварительно идентифицирована (эмулирована в НС) по экспериментальным данным входо - выходных характеристик замкнутого линейным регулятором физического объекта.
Неравенство (12) соответствует второй лемме Ляпунова об устойчивости движения и указывает класс технических систем, который алгоритмом адаптации приводится к цели. Этот класс полностью определяется через параметры алгоритма.
Инициализация начальных условий алгоритма адаптации (1) сводится к следующему.
1). Используя пакет Mat Lab Toolbox LMI, методом линейного программирования решаем систему матричных неравенств Ляпунова (12) и определяем матрицу H.
2). Задаваясь весами c = c» выходных сигналов ( к = 1, n), из формулы (10) вычисляем параметры вектора B НБП: B = H 1 c„.
3). Применяя условие устойчивости б) теоремы 1 [2], определяем начальное условие L(0) алгоритма адаптации (11)
(= 1, ~2 = 0): L(0) = -
а-
cT B z(0)
В последующем начальные условия алгоритма адаптации (11) уточняются в реальном времени с шагом, равным периоду дискретизации (интервалу наблюдения) выходного сигнала z .
Альтернативный путь предварительной инициализации параметров НС по алгоритму обратного распространения - использование пакета Neural Toolbox среды Mat Lab [7].
Дальнейшее оперативное обучение и управление j -м ТМ производится по алгоритму адаптации (11) (0 < ~2 < 1). При ~2 = 1 процесс обучения НС заканчивается. НС работает как обычный АР.
Заключение
Таким образом, в статье на основе организации параметрического управления по методу скоростного градиента разработан эффективный алгоритм адаптации, позволяющий:
1) ускорить сходимость нейро-нечеткого управления за счет обучения нейронной сети в реальном времени;
2) применить гибридные сети, в которых искусственные нейронные сети связываются со структурами адаптивного управления на основе традиционных технологий;
3) осуществить предварительное обучение и применить эффективные процедуры инициализации параметров нейронной сети.
Для практической реализации алгоритма адаптации на базе однослойной нейронной сети достаточно знаний о порядке дифференциальных уравнений, описывающих физический объект с устойчивой структурой взаимосвязей между ее элементами.
В отличие от традиционного адаптивного подхода, когда область устойчивых решений линейной части системы (1) определяется условием Ь < 0, при организации нейроподобных структур областью допустимых значений параметра Ь регулятора является все множество действительных чисел Ь е Я1.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Крылов А.А., Сизых В.Н., Чумак А.Г. Методика структурно-параметрического синтеза нейросетевой модели продольного движения воздушного транспортного средства // Современные технологии. Системный анализ. Моделирование. 2011. № 1 (29). С. 129-134.
2. Мухопад Ю.Ф., Пашков Н.Н., Сизых В Н. Адаптивный подход к нейронному управлению одним классом абсолютно устойчивых систем. М. : Изд-во РАЕ, 2011. №8. Ч. 1. С. 139-147.
3. Срагович В.Г. Адаптивное управление. М. : Наука, 1981. 384 с.
4. Попов Е.П. Теория нелинейных систем автоматического регулирования и управления. М. : Наука, 1988. 256 с.
5. Уткин В.И. Скользящие режимы и их применение в системах с переменной структурой. М. : Наука, 1974. 272 с.
6. Фрадков А.Л. Схема скоростного градиента и ее применение в задачах адаптивного управления // А и Т. 1979. № 9. С. 90-101.
7. Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Нейросетевые системы управления // Нейро-контроллеры и их применение / под ред. А.И. Галушкина. М. : ИПРЖР, 2002. 480 с.