Субоптимальное нелинейное управление по критерию быстродействия на основе метода Беллмана – Ляпунова

Кудин В. Ф.; Колесниченко С. П.

Gostev V. I.

DESIGNING OF A FUZZY CONTROLLER AT IDENTICAL GAUSS MEMBERSHIP FUNCTIONS

Analytical expressions for control actions at the fuzzy controller output at identical gauss membership functions ha-

ve been obtained, fuzzy controller designing procedure is described, and the practical scheme of a fuzzy controller is proposed.

Key words: automatic control, fuzzy controller, MATLAB, fuzzy logic.

УДК 62-50 Кудин В. Ф.1, Колесниченко С. П.2

1Д-р техн. наук, профессор Национального технического университета Украины «Киевский политехнический институт» 2Канд. техн. наук, старший преподаватель Национального технического университета Украины

«Киевский политехнический институт»

СУБОПТИМАЛЬНОЕ НЕЛИНЕЙНОЕ УПРАВЛЕНИЕ ПО КРИТЕРИЮ БЫСТРОДЕЙСТВИЯ НА ОСНОВЕ МЕТОДА БЕЛЛМАНА - ЛЯПУНОВА

Рассматривается общетеоретическая задача синтеза субоптимального нелинейного управления на примере двухмассовой электромеханической системы управления крановым механизмом передвижения с учетом гашения колебаний транспортного груза. Задача решается на базе метода Беллмана - Ляпунова с использованием концепции «инвариантного погружения» по критерию быстродействия. Проведено исследование динамики замкнутой системы с синтезированным субоптимальным регулятором.

Ключевые слова: электромеханическая система, аналитическое конструирование регуляторов, критерий быстродействия, нелинейное управление, метод Беллмана - Ляпунова.

ВВЕДЕНИЕ

Задачи синтеза алгоритмов управления, оптимальных по быстродействию, остаются актуальными для проектирования автоматических систем управления различными транспортными механизмами производственных цехов, следящих систем различного назначения, систем управления колебаниями, манипуляторами и др. [1-4]. Известно, что в практике проектирования систем максимального быстродействия синтез алгоритмов выполняется, как правило, методом фазовой плоскости. Возможности применения этого метода ограничены объектами третьего порядка, передаточные функции которых не имеют комплексно-сопряженных полюсов, а фазовые траектории являются монотонными кривыми.

В настоящее время уделяется большое внимание проблеме синтеза оптимального управления двухмассовой электромеханической системой (ЭМС) механизма перемещения крана с гашением колебаний подвешенного груза [1]. При этом рассматривается довольно широкий спектр математических моделей управляемой ЭМС, которая учитывает нелинейность объекта управления и электромагнитную инерционность электропривода. Математические модели подобных управляемых систем наряду с апериодическими звеньями зачастую содержат и колебательные. Синтез оптимальных по быстродействию управлений такими системами, как показывают выполненные в

[5, 6] исследования, представляют трудную, возможно, даже неразрешимую задачу.

В целом исследуемая модель ЭМС является нелинейной по переменным состояния и управляющему воздействию. Кроме того, минимизируемые функционалы, используемые при построении оптимальных двухмассовых ЭМС, являются, обычно, неквадратичными, что усложняет процедуру аналитического конструирования оптимальных регуляторов (АКОР).

В данной статье предлагается приближенное решение нелинейной задачи АКОР по быстродействию на основе метода Беллмана - Ляпунова в сочетании с концепцией «инвариантного погружения» [7-10]. Метод обладает вычислительной эффективностью и легко распространяется на нелинейные системы высокой размерности.

1. ПОСТАНОВКА ЗАДАЧИ

Задана математическая модель колебаний подвешенного груза в виде консервативного звена с электроприводом, создающим динамический момент (рис. 1) [3].

На рис. 1 используются следующие обозначения: т1 - масса тележки (моста); т2 - масса груза; ф - угол отклонения груза от вертикали; Е - динамическое усилие, приложенное к тележке (мосту); М - динамический момент електропривода; р - радиус приведения.

Рис. 1. Подъемно-транспортный механизм с маятниковой подвеской груза

При малых отклонениях груза от вертикали движение двухмассовой системы «тележка - груз» описывается системой линейных уравнений [3]

d2ф , 2 dt2

+ ю2ф = b1 F,

ЛР 1 ^ , -

— =------р + Ь2 и, [иТ< и,

Ж Та 2 1 J

где ю0 = 1,33 с-1 - частота собственных колебаний системы «тележка - груз»; Та = 0,05 с - электромагнитная постоянная момента электропривода; Ь1 = = 6,54 х 10-4, Ь2 = 7,6 х 104 - коэффициенты; и -управление.

Запишем заданную систему дифференциальных уравнений в форме Коши:

x1 = x2 x1 - ф

x2 = —®2x1 + b1 x3, здесь x2 - еф

(1)

x: = — a31 x3 + b2 u

x3 — F, u = f (а) = а 1.

Примечание. Учет ограничения на управление и с помощью некоторой функции и = f(с) был впервые предложен A. Miele [11]. Здесь роль управляющего воздействия переходит уже к с, на которое не наложено ограничение. Поэтому формировать подынтегральную функцию w (с), которая определяет вид и = f(c),

гораздо легче. При этом зависимость вида u = 2n-¡o (n = 2,3,4, ...) позволяет при достаточно больших n аппроксимировать релейную характеристику с большой точностью на классе гладких функций.

Ставится задача отыскания управления с = = у( xj x2 x3), обеспечивающего переход изображающей точки пространства состояний в начало координат

при произвольных начальных условиях, на решениях системы (1), исходя из минимизации функционала вида

min/ = J i W (xj, x2, x3 ) + сс2 ) dt.

(2)

Рассмотрим сначала процедуру АКОР, учитывая ограничение на управление, используя нелинейное преобразование A. Miele, не уточняя вид функции

W ( Xj, x2, x3).

Метод динамического программирования Беллма-на дает следующее функциональное уравнение:

min

с

W i Xj, X2, X3 ) + С с2 + -т— X2 +

дї

+ § i - ®02Xj + bj X3 ) +

+ dX" i - fl3iX3 + b2 с1/5 )

= 0.

(3)

После дифференцирования получаем

b dV -V, y b2 dV

2cct +-:— ct /5 = 0; ct +—2------= 0;

5 dx:

10c dx:

f b ЭП b2 dV

с UcaxJ ; u = lwCdx~.

Исключая о из функционального уравнения (3), получаем уравнение Гамильтона - Якоби - Беллмана (ГЯБ) вида

W(Х1; Х2, Х3) + дХХ2 + дХ (- + Ь1X3 ) +

+Цix3) =9cf wÆ,

(4)

Разлагая правую часть в цепную дробь [12], получаем

W(ХЬ Х2, Х3 ) + дХХ2 + дХ (- Ю02Х1 + ЬХЪ) -

д¥

- Яз! Х3

дХз

ь2 дУ

ЦцОІ. + ЦігС^ + ІЛізаі5 ^ (Лз,!«?2- -+- |Ц1:22С^1^ ’

(5)

где 0[ = 7-Э-", М-11, М-12, • •• - постоянные коэффици-

6 С 0Х3

енты разложения.

Приближенное решение этого уравнения находится в виде последовательности степенных форм от переменных состояния.

У( Х ) = V2 (Х) + V4 (Х) + V6 (Х)...

(6)

Здесь v2(х) - квадратичная форма от переменных х!, х2, х3, V4(х) - форма четвертой степени и т. д. Параметры квадратичной формы определяются системой уравнений Риккати, а параметры четвертичной формы - системой линейных алгебраических уравнений.

В точках позиционирования тележки перемещаемый груз занимает произвольное положение. Возникает типичная задача АКОР по отработке начальных условий, исходя из условия быстрейшего затухания переходного процесса [или критерия шіпшах х(ґ)].

С ґ

В этом случае критерий оптимальности и подынтегральные функции приобретают следующий вид:

тій./ = | Ш(хь х2, х3) + ей1 ] Ж,

(7)

где W1(хь х2, х3 ) = 1.

Уравнение ГЯБ для функционала быстродействия с учетом ограничения на управление будет иметь следующий вид при и = /(о) = о1/5:

1 _1_ дУ , ЭУ, 2 , ч

1 + — Х2 + 7— (- Ю02Х! + Ь1X3 ) -

д Х 1 д Х 2

дУ

дх-

ах3 = 9 е

Ьі дУ 10едх-

(8)

По утверждению М. Атанса, П. Фалба, решение задачи синтеза по критерию быстродействия на базе метода динамического программирования, которое сводится к решению уравнения ГЯБ, практически невозможно.

Один из возможных путей - переход к аналитическому выражению подынтегральной функции критерия быстродействия в функции переменных состояния.

Подынтегральную функцию W1 (х1, х2, х3 ) = 1 можно аппроксимировать соотношением W1( х1, х2, х3 ) =

Рис. 2. Аппроксимированная подынтегральная функция Ші (Хі)

= і ~ і - е-“*1. Данная функция при а =100 представлена на рис. 2.

Аппроксимированная подынтегральная функция уже является аналитической. Поэтому решение задачи синтеза (уравнение ГЯБ) можно искать в виде многомерного степенного ряда. Тогда для системы дифференциальных уравнений (1) и функционала (7) уравнение ГЯБ будет иметь вид

(ах)2 -і- 1/2(ах)4 + і/6(ах)6 + дУ +

і + (ах)2 + 1/2(ах)4 + 1/6(ах)6 дх! 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

дУ 2 дУ

+ -г— (- юО*! + Ьхх3) - — ах3 =

д*2 д*3

= 9е| Ь-дУ

10 е дх3

(9)

После разложения правой части уравнения в цепную дробь решение уравнения ГЯБ ищется в виде последовательности степенных форм. Однако процедура решения уравнения ГЯБ достаточно сложна в вычислительном отношении. Поэтому используем процедуру синтеза субоптимального управления на базе метода Беллмана - Ляпунова в сочетании с принципом «инвариантного погружения» [6-9].

2. РЕШЕНИЕ ЗАДАЧИ АКОР

Преобразуем подынтегральную функцию минимизируемого функционала

Ш ( х1 х2 ) = і = а(*! )х2,

где а(х1 ) = -1 - весовая константа.

*2

0

В итоге получаем критерий оптимальности вида

min/ = J (а( x1) x2 + cg 2) dt, (10)

0

т. е. неквадратичный функционал сведен к квадратичному функционалу, весовая константа которого а( x1) является функцией переменной x1. Тогда для системы дифференциальных уравнений (1) и функционала (10) получаем уравнения ГЯБ в частных производных для фиксированной области фазового пространства.

а(xi)x2 + -т—x2 + ^(- ю2xi + bix3) -dxj 0X2

dv q2(a)b2 f d

■ n— ax3 = —----------- - , .

dx3 4 с V dxy

(11)

Здесь q(a) есть постоянная величина для фиксированной области фазового пространства.

Трансформация уравнения ГЯБ (8) в (11) обусловлена тем, что управляющее воздействие есть и = f(о), где f(o) - функция нелинейного преобразования

A. Miele, представленная в виде и = q(a)о = f0-)'O.

Здесь q(a) - коэффициент гармонической линеаризации для затухающих переходных процессов [13, 14]. Этот коэффициент является приближенным эквивалентом коэффициента линеаризации по методу секущей, поскольку q(a) также можно получить методом среднеквадратичного приближения [15].

Система уравнений Риккати имеет вид

. . 2 q2(a)b2.,

а(x1) — 2к21®0 = k31 ,

с

= q2(a)b-2

2k12 kT3^

с

2b, ки = ¿Ш^,

U - q2(a)b\u и

k13 b1k12 a31 k32 k31 k32,

k13 - bk12 - a31 k32 =

q2(a)b2

k32k33,

їй и 7 я2(а)Ь2

кп Ь і юо ^23 а3і к3і к13к33. (12)

Далее осуществляем решение задачи АКОР «в малом» при а( *!) = аі( х! ) = 400, я (а) = я (а) = 6, е = е1 = 1.

На этом этапе получаем закон управления

С1 (Х) ( к31 Х1 + к32 Х2 + к33Х3 )

Єі

= -(кх х1 + к2 х2 + к3х3) =

= -( 19,75х1 + 0,380x2 + 0,00х3).

На втором этапе получаем решение задачи АКОР «в большом» при а( х! ) = а2(х!) = 4, я (а) = = я2(а) = 0,8 , е = е2 = 1/(50)2:

С2 (Х) = - (к31 х1 + к32 Х2 + к33Х3 ) =

е2

= -(к1 /х1 + к2'х2 + к3' х3) =

= -( 98,28х1 + 13,88 х2 + 0,000х3).

Таким образом, получена последовательность «мгновенных» оптимальных управлений для некоторых совокупностей начальных условий. Далее возникает необходимость сшивания «мгновенных значений» оптимального управления и! и и2. Находим вариации параметров Ак, возникающих при переходе из одной области в другую, и рассматриваем их как управляющие воздействия.

Тогда

и2 = -signc2 = -sign[ к! х1 + к2 х2 + к3 х3 +

+ Ак1х1 + Ак2 х2 + Ак3 х3 ], (13)

где Ак1, Ак2 и Ак3 определяем из соотношения

Ас(х) = с2(х) - С!(х) =

= (к! - к! )Хі + (к2 - к2 )х2 + (к3 - к3 )Х3 =

= Ак!х! + Ак2 х2 + Ак3х3.

Дальнейшая процедура синтеза производится в соответствии с методикой, изложенной в [9, 10]. Ставится задача минимизации функционала

min / = fly aix2 + с-Ak- + с^^ І dt (14)

Ak-, Ak2 I ^ J

на решениях системы дифференциальных уравнений

X2 = -ю0 x- + b- x3, X3 = -a3-x3 + b2u,

u = -/(с) = -sign

y kjXi + Ak-xl + Ak2x2 .і = - .

.(15)

Процесс определения допустимого управления по переменной состояния х3 приводит к ничтожно малому значению эффективности управления, что позволяет в (14) и (15), соответственно, пренебречь слагаемыми с3Дк2 и Ак3 х3.

0

x. = x

2

- 3

Получаем функциональное уравнение Беллмана для системы (15) и функционала (14):

mm

Ak,, Ak-

dv

У a,X2 + CjAk? + c2Ak\ + — x2 +

+ dx"(- Ю02Xi + ахз) + dx"(- азіХ3 + ¿29з(a)) x

x І у ktxt + Ak1 x1 + Ak2x21 = 0.

V i =1

После дифференцирования получаем

Ak = -¿я+а! &

C1 дХз

=

C2 0X3

(16)

(17)

Подставляя (17) в (16), получаем в итоге модифицированное уравнение Гамильтона - Якоби - Бел-лмана вида

» =3 dV W. 2 , .

У aiX2 + — X2 + dx (-®2X1 - ^рХз) -i= 1 1 2

dV и =3

- dX"(a31X3 + bq2(a)) у k,X, =

« = 2 X2

У

i = 1

4c2

М2 (a)

dV"l

dX3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(18)

Решение этого уравнения аппроксимируется последовательностью степенных форм

У(х) = V29(х) = V2(х) + V4(х) + V6(х)... (19)

9 = 1

Параметры квадратичной и последующих форм определяются из системы линейных алгебраических уравнений. Окончательно получаем субоптимальный закон управления:

и = -sign[ кххх + к2 х2 + к3 х3 +

Я2(a)у

2 x--_ dVV

2c dX3

Используя только квадратичную форму последовательности степенных форм (10), получаем нелинейный закон управления:

и = -sign[ k1X1 + k2X2 + k3X3 + (k21 X2 + k2X) x

x (k31X1 + k32X2 + k33X3) . (20)

Исследование динамики замкнутого контура с синтезированным регулятором произведено методом цифрового моделирования. На рис. 3 представлены переходные процессы изменения угла ф и управления и при отработке начального отклонения в 0,5 рад и ограничении на управление.

Рис. 3. Результаты моделирования

ЗАКЛЮЧЕНИЕ

Таким образом, исходная нелинейная задача АКОР для функционала (7) и системы (1) свелась к решению задачи минимизации квадратичного функционала (10) на решении линеаризованной системы (1), т. е. к решению ряда линейных задач АКОР. Дальнейшие исследования по синтезу систем управления желательно осуществить для нелинейной модели транспортируемого груза по фазовым координатам при ограничении управления. Предложенная методика позволяет существенно усилить вычислительную эффективность процедуры АКОР, что крайне важно при решении прикладных задач высокой размерности.

СПИСОК ЛИТЕРАТУРЫ

1. Динамика машин и управление машинами / под ред. Крейнина Г. В. - М. : Машиностроение, 1988. - 240 с.

2. Терехов, В. М. Системы управления электроприводов / Терехов, В. М., Осипов О. И. - М. : Академия, 2005. -240 с.

3. Герасимяк, Р. П. Электроприводы крановых механизмов / Герасимяк Р. П., Параил В. А. - М. : Энергия, 1970. - 136 с.

4. Герасимяк, Р. П. Анализ и синтез крановых электромеханических систем / Герасимяк Р. П., Лещев В. А. -Одесса: СНИЛ, 2008. - 192 с.

5. Федунов, Б. Е. Синтез оптимального по быстродействию управления колебательным звеном /Б. Е. Федунов // Известия РАН. Теория и системы управления. -2000. - № 3. - С. 78-84.

6. Крутько, П. Д. Исследование динамики субоптималь-ных по быстродействию автоматических систем / П. Д. Крутько // Известия РАН. Теория и системы управления. - 2004. - № 2. - С. 16-33.

7. Беллман, Р. Методы вычислений : избранные главы // Автоматика и телемеханика. - 1993. - № 8. - С. 3-39 ; № 9. - С. 3-51; № 10. - С. 3-43.

8. Булатов, В. Н. Методы погружения в задачах оптимизации / Булатов В. Н. - Новосибирск : Наука, 1977. -154 с.

9. Кудин, В. Ф. Аналитическое конструирование нелинейных регуляторов с помощью метода гармоничес-

2

кой линеаризации // Электромеханика. Известия ВУЗов. - 1989. - № 9. - С. 60-66.

10. Kudin, V. Sinthesis of suboptimal nonlinear regulator by immersion method / Kudin V., Kolachny I. // Jour. Electrical engineering. - 1998. - Vol. 49, № 1-2. - Pp. 11-15.

11. Miele, A. General variational theory of the flight paths of rocket-powered aircraft, missiles and satellite carriers / Miele A. // Astronant Acta. - 1958. - Vol.4. - Pp. 264-288.

12. Хованский, А. Н. Приложение цепных дробей и их обобщений к вопросам приближенного анализа / Хо -ванский А.Н. - М. : Гостехиздат, 1956.- 203 с.

13. Попов, Е. П. Прикладная теория процессов управления в нелинейных системах / Попов Е. П. - М. : Наука, 1973. - 584 с.

14. Пальтов, И. П. Качество процессов и синтез корректирующих устройств в нелинейных автоматических системах / Пальтов И. П. - М. : Наука, 1975. - 367 с.

15. Кринецкий, И. И. Расчет нелинейных автоматических систем / Кринецкий И. И. - Киев : Техника, 1968. -312 с.

Надійшла 07.10.2010

КудінВ. Ф., Колесніченко С. П.

СУБОПТИМАЛЬНЕ НЕЛІНІЙНЕ КЕРУВАННЯ ЗА КРИТЕРІЄМ ШВИДКОДІЇ НА ОСНОВІ МЕТОДУ БЕЛ-ЛМАНА - ЛЯПУНОВА

Розглядається загальнотеоретична задача синтезу субоп-тимального нелінійного керування на прикладі двомасової електромеханічної системи керування крановим механізмом пересування з урахуванням гасіння коливань

транспортного вантажу. Задача вирішується на базі методу Беллмана - Ляпунова з використанням концепції «інваріантного занурення» за критерієм швидкодії. Проведено дослідження динаміки замкнутої системи із синтезованим субоптимальньїм регулятором.

Ключові слова: електромеханічна система, аналітичне конструювання регуляторів, критерій швидкодії, нелінійне керування, метод Беллмана - Ляпунова.

Kudin V. F., Kolesnichenko S. P

SUBOPTIMUM NONLINEAR CONTROL BY OPERATION SPEED CRITERION BASED ON BELLMAN-LYAPU-NOV METHOD

A general-theoretical task of suboptimal nonlinear control algorithm synthesis is discussed. As an example, a two-mass electromechanical control system of a crane moving mechanism is examined taking into account load oscillations damping. The task is solved on the basis of Bellman-Lyapunov method using the concept of «invariant immersion» by operation speed criterion. The dynamics of a closed-loop system with a synthesized suboptimal regulator is investigated.

Key words: electromechanical system, analytical regulator syntethis, operation speed criterion, nonlinear control, Bell-man-Lyapunov method.

УДК 629.424.2

Орловский И. А.

Канд. техн. наук, доцент Запорожского национального технического университета

ИДЕНТИФИКАЦИЯ МАТЕМАТИЧЕСКОЙ МОДЕЛИ В ВИДЕ ПОЛИНОМИАЛЬНОЙ РЕКУРРЕНТНОЙ НЕЙРОННОЙ СЕТИ И НАСТРОЙКА РЕГУЛЯТОРОВ ЭЛЕКТРОПРИВОДА С СЕРИЕСНЫМ ДВИГАТЕЛЕМ

Синтезированы математические модели электропривода с сериесным двигателем в виде полиномиальных рекуррентных нейронных сетей (ПРНС) по данным режима его работы. Исследованы способы идентификации параметров привода и зависимости момента сопротивления от скорости двигателя при задании специальных режимов работы и разных видов уравнений, описывающих нелинейности параметров. Выполнена настройка ПИ-регулятора скорости на полученной модели в виде ПРНС.

Ключевые слова: математическая модель, двигатель постоянного тока последовательного возбуждения, рекуррентная нейронная сеть, регулятор скорости, идентификация параметров.

ВВЕДЕНИЕ

В настоящее время имеется возможность применить в электроприводе (ЭП) с микропроцессорной системой управления (СУ) методы синтеза математических моделей электромеханических систем в виде нейронных сетей [1, 2] с последующей оптимальной настройкой регуляторов на этих моделях [3, 4]. Поиск с помощью различных алгоритмов оптимальных параметров регуляторов с помощью математических © Орловский И. А., 2011

моделей предъявляют повышенные требования к точности моделей и их обобщающим свойствам. В работах [5, 6] разработан метод синтеза математических моделей нелинейных электромеханических объектов в виде полиномиальных рекуррентных нейронных сетей (ПРНС), однако отсутствует методика идентификации с высокой точностью с помощью полученных моделей параметров объекта (как линейных, так и нелинейных). В работе [7]

Субоптимальное нелинейное управление по критерию быстродействия на основе метода Беллмана – Ляпунова Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Кудин В. Ф., Колесниченко С. П.

Похожие темы научных работ по математике , автор научной работы — Кудин В. Ф., Колесниченко С. П.

Текст научной работы на тему «Субоптимальное нелинейное управление по критерию быстродействия на основе метода Беллмана – Ляпунова»