Научная статья на тему 'ОПТИМАЛЬНОЕ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ СИСТЕМАМИ'

ОПТИМАЛЬНОЕ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ СИСТЕМАМИ Текст научной статьи по специальности «Математика»

CC BY
126
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНАЯ СИСТЕМА / НЕЛИНЕЙНОЕ ПРЕОБРАЗОВАНИЕ / КВАЗИЛИНЕЙНАЯ ФОРМА / УПРАВЛЯЕМАЯ ФОРМА ЖОРДАНА / ЛИНЕАРИЗУЮЩЕЕ УПРАВЛЕНИЕ / ЛИНЕЙНЫЕ УРАВНЕНИЯ / НЕОПРЕДЕЛЕННЫЙ КВАДРАТИЧНЫЙ КРИТЕРИЙ / АНАЛИТИЧЕСКИЙ МЕТОД СИНТЕЗА / ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Гайдук Анатолий Романович, Плаксиенко Елена Антольевна

Проблема синтеза оптимального управления нелинейными системами, несмотря на давнюю историю развития, все еще не имеет исчерпывающего решения. Известные подходы к ее решению на основе принципа оптимальности Беллмана и принципа максимума Понтрягина в общем случае приводят к алгоритмам, осложненным необходимостью решения нелинейных уравнений в частных производных. Поэтому на практике вводятся различные упрощающие задачу допущения, которые чаще всего приводят к приближенным решениям. В данной работе метод синтеза оптимальных нелинейных систем управления разрабатывается, следуя А.А. Красовскому, применительно к неопределенному квадратичному критерию, а также к нелинейным системам, уравнения которых представлены в управляемой форме Жордана. Приводится определение управляемой формы Жордана уравнений нелинейных динамических систем с одним управлением. Доказана теорема существования линеаризующего управления. Показано, что решение задачи синтеза оптимального управления разработанным методом существует, если уравнения нелинейной системы представлены в управляемой форме Жордана. Приводятся аналитические соотношения, которые позволяют найти управление, оптимальное в смысле нелинейного квадратичного критерия, окончательный вид которого определяется в процессе синтеза. При этом используется решение алгебраического уравнения Риккати. Доказана оптимальность получаемого нелинейного управления. Дан пример синтеза оптимального управления нелинейной динамической системой. Показано, что разработанный метод может быть применен для синтеза оптимальных в смысле нелинейных квадратичных критериев управлений различными нелинейными системами.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Гайдук Анатолий Романович, Плаксиенко Елена Антольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMAL CONTROL OF NONLINEAR SYSTEMS IN TERMS OF A QUADRATIC CRITERION

The problem of nonlinear system optimum control design, despite a long history of development, has not been fully solved yet. The existing approaches to its solution based on the Bellman principle of optimality and the Pontryagin principle of maximum, generally, result in algorithms that require solving nonlinear partial differential equations. Therefore in practice to simplify the problem various assumptions which mostly result in an approximate solution are used. In this article a method for designing optimal nonlinear control systems is developed following A.A. Krasovsky, with regard to an uncertain quadratic criterion and also to nonlinear systems whose equations are expressed in the Jordan controlled form. The definition of the Jordan controlled form of equations of nonlinear dynamic systems with a single control input is given. The existence theorem of linearizing control which does not change the properties of the system is proved. It is shown that the solution of the problem of an optimum control design by the developed method exists if the equations of a non-linear system are expressed in the Jordan controlled form. Analytical expressions which allow finding an optimal control in terms of a nonlinear quadratic criterion whose final kind is determined during the design process are given. The solution of the Riccati algebraic equation is used. The optimality of the proposed nonlinear control is proved. An example of an optimal design of a nonlinear dynamic system control is given. It is shown that the developed method can be applied for designing optimal control in terms of nonlinear quadratic criteria for various nonlinear systems.

Текст научной работы на тему «ОПТИМАЛЬНОЕ ПО КВАДРАТИЧНОМУ КРИТЕРИЮ УПРАВЛЕНИЕ НЕЛИНЕЙНЫМИ СИСТЕМАМИ»

ISSN 1814-1196 Научный вестник НГТУ том 57, № 4, 2014, с. 7-18

http://journals. nstu. ru/vestnik Science Bulletin of the NSTU Vol. 57, No. 4, 2014, pp. 7-18

АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ AUTOMATIC CONTROL

И ИДЕНТИФИКАЦИЯ AND IDENTIFICATION

УДК 681.5.013

Оптимальное по квадратичному критерию управление

*

нелинейными системами

А.Р. ГАЙДУК1, Е.А. ПЛАКСИЕНКО2

1 347928, РФ, г. Таганрог, пер. Некрасовский, 44, Южный федеральный университет, доктор технических наук, профессор. E-mail: gaiduk_2003@mail.ru

2 3 4 7900, РФ, г. Таганрог, ул. Петровская, 45, Таганрогский институт управления и экономики, доцент.

E-mail: pumkad@mail.ru

Проблема синтеза оптимального управления нелинейными системами, несмотря на давнюю историю развития, все еще не имеет исчерпывающего решения. Известные подходы к ее решению на основе принципа оптимальности Беллмана и принципа максимума Понтрягина в общем случае приводят к алгоритмам, осложненным необходимостью решения нелинейных уравнений в частных производных. Поэтому на практике вводятся различные упрощающие задачу допущения, которые чаще всего приводят к приближенным решениям. В данной работе метод синтеза оптимальных нелинейных систем управления разрабатывается, следуя А.А. Красовскому, применительно к неопределенному квадратичному критерию, а также к нелинейным системам, уравнения которых представлены в управляемой форме Жордана. Приводится определение управляемой формы Жордана уравнений нелинейных динамических систем с одним управлением. Доказана теорема существования линеаризующего управления. Показано, что решение задачи синтеза оптимального управления разработанным методом существует, если уравнения нелинейной системы представлены в управляемой форме Жордана. Приводятся аналитические соотношения, которые позволяют найти управление, оптимальное в смысле нелинейного квадратичного критерия, окончательный вид которого определяется в процессе синтеза. При этом используется решение алгебраического уравнения Риккати. Доказана оптимальность получаемого нелинейного управления. Дан пример синтеза оптимального управления нелинейной динамической системой. Показано, что разработанный метод может быть применен для синтеза оптимальных в смысле нелинейных квадратичных критериев управлений различными нелинейными системами.

Ключевые слова: нелинейная система, нелинейное преобразование, квазилинейная форма, управляемая форма Жордана, линеаризующее управление, линейные уравнения, неопределенный квадратичный критерий, аналитический метод синтеза, оптимальное управление

DOI: 10.17212/1814-1196-2014-4-7-18

ВВЕДЕНИЕ

Известный метод аналитического синтеза оптимальных регуляторов (АКОР) является очень удобным и широко распространенным способом синтеза линейных оптимальных в смысле минимума квадратичного критерия систем управления [1, 2]. Этот метод при заданном критерии является полностью аналитическим, так как при постоянных параметрах линейных управляемых систем он позволяет найти параметры законов управления путем решения алгебраических уравнений Риккати. К недостаткам этого подхода относятся некоторая сложность формирования критерия, при котором обеспечивается требуемое качество управления, и необходимость измерения всех переменных состояния. Однако эти сложности легко преодолеваются применением итерационной процедуры, наблюдателей состояния и современных компьютерных технологий [2, 3].

* Статья получена 01 июля 2014 г.

Работа выполнена при поддержке РФФИ, проекты № 12-08-00249-а и № 14-08-01176-а.

Синтез оптимальных управлений нелинейными системами чаще всего осуществляют либо на основе линеаризованных уравнений систем [2], либо путем приближенного решения нелинейного дифференциального уравнения Гамильтона-Якоби-Беллмана [1, 4]. Фактически в случае нелинейных систем общего вида теряется основное преимущество оптимального подхода - аналитичность и простота методики синтеза. При этом и решение задачи синтеза, строго говоря, оказывается неоптимальным.

При синтезе нелинейных систем часто применяется двухэтапный подход, при котором сначала синтезируется управление, введение которого линеаризует модель исходной управляемой системы. На втором этапе синтезируется управление, обеспечивающее требуемые свойства замкнутой системы. Для этой цели могут применяться различные методы синтеза линейных систем как оптимальных, так и других типов. Так, в работах [5-8] уравнения нелинейной системы приводятся к канонической управляемой форме, что позволяет синтезировать оптимальное или инвариантное управление. Модальное управление нелинейным объектом аналогичным способом синтезируется в [9]. Основная трудность данного двухэтапного подхода состоит в нахождении линеаризующего управления и подходящего нелинейного функционала. Задача синтеза линеаризующего управления легко разрешается, если уравнения в отклонениях нелинейной системы представлены в управляемой форме Жордана.

В данной работе рассматривается основные особенности метода синтеза оптимальных в смысле минимума нелинейного квадратичного функционала нелинейных систем управления, уравнения которых представлены в управляемой форме Жордана (УФЖ) [10, 11]. В этом случае линеаризующее управление аналитически строится на основе стабилизирующего управления, предложенного в [10]. Поэтому вся процедура синтеза оптимальной в смысле квадратичного критерия нелинейной системы управления является аналитической. При этом необходимость применения итераций для обеспечения требуемого времени регулирования и желаемого характера переходных процессов, к сожалению, сохраняется, но относится лишь к этапу синтеза минимизирующей составляющей оптимального управления.

Значимость разработанного метода синтеза оптимальных управлений для практики обусловлена тем, что уравнения очень многих реальных нелинейных управляемых систем (объектов) либо имеют УФЖ (с точностью до обозначения переменных), либо могут быть приведены к этой форме невырожденным преобразованием переменных состояния [10, 11].

1. ФОРМУЛИРОВКА ЗАДАЧИ СИНТЕЗА Пусть нелинейная управляемая система описывается уравнениями в отклонениях:

Х;- = фг- (Х^ ..., Хг+1) , I = 1,П - 1, (1)

Хп =Фп (Х1, .••, Хп) +и , у = сХ , (2)

где Х},..., хп - отклонения переменных системы, т. е. х^ = xi -xi , I = 1, п ; фг-(Хь ..., Х^+1) = фг-(Х^ +1), I = 1,п -1 и Фп(Х^..., хп) = фп(Х) - нелинейные, дифференцируемые необходимое число раз по всем своим аргументам функции, причем фг- (0) = 0, / = 1, п ;

— т

и = и(Х)- искомое управление; Хг- = [Х1 ...Хг- ] - подвектор отклонений размерности I; оче-

~ — о о / , о \ о

видно, хп = х ; х = х (^ И0), И0 - векторы состояния и управления при невозмущенном движении рассматриваемой системы. Предполагается также, что переменные Хг-, / = 1, п доступны измерению.

Задача синтеза заключается в определении управления u как функции вектора x, при котором на траекториях нелинейной системы управления (1), (2) обеспечивается выполнение условия

J =J [ xTST (x)QS (х) х + ру2( x)(u - илин)2] dt ^ min, х еП x е Rn . (3)

Здесь постоянные диагональная матрица Q > 0 и число р > 0 выбираются, исходя из желаемого характера переходных процессов системы (1), (2); матрица £(х) и функция у^х) обусловлены синтезируемой в процессе решения задачи линеаризующей составляющей илин = илин(х) искомого оптимального управления иопт ; О% - область пространства Rn, в которой выполняются условия:

ф(хЬ •••, %+1)

дх,+!

>е> 0, i = 1, n -1, х еП x е R , (4)

где е - некоторое положительное число. Область О % включает точку х = 0 .

Определение. Если система уравнений (1), (2) удовлетворяет условиям (4), то она является «управляемой формой Жордана» [10].

Очевидно, каноническая управляемая форма Фробениуса является частным случаем УФЖ при (%) = +1, i = 1, п -1 (для п > 1) и фп (х) = -а,0%1 -ах - — _ап-1%п [5, 10].

Поставленная оптимизационная задача (1)-(3) при условии (4) решается в два этапа: на первом этапе синтезируется линеаризующее, а на втором - оптимальное управление.

2. СИНТЕЗ ЛИНЕАРИЗУЮЩЕГО УПРАВЛЕНИЯ

Это управление синтезируется тем же методом, который применяется для синтеза нелинейного стабилизирующего управления системами, уравнения которых имеют управляемую форму Жордана [10, 11]. При этом прежде всего вводится новый вектор состояния

Т

^ = w(X) = [м>1, ^2, ..., wn] системы (1), (2) следующим образом:

i-1 д w _ _ _

w1 = Щ = Е~— фу(ху+1) + Vlwi-1(Xi-1), i = 2п , (5)

V=1 дх.

v

где - некоторые константы. Из соотношений (5) и уравнений (1) следует, что переменные wi зависят в общем случае только от переменных ху, V = 1, i, т. е. wi = wi (%1 — Xi). Так как по условию функции фг- (х^+1) дифференцируемые и w(0) = 0, то нелинейное преобразование

w = w(х) в области Ох еRn можно представить в квазилинейной форме вида w = £(х)х, где £(х)- п х п -матрица. Причем в силу условий (4) det£(х) Ф 0 [11]. Поэтому в области

х еОх е R существует ограниченное обратное преобразование х = £ _1( ХМ х), где вектор w( х) определяется соотношениями (5).

При выполнении условия (4) в области Ох на основе уравнений (1), (2), (5) [10, 11] определяется управление

и = и(X, V) = -у-1 (X)[у2 (х) + X„•Мп(х)] - Фп (х) + У-1(, (6)

0

где

п—1

5 щ (X) „<

У1( х) =—-— =п-

I(х+1)

п—1

З Х„

г=1

ЗХ,

З щп (X) Х -У 2 (Х) = ^^3-Фу (хУ+1)' Х 6%

г +1

=1 З X,

(7)

у=1

V - новое управление - некоторая функция X или времени t.

Теорема 1. Если в некоторой области Ох выполняется условие (4) и управление определяется выражениями (5)-(7), то уравнения системы (1), (2) относительно вектора щ имеют следующий вид:

Щ = Лпщ + е„V , Лп =

—X,

1

0 —Х1

0

0

0

—X „

(8)

где е„ = [0 ... 0 1]' .

Матрица Л„ (8) при Хг = —X , г = 1, п, очевидно, совпадает с клеткой Жордана [12, с. 36] размера п х п . Именно, поэтому система уравнений (1), (2) при выполнении условия (4) в некоторой области Ох еRn называется «управляемой формой Жордана».

Доказательство. Второе выражение (5) с учетом уравнений (1) при г = 2, 3,..., п — 1 можно представить следующим образом:

Щ = Щ + Хщ, Щ = V/2 + Х2Щ ,

Щп = Щ п—1 +Х п-1Щп-1.

(9)

Далее, подставим управление и = и( X, у) (6) с учетом второго равенства (7) в уравнение (2) и умножим обе его части на У1 (X). В результате получим равенство

• п-—1 З щп (X) ~ — У1(Х>X = —Ъ—Г„— фуК+1» — хпЩпМ + V .

у=1

З X,,

Перенеся первое слагаемое из правой части этого равенства в его левую часть и учтя значение У1 (X) из первого равенства (7), будем иметь

п —1

V Зщп ^ -г ^ ч , Зщп(X) X - ,

^^-фу ^у+1» + —-X = —ХпЩп (х) + V .

у=1 ЗлТу З5Сп

(10)

Нетрудно видеть, что левая часть равенства (10) представляет собой производную по времени переменной щп . Поэтому (10) можно записать следующим образом: Щп = —Xпщп + V . Отсюда и из выражений (9) следует утверждение теоремы. Теорема 1 доказана.

Из (8) следует, что при выполнении условия (4) и и = и(X, у) (6) система (1), (2) эквивалентна системе (8), которая, очевидно, асимптотически устойчива, если все Хг > е > 0, г = 1, п . Так как преобразование щ = щ(X) (5) является взаимообратным и ограниченным, то положение равновесия X = 0 системы (1), (2), (6) при условии Хг >ег > 0, г = 1, п также является

асимптотически устойчивым в области ОX е Rn. Поэтому управление (6) при указанных условиях является стабилизирующим.

Таким образом, если уравнения некоторой нелинейной управляемой системы (объекта) представлены в УФЖ, то соотношения (5)-(7) позволяют аналитически найти управление

0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и = и(х, V), при котором положение равновесия х = 0 системы будет асимптотически устойчивым в большом. Другие свойства системы будут определяться конкретными значениями чисел и управления V. Примеры синтеза стабилизирующих управлений при V = 0 приведены в [10, 11].

Однако, соотношения (5)-(8) выполняются при всех значениях , в том числе и при = 0 , I = 1, п . При этом система (1), (2) по-прежнему будет нелинейной, но в переменных она будет описываться линейными уравнениями. Поэтому если определить переменные

_ г "1 т _ _

м>! = %, w1 (х) = Фv(Х+1), ' = 2,п , (11)

v=l зх.

то управление (6) можно записать в виде

и = илин +у"1( , илин =-у"1(Х)Г2(Х) -фп(х). (12)

Здесь функции у1( х) и у 2(х) по-прежнему определяются по формулам (7).

Управление (12) линеаризует систему (1), (2), но без целенаправленного изменения ее свойств. Как видно из соотношений (7), (11) и (12), линеаризующее управление определяется исключительно свойствами управляемой системы.

3. СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

В рассматриваемом случае оптимальное управление берется в виде (11), (12), где V = иШщ . Здесь иШщ - составляющая, обеспечивающая оптимальность искомого управления в смысле минимума функционала (3).

Уравнения (1), (2) при управлении и = илин +у"1(х)имин относительно вектора w (11) в соответствии с теоремой 1 имеют вид

^0 1 ... 0

= Л nw + enumin, Лп =

0 0 . 0

(13)

0 0 ... 0

Так как система (13) линейная, то управление, обеспечивающее минимум функционала

да

..т

J = | [wTQw + ритш] dt, (14)

0

на ее траекториях, как известно [1, с. 275 ], определяется выражением

__—1 т

иттМ = "Р enPw . (15)

Здесь Р - симметричная, положительно определенная матрица, являющаяся решением следующего уравнения Риккати:

РЛ п +ЛТпР — Рвпр-^Р + Q = 0. (16)

Решение оптимизационной задачи (1)-(3) при условии (4) определяется следующей теоремой.

Теорема 2. Если управление илин = илин(X) определяется выражениями (11), (12) при V = иШщ, то оптимальное управление, доставляющее на траекториях замкнутой нелинейной системы (1), (2) минимум функционалу (3), определяется выражением

иопт = илин(Х) + ит1п(Х) = илин(Х)-уГ1(Х)Р_1е«^РЯ(Х)Х . (17)

Доказательство. При управлении (15) система (13) в силу теоремы 3.7 из [1, с. 275] является асимптотически устойчивой в целом. С другой стороны, преобразование ^ = X) (11), как и (5), является взаимообратным, непрерывным и ограниченным в силу условия (4). Поэтому положение равновесия Х = 0 системы (1), (2) при и = иопт (17) является устойчивым. Следовательно, в интегралах (3) и (14) верхний предел можно заменить на достаточно большое значение ^ и без потери общности записать их следующим образом:

Ч Ч

7 = | [ХТ£Т (Х)^Я(Х)Х + ру2 (Х)(и - илин)2] dt, 7 = _[ [м>Т^ + рй,^ ] dt. (18)

0 0

Если определенный интеграл

7Х = | F (м>, и) dt 0

имеет минимум по и, то согласно [13, с. 322] существует такое положительное число еи, что

'1 '1 _ Д31 = \^(м>,и)dt = и)5и dt > 0 при 0 <|5й| <еи, (19)

0 0 ди

где 5 м - произвольная вариация функции м .

По отношению ко второму функционалу 7 (18), эквивалентному функционалу (14), фигурирующие в (19) частная производная и вариация с учетом выражения (15) определяются выражениями:

дF(м> и ■ ) _ т — —1 т -Ш1П = 2Рит1п = —2е„Р^ , а 5ит1п = —Р епР ^ ,

дит1п

где 5^ = [5^1, 5^2, ..., ]Т - вариация вектора w .

Так как функционал (14) по теореме 3.7 [1, с. 275 ] имеет минимум при управлении ит1п (15), то по формуле (19) существует такое еи, что выполняются неравенства

'1

-1„ т

Д31 =| 2eTPw р 1еТР 5wdt > 0 при 0 < 0

р- 1еТР 5w

(20)

В силу ограниченности вектора w (') при конечных значениях w (0) и обратимости преобразования w = w( X) = Я (X) X вектор Х также ограничен. Матрица Я (X) при всех ограниченных X е Ох является ограниченной и дифференцируемой по Х. Поэтому вариация 5 w в соответствии с леммой, приведенной в (П.1) (см. приложение), связана с вариацией вектора Х ра-

[Т Т Т Т Т

[X (Я (X))'] + Я(X) ^ . Выражение (Я (Х))' = дБ (Х)/дХ можно рассмат-

<еи.

ривать как п х п -матрицу, (г, ]') -элементом которой является вектор-строка градиента дSjj(х)/дх, а 5х = [5Х1, 5Х2, ..., 8хп]т - вариация вектора х. С учетом приведенных выражений неравенства (20) можно представить следующим образом:

ДJ1 = ||—2eTPS(х)х||—р—11еТР[[хт (ST (х))']т + S(х)^5х| dt > 0 (21)

при

0 <

р—1еТР[[хТ (SТ (х))']Т + S(х)]8х

(22)

Для доказательства теоремы покажем, что из неравенств (21), (22) следуют условия, аналогичные неравенствам (19) по отношению к функционалу (3), если в системе (1), (2) используется управление (17). С этой целью найдем фигурирующую в (19) частную производную по и = иопт , соответствующую интегралу J (18), который эквивалентен функционалу (3). Дифференцируя первое выражение (18) по и и учитывая равенство (17), получим

дF и)

ди

= 2ру12(х)(иодт — илин) = —2У1 (x)eTnPS(х)х . (23)

Так как составляющая илин однозначно определяется заданными уравнениями системы (1), (2), то вариация 5иопт оптимального управления (17) с учетом указанной выше леммы определяется выражением

8иоПТ(х) = —р~Хе1пР[[хТ (х))']Т + S(х)]8х. (24)

Нетрудно видеть, что, подставляя выражения (23) и (24) в (19), получим условия минимума функционала (3) по оптимальному управлению (17), полностью совпадающие с неравенствами (21) и (22). Так как последние, как показано выше, выполняются, то выполняются и условия минимума функционала (3) по управлению (17). Теорема 2 доказана.

Фактически можно сказать, что из оптимальности управления мт;п = мт;п следует оптимальность управления (17). Это управление, очевидно, определяется свойствами нели-нейностей системы (1), (2), матрицей Q и коэффициентом р . Так как нелинейности заданы и не могут варьироваться, то свойства оптимальной нелинейной системы управления объектом (1), (2) можно изменять, как и в линейном случае, путем выбора значений элементов матрицы Q и коэффициента р , т. е. варьируемых параметров функционала (3).

Метод аналитического синтеза оптимальных уравнений нелинейными объектами, вытекающий из приведенных соотношений, покажем на примере синтеза оптимального управления для системы, рассматривавшейся в работах [7, с. 188] и [9].

<е„

и=и

4. ЧИСЛЕННЫЙ ПРИМЕР СИНТЕЗА Для системы, которая описывается уравнениями

Х1 = Х2, Х2 = Х3 + и , Х3 = Х1 + СХ3 , (25)

где с Ф 0 - постоянный коэффициент, найти оптимальное управление, обеспечивающее минимум функционала (3), где матрица S(х) и функция у1(х) определяются управлением

илин = илин (X), линеаризующим уравнения системы (25), матрица Q = diag[2, 6, 8], а

3

р = 0,5. Переменные состояния измеряются; Оx - это область в R , где уравнения (25) имеют УФЖ.

Форма уравнений (25), очевидно, не является УФЖ. Однако, эти уравнения легко привести к этой форме, просто переобозначив переменные следующим образом: X! = X2, X2 = Xз, Xз = Xl. В результате уравнения рассматриваемой системы принимают вид

• 3 • • 3

Х1 = cXl + X2 = Ф1(Х), .Г2 = Xз = Ф2 (Х), Х3 = Х1 + и = ф3(Х1) + и , (26)

причем дф1 / дX2 = дф2 / дXз = 1. Следовательно, уравнения (26) имеют УФЖ при всех X е R , т. е. поставленная задача может быть решена предлагаемым методом. В соответствии с изложенным выше сначала синтезируется линеаризующее управление. С этой целью по (11) строится нелинейное преобразование переменных:

3 2 / 3 \

Wl = Xl, W2 = Х2 + СХ1 , wз = Xз + 3сХ1 I Х2 + СХ1 I

или в векторно-матричной форме

(27)

w( X) = Я (X) X, Я (Х) =

0 0 1 0

сХ^

3с2 Х4 3сХ12 1

(28)

Преобразование (27), (28) является непрерывным и взаимообратным при всех X е R 1X1 < ж , что позволяет по формулам (7) найти функции у1( X) и у 2^):

У1 (X) = 1, у 2 (Х) = 6cXlX2 + 21с2Х4Х2 + 15с3Х7 + 3сХ^Х3 .

(29)

Теперь линеаризующее управление записывается по формуле (12) при ф3( Х) = Х1 и V = и,

—1 3

и = илин + У1 (Х)ит1п , илин (Х) = —У 2 (Х) — Х1 .

(30)

Определение оптимального управления по выражениям (13)-(17). Матрица Р как решение уравнения Риккати (14) [3] при заданной матрице Q = diag {2, 6, 8} и р = 0,5 имеет вид

Р =

5,742 5,243 1,000 5,243 14,051 2,871 1,000 2,871 2,621

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(31)

Оптимальное управление по (17) с учетом матриц Я(X) (28), Р (31), величины У1(X) = 1 и р = 0,5 определяется выражением

иопт (^ = илин (^ — С3 (^ •

(32)

где

С3(Х) = 2Х1 + 5,742сХ13 + 15,728сХ15 + 5,742Х2 + 15,728сХ12Х2 + 5,243Х3 .

(33)

1

Итак, искомое оптимальное управление, обеспечивающее минимум функционала (3) с заданными матрицей Q , коэффициентом р = 0,5, матрицей S(х) (28) и величиной у1 (х) = 1,

согласно (30), (32) и обозначениям (29) и (33) имеет вид иопт(х) = —у2(х) — х1 —Сэ(х). Наконец, возвращаясь от переменных хг к исходным переменным хг, г = 1, 2, 3, получим

иопт (х) = —Т2 (х) — х| — Сэ (х), (34)

где

у2 (х) = 6сх3х2 + 21с2х4х1 + 15с3х^ + 3сх:2х2 , С3(х) = 2х3 + 5,742сх3 + 15,728сх3 + 5,742х1 + 15,728сх2х1 + 5,243х2 .

Для реализации оптимального управления (34) требуется измерение всех переменных состояния, что не всегда возможно. В данном случае эту проблему можно разрешить, как показано в [9], применив наблюдатель состояния, если измеряется переменная х3.

ЗАКЛЮЧЕНИЕ

Аналитически найти оптимальное управление нелинейной системой можно, если ее уравнения представлены в управляемой форме Жордана. Оптимальное управление в этом случае синтезируется на основе линейных уравнений системы, которые находятся в результате применения линеаризующего управления. Последнее является частным случаем стабилизирующего управления, которое строится непосредственно по уравнениям нелинейной системы в управляемой форме Жордана. Необходимость приведения уравнений системы к управляемой форме Жордана не является сильным ограничением, так как уравнения очень многих реальных нелинейных систем имеют управляемую форму Жордана или могут быть приведены к ней путем замены переменных. Методика синтеза оптимального нелинейного управления показана на примере.

СПИСОК ЛИТЕРАТУРЫ

1. Квакернаак Х., Сиван Р. Линейные оптимальные системы управления. - М.: Мир, 1977. - 650 с.

2. Справочник по теории автоматического управления / под ред. А.А. Красовского. - М.: Наука, 1987. - 711 с.

3. Дьяконов В., Круглов В. Математические пакеты расширения MATLAB. - СПб.: Лань, 2011. - 287 с.

4. Stengel R.F. Optimal control and estimation. - New York: Dover Publ., 1994. - 639 p.

5. Краснощеченко В.И., Крищенко А.П. Нелинейные системы: геометрические методы анализа и синтеза. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2005. - 519 с.

6. Ким П.Д. Теория автоматического управления. Т. 2. Многомерные, нелинейные, оптимальные и адаптивные системы. - М.: Физматлит, 2004. - 464 с.

7. Никифоров В.О. Нелинейная система управления с компенсацией внешних детерминированных возмущений // Известия РАН. Теория и системы управления. - 1997. - Т. 36, № 4. - С. 69-73.

8. GaidukA.R. Control systems design with disturbance rejection based on JCF of the nonlinear plant equations // Facta Universitatis, Series: Automatic Control and Robotics. - 2012. - Vol. 11, N 2. - P. 81-90.

9. Иванов А.Е. Построение регулятора модальным методом для нелинейного объекта // Сборник научных трудов НГТУ. - 2014. - № 2 (76). - С. 7-15.

10. Гайдук А.Р. Синтез нелинейных систем на основе управляемой формы Жордана // Автоматика и телемеханика. - 2006. - № 7. - С. 3-13.

11. Гайдук А.Р. Теория и методы аналитического синтеза систем автоматического управления (полиномиальный подход). - М.: Физматлит, 2012. - 360 с.

12. Демидович Б.П. Лекции по математической теории устойчивости. - М.: Наука, 1967. - 472 с.

13. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. - М.: Наука, 1968. -

720 с.

ПРИЛОЖЕНИЕ

Лемма. Пусть S(х) - дифференцируемая по х п х п -матрица. Если п-векторы V и х связаны соотношением V = S(х)х, то

(

=

Т д (х)

д х

т I

+ S (х)

5х = [[хт (£т (х))']т + £(х)^5х , (П.1)

где 5^ = [5^, 5^, ..., 5^п]т , 5х = [5х,, 5£2, ..., 5хп]т .

Доказательство. Покажем справедливость леммы при п = 2. Доказательство при произвольном значении п проводится совершенно аналогично, но громоздко в записи. Итак, пусть

S (х) =

Sll(x) S12( х) ^21 ( х) S22( х)

Из выражения V = S(х)х следует равенство 5^ = 5S(х)х + S(х)5х. Для доказательства леммы, как видно из (П.1), достаточно показать справедливость равенства

Т Т т

5S(х)х = [х (£ (х))'] 5х. С этой целью найдем сначала произведение

5S (х) х =

д£х) д х

(д Sll

д х

5х1 +

д^ ^ ,(дSl2

д х-

-5х2 I х1 +

2

д х

5х1 +-

д £

12

д х

5х2 I х2

2

' д S21 5х1 + д S21 5х2 I х1 +1 д S22 5х1 + д S22 5х2 I х2

д х

д х-

2

д х

д х-

2

(П.2)

С другой стороны,

( т д Sт (х)1Т

д х

[ х, х2 ]

д £п д £п д £21 д £21

д х, д х2 _ д х, д х2

д £12 д £12 д £22 д £22

д х, д х2 д х, д х2

д £11 ^11

д х, д х2

+ хп

д Sl2 д Sl2

д х, д х2

д S2l д S2l

д х, д х2

+

д S22 д £

22

д х, д х-

2

Выполняя сначала суммирование в элементах данного вектора-строки, а затем транспонирование, получим п х п -матрицу

( т д !5т (х)1Т

д х

д S11 д £19

—11 х, +—- х2

д х,

д £21

д х.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

д х,

д £ц д —11 х, + —12х2

д £22 х1 + х2

д х,

д х2 д £21

д

д х2

д £22 х1 + х2

д

х =

т

(

т

(

= х

х

1

Умножая обе части полученного равенства на вектор-столбец 5 х, будем иметь

f d Su d Sl2 \ fd Su d S12 ^

(П.З)

Сравнивая векторы в правых частях равенств (П.2) и (П.3), заключаем, что векторы в их левых частях тождественно равны. Отсюда следует справедливость равенства (П.1). Лемма доказана.

Гайдук Анатолий Романович, доктор технических наук, профессор Южного федерального университета, действительный член Академии инженерных наук имени А.М. Прохорова. Основное направление научных исследований - теория систем автоматического управления, анализ и синтез. Имеет более 300 научных публикаций, в том числе 16 монографий. E-mail: gaiduk_2003@mail.ru

Плаксиенко Елена Анатольевна, доцент Таганрогского института управления и экономики. Основное направление научных исследований - управление в технических и экономических системах. Имеет более 40 публикаций, в том числе две монографии. E-mail: pumkad@mail.ru

Optimal control of nonlinear systems in terms of a quadratic criterion'

A.R. GAIDUK1, E.A. PLAKSIENKO2

1 Southern Federal University, 44 Nekrasovskiy Pereulok, Taganrog, 347928, Russian Federation, D.Sc. (Eng.), professor. E-mail: gaiduk_2003@mail.ru

2 Taganrog Institute of Management and Economy, 45 Petrovskaya Street, Taganrog, 347900, Russian Federation, PhD(Eng.) associate professor. E-mail: pumkad@mail.ru

The problem of nonlinear system optimum control design, despite a long history of development, has not been fully solved yet. The existing approaches to its solution based on the Bellman principle of optimality and the Pontryagin principle of maximum, generally, result in algorithms that require solving nonlinear partial differential equations. Therefore in practice to simplify the problem various assumptions which mostly result in an approximate solution are used. In this article a method for designing optimal nonlinear control systems is developed following A.A. Krasovsky, with regard to an uncertain quadratic criterion and also to nonlinear systems whose equations are expressed in the Jordan controlled form. The definition of the Jordan controlled form of equations of nonlinear dynamic systems with a single control input is given. The existence theorem of linearizing control which does not change the properties of the system is proved. It is shown that the solution of the problem of an optimum control design by the developed method exists if the equations of a non-linear system are expressed in the Jordan controlled form. Analytical expressions which allow finding an optimal control in terms of a nonlinear quadratic criterion whose final kind is determined during the design process are given. The solution of the Riccati algebraic equation is used. The optimality of the proposed nonlinear control is proved. An example of an optimal design of a nonlinear dynamic system control is given. It is shown that the developed method can be applied for designing optimal control in terms of nonlinear quadratic criteria for various nonlinear systems.

Keywords: nonlinear system, nonlinear transformation, quasilinear form, Jordan controlled form, linearizing control, linear equations, uncertain square criterion, analytical design method, optimal control

1. Kwakernaak H., Sivan R. Linear optimal control systems. New York, John Wiley & Sons, 1972. 575 p. (Russ. ed.: Kvakernaak Kh., Sivan R. Lineinye optimal'nye sistemy upravleniya. Moscow, Mir Publ., 1977. 650 p.).

2. Krasovskii A.A., ed. Spravochnikpo teorii avtomaticheskogo upravleniya [Mathematical handbook on the theory of automatic control]. Moscow, Nauka Publ., 1987. 711 p.

* Received 1 July 2014.

The work was supported by the Council under grants of the Russian Federation President and RFBR, projects no SS-1557.2015.10 and no 12-08-00249

REFERENCES

3. D'yakonov V., Kruglov V. Matematicheskie pakety rasshireniya MATLAB [Mathematical packages of expansion MATLAB]. St. Petersburg, Lan' Publ., 2011. 287 p.

4. Stengel R.F. Optimal control and estimation. New York, Dover Publications Inc., 1994. 639 p.

5. Krasnoshchechenko V.I., Krishchenko A.P. Nelineinye sistemy: geometricheskie metody analiza i sinteza [Nonlinear systems: geometrical methods ofthe analysis and design]. Moscow, Bauman MSTU Publ., 2005. 519 p.

6. Kim P.D. Teoriya avtomaticheskogo upravleniya. T. 2. Mnogomernye, nelineinye, optimal'nye i adaptivnye sistemy [The theory of automatic control. Vol. 2. Multivariable, nonlinear, optimal and adaptive systems]. Moscow, Fizmatlit Publ., 2004. 464 p.

7. Nikiforov V.O. Nelinejnaya sistema upravleniya c kompensatsiej vneshnikh determinirovannykh vozmuschenij [Nonlinear control system with compensation of external deterministic perturbations]. Izvestiya Rossiiskoi akademii nauk. Teoriya i sistemy upravleniya — Journal of Computer and Systems Sciences International, 1997, vol. 36, no. 4, pp. 69-73. (In Russian)

8. Gaiduk A.R. Control systems design with disturbance rejection based on JCF of the nonlinear plant equations. Facta Universitatis. Series: Automatic Control and Robotics, 2012, vol. 11, no. 2, pp. 81-90.

9. Ivanov A.E. Postroenie regulyatora modalynym metodom dlya nelinejnogo obyekta [Synthesis of regulator for nonlinear obj ect by modal method]. Sbornik nauchnyh trudov NGTU — Transaction of Scientific Papers ofNovosibirsk State Technical University, 2014, no. 2 (76). pp. 7-15.

10. Gaiduk A.R. Sintez nelineinykh sistem na osnove upravlyaemoi formy Zhordana [Design of nonlinear systems based on the controllable Jordan form]. Avtomatika i telemekhanika — Automation and Remote Control, 2006, vol. 67, iss. 7, pp. 1017-1027. doi: 10.1134/S0005117906070010

11. Gaiduk A.R. Teoriya i metody analiticheskogo sinteza sistem avtomaticheskogo upravleniya (polinomial'nyi podkhod) [Theory and methods of automatic control systems analytical design (polynomial approach)]. Moscow, Fizmatlit Publ., 2012. 360 p.

12. Demidovich B.P. Demidovich B.P. Lektsii po matematicheskoi teorii ustoichivosti [Lectures on the mathematical theory of stability]. Moscow, Nauka Publ., 1967. 472 p.

13. Korn G.A., Korn T.M. Mathematical handbook for scientists and engineers: Definitions, theorems and formulas for reference and review. New York, McGraw-Hill, 1961. (Russ. ed.: Korn G., Korn T. Spravochnikpo matematike dlya nauch-nykh rabotnikov i inzhenerov. Moscow, Nauka Publ., 1968. 720 p.).

ISSN 1814-1196, http://journals.nstu.ru/vestnik Science Bulletin of the NSTU Vol. 57, No. 4, 2014, pp. 7-18

i Надоели баннеры? Вы всегда можете отключить рекламу.