Научная статья на тему 'Аналитическое конструирование оптимальных регуляторов для объектов с симметричными полиномиальными характеристиками'

Аналитическое конструирование оптимальных регуляторов для объектов с симметричными полиномиальными характеристиками Текст научной статьи по специальности «Математика»

CC BY
1123
105
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ / ФУНКЦИОНАЛЬНЫЙ РЯД ВОЛЬТЕРРА / КРИТЕРИЙ ОБОБЩЁННОЙ РАБОТЫ / АВТОМАТИЧЕСКОЕ УПРАВЛЕНИЕ

Аннотация научной статьи по математике, автор научной работы — Кирпа А. В., Ловчаков В. И., Шопин С. А.

Предложен метод аналитического конструирования регуляторов, оптимальных по критерию обобщённой работы, с использованием функциональных рядов Вольтерра для многомерных устойчивых объектов, описываемых дифференциальными уравнениями с полиномиальными нелинейностями фазовых координат и имеющих симметричные характеристики относительно начала координат.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYTICAL DESIGNING OF THE OPTIMUM REGULATORS FOR OBJECTS WITH THE SYMMETRIC POLYNOMIAL CHARACTERISTICS

The method of analytical designing of regulators, optimum by criterion of the generalized work, with use of functional ranks of Volterra for the multidimensional steady objects described by the differential equations with polynomial not linearities of phase coordinates and having symmetric characteristics concerning the beginning of coordinates is offered.

Текст научной работы на тему «Аналитическое конструирование оптимальных регуляторов для объектов с симметричными полиномиальными характеристиками»

УДК 681.513.5

A.В. Кирпа, канд. техн. наук, доц., (4872) 43-84-66, randwave@rambler.ru (Россия, Тула, ТулГУ),

B.И. Ловчаков, д-р техн. наук, проф., проф., (4872) 56-55-80, lovvi50@mail.ru (Россия, Тула, ТулГУ),

C.А. Шопин, асп., (4872) 40-27-25, sshopin@mail.ru (Россия, Тула, ТулГУ)

АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ ДЛЯ ОБЪЕКТОВ С СИММЕТРИЧНЫМИ ПОЛИНОМИАЛЬНЫМИ ХАРАКТЕРИСТИКАМИ

Предложен метод аналитического конструирования регуляторов, оптимальных по критерию обобщённой работы, с использованием функциональных рядов Воль-терра для многомерных устойчивых объектов, описываемых дифференциальными уравнениями с полиномиальными нелинейностями фазовых координат и имеющих симметричные характеристики относительно начала координат.

Ключевые слова: аналитическое конструирование, функциональный ряд Воль-терра, критерий обобщённой работы, автоматическое управление.

1. Введение. В работе [1] был предложен метод аналитического конструирования оптимальных регуляторов (АКОР) по критерию обобщённой работы с использованием рядов Вольтерра применительно к устойчивым стационарным многомерным объектам, динамика которых описывается дифференциальными уравнениями с полиномиальными нелинейностями фазовых координат. Настоящая работа продолжает и развивает данный метод АКОР в направлении сокращения вычислительных затрат для устойчивых стационарных многомерных объектов с полиномиальными нелинейностями фазовых координат, имеющих симметричные характеристики относительно начала координат фазового пространства.

2. Постановка задачи аналитического конструирования оптимального регулятора. Динамика многих стационарных объектов управления, имеющих полиномиальные нелинейности фазовых координат (полиномиальные объекты), с требуемой точностью может быть описана следующим дифференциальным уравнением:

X (t) + F' (X) = B (X)U (t), (1)

где t - время; X(t) - вектор размерности n фазовых координат объекта (точка вверху обозначает производную данной переменной по времени); F'(t) - вектор размерности n полиномиальных функций от компонентов вектора фазовых координат; B(X) - матрица размерности nxm коэффициентов при управляющих воздействиях; U(t) - вектор управления размерности m. При этом полагается, что компоненты вектора X(t) имеют физический смысл отклонения текущих координат объекта от заданных по каким-

либо причинам, т. е. уравнение (1) представляет собой описание возмущённого движения объекта.

Среди полиномиальных объектов (1), кроме выделенных в работе [1] объектов с несимметричными характеристиками (несимметричные полиномиальные объекты)

X (;) + Л^) + А 2 (Х(;) ® Х(;)) = В( Х)и(;), (2)

целесообразно выделить объекты с симметричными характеристиками относительно точки начала координат фазового пространства (симметричные полиномиальные объекты)

X (;) + А1Х(;) + А 3 (Х(;) ® Х(;) ® Х(;)) = в( Х)и(;), (3)

где А1? А2, А3 - матрицы размерностей пхп, пхп2 и пхп3 соответственно параметров стационарного объекта; Y®Z - кронекеровское произведение векторов (матриц) Y=(yij) и Z=(zij), которое определяется как блочная матрица Y®Z=(yij•Z) [2, с. 235].

Выделение объектов (2), (3) и их анализ имеет большое методологическое значение: во-первых, указанные объекты представляют для практики самостоятельный интерес, поскольку достаточно широко распространены, во-вторых, для них формулируемая далее задача управления решается значительно легче, чем для других полиномиальных объектов (1), вследствие наличия нелинейностей лишь второй или третьей степеней, в-третьих, описания полиномиальных объектов, содержащих нелинейные члены в виде произведений фазовых координат более высоких степеней, можно привести к виду (2) или (3) путём расширения пространства состояния объекта новыми координатами, представляющими собой произведения исходных координат (см. далее).

Целесообразность рассмотрения задачи АКОР не только для объектов (2), но и для объектов (3), определяется тем, что: во-первых, переход от описания (3) к описанию (2) увеличивает размерность вектора состояния объекта, а это, в свою очередь, значительно увеличивает объёмы вычислений при синтезе оптимального регулятора, и, во-вторых, переход от описания симметричного полиномиального объекта с высокой степенью нелинейности фазовых координат к уравнению (3) осуществить значительно проще, чем к уравнению (2).

Продемонстрируем последнее на примере объекта с полиномиальной нелинейностью пятой степени

3 5

х(;) + х(;) + а3х (;) + а5х (;) = Ьи(;). (4)

3

Введением новых координат Х1 (;) = х(;) и х2 (;) = Х1 (;), уравнение (4)

можно привести к виду (3), где

^ „ „ Л ^ и Л Лл^ллллл лЛ

А1=

а1 а3 ь 0 а5 0 0 0 0 0 0

0 3а1

Ь

, В(Х) =

2

3Ьх1 (;)

А 3=

у

V

0 3а3 0 3а5 0 0 0 0

Переход же от описания (4) к уравнению (2), во-первых, осуществляется неоднозначно, а, во-вторых, требуется не две, а три фазовые координаты. Один из вариантов введения координат следующий: х^) = x(t), 2 2

X2(t) = x1 ^), xз(t) = x 2(t). При этом получаем уравнение (2) с параметрами

/ 'а1 0 0 1 г ь л

А1 = 0 2а1 2а3 , Б(Х) = 2Ьх1 ^)

\ 0 ч 0 4а1 , ч 4bxl(t) х 2^),

Г 0 а3 а5 0 0 0 0 0 0 л

А2= 0 0 00 0 2а5 0 0 0

\0 0 00 0 4а3 0 0 4а5,

Задачу АКОР сформулируем следующим образом: требуется найти закон управления в функции координат U(X), образующий вместе с объектом (3) асимптотически устойчивую систему управления, переводящий её из произвольного начального состояния X(t=0)=Xo в конечное Х(;^да)=0 с минимальным значением функционала обобщённой работы (ФОР):

да

J = 1

т т 1

Xт ^)ОХ^) + Uт (t)RU(t) + -

4

rдS (X)Л т дХ

Б( X)R-1Б Т(Х) ^ дХ

dt, (5)

где S(X) - функция Беллмана-Ляпунова (изначально не определена и находится в процессе синтеза оптимального управления); О и R - заданные диагональные, положительно определённые матрицы, символ «Т» обозначает транспонированный вектор (матрицу).

3. Применение аппарата функциональных рядов Вольтера к симметричным полиномиальным объектам. В предлагаемом методе АКОР функциональные ряды Вольтерра (ФРВ) [3-6] применяются для приближённого аналитического определения свободного движения объекта управления (3), т. е. для решения уравнения

X ^) + А^^) + А 3 (Х^) ® Х^) ® Х^)) = 0 (6)

при начальных условиях Х^=0)=Х0, в виде

N ^, Х 0) = N1^, Х 0) + N 2^, Х 0) + N 3^, Х 0) + N ^, Х 0) + ..., где ^(^Х0) - ьый член ряда.

Для нахождения первого члена ФРВ, представляющего собой решение линейной части дифференциального уравнения [3-6], запишем линейную часть уравнения (3) в пространстве изображений Лапласа:

Х( р)(р1 + А1)-Х 0 = G (р),

где I - единичная матрица; G(p) - изображение входного сигнала (Ви(;)) объекта. На основе данного соотношения определяем передаточную и импульсную функции объекта:

0

W (Р) = = (Р! + А1 )-1 + H (*) = е - ^ ■

С(Р)

Соответственно, решение линейной части уравнения объекта (3) при отсутствии сигнала управления принимает вид:

X(Р) = (р1 + А1) 1Xо ■ N Xо) = е А1X

- А

•0-

(7)

Все последующие члены ФРВ для уравнения (6) можно формировать по рекуррентному соотношению

г - 2 г2 * {

N г (*, X о) = -! I | Н(* - т) А 3 [N Г1(х, X о) ®

г2 =1 гх =1 о

(8)

® N

г2 - Г1 +1

(т, X о) ® N г - г2 -1(т, X о)К г = 3, 5, 7, ■■.,

полученному на основе зависимостей, приведённых в работе [3].

Следует отметить, что для уравнения (6) члены ФРВ с чётными индексами обнуляются, так как в нём, вследствие симметричности характеристик относительно начала координат, отсутствуют полиномиальные слагаемые с чётными степенями фазовых координат.

Третий член ФРВ для уравнения (6) находим по выражению (8):

N 3(*, X о) = -| е "А1(*-т) А,

-А1т ® е -А1т ^ е "А1т

® е"

^т • (X о ® X о ® X о )■ (9)

В результате, аналитическое решение уравнения (6) свободного движение объекта (3) с точностью до двух ненулевых членов ФРВ (7) и (9) будет определяться функцией

N(*,Xо) = е-АXо + Б(*о ® Xо ® Xо), (Ю)

где

Б (*) = -| е

- А1 (*-т) ж | - А1Т -о. - А1 т^. - А1Т

14 ' А 31е 1 ® е 1 ® е 1

(11)

Как показывает опыт применения ФРВ в практических задачах, часто решение с инженерной точностью (с ошибкой менее 5 %) может быть представлено суммой двух-трёх членов ряда [4, 6]. На этом основании в дальнейшем соотношения (Ю) и (11), описывающие свободное движение нелинейного объекта (3) из произвольного начального состояния, непосредственно используются в решении целевой задачи АКОР.

4. Аналитическое конструирование оптимальных регуляторов для симметричных полиномиальных объектов. Согласно основной теореме А. А. Красовского, для устойчивого стационарного объекта (3) оптимальным в смысле минимума ФОР (5) является управление

и опт.( X) = - 2 к-1в т( X) ^

2 ©X

(12)

в котором функция Беллмана-Ляпунова S(X) является решением линейно-

е

о

о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

го уравнения в частных производных (уравнения Ляпунова)

rdS (X )лТ

F (X) = X Т QX, (13)

дХ

где F(X)=A1X(t)+A3(X(t)®X(t)®X(t)) - вектор размерности п нелинейных функций от фазовых координат.

Отметим, что решение уравнения Ляпунова (13) существует только для устойчивых объектов. В связи с этим метод решения задачи АКОР по критерию обобщённой работы применим непосредственно к устойчивым объектам.

Таким образом, синтез оптимальных управлений сводится к решению уравнения Ляпунова. Наиболее универсальной формой алгоритма управления, оптимального в смысле минимума ФОР (5), является алгоритм с прогнозирующей моделью [7], в котором функция Беллмана-Ляпунова определяется на основе известного (прогнозируемого) свободного движения управляемого объекта.

Алгоритмы с прогнозирующей моделью основаны на том факте, что на решении уравнения свободного движения объекта X ) + F (X) = 0 левая часть уравнения Ляпунова (13) обращается в полную производную функции Беллмана-Ляпунова S(X) по времени:

S ( X ) = № Т X = -№ Т F (X)

dX

dX

Отсюда следует

S = - X Т QX. (14)

Если объект при отсутствии сигнала управления асимптотически устойчив, т. е.

lim X(t2 )= 0, lim S [X(t2 )]= 0,

12 12

то интегрирование уравнения (14) в пределах t1=0, даёт

(

S (X о) = J N , X o)QN (t, X o)dt, 0

где X0=X(t=0) - начальное состояние движения объекта; N(t,X0)=X (t,X0) -траектория свободного движения объекта, зависящая от времени и начальных условий (решение в форме Коши).

В задаче АКОР начальным состоянием объекта в каждый момент времени является величина отклонения его координат от устойчивого состояния X=0, т. е. в полученном уравнении можно принять X=X0:

(

S (X) = J N , X )QN (t, X )dt. 0

Продифференцируем обе части последнего уравнения по X и при

условии, что Q является симметричной матрицей, получим:

а*х) = 2уЛх) (15)

эх 0 эх

Приближённое решение в форме Коши N(t,X) (при Х=Хо) для свободного движения объекта будем искать в виде ФРВ. Как известно [6], ряд Вольтерра для устойчивого объекта имеет соответствующую область сходимости О, содержащую начало координат фазового пространства Х. Так как в задаче АКОР по ФОР объект управления предполагается устойчивым (состояние Х=0 устойчиво с множеством притяжения, включающее О), то использование ФРВ в указанной области фазового пространства при решении рассматриваемой задачи оптимального управления является вполне правомерным.

На основе уравнения (10) при Х=Х0 и соотношений

— (А • М (Х) )Т =дМ!(Х) А Т,

ЭХ4 ; ЭХ

— (Х ® Х ® Х )Т = I ® (Х ® Х )Т + (Х ® Х )Т ® I + Х Т ® I ® Х Т

ЭХ ' \ ) \ )

(I - единичная матрица; А - матрица, состоящая из констант; М (Х) - матрица, элементы которой зависят от компонентов вектора Х) определяем

^ Х) = (е"А1?)Т + I®(Х®Х)Т +(Х®Х)Т ®I + ХТ ®I®ХТ]оТ(0. (16) ЭХ

Теперь подставим (10) при Х=Х0 и (16) в (15) и в обозначениях

да А Т

М1 = 21 е " А 1 Qe - , 17)

0

— да - А ТI -

М 2 = 21 е 1 QD (^, (18)

0

да

М3 = 21DТ {г)Qe- Аltdt, (19)

0

да

М4 = 21D T(t)QD(t)dt, (20)

0

Х[3] = Х ® Х ® Х, (21)

Р(Х) = I®(Х®Х)Т +(Х®Х)Т ®I + ХТ ®I®ХТ (22)

получим производную функции Беллмана-Ляпунова:

^^^ = М1Х + М 2 Х[3] + Р( Х) М 3 Х + Р( Х)М 4 Х[3]. ЭХ

В результате искомое управление (12) запишется как

и

опт.(Х) = — R В1 (X) • М1Х + М2Х1^ + Р(Х)М3X +

[3]

Р (X) М 4 X[з]]

. (23)

1 R-1в Т

2

Подводя итог, укажем, что согласно предлагаемому методу синтеза закон оптимального (в смысле минимума критерия (5)) управления для устойчивого стационарного симметричного полиномиального объекта (3) определяется выражением (23) с учётом соотношений (11), (17)-(22).

Поясним применение разработанного метода синтеза на примере.

Пример. Применим вышеописанный метод АКОР к симметричному полиномиальному объекту

23

х1 (*) + 10 х1 (*) + х1 (*) х 2 (*) + 2 х 2 (*) = 0.8м1 (*),

23

х2 (*) + 9х2 (*) - 2х1 (t)х2 (*) + 2х2 (t) = 0.7и2 (t),

(П.1)

который запишется в виде (3) с параметрами

10 0 0

А

1

(10 01

, А3 =

( 0 9,

00 00

0 0

2000

2 2

(0.8 0 Л

, В (X) = , 0 0.7 у

при коэффициентах ФОР (5)

(1200

° =( 0

0

1200

(1 01

, R =

, 0 1 у

Для нахождения оптимального управления сначала определяем функцию (11):

D ^) =

2x8

0 0 0 — (е 18

(е - 9*

19

Далее определяем величины (17)-(20):

- 28*

л л л - I -9* -28* 0 0 0 — I е - е

2

0 — (е

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

17

1

0 -(е

9

-27*

-10*

-27* - 9* -е

М1 =

2х 2

120 0

(

0 400

3

М 2 =

2x8

ЛТ

М 3

V 8х 2 у

000 000

- 60

19 800

111

000 000

- 240

37 200

27

М 4

8x8

(0 0 0 0 0 0 0 0 1

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 9265 0 0 0 - 62360

14763 208791

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0

0 0 0 - 62360 0 0 0 27760

208791

26973

Записываем выражения (21) и (22):

X

8x1

Р (X) =

2x8

3 2 2 2 2 2 2

х^ х 1 х 2 х 1 х 2 х 1 х 2 х 1 х 2 х 1 х 2 х 1 х 2

)т,

2

3 х^ 2х1 х 2 2х1 х2

х

2

0

х

х

2 х1 х 2 2

х

2

х

0

1 2 х1 х 2 х1 2 х1 х 2 2 х1 х 2 3 х 2

В результате получаем искомый закон управления (23):

и

опт.( Х) 2x1

- 48х1 + 2.53х1 • х| - 0.29х2 - 0.25х1 х2 + 0.12х2

46.67х2 + 2.2Ц2х2 - 0.76х1 х^ +10.37х2

- 0.44х^х2 + 0.52х1 х2 -1.08х2

V у

Согласно разработанному методу, точность решения задачи АКОР определяется точностью решения уравнения свободного движения объекта с помощью ФРВ. Для того чтобы наглядно представить на сколько точно в решаемом примере ФРВ приближен к истинному решению, на рис. 1 приведено свободное движение объекта (П.1) из начального состояния (2, 2) , полученное численным решением (которое наиболее точно отражает истинное решение) уравнения свободного движения объекта и с помощью ФРВ. На рис. 1: кривые 1 и 2 (сплошные) - численное решение для координат XI и х2 соответственно; кривые 3 и 4 (пунктирные) - решение в виде суммы двух членов ФРВ для координат XI и х2 соответственно.

Переходные процессы по компонентам векторов управления и состояния при движении управляемого объекта из начального состояния (2, 2)Т изображены на рис. 2 и 3 соответственно. На рис. 2 кривые 1 и 2 -первая и вторая координаты вектора управления соответственно. На рисунке 3 кривые 1 и 2 - первая и вторая координаты объекта соответственно.

Рис. 1. Свободное движение объекта

Рис. 2. Сигналы управления

Рис. 3. Движение объекта под воздействием сигналов управления

Объект (П.1) можно было бы привести к виду (2) и найти закон управления в соответствии с методом, изложенным в работе [1], но тогда пришлось бы вводить дополнительные координаты в вектор состояния X, что увеличило бы размерности матриц, используемых в расчётах, и, как следствие, увеличило бы затраты вычислительных ресурсов на решение задачи АКОР. Так, например, если бы пришлось ввести одну дополнительную координату, то процесс нахождения оптимального управления увеличил бы объём вычислений примерно в 1.9 раза, а если две дополнительных координаты - примерно в 6.5 раза.

Вышесказанное подтверждает целесообразность решения задачи АКОР для полиномиальных объектов с симметричными характеристиками в соответствии с методом, предложенным в пункте 4.

Список литературы

1. Кирпа А. В., Ловчаков В. И. Аналитическое конструирование оптимальных нелинейных регуляторов по критерию обобщённой работы с ис-

97

пользованием рядов Вольтерра // Изв. вузов. Электромеханика, 2007, № 2. С. 45-50.

2. Ланкастер П. Теория матриц / перевод с англ. С. П. Дёмушкина. 2-е изд. М.: Наука, 1982, 269 с.

3. Ку И., Вольф А. Применение рядов Вольтерра-Винера для анализа нелинейных систем. // Техн. Кибернетика за рубежом. М.: Машиностроение, 1968. С. 145-165.

4. Пупков К. А., Капалин В. И., Ющенко А. С. Функциональные ряды в теории нелинейных систем. М.: Наука, 1976. 448 с.

5. Пинчук В. М. Аппроксимация непрерывных процессов конечными рядами Вольтерра при помощи итеративной процедуры. // Автоматика, 1983, № 5. С. 39-46.

6. Аверина А. Д., Модяев А. Д. Исследование нелинейных систем управления на основе применения дискретных моделей. В кн. Дискретные нелинейные системы / А. Д. Аверина, А. Н. Герасимова, С. П. Забродин и др.; Под ред. Ю. И. Топчеева. М.: Машиностроение, 1982. С. 183-206.

7. Красовский А. А. Неклассические целевые функционалы и проблемы теории оптимального управления (обзор). Изв. АН СССР, Техническая кибернетика, 1992. № 1. С. 3-41.

A. V. Kirpa, V.I. Lovchakov, S.A. Shopin

ANALYTICAL DESIGNING OF THE OPTIMUM REGULATORS FOR OBJECTS WITH THE SYMMETRIC POLYNOMIAL CHARACTERISTICS

The method of analytical designing of regulators, optimum by criterion of the generalized work, with use of functional ranks of Vol-terra for the multidimensional steady objects described by the differential equations with polynomial not linearities of phase coordinates and having symmetric characteristics concerning the beginning of coordinates is offered.

Key words: analytical designing, a functional number of Vol-terra, criterion of the generalized work, automatic control.

Получено 20.11.12

i Надоели баннеры? Вы всегда можете отключить рекламу.