Научная статья на тему 'Алгоритмы структурно-параметрического синтеза оптимального управления стохастическими динамическими объектами'

Алгоритмы структурно-параметрического синтеза оптимального управления стохастическими динамическими объектами Текст научной статьи по специальности «Математика»

CC BY
209
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ / СТОХАСТИЧЕСКИЙ ДИНАМИЧЕСКИЙ ОБЪЕКТ / УРАВНЕНИЕ ГАМИЛЬТОНА-ЯКОБИ-БЕЛЛМАНА-АЙЗЕКСА / OPTIMAL CONTROL SYNTHESIS / STOCHASTIC DYNAMICAL OBJECT / HAMILTON-JACOBI-BELLMAN-ISAACS EQUATION

Аннотация научной статьи по математике, автор научной работы — Пупков Константин Александрович, Фанг Фам Суан

Рассмотрена задача синтеза оптимального управления стохастическими динамическими объектами. Разработан алгоритм синтеза оптимального управления стохастическими системами, систематически изложены проблемы и методы оптимизации процессов в динамических системах управления. Рассмотрен численный пример синтеза закона оптимального управления нелинейным стохастическим динамическим объектом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Пупков Константин Александрович, Фанг Фам Суан

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Algorithms of Structural-Parametric Synthesis of Optimal Control of Stochastic Dynamical Objects

A problem of synthesis of optimal control of stochastic dynamical objects is regarded. An algorithm for synthesis of optimal control of stochastic systems is developed; problems and methods of optimization of processes in dynamical control systems are set forth systematically. The numerical example of synthesis of the optimal control law for a nonlinear stochastic dynamical object is considered. Refs. 6. Figs. 1.

Текст научной работы на тему «Алгоритмы структурно-параметрического синтеза оптимального управления стохастическими динамическими объектами»

УДК 62.50

К. А. Пупков, Фам Суан Фанг

АЛГОРИТМЫ СТРУКТУРНО-ПАРАМЕТРИЧЕСКОГО СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ СТОХАСТИЧЕСКИМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ

Рассмотрена задача синтеза оптимального управления стохастическими динамическими объектами. Разработан алгоритм синтеза оптимального управления стохастическими системами, систематически изложены проблемы и методы оптимизации процессов в динамических системах управления. Рассмотрен численный пример синтеза закона оптимального управления нелинейным стохастическим динамическим объектом.

E-mail: pupkov@iu1.bmstu.ru; phangvn@mail.ru

Ключевые слова: синтез оптимального управления, стохастический динамический объект, уравнение Гамильтона-Якоби-Беллмана-Айзекса.

В современной теории оптимального управления стохастические проблемы являются наиболее трудными и их эффективное решение во многом определяется применением различных методов. Эти проблемы имеют теоретический и практический аспекты. Развитие теоретических вопросов стохастической оптимизации происходит на основе совершенствования методов решения и получения оптимальных структур, законов управления, а также путем разработки подходов к синтезу алгоритмов определения оптимального управления стохастическими динамическими объектами [1-3].

Стохастические задачи в современной теории динамических систем начали разрабатываться недавно. Поэтому эти задачи и их решения не нашли в литературе достаточного освещения, кроме статей по отдельным вопросам.

Актуальность исследований в этом направлении обусловливается необходимостью наиболее точного описания нелинейных систем управления, учитывающего воздействие на объект управления случайных факторов в предположении неполноты информации о состоянии объекта. В настоящей статье предлагается алгоритм синтеза закона оптимального управления стохастическими динамическими объектами методом аппроксимации Галеркина. Оптимальное управление позволяет установить структуру систем управления и регулирования, рассчитать оптимальные параметры их динамической настройки, которые обеспечивают предельно высокие показатели качества при учете реальных ограничений, накладываемых на переменные в условиях сложного воздействия окружающей среды.

Рассмотрим задачу синтеза оптимального управления стохастическими динамическими объектами [4-6].

Задана математическая модель объекта управления - модель нелинейной стохастической системы при воздействии на нее случайного сигнала:

х = f (х) + д(х)и(х) + к(х)ш(£); У = Мх)

где f (х), д(х), к(х), Л,(х) — векторы, зависящие от параметров системы; — случайный сигнал воздействующий на систему; и(х) — управление.

Требуется найти управление, доставляющее экстремум:

т т

! (||у(£)||2 + ит(¿)Яи(£))^ < 72 ^ (шт(¿)Рш(£))^, (2) 0 0 где 7 — коэффциент уровня воздействия случайного сигнала на систему; Я, Р — корреляционные матрицы управления и случайного сигнала.

Начальная функция плотности вероятности состояния Ш(£,х), которая фиксирует состояние неопределенности в момент £ = 0, считается известной и равной Ш(0,х) = Ш0(х). Оптимальный закон управления имеет вид

и*(х) = -1 Я-У(х) ^^, (3)

где V*(х) — решениеуравненияГамильтона-Якоби-Беллмана-Айзекса (ГЯБА) вида

f+™+1 дv: с аи-* - ^=о. (4)

дх 4 дх \272 ) дх

Перепишем (4) в обобщенном виде

дVт 2 2 2

——(f + ди+кш) + НТН + ||и||л — 7 ||ш||Р = 0. (5)

Уравнение (5) описывает решение задач синтеза управления как при полной, так и при ограниченной информации о возмущениях на систему.

Отметим, что при сведении преобразованных нелинейных уравнений в частных производных к линейной задаче значение функции V* (х) для оптимального закона управления может быть получено путем итерации по начальному значению закона управления и0(х).

Разработка алгоритмов синтеза. Пусть и0(х) — начальное значение закона управления для динамической системы (1). Найдем итеративное решение уравнения (5).

Разработка алгоритма аппроксимации. Пусть и0(х), я = 0, Э = 0, тогда

dV т

Ч?

дх

(f + gui + kwl<3) + hTh + \\щ\\\ — y2 \\тЪ)] \\p = 0;

w

i,j+1

1 -P^F dVij

27 2

1

дх dVj (x)_

иг+1 (х) = - 2К У(х) дх ,

э = э + 1, э < N;

Я = Я + 1, Я ^ N ^ — число шагов).

Наша задача найти V*(х) — решение уравнения (4), чтобы затем найти закон оптимального управления для модели (1).

Решить эту задачу можно методом последовательного приближения по алгоритму конечных элементов Гарлекина [3-6].

Метод Галеркина является общим методом решения уравнений с частными производными и часто используется для решения уравнения ГЯБА.

Пусть вектор х имеет п компонент в области П, V(t, х) и поря-

к

док М. Тогда при К = Мп функции V(^ х) = ^ ск(х), к = 1,К,

{рк(х)>к=1 - базисные функции. Определим коэффициенты ск численным методом.

k=1

K

Из уравнения (5) при V(t, х) = ск(х), к = 1, К, имеем

к=1

д^т (х) 1 2 2 и и 2

с,—^- | (/ + ди+кь)) + НТк + ||и||л — 7

дх

Е'

,k=1

N

cNVfNx) ) (f + gu+kw) + hTh +

,k=1

IP

I II2 2 и и2

|u\\R — Y \\w\\P

fl (x)dx = 0; fl (x)dx = 0;

C

N

^Nx) (f + gu + kw) ФN(x)dx

= — / (hTh + \\u\\R — Y2 \\w\\p) ФN(x)dx;

(f + gu+kw)T VФNdx

CN =

= — / (hTh + \\u\\R — Y2 \\w\p) ФNdx;

u

(Ai + A2(u) + As(w)) CN = b+b2u) - 72bs(w);

Ai = ФN f TVfTN dx; (6)

A2(u) = Фт «Tg^N dx; (7)

bi = - Фт hThdx; (8)

b2 (u) = - Фт ||u(0)||Rdx; (9)

JQ

As(w) = / Фтад^^ФТdx; (10)

JQ

b3(w) = - / Фт||w||pdx (11)

JQ

-1

^ Cn =

(А+А^и) + 4^})]- [ь+б^и) - 72ЬЦ . (12)

Обозначив А = А1 + А2(и) + А3(ад), Ь = 61 + ^ (и) - 72Ь3(-ш), получим уравнение (12) в виде

^ = А-1Ь. (13)

Результатом применения алгоритма для получения оценки закона оптимального управления по целевой функции (заданному критерию) будет

й(ж) = - 2 Д-УУФ^ ^,

\т \т (т

где СТ = (С1... ст) , Фт = (^1... ) , = ( "дх ... ) ~

якобиан Фт. Чтобы найти Ст, необходимо применять алгоритм по шагам.

Шаг 1. Имеем Я,Р, и0(ж), = 0, где и0(ж) будет на-

чальным условием устойчивого управления для динамической системы (1). Определим коэффициенты по формулам (6)—(11) и вычислим также коэффициенты

Ск = ! Ф^д^)

п (14)

К = I Фт( ) кР-1ктУФТ¿ж;

п

Cn(0) = [Ai + A2(uo)]-1 [bi + b2(uo)]. (15)

Q

Шаг 2. Для Я = 0,1,... N получим

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А1 + 42(и0), если Я = 0;

А(г) = ^ 4 1 ^ ^ П > 0 (16)

А1 — ск Пк, если я > 0;

к=1

Ь1 + 02(и0), если Я = 0;

6(г) = ^ 1 ~ (17)

01 — ск ПкСк ' , если Я> 0.

к=1

Для Э = 0,1,..., N, получим

{4(г), если Э = 0;

4(г) + ^ Е ск,-1Кк, если э> 0; (18)

^ к=1

6(г), если Э = 0;

b = 4 ь(г) , 1 ^ Jj-1^.. „„„„ ^ п (19)

b(i) + Е ckJ-1Kk CNj-1, если j > 0

t

k=1

u(i+1) = -1 R-1gT(x)V$N cNi,j).

При 4(г), 6(г), где Я — номер шага, получим = 4 10. Для нового значения величин

= СТ

новый закон управления будет иметь вид

1

-1 2

Пример. Для иллюстрации эффективности предлагаемого алгоритма рассмотрим численный пример синтеза закона оптимального управления летательным аппаратом (ЛА) с учетом полной нелинейной динамики.

Модель системы управления ЛА имеет вид [6]

0 = Му //у; соэ2(а)

а =

mU

-Fz + 0; (20)

8 = -2дап8 - (8 - 8c),

где $ — угол тангажа; a — угол атаки; 8 — угол отклонения руля; 8c — командный угол отклонения руля высота, U = V cos a — продольная скорость ЛА.

Момент тангажа запишем как

My = CmQSd, Cm = ai«3 + a2a |a| + a3a + a4ö; (21) подъемную силу представим в виде

Fz = CnQS, Cn = bi«3 + |a| + 63a + M, (22)

где a,i, bi, i = 1, 4, — коэффициенты характеризующие динамику ЛА; Q = pV2/2 — скоростной напор; S — эффективная площадь крыла; d — диаметр ЛА; Ст, Cn — аэродинамические коэффициенты.

На практике параметры моментов и сил являются неопределенными величинами из-за трудностей точного моделирования аэродинамических сил и моментов. Для расчета фактических их значений можно записать выражения

My = (1 + p)My, Fz = (1 + v)Fz.

Вектор случайного воздействия w = [р, v^ при стохастической неопределенности выступает в качестве изменений параметров в системе.

С учетом уравнений (21), (22) модель системы (20) принимает вид

X CmQSd CmQSd

? = —I— + —I—р;

a = CnQS cos2 a + ? + CnQS cos2 a v; (23)

mU mU '

<5 = -2дшп0 - шП(ö - öc).

Для системы (23): выход — угол атаки ЛА; управление — угол отклонения руля öc; ö, öc должны быть отличны от нуля.

Летательный аппарат отрабатывает желаемый стационарный угол

г • • "I Т

атаки ass, значения состояния ?, a, ö, ö и управление öc будут найдены из решения нелинейной системы уравнений при условии, когда производные состояния и выхода равны нулю.

Пусть x = (ж1,Ж2,Ж3,Ж4)т = (j> - ?ss, a - ass, ö - öss,ö - öss)

u = öc - öc ss, где индексами ss обозначаются установившиеся значения.

На параметры x1,x3 (°/с) и x2,x4 (градусы) накладываются следующие ограничения:

-150 < x1 < 150; -800 < x3 < 800;

-20 < x2,x4 < 20.

Целью управления является обеспечение угла атаки из исходного значения a ^ ad при состоянии системы x ^ 0 и управлении u ^ 0. Разработанные алгоритмы обеспечивают достижение цели.

Функции f (х), д(х), к(х), Н(х) определяются непосредственно из динамической модели системы. В модели, описанной ранее, закон управления с обратной связью может быть синтезирован на основе изложенного подхода.

Правильный выбор базисных функций является важной частью в получении решения задачи разработаным методом. Базисные функции использовались для определения не только точности приближения Га-леркина, но и функции состояния, по которой рассчитывается закон управления. Если базисные функции дают приближенные значения функции V^ (£,х) с не достаточной точностью, то алгоритм не будет сходиться. Для этого использовали следующий набор базисных функций:

г ]10 Г 2 2 2 21

{фj =1 = , х1 х2, х2 ,х1 х3, х2х3 ,х2 , х1 х4, х2х4, х3х4, , х4) .

Начальный закон управления был разработан на основе линеаризации уравнений движения относительно желаемого угла атаки и со-отвествующего расположения полюсов. Для этого были использованы следующие исходные данные:

и0(х) = 0,48х1 - 2,82х2 - 0,732х3 - 3,77х4.

Результаты моделирования структурно-параметрического синтеза:

а — угол атаки; б — угловая скорость тангажа; в — отклонение руля; г — скорость отклонения руля

Результаты моделирования алгоритмов структурно-параметрического синтеза системы управления нелинейным стохастическим ЛА приведены на рисунке для следующих значений возмущений:

[р, v] = [0, 0; 0,25, 0,25; 3, 3; 0,25, 3; 3, 0,25]т .

Во всех случаях заданы нулевые начальные условия, а затем дана команда для получения угла атаки в 15°. Как следует из реакции системы на различные возмущения, изменения My и Fz влияют на качество системы. На рисунке видно, что стационарный отклик системы является наиболее чувствительным к изменениям Fz (изменения в v), а вариации в My (изменения в р) оказывают влияние на устойчивость и переходный процесс системы.

Выводы. Разработан алгоритм на основе последовательного приближения Галеркина, представлен алгоритм численного решения уравнения Гамильтона-Якоби-Беллмана-Айзекса, при использовании которого решена задача структурно-параметрического синтеза нелинейной стохастической системы управления. Моделирование нелинейной динамики показало лучшие результаты по сравнению с линейной системой с обратной связью по состоянию.

СПИСОК ЛИТЕРАТУРЫ

1. Казаков И. Е., Гладков Д. И. Методы оптимизации стохастических систем. - М.: Наука, 1987. - 304 с.

2. Kolosov G. E. Optimal design of control systems stochastic and deterministic, CRC Press, 1999. - 423 с.

3. Ramon Van Handel. Stochastic calculus, filtering and stochastic controls, Springer, 2007. - 265 p.

4. КузнецовД. Ф. Стохастические дифференциальные уравнения // Теория и практика численного решения. - СПб.: СППУ, 2010. - 816 с.

5. Henrique C. Ferreira. Nonlinear H< control and the Hamilton-Jacobi-Isaacs equation, IFAC, 2008.

6. Randal W. Beard. Successive Galerkin approximation algorithms for nonlinear optimal and robust control // International Journal of Control, 2007.

Статья поступила в редакцию 28.10.2011

Константин Александрович Пупков окончил в 1954 г. МВТУ им. Н.Э. Баумана. Д-р техн. наук, профессор, заведующий кафедрой "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор более 300 научных работ в области теории управления и интеллектуальных систем.

K.A. Pupkov graduated in 1954 from the Bauman Moscow Higher Technical School. D. Sc. (Eng.), professor, head of "Automatic Control Systems" department of the Bauman Moscow State Technical University. Author of more than 30 publications in the field of control theory and intelligent systems.

Фам Суан Фанг окончил Ханойский госудаственный технический университет им. Ле Куй Дона в 2001г. Канд. техн. наук, докторант кафедры "Системы автоматического управления" МГТУ им. Н.Э. Баумана. Автор более 20 научных работ в области моделирования систем управления летательными аппаратами. Pham Xuan Phang graduated from Le Quy Don Hanoi State Technical University in 2001. Ph. D. (Eng.), doctoral student of "Automatic Control Systems" department of the Bauman Moscow State Technical University. Author of more than 20 publications in the field of theory of simulation of control systems of flying vehicles.

i Надоели баннеры? Вы всегда можете отключить рекламу.