Научная статья на тему 'К вопросу синтеза оптимального управления в условиях нестохастической неопределенности'

К вопросу синтеза оптимального управления в условиях нестохастической неопределенности Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
94
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
регулятор / оптимальное управление / неопределенные возмущения / игровой подход / функция ляпунова / оптимальне управління / невизначені збурення / ігровий підхід / функція ляпунова / regulator / optimal control / uncertainty disturbance / playing approach / lyapunov function
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Гурко Александр Геннадиевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Some questions of synthesis of optimal control based on the game approach are considered. It is supposed that the prior information concerning the perturbation action is limited to some set of probable values and at the same time it is necessary to guarantee an acceptable quality of control at any possible realizations of perturbation.

Текст научной работы на тему «К вопросу синтеза оптимального управления в условиях нестохастической неопределенности»

УДК 681.5.013

К ВОПРОСУ СИНТЕЗА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ В УСЛОВИЯХ НЕСТОХАСТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ А.Г. Гурко, доцент, к.т.н., ХНАДУ

Аннотация. Рассмотрены некоторые вопросы синтеза оптимального управления на основе игрового подхода. Предполагается, что априорная информация о возмущениях ограничена лишь множеством их возможных значений, при этом необходимо гарантировать приемлемое качество управления при любых возможных реализациях возмущений.

Ключевые слова: регулятор, оптимальное управление, неопределенные возмущения, игровой подход, функция Ляпунова.

ЩОДО ПИТАННЯ СИНТЕЗУ ОПТИМАЛЬНОГО УПРАВЛІННЯ В УМОВАХ НЕСТОХАСТИЧНОЇ НЕВИЗНАЧЕНОСТІ О.Г. Гурко, доцент, к.т.н., ХНАДУ

Анотація. Розглянуті деякі питання синтезу оптимального управління на основі ігрового підходу. Передбачається, що апріорна інформація про збурення обмежена лише множиною їх можливих значень, при цьому необхідно гарантувати прийнятну якість управління при будь-яких можливих реалізаціях збурень.

Ключові слова: регулятор, оптимальне управління, невизначені збурення, ігровий підхід, функція Ляпунова.

TO THE PROBLEM OF SYNTHESIS OF OPTIMAL CONTROL UNDER NONSTOCHASTIC UNCERTAINTY A. Gurko, associate professor, cand. eng. sc., KhNAHU

Abstract. Some questions of synthesis of optimal control based on the game approach are considered. It is supposed that the prior information concerning the perturbation action is limited to some set of probable values and at the same time it is necessary to guarantee an acceptable quality of control at any possible realizations of perturbation.

Key words: regulator, optimal control, uncertainty disturbance, playing approach, Lyapunov function.

Введение

Подавляющее большинство современных систем управления проектируются и функционируют в условиях априорной неопределенности как относительно их структуры и (или) параметров, так и относительно действующих на объект возмущений. В настоящее время наиболее распространен стохастический подход к проектированию систем

управления. Управление при таком подходе ищется из условия обеспечения в среднем приемлемого качества процессов.

Однако стохастический подход не всегда оправдан, к тому же он не может гарантировать обеспечения заданного качества системы при любом возможном сочетании неопределенных факторов. В связи с этим все более широкое распространение получает так назы-

ваемый минимаксный, или игровой подход к проектированию систем управления, согласно которому управление ищется из условия минимума некоторого критерия качества и в предположении, что характер действия неопределенных факторов будет его максимизировать. При этом гарантируется, что качество процессов останется приемлемым при любых возможных реализациях факторов неопределенности. Это особенно важно при управлении, например, транспортными средствами или энергетическими установками, когда даже единичное отклонение управляемых параметров сверх определенных пределов может привести к трагическим последствиям.

Анализ публикаций

Как уже отмечалось, в последнее время вопросу синтеза управления на основе игрового подхода уделяется достаточно большое внимание [1-5], при этом получены значительные результаты. Однако на практике рассматриваемый подход используется крайне редко. Это связано как с тем, что в большинстве своем эти результаты имеют достаточно общий характер и не учитывают особенностей конкретных приложений [5], так и с тем, что многие предлагаемые алгоритмы управления весьма сложны и их реализация сопряжена с определенными трудностями вычислительного плана.

В данной статье рассматриваются некоторые практические вопросы синтеза оптимального управления системой в условиях неопределенности относительно внешних возмущений на основе игрового подхода.

Постановка задачи и способ ее решения

Будем считать, что модель объекта известна с достаточной точностью и приведена к виду

Х(п +1) = АХ(п) + Ви(п); (1)

Y(п + 1) = СХ(п + 1), (2)

где Х - вектор координат состояния размерности (тх1); и - вектор управляющих воздействий (рх1); Y - вектор выходных координат объекта (дх1); А, В и С - матрицы соответствующих размерностей, п - моменты квантования, п = 0, 1, 2, ...

Остановимся на вопросе определения оптимального управления. Перед обсуждением этой проблемы сделаем следующее замечание. Допустим, в процессе функционирования системы наблюдаются последовательности управлений U(0), U(1), U(2), ... и выходных координат объекта Y(0), Y(1), Y(2), ... . Регулятор в каждый момент квантования n по последовательности измеренных значений Y(n-j), ..., Y(n-1), Y(n) восстанавливает координаты состояния объекта X(n) и по ним вырабатывает какую-то последовательность управляющих воздействий U(n), U(n + 1), U(n+2), ..., которая обусловит оптимальную в каком-то определенном смысле последовательность состояний X(n + 1), X(n+2), X(n+3), ..., приводящую систему в желаемый режим. Регулятор применит U(n). Но уже в момент квантования n+1, ввиду того, что на систему действуют неконтролируемые возмущения L(n) = {А,ь ... , A,s}, вместо предполагаемого состояния X(n+1) (и выходных координат Y(n+1)) система попадет в другое состояние. Дальнейшее использование найденных ранее управлений U(n+1), U(n+2), U(n +3), . станет нецелесообразным и их нужно определять заново. Таким образом, очевидно, что при выработке управляющего воздействия U(n) регулятор должен учитывать, что на систему дополнительно к его воздействию подействуют и возмущения Л(п).

Будем считать оптимальными переходные процессы, на которых суммарная оценка

ад

J = Z( XT (n)QX(n) + RU2(n)) (3)

n=0

достигает минимума. Здесь Q - неотрицательно определенная симметричная матрица (m*m); R - положительно определенная симметричная матрица (рхр); Т - символ транспонирования.

Решим задачу синтеза оптимального управления, которое обеспечит устойчивость замкнутой системы и min J (X(n)) при дви-

n

жении из произвольного состояния X(n)

m

U( n) = ^pX (n) . (4)

i=1

Зависимость min J от X(n) определяет функция Ляпунова

V(X) = XTPX , (5)

где Р - положительно-определенная симметричная матрица (m*m).

Тогда при действии возмущений Л(п) поставим задачу синтеза следующим образом [3, 4]: найти алгоритм определения управляющего воздействия U(n) (на каждом такте квантования), минимизирующего функцию удельных потерь

ю(и) = V ( X(n + 1)) + RU 2( n), (6)

где V(X(n + 1)) - оценка качества дальнейшей траектории при отсутствии возмущений, RU2(n) - затраты на переход из состояния X(n) в состояние X(n+1).

Поскольку реальная система подвержена не только влиянию возмущений Л(п), но и помех измерения T(n) выходных координат, то в общем случае в выражении (6)

X(n +1) = F (X(n), U(n), Л(п), T(n)) , (7)

где T(n) - вектор-столбец (kx 1) помех измерений выходных координат системы; F - заданная вектор-функция.

Теперь вернемся к поставленному выше вопросу: как учесть при синтезе системы внешние воздействия? Задача синтеза конкретизировалась: нужно выбирать U(n) так, чтобы при действии Л(п) и T(n) удельные потери были минимальными. Для решения этой задачи нужно определиться с характеристиками Л(п) и T(n). Возможность введения вероятностных законов распределения Л(п) и T(n) часто бывает практически неприемлемой. В то же время во многих случаях даже без тщательного изучения условий работы управляемого объекта можно указать ограничения, которым удовлетворяют возмущения и помехи измерения

Л(п) еОЛ (n), (8)

T(n) eDT (n), (9)

где Пл(п) и QT(n) - заданные ограниченные множества.

Такие ограничения, например, можно указать исходя из класса точности измерительных приборов. Но на какие же значения Л(п) и ¥(n) из указанных диапазонов ориентироваться регулятору? Предлагается считать, что Л(п) и ¥(n) имеют наиболее неблагоприятный характер, который заключается в том, что какое бы управляющее воздействие U(n) не применил бы регулятор, Л(п) и ¥(n) «постараются» максимально ухудшить качество системы именно при этом U(n). Такой подход к определению алгоритма работы регулятора по аналогии с подходом теории игр к решению некоторых задач получил в теории управления название игрового подхода.

Определение управления при точном измерении координат состояния

Рассмотрим теперь саму процедуру синтеза оптимального управления. Положим, что на систему действует скалярное аддитивное возмущение A,(n), n = 0, 1, 2, ..., которое непосредственно добавляется к управляющему воздействию, т.е.

X(n + 1) = AX(n) + B ( U(n) + X(n)) . (10)

Относительно A,(n) известна лишь априорная оценка

Im n )| <5, (ii)

где 5 - некоторое число.

Будем также считать, что координаты состояния удается определить точно, т.е. T(n) = 0. В этом случае оптимальное управление определяется из решения задачи

min max {ra(n)} =

U (n)eQU |a.(n)|<5 ' ’

iV 4 2 ) (12)

= min max {V(X(n +1)) + RU (n)}.

U(n)eQU |a.(n)|<5 I v ' >

Запишем выражение для ra(n)

ю(п) = XT (n + 1)PX(n +1) + RU2 (n). (13)

Подставим сюда выражение (10) для X(n + 1) и оставим при этом в ю(п) только те слагаемые, которые зависят от U(n) и A,(n), т.к. слагаемые, зависящие только от X(n) ни минимизировать с помощью U(n), ни максимизировать с помощью A,(n) невозможно. Эта

часть о(и), зависящая от и(и) и Х(и), определяется выражением:

со (и) = (Р + Вт РВ)и2(и) + Вт РВХ2(и) +

+2

+2 ( АХ(и))Т РВи(и) +

(АХ(и))Т РВ + ВтРВи(и)]х(и).

(14)

Проанализируем выражение (14). Так как матрица Р - положительно определенная, то, очевидно, что Х(и), максимизирующее со (и)

максимально по модулю и его знак совпадает со знаком (АХ(и))тРВ + ВтРВи(и). Управление, минимизирующее со (и) при наиболее

неблагоприятном поведении Х(и), определяется как управление, минимизирующее выражение

ф + Вт РВ)и2(и) + Вт РВ52 +

+2

+2 (АХ(и))Т РВи(и) +

(АХ(и))Т РВ + ВтРВи(и)

(15)

5.

Можно привести выражение для оптимального управления ио^(и), минимизирующего (15) [3]. Однако мы этого делать не будем. Рассмотрим, как «рассуждает» регулятор, при этом для наглядности ограничимся системой 2-го порядка.

сутствии внешних воздействий, т.е. в свободном движении, система будет двигаться по некоторой траектории и в момент и + 1 окажется в точке Хсв. Координаты этой точки известны, т.к. считаются известными все параметры системы. Однако под действием возмущений реальное состояние будет иным. Если подействует возмущение +Х, то система попадет в точку 1, где значение функции Ляпунова V = Если же подействует -X, то система попадет в точку 2, где

V = V < V]. Необходимо применить такое управление С/„^(и), которое приведет систему в такое состояние ХорЬ выход из которого под влиянием как +Х, так и -X приводит в точки, где V! = V (рис. 2).

1 V'/\

д\\ \\

/ °рг \ 1 \ \

/ Движение под \

действием иор. 1

А'

Свободное/

движение

Направление действия управления (по вектор} В]

Рис. 1. Определение возможного состояния системы

На рис. 1 изображены линии равного уровня некоторой функции Ляпунова. Пусть состояние системы в момент квантования и определяется точкой Х(и) = {^(и), Х2(и)}. При от-

Рис. 2. Иллюстрация действия оптимального управления

Определение оптимального управления можно осуществлять различными методами, например, каким-либо из поисковых, которые широко освещены в специализированной литературе (см., например, [6]). Здесь же рассмотрим пример синтеза оптимального управления.

Пример синтеза оптимального управления

Для определенности будем рассматривать объект второго порядка с передаточной функцией

К

Ж (5) = ---------------.

(5 -|^)(5 -Ц2)

В качестве координат состояния примем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Х1 = 7, Х2 = ¿7М,

где 7 - выходная координата системы управления, которая поддается наблюдению.

По-прежнему считаем, что измерение осуществляется точно. Дискретная модель системы в пространстве состояний имеет вид (1-2). При ц1 = -0,6, ц2 = -0,7, К = 1 и периоде квантования т = 0,6 имеем

" 0,9415 0,4063" "0,1394"

А = ; в =

-0,1706 0,4133_ 0,4063_

Будем также считать, что возмущение Х(и) действует в виде импульсных ударов и удовлетворяет ограничению

|Х(и)| <5 = 0,25.

Оптимальными будем считать такие переходные процессы, на которых суммарная оценка (3) достигает минимума. Пусть Q -единичная матрица (2^2), а Я = 0,5. Тогда

3 = 2(X;(и) + X22(и) + 0,5 • и2(и)) .

и=0

Решение данной задачи произведено при помощи программы, написанной на языке МА^АВ. На рис. 3 изображен характер изменения внешнего возмущения.

0.26

'0 123456789

Тіте, гес

Рис. 3. Действующее на систему внешнее возмущение

также найденного оптимального управления иор1(п). На рис. 5 представлена фазовая траектория системы с игровым регулятором, там же для сравнения приведена траектория движения системы с классическим регулятором, синтезированным методом, известным как метод аналитического конструирования регуляторов [7]. Как видно из рисунков 4, 5 игровой регулятор уже через 4 такта квантования приводит систему в окрестность желаемого состояния, т.е. обеспечивает ¿-дисси-пативность системы. Классический регулятор, как и ожидалось, с действующим возмущением не справляется.

0.4

01 23456789

□ 1 23456739

и -0.2

-0.6

01 23456789

Тіте, эес

Рис. 4. Изменение координат объекта и оптимальное управление

61.5 -1 -0,6 0 0,6 1 15

*1

Рис. 4 отображает графики изменения коор- Рис. 5. Фазовые траектории систем с шротьш

динат состояния рассматриваемой системы, а и классическим регулятором

Выводы

Игровой регулятор наиболее целесообразно использовать в таких системах, в которых вероятностные характеристики неопределенных факторов неизвестны, например, при недостаточной статистической информации, или когда вообще нет никаких оснований приписывать указанным неопределенностям вероятностную природу, а также в ситуациях, когда необходимо гарантировать приемлемое качество работы системы при любых сочетаниях возмущений из заданного диапазона.

Вследствие чрезмерной «осторожности» игрового регулятора, он далеко не всегда будет достаточно точно компенсировать внешние возмущения. Однако это является платой за то, что состояние системы гарантированно никогда не выйдет за пределы множества допустимых состояний.

Литература

1. Красовский Н.Н. Игровые задачи о встрече

движений. - М.: Наука, 1970. - 473 с.

2. Куржанский А.Б. Управление и наблюде-

ние в условиях неопределенности. - М.: Наука, 1977. - 392 с.

3. Кунцевич В.М., Лычак М.М. Синтез опти-

мальных и адаптивных систем управления. Игровой подход. - Киев: Наукова думка, 1985. - 248 с.

4. Кунцевич В.М., Лычак М.М. Синтез сис-

тем автоматического управления с помощью функций Ляпунова. - М.: Наука, 1977. - 400 с.

5. Кейн В.М. Оптимизация систем управле-

ния по минимаксному критерию. - М.: Наука, 1985. - 248 с.

6. Моисеев Н.Н. Численные методы в теории

оптимальных систем. - М.: Наука, 1971. -424 с.

7. Методы классической и современной тео-

рии автоматического управления. Т.4: Теория оптимизации систем автоматического управления / Под ред. К.А. Пупкова и Н.Д. Егупова. - М.: Издательство МГТУ им. Н.Э. Баумана, 2004. - 744 с.

Рецензент: О.П. Алексеев, профессор, д.т.н., ХНАДУ.

Статья поступила в редакцию 18 сентября 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.