Научная статья на тему 'Компенсация возмущений в системах автоматического управления на основе методов теории дифференциальных игр'

Компенсация возмущений в системах автоматического управления на основе методов теории дифференциальных игр Текст научной статьи по специальности «Математика»

CC BY
278
87
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УДК 681.5 / СИСТЕМЫ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ / ВОЗМУЩЕНИЯ / ПОЗИЦИОННЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ / ОБЛАСТИ ДОСТИЖИМОСТИ / АUTOMATIC CONTROL SYSTEMS / DISTURBANCE / POSITIONAL DIFFERENTIAL GAMES / ATTAINABLE DOMAINS

Аннотация научной статьи по математике, автор научной работы — Толпегин Олег Александрович

Рассматривается применение областей достижимости для компенсации детерминированных или случайных возмущений с неизвестными статистическими свойствами в системах автоматического управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Толпегин Олег Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Компенсация возмущений в системах автоматического управления на основе методов теории дифференциальных игр»

Расчет числа Фурье можно проводить по формуле:

- при 4 = 49 °С Бо =---------11109——;

Ке°Л3 .@(5,49/Ке0,13)

1 28

- при /ж = 24 °С Бо =------------— .

Ке°’12б .©(6Д/^е°'17)

В формулах число Рейнольдса изменяется от 18 910 до 65 790, при 0,4 < 0 < 0,907. Относительная погрешность составляет 4,5 %.

В опытах на стенде исследовалось нагревание цилиндра, содержащего железорудный концентрат со льдом (Оленегорский) при различной начальной температуре. Начальная температура изменялась от -25 °С до -5 °С. Диаметр цилиндра из нержавеющей стали 2X13 составлял йн = 50 мм, йвн = 48 мм. Число Рейнольда изменялось от 18 000 до 57 000. Скорость набегающего потока варьировалась в пределах от 6,8 до 20,4 м/с. Температура потока от 24 до 49 °С. Тепловой критерий Био изменялся в пределах 0,99 < < Ы < 2,17 для цилиндра в целом, для стенки трубы Ы < 0,1.

На рис. 1 представлены результаты расчета по прогреву образца и экспериментальные данные. Скорость набегающего потока изменялась от 6,8 до 20,4 м/с, при температуре набегающего потока 24 °С. На рис. 2 представлена взаимосвязь между числами Фурье и Коссовича при изменении скорости потока от 6,8 до 20,4 м/с, при этом температура набегающего потока равна 49 °С.

Предложенные критериальные уравнения можно использовать при расчете времени прогрева железорудного концентрата с учетом таяния льда в различных технических устройствах (например, в гаражах размораживания).

Рис. 1. Взаимосвязь числа Бо от числа Коссовича:

1 - №к = 6,8 м/с; 2 - №к = 10 м/с; 3 - №к = 13,6 м/с;

4 - Жк = 20,4 м/с при температуре набегающего потока /ж = 24 °С

Рис. 2. Взаимосвязь числа Фурье от числа Коссовича:

1 - №к = 6,8 м/с; 2 - №к = 10 м/с; 3 - №к = 13,6 м/с; 4 - №к = 20,4 м/с при температуре набегающего потока равной /ж = 49 ° С

Литература

1. Синицын, Н.Н. Математическая модель прогрева бесконечного двухслойного цилиндра, содержащего лед и кусковые материалы / Н.Н. Синицын, Д.В. Гусев, Ю.В. Андреев, Н.В. Андреев // Вестник ЧГУ. - 2008. - № 4. -С. 119 - 120.

УДК 681.5

О.А. Толпегин

КОМПЕНСАЦИЯ ВОЗМУЩЕНИЙ В СИСТЕМАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ НА ОСНОВЕ МЕТОДОВ ТЕОРИИ ДИФФЕРЕНЦИАЛЬНЫХ ИГР

Рассматривается применение областей достижимости для компенсации детерминированных или случайных возмущений с неизвестными статистическими свойствами в системах автоматического управления.

Системы автоматического управления, возмущения, позиционные дифференциальные игры, области достижимости.

Application of attainable domains for compensation of determinate or random disturbances with unknown statistical properties in automatic control systems is considered in the article.

Automatic control systems, disturbance, positional differential games, attainable domains.

Для компенсации детерминированных или случайных возмущений с неизвестными статистическими свойствами в системах автоматического управления (САУ), недоступных прямым измерениям, предлагается использовать методы теории дифференциальных игр. Задачу синтеза управления в САУ при действии возмущений можно поставить в виде антагонистической дифференциальной игры с двумя игроками, один из которых выбирает управление САУ, а второй формирует возмущение детерминированного или случайного характера. При этом не требуется знать свойства возмущений, достаточно ограничиться их максимально возможными значениями. Например, если движение летательного аппарата происходит при действии ветра, то достаточно задать ограничение на максимальную величину его скорости.

Рассмотрим постановку задачи синтеза управления САУ при действии возмущений в виде антагонистической дифференциальной игры. Пусть движение САУ определяется векторным дифференциальным уравнением:

Их

— = / (і, х(і), «(О, КО), аі

(1)

где х(0 = (х1 (/),...хи(/))- фазовый вектор системы,

и (О = (и1(/),...ит(/)) - вектор управления, §(/) =

= (|1(/),...§* (/)) - вектор возмущения.

Управление и возмущение удовлетворяют ограничениям:

и(/) е и , §(/) е Н,

где и , Н - заданные множества.

Заданы начальные условия:

/ = /0, х(^) = Х0.

(2)

(3)

Пусть первый игрок выбирает управление САУ, а второй - возмущение.

Требуется найти управление первого игрока, который минимизирует, например, терминальный критерий

Для решения технических задач наиболее пригодны методы теории позиционных дифференциальных игр [2, с. 7], когда управления игроков выбираются в дискретные моменты времени на основе решения вспомогательных минимаксных задач программного управления. Для их решения можно использовать необходимые условия оптимальности, аналогичные принципу максимума Л. С. Понтрягина, или методы, основанные на расчете областей достижимости, которые предложил использовать Н.Н. Красовский [1, с. 399].

Вспомогательная задача минимаксного программного управления ставится так же, как исходная, но решается из позиции {/*, х(/*) }, для которой выбираются управления игроков. Управления игроков вычисляются только как функции времени и(/) и §(/). В результате решения находятся минимаксные программы игроков ~(/) и £(/) на интервале времени от /* до момента окончания игры 9 . Оптимальные управления игроков в позиции {/ *, х(/*)} принимаются в виде:

и (і*, х(і*)) = и (і) ~(і*, х(і*)) = ~(і)

і = і*

і = і*

(5)

то есть оптимальные управления в позиции {/*, х(/*) } равны значениям минимаксных программных функций управления, которые получены из решения вспомогательных программных задач. Переход (5) справедлив не для всех систем. В данной статье для решения вспомогательных задач применяются области достижимости.

Для наглядности использования методов синтеза САУ, основанных на расчете областей достижимости, рассмотрим задачу синтеза оптимального управления движением крена беспилотного летательного аппарата. Движение крена с идеальным рулевым приводом при наличии возмущений определяется следующими дифференциальными уравнениями:

J = Я(х(3)).

(4)

а

• = ю.

■ = сю х + &м-

(6)

Момент окончания управления 9 задан или выбирается в процессе функционирования системы.

С целью получения гарантированного результата будем считать, что интересы второго игрока противоположны интересам первого игрока, то есть второй игрок ищет максимум (4).

Для решения антагонистических дифференциальных игр используются методы: Р. Айзекса, Л.Н. Пон-трягина, Н.Н Красовского и других авторов. Большинство из разработанных методов применяются для линейных систем дифференциальных уравнений, требуют большого объема вычислений, а в некоторых случаях и информационной дискриминации игроков.

где у - угол крена, ю х - угловая скорость крена, и

- сигнал управления, £, - возмущение, к - коэффициент усиления рулевого привода.

Сигналы управления и возмущения удовлетворяют ограничениям:

|и(/)| <1; %(/)| <1. (7)

Заданы начальные условия:

= 0, У = У 0, ю X = ю х0 . (8)

Требуется найти управление и , обеспечивающее переход в нулевое состояние за минимальное время при действии случайных возмущений, удовлетворяющих ограничению (7).

Процесс стабилизации при наличии возмущений будем рассматривать как антагонистическую игру двух игроков. Первый игрок выбирает управление и , а второй - возмущение £, . Первый игрок действует в наших интересах и минимизирует время переходного процесса, интересы второго - противоположны.

На основе теории позиционных дифференциальных игр управление первого игрока выбирается в дискретные момент времени / 0 = 0, ^1 = /0 + А/, /2 = ^1 + А/ и т.д., где А/ - шаг выбора управления. С выбранным управлением происходит переходной процесс в течение времени А/ . Одновременно реализуется некоторое возмущение ^(/), неизвестное первому игроку. Возмущение ^(/) можно формировать любым способом, в том числе и из решения поставленной задачи.

Для выбора управления первого игрока в позиции {/*, у(/*), юх (/*)} используем следующий подход [1, с. 82]. Исходную систему (6) запишем в векторном виде

Их

а

= Ах + Б(ки - Е),

(9)

Систему уравнений (9) разобьем на две: первой системой будет управлять первый игрок, второй -второй игрок. Для этого вектор х(і) представим:

х = У ; а = " 0 1" ; б = " 0' 1

_Ю х _ 0 с

определяется из решения следующей вспомогательной задачи

шіп шіп шахЛ/(у(2)(&,)-у(1)(&,)) +(юх<2)(й.)-юх(1)(&,)) , (12)

* <•&*<Т и(х) Е(х)

где 9* - будущий гипотетический момент окончания

решения вспомогательной задачи (12), Т - максимально допустимое время окончания переходного процесса, и (х) и £ (х) - программы управления

игроков на интервале времени [/*, 9 * ], удовлетворяющие (7).

Для решения задачи (12) используется следующий алгоритм [4, с. 140].

1. Задается начальный гипотетический момент

встречи 9* = + А9, где А9 - шаг изменения 9*.

2. В плоскости Оую х (рис. 1) строятся ОД первого игрока С и второго игрока С2 для гипотетического момента встречи 9* .

х(і) = х(1)(і) - х(2)(і) .

(10)

Рис. 1. Определение точек прицеливания игроков

После подстановки (10) систему (9) можно записать в виде двух систем дифференциальных уравнений:

ах ■ = Ах(1) + Бки; —— = Ах(2) + БЕ,, (11)

где х

(1) =

ю

,(1)

(1)

; х

(2) =

ю

(2)

(2)

Для этих систем уравнений введем начальные условия:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

і = і*, у()(і*) = у(і*), ю^*) = юх(і*);

,(1)(і*) = У (і*), ю(1)(

У (2)(і*) = 0, ®х2)(і*) = 0.

Оптимальное минимаксное управление первого игрока в позиции {/*,у(/*),юх(/*)} и(/*,у(/*),юх(/*))

3. Определяется точка ОД второго игрока, наиболее удаленная от ОД первого игрока (точка В на рис.1).

4. Находится точка ОД первого игрока, ближайшая к точке В (точка А на рис. 1).

5. Определяется гипотетический «промах» 8* (/* , 9* ) .

6. Определяется программа управления первого игрока ~ (х) , обеспечивающая перемещение из позиции {/*, х(1)(/*)} в точку А в момент 9* и управление и (/*, 9*) = и(х)

х = /*

7. Гипотетический момент встречи увеличивается

на величину А9 и вновь определяется

8*(/*, 9* +А9), ~(/*, 9 * + А 9) и т.д.

8. Оптимальный гипотетический момент встречи в позиции {/*, х(1)(/*), х(2)(/*)} находится из

условия:

х

х

шіп є*(t*, S*). t.<S. <1

( 1З)

Условие (13) определяет минимальное время переходного процесса из позиции

{/*, х(1)(/*), х(2)(/*)} при самых неблагоприятных действиях возмущений.

9. В качестве оптимального управления первого игрока в позиции {/*,х(1)(/*),х(2)(/*)} принимается

~(/*,х(1)(/*),х(2)(/*)) = и(г*, 9 *), т.е. управление,

вычисленное по взаимному расположению ОД игроков в оптимальный гипотетический момент встречи

9 *.

Для систем уравнений (12) с терминальным критерием (13) такой способ выбора управления является оптимальным, так как ОД игроков выпуклые и точка прицеливания А одна.

Если для выбора возмущения

£(/*,х(1)(/*), х(2)(/*)) также используется решение

вспомогательной задачи (12), то необходимо определить программу управления второго игрока

£ (х), обеспечивающую перемещение второго игрока из позиции {/*, х(2)(/*)} в точку В области достижимости 02 , построенной для оптимального гипотетического момента 9 * , и принять

хт(,) х(2)( ~

I (t., x(1)(t.), x(2)(t.)) = | (t., S .) = | (х)

х = t *

Расчет ОД рассмотрен в [4, с. 95].

На рис. 2 построены ОД игроков из начальной позиции і0 = 0 , у = 3, юх = -3 1/с для оптимального гипотетического момента времени 9 * =1,7 с. Параметры системы стабилизации имели следующие значения: с = -2 1/с, к = 4 1/с2, Т = 5 с. В данной начальной позиции гипотетический «промах»

є*(і0,9*)= 0, управление ~(і0,у(і0),юх(і0)) = -1, возмущение I (і 0, у (і 0), ю х (і 0)) = -1.

удовлетворяющих (7), время переходного процесса меньше 1,7 с.

Рассмотрим другой подход для решения поставленной задачи, отличающийся тем, что при выборе управления в позиции {/*, у(/*), юх (/*)} для решения вспомогательной игровой задачи используется одна область достижимости.

Вспомогательную игровую задачу при выборе управления в позиции {/*,у(/*),юх(/*)} сформулируем следующим образом. Движение игроков определяется системой уравнений (6) при ограничении (7). Требуется определить программы управления игроков и (х) и £ (х), при которых выполняется

условие:

є(^,~*) = min min maxJу2(S*) + юx2(S*) , (14)

t* <S*<T u (х) |(х)

где 8(/*, 9*)- гипотетический «промах» в позиции {/*, у(/*), юх (/*)}, 9 *- оптимальный гипотетический момент окончания переходного процесса в данной позиции при самом упорном противодействии второго игрока.

Для решения вспомогательной минимаксной задачи программного управления (14) из позиции {/*, у(/*), юх (/*)} в плоскости Оуюх построим для гипотетического момента времени 9 * ОД 0 для системы (6) с учетом противодействия второго игрока (минимаксную ОД). Границу минимаксной ОД будем строить по точкам, для расчета которых решим следующую минимаксную задачу. В плоскости

Оую х введем единичный вектор 1Т = = [С08(ф),8т(ф)] и найдем программу управления первого игрока, обеспечивающую максимум критерия J = 1Т х (9 *) в предположении, что интересы второго игрока противоположны. Получаем:

w(t.,S., і) = maxminJ = maxminі1 x(S.), (15)

u (х) |(х) u (х) х)

Рис. 2. Области достижимости игроков в гипотетического момента времени 9 * =1,7 с

Моделирование при данных начальных условиях показывает, что при любых видах возмущений,

где x = [у, ю x ] (см. (8)), ф - угол между вектором l и осью о у .

Для решения задачи (15) используем формулу Коши [2, c. 370], тогда:

w(t,, 9,, l) = max min {lTX(9,, t,)x(t,) +

u(t) 4(t)

9*

+ J lTX (9,, t) В[ки(т)-^(t)]J t}. (16)

вид

Для системы (6) фундаментальная матрица имеет

1 [r(S,-х) -1]/ c-

0 іс(^-х)

X (S., х) =

тогда (16) с уче-

том выражения для вектора І можно записать в виде:

w(t., S., і) = W0(t., S., і) +

S.

+ maxmin jW(х,S.,і)[1м(х)-|(T)]dх, (17)

u (х) I(х) І

где

w0(t.,S.,і) = Mt.) + [іс(S-t‘) - 1K(t.)/c}cos(ф) + +[іс( S-fc) ox (t.)]sinfa),

W(х,S.,і) = [іс(S-х) -1]cosfa) /c + іc(S*-х) sin(ф).

С учетом ограничений (7) оптимальные управления игроков можно записать в виде:

й (х) = 1. sign[ W (х, S., і )k ];

I (х) = 1.sign[W (х, S., і)], (18)

тогда из (18) получим:

w(t., S., і) = W0(t., S., і) +

u ( х)

S.

+ j |W (х, S., і )|(k - 1)d х]. (19)

t.

Таким образом, для определения точки на границе минимаксной ОД нужно для заданного направления вектора і решить задачу (19).

Для получения гарантированного минимума отклонения системы от нулевого состояния нужно определить

w(t., S., і) = min w(t., S., і), (20)

IIі II

то есть из (20) находим точку на границе минимаксной области достижимости, ближайшую к началу системы координат Oую x .

С увеличением S . ОД расширяется, тогда минимальный гипотетический момент времени S . гарантированного приведения системы в начало Oую x определяется из условия:

w(t.,S.,і) = шіп w(t.,S.,і).

t. <S. <1

По значению W(t.,S.,і) с использованием (20)

находится минимаксное управление первого игрока в позиции {/*, у(/*), юх (/*)} . Отсюда можно определить и минимаксное значение возмущения в данной позиции.

На рис. 3 построена минимаксная ОД для рассмотренного выше примера из начальной позиции

/0 = 0 , У = 3, ю х = -3 1/с для 9 * =1,7 с. Моделирование при данных начальных условиях, как и при использовании двух ОД, показывает, что при любых видах возмущений, удовлетворяющих (7), время переходного процесса меньше 1,7 с.

Рис. 3. Минимаксная область достижимости

В работе [3, с. 146] подход, основанный на расчете минимаксной области достижимости, использовался для синтеза линейной следящей системы при действии возмущений, а в статье [4, с. 79] - для синтеза нелинейной системы стабилизации углового положения беспилотного летательного аппарата.

Решение рассмотренной задачи показывает, что применение дифференциально-игровых методов на основе расчета областей достижимости улучшает точность и качество САУ при действии детерминированных или случайных возмущений с неизвестными статистическими свойствами.

Литература

1. Красовский, Н.Н. Игровые задачи о встрече движений / Н.Н. Красовский. - М., 1970.

2. Красовский, Н.Н. Позиционные дифференциальные игры / Н.Н. Красовский, А.И. Субботин. - М., 1974.

3. Толпегин, О.А. Дифференциально-игровые методы управления движением беспилотных летательных аппаратов / О.А. Толпегин. - СПб., 2009.

4. Толпегин, О.А. Дифференциально-игровой алгоритм компенсации действия возмущений при управлении беспилотным летательным аппаратом / О.А. Толпегин, А.А. Сизова // Известия Российской академии ракетных и артиллерийских наук. - 2009. - № 3. - С. 79 - 83.

i Надоели баннеры? Вы всегда можете отключить рекламу.