Научная статья на тему 'Метод бискоростного градиента'

Метод бискоростного градиента Текст научной статьи по специальности «Математика»

CC BY
144
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНЫЕ КАСКАДНЫЕ СИСТЕМЫ / СИНТЕЗ / УСТОЙЧИВОСТЬ ПО ЧАСТИ ПЕРЕМЕННЫХ / АЛГОРИТМЫ АДАПТИВНОГОУПРАВЛЕНИЯ / НАСТРАИВАЕМЫЕМНОГООБРАЗИЯ

Аннотация научной статьи по математике, автор научной работы — Мышляев Ю. И.

Рассматривается трёхэтапная схема синтеза алгоритмов адаптивного управления для нелинейных каскадных систем. Приведён класс гладких и релейных алгоритмов бискоростного градиента и условия их применимости.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Мышляев Ю. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DOUBLE SPEED GRADIENT METHOD

The three stage scheme of adaptive control algorithms synthesis for nonlinear cascade systems is considered. Kind of continuous and relay double speed algorithms and conditions of algorithms applicability are presented.

Текст научной работы на тему «Метод бискоростного градиента»

10. Старовойтов Е.И., Воробьев С.А. Контроль работоспособности лазерных излучателей в условиях космического полета с использованием телевизионных средств // Радиотехника. 2011. № 6. С.50-55.

11. Сканирующий лазерный маяк космических аппаратов: заявка на изобретение № 2011106637. Приоритет от 22.02.2011 / РКК «Энергия».

12. Сканирующий лазерный маяк космических аппаратов: заявка на изобретение № 2011106638. Приоритет от 22.02.2011 / РКК «Энергия».

13. Оптико-электронная система обеспечения автоматической за-

правки самолета топливом в полете / А.М. Агеев [и др.] // Вестник Воронежского государственного технического университета. 2010. Т. 6. № 8.

С.52-54.

E.I. Starovoitov

USE OPTOELECTRONIC DEVICES FOR POSITIONING FOR SPACE OBJECTS The use of optoelectronic devices for positioning and navigation in space technology is described. Their options, limiting the use and ways to improve are considered.

Key words: computer vision, laser beacons, spacecraft.

Получено 03.10.11

УДК 62.50

Ю.И. Мышляев, канд. техн. наук, доц., 89105100050, uimysh@mail.ru (Россия, Калуга, КФ МГТУ им. Н.Э. Баумана)

МЕТОД БИСКОРОСТНОГО ГРАДИЕНТА

Рассматривается трёхэтапная схема синтеза алгоритмов адаптивного управления для нелинейных каскадных систем. Приведён класс гладких и релейных алгоритмов бискоростного градиента и условия их применимости.

Ключевые слова: нелинейные каскадные системы, синтез, устойчивость по части переменных, алгоритмы адаптивногоуправления, настраиваемыемногообразия.

Постановка задачи. Рассматривается модель объекта управления (ОУ) в регулярной форме уравнений пространства состояний

*1 = Ж х ^ г X (1) х 2 = /2( *, и,г),

где хт = (х^х^ е Яп,и е Ят

- векторы состояния и входа ОУ,

х2 ^ Кт,х1 ^ Кп т^ ^ ^ - вектор постоянных параметров ОУ, который по постановке задачи считается неизвестным (5 - множество допустимых вариантов значений параметров). ОУ управляем.

Требуется синтезировать класс законов управления и(г), не содержащих неизвестных параметров ОУ, обеспечивающих при любых ограни-

ченных начальных условиях и £еН ограниченность всех траекторий замкнутой системы, и выполнение целевого условия

Q (хъ t )<АХ1 при t > t*, (2)

где Ах > 0, t* > 0, Q(Х1,t) - локальный целевой функционал.

Условие Q (условие роста Q(Х1, t)). Функция Q(Х1, t) неотрицательная, равномерно-непрерывная в любой области вида {(Х1,t): ||хЦ < Р,t > 0} и удовлетворяющей соотношению

infQ(Х1,t)при ЦхЦ^да.

На языке теории устойчивости такая постановка задачи соответствует требованию диссипативности системы по части переменных состояния. В предельном случае (цель управления: Q(Х1,t) ^ 0 при t ^да) задача соответствует требованию асимптотической устойчивости системы по части переменных состояния.

Этапы синтеза. Этап 1. Формирование многообразия гиперповерхностей o(t) = 0, движение по которым, обеспечивает системе (1) выполнение цели управления (ЦУ) (2) в условиях полной информации о параметрах ОУ.

Введём в рассмотрение систему алгебраических уравнений вида

o(t) = Ф( Х, 0, t), (3)

где а е Rm - результирующий вектор; 0 е Rm® - вектор параметров.

В общем случае o(t) можно рассматривать как отклонения траекторий замкнутой системы от заданного многообразия. Будем предполагать выполнение следующего условия.

Условие Ф (условие разрешимости и ограниченности Ф(Х,0,t)).

Пусть для любых о е Rm, x1 е Rn_m, t > 0 уравнение (3) имеет единственное решение Х2 = ж(Х1,0,о, t), причём из ограниченности Х},0,о, t следует ограниченность вектора Х2 при любом t > 0.

Введение уравнения (3) позволяет сформулировать исходную задачу в форме обеспечения ограниченности векторов Х1,0, о, выполнения целевого условия (2) совместно с целевым неравенством

R(о,t) при t > t*, (4)

где Лст > 0, < ^ R(a,t) - целевой функционал.

Замечание 1. Выполнение условия (4) означает быстрое достижение траекторий системы Аст- окрестности многообразия R(о,t) = 0 и, следовательно, окрестности многообразия o(t) = 0. При этом система по части переменных состояния Х1 приобретает желаемые динамические свойства,

задаваемые целевым условием (2). Следует отметить, что в этой постановке задачи значения Аа и Ах^ должны быть согласованными, а именно

Aх = Aх (Аст). Очевидно, что вопрос согласования Аа и Ах^ зависит от конкретной формы функционалов Q(Х},t), R(о,t) и свойств вектор-функции /!(ХЬ ж( Х1,0, о, t), t).

Замечание 2. Цель управления можно усилить, потребовав выполнения условия R(о,t) ^ 0 при t и существенно усилить за счёт требования R(о,t) = 0 при t > t*. В последнем случае отпадает необходимость согласования значений Аа и Ах . Очевидно, что требование согласования

также отпадает, если вместо целевого неравенства (2) потребовать выполнение условия Q(Х1, t) ^ 0 при t .

Условие R (условие роста R(о,t)). Функция R(о,t) -

неотрицательная, равномерно-непрерывная в любой области

{(o,t): ||о|| < Р,t > 0}, и удовлетворяет соотношению

inf R(о,t) при t > 0.

IHI

Условие D1 (условие достижимости).

Существует вектор 0* = 0*)е Rm°, скалярная, непрерывная, строго возрастающая функция pj(Q) > 0 такая, что pj (0) = 0 и выполняется неравенство

w( Х1,0*,0, t) <-Px(Q( ХЬ t)),

где w(Х1,0,о,t) = dQ/ dt + (dQ/ дХ1) f1(Х\,ж(х^0,о,t),t) - полная производная по времени функционала (2) в силу траектории системы (1) с учётом соотношений (3) и условия Ф при 0 = 0* и o(t) = 0.

Этап 2. Синтез алгоритма адаптации параметров многообразия <3(t) = Ф(х, е (t) , t) = 0, обеспечивающего достижение ЦУ (2) в условиях параметрической неопределённости £eS.

Условие C1 (условиевыпуклости).

Функция w(Х1,z, t), z = (бТ °T) выпукла по z, т.е. выполнено

w(Х1,z,t) - w(Х1,z,t) < (z - Z)T Vzw(Х1,z,t) .

Семейство алгоритмов самонастройки параметров многообразия o(t) = 0 выберем в форме

d(0 + Т(Х1,0,о,t) / dt = -rV^w(Х1,0,о,t), (5)

Т Т

где Г = Г > 0-(т$х то) матрица; У^(Х1,0,о,г) = (дw(Х1,0,о,г)/ Э0) -

градиент w(Хl, 0,о, г) по вектору 0; ^(х1,0, о,г) е Яте удовлетворяют приведенному ниже условию.

Условие ¥ (условие разрешимости и псевдоградиентности

Т(Х1,0,о,г)). Гладкая вектор-функция Т(Х1,0,о,г) удовлетворяет условию

Т

псевдоградиентности Т(Х1,0,о,г) V^w(Х1,0,о,г) > 0, и для любых

00 е Ят, х1 е Ят, а е Ят, г > 0, существует единственное решение 0 = х(Х1,00,о,г) уравнения 0 + Т(Х1,0,о,г) = 00.

Замечание 3. Частным случаем (5) является алгоритм в дифференциальной форме

0 (г) = -тVow( Х1,0, о, г), (6)

получаемый при Т(Х1,0, о, г) = 0.

Этап 3. Синтез алгоритма управления, обеспечивающего для системы (1), (5) достижение ЦУ (4). Выберем алгоритм управления из семейства

и = «0 -м Х, 0,0, и, г), (7)

где у - множитель шага; «0 ( х, 0,о, и, г) - начальное (априорно заданное) управление, которое, в частности, может быть выбрано равным нулю; вектор функции ф(х 0, о,и,0 е Ят удовлетворяет приведенным ниже условиям.

Условие С2 (условие выпуклости). Функция ^(х,0,о,и,г) выпукла по и е Ят , т.е. выполнено неравенство

Т

^(х,0,о, и, г) - ^(х,0, о, и,г) < (и - и) Уи^(х,0,о, и, г,

, Л Л дЯ дЯ \ дФ ^ Л дФ , , ЭФ ■ дФ 1

где ц(х,0,о,и,г)= —+ —1 —/1(х,г) + -— /2(х,и,г) + -— 0 + —^ - пол-

ш ^ 0Х1 0x2 ^6 ш J

ная производная по времени функционала (4) в силу траекторий системы.

Условие Б2 (условие достижимости). Существует вектор и* е Ят,

скалярная, непрерывная, строго возрастающая функция Р2(К) > 0 такое,

что Р2(0) = 0 ивыполняетсянеравенство

ц( х, 0, о, и*, г) <-р2( К(о, г)).

Условие Б (разрешимости и усиленной псевдоградиентности ф(х,0, о, и,г)). Вектор-функция ф(х,0, о, и,г) удовлетворяет условию усиленной псевдоградиентности

Ф( х, 0, о, и, г )Т Уи ц ( х , 0, о, и, г) > р| |у и ц( х, 0, о, и, г )| |5,

где Р > 0,5 = 1,2,... - некоторые числа, Уи^(х,0,о,и,г) - градиент

^(х, 0,о, и, г) по вектору и.

Уравнение (7) имеет единственное (доопределённое) решение относительно и.

Условие Ь (условие ограниченности). Функции /1( х, £, г),

/2(х,и,%,г), Vх^(Х1,г1), УстЯ(о,г), Vвw(хь0,о,г), Уии(х,0,о,и,г) - ло-

кально ограничены равномерно по г > 0.

Условие СО (согласованности). Вектор-функция Уи^(х,0,о,и,г) представлена в виде

Уи^ ( х, 0, о, и, г) = М ( х, 0, о, и, г )о, где (т х т) - матрица М(х, 0,о, и, г): ёе! М(х, 0,о, и, г) ф 0 при любых х е Яп,0 е Ят0 ,и е Ят и г > 0 вне области достижения цели управления (2),

(4).

Замечание 4. Условию усиленной псевдоградиентности удовлетворяют, например, функции

ф(х,0,о,и,г) = Ги^(Х,0,о,и,г) при 5 = 2,р = Xтш(Л), (8)

ф(Х,0, о, и,г) = /^§п УиЦ(Х,0, о, и,г) при 5 = 1,р = 1 2), (9)

л/т

~ ~ Т ~

где > 0 - (т х т) - матрицы; Xт^(7~1) - минимальное собственное

число матрицы .

Определение. Алгоритмами бискоростного градиента назовём алгоритмы вида (5),(7)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и = и0 - /ф(х,0, о, и,г), й (0 + ¥(хь0,0,г)) / йг = -ГУ^^^ОДг).

Замечание 5. Алгоритмы адаптивного управления (5),(7) осуществляют настройку параметров 0(г) и вырабатывают управляющее воздействие и(г) в направлениях антиградиентом от скорости изменения двух целевых функционалов Q( Х1, г) и К (о, г). Этим объясняется название рассматриваемого класса алгоритмов адаптивного управления и подчёркивается преемственность и идейная близость с методом скоростного градиента А.Л.Фрадкова [1,2]. При использовании в управлении ф(х,0,о,и,г) в форме (9) получаются алгоритмы с настраиваемым скользящим режимом [3,4].

Теорема. Пусть выполнены условия Ф, ОД,^ ,Б,Ь, СО,С^Б^

i = {Ц2}. Тогда если 5 > 1, то для любого Аа > 0 существуют у = у(Дст) > 0 и д =д (Дст) > 0 такие, что при у > у, АХ1 >АХ1 в системе (1), (3), (5), (7)

все траектории движения ограничены и достигаются целевые условия (2),(4). Для замкнутой системы существует функция Ляпунова вида

172

V (X, о, 0,г) = б( *1,г) + Я(о, г) +1|0 - 0* + Т( *ь0, о, г)|£ + ,

где Г+ - псевдообратная матрица.

Алгоритмы бискоростиого градиента для линейных объектов. В

качестве примера использования метода бискоростиого градиента рассмотрим задачу синтеза в классе линейных систем. Пусть объект управления описывается в регулярной форме

*1 = 41*1 + А12 /Лч /Лч пт

• л л в *1 (0) = *10, *2 (0) = *20, (10)

.•*2 = А21*1 + А 22 *2 + В2М,

где Ау (£) (/,у = 1,2), ^2(^) - постоянные матрицы соответствующих раз-

меров; *1 - (п - т) - мерный вектор; *2 - т - мерный вектор; ёе! В2 ф 0.

Целью управления является ограниченность всех траекторий системы и выполнение условия

||*1(г) - *1* (г )|| < А х, У г > г*,

где *1*(г) - желаемое (эталонное) движение по части переменных состояния объекта управления, заданное эталонной моделью вида

*Э1 = А**Э1 + ВЭ° + В*г, *Э1(0) = *Э1. (11)

Зададим целевой функционал квадратичной формы

0(е) = 0,5еТ Не (12)

Первый этап синтеза. Введём системы алгебраических уравнений

ст(в*, Б*, х) = в*Х1 - Б*г + Х2, (13)

где 0* = 0(£) - т х (п - т) матрица; В* = В(£) - т хт матрицы

идеальных параметров; г е Ят - вектор-функция задающих воздействий; и дополнительную цель (4) с функционалом

Я (о) = 0,5а Т( Вг1)Т Вг1о. (14)

Очевидно, что функционалы (12), (14) удовлетворяют условиям роста О и Я, а правая часть уравнения (13) удовлетворяет условию Ф.

Определим производную по времени от целевой функции (12) в силу уравнений системы (10), (11), с учётом (13):

^(е,0*,В*,Вэ,о) = е НА*е + е Н[^А* — А11 + А120*)*1 +

+ (Вэ - А12) о + (В* - А12 в* )г ].

*

Идеальныепараметры 0*,В*,Вэ выбираем изусловий

А11 — А120* = А*, А12В* = В*, В^ = В** = А12 (15)

Получаем

Т Т

w(e,0*,В*,Вэ,о) = е НА*е <-ре Не,

* (С) Т

где р = —т*^—— > 0, матрица Н = Н > 0 удовлетворяет уравнению

^ тах( Н )

Т — — —Т

Ляпунова НА* + А* Н = -С, С = С > 0. Таким образом, условие достижимости £>1 выполнено и при выбранных идеальных параметрах, гурвицевости матрицы А* и ограниченности задающих воздействий

(||г||<СГ достигается цель управления *1 ^ *31, при г и все

траектории системы (10), (11) ограничены (||*|| .

Второй этап синтеза. Заменим идеальные параметры в выражении (13) ив эталонной модели настраиваемыми

о(0(г),В(г),*) = 0(г)*1 - В(г)г + *2, Вэ = Вэ (г).

Вычисляя градиенты функции ^(е,0, В, Вэ,о) по настраиваемым параметрам, и выбирая алгоритм адаптации в дифференциальной форме (6), получаем

в = г^г) *1(г )Т,

В = -Г2^(г )г (г )Т,

Вэ = Гз Не (г )Х(г )т, Г,- = Г,т > 0, (І = 1,3), X (г) = АЙ Не (г).

(16)

Условие выпуклости С1 выполнено в силу линейности

^(е,0, В, Вэ,о) по настраиваемым параметрам.

Третий этап синтеза. Выберем варианты управления из семейства (7), при которых траектории системы стремятся к многообразию о(0, В, *) = 0 . Вычислим производную от целевого функционала (14):

^( *, 0, о, и, г) = Я (о) = о Т(В24)Т В24Р (*,г ) + о Т(В24)Т и, где Р(*,г) = (0Ац + А12 + 0)*1 + (0А12 + А22)*2 - Вг - Вг.

Вычисляя градиент от ц(*, 0,о, и, г) и полагая щ = 0, получаем гладкие, релейные и комбинированные алгоритмы вида

и = -пВ2_1о, (17)

и = ~У2 8*§п В^с, (18)

и = -пВ2_1о -^2^ В2_1о , (19)

174

для которых выполнены условия усиленной псевдоградиентности Б.

Условие выпуклости С2 и условие ограниченности Ь выполнены в силу линейности объекта и вида правой части алгоритмов (16). Условие согласованности СО выполнено в силу ёй В2 ф 0.

Проверим выполнение условия достижимости Б2. Для этого вновь рассмотрим производную от целевого функционала (14)

Я (о) = о Т (В2~1)Т В^Р (*, г) + о Т (В?)Т и .

Очевидно, что условие достижимости выполнено, например, при и* в форме релейного управления (18) и

У 2 > У =

х1\+ Ух2 х2

0

+ У

Хі

хі

+ у

х2

х2

+

+

где То

>

В21

Х1 ( +уг И )+1 \°¥ |}+p,

> Ух1 ИАПІ|> 1х2 ї|Иі2І> Ъ1 £ІІА21ІІ> Ух2 ЦА22Ї

У в

>

выполняется неравенство

Я <-р

У /

1

>

Р > 0;

В2 *

Таким образом, условия теоремы выполнены, все траектории системы (10), (11) с алгоритмом управления (17) (18), (19) и алгоритмом адаптации (16) ограничены и достигаются цели управления (2), (4).

Замечание 6. При использовании релейного алгоритма управления (18) с настраиваемой поверхностью скольжения многообразие 0(0, В, х) = 0 достигается за конечное время и Q(e) ^ 0 при г (е ^ 0

при г ^да).

При использовании комбинированного алгоритма (19) в зависимости от величины коэффициента усиления у2 удаётся достигнуть многообразия о(0, В, х) = 0 асимптотически или за конечный промежуток времени и Q(e) ^ 0 при г (е ^ 0 при г ).

Гладкий алгоритм управления (17) обеспечивает достижение целевого неравенства (4) при любом Аа > 0 и достаточно большом

У1 > у > 0 (теорема 3.3 [2]). При этом основная цель управления (2) достигается, более того за счёт адаптации В3 (г) и обеспечения условий идентифицируемости удаётся обеспечить Q(e) ^ 0 при г .

175

Замечание 7. Можно отказаться от настройки параметров B3 (t),

увеличив коэффициенты усиления у i (i = 1,2) алгоритмов управления (17),

((18)). Можно исключить из уравнения эталонной модели слагаемое B30 .

Однако, введение в эталонную модель о (t) уменьшает ошибку

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

слежения e (t) вне поверхности скольжения, что в свою очередь,

уменьшает энергетические затраты на управление. Значения настраиваемых параметров B3, в силу условия согласованности (15),

можно использовать для оценки матрицы A12.

Пример. Пусть объект управления описывается уравнением

X1 = а,ц + $12 х2;

Х2 = a21 х1 + a22х2 + b2u; х1 (0) = 1, х2 (0) = 2, где $ij (i, j = 1,2), b2 - параметры ОУ (b2 > 0,$12 > 0).

Желаемое поведение системы зададим уравнением

х1э = -3х1э +3r(t)+ьэ(t)o(t); х1э(0) =2,

где r(t) = sin(nt /3) - задающее воздействие.

Алгоритм адаптивного управления в соответствии с (16) имеет вид

u (t) = -y(t )signa(t);

0(t) = j1e(t) x1(t); d (t) = -y 2e(t) r (t);

b =J3e(t )G(t),

где

a(t) = 0(t)xi(t) + X2(t) - d(t)r(t), e(t) = x^(t) - х^з(t), y(t) = 3 • (|x^ + (|0| + e ^ 1) ^ X21(2101 + 3) + e + ^ |d|).

На рисунке приведены результаты моделирования системы с модифицированным алгоритмом адаптивного управления при начальных условиях

0(0) = -0,5; d(0) = 0,1; Ьэ(0) = 0.5, параметрах объекта управления

a11 = 1; a12 = 2; a21 = 1^ a22 = 3; b2 = 1,

параметрах адаптера = 4, у2 = 2, Уз = 60, Уо = 3

176

г

г

^12

0 2 4 6 8 10 12 14 16 18

0 2 4 6 8 10 12 14 16 18

□ 2 4 6 8 10 12 14 16 18 20

ь

Э 4

г

X

2

Результаты моделирования системы слежения с настраиваемой поверхностью скольжения (модифицированный алгоритм)

Пример иллюстрирует наличие идентифицирующих свойств у релейных алгоритмов с настраиваемой поверхностью скольжения в реальном скользящем режиме [3,4].

Список литературы

1. АндриевскийБ.Р., Стоцкий А.А., ФрадковА.Л. Алгоритмы скоростного градиента в задачах адаптации и управления // Автоматика и телемеханика. 1988. №12. С.3-39.

2. Мирошник И.В., Никифоров В. О., ФрадковА.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб.: Наука, 2000. 549 с.

3. Мышляев Ю.И. Алгоритмы управления линейными объектами в условиях параметрической неопределенности на основе настраиваемого скользящего режима // Мехатроника, автоматизация, управление. 2009. №2. С. 111-116.

4. Методы робастного, нейро-нечёткого и адаптивного управления/ Л.А. Пупков [и др.]. М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. 744 с.

Y.I. Myshlyaev

DOUBLE-SPEED GRADIENT METHOD

The three-stage scheme of adaptive control algorithms synthesis for nonlinear cascade systems is considered. Kind of continuous and relay double-speed algorithms and conditions of algorithms applicability are presented.

Key words: nonlinear cascade systems, synthesis, partial stability, adaptive control algorithms, configurable manifolds

Получено 03.10.11

УДК 681.51

H.H. Макаров, д-р техн. наук, проф., (4872)35-38-35, info@sau.tsu.tula.ru, М.В. Кузьмин, магистрант (Россия, Тула, ТулГУ)

ПУТИ МОДЕРНИЗАЦИИ НЕУПРАВЛЯЕМОГО ЛЕТАТЕЛЬНОГО АППАРАТА

Рассматриваются возможности модернизации вращающегося неуправляемого летательного аппарата посредствомустановки на него рулевых органов с использованием минимума доступной информации. В системе используется минимальное количество датчиков.

Ключевые слова: летательный аппарат, система управления, головка самонаведения.

Движение летательного аппарата (ЛА) рассматривается в вертикальной плоскости и описывается системой нелинейных дифференциальных уравнений, учитывающих аэродинамику ЛА, изменение плотности воздуха на высоте, нелинейность аэродинамических коэффициентов в за-

i Надоели баннеры? Вы всегда можете отключить рекламу.