Научная статья на тему 'Градиентный алгоритм адаптации в системе управления ориентацией деформируемого космического аппарата'

Градиентный алгоритм адаптации в системе управления ориентацией деформируемого космического аппарата Текст научной статьи по специальности «Математика»

CC BY
575
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ДЕФОРМИРУЕМЫЙ КОСМИЧЕСКИЙ АППАРАТ / УПРУГИЕ КОЛЕБАНИЯ / ОГИБАЮЩАЯ / АДАПТИВНОЕ УПРАВЛЕНИЕ / FLEXIBLE SPACECRAFT / FLEXIBLE OSCILLATIONS / ENVELOPE / ADAPTIVE CONTROL

Аннотация научной статьи по математике, автор научной работы — Силаев Андрей Владимирович

Рассмотрена задача минимизации уровня упругих колебаний в угловом движении деформируемого космического аппарата. Получены уравнения, позволяющие оценить огибающие упругих мод с учетом их собственного демпфирования. Предложен градиентный алгоритм беспоисковой адаптации параметра базового закона управления ориентацией объекта, минимизирующий общую огибающую упругих мод.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Силаев Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Градиентный алгоритм адаптации в системе управления ориентацией деформируемого космического аппарата»

УДК 517.977.5:629.7

ГРАДИЕНТНЫЙ АЛГОРИТМ АДАПТАЦИИ В СИСТЕМЕ УПРАВЛЕНИЯ ОРИЕНТАЦИЕЙ ДЕФОРМИРУЕМОГО КОСМИЧЕСКОГО АППАРАТА1

А.В. Силаев

Рассмотрена задача минимизации уровня упругих колебаний в угловом движении деформируемого космического аппарата. Получены уравнения, позволяющие оценить огибающие упругих мод с учетом их собственного демпфирования. Предложен градиентный алгоритм беспоисковой адаптации параметра базового закона управления ориентацией объекта, минимизирующий общую огибающую упругих мод.

Ключевые слова: деформируемый космический аппарат, упругие колебания, огибающая, адаптивное управление.

ВВЕДЕНИЕ

Возмущающее влияние упругих колебаний нежестких элементов конструкции (панелей солнечных батарей, антенн и других элементов) на движение деформируемых космических аппаратов (ДКА) приводит к необходимости учета при разработке систем управления их ориентацией достаточно большого числа мод упругих колебаний, даже если амплитуды этих мод малы по сравнению с координатами движения ДКА как абсолютно жесткого тела. Это вызвано тем, что при длительном сроке функционирования объекта и при определенных условиях может возникнуть явление резонанса отдельной моды, выражающееся в неограниченном возрастании ее амплитуды, ведущим к захвату регулятора упругими колебаниями, т. е. к потере устойчивости системы [1]. Вследствие этого алгоритмы управления ориентацией ДКА, полученные для абсолютно жесткого объекта, оказываются неработоспособными. В связи с этим необходима разработка методов оценки уровня упругих колебаний и, в случае необходимости, изменения закона управления, например, путем адаптации его параметров в допустимых пределах в целях минимизации уровня упругих колебаний.

Существенная нелинейность и высокая размерность математической модели ДКА приводят к тому, что при исследовании динамики движения с учетом упругости конструкции важнейшим инструментом служит цифровое моделирование. Большие

1 Работа выполнена при финансовой поддержке РФФИ

(проект № 08-08-00512) и Отделения ЭММПУ РАН (программа № 15).

затруднения вызывает широкий диапазон собственных частот упругих мод, что требует выбора шага интегрирования дифференциальных уравнений мод, исходя из максимальной частоты мод. Это приводит к существенному увеличению времени моделирования. В то же время для оценки влияния мод (в особенности высокочастотных) на движение системы в целом достаточно знать не мгновенные значения координат мод, а их текущие амплитуды (огибающие), изменяющиеся во времени относительно медленно. Огибающие можно моделировать с существенно большим шагом, что значительно сократит время моделирования. Поэтому представляет интерес разработка методов оценки огибающих упругих мод.

1. ПОСТАНОВКА ЗАДАЧИ

Наиболее удобной формой описания упругих мод служит модально-физическая модель [2] углового движения ДКА:

х = т(и),

х, + 2^5, х, + 52 х, = к, т(и), / = 1, п, (1)

П

х = х + X , х = ^ х,,

, = 1

где х — координата движения ДКА как абсолютно жесткого тела; х, — координата /-й моды упругих

колебаний; 5,, и к, — соответственно собственная циклическая частота, коэффициент затухания и коэффициент возбудимости /-й моды; п — число учитываемых мод; т(и) — приведенный управляющий момент; и = и(х, х, t, 1) — базовый релей-

(2)

но-логическии закон управления; х и х — измеряемые координаты объекта; х — дополнительная составляющая координаты х, обусловленная упругими колебаниями; X — параметр базового закона управления, доступный адаптации. Обычно моды слабодемпфированные, поэтому значения малы.

Для ДКА с длительным сроком существования в качестве базового закона управления ориентацией нередко используют релейно-логические законы, приводящие к автоколебаниям, которые обеспечивают требуемую динамику процессов управления в замкнутой системе.

Рассмотрим в качестве базового закона управления ориентацией ДКА алгоритм на основе релейно-логической функции и(х), зависящей только от одной измеряемой координаты х. Если пренебречь упругими колебаниями (т. е. при х « х), то в окрестности координат, близкой к области существования предельного цикла, этот алгоритм может быть описан следующим образом:

и(х) =

+ иЕУ|х| < е V ?< ?0;

-ииУх > Е V ? е [ ?0, tx ], х( ? 1) = е - у,

?1 - ?0 = т1;

+ ии^х < Е — уА t е[ ?1, ?2 ], ?2 — ^1 = ^2 = к^ Т1,

0 < к < 1;

+ иЕУ |х| < Е — у V t > t2.

Сигналы (напряжения) +ии, — ии, +иЕ используются для включения исполнительного органа, создающего управляющие воздействия +ти, — ти, +тЕ соответственно. Для пояснения работы алгоритма на рис. 1 представлена фазовая плоскость, отображающая автоколебания, вызываемые данным алгоритмом при некоторых значениях его параметров. Пусть 0 на рис. 1 — начальная точка, соответствующая моменту ^ начала функционирования системы стабилизации. Примем для определенности х(^) > е. В соответствии с данным алгоритмом к объекту прикладывается воздействие —ти, уменьшающее начальное отклонение. В некоторый момент t = ^ изображающая точка попадет на линию переключения Х2 (х(^) = е — у). Время движения по траектории 0—1, равное т1 = = ^ — ^, измеряется и запоминается. По сигналу датчика угла х(^) = е — у управляющее воздействие, приложенное к объекту, меняет знак на противоположный (+ти), под влиянием которого осуществляется торможение объекта в течение расчетного времени т2 = к^х1, где к — коэффициент возврата, доступный адаптации в определенных пределах. Далее под влиянием «слабого» управле-

Рис. 1. Движение системы на фазовой плоскости в окрестности предельного цикла без учета упругих колебаний

Рис. 2. Приведенный управляющий момент в режиме автоколебаний

ния +тЕ по траектории пассивного движения 2—3 внутри зоны нечувствительности система возвращается на исходную правую границу зоны нечувствительности в точке 3 (х(^) е Х1), выходя в конечном счете на траекторию предельного цикла Г.

Функционирование регулятора в режиме автоколебаний (Г), представленное периодической последовательностью импульсов управляющего воздействия, отображено на рис. 2. Вид автоколебаний, установившихся в системе, зависит от соотношения значений т , т и к.. Автоколебания,

и Е / 5

представленные на рис. 1 и 2, соответствуют случаю минимального расхода энергии и являются односторонними, т. е. фазовая траектория движения системы никогда не пересекает левую границу зоны нечувствительности — линию переключения Х3, на которой х(^ = —е. Параметры автоколебаний т1, т2 и т3, как и общий период цикла

Т0 = т1 + т2 + т3, определяются параметрами базового алгоритма е, у, кя ти и тЕ. В процессе движения релейный алгоритм (2) воздействует на упругие моды и при определенных условиях может вызвать резонанс отдельной моды. При этом огибающая данной моды будет неограниченно возрастать.

Требуется разработать:

— метод оценки огибающих отдельных мод и

общей огибающей движения х, вызванного упругими колебаниями;

— алгоритм адаптации параметра кр позволяющий минимизировать общую огибающую упругих колебаний.

2. ОЦЕНКА ОГИБАЮЩИХ УПРУГИХ МОД

Предлагаемый здесь метод оценки огибающих демпфированных упругих мод основан на результатах, полученных в работе [3] для недемпфированных мод. Рассмотрим /-ю моду, описываемую уравнением

х. + 2£.5.х. + 5{ XI = Ш),

(3)

где./.(?) = к. т(и).

Согласно методу Крылова — Боголюбова [4] приближенное решение уравнения (3) имеет вид

X(^ = a{.(t)cos0{.(t), где 0г(^ = 511 + фг(0, а аг(^ и Фг(^ — относительно медленно меняющиеся функции времени, яг(^ — огибающая моды. Выражения для X и X имеют вид [4]

X = —яг(05{sin0{.(t), X = 51 а. (^ш0г(^ —

X 2 X

— 5. a{.(t)cos0{.(t) — 5. аг(*) фI cos0г.(t) при условии

а I (t)cos0г.(t) — а;(^ ф г- (^т0г(^ = 0. (4)

После подстановки выражений X и X уравнение (3) примет вид

- 5. а .(^т0г(О - 5. аг(0 ф. (О^0г.(О -

- 2^г 52 a{.(t)sin0{.(t) = /(!). (5)

Преобразуем уравнения (4) и (5) в целях получения выражений для а. (^ и ф{(t), удобных для решения с помощью численных методов. Для этого умножим уравнение (4) на 5 {sin0{.(t), уравнение (5) — на cos0{.(t) и сложим полученные уравнения. Затем умножим уравнение (5) на sin0{.(t) и вычтем из него уравнение (4), умноженное на 5. cos0{.(t). В результате несложных преобразова-

ний, опуская для простоты зависимость переменных от ^ получим

ф I = (-2^-5 2 а ^п2( 51t + ф^^ 51t + ф.-) -/■^( 5. t + ф.))/( 5. а.),

а . = (-2^. 52 а. sin2( 5. t + ф.) -

(6)

I I

- /sin( 51t + ф.М 51). (7)

Уравнения (6) и (7) могут быть решены численными методами при начальных условиях а..(0), ф..(0), определяемых по заданным начальным значениям координат моды X (0), X (0) из соотношений X (0) = a{.(0)cosф{.(0), X (0) = - 5 . a{.(0)sinф{.(0).

Моделирование уравнения (6) может представлять трудности при малых значениях а.. Поэтому перейдем к новым переменным А^) = a{.(t)cosф{.(t), Вг(^ = а.^Шф^) способом, описанным в работе [5]. Для этого умножим уравнение (7) на cosф{. и вычтем из него уравнение (6), умноженное на а^Шф.. Затем умножим уравнение (6) на a{.cosф{, уравнение (7) — на sinф{. и сложим. В результате получим уравнения относительно новых переменных:

А. = -(2^ 5. (А^т 5. t + B{.cos 5.0 +

+ к. т(и)/5 г )sin 5 . t, (8)

В = -(2^, 5. (А^т 5. t + B{Cos 5.0 +

+ к. т(и)/51 )cos 5 ^ (9)

при следующих начальных условиях: А;(0) = X (0),

В(0) = - X (0)/5..

Тогда огибающая а. /-й моды определяется следующим образом:

а. = ,/А2 + В2 . (10)

Общая огибающая п упругих мод а вычисляется как сумма а., / = 1, п. Тогда движение х (^, вызванное упругими колебаниями, будет ограничено областью [-а, а].

Нетрудно видеть, что уравнения, полученные в работе [3] для оценки огибающих недемпфированных мод, являются частным случаем уравнений (8) и (9) при = 0.

Для оценки огибающих мод требуется однократное (на всем интервале времени функционирования объекта) получение информации о начальных

значениях их координат X (0), X (0), / = 1, п, что может быть реализовано с помощью наблюдателя состояния, работающего на коротком отрезке времени, необходимом для оценки значений координат мод. В работе [6] дан пример совместного оце-

<10

Рис. 3. Результаты оценки огибающих упругих мод:

а — для первой моды; б — для пятой моды

нивания координат мод и их параметров 5 ., кг- с помощью расширенного фильтра Калмана.

Продемонстрируем работоспособность предложенного метода оценки огибающих демпфированных мод на примере объекта, плоское угловое движение которого описывается системой уравнений (1) при следующих значениях параметров мод: 51 = 0,44; 52 = 0,755; 53 = 2,2; 54 = 6,5;

55 = 10,6; к = 0,425; £2 = 2,16; к = 0,587; к4 = 0,82; к5 = 0,415; ^ = 0,003, і = 1, 5, при законе управления (2) с параметрами тЕ = 10 6,

тц = 8-10-6, б = 5-10-4, у = 10-4, к = 0,31, нулевых начальных условиях на координаты мод и

X (0) = 4,5- 10-4, Х(0) = 2,2-10-5.

Для всех пяти мод были получены огибающие с помощью уравнений (8)—(10). Результаты для первой (низкочастотной) и пятой (высокочастотной) мод представлены на рис. 3. Для остальных мод огибающие так же точно соответствуют координатам своих мод. Следует отметить, что значения параметров мод к., 5г-, не играют сущест-

венной роли для метода оценки огибающей: метод дает такие же точные результаты и при других значениях параметров, что было проверено в результате моделирования.

3. ГРАДИЕНТНЫЙ АЛГОРИТМ ПАРАМЕТРИЧЕСКОЙ АДАПТАЦИИ

Перейдем к решению задачи минимизации уровня упругих колебаний, оцениваемого значением их общей огибающей, с помощью адаптации

параметра к* базового закона управления. Результаты моделирования движения ДКА при законе управления вида (2) показывают, что общую огибающую мод а(^ можно приближенно считать почти периодической функцией времени, причем влияние параметра к* на ее значение проявляется с определенной динамикой. В связи с этим зависимость а от к следует оценивать не по мгновенному значению а(^, а по осредненному на отрезке времени, длительность Т которого должна превышать период функции а(^, определяемый частотами мод и параметрами закона управления. Работоспособность предлагаемых алгоритмов адаптации по критерию минимума среднего значения

общей огибающей а упругих мод определяется ха* + т

рактером зависимости а (к*), где а = - | а(т)йГ.

*

Исследования, представленные в статье [7], показали, что при приведенных в § 2 параметрах мод и закона управления (2) период моды а(^ приблизительно равен 71 с, поэтому минимальное значение Т должно быть больше 71 с. Окончательный выбор значения Т должен подтверждаться на основании моделирования по следующему правилу: при одних и тех же исходных данных и постоянных

параметрах значение а должно быть приблизительно постоянным (с определенной точностью).

На рис. 4 представлена зависимость а (к*) для объекта с двумя низкочастотными модами с параметрами 51 = 0,44 с-1, 52 = 0,755 с-1, к = 0,0107, к2 = 0,0108, ^1 = ^2 = 0,003, при начальных условиях на координаты мод х1 (0) = 1,38 • 10 6, х"2 (0) = х1 (0) = х"2 (0) = 0 и жесткого тела х (0) = 4,5- 10-4, х (0) = 2,2-10-5, прежних значе-

Рис. 4. График зависимости а (А,)

ниях параметров закона управления (2) и при к*, изменяющемся на отрезке от 0,2 до 0,45. Длительность T интервала осреднения общей огибающей была взята равной 200 с. Из графика видно, что зависимость а (к*) носит плавный характер и имеет небольшое число локальных минимумов.

Самым простым решением было бы присвоение параметру к* значения, при котором достигался бы минимум функции а (к*). Но это, прежде всего, может привести базовый закон управления к виду, при котором нарушается выполнение функций, возложенных на объект. Далее, вид функции

а (к*) зависит от параметров мод, которые в процессе полета могут изменяться вследствие перестройки конструкции ДКА на орбите, изменения упругих свойств элементов конструкции из-за температурных отклонений, старения материалов и других факторов. В этом случае необходима периодическая идентификация параметров мод (см., например, статьи [6, 8]).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В связи с этим наиболее рациональным решением поставленной задачи был бы подбор с помощью адаптивной настройки значения параметра к*, при котором достигался бы локальный (в лучшем случае, глобальный) минимум нелинейной функции а (к*). Это задача нелинейного программирования, которая может быть решена известными методами [9]. В работе [7] было предложено ее решение для недемпфированных мод на основе алгоритма случайного поиска с обучением. В данной работе, кроме распространения уже разработанного поискового алгоритма на случай демпфированных мод, предлагается градиентный алгоритм бес-поисковой адаптации.

_ х10-5

Рис. 5. График зависимости а (А,) при увеличении значений к, и х,- (0), I = 1, 2, в 20 раз

Рис. 6. Движение системы на фазовой плоскости:

а — при заданных значениях к(., х(- (0), г = 1, 2; б — при увеличении их в 4 раза

С ростом начальных условий на координаты мод и их коэффициентов возбудимости к. характер зависимости а (к*) меняется. Так, на рис. 5 представлена зависимость а (к*) при увеличении

коэффициентов кг и начальных условий X (0), X (0) по обеим модам в 20 раз. Зависимость уже не имеет продолжительных участков монотонного изменения, и методы [9] решения задачи нелинейного программирования неприменимы.

Если исследовать движение объекта в этих случаях методом фазовой плоскости (х, х), то можно сделать следующий вывод (см. рис. 6, полученный при к* = 0,31): при малых значениях начальных условий на координаты мод и коэффициентов возбудимости (эти значения были приведены ранее) движение изображающей точки системы на фазовой плоскости близко к устойчивому предельному циклу (рис. 6, а); при увеличении начальных условий и коэффициентов возбудимости предельный цикл сохраняется, но становится «размытым» (так, рис. 6, б соответствует случаю, когда значения начальных условий и коэффициентов кг увеличены в четыре раза); при дальнейшем росте значений

начальных условий и к. предельный цикл пропадает. Таким образом, представленные далее методы параметрической адаптации применимы при таком уровне упругих колебаний, при котором устойчивый предельный цикл сохраняется (например, в случаях, соответствующих рис. 6).

Для минимизации среднего значения общей огибающей мод а путем настройки параметра к* может быть применен градиентный метод наискорейшего спуска [9], основанный на определении значения аргумента к*, при котором достигается

локальный минимум функции а (к*). Градиентные методы являются итерационными и основаны на определении направления и значения пошагового значения аргумента для достижения экстремума функции по ее градиенту. Предлагаемый здесь алгоритм заключается в следующем.

На начальном такте (к = 1) в момент времени t = ^ задается начальное значение параметра

к* = к(0), при котором осуществляются оценка общей огибающей п учитываемых мод и ее осреднение; в момент t = ^ + T окончания начального такта вычисляется среднее значение общей огибаю-

„ -(0) -//(0)ч

щей мод на данном такте а = а (к) ).

На первом такте (к = 0) принимается новое значение параметра к( к) = к(к -1) + А, где А — заданное

малое по сравнению с к(0) значение — пробный шаг изменения параметра к*; в момент t = /0 +

— (к)

+ (к + 1) Т окончания к-го такта оценивается а , и вычисляется приближенное значение градиента функции а (к*) по формуле V а(к) = (а(к) -

-(к - 1К//,( к) , (к - 1К

- а )/(к* - к* ), а также относительное из-

“ л, 5(к) /-(к) -(к-1) ,-(к-1)

менение этой функции 8' ’ = (а - а / а .

На следующем такте (к = к + 1) принимается

, (к) , (к- 1) . , „-(к) новое значение параметра к* = к* - Ак^ а ,

где Ак* — шаг изменения параметра к*; в момент

t = *0 + (к + 1) Т окончания к-го такта оценивается

-(к) п-(к) „(к)

а , вычисляются Vа и 8 , проверяется условие: если 8(к) < 0 и 8(к - 1) < 0 (т. е. функция а (к*) убывает на текущем и предыдущем тактах алгоритма), то значение шага Ак* следует увеличить (например, в два раза: Ак* := 2Ак*), если же 8(к) > 0 и 8(к - ^ < 0, у = 1, N (т. е., по крайней мере, на N предыдущих тактах алгоритма функция а (к*) убывала, а на текущем начала возрастать), то это означает, что локальный минимум функции а (к*) пройден, шаг Ак* необходимо уменьшить до некоторого

значения А к*, которое дальше будет оставаться постоянным, а значение к* на следующем такте установить на промежутке между последним и предпоследним его значениями, но ближе к пред-

последнему (при котором 8(k ^ < 0), с последующей его настройкой на дальнейших тактах с шагом

A kt. В частности, примем такое правило выбора

значения k( k + ^ на следующем (k + 1)-м такте пос-

7 (k + 1)

ле перехода через локальный минимум: k) де-

, (k - 1)

лит промежуток между двумя значениями k) и

k( k) в отношении 1/р, считая от k(k -1) (р — целое положительное число, р = 3, 4). При приближении k)k) к окрестности значения, при котором достигается локальный минимум функции a (kt), знак 8(k)

^-( k)

будет постоянно чередоваться, а значение V а существенно уменьшится (в сотни и тысячи раз). При других комбинациях знаков текущего и пре-

^ o(k)

дыдущих значений 8 настройка продолжается с предыдущим значением Akt.

Данный алгоритм реализует приближенный способ выбора оптимального значения шага изменения настраиваемого параметра kt путем его непрерывного увеличения (например, удвоения) до достижения локального минимума функции a (kt), что позволяет увеличить быстродействие алгоритма. Описанный алгоритм представляет собой развитие алгоритма, предложенного в работе [10], где шаг Akt предполагался постоянным.

Проведено моделирование работы данного алгоритма для ДКА (1) с учетом двух упругих мод при базовом законе управления (2). Параметры мод и закона управления были приведены ранее. Длительность такта алгоритма T была выбрана с помощью моделирования равной 200 с. Начальное значение параметра kt было принято равным 0,31, начальное значение шага изменения параметра kt Akt = 5; число N тактов в правиле обнаружения момента достижения экстремума функции a (kt) равно 6; значение р, устанавливающее величину kt после перехода через оптимальное значение, равно 3. После перехода через локальный минимум функции

a (kt) устанавливается постоянный шаг A kt = 50. Результаты моделирования представлены на рис. 7.

Среднее значение общей огибающей мод а в результате работы алгоритма снижается приблизительно в 7 раз по сравнению со значением a, которое было бы при отсутствии адаптации (при

kt = const = 0,31 a « '7-10 6); при этом устанавливается значение к,, равное 0,234, близкое к оптимальному, равному 0,230, полученному путем построения зависимости a (kt) при данных значениях параметров мод и закона управления (2). Отметим,

Рис. 7. Результаты работы градиентного алгоритма адаптации:

а — общая огибающая а и ее среднее значение а; б — настройка параметра к(

что учет только двух низкочастотных мод не является принципиальным ограничением и принят в целях сокращения времени моделирования.

Моделирование также показало, что и при других значениях коэффициента затухания мод _________2 _3

(^. = 10 , 10 ) алгоритм по-прежнему решает поставленную задачу (с уменьшением значение

Т следует увеличивать) и лишь при <10 4 не дает положительного результата. Это связано с тем, что при малых значениях коэффициента характер

изменения функции а (к*) меняется (см. результаты, представленные в статье [7]): на общую тенденцию изменения величины а накладываются ее колебания, поэтому градиент функции может не передавать общую тенденцию ее изменения.

Сравним работу предложенного в статье [7] поискового алгоритма адаптации, основанного на методе случайного поиска с элементами обучения [9], для случаев недемпфированных и демпфированных мод. Первый случай рассмотрен в статье [7]. Применим алгоритм для объекта с двумя демпфированными модами (параметры базового закона управления, начальные значения координат

были приведены ранее, параметры мод 5. и к. прежние, а = 0,01, / = 1, 2). Поскольку алгоритм был подробно представлен [7], в данной работе только кратко опишем его суть и укажем введенные отличия от изложенного ранее.

Алгоритм заключается в моделировании общей огибающей мод, ее осреднении на отрезке времени длительностью Т, в результате чего получается

среднее значение общей огибающей а; значение параметра к* на каждом к-м такте работы алгоритма (к(к)) вычисляется путем прибавления к значению этого параметра на предыдущем такте (к(к -1)) величины гАк*, где Ак* — заданное малое приращение параметра, а г — случайное вещественное число, равномерно распределенное на отрезке, границы которого симметричны относительно нуля. Число г выбирается на каждом шаге, его абсолютное значение случайно, а знак определяется опытом, достигнутом на предыдущем шаге: если значение а на текущем шаге меньше, чем на предыдущем, то направление поиска значения параметра к* на предыдущем шаге было выбрано правильно и его следует сохранить и на текущем шаге (т. е. новое значение г должно быть одного знака с предыдущим), в противном случае знак г необходимо сменить на противоположный. Именно в этом и состоит элемент обучения. В алгоритме предусмотрено также исключение случаев неоправданных однократных смен знака числа г, вызванных

случайным ростом значения а вразрез с устоявшейся тенденцией его снижения. В связи с этим также следует исключить малые по абсолютной величине значения г, например, принять 0,1 < | г | < 1.

Для установления момента достижения локального минимума функции а (к*) на каждом

такте вычисляется относительное изменение а:

(к) -(к - 1К,-(к).

8 = |( а - а )/а |. Если 8 < 80, где 80 > 0 —

заданное малое число, на протяжении нескольких (например, шести) тактов подряд, то считается,

что локальный минимум функции а (к*) достигнут, и процесс адаптации можно завершить, зафиксировав последнее значение параметра к*.

Результаты моделирования показали, что учет демпфирования мод облегчает работу алгоритма, что позволило внести упрощения в исходный алгоритм, представленный в статье [7]. Так, если не зафиксировать значение параметра к* при приближении к локальному минимуму функции а (к*), то в случае недемпфированных мод при переходе через этот минимум начинаются колебания величин

а и к* со значительной амплитудой. Для демпфированных мод при значениях \,, превышающих некоторое предельное значение, фиксировать к* необязательно, так как заметных колебаний не происходит. Так же в алгоритме, предложенном в работе [7], по результатам моделирования было введено минимально необходимое время Тш1п работы алгоритма, по достижении которого можно было проверять условие окончания процесса адап-

Рис. 8. Результаты работы поискового алгоритма адаптации:

а — общая огибающая a и ее среднее значение a; б — настройка параметра kt

тации. Для демпфированных мод нет необходимости во введении этого дополнительного условия.

На рис. 8 представлена работа алгоритма при начальном значении параметра к*, равном 0,31. Длительность такта алгоритма Т (интервала осреднения общей огибающей) принята равной 100 с. Фиксация значения к* при приближении к локальному минимуму функции а (к*) не предусмотрена. Ранее было указано, что без применения алгоритма адаптации значение а устанавливается на уровне приблизительно 7 • 10_6; с использованием адаптации значение а снижается в 5 раз, достигая 1,4^10 6. Значение параметра к* будет колебаться в узком диапазоне около значения 0,35, близкого к другому локальному минимуму функции а (к*).

При этом колебания величины а несущественны. Из сравнения результатов, представленных в статье [7] и в данной работе, видно, что наличие демпфирования позволило снизить длительность такта Т алгоритма с 500 до 100 с, что существенно повысило быстродействие процесса адаптации, улучшило динамику процессов.

Моделирование показало, что алгоритм сохраняет работоспособность и при других значениях

_2

коэффициента затухания мод, однако при < 10 необходимо фиксировать значение к* при приближении к локальному минимуму функции а (к*), как это осуществлялось в работе [7], иначе начинаются существенные колебания величин а и к*.

ЗАКЛЮЧЕНИЕ

Получена математическая модель для оценки огибающих мод упругих колебаний ДКА при учете их собственного демпфирования. На ее основе разработан градиентный алгоритм параметрической адаптации базового закона управления ориентацией ДКА, позволяющий минимизировать среднее значение общей огибающей упругих мод. Показана работоспособность предложенного ранее поискового алгоритма для случая демпфированных мод. На основании результатов моделирования проведено сравнение обоих алгоритмов при их работе на одном и том же объекте.

Полученные результаты могут быть полезны для разработчиков систем управления ориентацией ДКА в случаях, когда базовые алгоритмы управления вызывают высокий уровень упругих колебаний.

ЛИТЕРАТУРА

1. Рутковский В.Ю., Суханов В.М. Особенности релейного управления деформируемыми спутниками // Тр. 5-го Междунар. симпозиума ИФАК по автоматическому управлению в пространстве / Сб.: Управление в пространстве. — М.: Наука, 1975. — Т. 1.

2. Рутковский В.Ю, Суханов В.М. Большие космические конструкции: модели, методы исследования и принципы управления // Автоматика и телемеханика. — 1996. — № 8. — С. 55—66.

3. Силаев А.В., Суханов В.М. Методы оценки огибающей упругих колебаний деформируемого космического аппарата // Автоматика и телемеханика. — 2002. — № 4. — С. 76—90.

4. Боголюбов Н.Н., Митропольский ЮА. Асимптотические методы в теории нелинейных колебаний. — М.: Наука, 1974.

5. Чен Дж.Ч. Требования к точности расчетных динамических моделей конструкций // Аэрокосмическая техника. — 1985. — Т. 3, 1. — № 6. — С. 43—52.

6. Ермилова Т.В., Суханов В.М, Ермилов А.С. Совместное оценивание модально-физических координат и параметров при управлении ориентацией большемерных объектов космической техники с нежесткой конструкцией // Авиакосмическое приборостроение. — 2006. — № 3. — С. 58—64.

7. Силаев А.В. Алгоритм параметрической адаптации базового закона управления ориентацией большой космической конструкции на основе оценки огибающей мод упругих колебаний // Проблемы управления. — 2009. — № 2. — С. 52—58.

8. Силаев А.В. Адаптивный подход с использованием «быстрой» модели в задачах идентификации и прогнозирования динамики при релейном управлении упругим спутником // Автоматика и телемеханика. — 2010. — № 6. — С. 96—108.

9. Химмельблау Д. Прикладное нелинейное программирование. — М.: Мир, 1975.

10. Силаев А.В. Градиентный алгоритм параметрической адаптации релейно-логического закона управления большой космической конструкцией в задаче стабилизации неустойчивых упругих мод // Тр. XVI международного на-уч.-техн. семинара «Современные технологии в задачах управления, автоматики и обработки информации». Алушта, 2007 г. — Тула: Изд-во ТулГУ, 2007. — С. 211—212.

Статья представлена к публикации членом редколлегии Б.В. Павловым

Силаев Андрей Владимирович — канд. техн. наук, ст. науч. сотрудник, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, в (495) 334-87-79, И rutkov@ipu.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.