У
правление подвижными объектами
УДК 517.977
СИНТЕЗ ПРОГНОЗИРУЮЩЕГО АЛГОРИТМА ПРОГРАММННГН РАЗВОРОТА БОЛЬШОЙ КОСМИЧЕСКОЙ КОНСТРУКЦИИ С ИЗМЕНЯЮЩИМИСЯ ПАРАМЕТРАМИ1
А.Б. Шубин, Е.Г. Александров, Г.Г. Харченков Институт проблем управления им. В.А.Трапезникова РАН, г. Москва
Предложен алгоритм программного управления ориентацией упругой конструкции, обеспечивающий прогнозирование конечного состояния и его последовательную коррекцию. Показано, что дискретное управление обеспечивает быстрый разворот объекта на заданный угол и удерживает его в данном положении с одновременным гашением упругих колебаний конструкции благодаря подаче импульсов управления, формируемых с учетом необходимости удержания углового положения объекта в области допустимых отклонений. Приведен пример реализации предложенного алгоритма.
ВВЕДЕНИЕ
Существует большой класс задач управления техническими устройствами, в которых управляющее воздействие принимает дискретные значения, например —1, 0, +1. С помощью такого управления можно обеспечивать максимальное быстродействие, применяя для вычисления управления принцип максимума Понтрягина [1]. Известен также ряд других методов формирования кусочно-непрерывного управления, например, метод динамического программирования [2] или методы оптимального управления [3].
В данной статье описывается применение алгоритмов программного управления (АПУ) для решения задачи управления угловым движением большой космической конструкции (БКК) с изменяющимися в процессе сборки параметрами ее математической модели. Предложенный в работе [4] алгоритм управления ориентацией БКК можно после некоторой доработки применить для синтеза системы управления собираемой на орбите
1 Работа выполнена при поддержке РФФИ, проект № 0508-18175.
БКК, модель которой представляет собой последовательность «сшитых» по краям линейных моделей, отличающихся друг от друга значениями коэффициентов, дискретно изменяющихся в краевых точках. При данном способе управления используется принцип прогнозирования конечного состояния и его последовательной коррекции с целью минимизации отклонения вектора регулируемых координат от требуемого значения в конечной точке.
Введение интервалов нулевого управления позволяет экономить ресурс управления при гашении упругих колебаний. Кроме того, модификация исходного алгоритма [4] предусматривает введение процедуры подстройки коэффициентов модели БКК на отдельных этапах ее сборки.
В соответствии с АПУ вычисляется воздействие на объект кусочно-постоянного управления, переводящего его из известной точки фазового пространства в заданное конечное состояние. Реализация АПУ осуществляется на ЦВМ и предполагает знание дифференциального уравнения или системы уравнений, описывающих объект, а также возможность моделирования таких уравнений на ЦВМ с достаточной точностью. В том случае, когда параметры объекта плохо определены или из-
меняются во времени, возможно применение соответствующих методов идентификации.
По-видимому, особенно эффективно применять АПУ для управления движением механических конструкций, соединенных упругими связями, в случае, когда управляющее воздействие прикладывается только к одному, обычно главному, элементу конструкции, роль которого выполняет корпус [5, 6]. В конце цикла управления фазовые координаты элементов должны принимать заданное значение.
Алгоритмы программного управления позволяют решать такие задачи при управлении ±1. Однако простейшее двухпозиционное управление с числом интервалов, равным сумме порядков дифференциальных уравнений, описывающих динамику конструкции, часто приводит к большим затратам ресурса управления. Модифицированные трехпозиционные АПУ, содержащие интервалы нулевого управления, минимизируют суммарную длительность участков активного управления и позволяют учесть значения фазовых координат, определяющих колебания, в целях выбора благоприятных моментов начала интервалов активного управления.
1. ПОСТАНОВКА ЗАДАЧИ И ОПИСАНИЕ АЛГОРИТМА ПРОГРАММНОГО УПРАВЛЕНИЯ
Пусть объект описывается уравнением
х(п) + С(х(п - 1}, ..., х) = и(1), и(1) = ±1. (1)
Обозначим х = х1, х(1) = х2,
х
(п - 1) _
= х„. Всю
совокупность координат обозначим X. Задача заключается в том, чтобы найти управление и(ґ) 0 < ґ < Т с п участками постоянства такое, что при подстановке его в уравнение (1) решение последнего, имеющее в момент ґ = 0 координаты Х0, в некоторый момент ґ = Т будет иметь заданные значения координат X*.
Предполагается, что X* є ШТ*, где ^Х* — область достижимости, т. е. существует управление и(ґ), решающее данную задачу. Очевидно, что область ШТ* зависит как от вида дифференциального
уравнения, так и от X*. Определение области достижимости ШТ* — задача чрезвычайно сложная, АПУ прост и может служить вычислительным инструментом определения ШТ*.
Управляющее воздействие на объект, вычисляемое в соответствии с АПУ, представляет собой некоторую знакопеременную функцию на интервале времени управления, причем число перемен знака равно п — 1, где п — порядок уравнения,
описывающего объект. В простейшем случае управление может принимать два значения, например, ±1. В этом случае получаем управление, имеющее п участков постоянства знака и значения управления.
Большое число технических объектов, описываемых дифференциальными уравнениями п-го порядка, обладают достаточно эффективными органами управления, позволяющими приводить фазовые координаты объектов в требуемое состояние путем подачи на органы управления некоторой знакопеременной функции (программы), имеющей п интервалов постоянства. Разумеется, есть некоторое небольшое число состояний объекта, из которых объект приводится в заданное состояние путем управления, содержащим меньшее, чем п, число участков постоянства.
Основной принцип, заложенный в АПУ, описан в работе [4]. Кратко напомним его и введем обозначения. Каждой функции м(?) с п участками
постоянства соответствует вектор £ с компонентами {Лр л2, ..., лк, ..., лп} размерностью п такой, что на к-м участке постоянства продолжительность к-го участка равна тк = |лк|, а значение управления
м(?) = sign(sk). Таким образом, вектор £ полностью определяет функцию м(?) на отрезке 0 < ? < Т, где
т = I!
£•!.
(2)
І = 1
Компоненты sk вектора £ назовем координатами управления. Фазовые координаты х^ґ) зависят от управления и(ґ), но нас будут интересовать только значения координат в момент Т, а также их зависимость от координат управления. Поэтому целесообразно ввести функции
К .(£ ) = дх і( Т ) * Ахі ( Т >
1’І дsi А5;
і, І = 1, 2,
(3)
Аналитические выражения для хІ(Т), тем более для функций (3), неизвестны. Однако современный уровень вычислительной техники позволяет путем решения уравнения (1) получать за короткий промежуток времени как значения хІ(Т), і = 1, 2,..., п, так и оценки значений функций (3).
Согласно работе [4], итеративная процедура АПУ состоит в следующем. Пусть на шаге итерации т имеется совокупность координат управления £(т), определяющая уравнение и(т)(ґ). В конце решения (2) уравнения (1) получим конечные значения фазовых координат хІ(Т), і = 1, 2, ..., п. Обозначим заданные значения координат х*І, і = 1, 2,
п
п
..., п. Вычислим значения ошибок попадания фазовых координат в заданную точку:
п(т) = х*і - х,(Т), і = 1, 2, ..., п. (4)
Заметим, что при таком определении Ві согласно выражениям (3) и (4)
= -К
Ж, г
Вычислим следующее приближение координат управления:
_ ( т + 1) = _ ( т ) + _0ї п(т)
^ І Л І + 77 ПІ ,
К І, І
і = 1, 2,
п, (5)
где коэффициенты а; < 1, а; < а; + 1. В случае небольшого порядка уравнения (1) п = 2...4, а; можно принять постоянными. При п = 5...12 лучшую сходимость алгоритма обеспечивают переменные коэффициенты ар причем а; < 1 и а; = аг-(Вг. + 1,
+ 2, ..., Вп), где а; — монотонно убывающие функции от ошибок В |, причем а; _ 1 < а;, а;(0, 0, ..., 0) = 1. Назначение коэффициентов а;. — обеспечить более быструю настройку к заданным конечным значениям высших производных в уравнении (1), т. е. чем выше производная х;, тем
быстрее она настраивается на заданное конечное значение путем изменения координаты управления.
Подставляя в уравнение (1) новое значение уп-
/ \ - т + 1)
равления и(0, определяемое величиной о ,
аналогичным образом проведем решение на ЦВМ и получим новые значения х;(Т). Индексы итераций (т + 1) у величин ), и(/), Т для простоты опущены. Произведя несколько десятков или сотен итераций (5), получим значения | т) |, i = 1,
2, ..., п, требуемой малости. Число итераций зависит от сложности задачи: размерности п, наличия нелинейностей, устойчивости решения и др. Обычно для контроля хода решения и определения момента окончания решения задачи для каждой итерации вычисляется мера отклонения конечных значений фазовых координат от заданных:
(т) _
,(т) і
Решение задачи целесообразно начинать с вектора = 0, і = 1, ..., п. При этом разность А =
= 0(т) — 0(т + 1) может менять знак. Однако, начиная с некоторого шага, величина А становится положительной и уменьшается со скоростью геометрической прогрессии.
2. ПРИМЕНЕНИЕ АЛГОРИТМА ДЛЯ РЕШЕНИЯ ЗАДАЧИ УПРАВЛЕНИЯ РАЗВОРОТОМ КОСМИЧЕСКОЙ КОНСТРУКЦИИ
Разворот БКК в одной плоскости можно с достаточной точностью описать в форме сложного переносного («жесткого») и относительного («упругого») движений. Каждое движение описывается своим дифференциальным уравнением, однако управляющее воздействие у них общее, но с разными коэффициентами [5]. Поэтому эти движения можно представить в виде отдельных блоков. Обычно замеру доступно только суммарное движение, однако существуют эффективные методы определения отдельных его составляющих [8].
Для подобных сложных объектов можно предложить алгоритмы вычисления управлений, которые решают задачи приведения всех координат нескольких блоков в заданное состояние. В таких случаях целесообразно применение АПУ, так как легко просчитать варианты: если один блок привести в заданное состояние, то в какое состояние придут другие блоки. Рассмотрим структурную схему, изображенную на рис. 1.
Пусть блок X описывается уравнением
X = аи, (6)
блок У — уравнением
у + Ь1у = Ь2и. (7)
В данном случае для двух дифференциальных уравнений с произвольными начальными значениями координат необходимо сформировать управление и(/), которое приводит координаты объекта к нулевым значениям. Управление может принимать три значения: +1, 0, —1.
В рассматриваемом случае, когда управление поступает одновременно на несколько блоков, на-
Рис. 1. Структурная схема задачи
п
личие нулевого управления весьма целесообразно, поскольку дискретное двухпозиционное управление имеет большой коэффициент влияния, а нулевые участки управления позволяют уменьшить колебания фазовых координат при движении в заданную область, а также при пребывании в ней.
Введем следующие обозначения: х1 = х, х2 = х,
У1 = У, У2 = У. Пусть заданная область определяется зоной нечувствительности по выходным координатам —с1 < х < с1, —с2 < у1 < с2.
Область нулевого управления целесообразно выбрать как заштрихованную область на рис. 2. Эта область определяется отрезками вертикальных и х1 = с1 и х1 = — с1 и горизонтальных прямых
х2 = с2 при х1 > —с1 и х2 = —с2 при х1 < с1. В этой области координаты блока X при нулевом управлении движутся к заданной области. Координаты блока У при нулевом управлении движутся на фазовой плоскости по замкнутому эллипсу вокруг нулевой точки.
В дальнейшем будем искать управление на достаточно малых дискретных интервалах времени А/. Для определения управления в произвольной точ-
/V0
ке (X , У ) на временном интервале квантования вычислений производятся следующие операции.
1. При помощи АПУ на модели вычисляется программное управление 5у, которое приводит блок У в заданное нулевое положение. Вычисляется состояние X (5у), в которое приходит блок X при реализации управления 5у. Если это состояние
попадает в зону нулевого управления с дополнительным условием
и( X (£у)) = 0 и ! х?! 1 !х,(£у)!, то реализуется управление £.
(8)
2. Если условие (8) не выполняется, то значение управления на интервале Аґ определяется по положению координат блока X согласно рис. 2.
3. Если координаты блока X находятся в зоне нулевого управления, а координаты блока У значительно отличаются от заданных значений, т. е.
! у 1! + ! у0! > сз,
то вычисляется критерий наибольшего эффекта управления для блока У Для этого вычисляется посредством АПУ управление £у, приводящее блок У в нулевое состояние, по которому вычисляется критерий
к = ттЦ( у0 , у2 ), ^( у°, у2 )}/тахЦ( у1, у°),
^(у0 , у0 )}.
Очевидно, что при к * 0 блок У находится в таком состоянии, что за один интервал управления он приходит в заданное положение. Практически выполнение условия к < с4 можно считать достаточным для реализации управления, приближающего координаты блока У заданному значению:
00 Л = V у 1 , У 2 ),
0 0 0 0 Л = .?2(У1 , У2 ) при ^У1 , У2 )! < С5,
и = sign(s).
Это управление действует только на интервале времени Аґ после чего операции 1—3 повторяются.
При нулевом управлении координаты блока У описывают на фазовой плоскости замкнутый эллипс. Посредством АПУ легко вычисляется управление (координаты управления), которое переводит координаты блока У в нуль. Можно вычислить множество точек, в которые при этом переходит блок X. На диаграмме (рис. 3) изображены множество координат блока У, координаты управления £ и множество точек X. Для удобства соотнесения отдельных точек кривых одноименные точки помечены одинаковыми цифрами. Отметим, что подобная методика может применяться и для объектов, описываемых более сложными дифференциальными уравнениями, в том числе и нелинейными.
Анализ диаграммы позволяет сделать следующие выводы. В процессе колебаний координат блока У существуют два значения координат таких, что управление, переводящее блок У в заданное положение, переводит блок X в состояния {хт, 0} и {—хт, 0}. Таким образом, существуют такие значения координат блока У, при которых управление
1,8 ------------1----------1----------1---------------------1----------1----------1----------
-0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8
Рис. 3. Диаграмма взаимного расположения начальных точек блока У, конечных координат блока X и соответствующих координат управления
не выводит блок X из состояния, соответствующего нулевому управлению.
Кроме того, существуют два положения блока У, при которых длительность управления, переводящего его в нулевое положение, имеет минимальное значение. Это именно те точки, в которых це-
лесообразно уменьшать или гасить колебания, поскольку при этом блок X испытывает наименьшие возмущения.
Реализация алгоритма показала хорошую сходимость координат обоих блоков X и У к заданным значениям. На рис. 4, а приведены траектории х1(/), х2(ґ) и у1(ґ), у2(ґ) на фазовой плоскости для случая, когда большое отклонение от заданного значения у блока X и малое у блока У. На рис. 5, а то же, но при малом отклонении начальных условий блока X и большом блока У Моделирование проводилось при значениях констант алгоритма с1 = 0,03, с2 = 0,05, с3 = 0,2, с4 = 0,15, с5 = 0,005.
Аналогичные два варианта переходных процессов из тех же начальных условий, но развернутых по времени, представлены на рис. 4, б и 5, б.
3. ПОДСТРОЙКА ПАРАМЕТРОВ МАТЕМАТИЧЕСКОЙ МОДЕЛИ РЕАЛЬНОГО ОБЪЕКТА
Решение задач управления реальными объектами с высоким быстродействием требует знания коэффициентов дифференциального уравнения, описывающего изменение координат объекта. Часто эти коэффициенты известны лишь приблизитель-
а)
б)
Рис. 4. Фазовые траектории (а) и переходный процесс (б) блоков при больших начальных значениях координат блока X
0,4
0,2
0Уі
-0,2
-0,4
-0,2 -0,1 0 0,1 0,2
а)
0,2 0
-0,2 -0,4 -0,6 -0,8
0 1 2 3 4 5 6
б)
Рис. 5. Фазовые и траектории (а) и переходный процесс (б) блоков при малых начальных значениях координат блока X
У і, и
__________________________I__________________________I___________________________I__________________________I__________________________I.
но, и для эффективной работы управляющего алгоритма требуется уточнение математической модели объекта. Иногда в процессе работы по тем или иным причинам изменяются параметры описания объекта. Разработаны различные методы идентификации коэффициентов дифференциальных уравнений фазовых координат объектов [7, 8].
Для рассмотренной задачи параллельного управления блоками, описываемыми линейными дифференциальными уравнениями второго порядка (6) и (7) были промоделированы простейшие алгоритмы идентификации параметров, использующие коэффициенты чувствительности фазовых координат от параметров.
Обозначим соответствующие фазовые координаты модели как
х1, х2, а, у1, у2, Ь1 и Ь2 .
Тогда уравнения подстройки параметров модели по интервалам коррекции можно записать в виде
А а = к1(х2 — х2 )и(/),
А ^1 = -^2^2 - У2 )У1,
А ^2 = к3(у2 - у2 )и(/).
В конце интервала коррекции целесообразно у модели устанавливать координаты объекта х1 = х1,
х2 = у1 = Ур у2 = У2.
Коэффициенты к1, к2 и к3 выбираются с учетом длины интервала коррекции и обеспечения устойчивости процесса идентификации.
Моделирование показало устойчивую подстройку коэффициентов модели при начальном отклонении их значений на 20—30 % от значений коэффициентов объекта.
ЗАКЛЮЧЕНИЕ
Рассмотренные алгоритмы управления могут эффективно применяться для управления конструкциями, движение которых описывается системой дифференциальных уравнений. Единственное управление входит с разными коэффициентами в правые части этих уравнений. Такая модально-физическая модель удовлетворительно описывает угловое движение большой космической конструк-
ции. Число уравнений, описывающих движение отдельных элементов или блоков общей конструкции, может быть увеличено, и алгоритмы программного управления легко прогнозируют движение всех элементов. Рассмотренные алгоритмы могут применяться также и для решения задач управления блоками, описываемыми нелинейными дифференциальными уравнениями, а также уравнениями с переменными во времени коэффициентами, что делает их эффективным средством при построении сложных интеллектуальных систем управления.
ЛИТЕРАТУРА
1.
2.
3.
4.
Математическая теория оптимальных процессов / Л.С. Пон-трягин, В.Г. Болтянский, Р.В. Гамкрелидзе и др. — М.: Наука, 1976. — 270 с.
Беллман Р. Динамическое программирование. — М.: Изд-во иностр. лит., 1960. — 195 с.
Габасов Р., Кириллова Ф.М., Ружицкая Е.А. Решение классической задачи регулирования методами оптимального управления // Автоматика и телемеханика. — 2001. — № 6. — С. 18—29.
Харченков ГГ., Шубин А.Б. Алгоритмы программного управления ориентацией космического модуля в режиме транспортировки нежесткого груза с прогнозированием движения // Тр. X международ. науч.-техн. семинара «Современные технологии в задачах управления, автоматизации и обработки информации». — Алушта, 2001. — С. 253—254.
Модально-физическая модель пространственного углового движения деформируемого космического аппарата и ее свойства / В.М. Глумов, С.Д. Земляков, В.Ю. Рутковский, В.М. Суханов // Автоматика и телемеханика. — 1998. — № 12. — С. 38—50.
Рутковский В.Ю, Суханов В.М. Модель деформируемого космического аппарата и общие характеристики динамики конструкции // Изв. РАН. Техн. кибернетика. — 1994. — № 1. — С. 198—206.
7. Харченков ГГ., Шубин А.Б. Методы идентификации параметров гибкой космической конструкции и алгоритм программного управления этой конструкцией // Тез. докл. III междунар. симп. «Интеллектуальные системы». — М., 1998. — С. 266.
8. Харченков Г.Г., Шубин А.Б. Вычислительный метод определения частот и амплитуд гармоник сигнала по наблюдению короткой реализации // Тр. междунар. конф. «Идентификация систем и задачи управления» SICPRO-2000 / Ин-т пробл. упр-я. — М., 2000. — С. 2126—2130.
8 (495) 334-87-20
Статья представлена к публикации членом редколлегии С.Д. Земляковым. □
5.
6.
Читайте в следующем номере статью
Клепарского В.Г., Клепарской Ек.В. Оценка капитализированной стоимости изменений адекватности управления при переходе на траекторию интенсивного развития