литература
Кириченко Д. В., Семенихин В. К., Слободчиков В. А. Модель относительного движения летательного аппарата // Сб. трудов 2-го науч.-исслед. центра 4-го ЦНИИ МО РФ. СПб., 2005. С. 127—132.
Сведения об авторах
Виталий Кузьмич Семенихин — канд. техн. наук, доцент; Научно-исследовательский центр (Санкт-
Петербург) — филиал 4-го ЦНИИ Минобороны России Дмитрий Валерьевич Кириченко — канд. техн. наук; Научно-исследовательский центр (Санкт-Петербург) —
филиал 4-го ЦНИИ Минобороны России; E-mail: [email protected]
Рекомендована
ВКА им. А. Ф. Можайского
Поступила в редакцию 20.10.09 г.
УДК 629.78.05
М. Г. Кудинов, С. Б. Силантьев, А. В. Степовой УПРАВЛЕНИЕ
ОТНОСИТЕЛЬНЫМ ДВИЖЕНИЕМ КОСМИЧЕСКОГО АППАРАТА ПРИ НАБЛЮДЕНИИ ОРБИТАЛЬНЫХ ОБЪЕКТОВ ПАССИВНЫМИ СРЕДСТВАМИ
Предложен метод управления относительным движением космического аппарата в зоне прямой видимости наблюдаемого орбитального объекта. В качестве измерительной информации используются угловые координаты наблюдения за орбитальным объектом, определяемые пассивными бортовыми средствами космического аппарата-наблюдателя в условиях действия помех. Предлагаемый метод основан на принципах дуального управления.
Ключевые слова: метод управления, относительное движение, космический аппарат-наблюдатель, орбитальный объект.
Введение. Для управления движением космического аппарата относительно какого-либо орбитального объекта необходимо иметь информацию о параметрах движения каждого из них. В практических задачах параметры движения космического аппарата-наблюдателя (КАН) известны. Будем считать, что орбитальный объект совершает пассивный полет, а получение информации о параметрах его движения возможно только с помощью бортовых средств КАН.
В настоящее время задача получения информации о параметрах относительного движения КАН решается с помощью активных средств наблюдения (дальномеров, доплеровских измерителей скорости и т. п.) [1].
Использование таких средств позволяет определить ориентацию линии визирования наблюдаемого объекта, а также относительную дальность и скорость ее изменения. Однако применение активных средств не всегда возможно, так как они имеют значительную массу и габариты, а также большое энергопотребление. Использование пассивных средств наблюдения в этом смысле представляется более предпочтительным, но при этом возникает проблема определения относительной дальности. Один из подходов к решению этой проблемы заключается в формировании управления относительным движением центра масс КАН таким образом, чтобы оно носило двойственный характер, а именно: изучающий (обеспечивающий возможность определения параметров относительного состояния двух объектов) и направляющий (обеспечивающий поддержание данных параметров вблизи их требуемых значений).
Реализующие данный подход системы управления относятся к классу систем дуального управления [2].
В обычных системах этого типа управляющие воздействия, вследствие различия их частотных диапазонов и временного разделения их приложения к объекту, можно представить двумя составляющими: первая (назовем ее изучающей) обеспечивает получение информации о параметрах движения, а вторая (направляющая) — функционирование КА в заданном режиме. Однако в общем случае такое разделение не обязательно: одно и то же воздействие может иметь двойственный характер.
В системах дуального управления возникает противоречие между двумя указанными сторонами управляющего воздействия. Действительно, выполнение задачи управления относительным движением с заданным качеством возможно лишь при своевременном формировании направляющего воздействия. Воздействие, реализованное с задержкой, ухудшает качество процесса управления КА. Однако успешно управлять можно лишь тогда, когда достаточно точно известны параметры движения наблюдаемого объекта. Между тем процесс определения параметров движения требует затрат времени. Слишком „быстрое" управляющее устройство будет производить необоснованные направляющие действия, которые не будут должным образом подкреплены полученной в результате изучения наблюдаемого орбитального объекта информацией. Слишком „осторожная" система будет излишне долго выжидать, накапливая информацию, и не сможет своевременно выполнить поставленную задачу сближения. И в том, и в другом случае процесс управления может оказаться неоптимальным или даже неуспешным.
Неполная информация о местонахождении наблюдаемого орбитального объекта содержится в вероятностных распределениях параметров относительного движения. Эти распределения по мере изучения наблюдаемого орбитального объекта будут, вообще говоря, все точнее и точнее характеризовать эти параметры. Именно постепенное изменение апостериорных вероятностных распределений, их сосредоточение вблизи действительных значений является оценкой интервала времени, необходимого для изучения объекта. Отличительное свойство систем дуального управления заключается в зависимости этого интервала от стратегии управляющего устройства.
Постановка задачи управления. Сформулируем задачу построения оптимального управляющего устройства относительным движением КАН [2]. Рассмотрим дискретно-непрерывную систему управления, структурная схема которой представлена на рисунке.
н* У 5 А о V 5 В
Р
р(У* I х*)
Г (и
Р( V5 Iи5 )
н
Р(У 5 I X5 )
*
Информация х5 о параметрах относительного положения КАН поступает на вход его
* *
управляющего устройства А через канал Н , где смешивается с шумом Ь5 . Поэтому факти-
*
ческая информация у5 , подступающая непосредственно на вход устройства А, не соответст-
*
вует действительной информации х5. Аналогично происходит смешение сигнала х5 о состоянии управляемого объекта В с шумом в канале Н. Последний находится в цепи
8
2
5
5
*
*
х
х
5
5
У
5
обратной связи; его выходной сигнал уя поступает на вход управляющего устройства А. Далее, управляющее воздействие ия поступает на вход объекта В, также пройдя канал О , где оно смешивается с шумом gs . Поэтому действительное управляющее воздействие Vя, непосредственно поступающее на объект В, вообще говоря, не равно воздействию ия . Здесь —
помеха, действующая на управляемый объект В.
Все величины, принятые в схеме, рассматриваются лишь в дискретные моменты времени I = 0,1,..., п, где п фиксировано. Значение любой из величин в момент времени
*
t = я снабжено индексом я (например, хя, хя, уя и т.д.). Введем временные векторы
= (и0, и1, ..., ия ), = (х0, х1, ..., хя );
У* =(( V1,..., ^), У* =( y1,..., уЯ );
= (х0, х1, ..., хя ), Уя = (у0, у1, ..., уя ),
0 < я < п.
Значение ия представляет собой случайную функцию от параметров уг-, поступивших
на вход устройства А в предыдущие моменты времени (г < я ), также ия есть функция значе-
*
ний у у, у < я . Наконец, и я может зависеть и от значений иу на выходе устройства А, полученных ранее ( V < я ). Предыдущие значения иу могут запоминаться в этом устройстве и поступать на вход вычислительного блока, определяющего текущее значение ия , точно так же
как поступают на вход устройства А остальные входные параметры уг- и у*.
Задача состоит в определении оптимальной случайной стратегии устройства А, т. е. определении оптимальных плотностей вероятности
Р(ия) = Г(ия | ия-1, У5-1, У*), 0 < я < п,
при которых полный риск Я минимален.
Полный риск Я определяется как математическое ожидание функции потерь:
Я = М (Ж} = £м (Ж } = £я ,
я=0 я=0
где Яя — средний удельный риск; Ж — общая функция потерь, определяемая как
Ж = ^ Жя (я, хя, хЯ ); Жя = Жя (я, хя, х^ ) — удельная функция потерь.
.5=0
Метод управления. Так как Гя есть плотность вероятности, то Гя > 0, и функции Гя должны удовлетворять ограничению
| Гя (и я )ёО = 1,
"К )
где О(ия ) — область возможных значений ия , ёО — ее бесконечно малый элемент. Назовем Гг-, г = 0,1,..., п, удельными стратегиями.
Первый этап решения задачи состоит в выводе формулы для риска Я . Найдем сначала выражение для условного удельного риска гя, который определим как слагаемое риска, соответствующее я-му такту (т.е. моменту времени t = я ), при фиксированных значениях входных сигналов управляющего устройства А.
Условный удельный риск вычисляется по формуле [3]
г = ' 5
/ ...
О(Л, М, х^, ^)
Р(¥,)
*
^ [5, х* (5, Л), х5 ] Р(Л)Р(У5 1 Л) Р^ | М, 5, ^ ) X
5 .
5-1
Р(М)П Р(У1 I М, ¿, и)
¿=0
-*-П О,
Р(¥ -1, и 5 -1|¥*) ¿=0
где М = (^1,..., цт) и Л = (^1,..., Xд) — случайные векторы.
**
Пусть Р(Х5 , и5-1, У5-1) — совместная плотность распределения векторов У5 , и
(1)
5-1
и
У5-1. Тогда средний удельный риск Я5, являющийся средним значением условного удельного риска г5, определяется формулой
^5 = ! r*P(Y*í, и5-1, ¥5-1) ёО. (2)
Учтем теперь, что
Р(¥5*,и5-1,¥5-1) = Р(Х5-1,и5-1 | ¥>(¥;) . Подставив выражения (1) и (2) в формулу (3), с учетом
Р(¥; I Л) = ПР(у* I Л) = 1ПР(у* I ¿, Л) ¿=0 ¿=0 получим основную формулу — выражение для Я5 в виде
(3)
я5 =
^5 [5, х5 (5, Л), х5 ]Р(Л)
О(Л, М, х 5, ¥*,и 5 ,¥5-!)
X Р(М)
П Р(у* I-, Л)
¿=0
Р(х5 I М, 5, и5) X
5—1 5
П Р(у- I М, ¿, и-) • П Г- ёО.
_¿=0 J |_¿=0 _
Управление при I = к ( к < п ) должно быть направлено не только на уменьшение значения Як — удельного риска, но и на уменьшение значений рисков Я1 (/' > к) в последующие
моменты времени путем лучшего изучения объекта. Рассмотрим Як — составляющую полного риска Я , зависящую от стратегии Гк :
Як = £Я = Як + £ Я . (4)
¿ =к ¿=к+1
По отношению к удельной стратегии Гк первое слагаемое правой части выражения (4) можно назвать риском действия, а второе — риском изучения. Примитивная стратегия, определяющая воздействие ик (или его плотность вероятности Гк), так чтобы минимизировать лишь риск действия, не является оптимальной. С другой стороны, игнорирование риска действия и минимизация лишь риска изучения, т. е. выбор ик (либо Гк ) лишь с целью наилучшего изучения объекта для использования этой информации в последующих действиях, также не будет оптимальным поведением. Оптимальная стратегия при дуальном управлении должна минимизировать сумму Як рисков действия и изучения.
При определении оптимальной стратегии дуального управления воспользуемся методом динамического программирования [4].
*
Оптимальная стратегия Гп (для фиксированного момента времени п) определяется выражением
Г! =§к - иП(5)
где 5 — единичная импульсная функция.
* г *
Величина ип представляет собой функцию от ии-1, Уи-1, Yn :
иП = иП(и п-1, Уп-1, Уп*). (б)
*
Это означает, что Гп является регулярной стратегией, причем в соответствии с выраже-
**
нием (6) оптимальное значение ип равно ип. Как следует из выражения (6), ип представляет
собой функцию от ранее поступивших на управляющее устройство А сигналов и5, у5,
*
^ = 0,1,..., п -1, а также параметров уг-, I = 0,1,..., п.
*
Оптимальная стратегия Гп_к (для некоторого момента времени п - к), определяемая выражением
* * Гп_к = 5(ип_к _ ип_к ^
где
* * *
ип_к = ип_к (Уп_к, ип_к_1, Уп_к_1 ) , (7)
*
регулярна и заключается в выборе ип_к = ип_к согласно формуле (7). Как видно из этой фор*
мулы, оптимальное управление ип_к в момент t = п _ к зависит, вообще говоря, от предыстории изменения входных сигналов, поступающих на устройство А, т.е. от всех значений иг- и
*
уг-, / = 0,1,..., п _ к _ 1, а также от значений у у, ] < п _ к. При этом начальное управляющее
воздействие ио = ио(уо) зависит от исходной информации, полученной на входе устройства А, и от априорных данных.
Следует отметить, что в оптимальном алгоритме (7), который должен быть заложен в
**
управляющее устройство А, значение ип_к зависит от параметров иг-, уг-, уг-, поступивших на
*
вход устройства А в прошлом, а также от текущего значения уп_к , но не от будущих значений этих параметров. Поэтому оптимальное управляющее устройство физически реализуемо.
Заключение. Экспериментальные исследования предложенного метода были проведены путем математического моделирования управляемого относительного движения КАН и наблюдаемого орбитального объекта. Их орбиты принимались круговыми компланарными.
В результате моделирования было установлено, что минимальное количество управляющих воздействий равно двум; первое управляющее воздействие должно быть направлено по перпендикуляру к линии визирования; параметры последующих управляющих воздействий выбираются исходя из конкретного вида относительного маневра (облет, зависание, барражирование и т. д.).
список литературы
1. Гончаревский В. С. Методы и алгоритмы управления относительным движением космических аппаратов. МО РФ, 1998. 87 с.
2. Фельдбаум А. А. Теория дуального управления // Автоматика и телемеханика. 1960. Т. 21, № 9. С. 1240—1249.
3. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М.: Наука, 1966. 629 с.
4. Бесекерский В. А., Попов Е. П. Теория систем автоматического регулирования. М.: Наука, 1972. С. 385—389.
Анализ перекрестных связей в динамических системах класса „ двумерный вход — выход " 35
Михаил Георгиевич Кудинов
Сергей Борисович Силантьев
Андрей Васильевич Степовой
Сведения об авторах Военно-космическая академия им. А. Ф. Можайского, кафедра автономных систем управления, Санкт-Петербург; мл. науч. сотрудник; E-mail: [email protected]
канд. техн. наук, доцент; Военно-космическая академия им. А. Ф. Можайского, кафедра автономных систем управления, Санкт-Петербург; E-mail: [email protected]
канд. техн. наук; КБ точного машиностроения им. А. Э. Нудельмана, Москва; E-mail: [email protected]
Рекомендована кафедрой автономных систем управления ВКА
Поступила в редакцию 02.03.09 г.
УДК 62.50
Е. Д. Лихолетов, А. В. Ушаков, А. Ю. Цвентарный
АНАЛИЗ ПЕРЕКРЕСТНЫХ СВЯЗЕЙ В ДИНАМИЧЕСКИХ СИСТЕМАХ КЛАССА „ДВУМЕРНЫЙ ВХОД — ВЫХОД"
С ОДНОТИПНЫМИ КАНАЛАМИ
Показывается, что работоспособность динамических систем класса „двумерный вход — выход" с однотипными каналами и матрицей вращения перекрестных связей сохраняется, если ее аргумент не превышает запаса устойчивости по фазе сепаратного канала системы. Предлагается способ увеличения запаса устойчивости скалярных полиномиальных динамических моделей.
Ключевые слова: динамическая система, перекрестные связи, матрица вращения, запас устойчивости.
Постановка задачи. Рассматривается проблема построения автоматических систем, встраиваемых в измерительные мониторинговые комплексы, использующие принцип следящего преобразования. Такие системы, как правило [1—5], являются двухканальными с однотипным исполнением каналов и характеризуются наличием перекрестных межканальных связей с матрицей типа „матрица вращения" (МВ). Наличие перекрестных связей при определенных значениях аргумента д МВ становится причиной потери работоспособности двухка-нальных систем при устойчивых сепаратных каналах.
В настоящей статье рассматривается проблема установления связи аргумента д МВ с запасом устойчивости Дф по фазе сепаратных однотипных каналов, степень различия которых оказывается важным фактором.
Определение связи между предельно допустимым значением аргумента матрицы вращения и запасом устойчивости сепаратных каналов. Основной результат.
Рассмотрим динамическую систему (ДС) класса „двумерный вход — выход", структурная схема которой приведена на рис. 1. Здесь gt, s¿, yi, i = 1,2, — внешнее воздействие, ошибка слежения и выход i-го сепаратного канала соответственно; д — аргумент матрицы межканальных связей (матрицы вращения) T = col {[cos д sin д], [-sin д cos д]}; v1, v2 — переменные, образующие двумерный выход матрицы T; W(s) — передаточная функция прямой цепи i-го сепаратного канала спроектированной системы, имеющая представление
W ( s) = M ( s) N _1( s), (1)