Научная статья на тему 'Алгоритмы тестирования качества ручного управления спуском космического аппарата "Союз-ТМА" на динамическом стенде'

Алгоритмы тестирования качества ручного управления спуском космического аппарата "Союз-ТМА" на динамическом стенде Текст научной статьи по специальности «Математика»

CC BY
61
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИНАМИЧЕСКИЙ ТРЕНАЖЕР / DYNAMIC SIMULATOR / МАКСИМИННОЕ ТЕСТИРОВАНИЕ / MAXIMIN TESTING / ЦЕНТРИФУГА / CENTRIFUGE / МАТРИЧНЫЕ ИГРЫ / MATRIX GAME

Аннотация научной статьи по математике, автор научной работы — Лобашов Евгений Сергеевич

В статье рассмотрена задача построения третьего уровня системы управления динамическим стендом центрифуги ЦФ-18 на основе методики максиминного тестирования точности стабилизации управляемых объектов. Первый этап методики тестирования реализуется путем сведения исходной динамической игры к матричной игре большой размерности. В случае отсутствия седловой точки задача решается на смешанном расширении матричной игры сведением к задаче линейного программирования. Рассмотрен пример построения тестирующих возмущений, используемых на втором этапе методики тестирования

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Лобашов Евгений Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритмы тестирования качества ручного управления спуском космического аппарата "Союз-ТМА" на динамическом стенде»

Здесь Atv = v(t) — v(t° ) — первая разность по времени переменной v; Да?, ДА? — случайные погрешности счисления углов карданова подвеса.

Задача оценивания инструментальных погрешностей ИНС-2000. Введем вектор состояния x:

x = (¿ai,6а2, SVi,SV2, ¿A, v°,v°, v°, Du,D22, A/?, Д/2°, Kn,K22, ai°, а20, AA°)T.

Тогда можно поставить задачу оценивания вектора состояния x линейной динамической системы с известным управлением (4) при помощи линейных измерений z (5) и (6):

X = Ax + q + w, z = Hx + r.

Данная задача решается при помощи дискретного фильтра Калмана [1].

Обработка модельных данных. Описанные алгоритмы тестировались на модельных данных. Данные моделировались с помощью полной системы уравнений (2). Сравнивались реальные значения погрешностей и их реализации из фильтра Калмана.

Точность результатов работы алгоритма приведена в таблице, где СКО — среднеквадратичное отклонение.

4. Заключение. В работе построена модель уравнений ошибок инерциальной навигационной системы ИНС-2000 в режиме контрольной задачи "Период Шулера". Предложены и проверены на модельных данных возможные алгоритмы оценивания инструментальных погрешностей ИНС в этом режиме.

СПИСОК ЛИТЕРАТУРЫ

1. Голован А.А., Парусников Н.А. Математические основы навигационных систем. 1: Математические модели инер-циальной навигации. М.: Изд-во МГУ, 2007.

Поступила в редакцию 14.01.2008

Параметры Характерное значение Ошибка оценки СКО ошибки оценки

~ 0, 2°/ч ~ 0, 01°/ч ~ 0,03°/ч

-Dil, -D22 ~ 1СГ2 ~ 1СГ3 ~ 1СГ3

A/i°, А/2° ~ 1СГ2м/с2 ~ 1СГ3м/с2 ~ 1СГ3м/с2

К il, К22 ~ 1СГ2 ~ 1СГ3 ~ 1СГ3

УДК 51-72

АЛГОРИТМЫ ТЕСТИРОВАНИЯ КАЧЕСТВА РУЧНОГО УПРАВЛЕНИЯ СПУСКОМ КОСМИЧЕСКОГО АППАРАТА "СОЮЗ-ТМА" НА ДИНАМИЧЕСКОМ СТЕНДЕ

Е. С. Лобашов1

В статье рассмотрена задача построения третьего уровня системы управления динамическим стендом — центрифуги ЦФ-18 — на основе методики максиминного тестирования точности стабилизации управляемых объектов. Первый этап методики тестирования реализуется путем сведения исходной динамической игры к матричной игре большой размерности. В случае отсутствия седловой точки задача решается на смешанном расширении матричной игры сведением к задаче линейного программирования. Рассмотрен пример построения тестирующих возмущений, используемых на втором этапе методики тестирования.

Ключевые слова: динамический тренажер, максиминное тестирование, центрифуга, матричные игры.

The problem of developing the third level of the control system for a dynamic bench based on the CF-18 centrifuge is considered. The maximin testing method is used to check the

1 Лобашов Евгений Сергеевич — асп. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail:

[email protected].

stabilization accuracy of controlled objects. The first stage of this method is implemented by reducing the original dynamic game to a matrix game of large scale. When a saddle point does not exist, the problem is solved with the use of a mixed matrix game expansion by reducing it to a linear programming problem. An example of constructing the test perturbations used at the second level of the maximin testing method is discussed.

Key words: dynamic simulator, maximin testing, centrifuge, matrix game.

1. В процессе подготовки космонавтов необходимо регулярно осуществлять тестирование качества визуального управления различными космическими аппаратами. Так, при спуске космического летательного аппарата (КЛА) имеет место вестибулоглазодвигательное нарушение — запаздывание при установке взора, которое существенно влияет на безопасность при возвращении космического аппарата на Землю. Поэтому целесообразно проводить тренировки космонавтов по управлению спуском КЛА на Земле в условиях, приближенных к реальному космическому полету. Такого рода тестирующий тренажер должен быть динамическим.

Тренажер по управлению спуском корабля "Союз-ТМА" создан на базе динамического стенда — центрифуги ЦФ-18. Тренажер позволяет осуществлять имитацию перегрузок и угловых ускорений реального полета для космонавта.

Система управления тренажером, представляющая собой сложную структуру, состоит из трех уровней.

Первый (нижний) уровень управления предназначен для стабилизации или отслеживания имитирующих программных движений приводов консоли и кардановых колец центрифуги, которые формируются на втором уровне управления блоком алгоритмов динамической имитации.

Второй уровень управления состоит из следующих блоков: динамический объект, исполнительные механизмы, алгоритмы динамической имитации.

Третий уровень управления представляет собой тестирующую систему, которая позволяет по результатам тренировок получать оценку деятельности пилота-оператора. В качестве одной из возможных реализаций третьего уровня управления рассмотрим методику максиминного тестирования точности стабилизации управляемых объектов [1].

2. Рассмотрим пример формирования блока алгоритмов тестирования, когда для решения задачи первого этапа методики тестирования применяются упрощенные уравнения движения КЛА. Примем следующие допущения: для описания динамики КЛА будем использовать модель абсолютно твердого тела; Землю считаем сферической, не вращающейся; уравнения движения центра масс КЛА будем записывать в проекциях на оси скоростной системы координат.

Ввиду устойчивости движения спускаемого аппарата корабля "Союз-ТМА" по углам атаки и скольжения в целях имитации перегрузок можно рассматривать лишь уравнения движения центра масс аппарата [2].

Используя поворот вокруг вектора скорости (поворот по крену), можно менять значение подъемной силы, добиваясь посадки КЛА в нужной точке. Возникающие при таком управлении боковые отклонения компенсируются набором поворотов по крену, симметричных относительно нуля. Будем считать, что система угловой стабилизации КЛА обеспечивает условия "идеального" разворота по крену.

Уравнения движения центра масс спускаемого аппарата можно записать в виде

dyi y4 sin y6 cos y5

dt уз cos y2

dy2 _ У4 COS у6 COS у5 dt Уз

dy3

-ж = Ш8ту5>

dy4 2 sin y5 -- —ц,дауА--—,

dt

Уз

dy5 ( 1 У4

, ¡лажду^ cos 7 — cos у5 -~

dt \У4У2 Уз

dy6 ц.ажду4 sin 7 У4

Н--tan у2 sin 2/6 cosí/5,

dt cos y5 уз

где у\ = А, г/2 = = г/а, 2/4 = л/ff + + v\j(шоа) — модуль скорости KJ1A, у$ — угол наклона

траектории (угол между вектором скорости центра масс КЛА и горизонтальной плоскостью), уб — угол скоростного курса (угол между направлением на север и проекцией вектора скорости центра масс КЛА

на горизонтальную плоскость), ае = — — аэродинамическое качество, и = —--баллистический коэф-

cx m

фициент, q — плотность атмосферы. Управление кораблем осуществляется изменением угла крена 7.

Возьмем некоторую номинальную траекторию у* (t) спуска КЛА, соответствующую начальным условиям у*(0) = 0, у* (0) = 0, у* (0) = 90 км, у*(0) = 7500 м/с, у** = -1,5°, у* (0) =0 и программному управлению 7*(t) = 70, 70 £ {-30°, 0, 30°}, t £ [0,tk]. В конечный момент времени tk имеем ) = h*, где h*0 ~ 20 км — конечная высота раскрытия парашюта, у*(tk) = у*, i = 1, 2, 4, 5, 6.

Рассмотрим возмущенное движение аппарата у^) = у*(t) + x(t). Точность управления спуском будем определять как отклонение координат корабля в конечный момент времени от номинальных значений:

J(Y,w) = (у1 (tk) - уШ))2 + (у2(tk) - у*(^))2 + (уз(tk) - у*(и))2, (2)

где w = {x(to),p,q} £ W — совокупность начальных x(to) £ Y0, параметрических p(-) £ P = {'p(-) £ P С Rr||p(t)| ^ v} и постоянно действующих q(-) £ V = {q(-) £ KC\q(t) £ Q С Rm} возмущений, а W = Y0 x P x V, y(tk) £ M, tk — первый момент достижения конечного многообразия M в пространстве отклонений.

Будем рассматривать случай, когда в дифференциальной игре между управлением u(t) и возмущением w(t) имеет место седловая точка [1] и существует цена игры:

max min J(u, w) = min max J(u, w) = J(u0,w0) = J0, w€W u€U u€U w€W

где J00 — наилучший результат по точности стабилизации.

Пусть тестируется некоторый предложенный алгоритм управления U. Методика тестирования, как правило, состоит из трех этапов [1].

На первом этапе определяются оптимальная контрстратегия w0(x,u,t) поведения внешних возмущений, а также цена игры J00 с помощью компьютерного решения максиминной задачи динамической игры.

На втором этапе реализуется тестирование на динамическом имитационном стенде. Тестируется алгоритм управления u(x,t), а имитаторы среды используют наихудшие возмущения w0(x,u,t), найденные на первом этапе методики. Вычисляется реальный результат точности стабилизации J .

На третьем этапе определяется оценка тестирования путем сравнения реального результата J с неулучшаемой оценкой J°.

Найдем решение задачи первого этапа методики тестирования.

3. В задаче п. 2 множества управлений U и возмущений W представляют собой дискретные наборы стратегий. Действительно, начальные возмущения суть отклонения от номинальных скоростей входа и углов входа аппарата в атмосферу. Параметрические возмущения в системе представляют собой неточное определение аэродинамического качества и баллистического коэффициента аппарата: p = (р, ж). Считаем, что возмущения ' принимают значения из заданного множества P. Постоянно действующие возмущения в системе формируются согласно имитационной модели атмосферы [3], в которой вариации плотности атмосферы öq представлены дискретным набором. То есть возмущения w £ Wk, i = 1,...,n, принимают дискретные значения из заданного множества. Таким образом, дифференциальная игра сводится к матричной игре двух лиц с противоположными интересами.

Построим матрицу стоимости игры Aj = {J(щ,wj)}. Для этого вычислим значение функционала (2), проинтегрировав т-п раз уравнения движения КЛА (1), для каждого элемента из множества управления щ G U, г = 1, п, и возмущений Wj G W, j = 1, т.

Допустим, что существует седловая точка в чистых стратегиях [4] в матричной игре {Aj, U, W}, т.е. J(u,0,w0) = maxmin J(ui,wj) = minmaxJ(u,wj). Стратегии u0 и w0 будут оптимальными стратегиями

Wj Ui Ui Wj

управления и возмущения соответственно.

Если седловая точка в чистых стратегиях не существует, то одним из способов поиска оптимальных стратегий является переход к смешанным стратегиям [4]. В смешанном расширении матричной игры в качестве критерия оптимальности используется математическое ожидание функционала (2):

m n

H(С, п) = M[J] = ^ £ JijZiVj = (£Aj)n = C(Ajn), j=1i=1

( т 11™ I

где е е V = | е е Ет, = & = > 0, г = 1,...,ш\ и п е \¥=1 п е Я™, = т = 1,Ш > 0, г = 1,...,п| — смешанные стратегии Игроков. %

Согласно теореме Неймана [4], матричная игра {AJ, и} имеет седловую точку в смешанных стратегиях. Для решения задачи поиска оптимальных стратегий воспользуемся эквивалентностью матричной игры {AJ,и,\¥} и задачи линейного программирования [4]. В результате решения последней найдем седловую точку (&*,п*) матричной игры {AJ,и,\¥}.

Рассмотрим возможность использования полученной оптимальной смешанной стратегии на втором этапе методики максиминного тестирования.

4. Изучим вопрос использования полученной на первом этапе оптимальной стратегии на смешанном расширении игры для проведения тренировок на динамическом стенде.

На практике при численном решении задачи поиска оптимальных стратегий размерность п* велика, поэтому реализовать полученную смешанную стратегию сложно. Сократить количество тренировок можно, воспользовавшись понятием е-седловой точки [4]. Для е-седловой точкой в матричной игре {AJ, и, V} выполняется неравенство

Н(е,пе)(1 - е) < Н(£е,т) < Н(ее,п)(1 + е) (3)

для любых стратегий & е и и п е V, где (&£, т) — е-оптимальные стратегии.

Рассмотрим пример решения задачи формирования оптимальной стратегии тестирования качества управления аппаратом. Допустим, что коррекция управления за время спуска осуществляется 7 раз. Пусть в каждом интервале времени управление постоянно и может принимать дискретные значения, что соответствует реальному алгоритму управления и(Ь) = ] * Д7, Ь е [и,Ь+], ] = -1, 0,1. Повороты по углу крена производятся с шагом Д7 =15°.

Начальные возмущения заданы как отклонения от номинальной траектории у*(Ь) по высоте ДН = (-5, 0, 5) км, по углу входа в атмосферу Д9 = (-0,4°, 0, -0,4°) и по скорости входа в атмосферу ДУ = (-20, 0, 20) м/с. Таким образом, размерность матричной игры составила 4401 вариант стратегий по возмущению и 489 — по управлению.

Полученная матричная игра не имеет седловой точки в чистых стратегиях, и оптимальная стратегия тестирования формировалась на смешанном расширении игры. В результате решения задачи линейного программирования найдена контрстратегия тестирования п*. Если из спектра оптимальной стратегии п* исключить стратегии с малой вероятностью появления (п* ^ 0,01), то в неравенстве (3) получаем е ^ 0,1. Уменьшение спектра смешанных стратегий вычеркиванием доминируемых стратегий [4] приводит к уменьшению размерности оптимальной стратегии тестирования. Так, в рассматриваемом примере число активно используемых чистых стратегий возмущения сокращается до 12, при этом цена игры Н(ие,и!е) находится с заданной е-точностью. Полученные е-оптимальные стратегии можно использовать на практике, поскольку при этом резко сокращается количество тренировок.

Итак, можно реализовать второй этап тестирования, где необходимо провести серию тренировок с использованием реального алгоритма управления и. При моделировании динамики КЛА возмущения выбираются в соответствии с вероятностным распределением пе, найденным на первом этапе.

На третьем этапе после обработки статистических результатов второго этапа вычисляем интервальные оценки математического ожидания функционала (2): Н ^ Н(и, пе) ^ Н. Путем сравнения с результант

том, вычисленным на первом этапе, получаем "нижнюю" ае* = —т------ и "верхнюю"

Н (е*,п*)(1+ е)

Н

ае* = —г------ оценки тестирования качества управления спуском КЛА.

Н(е*,п*)(1 - е)

СПИСОК ЛИТЕРАТУРЫ

1. Александров В.В., Лемак С.С., Парусников Н.А. Оптимизация динамики управляемых систем. М.: Изд-во МГУ, 2000.

2. Новожилов И.В. Фракционный анализ. М.: Изд-во ЦПИ при механико-математическом факультете МГУ, 1995.

3. Сихарулидзе Ю.Г. Баллистика летательных аппаратов. М.: Наука, 1982.

4. Петросян Л.А., Зенкевич Н.А. Теория игр. М.: Высшая школа, 1998.

Поступила в редакцию 15.09.2008

i Надоели баннеры? Вы всегда можете отключить рекламу.