50
вестн. миск. ун- та. сер. 1, млхемА!ила. меланилл. 2ииа. № о
Механика
УДК 531.396
СМЕШАННЫЕ СТРАТЕГИИ ТЕСТИРОВАНИЯ В ЗАДАЧАХ ПРОВЕРКИ КАЧЕСТВА РАБОТЫ АЛГОРИТМОВ СТАБИЛИЗАЦИИ
В. В. Александров1, А. В. Лебедев2, С. С. Лемак3
Рассмотрена задача максиминного тестирования качества стабилизации для линейных систем с дискретными начальными и параметрическими возмущениями. Методика тестирования реализуется путем сведения исходной динамической игры к геометрической игре. В случае отсутствия седловой точки предложен переход к смешанному расширению геометрической игры. Показана возможность использования оптимальной смешанной стратегии возмущений.
Ключевые слова: максиминное тестирование, качество стабилизации, стратегия тестирования, смешанная стратегия тестирования.
The maximin testing problem for the stabilization quality of linear systems with discrete initial and parametric perturbations is considered. A testing procedure is implemented by reducing the original dynamic game to a geometric game. The transition to a mixed expansion of the geometric game is proposed in the absence of saddle points. An optimal mixed perturbation strategy is shown to be applicable.
Key words: maximin testing, stabilization quality, testing strategy, mixed testing strategy.
Важным этапом разработки и создания алгоритмов управления сложными динамическими объектами является этап тестирования качества их работы. Особенно актуально проведение тестирования для управляемых систем с высокой ценой риска, например для систем управления космическими объектами.
Рассмотрим задачу тестирования алгоритмов робастной стабилизации для динамической системы, задаваемой уравнениями движения следующего вида:
Х = Лд (г)х + Бд (г)и + Од (г)уг (г), х(Ьо) = Хр, г = 1, 2,...,Е, р = 1, 2,...,Р, д = 1, 2,...,ф.
Здесь х(Ь) — п-мерный вектор состояния; и(-) € и = {^[¿о^к]| \щ(г)\ ^ ишах} — 8-мерная функция управляющих воздействий; и> = (г, р,д) € № — возмущение, где № — конечное множество возмущений, содержащее К ■ Р ■ Q элементов. Показатель качества стабилизации зададим функционалом
1 ('Ш,и(^))= хт (1и)Бх(гк), (2)
где 5 — постоянная, симметричная, положительно полуопределенная матрица; моменты Ьо,Ьк фиксированы, и> € №, и(^) € и. Необходимо объективно оценить алгоритм управления системой (1) с точки зрения показателя качества (2). Оценку алгоритма управления будем производить на специальном тестирующем стенде, который представим функциональной схемой (рисунок).
Блоки исполнительных механизмов, движущегося объекта, сенсоров и окружающей среды могут быть реализованы в виде компьютерной модели. Блок алгоритмов тестирования оценивает действия алгоритмов управления. В качестве основы этого блока в [1] предлагается использовать методику максиминного
1 Александров Владимир Васильевич — доктор физ.-мат. наук, проф., зав. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail: [email protected].
2 Лебедев Антон Викторович — ассист. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail: [email protected].
3 Лемак Степам Степанович — доктор физ.-мат. наук, вед. науч. сотр. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail: [email protected].
вьсш. миск. ун-та. сер. 1, математика. механика. ¿UU9. л-о
51
тестирования, которая позволяет получить объективные показатели точности выполнения алгоритмом управления поставленной задачи при экстремальных условиях.
В задаче максиминного тестирования [2] можно выделить три этапа:
1-й этап — предварительный. На этом этапе осуществляется поиск нижней (наилучшей) оценки показателя качества управления и оптимальной стратегии поведения внешних возмущений с помощью компьютерного решения максиминной задачи;
2-й этап — основной. На этом этапе реализуется процесс тестирования в виде компьютерного моделирования при воздействии найденной на первом этапе оптимальной стратегии возмущений; в результате моделирования определяется реальная оценка качества управления; функциональная схема тестирующего стод
3-й этап — заключительный. На этом этапе сравниваются наилучшая и реальная оценки и вырабатываются рекомендации по дальнейшим тренировкам и диагностике, калибровке и коррекции.
Методика максиминного тестирования опирается на два базовых предположения.
В качестве первого базового предположения выступает предположение о наличии антагонистической динамической игры Г = (W, и, ■) двух воздействий на систему (1) — возмущения ш (игрок 1) и управления и (игрок 2), которые будем считать независимыми:
min J(w,u(-)) —>■ max, u(-)eu wew
max J(w, u(-)) —> min . wew u(-)eu
Показатель качества J(w,u(-)) будем считать функцией выигрыша игрока 1 [3].
Как и для всякой антагонистической игры, справедлива следующая цепочка неравенств:
Jo = max min J(w,u(-)) ^ min max J(w,u(-)) ^ max J(w,U) = (w°(U),U) = J, wew u(-)eu u(-)eu wew wew
(3)
(4)
(5)
где и € и — произвольная стратегия управлений.
В дальнейшем будем рассматривать нижнюю оценку ■о как наилучший показатель качества функционирования алгоритма робастной стабилизации и(-), а стратегию ш0 — как стратегию максиминного тестирования, которую необходимо реализовать на втором этапе.
Вторым базовым предположением является выполнение принципа оптимальности, основанного на построении равновесной ситуации [2], что влечет за собой существование точки равновесия (ш0,и0):
J0 = J(w ,u ) = max min J(w,u(-)) = min max J(w,u(-))
wewu(-)eu
u(-)euwew
(6)
Таким образом, соотношения (3)—(6) позволяют определить наилучшее значение показателя качества стабилизации 7о, оптимальную стратегию тестирования ш0 и игроку 2 реализовать наилучшее качество робастной стабилизации.
На первом этапе для отыскания нижнего значения функционала качества ■ 0 рассмотрим разложение вектора состояния х(Ь) системы (1): х(Ь) = хт(Ь) — хи(Ь), где хт(Ь) и хи(Ь) удовлетворяют системам уравнений
хт = Ад (Ь)хш + Од (Ь)Уэ (Ь), (¿0) = хт; (7)
хи = Ад (Ь)хи — Вд (Ь)и, хи(Ь0) = 0. (8)
Системе (7) в конечный момент ¿к соответствует множество Ст, состоящее из ЯР^ точек — по одной точке на каждое значение возмущений ш = (г,р,д), а системе (8) — Q выпуклых центрально-симметричных множеств достижимости Ои(д) с центром в нуле.
Вместо набора множеств достижимости Ои(д) рассмотрим их пересечение Ои = Р| Ои(д) (оно
д=1,..,Я
непусто), а вместо множества управлений и — его сужение, приводящее в момент ¿к состояние системы (8) в множество Ои. Таким образом, справедливо сведение исходной динамической антагонистической игры Г
52
вестн. миик. ун-та. сер. 1, математика. механика. ¿UU9. л-о
к геометрической антагонистической игре на множествах достижимости систем (7) и (8) в момент Ьк: Г = (Ст, Си, 1). Произведенное сужение множества допустимых управлений не ухудшит оценку, полученную в результате процесса тестирования.
Задача (3) поиска нижней оценки функционала качества 1о сводится к прямому перебору значений
xw Е Gw с поиском min J(xw ,xu) на каждом шаге.
ее u
Для проверки наличия ситуации равновесия игры Г (что равносильно наличию седловой точки геометрической игры Г1) будем использовать следующее утверждение.
Утверждение 1. Для того чтобы пара стратегий (w*,u*) была точкой равновесия антагонистической игры (W,U,J), необходимо и достаточно, чтобы существовал max min J(w,u) и было выполнено
wew ueu
неравенство
J(w*,u*) = max min J(w,u) ^ J(w,u*) Vw Е W. wew ueu
Это утверждение легко доказать, используя определение и критерий существования точки равновесия антагонистической игры [3].
Для определения наличия точки равновесия необходимо решить задачу (3) и проверить условие утверждения 1 для всех возмущений w.
Если ситуация равновесия имеет место, то можно использовать стратегию возмущений w0, соответствующую решению задачи (3), в качестве стратегии тестирования и приступить ко второму этапу методики тестирования, а именно к моделированию движения управляемого объекта при воздействии на него стратегии возмущения w0 и тестируемого алгоритма робастной стабилизации.
Если же выяснилось, что ситуации равновесия нет, то в некоторых случаях можно изменить множество возмущений W таким образом, чтобы новая антагонистическая игра (W*,U,J) и как следствие геометрическая игра (Gw, Gu, J) имели седловую точку. В тех же случаях, когда это изменение недопустимо, необходимо перейти к смешанному расширению Г геометрической игры Г1. Остановимся подробнее на этом переходе.
Согласно [3], игра Г1 = (Gw,Gu,J), Gw С Rm, Gu С Rm, является выпуклой и имеет значение
Ко = min max J(xw ,xu). Игрок 1 (возмущение) обладает оптимальной смешанной стратегией ßo с
XueGu%weQw
конечным спектром, состоящим не более чем из (m + 1) точки множества Gw (здесь m — размерность пространства геометрической игры Г1, задаваемого метрикой J(xw ,wu) = (xw — xu)TS(xw — xu)).
Все чистые стратегии xf игрока 2, на которых достигается min max J(xw, xu), являются для него
хи) и (xw хи)
м и
Хи ее и ее
оптимальными, причем справедлива цепочка неравенств, соответствующая определению ситуации равно-
весия в смешанных стратегиях:
К (Хw ,хи ) ^ К (цо,хи ) ^ К (ро,Хи) Ухи € Си, УХw € Gw, (9)
где К(цо,хи) = ^ (х-ш,хи) — математическое ожидание выигрыша игрока 1 в точке хи € Си wеw
(здесь — вероятности, соответствующие смешанной стратегии цо), К(цо,хи) = Ко, а К(xw,хи) =
1 (xw , хи ) .
Как видно из (9), Ко является нижней оценкой математического ожидания выигрыша К(цо,хи), более того, в силу наличия ситуации равновесия в смешанном расширении Г исходной геометрической игры Г1 она достижима. Для реализации второго этапа методики тестирования необходимо найти эту нижнюю оценку К(цо,хи) = Ко и такую смешанную стратегию возмущений цо, чтобы выполнялись условия (9).
На втором этапе тестирования необходимо провести серию испытаний при воздействии на управляемый объект возмущений — стратегий тестирования, выбираемых в соответствии с распределением вероятностей цо, найденным на первом этапе. Каждое испытание представляет собой процесс математического моделирования движения управляемого объекта, на которое воздействуют выбранные возмущение и управление (игроки 1 и 2). После проведения серии испытаний можно вычислить приближенное
1 М
значение математического ожидания К (/л о,хи) = — о,хги), где N — количество испытаний, а хги —
г=1
реализация управляющего воздействия на г-м испытании.
С учетом предположения о достаточно большом числе испытаний N и на основании центральной предельной теоремы можно заключить, что с вероятностью ра выполняется интервальная оценка
а - а 1 М
К — а —= < К(цо, хи) < К + а —=, где а2 = —---(^о, хги) — К) — несмещенная оценка диспер-
V N у N N _ 1 ^^
г=1
вестн. миск. ун- та. сер. 1, мАтемл! ила. меллнилА. 2ииа. № о
а
,;„и, а л и « связаны соотношением Ро = * /ехр * А, Следовательно, при <=„-* выполняется
0
неравенство, соответствующее ситуации е-равновесия [3]:
К(^0, хм) ^ к(^0,хи) + е.
На третьем этапе к(р>0,хи) необходимо сравнить с нижней оценкой математического ожидания к(^0,хм) — е с учетом ситуации е-равновесия. В силу достижимости наилучшего значения показателя качества к0 оценка, полученная в результате процесса тестирования, будет объективной. Работа выполнена при финансовой поддержке РФФИ (грант № 07-01-00216).
СПИСОК ЛИТЕРАТУРЫ
1. Александров В.В. Тестирование качества стабилизации нестационарных движений // Вестн. Моск. ун-та. Матем. Механ. 1997. № 3. 51-54.
2. Александров В.В., Блаженнова-Микулич Л.Ю, Гутиерес-Ариас И.М., Лемак С.С. Максиминное тестирование точности стабилизации и седловые точки в геометрических играх // Там же. 2005. № 1. 43-50.
3. Петросян Л.А. Теория игр. М.: Книжный дом "Университет", 1998.
Поступила в редакцию 15.09.2008
УДК 528.56
УТОЧНЕНИЕ ТРАЕКТОРНЫХ ПАРАМЕТРОВ НАВИГАЦИОННЫХ СПУТНИКОВ СИСТЕМ GPS И ГЛОНАСС ПРИ ПОМОЩИ ДАННЫХ СЕРВИСА IGS
О. Н. Богданов1
Неточное знание траекторных параметров навигационных спутников является одним из факторов, снижающих точность обработанной измерительной информации. В работе рассматривается задача уточнения траекторных параметров навигационных спутников в режиме постобработки при помощи информации, предоставляемой службой международного сервиса глобальных спутниковых навигационных систем IGS.
Ключевые слова: спутниковая навигационная система, постобработка, стандартный режим, международный центр IGS.
The inaccurate knowledge of navigation satellite trajectory parameters is one of the factors decreasing the accuracy of processed measuring data. The problem of refining such parameters in a post-processing mode on the basis of IGS position data is considered.
Key words: satellite navigation system, post-processing, standard mode, International Global Navigation Satellite Systems Service (IGS).
Введение. Спутниковые навигационные системы широко используются для определения местоположения и скорости подвижных объектов. Ошибки определения координат и скорости подвижного объекта обусловлены многими факторами, среди которых существенную роль играют погрешности эфемеридного обеспечения навигационных спутников.
В некоторых приложениях, например в аэрогравиметрии, допускается постобработка спутниковых измерений. Это позволяет использовать при обработке дополнительную информацию, в частности свободно
1 Богданов Олег Николаевич — асп. каф. прикладной механики и управления мех.-мат. ф-та МГУ, e-mail: [email protected].