У
правление подвижными объектами
УДК 517.977
АЛГОРИТМЫ БЫСТРОГО ОЦЕНИВАНИЯ ВЕКТОРА ВЫСОКОЙ РАЗМЕРНОСТИ В ЗАДАЧАХ УПРАВЛЕНИЯ ПОДВИЖНЫМИ ОБЪЕКТАМИ
А.Я. Андриенко, Е.И. Тропова
Рассмотрена задача планирования программного управления подвижным объектом в условиях дефицита и априорной неопределенности времени, выделяемого на это планирование. Предложены алгоритмы быстрого оценивания векторов параметров высокой размерности.
Ключевые слова: вектор возмущений высокой размерности, алгоритм быстрого оценивания, дефицит времени оценивания.
ВВЕДЕНИЕ
В статье излагаются результаты развития метода оценивания векторов возмущений высокой размерности [1], разработанного в обеспечение анализа результатов летных испытаний бортовых систем управления. Необходимость такого развития связывается с созданием автоматизированных систем оперативного планирования полета объектов авиационной и ракетной техники [2]. Становится актуальной задача быстрого оценивания вектора параметров высокой размерности, принципы и алгоритмы решения которой представлены в § 2 и 3 статьи.
1. ЗАДАЧА БЫСТРОГО ОЦЕНИВАНИЯ ВЕКТОРА ПАРАМЕТРОВ ВЫСОКОЙ РАЗМЕРНОСТИ
Специфику требований, предъявляемых к представляемому алгоритму оценивания, поясним на содержательном примере автоматизированной прокладки маршрута полета, выполняемой в ряде перспективных систем управления типа бортовой системы управления полетом самолета тактической авиации, наземной системы подготовки полетных заданий для вылета авиасоединения и пр.
Прокладка маршрута х * — это выбор трассы, профиля и временного графика полета самолета от аэродрома к цели, проводимый по скалярному критерию /, учитывающему вероятности поражения самолета средствами ПВО, потери про-
странственной ориентировки и столкновения с наземными объектами. Для расчета критерия / используются специальные математические модели (модель ПВО в виде зависимости интенсивности поражения самолета от фазовых координат относительного положения самолета и средств ПВО; модель навигационного риска в виде функциональной зависимости вероятности потери самолетом пространственной ориентировки от информативности навигационного поля; модель риска столкновения с поверхностью Земли, связывающая вероятность гибели самолета с высотой полета и рельефом местности), позволяющие каждому возможному маршруту х ставить в соответствие численное значение критерия /:
/ = ¥(х), х е X, (1)
где X — множество всех возможных маршрутов полета, прокладываемых по имеющейся в системе информации.
Процессу прокладки маршрута предшествует этап сбора и введения в ПЭВМ оперативно-разведывательной, картографической, метеорологической и другой информации, касающейся параметров упомянутых моделей, а также этап автоматизированного формирования множества {Xк} магистральных маршрутов Хк, к = 1, 2, ..., К, полета, в окрестностях Ок, к = 1, 2, ..., К, которых лежит искомый маршрут. (Размеры объединения О = иок заведомо меньше размеров множества X.)
Маршруты x е Qk, к = 1,2, ..., K, подлежат параметризации: x = x(V), где V — N-мерный вектор параметров, характеризующий координаты точек поворота маршрута и коэффициенты полиноми-нальных аппроксимаций траекторий и временного графика полета на участках между точками поворота.
В дальнейшем полагаем, что границы Bk = = (Bk(1), Bk(2), ..., Bk(N)) окрестностей Qk, к = 1, 2, ..., K, магистральных маршрутов Xk = Xk(Vk), где Vk = (Vk(1), Vk(2), ..., Vk(N)), представимы в виде Bk(n) = Vk(n) ± A(n), n = 1, 2, ..., N, где A(n) — заданные числа, характеризующие размеры окрестности Qk.
Тогда выбор маршрута x * сводится к решению задач оценивания параметров V оптимального
маршрута в окрестностях Qk из условия
л k
V = arg min ^[x(V)j = arg min y(V) (2)
V e ak V e ak
с последующим определением наилучшей (по крил k
терию (1)) из оценок V , к = 1, 2, ..., K.
Задача (2) значительно труднее рассмотренной в работе [1] по двум причинам.
Прежде всего, критерий оптимальности у в задаче (2) по природе зависимости безопасности полета R = 1 — y(V) от маршрута представляет собой очень сложную многоэкстремальную функцию вектора параметров V.
Далее, располагаемое для решения задачи (2) время априори не определено: для прокладки маршрута одной и той же системе может быть выделено от минут до нескольких часов (а наземной системе подготовки полетных заданий — и до нескольких суток) в зависимости от складывающейся оперативной обстановки.
2. ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ
Целесообразно так развить корреляционный метод [1], чтобы он позволял формировать оценки вектора высокой размерности в условиях много-экстремальности задач типа (2) и в условиях дефицита времени, выделяемого на решение задачи, при априори неизвестной степени его дефицитности.
Такое развитие может быть получено на основе использования двух идей.
1. Решение многоэкстремальной задачи (2) оп-
kk
ределим как предел V = limVq, q ^ да, последо-
вательности решений задач (индекс к в дальнейшем опускается):
V* = V* -1 + А V*,
А V * = ащтт М{у( V * -1 + АV0 + V )},
ау4 4 4
Я = 1, 2, ..., (3)
где V* — Л^-мерный случайный вектор с независимыми между собой компонентами, среднеквадратические значения которых линейно связаны с
компонентами вектора А V * -1 так, что |у*| ^ 0 при
Я ^ да.
Критерии оптимальности в задачах (3) значительно глаже функции у(У) и могут быть аппроксимированы унимодальными зависимостями (по аргументам АVq) с тем, чтобы для решения задач (3) можно было использовать итерационным образом метод [1]. Но это, естественно, можно сделать лишь в случаях достаточно большого времени, располагаемого для решения всей оптимизационной задачи.
2. Процесс решения задачи организуем таким образом, чтобы при прерывании его в произвольный момент времени можно было представить некоторую промежуточную оценку вектора (с большей, естественно, погрешностью, чем ошибка завершенного решения задачи).
Эта промежуточная оценка должна быть в некотором смысле (см. § 3) наилучшей из всех оценок, которые можно было бы сформировать к текущему моменту времени решения задачи.
3. АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧИ
Основные пояснения принципов построения и действия разработанных алгоритмов оценивания вектора V высокой размерности проведем применительно к условиям задачи управления по критерию безопасности (алгоритм 1) с последующими уточнениями при приложении к задаче прогнозирования конечного состояния терминальной системы (алгоритм 2).
Алгоритм 1. При действии алгоритма реализуется итерационный процесс (3) оценивания вектора V.
В начале д-го цикла работы алгоритма (на шаге 1) считаются известными значения предшествующих
оценок V3 -1 и А V3 -1 при д > 1, а также априорные
л к
значения Vo = V вектора параметров магистрального маршрута и числа А(п), п = 1, 2, ..., N характеризующие размеры окрестности магистрального маршрута; на любом шаге итерационного процес-
70
CONTROL SCIENCES № 2 • 2010
са может поступить внешняя команда — запрос
X = 1 на выдачу оценки V вектора V.
В каждом из последующих шагов итерационного цикла формируется 5-е (^ = и — 1, и — номер ша-
\ / (1) (2) (N>4
га) значение у^ = (у*/, у*/ , ..., уд/) вектора V* и вычисляется соответствующее значение критерия
у( V * -1 + V ). Если бы заранее было известно, что сигнал х поступит не ранее (3Ж + 1)-го шага я-го
цикла итерации, то для определения оценки V* можно было бы непосредственно применить метод [3], предусматривающий формирование ортого-
Если же сигнал х поступает на одном из начальных шагов (шаге и) я-й итерации, то реализуется лишь относительно небольшой фрагмент набора {у^}, составленный из векторов уж, 5 = 1, 2, ..., ^,
где ^ = и — 1. Эти векторы в общем случае весьма неравномерно распределены в области О* _ 1, о чем
свидетельствует разброс расстояний рп^ пмежду
вектор-столбцами верхнего блока (размера ^ х Ж) матрицы А.
Поэтому при формировании матрицы Z целесообразно учесть дополнительное требование, направленное на повышение равномерности распределения начального фрагмента (длиной ^ = и — 1) нальных векторов у^, 5 = 1, 2, ..., Ж, на основе мат- набора векторов {уж} и формализуемое условием
рицы Адамара А размера N х N. Набор {у } полу
ченных при этом N векторов уле предельно равно
мерно заполняет задаваемую в окрестности V ф _ 1 область возможных значений вектора уф. Поясним это обстоятельство несколько детальнее. Считается, что область определяется задани-
(”)
ем среднеквадратических значений аф составляющих уфп), п = 1, 2, ..., N вектора уф (см. шаг 2) и
условием некоррелированности этих составляющих. Набор векторов уле , 5 = 1, 2, ..., N, однозначно определяется матрицей Z чисел (индекс д здесь опускается), каждая 5-я строка которой составлена из нормированных и безразмерных составляющих
1т = уфП) / аф”) вектора уф«. Равномерность заполнения области О векторами уле характеризуется разбросом расстояний между вектор-строками и расстояний рПі”2 между вектор-столбцами матрицы Z, где
N 2 ^ 2
Г«1«2 ^ (^«1 ” ^«2” ) , Р”і”2 X (^«”і ^««2 )
” = 1 « = 1
(в общем случае ^ < N; 51, 51, п1, п2 — произвольные номера строк и столбцов).
В методе [3] принимается Z = А, и тогда в силу ортогональности матрицы А по строкам и столбцам все расстояния г$ «2 между любыми вектор-
строками и рПі«2 между любыми вектор-столбцами одинаковы, т. е. сформированные N векторов уле распределены в ^мерной области О предельно равномерно. Поэтому в случае, если сигнал х поступит несколько раньше (Ж — 1)-го шага д-й итерации, то в качестве оценки вектора V на шаге и правомерно будет принимать тот элемент ряда
V - Р V - 1 + V V - 1 + V ..., V - 1 + V - ф который доставляет минимум функции уО).
тіл
«1«2
которое при Z = А, |г | = 1 эквивалентно условию
тіл
«і «2
(4)
Рассматривая г1п, г2п, ..., 18п как ^-разрядный набор из —1 и +1, воспользуемся принятым в теории кодов понятием расстояния между двумя наборами, определяемого как число разрядов, в которых эти наборы различаются. Тогда условие (4) аналогично требованиям, предъявляемым к расстоянию между сообщениями в оптимальных кодах. Математический аппарат преобразования матриц А для выполнения этих требований представлен в работе [4].
При назначении в условии (4) числа ^, когда время поступления сигнала х априори не известно, следует исходить из стремления обеспечить равномерность распределения у* на возможно более ранних этапах работы алгоритма, т. е. определять ^ как минимальное число, при котором задача (4) имеет решение. В представляемой далее формализации алгоритма, как и в работе [5], принимается
^ = [,/Ж]*, где [•]* — целая часть числа.
Шаг 1 я-го цикла.
1. В качестве наилучшей на шаге принимается оценка V q о = V * -1 и вычисляется соответствующее ей значение критерия /*0 = у( V *о).
2. Если х = 1, то V = V*о, конец; если х = 0, то переход к следующему шагу.
Шаг 2 я-го цикла.
1. Для я = 1 устанавливается ст(*п) = А(п)/л/3 ; для Я > 1
(”) ІЛ Т>(”) I 1 т
аф = |А Уд _ 11, п = 1, 2,
N.
2. Формируется возмущение у, с координатами
,,(”) — „(”)
= аГ
?1
п = 1, 2,
N.
У*1 ^1^ 1^
где й = и + 1 + Л[и/Л]*, я = [и/Л]* + 1; и — элементы образуемых в соответствии с работой [4] матриц Адамара © и Л.
3. Вычисляется значение критерия /*1 = у( У?1),
где V*1 = V* _ 1 + у*1, и устанавливаются начальные значения кумулятивных сумм
<1> = /?1 У(31>, и = 1, 2, ..., N.
4. Определяется наилучшая на шаге оценка
V*! :=
^1, если /^0 > 1ф1
и соответствующее ей значение критерия
/ .= |/ф0, если /ф0 - /ф1, ф1 1 /ф1. если /ф0 > /ф1.
5. Если х = 1, то V = V ф1, конец; если х = 0, то переход к следующему шагу.
Замечание 1. Величина а(1”), п = 1, 2, ..., N в операции 1 шага 2 назначается в предположении равномерности априорного распределения вероятностей величин у(1”) в интервале (—А(п), +А(п)). ♦
Шаг и (и = 3,4, ..., 3N + 1) д-го цикла.
1. Формируется возмущение уле (5 = и — 1) с ко ординатами.
а) при и = 3,4, ..., N + 1
где Ї = 5 - £[(5 - 1)/£]*, р = [(5 - 1)/£]* + 1; значения й и g указаны в шаге 2;
б) при и = N + 2, N + 3, ..., 2N + 1
.(") = I аф”), если 5 _ (N + 1) = п,
. 0, если 5 _ (N + 1) ф п; в) при и = 2N + 2, 2N + 3, ..., 3N + 1
V =
(”) уя ’
,(«) _ | _ая если 5 _ (2N + 1)
0, если 5 _ (2N + 1) ф п.
2. Вычисляется значение критерия / = у( V я«),
я«;
^ ^ _ 1 + V
а) при и = 3, 4, ..., N + 1 вычисляются значения кумулятивных сумм
ш(”) = ш(и) = Т у(п)
уя(«_ 1) /,,,уя
я« кя«
п = 1,2,
N1
б) при и = N + 2, N + 3, ..., 2N + 1 формируется = 5 — (Ы + 1) величина I(п) = / (5 = и — 1);
для п
в) при и = 2N + 2, 2N + 3, ..., 3N + 1 формируется для п = 5 — (2N + 1) величина т(п) = / (5 = и — 1).
3. Определяется наилучшая на шаге оценка
Уя1 ■=
^(.ї _ 1), если Тя(« _ 1) — /qs,
Vя«, если Тя(«_ 1) > Тя«
и соответствующее ей значение критерия
/ ■= I Тя(« _ 1), если Тя(5 _ 1) - ТЯ5,
я«
Тя«, если Тя(« _ 1) > Тя«.
4. Если х = 1, то V = Vqs, конец;
если х = 0, д > 1, и = N + 1, то переход к шагу
3N + 1,
в других случаях — переход к следующему шагу. Замечание 2. Как следует из условий операции 4 шага и, выполнение шагов N + 2, N + 3, ..., 3N + 1
и формирование величин и производятся только в первом цикле итераций (при д = 1); в остальных циклах число шагов не превышает N + 2. Шаг 3N + 2 д-го цикла.
1. Определяется наилучшая в цикле оценка V я
\(«) \(«) \(«)
с координатами V = V _ 1 + А V , п = 1, 2, N
где
А Г(П) = я
(”)
N(22/я0 _ I(п) _ т(п) _ р)
п = 1, 2, N
здесь параметр в априори выбирается, как и в работе [3], из условия, чтобы оценки вектора V не
выходили за пределы области Ок.
2. Если х = 1, то V = V я, конец;
если х = 0, то переход к (д + 1)-му циклу итерации. ■
Здесь изложен алгоритм решения только одной из однотипных задач (индекс к в данном разделе опущен), составляющих общую задачу прокладки маршрута по критерию безопасности Л. Порядок объединения алгоритмов параллельного решения К задач в единый очевиден и не требует пояснений.
Представленный алгоритм реализует, вообще говоря, процедуру приближенного решения поставленной задачи. для сходимости последовательности (3) к глобальному экстремуму (2) необходимо выполнение довольно жестких условий, накладываемых на коэффициенты связи вероятностных характеристик вектора Уя с вектором АVq . Эти условия в статье не рассматриваются. Данный же вариант алгоритма в практических приложениях
72
СОЫТВОЬ БОЕЫСЕБ № 2 * 2010
обеспечивает поиск всего лишь локального экстремума задачи, но вблизи глобального экстремума сглаженного исходного критерия.
Область возможных применений изложенного подхода заведомо шире класса задач управления по критерию безопасности Я. В частности, при терминальном управлении некоторыми технологическими процессами в химической и фармакологической отраслях промышленности интервалы времени между моментами I проведения коррекций процесса оказываются меньшими времени, потребного для формирования оптимальных управляющих команд. Применительно к таким случаям алгоритм модифицируется следующим образом.
Алгоритм 2. Прежде всего, номер цикла итерации здесь жестко привязывается к номеру интервала квантования дискретной терминальной системы: # = I (соответствующим образом должно быть перестроено условие перехода от цикла к циклу).
Далее, для терминальных систем априори известно число Si шагов, выполняемых в цикле итерации, т. е. размещаемых в интервале между дискретными моментами времени I и I +1 (поэтому условие (4) здесь должно соблюдаться для числа £., а
не для минимально возможного числа £ = [*Щ ]*).
Кроме того, задачи терминального управления в исходной постановке чаще всего оказываются статистическими, и поэтому здесь с увеличением номера итерации среднеквадратическое значение
стЩ возмущений у^и), п = 1, 2, ..., N должно приближаться не к нулю, а к условному среднеквадратическому значению ошибки оптимального оценивания координаты Vп вектора V.
Соответствующие уточнения в алгоритме очевидны.
И наконец, в зависимости от размерности решаемых задач алгоритм перестраивается посредством формирования матриц © и Л из множества возможных матриц Адамара. ■
Пример. Ограничимся представлением примера матриц © и Л, сформированных в соответствии с работой [4], для использования при оптимизации Ж-мерного вектора параметров маршрута полета применительно к случаю N = 64.
Матрица ©
+1 +1 +1 1 + +1 +1 1 + +1
1 + +1 -1 -1 -1 1 + -1 +1
1 + 1 + -1 +1 +1 -1 -1 -1
+1 -1 -1 1 + -1 1 + +1 -1
+1 +1 1 + -1 -1 -1 1 + -1
1 + -1 +1 1 + -1 -1 1 1 +1
+1 -1 -1 -1 +1 -1 +1 +1
+1 -1 +1 -1 +1 +1 -1 -1
Матрица Л + 1 +1 +1 +1 +1 +1 +1 +1
+ 1 _1 +1 _1 +1 _1 +1 _1
+ 1 +1 _1 _1 +1 +1 _1 _1
+ 1 _1 _1 +1 +1 _1 _1 +1
+ 1 +1 +1 +1 -1 -1 -1 -1
+ 1 _1 +1 _1 _1 +1 _1 +1
+ 1 +1 _1 _1 _1 _1 +1 +1
+ 1 _1 _1 +1 _1 +1 +1 _1
ЗАКЛЮЧЕНИЕ
Предложена процедура оценивания вектора высокой размерности, объединяющая ранее разработанный корреляционный метод поиска глобального экстремума в пространстве возмущений с методом формирования максимально различимых между собой вариантов вектора возмущений. При остром дефиците времени решения задачи предложенная процедура приводит к алгоритму выбора наилучшего из просмотренных вариантов оцениваемого вектора, а при увеличении располагаемого времени решения она трансформируется в алгоритм корреляционного поиска наилучшего из всех возможных вариантов оценки.
ЛИТЕРАТУРА
1. Андриенко А.Я., Тропова Е.И., Чадаев А.И. Методы анализа результатов летных испытаний бортовых систем управления // Автоматика и телемеханика. — 2010. — № 5. — С. 155—165 .
2. Maroon G.N., Duongh N.G., Maschec T.J. Tactical flight management — total mission capability // Proc. IEEE Nat. Aerosp. and Electron Cong., NAECON, 1984. — Dayton, Ohio. N.-Y., 1984. — P. 496—502.
3. Андриенко А.Я. Метод оценивания вектора возмущений в задаче прогнозирования конечного состояния терминальной системы управления // Автоматика и телемеханика. — 1996. — № 3. — С. 71—82.
4. Левенштейн В.И. Применение матриц Адамара к одной задаче кодирования // Проблемы кибернетики. — 1961. — Вып. 5. — С. 22—29.
5. Бортовые терминальные системы управления / Б.Н. Петров и др. — М.: Машиностроение, 1983. — 200 с.
Статья представлена к публикации членом редколлегии
Б.В. Павловым.
Андриенко Анатолий Яковлевич — д-р техн. наук,
зав. лабораторией,
Тропова Елена Ивановна — науч. сотрудник,
Институт проблем управления им. В.А. Трапезникова РАН,
г. Москва, S (495) 334-88-71, И vlaguc@ipu.rssi.ru.