Научная статья на тему 'Алгоритмы быстрого оценивания вектора высокой размерности в задачах управления подвижными объектами'

Алгоритмы быстрого оценивания вектора высокой размерности в задачах управления подвижными объектами Текст научной статьи по специальности «Математика»

CC BY
114
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Проблемы управления
ВАК
Область наук
Ключевые слова
ВЕКТОР ВОЗМУЩЕНИЙ ВЫСОКОЙ РАЗМЕРНОСТИ / АЛГОРИТМ БЫСТРОГО ОЦЕНИВАНИЯ / ДЕФИЦИТ ВРЕМЕНИ ОЦЕНИВАНИЯ / VECTOR OF INDIGNATIONS OF HIGH DIMENSION / ALGORITHM FOR FAST ESTIMATION / DEFICIENCY OF TIME ESTIMATION

Аннотация научной статьи по математике, автор научной работы — Андриенко Анатолий Яковлевич, Тропова Елена Ивановна

Рассмотрена задача планирования программного управления подвижным объектом в условиях дефицита и априорной неопределённости времени, выделяемого на это планирование. Предложены алгоритмы быстрого оценивания векторов параметров высокой размерности

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Андриенко Анатолий Яковлевич, Тропова Елена Ивановна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритмы быстрого оценивания вектора высокой размерности в задачах управления подвижными объектами»

У

правление подвижными объектами

УДК 517.977

АЛГОРИТМЫ БЫСТРОГО ОЦЕНИВАНИЯ ВЕКТОРА ВЫСОКОЙ РАЗМЕРНОСТИ В ЗАДАЧАХ УПРАВЛЕНИЯ ПОДВИЖНЫМИ ОБЪЕКТАМИ

А.Я. Андриенко, Е.И. Тропова

Рассмотрена задача планирования программного управления подвижным объектом в условиях дефицита и априорной неопределенности времени, выделяемого на это планирование. Предложены алгоритмы быстрого оценивания векторов параметров высокой размерности.

Ключевые слова: вектор возмущений высокой размерности, алгоритм быстрого оценивания, дефицит времени оценивания.

ВВЕДЕНИЕ

В статье излагаются результаты развития метода оценивания векторов возмущений высокой размерности [1], разработанного в обеспечение анализа результатов летных испытаний бортовых систем управления. Необходимость такого развития связывается с созданием автоматизированных систем оперативного планирования полета объектов авиационной и ракетной техники [2]. Становится актуальной задача быстрого оценивания вектора параметров высокой размерности, принципы и алгоритмы решения которой представлены в § 2 и 3 статьи.

1. ЗАДАЧА БЫСТРОГО ОЦЕНИВАНИЯ ВЕКТОРА ПАРАМЕТРОВ ВЫСОКОЙ РАЗМЕРНОСТИ

Специфику требований, предъявляемых к представляемому алгоритму оценивания, поясним на содержательном примере автоматизированной прокладки маршрута полета, выполняемой в ряде перспективных систем управления типа бортовой системы управления полетом самолета тактической авиации, наземной системы подготовки полетных заданий для вылета авиасоединения и пр.

Прокладка маршрута х * — это выбор трассы, профиля и временного графика полета самолета от аэродрома к цели, проводимый по скалярному критерию /, учитывающему вероятности поражения самолета средствами ПВО, потери про-

странственной ориентировки и столкновения с наземными объектами. Для расчета критерия / используются специальные математические модели (модель ПВО в виде зависимости интенсивности поражения самолета от фазовых координат относительного положения самолета и средств ПВО; модель навигационного риска в виде функциональной зависимости вероятности потери самолетом пространственной ориентировки от информативности навигационного поля; модель риска столкновения с поверхностью Земли, связывающая вероятность гибели самолета с высотой полета и рельефом местности), позволяющие каждому возможному маршруту х ставить в соответствие численное значение критерия /:

/ = ¥(х), х е X, (1)

где X — множество всех возможных маршрутов полета, прокладываемых по имеющейся в системе информации.

Процессу прокладки маршрута предшествует этап сбора и введения в ПЭВМ оперативно-разведывательной, картографической, метеорологической и другой информации, касающейся параметров упомянутых моделей, а также этап автоматизированного формирования множества {Xк} магистральных маршрутов Хк, к = 1, 2, ..., К, полета, в окрестностях Ок, к = 1, 2, ..., К, которых лежит искомый маршрут. (Размеры объединения О = иок заведомо меньше размеров множества X.)

Маршруты x е Qk, к = 1,2, ..., K, подлежат параметризации: x = x(V), где V — N-мерный вектор параметров, характеризующий координаты точек поворота маршрута и коэффициенты полиноми-нальных аппроксимаций траекторий и временного графика полета на участках между точками поворота.

В дальнейшем полагаем, что границы Bk = = (Bk(1), Bk(2), ..., Bk(N)) окрестностей Qk, к = 1, 2, ..., K, магистральных маршрутов Xk = Xk(Vk), где Vk = (Vk(1), Vk(2), ..., Vk(N)), представимы в виде Bk(n) = Vk(n) ± A(n), n = 1, 2, ..., N, где A(n) — заданные числа, характеризующие размеры окрестности Qk.

Тогда выбор маршрута x * сводится к решению задач оценивания параметров V оптимального

маршрута в окрестностях Qk из условия

л k

V = arg min ^[x(V)j = arg min y(V) (2)

V e ak V e ak

с последующим определением наилучшей (по крил k

терию (1)) из оценок V , к = 1, 2, ..., K.

Задача (2) значительно труднее рассмотренной в работе [1] по двум причинам.

Прежде всего, критерий оптимальности у в задаче (2) по природе зависимости безопасности полета R = 1 — y(V) от маршрута представляет собой очень сложную многоэкстремальную функцию вектора параметров V.

Далее, располагаемое для решения задачи (2) время априори не определено: для прокладки маршрута одной и той же системе может быть выделено от минут до нескольких часов (а наземной системе подготовки полетных заданий — и до нескольких суток) в зависимости от складывающейся оперативной обстановки.

2. ПРИНЦИПЫ РЕШЕНИЯ ЗАДАЧИ

Целесообразно так развить корреляционный метод [1], чтобы он позволял формировать оценки вектора высокой размерности в условиях много-экстремальности задач типа (2) и в условиях дефицита времени, выделяемого на решение задачи, при априори неизвестной степени его дефицитности.

Такое развитие может быть получено на основе использования двух идей.

1. Решение многоэкстремальной задачи (2) оп-

kk

ределим как предел V = limVq, q ^ да, последо-

вательности решений задач (индекс к в дальнейшем опускается):

V* = V* -1 + А V*,

А V * = ащтт М{у( V * -1 + АV0 + V )},

ау4 4 4

Я = 1, 2, ..., (3)

где V* — Л^-мерный случайный вектор с независимыми между собой компонентами, среднеквадратические значения которых линейно связаны с

компонентами вектора А V * -1 так, что |у*| ^ 0 при

Я ^ да.

Критерии оптимальности в задачах (3) значительно глаже функции у(У) и могут быть аппроксимированы унимодальными зависимостями (по аргументам АVq) с тем, чтобы для решения задач (3) можно было использовать итерационным образом метод [1]. Но это, естественно, можно сделать лишь в случаях достаточно большого времени, располагаемого для решения всей оптимизационной задачи.

2. Процесс решения задачи организуем таким образом, чтобы при прерывании его в произвольный момент времени можно было представить некоторую промежуточную оценку вектора (с большей, естественно, погрешностью, чем ошибка завершенного решения задачи).

Эта промежуточная оценка должна быть в некотором смысле (см. § 3) наилучшей из всех оценок, которые можно было бы сформировать к текущему моменту времени решения задачи.

3. АЛГОРИТМЫ РЕШЕНИЯ ЗАДАЧИ

Основные пояснения принципов построения и действия разработанных алгоритмов оценивания вектора V высокой размерности проведем применительно к условиям задачи управления по критерию безопасности (алгоритм 1) с последующими уточнениями при приложении к задаче прогнозирования конечного состояния терминальной системы (алгоритм 2).

Алгоритм 1. При действии алгоритма реализуется итерационный процесс (3) оценивания вектора V.

В начале д-го цикла работы алгоритма (на шаге 1) считаются известными значения предшествующих

оценок V3 -1 и А V3 -1 при д > 1, а также априорные

л к

значения Vo = V вектора параметров магистрального маршрута и числа А(п), п = 1, 2, ..., N характеризующие размеры окрестности магистрального маршрута; на любом шаге итерационного процес-

70

CONTROL SCIENCES № 2 • 2010

са может поступить внешняя команда — запрос

X = 1 на выдачу оценки V вектора V.

В каждом из последующих шагов итерационного цикла формируется 5-е (^ = и — 1, и — номер ша-

\ / (1) (2) (N>4

га) значение у^ = (у*/, у*/ , ..., уд/) вектора V* и вычисляется соответствующее значение критерия

у( V * -1 + V ). Если бы заранее было известно, что сигнал х поступит не ранее (3Ж + 1)-го шага я-го

цикла итерации, то для определения оценки V* можно было бы непосредственно применить метод [3], предусматривающий формирование ортого-

Если же сигнал х поступает на одном из начальных шагов (шаге и) я-й итерации, то реализуется лишь относительно небольшой фрагмент набора {у^}, составленный из векторов уж, 5 = 1, 2, ..., ^,

где ^ = и — 1. Эти векторы в общем случае весьма неравномерно распределены в области О* _ 1, о чем

свидетельствует разброс расстояний рп^ пмежду

вектор-столбцами верхнего блока (размера ^ х Ж) матрицы А.

Поэтому при формировании матрицы Z целесообразно учесть дополнительное требование, направленное на повышение равномерности распределения начального фрагмента (длиной ^ = и — 1) нальных векторов у^, 5 = 1, 2, ..., Ж, на основе мат- набора векторов {уж} и формализуемое условием

рицы Адамара А размера N х N. Набор {у } полу

ченных при этом N векторов уле предельно равно

мерно заполняет задаваемую в окрестности V ф _ 1 область возможных значений вектора уф. Поясним это обстоятельство несколько детальнее. Считается, что область определяется задани-

(”)

ем среднеквадратических значений аф составляющих уфп), п = 1, 2, ..., N вектора уф (см. шаг 2) и

условием некоррелированности этих составляющих. Набор векторов уле , 5 = 1, 2, ..., N, однозначно определяется матрицей Z чисел (индекс д здесь опускается), каждая 5-я строка которой составлена из нормированных и безразмерных составляющих

1т = уфП) / аф”) вектора уф«. Равномерность заполнения области О векторами уле характеризуется разбросом расстояний между вектор-строками и расстояний рПі”2 между вектор-столбцами матрицы Z, где

N 2 ^ 2

Г«1«2 ^ (^«1 ” ^«2” ) , Р”і”2 X (^«”і ^««2 )

” = 1 « = 1

(в общем случае ^ < N; 51, 51, п1, п2 — произвольные номера строк и столбцов).

В методе [3] принимается Z = А, и тогда в силу ортогональности матрицы А по строкам и столбцам все расстояния г$ «2 между любыми вектор-

строками и рПі«2 между любыми вектор-столбцами одинаковы, т. е. сформированные N векторов уле распределены в ^мерной области О предельно равномерно. Поэтому в случае, если сигнал х поступит несколько раньше (Ж — 1)-го шага д-й итерации, то в качестве оценки вектора V на шаге и правомерно будет принимать тот элемент ряда

V - Р V - 1 + V V - 1 + V ..., V - 1 + V - ф который доставляет минимум функции уО).

тіл

«1«2

которое при Z = А, |г | = 1 эквивалентно условию

тіл

«і «2

(4)

Рассматривая г1п, г2п, ..., 18п как ^-разрядный набор из —1 и +1, воспользуемся принятым в теории кодов понятием расстояния между двумя наборами, определяемого как число разрядов, в которых эти наборы различаются. Тогда условие (4) аналогично требованиям, предъявляемым к расстоянию между сообщениями в оптимальных кодах. Математический аппарат преобразования матриц А для выполнения этих требований представлен в работе [4].

При назначении в условии (4) числа ^, когда время поступления сигнала х априори не известно, следует исходить из стремления обеспечить равномерность распределения у* на возможно более ранних этапах работы алгоритма, т. е. определять ^ как минимальное число, при котором задача (4) имеет решение. В представляемой далее формализации алгоритма, как и в работе [5], принимается

^ = [,/Ж]*, где [•]* — целая часть числа.

Шаг 1 я-го цикла.

1. В качестве наилучшей на шаге принимается оценка V q о = V * -1 и вычисляется соответствующее ей значение критерия /*0 = у( V *о).

2. Если х = 1, то V = V*о, конец; если х = 0, то переход к следующему шагу.

Шаг 2 я-го цикла.

1. Для я = 1 устанавливается ст(*п) = А(п)/л/3 ; для Я > 1

(”) ІЛ Т>(”) I 1 т

аф = |А Уд _ 11, п = 1, 2,

N.

2. Формируется возмущение у, с координатами

,,(”) — „(”)

= аГ

?1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п = 1, 2,

N.

У*1 ^1^ 1^

где й = и + 1 + Л[и/Л]*, я = [и/Л]* + 1; и — элементы образуемых в соответствии с работой [4] матриц Адамара © и Л.

3. Вычисляется значение критерия /*1 = у( У?1),

где V*1 = V* _ 1 + у*1, и устанавливаются начальные значения кумулятивных сумм

<1> = /?1 У(31>, и = 1, 2, ..., N.

4. Определяется наилучшая на шаге оценка

V*! :=

^1, если /^0 > 1ф1

и соответствующее ей значение критерия

/ .= |/ф0, если /ф0 - /ф1, ф1 1 /ф1. если /ф0 > /ф1.

5. Если х = 1, то V = V ф1, конец; если х = 0, то переход к следующему шагу.

Замечание 1. Величина а(1”), п = 1, 2, ..., N в операции 1 шага 2 назначается в предположении равномерности априорного распределения вероятностей величин у(1”) в интервале (—А(п), +А(п)). ♦

Шаг и (и = 3,4, ..., 3N + 1) д-го цикла.

1. Формируется возмущение уле (5 = и — 1) с ко ординатами.

а) при и = 3,4, ..., N + 1

где Ї = 5 - £[(5 - 1)/£]*, р = [(5 - 1)/£]* + 1; значения й и g указаны в шаге 2;

б) при и = N + 2, N + 3, ..., 2N + 1

.(") = I аф”), если 5 _ (N + 1) = п,

. 0, если 5 _ (N + 1) ф п; в) при и = 2N + 2, 2N + 3, ..., 3N + 1

V =

(”) уя ’

,(«) _ | _ая если 5 _ (2N + 1)

0, если 5 _ (2N + 1) ф п.

2. Вычисляется значение критерия / = у( V я«),

я«;

^ ^ _ 1 + V

а) при и = 3, 4, ..., N + 1 вычисляются значения кумулятивных сумм

ш(”) = ш(и) = Т у(п)

уя(«_ 1) /,,,уя

я« кя«

п = 1,2,

N1

б) при и = N + 2, N + 3, ..., 2N + 1 формируется = 5 — (Ы + 1) величина I(п) = / (5 = и — 1);

для п

в) при и = 2N + 2, 2N + 3, ..., 3N + 1 формируется для п = 5 — (2N + 1) величина т(п) = / (5 = и — 1).

3. Определяется наилучшая на шаге оценка

Уя1 ■=

^(.ї _ 1), если Тя(« _ 1) — /qs,

Vя«, если Тя(«_ 1) > Тя«

и соответствующее ей значение критерия

/ ■= I Тя(« _ 1), если Тя(5 _ 1) - ТЯ5,

я«

Тя«, если Тя(« _ 1) > Тя«.

4. Если х = 1, то V = Vqs, конец;

если х = 0, д > 1, и = N + 1, то переход к шагу

3N + 1,

в других случаях — переход к следующему шагу. Замечание 2. Как следует из условий операции 4 шага и, выполнение шагов N + 2, N + 3, ..., 3N + 1

и формирование величин и производятся только в первом цикле итераций (при д = 1); в остальных циклах число шагов не превышает N + 2. Шаг 3N + 2 д-го цикла.

1. Определяется наилучшая в цикле оценка V я

\(«) \(«) \(«)

с координатами V = V _ 1 + А V , п = 1, 2, N

где

А Г(П) = я

(”)

N(22/я0 _ I(п) _ т(п) _ р)

п = 1, 2, N

здесь параметр в априори выбирается, как и в работе [3], из условия, чтобы оценки вектора V не

выходили за пределы области Ок.

2. Если х = 1, то V = V я, конец;

если х = 0, то переход к (д + 1)-му циклу итерации. ■

Здесь изложен алгоритм решения только одной из однотипных задач (индекс к в данном разделе опущен), составляющих общую задачу прокладки маршрута по критерию безопасности Л. Порядок объединения алгоритмов параллельного решения К задач в единый очевиден и не требует пояснений.

Представленный алгоритм реализует, вообще говоря, процедуру приближенного решения поставленной задачи. для сходимости последовательности (3) к глобальному экстремуму (2) необходимо выполнение довольно жестких условий, накладываемых на коэффициенты связи вероятностных характеристик вектора Уя с вектором АVq . Эти условия в статье не рассматриваются. Данный же вариант алгоритма в практических приложениях

72

СОЫТВОЬ БОЕЫСЕБ № 2 * 2010

обеспечивает поиск всего лишь локального экстремума задачи, но вблизи глобального экстремума сглаженного исходного критерия.

Область возможных применений изложенного подхода заведомо шире класса задач управления по критерию безопасности Я. В частности, при терминальном управлении некоторыми технологическими процессами в химической и фармакологической отраслях промышленности интервалы времени между моментами I проведения коррекций процесса оказываются меньшими времени, потребного для формирования оптимальных управляющих команд. Применительно к таким случаям алгоритм модифицируется следующим образом.

Алгоритм 2. Прежде всего, номер цикла итерации здесь жестко привязывается к номеру интервала квантования дискретной терминальной системы: # = I (соответствующим образом должно быть перестроено условие перехода от цикла к циклу).

Далее, для терминальных систем априори известно число Si шагов, выполняемых в цикле итерации, т. е. размещаемых в интервале между дискретными моментами времени I и I +1 (поэтому условие (4) здесь должно соблюдаться для числа £., а

не для минимально возможного числа £ = [*Щ ]*).

Кроме того, задачи терминального управления в исходной постановке чаще всего оказываются статистическими, и поэтому здесь с увеличением номера итерации среднеквадратическое значение

стЩ возмущений у^и), п = 1, 2, ..., N должно приближаться не к нулю, а к условному среднеквадратическому значению ошибки оптимального оценивания координаты Vп вектора V.

Соответствующие уточнения в алгоритме очевидны.

И наконец, в зависимости от размерности решаемых задач алгоритм перестраивается посредством формирования матриц © и Л из множества возможных матриц Адамара. ■

Пример. Ограничимся представлением примера матриц © и Л, сформированных в соответствии с работой [4], для использования при оптимизации Ж-мерного вектора параметров маршрута полета применительно к случаю N = 64.

Матрица ©

+1 +1 +1 1 + +1 +1 1 + +1

1 + +1 -1 -1 -1 1 + -1 +1

1 + 1 + -1 +1 +1 -1 -1 -1

+1 -1 -1 1 + -1 1 + +1 -1

+1 +1 1 + -1 -1 -1 1 + -1

1 + -1 +1 1 + -1 -1 1 1 +1

+1 -1 -1 -1 +1 -1 +1 +1

+1 -1 +1 -1 +1 +1 -1 -1

Матрица Л + 1 +1 +1 +1 +1 +1 +1 +1

+ 1 _1 +1 _1 +1 _1 +1 _1

+ 1 +1 _1 _1 +1 +1 _1 _1

+ 1 _1 _1 +1 +1 _1 _1 +1

+ 1 +1 +1 +1 -1 -1 -1 -1

+ 1 _1 +1 _1 _1 +1 _1 +1

+ 1 +1 _1 _1 _1 _1 +1 +1

+ 1 _1 _1 +1 _1 +1 +1 _1

ЗАКЛЮЧЕНИЕ

Предложена процедура оценивания вектора высокой размерности, объединяющая ранее разработанный корреляционный метод поиска глобального экстремума в пространстве возмущений с методом формирования максимально различимых между собой вариантов вектора возмущений. При остром дефиците времени решения задачи предложенная процедура приводит к алгоритму выбора наилучшего из просмотренных вариантов оцениваемого вектора, а при увеличении располагаемого времени решения она трансформируется в алгоритм корреляционного поиска наилучшего из всех возможных вариантов оценки.

ЛИТЕРАТУРА

1. Андриенко А.Я., Тропова Е.И., Чадаев А.И. Методы анализа результатов летных испытаний бортовых систем управления // Автоматика и телемеханика. — 2010. — № 5. — С. 155—165 .

2. Maroon G.N., Duongh N.G., Maschec T.J. Tactical flight management — total mission capability // Proc. IEEE Nat. Aerosp. and Electron Cong., NAECON, 1984. — Dayton, Ohio. N.-Y., 1984. — P. 496—502.

3. Андриенко А.Я. Метод оценивания вектора возмущений в задаче прогнозирования конечного состояния терминальной системы управления // Автоматика и телемеханика. — 1996. — № 3. — С. 71—82.

4. Левенштейн В.И. Применение матриц Адамара к одной задаче кодирования // Проблемы кибернетики. — 1961. — Вып. 5. — С. 22—29.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Бортовые терминальные системы управления / Б.Н. Петров и др. — М.: Машиностроение, 1983. — 200 с.

Статья представлена к публикации членом редколлегии

Б.В. Павловым.

Андриенко Анатолий Яковлевич — д-р техн. наук,

зав. лабораторией,

Тропова Елена Ивановна — науч. сотрудник,

Институт проблем управления им. В.А. Трапезникова РАН,

г. Москва, S (495) 334-88-71, И vlaguc@ipu.rssi.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.