Научная статья на тему 'К методам оптимального управления динамическим объектом при его сближении с подвижной целью'

К методам оптимального управления динамическим объектом при его сближении с подвижной целью Текст научной статьи по специальности «Математика»

CC BY
109
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНЫЕ СИСТЕМЫ / СБЛИЖЕНИЕ ОБЪЕКТОВ ПОДВИЖНАЯ ЦЕЛЬ НЕОПРЕДЕЛЕННОСТЬ ПРОГРАММНЫЕ / ПОЗИЦИОННЫЕ РЕШЕНИЯ / APPROACH OF OBJECT / MOBILE AIM / UNCERTAINTY / OPEN-LOOP / POSITIONAL SOLUTIONS

Аннотация научной статьи по математике, автор научной работы — Габасов Рафаил, Дмитрук Наталия Михайловна, Кириллова Фаина Михайловна

Исследуется задача оптимального управления при сближении динамического объекта в условиях неопределенности с подвижной целью. Рассматриваются разные типы априорной и текущей информации о поведении систем и действующих на них возмущений. Обоснованы принципы оптимального управления в реальном времени с помощью оптимальных эстиматоров и регулятора.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On optimal control methods to dynamical object at its approaching to a mobile aim

A linear optimal control problem at approaching the dynamical object under conditions of uncertainty with mobile aim is considered. Linear time-varying control system for which various type a priori and current information on system behaviour and disturbances influenced are investigated. Determinate and not completely determinate systems, maneuvering nonmaneuvering aims with motions being not completely determined are studied and principles of real-time control by optimal estimators and the controller are justified and tested by computer.

Текст научной работы на тему «К методам оптимального управления динамическим объектом при его сближении с подвижной целью»

Серия «Математика»

2011. Т. 4, № 2. С. 60-74

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 517.977

К методам оптимального управления динамическим объектом при его сближении с подвижной целью

Р. Габасов

Белорусский государственный университет

Н. М. Дмитрук

Институт математики, НАН Беларуси

Ф. М. Кириллова

Институт математики, НАН Беларуси

Аннотация. Исследуется задача оптимального управления при сближении динамического объекта в условиях неопределенности с подвижной целью. Рассматриваются разные типы априорной и текущей информации о поведении систем и действующих на них возмущений. Обоснованы принципы оптимального управления в реальном времени с помощью оптимальных эстиматоров и регулятора.

Ключевые слова: линейные системы, сближение объектов; подвижная цель; неопределенность; программные, позиционные решения.

В современных исследованиях задачи сближения (оптимального сближения) динамических объектов рассматриваются как часть дифференциальной игры [9] - [11]. В данной статье они трактуются как задачи оптимального управления в условиях неопределенности с подвижной целью и для их исследования используются методы теории оптимального управления динамическими системами с множественной неопределенностью [7]. Целью работы является развитие результатов авторов и их сотрудников, полученные в последние годы по оптимальному управлению в реальном времени, на новый круг задач - задач оптимального управления с подвижной целью. Первые результаты в этом направлении опубликованы в [8].

Введение

1. Постановка задачи

На промежутке времени Т = [Ь*, Ь*] рассмотрим линейную нестационарную систему управления

где х = х(Ь) € Кп — состояние системы управления в момент времени Ь; и = и(Ь) € и — значение управляющего воздействия; и = {и € Ет : и* < и < и* — ограниченное множество доступных значений управляющего воздействия; w = € Кк — неизвестное возмущение; А(Ь) € Епхп,

В(Ь) € Кпхг, М(Ь) € Кпхк, Ь € Т, — кусочно-непрерывные матричные функции. Для управления объектом (1.1) используются дискретные управляющие воздействия с периодом квантования К: и(Ь) = и(в), Ь € [8, в + Н[, в € Ть, где Ть = {Ь*,Ь* + Н,... ,Ь* — Н}, Н = (Ь* — Ь*)/М, N — натуральное число.

Пусть целью управления объектом (1.1) является сближение с другим динамическим объектом (подвижной целью)

где X = Х(Ь) € Кп — состояние цели в момент времени Ь; V = у(Ь) € Кг

— значение маневрирующего усилия; А(Ь) € Кпхп, В(Ь) € Епхт, М(Ь) € Кпхк, Ь € Т, — кусочно-непрерывные матричные функции; возмущение •ш(Ь) € Кк в (1.2) совпадает с возмущениями (1.1), что не ограничивает общности постановки задачи и сделано для упрощения выкладок. Пусть возмущение w(■) = ('ш(Ь),Ь € Т) представляет ограниченную кусочнонепрерывную функцию. Будем считать, что возмущения могут быть одним из трех типов: 1) регулярные возмущения: w(t) = В(Ь)ш, Ь € Т, ш € О, где О(Ь) € Екх1, Ь € Т, — кусочно-непрерывная матричная функция, ш € К1 — вектор неизвестных параметров, О = {ш € К1 : ш* < ш < ш*} — множество возможных значений параметров; 2) нерегулярные возмущения: w(t) € Ш = ^ € Кк : w* < w < w*}, Ь € Т, где w(t), Ь € Т, — кусочно-непрерывная функция; 3) возмущения смешанного типа w(t) = Б(Ь)ш + Wo(t), Ь € Т, где ш € О — вектор неизвестных параметров, Wo(t) € Ш, Ь € Т, — неизвестная кусочно-непрерывная функция.

Класс возмущений играет большую роль при выборе численных методов решения задач, которые возникают при оптимальном управлении объектом в реальном времени. Далее будут использоваться обозначения: Ш(■) — множество возмущений заданного типа 1), или 2), или 3); Шт(■) — сужение Ш(■) на промежуток Т(т) = [т, Ь*], Ь* < т < Ь*;

— сужение Ш(■) на промежуток [т,Ь], Ь* < т < Ь*. Если В(Ь) = 0, Ь € Т, то будем говорить о неманеврирующей цели, в противном случае цель — маневрирующая. Относительно маневрирующих усилий цели

х = А(і)х + Б(і)п + М(і)-ш, х(і*) = х0,

(1.1)

х = А(і)х + Б(і)у + М(і)'ш, х(і*) = х0,

(1.2)

будем считать, что они, как и возмущения, могут быть регулярными, нерегулярными и смешанными. Обозначим: V(■) — множество маневрирующих усилий выбранного типа 1), или 2), или 3); (■) —сужение V(■)

на промежуток Т(т) = [т,Ь*]; V\[т^t\(■) — сужение V(■) на промежуток [т,Ь], Ь* < т < Ь*. Пусть Бр(х) = {X € Кп : рд* < Н(х — X) < рд*}, -р—окрестность точки х,Н € Ктхп, д*,д* € Кт — заданные матрица и векторы, д* < 0 < д*.

Мерой близости объекта (1.1) и цели (1.2) назовем минимальное р, при котором любое возможное терминальное состояние цели х(Ь*) накрывается р-окрестностью Бр(х(Ь*)) терминального состояния объекта: х(Ь*) € Бр(х(Ь*)). Задача оптимального сближения состоит в построении управляющих воздействий и(Ь), Ь € Т, при которых мера близости объекта и цели минимальна.

В данной работе будут рассмотрены следующие ситуации: 1) оптимальное сближение с неманеврирующей целью с использованием детерминированных моделей; 2) оптимальное сближение с маневрирующей целью с использованием детерминированных моделей; 3) оптимальное сближение с неманеврирующей целью с не вполне определенным движением; 4) оптимальное сближение по недетерминированным моделям.

2. Оптимальное сближение с использованием детерминированных моделей

Рассмотрим задачу оптимального сближения объекта (1.1) с неманеврирующей целью (1.2). Пусть при любом т € Т^ процесса управления доступны точные измерения состояний объекта х(т) и цели х(т). Задача оптимального сближения имеет вид

р ^ шш, х = А(Ь)х + В(Ь)и, х(Ь*) = х0,

х = А(Ь)х, х(Ь*) = х0, (2.1)

х(Ь*) € Бр(х(Ь*)), и(Ь) € и,Ь € Т.

Определение 1. Доступную управляющую функцию и(Ь) € и, Ь € Т, назовем программой с мерой близости р(и) = шш р, х(Ь*) € Бр(х(Ь*)).

Программа и0(Ь),Ь € Т, и соответствующая ей траектория х0(Ь),Ь € Т, называются оптимальными, если р(и0) = шшр(и). Оптимальная

программа - программное решение задачи (2.1)

Оптимальная программа получается из решения задачи:

р ^ шш, х = А(Ь)х + В(Ь)и, х(Ь*) = х0, (2.2)

рд* + Hx(t*) < Hx(t*) < рд* + Hx(t*), u(t) € U,t € T.

где терминальное состояние X(t*) известно.

В [1] разработан двойственный метод построения оптимальных программ в детерминированных задачах оптимального управления линейными системами. С помощью модификаций он может быть использован и для построения программного решения задачи (2.2).

Для определения позиционного решения задачи оптимального сближения (2.1) погрузим ее в семейство

р ^ min, X = A(t)x + B(t)u, х(т) = z, (2.3)

X = A(t)x, x(t ) = z,

x(t*) € Sp(x(t*)), u(t) € U,t € T(t) = [T,t*],

зависящее от момента времени т € Th и векторов z,z € Rn. Тройка (t, z, z) составляет позицию процесса сближения. Программное решение и°Щт, z, z), t € T(t), задачи (2.3) для позиции (t,z,z) назовем оптимальной текущей программой. Отметим, что в задаче (2.3) оптимальная текущая программа всегда существует.

Оптимальной связью в классическом смысле (позиционным решением классической задачи оптимального сближения) назовем функцию

u0(t,z,z)= u0(tIt,z,z), z € Rn,z € Rn,T € Th. (2.4)

Позиционное решение (2.4) определено по детерминированной математической модели (2.1), но предназначено для решения задачи оптимального сближения объекта (1.1) с целью (1.2). Замкнем объект управления оптимальной связью (2.4) и запишем поведение замкнутой системы

x = A(t)x + B(t)u0(t, x, x) + M(t)w(t), x(t*) = xo, x = A(t)x + M(t)w(t), x(t*) = x0,

где u0(t, x(t),x(t)) = u0(t, x(t),x(t)), t € [t,t + h[, т € Th; w(t), t € T,

— неизвестное возмущение. Пусть в конкретном процессе сближения реализуется возмущение w*(t),t € T. Оно породит траектории x*(t),x*(t), t € T, удовлетворяющие тождествам

x *(t) = A(t)x*(t) + B(t)u*(t) + M (t)w*(t), x*(t) = A(t)x*(t) + M(t)w*(t),t € T,

где

u*(t) = u0(t, x*(t), x*(t)) = u0(tIt, x*(t),x*(t)),t € [t,t + h[, т € Th.

Определение 2. Управляющие воздействия и*(Ь),Ь € Т, называются реализацией оптимальной связи (2.4) в конкретном процессе сближения. Функция р*(т) = р(и0(^\т,х*(т),х*(т))), т € Т^, описывает изменение меры сближения в процессе управления, р*(Ь*) — достигнутая в этом процессе мера сближения объекта (1.1) с целью (1.2).

При оптимальном управлении по описанному классическому принципу замкнутого контура управляющие воздействия и*(Ь),Ь € Т, получаются с помощью заранее сконструированной связи (2.4). При таком способе управления для задач оптимального сближения даже с неподвижной целью трудно построить решение в явном виде. Поэтому будем использовать современный принцип оптимального управления в реальном времени, когда оптимальная связь (2.4) не строится заранее, но в каждом конкретном процессе управления текущие значения и*(т), т € Т^, ее реализации для текущего момента т € Т^ вычисляются за время, не превосходящее Н (период квантования). Устройство, способное выполнять эту работу, называется оптимальным регулятором.

Работа оптимального регулятора происходит следующим образом. До начала процесса управления регулятор находит программное решение задачи (2.1) (оптимальную программу для начальной позиции (Ь*,х0,х0)). Вычисленную оптимальную программу и0(Ь\Ь*,х0,х0), Ь € Т, он использует для управления физическим объектом на промежутке времени [Ь*,Ь* + Н[: и*(Ь) = и*(Ь*) = и0(Ь*\Ь*, хо, хо), Ь € [Ь*,Ь* + Н[. Пусть регулятор проработал до момента т. В текущий момент времени т € Т^ \ Ь* оптимальный регулятор решает задачу (2.3) для текущей позиции (т, х*(т),х*(т)). Эта задача снова может быть сведена к задаче оптимального сближения с неподвижной целью

р ^ шт, х = А(Ь)х + В(Ь)и, х(т)= х*(т), (2.5)

рд* + Нх(Ь*) < Нх(Ь*) < рд* + Нх(Ь*), и(Ь) € и,Ь € Т(т).

При этом в качестве начального приближения для оптимальной текущей программы и0(Ь\т,х*(т),х*(т)), Ь € Т(т), регулятор использует оптимальную программу и0(Ь\т — Н,х*(т — Н),х*(т — Н), Ь € Т(т — Н), построенную на предыдущем интервале [т — Н,т[, корректируя с помощью двойственного метода [1] сопровождающие эту программу элементы так, чтобы необходимая для вычисления текущего значения и*(т) реализация оптимальной связи осуществлялась за время в(т) < Н.

На промежутке Т оптимальный регулятор подает на вход объекта управления воздействие

и**(Ь) = и*(т) = и°(т\т,х*(т ),х*(т)), (2.6)

Ь € [т + в(т),т + Н + в(т + Н)[, т € Ть_, (в(Ь*) = в(Ь*) = 0).

которое отличается от реализации и*(Ь), Ь € Т, в силу временных затрат на вычисление управляющих сигналов и*(т).

Определение 3. Функция (2.6) называется реализацией оптимальной связи при управлении в режиме реального времени (квазиреализацией оптимальной связи (2.4)).

3. Оптимальное сближение с маневрирующей целью

Рассмотрим задачу сближения объекта (1.1) с маневрирующей целью (1.2), маневрирующие усилия которой ь(Ь), Ь € Т, остаются неизвестными для управляющего органа объекта (1.1). Пусть в процессе управления в каждый момент времени т € Т^ точно измеряются состояния х(т), х(т). Математическая модель задачи сближения с маневрирующей целью для детерминированных моделей объекта и цели имеет вид

р ^ шш,

х = А(Ь)х + В(Ь)и, х(Ь*) = х0, х = А(Ь)х + В(Ь)у, х(Ь*)= х0, (3.1) Xг С Бр(х(Ь*)), <) € V(■), и(Ь) € и,Ь € Т,

где X? = XI* (Ь*,хо) = {х € Яп : х = х(Ь*\Ь*,хо,у),у(■) € V(■)}, х(Ь*\Ь*,хо,у)— терминальное состояние цели под действием маневрирующих усилий ь(^).

Понятия оптимальной программы и0(Ь),Ь € Т, оптимальной траектории х0(Ь) € Т, вводятся стандартно (см. задачу (2.2)) В задаче (3.1) из-за неопределенности, представленной маневрирующими усилиями ь(Ь), Ь € Т, можно по аналогии с [7] исследовать разные типы оптимальных связей. Ограничимся оптимальной размыкаемой связью (по состоянию и по выходу).

Пусть С(Ь),С(Ь) € Етхп, Ь € Т, — решения сопряженных систем

С = —СА(Ь),С(Ь*) = Н, 6 = —СА(Ь), С(Ь*) = Н.

Введем обозначения

К(Ь) = С(Ь)В(Ь),К(Ь) = —С(Ь)В(Ь),Ь € Т.

которые используются ниже.

Оптимальная размыкаемая связь. Рассмотрим семейство задач

р ^ шш, (3.2)

х = А(Ь)х + В(Ь)и, х(т) = г, х = А(Ь)х + В(Ь)у, х(т) = г, Х1* (т,г) С Бр(х(Ь*)), и(Ь) € и, Ь € Т(т), у(^) € V-(■),

зависящее от момента времени т € Т^ и векторов г, г € Кп.

Пусть и0(Ь\т, г, г), Ь € Т(т), — оптимальная текущая программа для позиции (т,г,х) в задаче (3.2).

Определение 4. Функция

и0(т, г, ~) = и0(т\т, г, г), г € Еп, ~ € Еп, т € ТЬ, называется оптимальной размыкаемой (дискретной) связью .

Аналогично п.1 вводятся понятия реализации оптимальной размыкаемой связи

и*(Ь) = и0(т, х*(т), х*(т)) = и0(т\т, х*(т),х*(т)),Ь € [т,т + Н[, т € ТЬ,

квазиреализации оптимальной размыкаемой связи и оптимального регулятора. Работа оптимального регулятора основана на построении в реальном времени решения задачи (3.2) для текущей позиции задачи (т,х*(т), х*(т)).Чтобы построить программное решения задачи (3.2) достаточно свести ее к эквивалентной детерминированной задаче:

р ^ шш, х = А(Ь)х + В(Ь)и, х(т) = г, х = А(Ь)х, х(т)= ~, (3.3) х(Ь*) € Бр(х(Ь*)\т), и(Ь) € и, Ь € Т(т), где Бр(х(Ь*)\т) = {х € Еп : рд* — ^*(т) < Н(х(Ь*) — х) < рд* — 7*(т)}, Ъ(т) = (1*г(т ),г = 1,ш), 1*(т) = Ы(т ),г = 1,ш),

[** ~ / [** ~/

7*г(т) = ~(s)v(s)ds, (т) = кг(s)v(s)ds,

г = 1,ш. к/(Ь) — г-я строка матрицы К(Ь), решение которой рассмотрено в п.1

При построении позиционного решения задачи оптимального сближения (3.1) в условиях неопределенности (неизвестны маневрирующие усилия) наряду с состояниями объекта управления х(т) и цели х(т) удобно использовать ш-вектор ф(т) = (фг(т),г = 1,ш): ф(т) = ф(т,х(т), х(т)) = С(т)х(т) — С(т)х(т), т € Т^, который назовем состоянием задачи сближения в момент т.

Как видно, ф(т) представляет результат линейного преобразования состояний объекта х( ), цели х( ) и в компактной форме содержит информацию, достаточную для построения решения задачи. Будем считать, что в процессе управления для каждого т € Т^ доступно точное значение состояния задачи ф*(т) в момент т. Оно может получаться как в результате преобразования известных значений х*(т) и х*(т), так и с помощью специального измерительного устройства вида ф = С(Ь)х — С(Ь)х. В терминах состояния задачи ф семейство (3.3) можно записать в виде

р ^ шш, ф = К(Ь)и, ф(т) = (, ф(Ь*) € Фр(т), и(Ь) € и, Ь € Т, (3.4)

где ( — произвольный m-вектор, Ф*р(т) = {ф € Rm : pg* — Y*(T) < Ф < pg* — 7*(т)}.

Пусть u0(t|т, (), t € T(т), — оптимальная программа задачи (3.4) для позиции (т,(); р0(т,() = p(u0(~lт,()). Оптимальная размыкаемая связь и ее реализация также могут быть определены в терминах состояния задачи.

Замечание 1. Особенность оптимальной размыкаемой обратной связи состоит в том, что при ее определении не используется априорная информация о замыкании системы в будущие моменты времени. Это обстоятельство не влияет на оптимальную класическую связь, которая определяется по детерминированной модели, но существенно при использовании моделей, содержащих неопределенности (в данном случае - неизвестное маневрирующее усилие цели) [7, 2].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Использование недетерминированных моделей при оптимальном сближении объекта с маневрирующей целью. Рассмотренные выше конструкции построения оптимальных программ и реализаций оптимальных связей в задачах сближения с маневрирующей целью можно обобщить на случай недетерминированных моделей. Математическая модель задачи принимает вид

p ^ min,

x = A(t)x + B(t)u + M(t)w, x(t*) = x0, x = A(t)x + B(t)v + M(t)w,

x(t*) = xo,

Xt* С Qp(Xt* (u)), u(t) € U,t € T, v(-) € V (-),w(-) € W (■),

где Xt* = {x € Rn : x = x(t*lt*,x0,v,w),v(-) € V(-),w(-) € W(■)}, Xt*(u) = {x € Rn : x = x(t*lt*,x0,u,w),w(-) € W (■)}, Qp(Xt* (u)) =

П Sp(x).

x£Xt* (u)

Изменения, которые необходимо внести в предложенные выше конструкции , связаны с учетом возмущения w(-) € W(■), при этом терминальное множество Sp(x(t*)lт) заменяется на

Sp(x(t*)lт) = {x € Rm : pg* — ъ(т) — ш*(т) < H(x(t*) — x) < pg* — y*(т) —

—^*(т)},

где Ш*(т) = (и*г(т),1 = 1,m), Ш*(т) = (ш*(т),{ = 1,m),

ft* ; ft* '

и*г(т)= ..min / li(s)w(s)ds, ш*(т)= max / ^(s)w(s)ds,

w()£.WT(•) Jr w(^)^WT(•) Jr

i = 1,m, li(t) — i-я строка матрицы L(t) = G(t)M(t) — G(t)M(t).

4. Оптимальное сближение с неманеврирующей целью е не вполне определенным движением.

Пусть требуется провести оптимальное сближение объекта (1.1), текущее состояние которого х*(т) в каждый момент времени т € Ть известно, с неманеврирующей целью (1.2), начальное состояние которой хо неизвестно и в моменты времени т € Ть состояния цели х(т) измеряются неполно и неточно (несовершенные измерения состояний цели).

В этом случае вместо состояния цели оптимальный регулятор объекта для вырабоки управляющих воздействий использует: 1) априорно известное множество Хо, ограничивающее возможные начальные состояния цели, т.е. х(Ь*) = х0 € Х0, и 2) сигналы у *^), s € Ть, измерительного устройства у^) = С^)х^) + £^), где С(Ь) € Я^хп, Ь € Т,

— непрерывная матричная функция; £ ^), ,в € Ть, — ошибки измерения со значениями из ограниченного множества 2 = {£ € Яд : £ * < £ < £ *}.

Цель, обладающая описанными выше свойствами, называется неманеврирующей целью с не вполне определенным движением. При построении оптимальных связей вместо текущего состояния цели х*(т) используются их текущие распределения X*(т) = Хт(у*( )) (Ф*(т) = Фт(х*(т),{/**(■))), построенные по известному к моменту т сигналу у**() = (у*^)^ € Тн(т)), где Тн(т) = Тн П[Ь*,т].

Пусть ут(■) — некоторый возможный сигнал измерительного устройства к моменту т, Ут(■) — множество всех таких сигналов ут(■); у**() € Ут(■). Множество X0(yт(■)) назовем апостериорным распределением начального состояния цели, соответствующим сигналу ут(■), если оно состоит только из состояний хо € Xо, для которых найдутся ошибки измерения £ ^) € 2, ,в € Ть(т), способные к моменту т породить сигнал ут(). ~

Апостериорному распределению начального состояния X0(yт(■)) со-ответсвуют распределения Xт(ут(■)) текущего состояния цели, которое называется текущим распределением, и X** (ут(■)) - терминального состояния цели. При этом Xs(yт(■)) = Р(s)X0(yт(■)), s € ТЬ, где Р(Ь) €

Кпхп, Ь € Т, — фундаментальная матрица решений системы (1.2): Р = А(Ь)Р, Р(Ь*) = Е, Е — единичная матрица. Текущее распределение состояния задачи определяются по формуле: Фт(х(т),ут(■)) = С(т)х(т) — аШт (ут (■)).

Как и в п.2,3, для определения размыкаемой связи в рассматриваемой задаче сближения используем оптимальную текущую программу и0(Ь\т, г, у т(■)), Ь € Т(т), — программное решение задачи

ш1пшах р, (4.1)

и х(т)

х = А(Ь)х + В(Ь)и, х(т) = г, х = А(Ь)х, х(т) € Xт(ут(■)),

Xt* (Ут(■)) С Sp(x(t*)), u(t) € U, t € T(т). Определение 5. Функция

u (т, Z, Ут (■)) = u0(т 1т, z, Ут (■)), z € Кп,Ут (■) € Yt (■),т € Th,

называется оптимальной размыкаемой (дискретной) связью (по выходу).

В терминах состояния задачи (4.1) имеем

minmaxp, ф = K(t)u, ф(т) € Фт(z,yT(■)), pg* < ф(t*) < pg*, (4.2)

u ф(т)

u(t) € U,t € T(т).

Следуя [4], можно показать, что управление объектом (1.1) в режиме реального времени можно осуществить с помощью оптимальных эсти-маторов и оптимального регулятора. Оптимальные эстиматоры вычисляют оценки а*(Ут(■)) = (а^(Ут(■)), i = 1,m), а*(Ут(■)) = (а*(Ут(■)), i = 1,m), решая следующие задачи оптимального наблюдения:

ан(Ут(■)) = minh'ix, а*(Ут(■)) = maxh'ix,x € Xt*(Ут(■)), i = 1,m.

0 (4.3)

Оптимальный регулятор вычисляет u0(Цт^,Ут(■)), t € T(т), решая детерминированную задачу оптимального управления

p ^ min, x = A(t)x + B(t)u, x(т) = z, x(t*) € X*(ijT(■)), (4.4)

u(t) € U,t € T(т),

где X*p(ijT(■)) = {x € Rn : pg* — а*(Ут(■)) < hix < pg* — а*(Ут(■))}.

Задачи (4.3) называются сопровождающими задачами оптимального наблюдения, (4.4) — сопровождающая задача оптимального управления.

Теорема 1. Принцип разделимости. Для построения оптимальной текущей программы в позиции (т, z, Ут(■)) достаточно для сигналов Ут(■) решить 2m независимых сопровождающих задач оптимального наблюдения (4.3), по полученным оценкам а*(Ут(■)), а*(Ут(■)) и состоянию z

- решить сопровождающую задачу оптимального управления (4.4).

Отметим, что при оптимальном управлении в реальном времени сопровождающие задачи оптимального наблюдения (4.3) принимают вид

a*i = min hix(t*), (а* = max h'ix(t*)), (4.5)

ot = A(t)x, x(t*) = z, У*(s) — Cx(s) € E,s € Th(т); z € X0.

Методы решения таких задач исследованы в [5].

5. Оптимальное сближение по недетерминированным моделям при неполной информации о состояниях

Рассмотрим задачу оптимального сближения объекта (1.1) с маневрирующей целью (1.2) для недетерминированных моделей при неполной и неточной информации о состояниях объекта и цели. В этом случае в процессе управления информация о текущих состояниях содержится в априорных распределениях Xо и Xо, ограничивающих начальные состояния объекта и цели: х(Ь*) = х0 € X0, х(Ь*) = х0 € X0, и сигналах у* ^), у *^), s € ТЬ, измерительных устройств у^) = С ^)х^) + £^), у(,в) = С(.в)х(,в) + ~(,в), ,в € ТЬ, где С(Ь) € №хп, С(Ь) € Едхп, Ь €

Т, — непрерывные матричные функции; £^), £ ^), s € Ть, — ошибки измерения со значениями из ограниченных множеств 2 = {£ € Яд : £* <

£ < £*}; 2 = {£ € & : ~* < ~ < £*}.

Множество X0(uт( ),ут(■)) назовем апостериорным распределением начального состояния объекта, соответствующим заданному управляющему воздействию ит(■) = (и(Ь),Ь € [Ь*, т]) и сигналу ут(■), если оно состоит из тех и только тех состояний хо € Xо, для которых найдутся ошибки измерения £(,з) € 2, s € Т^(т), и возмущения w(■) € Щ^*^], которые вместе с ит(■) способны к моменту т породить сигнал ут(■). Соответствующее ему текущее распределение состояния объекта имеет вид Xт(ит(■),ут(■)) = {х € Еп : х = х(т\Ь*,х0,ит^),хо € X0(uт(■), ут (■)), w(■) € Щи,т]}.

Множество X0(yт(■)) назовем апостериорным распределением начального состояния цели, соответствующим сигналу ут(■), если оно состоит из тех и только тех состояний хо € Xо, для которых найдутся ошибки измерения £ ^) € 2, s € Т^(т), маневрирующие усилия у(^) € Уц*>т]() и возмущения w(■) € Ш^^т]0 которые способны к моменту т породить сигнал ут(■). Соответствующее ему текущее распределение цели имеет вид: Xт(ут(■)) = {х € Еп : х = х(т\Ь*,хо,у^),хо € X0(ут(■)),

"КО € У[ь*,т],'ш(^) € ь*,т]}.

При построении оптимальной размыкаемой связи в задаче оптимального сближения по неполным и неточным измерениям используется оптимальная текущая программа ио(Ь\т,ут( ),ут(■)), Ь € Т(т), задачи

шш шах р, (5.1)

и х(т),х(т),у(^)№^)

х = А(Ь)х + В(Ь)и + М(t)w, х(т) € Xт(ит(),ут(■)),

х = А(Ь)х + В(Ь)у + М(t)w, х(т) € Xт(ут(■)),

XI* (ут(■)) С (и(),ут(■))), и(Ь) € и, Ь € Т(т), <) € Ут(■),

w(■) € Wt(■).

Определение 6. Функция

У°(т,Ут (■ ),Ут (■)) = u° (т\т,Ут (■ ),Ут (■)), Ут (■) С Yt (■ ),У т (■) С Yt (■),т € T^

называется оптимальной размыкаемой (дискретной) связью (по выходу).

В терминах состояния задачи ф семейство задач (5.1) можно записать в виде

min max p, ф = K(t)u+K(t)v+L(t)w, ф(т) € Фт(uT( ■ ),Ут(■ ),Ут(■)),

u ф(т),'и(-),'ш(-)

pg* < ф(^) < pg*, u(t) € U, t € T(т), v(■) € Vt( ■ ), w(■) € Wt( ■ ).

Можно доказать, что следуя [4], управление объектом (1.1) в режиме реального времени осуществляется с помощью оптимальных эстимато-ров и оптимального регулятора.

Методы решения таких задач зависят от типов возмущений и маневрирующий усилия. Задачи оптимального наблюдения с регулярными возмущениями рассмотрены в работе [4]. Методы решения задач оптимального наблюдения при нерегулярных помехах изложены в [5, 6].

Пример 1. Пусть движения объекта и цели на промежутке [0,t*] описываются законами

mx\ = u\ + w, mx2 = u2 + 2w; m£\ + k\x\ = v\ + w, mx2 + k\x2 = v2 + 2w

\ui(t)\ < 1,\vi(t)\ < 1,t € T,i = 1, 2; \xi(t*) — xi(t*)\ < p,i = 1, 2,

и их состояния измеряются неполно и неточно.

Параметрам задачи присвоим значения: m = 1,m = 10; k\ = 1,k2 = 5; t* = 10. Будем считать, что начальные положения объекта и цели известны: xi(0) = 0, x2(0) = 0, xi(0) = 100, x2(0) = 0, а скорости реализуются в следующих промежутках: 0 < x 1(0) < 1, 0 < x2(0) < 1, —10 < x 1(0) < —5, 0 < x2(0) < 5. Измерения ij*(s), s € Th, поступающие от измерительного устройства: У]_^) = x1(s) + £1(s), у2(s) = x2(s) + (2(s), s € Th, \6(s)\ < 0.2, \£2(s)\ < 0.2, s € Th, возмущение выбирается из класса регулярных возмущений вида w(t) = w1 + w2 cos t, t € T, где \wj,\ < 0.1, i = 1, 2.

Допустим, что реальный процесс имеет характеристики объекта x1(0) = 0, x 1(0) = 0, x2(0) = 0, x2 = 0; и цели x1(0) = 100, x 1(0) = —8, x2(0) =0, x2 = 5; w* = —0.1, w** = 0; ошибки измерения: £*(s) = 0.2coss, C**(s) = 0.1sin2s, s € Th; £*(s) = 0.5sin4s, £**(s) = 0.1cos2s, s € Th.

На рисунке сплошная линия соответствует позиционному решению, пунктирная — программному (изображены фазовые портреты на плоскости Х1Х2 траекторий объекта и цели). Оптимальная программа и0(Ь), Ь € Т, и реализация оптимальной обратной связи и*(Ь), Ь € Т, представлены на рисунке 1б), значения меры сближения р*(т), т € Т^, рис. 1в). Большое начальное значение меры сближения р*(0) = 24.13448613, т € Тн, вызвано большой начальной неопределенностью. Достигнутая в терминальный момент мера сближения равна р*(Ь*) = 4.60011009.

0 2 4 6 8 10

ЕМ

02

46

Ь

С)

8 10

0 2 4 6 8 10

Ь)

а 0

20

15

10

Рис. 1.

Заключение

Задача оптимального управления динамическим объектом при его сближении с подвижной целью трактуется как задача оптимального управления в условиях неопределенности с подвижной целью и исследуется методами оптимального управления системами с множественной неопределенностью. Для линейных моделей управления в классе дискретных управляющих воздействий обоснованы принципы оптимального управления в реальном времени с помощью оптимальных эстиматоров и оптимального регулятора.

К МЕТОДАМ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ Список литературы

1. Балашевич Н. В. Численные методы программной и позиционной оптимизации линейных систем управления / Н. В. Балашевич, Р. Габасов, Ф. М. Кириллова // Журн. вычисл. и мат. физики. - 2000.- Т. 40, № 6. - С. 838-859.

2. Балашевич Н. В. Построение оптимальных обратных связей по математическим моделям с неопределенностью / Н. В. Балашевич, Р. Габасов, Ф. М. Кириллова // Журн. вычисл. и мат. физики. - 2004. - Т. 44, № 2. - С. 265-286.

3. Габасов Р. Оптимальное управление по препостериорным оценкам множественной неопределенности / Р. Габасов, Ф. М. Кириллова, Е. И. Поясок // Автоматика и телемеханика. - 2009. - № 8. - С. 70-83.

4. Габасов Р. Оптимальное управление многомерными системами по неточным измерениям их выходных сигналов / Р. Габасов, Н. М. Дмитрук, Ф. М. Кириллова // Тр. Ин-та математики и механики УрО РАН. - Екатеринбург, 2004. -Т. 10, №. 2. - С. 33-57.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Габасов Р. Оптимальное наблюдение за нестационарными динамическими системами / Р. Габасов, Н. М. Дмитрук, Ф. М. Кириллова // Изв. РАН. ТиСУ. - 2002. - № 2 - С. 35-46.

6. Габасов Р. Оптимальное наблюдение при постоянно действующих возмущениях / Р. Габасов, Н. М. Дмитрук, Ф. М. Кириллова // Тр. Ин-та математики и механики УрО РАН. - Екатеринбург, 2009 - Т. 15, № 4. - С. 52-68.

7. Габасов Р. Оптимальное управление в реальном времени / Р. Габасов, Ф. М. Кириллова, Е. И. Поясок // Изв. Иркут. гос. ун-та. Сер.: Математика. - 2009.-Т. 2, № 1. - С. 132-169.

8. Задачи оптимального управления с подвижной целью / Р. Габасов, Н. М. Дмитрук, Ф. М. Кириллова, Е. И. Поясок // Тр. Ин-та математики и механики УрО РАН. - Екатеринбург, 2009. - Т. 15, № 6. - С. 16-21.

9. Красовский Н. Н. Игровые задачи о встрече движений / Н. Н. Красовский. -М. : Наука, 1970. - 420 с.

10. Красовский Н. Н. Позиционные дифференциальные игры / Н. Н. Красовский, А. И. Субботин. - М. : Наука, 1974. - 455 с.

11. Красовский Н. Н. О дифференциальной игре на перехват / Н. Н. Красовский, А. Н. Котельникова. - Екатеринбург : УПИ, 2009. - 47 с.

R. Gabasov, N. M. Dmitruk, F. M. Kirillova On optimal control methods to dynamical object at its approaching to a mobile aim

Abstract. A linear optimal control problem at approaching the dynamical object under conditions of uncertainty with mobile aim is considered. Linear time-varying control system for which various type a priori and current information on system behaviour and disturbances influenced are investigated. Determinate and not completely determinate systems, maneuvering nonmaneuvering aims with motions being not completely determined are studied and principles of real-time control by optimal estimators and the controller are justified and tested by computer.

Keywords: approach of object, mobile aim, uncertainty, open-loop, positional solutions

Габасов Рафаил, доктор физико-математических, наук, профессор, Белорусский государственный университет, 220030, Беларусь, Минск, пр. Независимости, 4, тел.: (+37517)209-50-74 (kirill@nsys.by) Дмитрук Наталия Михайловна, кандидат физико-математических наук, старший научный сотрудник, Институт математики НАН Беларуси, 220072, Минск, ул. Сурганова, 11, тел.: (+37517) 284-27-92 (dmitruk@im.bas-net.by)

Кириллова Фаина Михайловна, доктор физико-математических наук, профессор, Институт математики НАН Беларуси, 220072, Минск, ул. Сурганова, 11, тел.: (+37517) 284-27-92 (kirill@nsys.by)

Gabasov Rafail, Doctor of Sciences in Physics and Mathematics, Professor, Belarussian State University, 220030, Minsk, Belarus, av. Nezavisimosti, 4, phone: (+375 17) 209-50-74 (kirill@nsys.by)

Dmitruk Nataliya Mikhailovna, Senior Research Worker, Institute of Mathematics of Belarussian Academy of Sciences, 220072, Minsk, Belarus, Sur-ganov str., 11, phone: (+375 17) 284-27-92 (dmitruk@im.bas-net.by) Kirillova Faina Mikhailovna, Doctor of Sciences in Physics and Mathematics, Professor, Institute of Mathematics of Belarussian Academy of Sciences, 220072, Minsk, Belarus, Surganov str., 11, phone: (+375 17) 28427-92 (kirill@nsys.by)

i Надоели баннеры? Вы всегда можете отключить рекламу.