Научная статья на тему 'Дуальное управление экстремальными объектами в условиях неопределенности'

Дуальное управление экстремальными объектами в условиях неопределенности Текст научной статьи по специальности «Математика»

CC BY
177
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИНИМАКСНО-ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ / СТАТИЧЕСКИЙ ЭКСТРЕМАЛЬНЫЙ ОБЪЕКТ / ПАРАМЕТРИЧЕСКАЯ НЕОПРЕДЕЛЕННОСТЬ / ДУАЛЬНОЕ УПРАВЛЕНИЕ / MIN-ТАХ CONTROL / STATIC EXTREMAL SYSTEM / PARAMETRIC UNCERTAINTY / DUAL CONTROL

Аннотация научной статьи по математике, автор научной работы — Алексеева Елена Юрьевна, Беседин Александр Александрович

Рассматривается задача минимаксно-оптимального управления статическим экстремальным объектом в условиях параметрической неопределенности. Целью управления с обратной связью является минимизация максимального суммарного отклонения от экстремума. Строится приближенное решение задачи на основе оценки функционала. Обсуждается связь предлагаемого алгоритма с дуальным управлением. Выполнено имитационное моделирование алгоритма управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Dual control by extremal system in condition of uncertainty

The task of min-max control by static extremal system in condition of parametric uncertainty is considered. Feedback control performance criteria is minimization of maximal additive difference between output value and extremum value. Approximated solution based on estimate performance criteria is desined. Relationship between solution and dual control are discussed. Algoritm simulation is done.

Текст научной работы на тему «Дуальное управление экстремальными объектами в условиях неопределенности»

УДК 681.513.685

ДУАЛЬНОЕ УПРАВЛЕНИЕ ЭКСТРЕМАЛЬНЫМИ ОБЪЕКТАМИ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Е.Ю. Алексеева, А.А. Беседин

DUAL CONTROL BY EXTREMAL SYSTEM IN CONDITION OF UNCERTAINTY

E.Y. Alekseeva, A.A. Besedin

Рассматривается задача минимаксно-оптимального управления статическим экстремальным объектом в условиях параметрической неопределенности. Целью управления с обратной связью является минимизация максимального суммарного отклонения от экстремума. Строится приближенное решение задачи на основе оценки функционала. Обсуждается связь предлагаемого алгоритма с дуальным управлением. Выполнено имитационное моделирование алгоритма управления.

Ключевые слова: минимаксно-оптимальное управление, статический экстремальный объект, параметрическая неопределенность, дуальное управление.

The task of min-max control by static extremal system in condition of parametric uncertainty is considered. Feedback control performance criteria is minimization of maximal additive difference between output value and extremum value. Approximated solution based on estimate performance criteria is desined. Relationship between solution and dual control are discussed. Algoritm simulation is done.

Keywords: min-max control, static extremal system, parametric uncertainty, dual control

Введение

В работе [1] построено асимптотически оптимальное дуальное управление экстремальными объектами в условиях вероятностной определенности - распределения вероятностей всех неопределенных факторов задачи считались известными. В данной работе эти допущения снимаются, строится дуальное управление экстремальным объектом в предположении, что все неопределенные факторы принадлежат заданным информационным множествам.

1. Постановка задачи

В качестве цели управления в условиях вероятностной определенности принимается оптимизация среднего значения некоторого функционала качества. В случае же отсутствия распределений целью управления обычно является минимизация максимально возможного ущерба по всем точкам информационного множества - гарантированное управление.

Как и в [1], считаем, модель объекта имеет вид

Х, = ч>\ида, 7,^ + в,, (1)

где Х1 - выход объекта; щ - управляющее воздей-

Алексеева Елена Юрьевна - кацд. хим. наук, доцент кафедры прикладной математики ЮУрГУ; lobova@pnma.susu.ac.ru

Беседин Александр Александрович - канд. техн. наук, доцент кафедры прикладной математики ЮУрГУ, besedin@prima.susu.ac.ru

ствие; ф(м;) - вектор базисных функций; а - вектор неизвестных коэффициентов объекта, а принадлежит множеству А0 - априорному информационному множеству; У, - результат измерения выхода Хг объекта; 8, - ошибка измерения, |в,| <= А, А - заданная предельная ошибка измерения.

Неформальной целью управления является поддержание состояния X, возможно ближе к точке экстремума. Пусть для определенности экстремум -минимум. Предполагается, что существует и* на множестве U допустимых управлений, для которой Х(и )<=Х(и) для всех и из U. Тогда в качестве критерия оптимальности управления можно принять минимизацию максимально возможной суммы отклонений Х(ип) - Х(и) на всем интервале управления 1 <= п <= N:

Q = mm max V {х(ип) - х{и )) . (2)

Оптимальное управление отыскивается в классе функций с обратной связью ип = ип(у}, у2,..., уп_i) . Управление должно использовать всю информацию, полученную к моменту его выбора. Очевидно, что гарантированное значение функционала (2) определяется априорным множеством Aq .

Alekseeva Elena Yurievna - PhD, associate professor of Applied mathematics department of SUSU; lobova@pnma.susu.ac.ru

Besedin Aleksandr Aleksandrovich - PhD, associate professor of Applied mathematics department of SUSU; besedin@pnma.susu.ac.ru

Дуальное управление экстремальными объектами в условиях неопределенности____________________

Для определенности рассмотрим объект второго порядка

х(и) = ахи2 + а2и + а3, где а = (а1,а2>а3)еЛ0.

Очевидно, что функционал (2) можно записать в виде

N

Q= min max ^аг(ип-и)2, и = -а2/2/аг.

щ,и2,...,ицЯ,ги...,ъИ П=1

Константу ах также можно опустить, так как она

не повлияет на значение оптимального управления. Таким образом, критерием оптимальности управления будем считать

N

Q= min max £(и„-и*)2. (3)

щ,и2,...,иИа,еъ...,£И n=1

Считаем, что множество Aq выпуклое, ограниченное и замкнутое, при этом множество значе-

* * * ____________________________*

ний и представляет отрезок и <и <и .

2. Оценивание параметров

По мере поступления наблюдений yl9y2,..., уп_х информационное множество для параметров а может сужаться, и, очевидно, оптимальная стратегия управления должна в пределе точно определять положение экстремума и . Первой задачей, которую необходимо решать в процессе управления является задача уточнения информационного множества Ап - множества возможных (допустимых) значений вектора а после получения измере-НИЙ Ух,У2,--;У„-\-

Ап строится как пересечение Ап_г и множества решений неравенства

уп - А<аги2 +а2и + аъ <yn + А.

Этой задаче посвящена обширная литература, и мы считаем, что для ее решения использован один из предлагаемых алгоритмов [2].

3. Приближенное решение

Пусть N= 1 (одношаговая задача). Тогда оптимальное управление щ определяется из условия

mm тах{щ -и)2= min тах(щ -и)2, (4)

Щ а Щ и*

где и <и <й*.

Решение этой задачи очевидно. При зафиксированном их максимум по и достигается на концах интервала [и , w * ], в точке наиболее удаленной от щ .Значение функционала (4) будет минимальным по щ, если максимальное расстояние щ

от точек и\й* будет наименьшим. Этому условию удовлетворяет средняя точка ис :

(и -й*)

и. =-=■—-----

Для любой точки, отличной от ис, максимальное расстояние до концов будет более поло-

г * —

вины интервала [и ,и ] и тем самым значение функционала увеличивается (по сравнению с ис).

Гарантированное значение функционала в одношаговой задаче:

Q = (uc-uY =(мс-м*)2 =

/ * —* \2 (и -и )

(5)

Рассмотрим случай N=2 (двухшаговая задача). Зафиксируем некоторое управление щ, тогда

б = пиптах(((**! -и )2 +{и2-и )2). (6)

"2 и

Точное решение задачи (6), видимо, невозможно. Получим приближенное решение (6), построив гарантированную оценку сверху для второго слагаемого (6).

Управление и2 должно выбираться после поступления измерения уг.

При этом неизвестные параметры модели удовлетворяют неравенству:

ух - А < + а2их +а3 < у} + А.

Отсюда имеем у.-А-а,

^ и, т

<4

(7)

си у. + А-а,

-<М] --------3-

у.-А-а, а,

—--------— и, < — <

у} н-Д-а,

а,и, а, и,

Учитывая, что и = -а2 121 ах, получим, что

а\и\

Соответственно, второе слагаемое в (6) будет не более:

(8)

(и2 -и)2<

4а^их

<1-

а

где а =----—, ал выбирается из информационного

4

множества Аг.

С учетом оценки (8) щ определяется условием

Щ = ^тт(тах((^1 - и )2,(ц - и )2) + —). (9)

»1 щ

Численное решение этой задачи достаточно просто. Из выражения (9) видно, что влияние будущего (второе слагаемое в (6)) приводит к отклонению оптимального значения щ от середины

отрезка [«*,«*], так как второе слагаемое уменьшается с увеличением щ. Увеличение щ уменьшает длину интервала неопределенности положения экстремума. В этом заключается дуальный эффект управляющего воздействия. Для сравнения, в [1] управляющее воздействие выбиралось из условия минимума суммы оценки текущего от-

Серия «Компьютерные технологии, управление, радиоэлектроника», выпуск 11

27

Е.Ю. Алексеева, А.А. Беседин

клонения от экстремума и взвешенной неопределенности положения экстремума, вычисляемой по матрице ковариаций параметров объекта.

Для решения задачи при произвольном числе шагов процесса управления используем подход, примененный в [1] - метод замкнуто-разомкнутого управления. Считаем, что после получения ух система размыкается и дальнейшие измерения не поступают в устройство управления. В этом случае выбор всех последующих управлений повторяет (8), и все слагаемые в функционале

м

0(щ ) = пип тах((щ - и )2 + ^ (ик - и )2 )

и2,Щ,...,ин и* к=2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(кроме первого) оцениваются согласно (8). Вместо (9) мы получим алгоритм выбора их:

Щ = а^тш(тах((к1 -м*)2) +

«1

Из (10) следует, что вес добавки на изучение объекта растет при увеличении длительности интервала управления, что соответствует здравому смыслу и результатам [1].

Принятая оценка будущего значения функционала, очевидно завышена, так как с учетом дополнительных измерений положение экстремума будет известно точнее, чем предполагается.

Численное моделирование предложенных алгоритмов управления подтвердило теоретические положения.

Заключение

Изложенный выше подход применим к другим типам задач адаптивного управления. Причем здесь более прозрачно, чем в стохастически определенном случае, виден смысл понятия дуального управления(впервые введенного А.А. Фельдбау-мом [3]). Изучающая сторона дуальности управляющего воздействия заключается в оптимальном (в смысле конечного результата) уменьшении информационного множества - множества неопределенности параметров адаптации.

Литература

1. Беседин, А.А. Субоптималъный алгоритм оптимизации статического объекта в условиях помех / А.А. Беседин, В.А. Цыганков // Известия Академии наук СССР Техническая кибернетика. — 1975. -№ 5. -С. 59-64.

2. Ширяев, В.И. Синтез управления линейными системами при неполной информации / В. И. Ширяев // Изв. РАН. Техническая кибернетика. -1994. -№ 3.- С. 229-237

3. Фелъдбаум, А.А. Основы теории оптимальных автоматических систем / А.А. Фелъдбаум. -М.. Наука, 1966.

Поступила в редакцию 26 апреля 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.