Научная статья на тему 'Штрафные функции в задаче управления процессом наблюдения∗'

Штрафные функции в задаче управления процессом наблюдения∗ Текст научной статьи по специальности «Математика»

CC BY
285
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАБЛЮДАЕМОСТЬ / ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ / ШТРАФНЫЕ ФУНКЦИИ / НЕДИФФЕРЕНЦИРУЕМАЯ ОПТИМИЗАЦИЯ / УПРАВЛЕНИЕ / OBSERVABILITY / THE DIFFERENTIAL EQUATIONS / PENAL FUNCTIONS / NOT DIFFERENTIATED OPTIMIZATION / MANAGEMENT

Аннотация научной статьи по математике, автор научной работы — Карелин Владимир Витальевич

Проблеме учета ограничений в задачах математического программирования было уделено много внимания. Во многих случаях ее решали с помощью штрафных функций. В настоящее время идея точных штрафов хорошо разработана и широко используется. Подход, основанный на точномшт рафе, наиболее интересен и изящен, но он приводит к необходимости решать негладкую задачу оптимизации, даже если исходная задача является гладкой. Однако прогресс в области численных методов недифференцируемой безусловной оптимизации, достигнутый в последние годы, дает некоторую надежду, что эти трудности будут преодолены. Ранее теория точных штрафов была применена к исследованию одного класса задач управления, в которых управления были просто параметрами системы дифференциальных уравнений, описывающей поведение некоторого управляемого объекта. Статья посвящена проблеме оптимизации процесса наблюдения для динамических систем при случайных возмущениях. Система дифференциальных уравнений считается ограничениями. Показано, как можно их убрать, вводя соответствующую штрафную функцию. Получающийся новый функционал существенно негладкий, тем не менее обладает интересными дифференциальными свойствами, и современные методы недифференцируемой оптимизации позволяют решать указанные задачи численно. Библиогр. 2 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Penal functions in the problem of process supervision control

The problem of reducing a constrained mathematical programming problem to an unconstrained one has been given a great deal of attention. In most cases such a reduction is performed with the help of so-called penalty functions. At present the theory of penalization is well developed and widely used. The exact penalization approach is most interesting and elegant but it generally requires solving a nonsmooth problem even if the original one was smooth. However, recent developments in nondifferentiable optimization give some hope that these difficulties will be overcome. To be able to reduce a constrained optimization problem to an unconstrained one via exact penalization it is suitable to represent the constraining set in the form of equality where the function describing a set must satisfy some conditions on its directional derivatives (or, in general, on its generalized directional derivatives). in the present paper we show how to describe the constraints given in the form of differential equations by a (nonsmooth) functional whose directional derivatives satisfy the required properties. The paper is devoted to the problem of supervision process optimization for dynamical systems at casual indignations. This problem is reduced to a nonsmooth unconstrained optimization problem. It makes it possible to construct a numerical algorithm for the unconstrained optimization problem just allowing one to solve the original parametric optimization problem. Then, by making use of necessary optimality conditions (for a nonsmooth problem) it is shown that the conditions we obtain are equivalent to the well-known ones.

Текст научной работы на тему «Штрафные функции в задаче управления процессом наблюдения∗»

Сер. 10. 2010. Вып. 4

ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА

ПРОЦЕССЫ УПРАВЛЕНИЯ

УДК 539.3 В. В. Карелин

ШТРАФНЫЕ ФУНКЦИИ В ЗАДАЧЕ УПРАВЛЕНИЯ ПРОЦЕССОМ НАБЛЮДЕНИЯ*)

1. Введение. Статья посвящена проблеме оптимизации процесса наблюдения для динамических систем при случайных возмущениях. В ней приведены постановка и исследование задачи о выборе оптимальной программы наблюдений. Предполагается, что состав или точность измерений может изменяться в некоторых пределах. Задача состоит в выборе такой программы наблюдений, которая обеспечивает наибольшую точность определения фазовых координат системы.

2. Постановка задачи. Пусть состояние системы характеризуется п-мерным вектором фазовых координат х(Ь), а время Ь принимает дискретные значения .

В моменты времени производятся измерения (наблюдения) состояния системы, и результатами их являются векторы у(Ьи). В момент Ьо = 0 известно вероятностное распределение вектора х(Ь — 0). Это распределение предполагается нормальным с математическим ожиданием то и матрицей ковариации Во. Изменение состояния системы и процесс измерения описываются системой

Случайные величины £(Ьь) и ) соответственно характеризуют возмущения, действующие на объект, и ошибки измерений. Случайные величины х(Ь — 0), £(Ьь) и п(Ьн) предполагаются независимыми друг от друга. Величины £(Ьк) и -ц(Ьк) имеют нормальное распределение с нулевым математическим ожиданием и известными матрицами ковариации, равными О(Ьь) и а(Ьь) соответственно. Матрица Qk характеризует состав измерений, производимых в момент Ь&. Ввиду сделанных предположений условное распределение х(Ьь) при условии, что заданы у(Ь8), 0 < в < к, будет нормальным.

Карелин Владимир Витальевич — кандидат физико-математических наук, доцент кафедры математической теории моделирования систем управления факультета прикладной математики-процессов управления Санкт-Петербургского государственного университета. Количество опубликованных работ: 65. Научные направления: идентификация систем управления, недифференцируемая оптимизация. E-mail: [email protected].

*) Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект № 09-01-00360).

© В. В. Карелин, 2010

x(tk+1) = Ak x(tk) + bk + Fk £(tk ), к = ° ■■■, N — 1, y(tk) = Qkx(tk) + n(tk), к = О,..., N.

(1)

(2)

Обозначим через хь и Бь математическое ожидание и ковариационную матрицу для вектора х(Ьь — 0), а через х*к и Б*к - для момента + 0. Тогда, используя (1), (2), можно записать соотношения типа фильтра Калмана [1]

Рекуррентные соотношения (3), (4) описывают изменение условных математического ожидания и ковариационной матрицы вектора х(Ь) в результате процесса наблюдения и движения объекта.

где матрица Б0 задана. Матрица Уь характеризует процесс наблюдения и зависит от состава измерений и их точности. В частности, если наблюдения не проводятся, то Уь = 0. Матрица К описывает возмущения, действующие на систему. Если наблюдатель может изменять выбор наблюдаемых параметров или точность их измерения, то матрицу Уь € V в матричном уравнении (5) можно считать управляющей функцией, при этом роль фазовых координат выполняют элементы ковариационной матрицы Бь. Рассмотрим функционал

3,ь=1

где Б^^ - элементы матрицы Б, а дь - компоненты заданного п-мерного вектора д. Этот функционал равен дисперсии некоторой линейной функции от фазовых координат

с ограничениями на фазовые координаты вида (5).

3. Метод штрафных функций. Рассмотрим неотрицательную на всем пространстве функцию

Из построения вектора Б и функции <р видно, что для любого фиксированного Уь и матрицы Бо множество решений системы (5) совпадает с решением уравнения

(3)

Хк+1 = Ак х*к + Ък,

Бк+1 = Ак Бк Ак + рк Ок Рк.

(4)

Введем новые обозначения Уь = Qkак 1Qk, Кь = РьСьи, объединяя уравнения (3), (4), получим

Бк+і = Ак (Б-1 + Ук )-1А'к + Кк = /(Бк, Ук),

(5)

П

Ь = д хк.

Поставим задачу об оптимизации наблюдений: найти

тіп 7

у еи

(6)

1/2

¥(У,Б)= (Бк+1 - Ак (Б-1 + Ук ) 1Ак - Кк)

2

0

<р(У, Б) = 0.

Обозначим множество решений данного уравнения следующим образом:

■= {У, Бо] | : фУь, Бо) = 0}.

Пусть д ■= [V, д], где V € Еп, д € Кп. Положим

:= т_ах{^, \\д\\} |М| :=

' N

к=1

1/2

■= Vх?-

Пара д определяет направление (на множестве Еп х Еп).

Изучим теперь дифференциальные свойства функции ф. Вначале рассмотрим случай ф(Б, У) > 0. Выберем Vk и найдем производную функции ф в некоторой точке Бь по направлению Vk. По определению,

^'( А V, д) = 1™ - ЫБ + (XV) - <р(Б)].

а|0 а

Покажем, что этот предел существует, и найдем его значение.

Лемма 1. Если ф(Б, У) > 0; то функция ф дифференцируема в окрестности точки

[Бь У].

При этом

(7)

где

=

N

(д/\

N

ім(н) :=

1

р(У, Б)

У (Бк + 1 - Ак (Б- 1 + Ук ) 1Ак - Кк)

=0

Так как (7) линейно по д, заключаем, что ф дифференцируема. Рассмотрим случай, когда ф(У, Б) = 0. Здесь

Р(У Б) = та* (Б к +1 — А к (Б- + Ук ) А к — Кк, V к

11^11=1 \

=1

Ък = Бк +1 — Ак (Б- 1 + Ук ) 1Ак — К к = °.

В силу того, что

^Б к + 1 — Ак (Б- 1 + Ук ) 1Ак — Кк^ '°к ^ =

= Ъ к + а

д/(Г)к,ук)^ д/(Бк,Ук)

'°к----------------------------------Ч

д Б к ^ дБо

+ о(а),

2

к

*

а

2

и

имеем

Члг п \ (- д/(Бк,Ук)

ср (У,0;дк) = тах ^ ------гг^-----}^щ ~

^г'^ = 1 ь=1 V ь г=1

дБь ^ 1 дБб

,, ,, ь=1 \

где

т°"У< , (8)

Кд/{Р^) (Рк+1 - Ак(Р11 + УкУ'А'ь - Кк) ^ дВ1 ф(У,В) ■

Для (8) имеем

N / N

ф'(У,Б; дь) = тах

|М| = 1

I - (^1{Бк,Ук)\ _

—щ~) *

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

XVЗЛА, 14) , _

2^ —ятТп—Чк) Ук’Як

о

(9)

Из (8) и (9) следует

Лемма 2. Если ф(У, Б) = 0, тогда функция ф дифференцируема в направлении точки [У, Б] и даже субдифференцируема, т. в.

ф'(У,Б; дь)= шах {G,g),

Ое0^(у,п)

где

дф(У,Б) = \ С =^*к,д*к]

^ 3/(А, 14) У- Л

д ей ,^=М4)-Ц^—др. ) 4,4 Г ^

Рассмотрим штрафную функцию

^(У, Б, X) = .1 (У, Б) + \ф(У, Б). (11)

Следуя работе [2], можно доказать следующее утверждение:

Теорема 1. Если ф липщицева, тогда найдется Х0 ^ 0 такая, что для всех X ^ Х0 множество минимумов функции 7 на множестве 0,у совпадает с множеством минимумов функции (11) на всем пространстве.

Итак, задача условной минимизации (5), (6) сводится к задаче безусловной минимизации (11).

Поскольку функция 7 дифференцируема, а функция ф дифференцируема по направлениям, причем производная по направлениям определена формулой

^дк9)=£(»-£(!£У«м.')-

. дБ

ь

-£((!) ™,я)=№,9),

о

в которой

Уф(Ъ)

N / Я! ^ I д/

д/

«.,-1^1 и,

то можно применить численные мето ды, разработанные для решения задач безусловной минимизации.

Пусть [V*, Б*] - точка минимума в задаче (5), (6). Тогда ф(У*, Б*) = 0. Функционал Г(У, Б) субдифференцируем, причем его субдифференциал есть

дГ (г*,п*) = УФ + Хдф,

где УФ дается формулой

(12)

J (Б, V, д) = Ит - [•/(£> + а, V + ад) - J{Бa, V)] а

N

Е

N

, к=1

(УФ,д), УФ

N

д/р д/р ^ д£>’ дУ

а дф - формулой (10).

По необходимому условию минимума субдифференцируемой функции

0 € дГ(Б*,У*).

(13)

Здесь 0 - нулевой элемент пространства Сп[0, Т] х Ст[0, Т]. Из (11)-(13) следует существование такого V € Сп[0,Т], ||-у|| ^ 1, что

N

^д/р(Б*,У*) | Л

дБ

N

дБ

0 Ук € [1,Ж],

(14)

д/о{Б*{1),У*) л (д/{Б*,У*)\_ п

—ж--------------АI, ау )1,=0

Обозначая XV через ф и дифференцируя (14), имеем

д/о(Б* ,У*)

Ф

,+

дБ

(15)

ФN) = 0п, (д/(Б*,У*)\* , д/о(Б*,У*)

, , ф — -V дУ ) И дУ

Окончательно получаем следующее необходимое условие:

0.

(16)

(17)

Теорема 2. Для того чтобы функция V* доставляла наименьшее значение функционалу 7(V), необходимо, чтобы нашлось pешение ф системы (15), (16), удовлетворяющее условию (17).

Замечание. Положим Б = (Б0,Б1, ...,Бп), и рассмотрим следующее дифференциальное уравнение:

Б = / (Б,У), Б(0) = Бо

*

*

где

f = (fo,fn), fi(D, V) = fi(Di,Dn, V).

Положим ф = (фо, Ф1,..., фп). Тогда уравнение (15), (16) и условие (17) могут быть переписаны в более симметричной форме

4. Заключение. В работе задачу оптимизации процесса наблюдения удалось свести к задаче оптимизации без ограничений, для которой найдены необходимые условия оптимальности. По функции точного штрафа можно установить точку глобального минимума задачи условной минимизации, если найдем точку глобального безусловного минимума функции штрафа при подходящих значениях штрафного параметра а. Однако, с практической точки зрения, поскольку обычные алгоритмы не способны привести к глобальным решениям (а только к локальным), то представляет интерес изучить связь между стационарными точками и локальными минимумами задачи (5), (6) и соответствующими точками штрафной функции.

Литература

1. Kalman R. E. A new approach to linear filtering and prediction problems // Transactions of ASME J. Basic Engrg. 1960. Vol. 82, N 1. P. 34-45.

2. Demyanov V. F., Giannessi F., Karelin V. V. Optimal control problems via Exact Penalty Function // J. of Global Optimiz. 1998. Vol. 12, N 3. P. 215-223.

Статья принята к печати 10 июня 2010 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.