СИСТЕМЫ И
ПРОЦЕССЫ
УПРАВЛЕНИЯ
УДК 621.395
ДРОБОВЫЕ ШУМЫ И ПАРАМЕТРИЧЕСКАЯ ОПТИМИЗАЦИЯ ДИНАМИЧЕСКИХ СИСТЕМ
МАЗМАНИШВИЛИА.С., СИЛА Т.А., СЛИПЧЕНКО Н.И.
Рассматривается задача выбора параметров объекта управления и регулятора, доставляющих на решениях минимум интегральному критерию качества. Показывается, что задача параметрической оптимизации динамической системы, возмущенной дробовым шумом, эквивалентна такой же задаче для той же системы, но возмущенной белым шумом с соответствующей ковариационной матрицей.
1. Введение и постановка задачи
В работах [1,2] получено решение задачи параметрической оптимизации регулируемой динамической системы для случая, когда статистические характеристики действующих на систему возмущений неизвестны. В настоящей работе та же задача рассматривается для случая возмущения системы дробовым шумом [3], широко распространенным в реальных условиях функционирования динамических систем. В соответствии с [1] запишем уравнение замкнутой динамической системы:
dX (t) = Ф( X ,а,Р) + W (t), dt (1)
X єRn, а єRp, ДєRl,
где a — p -мерный вектор варьируемых параметров объекта управления; Д — l -мерный вектор варьируемых параметров регулятора; Rn, Rp, Rl — действительные векторные пространства с евклидовой нормой. На компоненты векторов а и р
наложены ограничения
f (а) < 0, &j (Р) < 0, (i = 1,2...,z), (j = 1,2,...,q), (2)
определяющие в пространствах Rp и Rl области допустимых значений Ga є Rp и Gp є Rl.
Определение. Процесс ¥(t) назовем процессом класса GT є Rn, если его реализация определяется формулой
W) = Е Ak (tk), Ak є Rk , (3)
k = -CO
где [rk — простейший пуассоновский поток [3] с плотностью Л> 0; {Am}^x — последовательность
независимых, одинаково распределенных случайных n -мерных векторов со свойствами
Ea[||{Am}-J^ > 0; Ea[{AJZ
0. Предполага-
ется, что последовательности {zk }”от и {Am}Zx
статистически независимы. Класс GT будем называть классом дробовых шумов.
Требуется отыскать векторы а* є Ga и д* eG^, доставляющие на решениях уравнения (1) минимум интегральному квадратичному функционалу
J = EQ{X(t),а,Р} ,
(4)
где Q( X (t ),а,Р) — определенно-положительная форма компонент вектора состояния; T — временной интервал длительности регистрации.
2. Сведение дробового шума к эквивалентному белому шуму
Характеристический функционал Ф {U} процесса ¥ (t), заданный на классе финитных непрерывных вектор-функций U(t), определяется формулой [3]
Ф{и} = E
exp( П< U (t XЧ (t) >)
(5)
Теорема 1. Для характеристического функционала ф{и} случайного процесса ¥(t) є G^ справедлива формула
Ф{и} = exp| Tfj f (U (г) - 1] drj,
(6)
где f (U) — характеристическая функция [4,5] случайного вектора A, который статистически экви-
валентен каждому из {Am}, f (S) = E[exp[-i < S, A >].
Доказательство. Так как{д.}”от и {Am }”от — независимые случайные последовательности, то
E1=Е11E a [.] , где Er [] и Eа[.] — символы математических ожиданий по распределениям вероятностей соответственно для последовательностей {zk } и {Am } . Далее, случайные амплитуды {Am}”^ с различными номерами m статистически независимы и одинаково распределены, поэтому
Eа[exp-* iЕk< U(tkXAk >)] =
= ПkE0[exp(-iEk < U(tkX Ak >)] = Пkf (U(tk))-
Тогда из (3) получаем формулу
Ф^} = E^n kf (U (Ч ))).
При значениях г, для которых U (г) = 0, выполняется f (U (г)) = 1. Поэтому вычисление математического ожидания в последней формуле достаточно выполнить только для тех zk, которые
принадлежат suppU (t). Ввиду того, что {rk }”от — простейший поток, с вероятностью 1 только конечный набор точек удовлетворяет последнему усло-
РИ, 2000, № 2
38
вию. Пусть число l настолько велико, что [-l,l] єsuppU(t). Тогда, используя явную формулу усреднения по распределению вероятностей для простейшего потока с плотностью Д,
E ХІШ/ (U (Ч))] =
= lim =0xN exp(~2X)f_dN...
l
-j!і dxinN=if (U(Tt)), получим формулу (6).
Следствие. Процесс ¥(t) стационарен.
Нашей дальнейшей задачей является вычисление оператора Lх в уравнении (9) или, что эквивалентно, его Фурье-представления Lк. В общем случае псевдодифференциальный оператор L к является генератором эволюции во времени условной характеристической функции
h(K, t|Xо,tо) = Eexp{-i < K,X >}|Xo, tо] =
= Jexp{-i < K,X >}g(X,t|Xo, to)dX . Теорема 3. Для оператора Lк справедлива формула L к ={ K, Ф(і^/ Ж) ,а,р) + Л( / (K) -1). (10)
Доказательство. Случайный процесс является стационарным в том и только в том случае, если его характеристический функционал, определенный на непрерывных вектор-функциях U(t) , инвариантен относительно замены U(t) ^ U(t + t') при любом t ’. Отсюда и из (5) следует сформулированное следствие.
Теорема 2. Процесс X(t), который определяется стохастическим дифференциальным уравнением (1) и начальным условием X(tо) = Xo, является марковским.
Доказательство. Пусть t’ (t’> to) — произвольный момент времени и пусть G — любое измеримое случайное событие, связанное с процессом {X(t)}, которое определяется только теми моментами времени t, для которых t > t’. Тогда условная вероятность этого события Pr{G| X(t); t < t'} при условии, что зафиксирована эволюция системы до момента t ’, равна
Pr{G|X(t); t < t'} = Pr{G| X(t)}. (7)
Последнее равенство следует из интегрального представления
X(t) = X(t') + JФ(X,а,Р)dr+ XА . (8)
t’ k: t'<t
Эта формула показывает, что случайная траектория X(t) при t > t’ зависит только от e[t', t] и
отвечающих им {Ак }, а также от X (t ’) , но не зависит от того, какова была траектория X(t) при t < t. Таким образом, формула (7) выражает свойство марковости процесса {X(t)}.
Это свойство, с одной стороны, позволяет описать все его статистические свойства с помощью лишь одной функции — плотности вероятности перехода g( X, t| X0, t0 ), а с другой — с помощью стандартной методики [5] дает возможность сформулировать линейное уравнение Колмогорова для этой функции:
J,g = LXg' (9>
Доказательство. Зафиксируем любое А > 0 и запишем приращение функции h при переходе от t к t + А. Благодаря марковости процесса {X(t)} выражение для приращения принимает вид
h(K,t + А|X0,t0) - h(K,11X0,t0) =
= J limE exp - і < K, X (t + A>|X ,p|g( X, t| X0, t0) dX -
- J lim Eex p - і < K, X (t >| X, 0]g( X, t| X 0,10) dX.
Математическое ожидание от первого слагаемого справа разложим по формуле полной вероятности с гипотезами, отнесенными к полуинтервалу [t ,t + А). Получим: 1) не имеется случайных точек
из {Гк}; 2) имеется одна случайная точка; 3) имеется более одной случайной точки. Вероятности этих гипотез для простейшего пуассоновского потока равны соответственно:
1 - ЛА + о (ДА), ДА + о (ДА) и о (ДА). Кроме того, при записи этого разложения учтем, на основании (8), что для первой гипотезы
E exp - і < K, X (t + A >| X, t)] =
= E[exp - і < K, X (t) >[1 - і A < K, 0(X, a, P) E) | X, t]k о(ДД) а для второй —
X (t + А) = X (t) + As + о(ДА),
где As отвечает случайной точке ts, попавшей в полуинтервал. В результате получаем
ht+A- ht = іД| E\~1<K ’X(t)> < K, 0>(X, a,P) >|X, t\ x g(X, 11 X0, t0 )dX +
+ ДД f e~г<K’X>E
-і< K, As >
| X, tg(X,11X0,t0 )dX - ht)+
+ о(ДД).
Первое слагаемое справа преобразуется к виду - і А < K, Ф^д/ Ж), а,Р> ht. После замены символа E во втором слагаемом на символ E а , деления
на А и предельного перехода А ^ 0 получаем утверждение теоремы 3.
РИ, 2000, № 2
39
Будем в дальнейшем предполагать, что для векторфункции Ф(Х,а,Р) имеет место оценка
supX(< X,Ф(X,а,Р) >||X||2) = -р для некоторого положительного числа р. Из этой оценки, в частности, следует, что матрица B(X) = Д&(X,а,Р) / сХ — равномерно диссипативна при X є Rn, т.е.
max(< B(X)Y,Y >: || Y ||= 1 <-p.
Лемма 1. Решение X(t) уравнения (1) с вероятностью 1 равномерно ограничено по норме при t є (tо,<х>) случайной постоянной Ь .
Доказательство. Пусть Ts — точка последовательности {тк } , ближайшая к t слева. Из уравнения (1) следует, что при t >rs имеем
~ || X ||2 = <Ф (X(t),aJ), X (t) > <-2^||X||2 , dt
поэтому ||X(t)|| < exp(-^t + pts)||X(rs + 0)||. Из формулы (8) следует при t ’ = Ts, что
X(t) = Xs + J' Ф(X(т),а,Д)dz + As,
где Xs = X(ts ) . Тогда X(rs + 0) = Xs + As и || X (t )|| < exp( -pt + pxs )(|| Xs ||+|| As ||). Точно так же для любого к имеем неравенство
|| Xk+l|| ^ exp(-р*к+i+ Ртк ХУ Xk ||+|| Ак У).
Пусть Т/ — точка последовательности {Гк } , ближайшая к to справа. Тогда, применяя последовательно полученное неравенство, найдем
|| Xk|| +М)|| Ак ||+exP(-^^t +^'o)|| Xo||j
и поэтому
УX (t )|| ^ ( exp( -pt + Pt о) || Xо|| + XXexp( -Pt+ръ )|| A ||)
Случайный числовой ряд
Хг*= 1 exP(-^t + P*t) || Ai11 = ь-\\Xо11 сходится с вероятностью 1 [6]. Случайная величина
Cn = X У Ак У, n > 0 в нашем случае имеет
к: t—n>T>t-n—1
конечное, не зависящее отn математическое ожидание E[Cn ] = TE[|| А ||] и поэтому, используя неравенство Чебышева [7], найдем
Pr{Cn > exp(^n / 2)} < Лexp(pn / 2)E[|| Ai ||].
Из формулы Бореля—Кантелли [8] вытекает, что неравенство Cn > exp(^n /2) с вероятностью 1 выполняется только для конечного набора номеров
n . Так как (Ь-УX0У) ^ XГ= 0Cn exp(pn / 2) , то предыдущее утверждение обеспечивает существование случайной постоянной Ь. Объединяя используемые здесь неравенства, находим || X(t)||< Ь.
Лемма 2. Пусть X(t') и X(t") суть два решения уравнения dX / dt = Ф, которые отвечают двум различным начальным условиям X'(0) = X'0 и X"(0) = X"0 . Тогда
||X'(t)-X"(t)||< exp(^t-pt0)||X'0-X’’0 ||. Доказательство. Пусть Y = XX” и тогда
dt ||^|2 = 2(( Ф( X,a,fi-Ф( Xn ,a,p)\Y) = 2( Xa)Y,Y)
где Xa — некоторая точка на отрезке, который
соединяет точки X(t') и X(t'') в Rn. Интегрирование полученного неравенства доказывает утверждение леммы 2. При заданных реализациях Ак}Х, и {Ат}”^ решениеX(t) уравнения (1) с X (t 0) = X0 можно рассматривать также как функцию от t0, X(t; X0,10 ). На основе этой случайной функции построим процесс {Xx (t)} .
Теорема 4. При фиксированных X0 и t с вероятностью 1 существует предел
Xю (t) = lim X(t; X0, t0) (11)
Этот предел не зависит от X0. Он определяется
только реализациями {тк } , {Ат}^х и таким об-
разом представляет собой траекторию случайного стационарного процесса {Xx (t)} .
Доказательство. Пусть t'0 > t"0 и X'(t) , X" (t) — случайные решения уравнения (1) с начальными условиями X’(t ’ 0 ) = X0, X' ’ (t ’ ’ 0 ) = X0. Пусть номер l момента г і определен так, как при доказательстве леммы 1. Так как для любого решения X (t) уравнения (1) выполняется
Xk+1 = Xk + Ак + j^(X(r,a,A)) dr,
то, определив по этой формуле случайные последовательности {X’к } , {X"к } , получим, применяя лемму 2 при t = Тк+1 и t0 = тк:
||X' к+1 - X" к+1 У< exp(^Tt+1 - р?к )WX 'к - X "к У.
Из этого неравенства и формулы (2.4) при t ’ = t '0
40
имеем
РИ, 2000, № 2
\\X\t) - X"(ОН < expoOt -pt')\\Xо - X'\t'0) | | .(12)
Так как в силу леммы 1 \\X"(t'о )\\<b , то из неравенства (12) следует, что с вероятностью 1 выполняются условия Коши для функции X (t; Xо, to) при t Таким образом, с той же
вероятностью предел (11) существует. Пусть теперь решения X'(t) и X”(t) отвечают начальным условиям X' (t0) = X' 0, X''(t0) = X'' 0 . Тогда, полагая в (11) t'0 = t' и устремляя t0 ^ -ж, получаем, что X'х (t) = X' 'х. Таким образом, предел (11) не зависит от X0 .
Каждая траектория Xx (t) однозначно восстанавливается по реализациям ¥(t). Иными словами, она является случайным функционалом от ¥(t), который обозначим, подчеркнув явную зависимость от Y(t), как Xx (t) = Xx (t, Y(t ')).
Из процедуры построения этого функционала следует, что он обладает свойством
X х (t + т, W(t')) = X х (t, ^(t ’-г)) (13)
при любом Г- ФункционалыX(t;X0,ф) измеримы, так как зависят от конечного набора случайных параметров. В силу (11) функционал Xx (t) также измерим, как предел измеримых функционалов. Таким образом, распределение вероятностей для
Xx (t) индуцируется распределением вероятностей для процесса ¥(t). В силу формулы (11) распределение вероятностей для процесса Xx (t + т) индуцируется распределением вероятностей для процес -са ¥(t -г). Но процесс ¥( t) — стационарен. Поэтому распределения вероятностей для процессов ¥(t - г) и ¥(t) совпадают. Отсюда следует, что и процесс Xx (t) — стационарен.
Теорема 5. Процесс Xx (t) асимптотически при t ^ж приближает по вероятности каждый из
процессов X(t) . Это означает, что для любого є> 0 выполняется
Pr{\\X (t) - X х (t)\\>s}^ 0, t ^ж. (14)
Доказательство. Пусть Xx (t0) = X". Тогда, полагая в неравенстве (13) t0 = t'0, X'(t) = X(t) , X"(t) = Xx (t) , получим
\\X(t) - Xx(t) < exp(-pt + ^t0)\\X0 - Xx(t0)\\
и так как \\Xx(t0)\\< b, то при t ^ж следует утверждение теоремы 5.
Докажем теперь теорему, важную для определения оптимального управления в стационарном приближении.
Теорема 6. Уравнение (9), отвечающее процессу X (t), обладает единственным устойчивым решением gx ( X), которое определяет распределение вероятностей в Rn и которое притягивает при t ^ ж условные распределения g (X, t: X0, ^) при любых X0 и t0 .
Доказательство. В силу свойства (12) для любой окрестности с любой точки X є Rn имеем
|Pr[X(t) є<г]- Pr[Xx(t) є<г]|^ 0, t ^ж.
В частности, так как процессы имеют непрерывные плотности одномерных распределений вероятностей соответственно g(X, t) и gx (X, t) , то почти всюду по X имеем |g(X, t) - gx (X, t)| ^ 0 при t ^ж. Плотность gx (X, t) не зависит от t, так как процесс Xx (t) стационарен. Поскольку g(X,t) удовлетворяет уравнению (9), то gx (X) обязана удовлетворять уравнению
L Xg^= 0 либо L Kgx= 0. (15)
Следующая теорема является объединением известных утверждений [5,9]. Мы ее приводим вместе с доказательством для полноты изложения.
Теорема 7. Пусть X(t) _ процесс, определяемый уравнением (1) и начальным условием X(t0) = X0, в котором ^(t) суть n -мерный белый шум с ковариационной матрицей D,
E¥(t)¥(t')] = DA(t - t') , E¥(t)] = 0.
Тогда для процессов X(t) и X(t) и отвечающим им одномерных плотностей g(X, t) и gх (X, t) справедливы утверждения, аналогичные теоремам 5,
6. При этом Фурье-образ плотности g (X, t) является решением уравнения
- і(к, ф(^/ гк))и „= 1 < к, dk > . (16)
Доказательство. Обобщенный случайный процесс ¥( t) может рассматриваться как следующий слабый предел. Заменим векторные амплитуды {Am } на {cAm} , ст > 0 и перейдем к пределу Л ^ ж и
<7 ^ так, что Ло = const. Тогда производящий функционал (5) перейдет в производящий функционал белого шума с ковариационной матрицей
D = const*M, где Ыы = E^m], A = (aba2,...,an).
Решения X (t) стохастического дифференциального уравнения (1) с белым шумом в качестве порождающего процесса являются пределами с вероятностью 1 решений X(t) уравнений (1) с дробовым шумом ¥ (t) для тех же начальных условий. Точно так же процесс Xх (t) сходится с вероятностью 1 к некоторому стационарному процессу X х (t) . Оператор Lk в уравнениях Колмогорова, отвечающих процессам X (t) и X (t), также получается описанным выше предельным переходом. Тогда из формулы (16) путем подстановки явного выражения (10) и предельного перехода получаем уравнение (16).
Перейдем теперь к формулировке теоремы, содержащей основной результат работы об эквивалент-
РИ, 2000, № 2
41
ности задач параметрической оптимизации динамических систем, возмущенных дробовым шумом, и систем, возмущенных белым шумом с соответствующей ковариационной матрицей.
Теорема 8. Оптимальное управление в стационарном приближении процессом Xx (t) эквивалентно оптимальному управлению аналогичным процессом, который порождается белым шумом с ковариационной матрицей
D = Ж. (17)
Доказательство. Так как
f (K) = 1 - 0,5 < MK,K >+ о(||K||2) при ||K||^ 0
и Eo[||Am||] <<», Ео[ т ТО
Нк = 0,5 < HK,K > +о(||K||2 ), (18)
где H — матрица вторых моментов плотности распределения g (X).
Функционал качества J полностью определяется матрицей H
J = Sp(HG) (19)
с некоторой положительно-определенной матрицей G.
Для нахождения матрицы H воспользуемся формулами (10) и (15). Удерживая в разложении (18) только квадратичные члены, получим, что матрица H является решением стационарного уравнения Ляпунова BH + HB = AM , где B = B(0) и ф(X) = BX + о(||X||2 ) . Матрица же H, отвечающая уравнению (1), в котором ¥(t) заменяется на белый шум с ковариационной матрицей D, определяется аналогично из уравнения
BH + HB = -D. (20)
Потребовав теперь, чтобы H = H, получим формулу (17).
Таким образом, задача параметрической оптимизации динамической системы (1), возмущенной дробовым шумом (3), эквивалентна задаче параметрической оптимизации динамической системы (1),
возмущенной белым шумом ^( t) с ковариационной матрицей (17). Практически это означает, что хорошо разработанный статистический аппарат параметрической оптимизации, базирующийся на гипотезе о белом шуме, как о порождающем процессе , возможно распространить и на решения задач оптимизации динамических систем, подверженных воздействию эквивалентного в энергетическом отношении дробового шума.
3. Заключение
В заключение отметим, что доказанная теорема 8 имеет место только для функционалов качества квадратичного вида. Поэтому результат работы можно сформулировать и таким образом.
Если движение системы определяется уравнением (1) с ¥(t) єRn, то существует асимптотическая
плотность распределения вероятностей gх (X), моменты которой вполне определяются вторыми моментами шума ¥(t) .
Полученные в работе результаты относятся к классу случайных процессов — случайных дробовых шумов, представляющих собой случайную последовательность мгновенных импульсов. Вместе с тем ясно, что с практической точки зрения важно распространение этих результатов на более широкий класс возмущающих процессов, значимых в практическом отношении. Помимо того, что дробовые шумы достаточно распространены, они в качестве модели удобны благодаря возможности применения теории марковских процессов. Можно высказать гипотезу, что результаты работы справедливы для некоторого более широкого класса стационарных случайных процессов, чем рассмотренные, а именно для класса, внутри которого возможно осуществить слабый предельный переход к белому шуму.
Литература: 1. Александров Е.Е. К вопросу о параметрической оптимизации регулируемых систем // Изв. вузов. Электромеханика. 1990. № 6. C.84—87. 2. Александров Е.Е. Параметрическая оптимизация регулируемых динамических систем с помощью функций Ляпунова / / Изв. АН СССР. Техническая кибернетика. 1990. № 3. C.44—49. 3. Гнеденко Б.В, Коваленко И.Н. Введение в теорию массового обслуживания. М.: Наука, 1987. 336с. 4. Гнеденко Б.В. Курс теории вероятностей. М.: Наука, 1961. 406 с. 5. Гихман Н.Н., Скороход А.В. Теория случайных процессов. T.III. М.: Наука, 1971. 496 с. 6. Вирченко Ю.П., Ласкин Н.В. Огрубленное описание распределения решений уравнения Ланжевена // Теоретическая и математическая физика. 41, № 3. 1979. C.406—417. 7. Феллер В. Введение в теорию вероятностей и ее приложения. М.: Мир, 1984. Т.1. 528 с., Т.2. 728 с. 8. ЛампертиДж. Вероятность. М.: Наука, 1973. 184 с.
9. Пугачев В. С., Синицын И.Н. Стохастические дифференциальные уравнения. М.: Наука, 1985. 560 с. 10. Справочник по теории автоматического управления / Под ред. А.А. Красовского. М.: Наука, 1987. 758 с.
Поступила в редколлегию 25.11.99
Рецензент: д-р физ.-мат. наук, проф. Дикарев В.А.
Мазманишвили Александр Сергеевич, д-р физ.-мат. наук, профессор кафедры САУ ХГПУ. Научные интересы: теория связи, радиофизика, прикладная математика. Адрес: Украина, 61002, Харьков, ул.Фрунзе, 21, тел. 40-00-56.
Сила Татьяна Александровна, аспирантка кафедры КГМ ХГПУ. Научные интересы: теория устойчивости, прикладная математика, теория автоматического управления. Адрес: Украина, 61002, Харьков, ул. Фрунзе, 21, тел. 40-03-55.
Слипченко Николай Иванович, канд. техн. наук, доцент кафедры МЭПУ ХТУРЭ, проректор по научной работе ХТУРЭ. Научные интересы: моделирование процессов формирования интегральных структур, разработка теории многофункциональных частотных элементов. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 47-01-
07.
42
РИ, 2000, № 2