Научная статья на тему 'Вероятностно-асимптотический метод композиционного синтеза в соотношении с процедурой робастного h∞ - управления'

Вероятностно-асимптотический метод композиционного синтеза в соотношении с процедурой робастного h∞ - управления Текст научной статьи по специальности «Математика»

CC BY
57
12
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — С А. Дубовик

Рассматривается задача стабилизации одного из состояний равновесия нелинейного слабо возмущенного объекта в условиях полной информации о векторе состояния. Для решения задачи предлагается вероятностно-асимптотический метод, основанный на функционале действия. Данный подход сравнивается с гарантированным управлением, являющимся решением задачи робастного H0 синтеза.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The problem of stabilization of one from balance states from of the nonlinear poorly disturbed object in conditions of the full information of a state vector is considered. For the decision of the problem it is offered probabilistic-asymptotic method based on functional of action. The given approach is compared with the guaranteed management being the decision of a problem robust H~Synthesis.

Текст научной работы на тему «Вероятностно-асимптотический метод композиционного синтеза в соотношении с процедурой робастного h∞ - управления»

Реакщя фшьтра низьких частот (ФНЧ), що вщокре-млюе шформативний сигнал, розраховуеться за допомо-гою двом1рно! згортки

I1(x, y) = |HH4 (x, y, x1, y1 Vg^xp y1) dx1 dy1, (23)

E2p

де E2 - двом1рний прошарок; H нц (x, y, xp y^) - функ-

щя спотворень ФНЧ (двом1рна 1мпульсна характеристика).

Пристрш логарифмування формуе ампл1тудну характеристику виду I2(x, y, Ip) = ln [ 1 + Ip (x, y)] , яка апроксимуеться усченим рядом Тейлора

M

I2(x, y)«£ (-1 )p + V-1 Ip(x, y),

P = 1

(24)

при цьому под1бне розкладення може використовуватися i при шшш амплггуднш характеристик в блощ нелшш-ность Шдставляючи спiввiдношення (21) у (22) i розра-ховуючи двомiрну згортку з Ig% , визначаемо

M

huX(x, y) (-1 )p + 1P'4gp(x> y> XP' 7P)x

p = 1 E2p

n

X П HH4(x2 -x1j'y2 -y1j)dx2dУ2, j = 1

(25)

де gp(x, y, X , Yp) - ядро РВВ р-го порядку.

Отриману модель можна використовувати при побу-довi систем контролю складних динамiчних багатомiр-них об'eктiв автоматизацп i контролю якостi промисло-во! продукцГ1', особливо на основi графиу. На базi роз-роблених моделей сепарабельних фшк^в (17), (20),

(25), автором статп запропоновано двi структури фть-трiв низько!' i високо!' частот у виглядi розподiльних структур та кругових фтк^в, мова про яю пiде у наступних роботах.

ПЕРЕЛ1 К ПОСИЛАНЬ

1. Современные методы идентификации систем / П. Эйкхофф, А. Ванечек, Е. Савараги, Т. Соэда и др.; Под ред. П. Эйкхоффа.-М.: Мир.-1983.-400с.

2. Исследование по общей теории систем / Сб. перев. с англ. и польск. А. М. Микиши, Б. В. Плесского, Г. Л. Смолина, Б. А. Старостина, Б. Г. Юдина, Н. С. Юлиной; Под общ. ред. В. Н. Садовского, Э. Г. Юдина.-М.: Прогресс, 1969.-520 с.

3. Винер Н. Нелинейные задачи в теории случайных процессов.-М.: Иностранная литература.-1961.-324с.

4. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров / Пер. со второго американского перераб. изд. Под общ. ред. И. Г. Арамановича.-М.: Наука.-1974.-832с.

5. Анго А. Математика для электо- и радиоинженеров.-М.: Наука.-1967.-780 с.

6. Галько С. В. Системотехшчш основи побудови вим1рювач1в немагштних матер1ал1в // Труды ТГАТА.-Мелитополь.-1999.-с.64-71.

7. Галько С. В. Математичш основи побудови структури електромагштних вим1рювач1в немагштних матер1ал1в // Труды ТГАТА.-Мелитополь.-1999.-с. 72-76.

Надшшла 15.09.2003 Пiсля доробки 15.10.2003

В работе рассматридается методологический подход математического моделиродания сложных (многомерных) стационарных нелинейных систем адтоматизации с конечной памятью на базе издестных методод идентификации динамических объектод. На осноде математического аппарата рядод Винера-Вольтерра получена математическая модель описания динамических характеристик нелинейных систем объемной (пространстденной) обработки информации.

In operation the methodological approach of mathematical simulation of multivariate stationary nonlinear systems of automation with final memory on the basis of known methods of identification of dynamic plants is considered. The mathematical sample piece of exposition of dynamic responses of nonlinear systems of a volumetric information is obtained on a base of a mathematical means of series (lines) of Wiener-Wol-terra.

УДК 681.5

С.А. Дубовик

ВЕРОЯТНОСТНО-АСИМПТОТИЧЕСКИЙ МЕТОД КОМПОЗИЦИОННОГО СИНТЕЗА В СООТНОШЕНИИ С ПРОЦЕДУРОЙ

РОБАСТНОГО Н00 - УПРАВЛЕНИЯ

Рассматривается задача стабилизации одного из состояний равновесия нелинейного слабо возмущенного объекта в условиях полной информации о векторе состояния. Для решения задачи предлагается вероятностно-асимптотический метод, основанный на функционале действия. Данный подход сравнивается с гарантированным управлением, являющимся решением задачи робастного Н°

синтеза.

ВВЕДЕНИЕ

В задачах управления движением типичной является ситуация, когда объект описывается нелинейным слабо возмущенным уравнением. Нормальное функционирование системы в такого рода случаях связывается с одним

из состоянии равновесия, которое можно назвать основным или штатным. Примером является задача управления кораблем в условиях ветроволновых возмущении, в рамках котороИ осуществляется стабилизация положения и контролируется вероятность опрокидывания. В условиях удовлетворительнои стабилизации фазовая точка подавляющую часть времени принадлежит малоИ окрестности основного состояния равновесия. Тем не менее, среди реализации возмущения не должны исключаться такие, которые приводят к большим уклонениям от штатного состояния равновесия, в том числе выводящие фазовую точку на границу области устоичи-вости. Таким образом, процедура синтеза в рассматриваемых задачах может формироваться в виде композиции алгоритмов двух типов: локальноИ стабили-зации и глобального контроля больших уклонении. Выделить указанные алгоритмы в общеИ стохастической задаче удается с помощью асимптотического анализа по параметру возмущениИ. Основными элементами этого анализа оказываются конструкции, вполне аналогичные известным средствам теории вероятностеИ и ее базовых теорем: закона больших чисел, центральноИ предельноИ теоремы и оценки вероятности больших уклонениИ [1]. Интересно отметить, что некоторые из основных конструкциИ этоИ вероятностноИ теории сохраняются и в детерминированноИ задаче H~ - управления [2,3]. Сопоставление указанных подходов является одноИ из целеИ настоящеИ статьи.

1 ПОСТАНОВКА ЗАДАЧИ

Исследуется задача рационального выбора г - вектора управления Ut объектом, движения которого описываются нелинеИным слабо возмущенным дифференциальным уравнением для п - вектора состояния xt

L = LT1 т2 (u) = j(XTQX + p2uTu) dt (2)

= , Ut) + еo(xt)vt, x0 = x .

(1)

на движениях линеаризованноИ системы

X = AX + Bu + е Gv,

котороИ X = X( t) = xt - , а матрицы

(3)

известным

образом вычисляются как частные производные по аргументам функциИ правоИ части (1) в точке x = , причем троИка (A, B, C) - невырождена, а управление

выбираем в виде линеИноИ формы состояния u = DX. Это означает, что мы ограничиваем изложение случаем полноИ информации. Второе слагаемое в (2) задает интенсивность управления в (1), (3). Ясно, что наши требования к качеству должны быть как-то увязаны с интенсивностью возмущения, которую будем оценивать посредством функционала у > 0

I = I

T1T2

(u) = |у2vTvdt.

(4)

Здесь е > 0- малыИ параметр, vt - k -вектор возмущениИ, а, О - гладкие матричные функции. Выбор управления связывается с некоторым состоянием равновесия невозмущённоИ системы; последняя получается из (1) при е = 0 . Именно, необходимо стабилизировать и, при этом, обеспечить некоторое качество и надежность стабилизации. Категорию "качество" можно понимать как в классическом смысле, и тогда это прямые показатели качества процессов, так и в рамках метода пространства состояниИ, в котором качество, как правило, характеризуется квадратическим функционалом. Учитывая вполне определенную связь между тем и другим [4,5], естественно сосредоточить внимание на квадратическом критерии, как более мощном и универсальном средстве синтеза многомерных систем. Сформулируем некоторую опорную задачу, связанную с

интервалом [ ^ T2 ], ^ < T2 : минимизировать функционал (Q = CTC, р > 0)

Кроме того, в системе (1) соотношением интенсив-ностеИ управления и возмущениИ определяется надежность стабилизации в смысле возможности выхода фазовоИ точки на границу некотороИ критическоИ области D , содержащеИ состояние равновесия ^ . Для системы (1) рассматриваемого типа наиболее характеренен тот случаИ, когда критическая область совпадает с областью притяжения , то есть D = O^ , но могут представлять интерес и более "узкие" границы: D с. .

Вопрос о месте задачи (2), (3) и метрики (4) в такоИ общеИ задаче стабилизации с учетом качества и надежности зависит теперь от дополнительноИ информации относительно возмущениИ. Рассмотрим два случая -вероятностныИ и гарантирующиИ.

2 ВЕРОЯТНОСТНО-АСИМПТОТИЧЕСКИЙ

МЕТОД КОМПОЗИЦИОННОГО СИНТЕЗА

Пусть возмущением в уравнениях (1), (3) является "белыИ шум" vt = wt, то есть формальная производная от стандартного винеровского процесса. Тогда уравнение (3), представляющее собоИ аналог центральноИ предельноИ теоремы, аппроксимирует (точныИ смысл, например, в [6]) решения (1) в ситуации нормальных уклонениИ от состояния равновесия ^ , то есть уклонениИ порядка е . В этом случае для получения стабилизирующих управлениИ необходимо на решениях стохастического уравнения (3) минимизировать функционал J, представляющиИ собоИ усредненное значение

2

в

Г

2

г

предела (2) при , Т^= 0: J = Е ^ 0 u)]. Суще-

ствование предела гарантируется условием невырожденности троИки (А, В, С) и оптимальное в смысле 1 управление имеет вид

u(t) = uJ(t) = DX(t), D = -p-2BTP ,

(5)

где матрица P удовлетворяет алгебраическому уравнению Риккати

PA + ATP -PB p-2 BTP + Q = 0

(6)

СлучаИ нормальных уклонениИ, хотя и оказывается типичным для стабилизированноИ слабо возмущенноИ системы, тем не менее не является абсолютно достоверным событием для (1): сохраняется возможность уклонениИ от порядка е0 вплоть до выхода фазовоИ точки (1) на границу ЭО^ области притяжения точки .

Оказывается, далее, что вероятность Рд такого критического события оценивается с помощью функционала I. ДеИствительно, для вероятности больших уклонениИ (порядка е0 ) процесса (1) известны грубые оценки, которые выражаются через функционал деИствия, но начать удобнее с более простого случая.

В связи с проблемоИ больших уклонениИ, можно продолжить аналогию между марковскими процессами

типа (1) и суммами случаИных величин. Пусть -

последовательность независимых одинаково

распределённых случаИных величин с математическим ожиданием и дисперсиеИ М^ = 0, = 1, удовлетворяющих условию Крамера: существует Х> 0 такое,

п

что у(Х) = Мехр (Х^) < ^ . Обозначим 8п = ^ Ъ,к.

к = 1

Требуется определить вероятность Р(Бп > х) в том случае, когда х зависит от п так, что существует а > 0 и

х = ап (а не х = а4П , как в центральноИ предельноИ теореме). Решение имеет следующиИ вид [1]:

P(S > аn) ~ exp{-пЛ(а)}/с(а, n),

(7)

где

Л(а) = - lim - lnP(Sn > аn) > 0

n — »n

Такая грубая форма представления результатов (с точностью до логарифмическоИ эквивалентности), показывающая экспоненциальную скорость сходимости, но не содержащая константы с(а, п) , широко используется в теории больших уклонениИ. Можно отметить ещё, что грубая форма (8) является прямым следствием экспоненциального неравенства Чебышова

Р(Бп > х) < ехр(-Хх)Мехр(ХSn)=ехрп{-аХ+1пу(Х)}.

Для марковских процессов (2) вероятность больших уклонениИ мы будем оценивать именно в грубоИ форме. Аналогом функции уклонения в этоИ бесконечномерноИ задаче оказывается нормированныИ функционал деИст-вия [6]

Т2

5(ф) = Snт2(Ф) = ||(о(ФР)-1 ^- я(ф^)|2dt. (9)

Приведём результат Вентцеля-ФреИдлина, для чего сформулируем условия относительно системы, которая получается в результате замыкания исходноИ системы (1) управлением (5), (6):

xt = a(xt) + eo(xt)wt,

(10)

Л(а) = -inf (- аХ + lny(X)) = аХ(а) - lnу(Х(а)), c(а, n) = л/2nnсаХ(а).

Определяющую роль в оценках вероятностеИ больших уклонениИ играет функция уклонения Л(а) , для котороИ из (7) имеем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где вектор переноса a зависит регулярным образом от малого параметра.

А). Вектор-функция a(x) и матричная функция У (x) = о(x)оT(x) в Rn ограничены и равномерно непрерывны.

Б). Матрица x) = о(x)оt(x) при любом x симметрична и равномерно невырождена.

Пусть (x, Px) - диффузионный процесс в Rn с пере-

2

носом a(x) , матрицей диффузии 8 ^(x) и начальной

точкой xо = x , причем a(x) при 8 — 0 равномерно

сходится к a(x), то есть lim a(x) = a(x) и предель-

8 —> 0

ный вектор переноса a (x) и матрица диффузии x) удовлетворяют условиям А и Б. Пусть, далее, функционал S задается формулой (9). Тогда 8-2S0т(ф) является функционалом действия для семейства процессов (x,Pд) при 8—0 в смысле метрики Р0т(ф,^)=qUPj,|ф -Vt|

равномерно относительно начальной точки. Это означает, что, совершенно аналогично (8), для любого регулярного борелевского множества Fd с X

lim 82 lnP(Fd) = -inf {S(x) :x 6 FD}

8 — 0 +

(11)

Переходя к понтрягинской форме задачи, обозначим в (9)

(G(фt))-1(фt-a(фt)) = vt = v(t),

что равносильно введению функционала действия в форме

1(V) = /0 (V) = 8(V) = 2, 1 = 8 . (12)

0 1

У

Фг = а(Фг) + о(ф{)vt, Ф0 = X .

(13)

фЁ Еп с X = С(

0tf

(14)

0t

оценку

Рд = ехр(—8 5)

(15)

стабилизирующих и таким образом, что на движениях (3) обеспечивается с учетом (2), (4)

^0 =

¿0о(и)

ё иv Ё^/0о( V)

(16)

Теперь, по построению, ограничение необходимо записать в виде

Сюда еще следует добавить условие принадлежности траектории ф множеству А (событие, вероятность которого оценивается) из семейства функций, непрерывных на отрезке

Результатом решения этой задачи в случае В = О^ является тройка ф, ) , определяющая минимальное значение (12) I = (V-) = 8 2 , и искомую

вероятности Рд выхода фазовой точки (1) на границу ЭО^ области притяжения состояния . В случае превышения этой величиной некоторого порогового значения Р* , в системе должен быть предусмотрен переход на более интенсивное управление и*(t) , парирующее кризисное развитие процесса. Вопрос синтеза такого управления представляется вполне ясным и здесь не рассматривается.

Таким образом, вероятностная трактовка возмущений в системе (1) и последовательное применение вероятностно-асимптотических методов (можно сказать вероятностных, так как теория вероятностей не мыслима без асимптотических методов) позволяют процедуру синтеза в задаче п. 1 формировать в виде композиции алгоритмов двух типов: локальной стабилизации (5), (6) посредством управления UJ и глобального контроля больших уклонений (12)-(15) с оценкой критической вероятности Рэ и, в случае Рэ > Р* , перехода на любое

антикризисное управление и*(t) , приводящее фазовую точку за короткое время в окрестность . Такой способ назовем вероятностно-асимптотическим методом композиционного синтеза (ВАКС-методом).

3 ГАРАНТИРУЮЩИЙ МЕТОД РОБАСТНОГО Н° - УПРАВЛЕНИЯ И ЕГО СРАВНЕНИЕ С

ВАКС-МЕТОДОМ

Пусть возмущения в (3) принадлежат классу функций V, квадратично интегрируемых на положительной полупрямой. Управления будем выбирать из множества

Это соответствует гашению в максимально возможной степени "энергии" от внешних возмущений посредством стабилизирующих (демпфирующих) управлений [3]. Решение указанной задачи существует вместе с неотрицательно определённым решением Р уравнения Риккати

РА + АТР - Р(р-2ВВТ- т2ССТ)Р + 6 = 0 (17)

и оптимальное управление в рассматриваемом случае полной информации о векторе состояния определяется соотношениями (5), (17). Указанная задача эквивалентна предельному случаю хорошо известной дифференциальной игры [7] для уравнения (3) с критерием

¿0 {(и) -10 (V) при tr . Построенное таким обра/ / ^

зом управление оказывается наилучшим при возмущении, наихудшем из допустимых, чем и объясняются гарантирующие свойства такого решения.

Слабые стороны метода робастного Н° - управления неоднократно отмечались. Они связаны со сложностью определения константы (16) и вытекающими отсюда проблемами существования решения уравнения (17). Для нас важно другое обстоятельство: полная информированность управляющей стороны о векторе состояния линеаризованной системы (уравнение (5)), а значит и о векторе исходной системы (1) ( х(=Х( t) + ) здесь совершенно не используется для контроля уклонений от состояния равновесия - алгоритм управления априорно сориентирован на наихудшее в смысле (16) возмущение V*. Очевидно, что это совсем не то, что требуется в рамках задачи п.1.

ЗАКЛЮЧЕНИЕ

Сопоставление двух подходов в задаче стабилизации состояния равновесия нелинейной динамической системы (а реальные системы всегда нелинейны): стохастического композиционного и детерминированного гарантированного показывает, что оба используют аналогичные конструкции для описания интенсивностей изменения управления, состояния и возмущения. Во многих случаях применение композиционного метода представляется более целесообразным, так как позволяет контролировать и парировать действительно наихудшее движение системы в направлении потери устойчивости. Не менее важно и то, что в случае штатного развития процесса ВАКС-метод обеспечивает оптимальность, чего также нет в гарантированном методе робастного Н° -управления. Вообще, на ВАКС-метод можно смотреть как на средство семантизации (структурирования) информации [8]. Как показывает опыт дисциплин, ориентированных на управление сложными процессами

В.Г. Козырев: ОПТИМАЛЬНЫЙ РЕГУЛЯТОР ВЫХОДА СИНГУЛЯРНО ВОЗМУЩЕННЫХ СИСТЕМ

в условиях неопределенности - системы искусственного интеллекта, объектное проектирование - системы управления должны строиться как преобразователи семантической информации. У этого вывода есть и другая сторона: регулятор должен представлять из себя сеть, причем, все элементы сети синтезируются заранее, off-line, а реконфигурация сети осуществляется в процессе управления, on-line, по мере поступления данных о действии возмущений.

ПЕРЕЧЕНЬ ССЫЛОК

1. Боровков A.A. Теория вероятностей. - М.: Наука, 1986. -431с.

2. Поляк Б.Т., Щербаков П.С. Робастная устойчивость и управление. М.: Наука, 2002.

3. Баландин Д.В., Коган М.М. Оценка предельных возможностей робастного - управления линейными неопределенными системами //A и Т.- 2000.- №10.- С. 117-124.

4. Дубовик С.А. Аналитическое конструирование регуляторов для сингулярно возмущенных систем // Проблемы управления и информатики.-1999.- № 5.- С.54-68.

5. Дубовик С.А. Синтез линейных сингулярно возмущенных систем //Динам. системы.- 1999.- Вып.15.- С.45-49.

6. Вентцель А.Д., Фрейдлин М.И. Флуктуации в динамических системах под действием малых случайных возмущений.- М.: Наука, 1979.- 424с.

7. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного результата. - М.: Наука, 1985. - 520с.

8. Чечкин А.В. Математическая информатика.- М.: Наука, 1991. - 416с.

Надшшла 05.09.2003

Розглядаеться задача стаб1л1зацп одного 3i cmanie pie-новаги нeлiнiйного слабко збуреного об'екта e умоеах пов-ноЧ iнфоpмaцi'i про вектор стану. Для pi-шення зaдaчi про-понуеться iмовipнicно-acимпmоmичний метод, заснований на функцiонaлi дИ. Даний пiдхiд поpiвнюemьcя з гаранто-ваним керуванням, що е pi-шенням зaдaчi робастного H синтезу.

The problem of stabilization of one from balance states from of the nonlinear poorly disturbed object in conditions of the full information of a state vector is considered. For the decision of the problem it is offered probabilistic-asymptotic method based on functional of action. The given approach is compared with the guaranteed management being the decision of a problem robust - Synthesis.

УДК 517.92

В.Г. Козырев

ОПТИМАЛЬНЫЙ РЕГУЛЯТОР ВЫХОДА СИНГУЛЯРНО ВОЗМУЩЕННЫХ СИСТЕМ

Построено асимптотическое приближение оптимального терминального регулятора выхода сингулярно возмущенных систем, равномерное по области управления. Приближение представлено в общей композиционной форме решения линейно-квадратичной задачи оптимального управления.

ВВЕДЕНИЕ

Движения управляемых технических объектов обладают обычно свойством разномасштабности (различия характерных времен). Оно заключается в наличии у движений быстро и медленно изменяющихся составляющих. Например, среди движений летательного аппарата можно выделить медленные линейные и быстрые угловые. Линейные движения Л А - это движения его центра масс. Они всегда более размеренные, плавные, чем резкие и нерегулярные угловые движения - вращения вокруг центра масс. ЛА значительно более инерционен по отношению к поступательному движению, чем к вращательному. Разномасштабность наблюдается и у движений других объектов - быстроходных судов, электроэнергетических установок с быстродействующими аппаратами управления, силовых электроприводов, радиофизических приборов с паразитными емкостными и индуктивными связями и др. У всех этих объектов имеются составляющие движения, одни из которых изменя-

ются медленно, а другие - быстро, причем различие характерных времен составляет порядок и более. Аналогичное свойство появляется и у системы управления объектом. Подобная система также будет обладать быстро и медленно изменяющимися составляющими в законе управления. Даже если управление осуществляется только по одномасштабным параметрам, это происходит в силу многосвязности объекта.

Наличие быстрых движений у динамических систем затрудняет их исследование. Оно принудительно навязывает малый шаг интегрирования при численном моде-лированиии, увеличивает машинное время решения задач, приводит к накоплению ошибок интегрирования, затрудняет расчет законов управления и их реализацию при встраивании в бортовые компьютеры объектов. Подобная особенность известна под названием жесткости систем.

Являясь затрудняющим фактором вообще при исследовании систем, различие характерных времен движений может быть обращено, тем не менее, на получение преимуществ при таком исследовании. Это удается сделать, если можно применить асимптотические методы. В настоящей статье выполнено асимптотическое исследование оптимального регулятора выхода представленных систем. Свойство разномасштабности выража-

i Надоели баннеры? Вы всегда можете отключить рекламу.