Научная статья на тему 'Регуляризованный метод оценивания состояния управляемых систем'

Регуляризованный метод оценивания состояния управляемых систем Текст научной статьи по специальности «Математика»

CC BY
53
12
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Бурлай И. В., Бондарь А. И.

В классе функций с финитным спектром разработан эффективный в вычислительном плане регуляризованный метод оценивания состояния управляемых динамических систем, характеристики которых заданы в виде совокупности отсчетов. Развитый подход позволяет существенно расширить классы решаемых задач и способы задания объктов управления; допускает эффективную реализацию на ЭВМ и направлен на распараллеливание вычислительного алгоритма.The effective regular method of estimating control systems parameters which characterize has been set in form greed massive has been elaborated.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Регуляризованный метод оценивания состояния управляемых систем»

пактную векторно-матричную форму записи, что весьма важно в системах оптимального управления, функционирующих в реальном масштабе времени.

Литература

1. Красовский А.А. и др. Универсальные алгоритмы оптимального управления непрерывными процессами. М., 1987.

2. Моисеев Н.Н. Элементы теории оптимальных систем. М., 1975.

3. Справочник по теории автоматического управления / Под ред. А.А. Красов-ского. М., 1987.

4. Буков В.Н. Адаптивные прогнозирующие системы управления полетом. М., 1987.

5. Булычев Ю.Г., Бурлай И.В. // А и Т. 1996. № 3. С. 34-46.

6. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М., 1971.

7. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. М., 1975.

8. Булычев Ю.Г., Бурлай И.В. // ЖВМ и МФ. 1997. Т. 37. № 9. С. 213-217.

9. Прудников А.П., Брычков Ю.А., Маричев О.И. Интегралы и ряды. М., 1981.

10. Булычев Ю.Г., Бурлай И.В., Манин А.А. // А и Т. 1994. № 7. С. 37-48.

11. Цыпкин Я.З. Основы информационной теории идентификации. М., 1984.

12. Бесекерский В.А. Цифровые автоматические системы. М., 1976.

Южно-Российский государственный университет

экономики и сервиса, г. Шахты 20 января 2005 г.

УДК 517.938

РЕГУЛЯРИЗОВАННЫЙ МЕТОД ОЦЕНИВАНИЯ СОСТОЯНИЯ УПРАВЛЯЕМЫХ СИСТЕМ

© 2005 г. И.В. Бурлай, А.И. Бондарь

The effective regular method of estimating control systems parameters which characterize has been set in form greed massive has been elaborated.

Введение

Современный этап развития науки и техники характеризуется неуклонным усложнением систем, оптимально управляемых в соответствии с заданным критерием качества. Данная тенденция обусловлена широким внедрением современной вычислительной техники на всех уровнях, начиная от локальных управляемых систем и кончая внешними контурами управления в больших системах [1-4].

Для синтеза управляемых систем уже давно используются методы оптимизации по строго заданным критериям, которые приводят к нелиней-

ному уравнению в частных производных первого порядка, часто называемого уравнением Беллмана [1]. Однако на практике применение данных методов сопряжено со значительными трудностями, обусловленными объемом вычислений и реализацией полученных решений.

В данной работе в классе функций с финитным спектром разработан эффективный в вычислительном плане регуляризованный метод оценивания состояния управляемых динамических систем, характеристики которых заданы в виде совокупности неравноотстоящих отсчетов.

Постановка задачи

Пусть управляемая динамическая система описывается уравнением

* + f (х, t) = р(х, t)и + , t е [7о, T], (1)

где * е К" - вектор параметров системы; функция f е К" непрерывна по совокупности аргументов и дифференцируема по * необходимое число раз; ф е К" х Кт непрерывна по совокупности аргументов; 4 е К" - формирующий белый гауссовский шум с нулевым математическим ожиданием М[4] = 0 и корреляционной матрицей М[4(0 Й(0] = - 7) Sx -матрица спектральных плотностей формирующих шумов; 5(-) - дельта-функция; и е Кт - вектор управлений, оптимизирующих функционал обобщенной работы [5]

M [J ] = M

t i T

V3 + JQ(x,t) dt+ —J(uTk-2u + uTTkdt t- 2

•t„

(2)

где У3 = У3[х(Т)], Q = Q(x, t) - заданные положительно определенные функции; к - матрица известных коэффициентов.

Для динамической системы (1) оптимальными в смысле минимума функционала (2) являются управления [5]

и0 =-к2рТ (X, О , (3)

дх

где х - оценка вектора состояния х; V = У(х, 7) - решение уравнения

дУ Т(дУЛ I

77"' [дН у1"=уз. (4)

Как показано в [5, 6], наиболее эффективный с точки зрения минимума вычислительных затрат метод решения уравнения (4) основан на использовании операционного ряда, каждый последующий член которого получается из предыдущего посредством применения линейного дифференциального оператора Ь

М-1 тУ

у = Уз + Х— Ь"-1( ЬУз + Q), (5)

V

=1 V!

где L = -fT(d/dx), т = T - t > 0 - относительное «обратное» время.

— (х - i Дх) Дх

x £ [-X, X], (6)

Предположим, что для функций/, У3, Q, V, фигурирующих в алгоритме (5), с заданной степенью точности справедливо представление в виде конечного интерполяционного ряда Котельникова [3]

N

Р = 2 Р вше

где Р = Р(х) - некоторая обобщенная функция фазовых координат; А = п - шаг между равноотстоящими отсчетами Р/ = Р(/А) функции Р(х); ^ - максимальная частота спектра ¥(1ю) функции Р(х); вше [х] = = Бте х / х.

Известно, что функция Р(х), рассматриваемая на всей вещественной оси (-да, да), может быть отнесена к классу функций с финитным спектром.

Введем в рассмотрение неравномерную сетку интерполяции

-X = х^< х^+1 < ... < XN = X, (7)

в узлах которой заданы отсчеты Р(х) / = 0, ±1,...±^ функции Р(х) на отрезке [-X, X].

Уравнение наблюдения имеет вид

2 = к(х, /) + п, / е [/о, Т], (8)

где 2, к, п2 е Л8, п2 - белый гауссовский шум с корреляционной матрицей М[п2 (/')цт2 (/")] = (/')8(//'); - матрица спектральных плотностей шумов наблюдения. Шумы £х и ц2 полагаем некоррелированными между собой, функцию к считаем непрерывной по совокупности аргументов.

Интервал наблюдений [/0, Т] разбивается на достаточно короткие циклы Д/;- = /у+1 - /у, ' = 0,3, при этом оценка начального состояния

х0 = х (/0) полагается известной, точность данной оценки характеризуется корреляционной матрицей Щ/0) = Я0.

Управление на каждому'-м шаге и(/) (где / е [' г^]) определяется по формуле

. (9)

U]=и , tj j=-k2<pr (х/, tj ipd"

Требуется с учетом (2)-(9) оценить по критерию минимума средне-квадратической ошибки вектор состояния управляемой динамической системы (1), при этом для синтеза оптимальных управлений необходимо разработать новый вариант операционного метода (5) с учетом неравномерной сетки интерполяции (7).

Для решения поставленной задачи в настоящей работе используется принцип разделения, согласно которому комплексная управляемая система состоит из фильтра Калмана, формирующего оценку вектора состояния

х, и системы управления, причем в последней для определения управляющих воздействий вместо х используется оценка х [5-7].

Интерполяция в классе функций с финитным спектром на неравномерной сетке

Известно [8], что использование конечного числа отсчетов приводит к неединственности задачи интерполяции. Для того чтобы решение было единственным, необходимо сузить класс функций до W™n с при этом один из путей сужения состоит во введении ограничений экстремального типа: из всех интерполирующих функций Р^(х), представимых рядом Котельникова

П

Pn (x) = X PN ('А) sinc

-(x - iA)

x e (-«, да),

(10)

выбирается та, для которой полная энергия минимальна.

С учетом сказанного экстремальная задача определения функции PN(x)

~ jjr min

с минимальной полной энергией из класса Wa сводится к определению

да

величин PNi = PN(iA), i = 0, ±1,..., минимизирующих сумму E = X PN ^

'=-да

^ min и удовлетворяющих 2(N + 1) дополнительным условиям

П

PN (xn ) = X PNi SinC

"(xn — iA)

= P(xn), n = 0,±1,..., ±N. (11)

Для решения данной задачи используем метод неопределенных множителей Лагранжа [8]. С учетом (5), (6), (10), (11) интерполяционная формула для класса W™n функций с минимальной полной энергией будет имеет вид

N

Pn (x) = X P(x) X aml sinc

i=—N

m=—N

П ( x — xm )

A

x e (—да, да),

(12)

где ami - элементы матрицы А = {ami}, обратной матрице A 1 =

= < sin c

"(xm — xi )

системы уравнений

N

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

X Кsinc

m=—N

П (xm — xi )

A

= Р (хг), г = 0, ±1,..., ± N,

Хт - неопределенные множители Лагранжа.

Синтез управляющих воздействий

Для одномерного объекта выражение (5) можно представить в виде

[10]

V = Ff/V-,f (^-2), V3, V3(1),..., V3(M), Q, Q(1),..., ß(^-2))

где F(-) - известная функция своих аргументов,

1=—да

1=—да

/О') д, /(0) = /; V« =^^3., ^3(0) = Кз; О*' ', Q(0) = Q. (14)

дх1 дх1 дх1

Используя метод у-кратного дифференцирования функций, для которых справедливо представление (12), запишем выражение для вычисления

(у)

производных РN (х) в отсчетных точках (7) [9]:

, . N

Pr\x) = S PX)

k=-N

<sin

N

Y

¿^ umk ¿-, /

m=-N j=0

П ч п

- (Xi - Xm ) + J -

"J i п

J! 1 -

п

+aik 1 - 1

)

J-1

) j-Y-1 ,

ч//2

Y+1

для четных у, у e {2, 4,...}, i = 0, ±1,..±N,

P№( X) =

N N Y (-1)

= S P(Xk) S amk SY—

k=-N m=-N j=0 J

--J ПJ-1

(X - Xm ) J Y 1 sln

- (X -Xm ) + J -

(15)

(16)

для нечетных у, у е {1, 3,.}, / = 0, ±1,.,

Формулы (15), (16) составляют математическую основу алгоритма управления в классе функций с финитным спектром на неравномерной сетке интерполяции. С учетом (14)-(16) для вычисления функции V в отсчетных точках отрезка [-X, X] можно воспользоваться следующим приближением

VN(х) = Р[^(х),х),...,^(х,), (х), х),..., Кз%1}( х,), QN (х), Qwl( х),..., QNJ-2)(х/)],

где / = 0, ±1,., ±N.

(17)

Для восстановления на каждом j-м шаге функции VN в точке x = xj воспользуемся записью теоремы Котельникова для неравноотстоящих узлов интерполяции

N N

VN (x) = S VN (X ) S am SinC

i =-N m=-N L ^ Jx= Xj

t=tj

С учетом (13), (17), (18) алгоритм оптимального управления примет следующий вид (для одномерного объекта):

П (X - Xm ) -

(18)

N

Uj =-к <p(xj,tj) 2 Vn(x) 2 a„

'] I " Ny-^iJ

' i=-N m=-N

sin

п { \

Д (x - xm )

П , ч2

~(x - xm )

д

cos

п

д (x - xm )

x - xm

(19)

x=xj t=t,

Обобщение полученных результатов для многомерных динамических систем не вызывает принципиальных затруднений и сводится по аналогии с [3] к применению развитого подхода по каждой из пространственных координат вектора состояния управляемой системы.

Регуляризация исходной задачи Полученные формулы у-кратного дифференцирования (15), (16) справедливы применительно к функциям с ограниченным спектром. Однако на практике нелинейные функции, фигурирующие в алгоритме (13), зачастую не могут быть отнесены к классу Wn. В этом случае целесообразно использовать операцию домножения на функцию-регуляризатор.

В качестве функции-регуляризатора по аналогии с [10] используем функцию срезывающего типа

х-5 2

дг5(x) = J co5l2(x - s)ds.

-х+5

2

(20)

Структура ядра интеграла (20) определяется следующими вспомогательными функциями [11]:

со( x) =

1

1

-exp

l \ 1 - xL

о, |x| -1'

x < 1, 1 (x

ah (x) = Ц Ц

где l = J exp

-1

1 - s2

ds - нормировочный множитель; к > 0 - радиус ядра усреднения. Функции ю(х) и юк(х) - четные, неотрицательные, бесконечно

ад

дифференцируемые на (-да, да); юк(х) = 0 при |х| > к, | сок (x)dx = 1.

-ад

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Регуляризацию исходной задачи можно осуществить с помощью сплайн-функций. В этом случае осуществляется преобразование вида [10]

+

+

'Р(х), х е [-X, X], Р(х) = |&(х), х е (-ад,-X], (21)

g2(х),х е [X,ад),

где g1 (х) и g2(x) - вспомогательные функции, имеющие на полуоткрытых интервалах (-да, X] и [X, да) соответственно производные до порядка у включительно.

Очевидно, что соотношения (21) необходимо дополнить соответствующими условиями стыковки:

|g1(г)(-X) = Р(|)(-X), I = 0,1,...,1, (g2г)( X) = Р(|)( X), I = 0,1,..., х-1.

Синтез алгоритма оптимального оценивания

Рассмотрим теперь задачу оценки вектора состояния системы (1) с учетом полученных управлений. Известно, что при условии достаточной

точности наблюдения условное математическое ожидание х определяется как выходная величина нелинейного фильтра Калмана [5, 6]:

x+ f (x, t) = K[z - h(x, t)] + p(x, t)Uj, x (tj ) = xj, t e [t,, tj+1], j = 0, J,

K = R

f -Л dh

dx v у

S-

\T

i Л

( -ЛT

R + df R + R d f + R dh s-1 dh

dx dx dx dx

R = Sx, R(t,) = R,

(22)

(23)

(24)

] = 0, J,

где К = М[(х - х)(х - х)т ] - корреляционная матрица ошибок оценивания; (д // дх),(дк/дх)- матрицы частных производных (матрицы Якоби),

взятые в точке оценки состояния х = х^.

С учетом (15), (16), (19) уравнение (22) для одномерного объекта примет следующий окончательный вид:

N N *

x+ f (x, t) = K[z - h(x, t)] -p2(x, t)к2 2 VN (xt) 2 a„

x (tj ) = ^ , t e [tj, tj+! ], j = a J,

(25)

m=-N

где ami = an

sin

П \

Д (X - Xm )

cos

П \

Д ( x - xm )

П \2

Д (Х - Xm )

X - Хт

X = Xj t=t,

Таким образом, уравнения (23)-(25) определяют систему пошагового оценивания вектора состояния управляемой системы (1).

Структура комплексной системы управления - оценивания, построенная в соответствии с синтезированным алгоритмом, должна состоять из двух информационных каналов: оценки вектора состояния и оценки управляющих воздействий. Следует отметить, что задачу неравномерной интерполяции, а также синтез алгоритма управления можно осуществить на этапе проектирования комплексной системы оценивания - управления, а в ходе функционирования последней необходимо лишь учитывать текущую оценку X = Xj. К числу достоинств разработанного алгоритма следует отнести то, что он не требует аналитичности функций f Q, V3, которые, как и характеристики объекта, могут быть заданы в графической или табличной форме [5, 6].

Заключение

Развитый в статье подход позволяет существенно расширить класс решаемых задач и способы задания объектов управления.

Достоинством предложенного метода является также его универсальность: при переходе от одного управляемого объекта к другому достаточно изменить лишь массив априорной информации, при этом характеристики динамической системы могут задаваться в графической или табличной форме.

Разработанный метод допускает эффективную реализацию на ЭВМ и направлен на существенное распараллеливание вычислительного алгоритма, поскольку позволяет заменить итерационную процедуру вычисления членов операционного ряда конечными аналитическими соотношениями.

Литература

1. Тихонов В.И., Харисов В.Н. Статистический анализ и синтез радиотехнических устройств и систем. М., 1991.

2. Таран В.Н. // А и Т. 1991. № 8. С. 80-89.

3. Булычев Ю.Г., Бурлай И.В. // Изв. РАН. Техн. кибернетика. 1993. № 6. С. 166173.

4. Бурлай И.В. // Изв. РАН. Теория и системы управления. 1997. № 4. С. 51-60.

5. Красовский А.А. // Изв. РАН. Техн. кибернетика. 1992. № 1. С. 1-39.

6. Красовский А.А., Буков В.Н., Шендрик В.С. Универсальные алгоритмы оптимального управления непрерывными процессами. М., 1977.

7. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. М., 1975.

8. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М., 1971.

9. Булычев Ю.Г., Бурлай И.В. // ЖВМ и МФ. 1997. Т. 37. № 9. С. 213-217.

10. Толкачев А.П. Математическое моделирование управляемых производственных процессов // Социально-экономические и технико-технологические проблемы развития сферы услуг: Сб. науч. тр. Ростов н/Д, 2003. Т. 2. С. 74-81.

11. Треногин В.А. Функциональный анализ. М., 1980.

Южно-Российский государственный университет

экономики и сервиса, г. Шахты 20 января 2005 г.

УДК 681.518

МЕТОД АНАЛИЗА СЕТЕВОЙ МОДЕЛИ ПРЕДСТАВЛЕНИЯ НЕЧЕТКИХ ЗНАНИЙ

© 2005 г. Д.В. Фатхи

For solving the solution of the analysis task there are definitions of the functions of the reaching and the net derivative in the article covering the model of representing knowledge.

В практике разработки и применения интеллектуальных систем управления в различных сферах человеческой деятельности все большее значение приобретают нечеткие интеллектуальные системы. Специфика вывода знаний в нечетких интеллектуальных системах состоит в обработке функций принадлежностей нечетких фактов, используемых в выводе. Повышение производительности таких систем можно осуществить путем распараллеливания процессов вывода знаний.

Признанный метод описания параллельных процессов базируется на математическом аппарате сетей Петри [1]. При маркировании позиций сети Петри функциями принадлежностей нечетких множеств, представляющих факты и реализующих в переходах сети операции над нечеткими множествами, можно осуществлять различные преобразования, в том числе, осуществлять нечеткий вывод знаний.

Известна нечеткая сеть Петри в виде биграфа [2]. Для применения нечеткой сети Петри в качестве сетевой модели представления знаний (СМПЗ) достаточно использовать лишь три вида переходов предложенной формальной системы. Тогда она представляется в виде пятерки: FNP = {T, P, I, O, Mo}, где P - конечное множество позиций, P = {р,}, i = 1, n ; T-конечное множество переходов, T = {/,}, j = 1,m; I : T x P ^ {0, 1} -

i Надоели баннеры? Вы всегда можете отключить рекламу.