О непараметрических алгоритмах управления дискретно-непрерывными процессами

Низамеев А.Р.

Математика, механика, информатика

УДК 62.501

А. Р. Низамеев

О НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМАХ УПРАВЛЕНИЯ ДИСКРЕТНО-НЕПРЕРЫВНЫМИ ПРОЦЕССАМИ

Предложены схема и алгоритмы управления дискретно-непрерывными процессами. Рассмотрены модификации алгоритмов, учитывающие взаимодействие с лицом, принимающим решение, наличие вещественных, целочисленных и булевых переменных.

Рассмотрим задачу управления дискретно-непрерывным процессом, входные и выходные характеристики которого имеют вид вещественных, целочисленных и булевых переменных (см. рисунок).

Регрессия (условное математическое ожидание) является оптимальной, в смысле квадратичного критерия

Я = М {(X - х) | и} = ш1п .

(1)

моделью истинных зависимостей. Здесь х - оценка вектора выхода объекта X.

Используя необходимое условие минимума, т. е., приравняв производную функции К по искомой величине х к нулю, получим ¿Я / ¿х = -2М {(X - х) | и} = 0, отсюда

х = М{Х\и}. (2)

Непараметрическая оценка регрессии для векторного случая имеет вид

Ф

Схема управления процессом

На рисунке приняты следующие обозначения: х(г) = ((X ■■■, *к(г)) - вектор выходных переменных процесса; и(г) = (),..., ит (г)) и ц (г) = (ц^г), ..., ц п (г)) - соответственно управляемые и неуправляемые контролируемые переменные, состоящие из т и п компонентов; £ (г) - случайные возмущения; н, ни, нх - случайные ошибки измерения, такие что М{Н} = 0, В{И} < ^ ; *

х (г) - желаемое значение выходной переменной, t - время.

На первом этапе (ключ К1 разомкнут) решается задача идентификации; на втором этапе (ключ К1 замкнут) решается задача управления объектом с участием лица, принимающего решение (ЛПР), после этого ключ К 2 замыкается.

При управлении дискретно-непрерывными процессами целесообразно использовать теорию адаптивных и обучающихся систем. Задачи идентификации, управления и принятия решения в стохастических системах рассматриваются в условиях непараметрической неопределенности (когда не известна параметрическая структура модели исследуемого процесса), поэтому предлагается использовать регрессионные модели.

Пусть х,, и,, ц,, где t - дискретное время, являются наблюдаемыми переменными. Необходимо найти алгоритм работы управляющего устройства для выработки такого управляющего воздействия на систему, что выход процесса в каждый текущий момент времени ^ = 1, 2, ...) как можно меньше отличался бы от желаемого х*(г) .

Для решения задачи управления используем элементы непараметрического подхода [1.. .3], который предполагает использование непараметрической оценки регрессии в качестве модели истинных зависимостей.

где Ф

1=1 1=1

1 -„ 1

Схк

£ I

/ X ПФ

1=1 1=1

схк

(3)

к

Сх

- ядро функции, выбирается из следую-

и£+\ - и г1

щих условий:

- |Ф(¿¿2 = 1, где г =

- ядро функции колоколообразное, т. е. Ф(г1) < Ф( 22), для | 72 |<| 21 |;

Сх

к 5

^Ф(2)^ <~ ,р = 2, 3, ... .

Параметр размытости Сх ядра Ф удовлетворяет условиям Сх — 0 и пСх (п) —■ го .

п—п—

При выполнении двух условий оценка х является асимптотически несмещенной, состоятельной, асимптотически нормально распределенной.

Приведем примеры треугольного, параболического и кубического ядер:

Ф(2 )~-

1- | 2 |, ¡Г | 2 |< 1, 0, ££ | 2 |> 1;

_2ч

Ф(2 )=^(3/4}(1 - 2 2),1£|2|< 1 } 0,1Г | 2 |> 1;

Ф(2 ) =

(1 + 2 | 2 |)(1- | 2 |)2,Г| 2 |< 1,

(4)

(5)

(6)

0, ¡Г| 21> 5.

Параметр размытости С выбирается по условию выполнения минимума квадратичного критерия:

Я =Х (Хг - Xг (Сх ))2

— Ш1П

Сх

(7)

где ^ - размер обучающей выборки, с помощью которой методом скользящего экзамена выбирается оптимальный на этой выборке С :

к

Cx,

n Ф i. (8)

ф^^ шф

п=1 т=1

V У V У

Рассмотрим последовательный непараметрический алгоритм управления.

Пусть мы имеем ситуацию, когда отсутствует обучающая выборка, а текущая информация об объекте поступает в устройство управления последовательно (активное накопление информации). Тогда обучающийся непараметрический алгоритм управления на такте t = 5 имеет вид

% = м/ + Дм ■£ , (9)

гдем - оценка вектора входа; Дм^ - изучающая добавка [3],

и/ є (и

J и^

min5 max

) >

5-1

Eu' Пф

f=i

i=i

( *f f Л n a a

x s - xi П ф р=1 V s- V

4 0 с р сц У У

k

Пф

f=i

*f f

x S - xi

C

f

Пф

р=1

( цр- црЛ

C р

сц

Пф

i=i p=i

( *р V Л n / \ і р р

X s Xj [П* р=1 Hs Мі [лф j=1 U s

с/ ср У ^ J ср

ЕПф

i=1 p=1

C:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пф

p=i

Ир-Ир

C р

сц

Пф

j=1

з р р

U s - Uj

j=і,m, s—2, з, ..., м/ є (иmm

CP

;) -

Пусть {и(г), ц(/), х(г), г = 1,5 -1} - обучающая выборка, состоящая из наблюдения входа и выхода объекта. Непараметрический алгоритм управления в этом случае имеет вид

5-1 к

EU Пф

i=i p=i

*р „р

x s - :

c:

Пф

р=1

Цр-Цр

C р

сц

Пф

j=i

з P и s -

S-1 к i=1 р=1

*р „р

x s - x

n

Пф

р=1

Цр-Цр

ср сц

Пф

j=1

зр р

U s - Щ

(13)

ср

(10)

(11)

3 = 1,т , 5 = 2, 3,... .

На начальном этапе управления, когда фактически идет процесс обучения, доминирующую роль играет изучающая добавка. Это связано с малой обученностью системы и соответствует выработке пробных шагов, которые могут носить случайный характер, если отсутствует дополнительная априорная информация. По мере изучения объекта при формировании и^ все большая роль начинает принадлежать и3 [5].

При управлении реальным процессом естественно использовать опыт обслуживающего персонала (оператора, технолога-эксперта). Для того чтобы использовать опыт эксперта при решении этой задачи, формулу (11) в алгоритме (9) следует модифицировать в виде

5-1 к

3 =1 m, ^ - 2 3 ..., Щ е (<^<ах) , I < т .

Алгоритм (13) представляет собой оценку обратной регрессии по наблюдениям {и(г), ц(г), х(г), г = 1,5 -1}.

В случае если компонентами вектора р.¡, кроме вещественных переменных, являются переменные типа целочисленных и булевых, обучающиеся непараметрические алгоритмы несколько модифицируются.

Рассмотрим модификацию непараметрического обучающегося алгоритма управления с обучающей выборкой в этом случае:

Х“№

i=1 f=1

ПfC^ Пф[^ П

Х№[ 4^

j=1,m,s=2- 3- ..., и1є (итш, umax) - ^m ■

, (14)

. (12)

где и определяется ЛПР на каждом такте принятия решения. Но ЛПР может определить не все значения компонент вектора и, поэтому I < т .

Далее рассмотрим непараметрический алгоритм управления с обучающей выборкой.

где с и V - соответственно размеры векторов и (0 и '^^); -„<)=('• ““ ,

[0, иначе.

Таким образом, предложенные обучающиеся непараметрические алгоритмы управления могут быть модифицированы и использованы при разработке реальных компьютерных систем управления дискретно-непрерывными процессами.

Библиографический список

1. Медведев, А. В. Адаптация в условиях непараметрической неопределенности / А. В. Медведев // Адаптивные системы и их приложения. Новосибирск: Наука. Сиб. от-ние, 1978. С. 4-34.

2. Медведев, А. В. Непараметрические системы адаптации / А. В. Медведев. Новосибирск: Наука. Сиб. от-ние, 1983. 173 с.

3. Рубан, А. И. Методы анализа данных: в 2-х ч. / А. И. Рубан; КГТУ Красноярск, 1994. 220 с.

S

k

US =

s-1 к

x s

S

A. R. Nizameev

ABOUT RESEARCHINGS OF NONPARAMETRIC ALGORITHMS OF MUTUALLY CONNECTED PROCESSES

There the scheme and discrete-continuous processes control algorithms are offered. The modifications of algorithms, which are taking into account interaction with the decision maker, presence of material, integer and Boolean variables are considered there.

О непараметрических алгоритмах управления дискретно-непрерывными процессами Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Низамеев А. Р.

Похожие темы научных работ по математике , автор научной работы — Низамеев А. Р.

ABOUT RESEARCHINGS OF NONPARAMETRIC ALGORITHMS OF MUTUALLY CONNECTED PROCESSES

Текст научной работы на тему «О непараметрических алгоритмах управления дискретно-непрерывными процессами»