Математика, механика, информатика
УДК 62.501
А. Р. Низамеев
О НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМАХ УПРАВЛЕНИЯ ДИСКРЕТНО-НЕПРЕРЫВНЫМИ ПРОЦЕССАМИ
Предложены схема и алгоритмы управления дискретно-непрерывными процессами. Рассмотрены модификации алгоритмов, учитывающие взаимодействие с лицом, принимающим решение, наличие вещественных, целочисленных и булевых переменных.
Рассмотрим задачу управления дискретно-непрерывным процессом, входные и выходные характеристики которого имеют вид вещественных, целочисленных и булевых переменных (см. рисунок).
Регрессия (условное математическое ожидание) является оптимальной, в смысле квадратичного критерия
Я = М {(X - х) | и} = ш1п .
(1)
моделью истинных зависимостей. Здесь х - оценка вектора выхода объекта X.
Используя необходимое условие минимума, т. е., приравняв производную функции К по искомой величине х к нулю, получим ¿Я / ¿х = -2М {(X - х) | и} = 0, отсюда
х = М{Х\и}. (2)
Непараметрическая оценка регрессии для векторного случая имеет вид
Ф
Схема управления процессом
На рисунке приняты следующие обозначения: х(г) = ((X ■■■, *к(г)) - вектор выходных переменных процесса; и(г) = (),..., ит (г)) и ц (г) = (ц^г), ..., ц п (г)) - соответственно управляемые и неуправляемые контролируемые переменные, состоящие из т и п компонентов; £ (г) - случайные возмущения; н, ни, нх - случайные ошибки измерения, такие что М{Н} = 0, В{И} < ^ ; *
х (г) - желаемое значение выходной переменной, t - время.
На первом этапе (ключ К1 разомкнут) решается задача идентификации; на втором этапе (ключ К1 замкнут) решается задача управления объектом с участием лица, принимающего решение (ЛПР), после этого ключ К 2 замыкается.
При управлении дискретно-непрерывными процессами целесообразно использовать теорию адаптивных и обучающихся систем. Задачи идентификации, управления и принятия решения в стохастических системах рассматриваются в условиях непараметрической неопределенности (когда не известна параметрическая структура модели исследуемого процесса), поэтому предлагается использовать регрессионные модели.
Пусть х,, и,, ц,, где t - дискретное время, являются наблюдаемыми переменными. Необходимо найти алгоритм работы управляющего устройства для выработки такого управляющего воздействия на систему, что выход процесса в каждый текущий момент времени ^ = 1, 2, ...) как можно меньше отличался бы от желаемого х*(г) .
Для решения задачи управления используем элементы непараметрического подхода [1.. .3], который предполагает использование непараметрической оценки регрессии в качестве модели истинных зависимостей.
где Ф
1=1 1=1
1 -„ 1
Схк
£ I
/ X ПФ
1=1 1=1
схк
(3)
к
Сх
- ядро функции, выбирается из следую-
и£+\ - и г1
щих условий:
- |Ф(¿¿2 = 1, где г =
- ядро функции колоколообразное, т. е. Ф(г1) < Ф( 22), для | 72 |<| 21 |;
Сх
к 5
^Ф(2)^ <~ ,р = 2, 3, ... .
Параметр размытости Сх ядра Ф удовлетворяет условиям Сх — 0 и пСх (п) —■ го .
п—п—
При выполнении двух условий оценка х является асимптотически несмещенной, состоятельной, асимптотически нормально распределенной.
Приведем примеры треугольного, параболического и кубического ядер:
Ф(2 )~-
1- | 2 |, ¡Г | 2 |< 1, 0, ££ | 2 |> 1;
_2ч
Ф(2 )=^(3/4}(1 - 2 2),1£|2|< 1 } 0,1Г | 2 |> 1;
Ф(2 ) =
(1 + 2 | 2 |)(1- | 2 |)2,Г| 2 |< 1,
(4)
(5)
(6)
0, ¡Г| 21> 5.
Параметр размытости С выбирается по условию выполнения минимума квадратичного критерия:
Я =Х (Хг - Xг (Сх ))2
— Ш1П
Сх
(7)
где ^ - размер обучающей выборки, с помощью которой методом скользящего экзамена выбирается оптимальный на этой выборке С :
к
Cx,
n Ф i. (8)
ф^^ шф
п=1 т=1
V У V У
Рассмотрим последовательный непараметрический алгоритм управления.
Пусть мы имеем ситуацию, когда отсутствует обучающая выборка, а текущая информация об объекте поступает в устройство управления последовательно (активное накопление информации). Тогда обучающийся непараметрический алгоритм управления на такте t = 5 имеет вид
% = м/ + Дм ■£ , (9)
гдем - оценка вектора входа; Дм^ - изучающая добавка [3],
и/ є (и
J и^
min5 max
) >
5-1
Eu' Пф
f=i
i=i
( *f f Л n a a
x s - xi П ф р=1 V s- V
4 0 с р сц У У
k
Пф
f=i
*f f
x S - xi
C
f
Пф
р=1
( цр- црЛ
C р
сц
Пф
i=i p=i
( *р V Л n / \ і р р
X s Xj [П* р=1 Hs Мі [лф j=1 U s
с/ ср У ^ J ср
ЕПф
i=1 p=1
C:
Пф
p=i
Ир-Ир
C р
сц
Пф
j=1
з р р
U s - Uj
j=і,m, s—2, з, ..., м/ є (иmm
CP
;) -
Пусть {и(г), ц(/), х(г), г = 1,5 -1} - обучающая выборка, состоящая из наблюдения входа и выхода объекта. Непараметрический алгоритм управления в этом случае имеет вид
5-1 к
EU Пф
i=i p=i
*р „р
x s - :
c:
Пф
р=1
Цр-Цр
C р
сц
Пф
j=i
з P и s -
S-1 к i=1 р=1
*р „р
x s - x
n
Пф
р=1
Цр-Цр
ср сц
Пф
j=1
зр р
U s - Щ
(13)
ср
(10)
(11)
3 = 1,т , 5 = 2, 3,... .
На начальном этапе управления, когда фактически идет процесс обучения, доминирующую роль играет изучающая добавка. Это связано с малой обученностью системы и соответствует выработке пробных шагов, которые могут носить случайный характер, если отсутствует дополнительная априорная информация. По мере изучения объекта при формировании и^ все большая роль начинает принадлежать и3 [5].
При управлении реальным процессом естественно использовать опыт обслуживающего персонала (оператора, технолога-эксперта). Для того чтобы использовать опыт эксперта при решении этой задачи, формулу (11) в алгоритме (9) следует модифицировать в виде
5-1 к
3 =1 m, ^ - 2 3 ..., Щ е (<^<ах) , I < т .
Алгоритм (13) представляет собой оценку обратной регрессии по наблюдениям {и(г), ц(г), х(г), г = 1,5 -1}.
В случае если компонентами вектора р.¡, кроме вещественных переменных, являются переменные типа целочисленных и булевых, обучающиеся непараметрические алгоритмы несколько модифицируются.
Рассмотрим модификацию непараметрического обучающегося алгоритма управления с обучающей выборкой в этом случае:
Х“№
i=1 f=1
ПfC^ Пф[^ П
Х№[ 4^
j=1,m,s=2- 3- ..., и1є (итш, umax) - ^m ■
, (14)
. (12)
где и определяется ЛПР на каждом такте принятия решения. Но ЛПР может определить не все значения компонент вектора и, поэтому I < т .
Далее рассмотрим непараметрический алгоритм управления с обучающей выборкой.
где с и V - соответственно размеры векторов и (0 и '^^); -„<)=('• ““ ,
[0, иначе.
Таким образом, предложенные обучающиеся непараметрические алгоритмы управления могут быть модифицированы и использованы при разработке реальных компьютерных систем управления дискретно-непрерывными процессами.
Библиографический список
1. Медведев, А. В. Адаптация в условиях непараметрической неопределенности / А. В. Медведев // Адаптивные системы и их приложения. Новосибирск: Наука. Сиб. от-ние, 1978. С. 4-34.
2. Медведев, А. В. Непараметрические системы адаптации / А. В. Медведев. Новосибирск: Наука. Сиб. от-ние, 1983. 173 с.
3. Рубан, А. И. Методы анализа данных: в 2-х ч. / А. И. Рубан; КГТУ Красноярск, 1994. 220 с.
S
k
US =
s-1 к
x s
S
A. R. Nizameev
ABOUT RESEARCHINGS OF NONPARAMETRIC ALGORITHMS OF MUTUALLY CONNECTED PROCESSES
There the scheme and discrete-continuous processes control algorithms are offered. The modifications of algorithms, which are taking into account interaction with the decision maker, presence of material, integer and Boolean variables are considered there.