УДК 62.501
А. В. Медведев
К ТЕОРИИ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ
Приводятся краткие сведения о параметрической теории управления дискретно-непрерывными процессами в частности, теории дуального управления и параметрической теории адаптивных систем. Обсуждается вопрос о месте теории непараметрических систем в общей теории управления. Рассматриваются некоторые модели и алгоритмы управления в условиях непараметрической неопределенности.
Ключевые слова: дискретно-непрерывный процесс, параметрическая теория, дуальное управление, непараметрические методы, адаптивное управление, априорная информация, неопределенность, случайные помехи.
Теория - в виду практики.
Девиз конгрессов ШАС
Истинная теория должна заключаться
о одном простом, единственном начале, откуда явление берется как необходимое следствие, со всем своим разнообразием.
Н. И. Лобачевский
Введение. Ранее [1] были рассмотрены различные уровни априорной информации, возникающие в различных задачах кибернетики. Ниже мы проанализируем два уровня априорной информации: параметрический и непараметрический.
Пусть и(р) - управляющее воздействие, поступающее на объект, а х(0 - выход объекта, задающее воздействие обозначим х (Г), (0 - непрерывное время, {и, х, t = 1,5 } - выборка наблюдений и(Г) и х(Г) в дискретное время t объемом 5. Обычно в качестве критерия в теории управления берется функционал:
I
R = | (х(Ґ) - х*«)2 dt,
(1)
где Т - фиксированная величина, 0 < t < Т.
Движение динамического процесса, например, может быть задано уравнением
dnx(t) dи-1x(t)
dtn
- + а
dtn
+... + апх(^ = и(Ґ), (2)
где а - вектор параметров.
В задаче об оптимальном быстродействии требуется перевести объект из одного состояния в другое за минимальное время Т при любых начальных условиях и любой функции х*(^). При этом \и^)\ < и0,
где и0 - ограничение на управление [2].
Теория дуального управления. Феномен дуализма в системах управления был открыт в 1962 г. А. А. Фельд-буамом и в последующем существенно развит им и его последователями. Сущность дуализма состоит в том, что управляющие воздействия носят двойственный характер. Они, как замечает А. А. Фельдбаум, «должны быть в известной мере изучающими, но в известной мере направляющими» [2].
Предметом изучения является дискретнонепрерывная система (рис. 1).
Рис. 1
Приняты следующие обозначения: х*- задающее воздействие, которое через канал Н смешивается с * * шумом и поступает в качестве у5 в регулятор; выход объекта х5 проходя через канал Н и смешиваясь с шумом в виде у5 также поступает в регулятор; управляющее воздействие и5 проходя через канал G, смешиваясь с помехой gs поступает в виде V на объект, который находится под воздействием помехи £ 5; 5 - дискретное время.
Далее предполагается следующее:
- рассматриваемая задача - байесова, И*, И5, gs -
последовательности независимых случайных величин с неизменными плотностями вероятности Р( И*), Р( ), Р( ); = £(5, ц), где ц - случайный вектор с
известной априорной плотностью вероятности Р(ц). Аналогично полагаем, что х!, = х(Х, х), где X - случайный вектор с заданной плотностью вероятности Р(Х) и все внешние воздействия - £5, И*, , gs, х* -
статистически независимы;
- объект не имеет памяти и описывается уравнением х5 = F (£5, vs), где F - ограничена, однозначна и дифференцируема;
- способы комбинации сигнала и шума в блоках Н*, Н, G считаются известными и неизменными, а са-
а
0
ми блоки не имеющими памяти, т. е. у! = у (хх, ),
Vх = v(us,gs), у* = у*(х*,) вместо которых и вероятностных характеристик шумов можно сразу задать условные плотности вероятности Р(у5 / и5), Р(ух / хх),
Р( у*/ х*).
Задача состоит в определении оптимальной стратегии регулятора.
Постановка задачи. Введем удельную функцию потерь Ш(х, хх, х*), тогда общая функция потерь
Ш примет вид
=£Ш(х, х, х*).
(3)
при которых полный риск Я минимален.
Поскольку Г5 - суть плотность вероятности, то
(6)
0 К )
(8)
у,. Поскольку во втором сомножителе (8) фиксация X ничего не меняет, раз уже зафиксировано ух, то
Р(х5 / ^ ^ ^ У,^ = Р(х5 / ^ У5_1 ). (10)
Подставляя (8) в (7), с учетом (9) и (10) получим
г, = I К (5, х,*(X, 5), х, )Р(Х) X
0(Х, хг)
(11)
Хр(хх / y^, их-1, А-^0.
Следуя [2], выражение (11) преобразуется к виду
г. = | *(., х*С,ХХ хлв'Мх
0(Л,ц,х1 и)
Р( у,)
Назовем оптимальной систему, для которой полный риск минимален
Я = м} = £м(х, х, х*)} = £ Я5, (4)
і=0 х=0
где Ях - удельный риск.
Будем считать, что регулятор в общем случае обладает памятью и характеризуется случайной стратегией. Введем временные векторы их = (и0,..., их),
хх = (х0,..., хх) и по аналогии V, х*, у*, у!і ,0 < х < п.
Теперь поставим задачу отыскания оптимальной случайной стратегии регулятора, т. е. оптимальных плотностей вероятности
^, x*, уж ,0 < х < п (5)
х Р(хх / ц, х, их )-
Р(Х)П Р(у,- / Ц,*, и,-)
/=0_____________
Р(Л-1, их-1/ у**)
-х (12)
Пг(«/ у*^ и-l, у,-1^о.
Усреднение г* по у**, у**, и!_1 дает
Я = | Г5Р(У**, Л-Р и.-М0,
0( у*> Л-Ь^-О
и с учетом
Р(У*, у-1, «х-1) = P(«,-1, у-1 / у*)Р(у*)
получим средний удельный риск
(13)
(14)
я =
(х, х*(х, X), хх)Р(Х) х
где П(и,) - область возможных значений и5; dП - ее
бесконечно малый элемент. Г5, , = 0, ..., п называется удельными стратегиями, а их совокупность - полной стратегией.
Синтез оптимальной стратегии. Первый этап задачи состоит в выводе формулы полного риска. Сначала найдем условный удельный риск г,. Последний в теории дуального определяется следующим образом:
г,=м{^, / y;, у, _!}=
= | (5, х*(5, хХ х,)Р(Х х,/y;, у,-l, х,-1^П (7)
П (X, х,)
По теореме умножения вероятностей (7) можно записать
Р(Х х, /У;, у,-Р х,-1) =
= Р(Х / У;, А-Р х,-1)Р(х, / У;, А-Р х,-1).
Учитывая, что X в (8) зависит только от ух, то р(х / у;, у,-1, х,-1)=р(х / у;)=р, (X), (9)
где Р, (X) обозначает апостериорную плотность вероятности X в момент времени , на основе наблюдений
0(Х,Ц, хг , ys,us, Л-1)
Х Р(хх / ц, х, «х)Р(ц)]"7 Р(у* /,, X) х
, = 0
хПР(у, / Ц,,, и,)ПГ(«,■ /у*, и,-1, y,-l)dО. (15)
,=0 ,=0
Проанализируем формулу среднего удельного риска (15), характеризующего качество работы системы, представленной на рис. 1. Хотя объект не имеет памяти, но Ях зависит от всей последовательности Г,, , = 1, ..., х, т. е. выбор Г,, , = 1, ..., х влияет на величину Ях к х-му такту времени. В этом факте и содержится феномен дуализма. Рассмотрим ^ый момент времени k < х. Запишем полный риск в виде
я=£ я=£ я + я*+1 я.
(16)
,=1 ,=1
Анализ (16) показывает, что на ^ом шаге первая составляющая дает ошибку при прохождении ^-1)-го такта управления; второе слагаемое названо А. А. Фельд-баумом риском действия - раз мы находимся на ^ом шагу, а третье слагаемое представляет собой риск изучения. Поэтому, чтобы управление было оптимальным для , шагов, необходимо на каждом такте управления минимизировать сумму рисков действия и изучения, т. е. для k = 1, 2, ..., ,.
Для определения оптимальной стратегии дуального управления А. А. Фельдбаум использует метод ди-
намического программирования. Введем вспомогательные функции:
а* = | W(*, х;(*, а), х* )Р(Х)Пр(у* / і, X) >
а(л,ц,х^) і=0
*-1
X Р(х* / ц, s, и* )Р(ц)ПР(Уі / Ц, і, и )йЮ
* *
і=0 і=0
Я = | а*(и*, А-р у*)Р*-1(Г* ^ о =
^(й,, у,_1, у*)
= | р*-х(и*, у,-1, уМ Д
^(й,,у,-1, у,*)
где
а* = а* (и^ и*-1, у*-1 , у*) = = ™п а,(и*, Щ,-1, у,-1, у*).
г*-*=§(«,_*-«;_ *),
и**- * =С* (щ*-*-l, у*-*-1, у;- *).
(26)
(27)
(17)
р* = ПГі = ПГі (щі / у*, Щ-1, у-1)- (18)
Выпишем с учетом последних формул выражение для я*
Отсюда следует важное с практической точки зрения заключение: оптимальное управляющее устройство физически реализуемо, так как к (5 - к)-му такту для определения и*-к необходимы наблюдаемые зна-— — — * чения И,-к-1 = у,-к-1 = Л-к'
Приведем оптимальный закон управления для простейшего безынерционного объекта при аддитивных нормально-распределенных помехах g и £
= X*-£(хі-иіV * +
(19)
(28)
г, (и, = у,-1= у*) =
= | а,(и, =и,-1=у,-1= у*)Г,(и, /и,-1=у,-1= у*^□. (20)
□ (и,)
На основании теоремы о среднем и с учетом (6) можно записать
г, = (а,)ср | ГЯ =(а,)ср ^ КХшп- (21)
□(и,)
Далее необходимо подобрать Г, так= чтобы минимизировать R,, а это возможно= если для любых и5- 1 = У, -1 = У* найти Г, так= чтобы х, была минимальной.
1—т * * Ш1П
Пусть и, = и, такое= что а, = а, = а, :
2 2 у
где СТв, ст? - дисперсии помех g и с.
Адаптивное дуальное управление. Проанализируем основную идею адаптивного управления на примере [3]. Пусть линейный объект описывается разностным уравнением
х, = £ ал-+аои,- р
(29)
где вектор коэффициентов с = (а0, а1,..., ап), а вектор ситуаций г, = (х(-1,..., х,-и, и(-1), тогда
^ (30)
х, = с ,
где Т - знак транспонирования.
Закон управления примем линейным
т
и,- 1 =£ ьх- либо и>- 1 = ьТу>= 1=1
(31)
(22)
*
Величина и* является= очевидно= функцией от
— — —*
и, -1= У,-1= У,
И* = и,*(и,-1= у,-1= у,*)= (23)
но это возможно= если
Г, =5(и,-и;)> (24)
где 5(и, - и*) - дельта-функция Дирака= т. е. Г, является регулярной (нерандомизируемой) стратегией. Если подставить (24) в (20) то получим
г, = (а, )щ =„: = (а, )тт= (25)
но согласно (21)= это и есть минимальное значение для х,= следовательно Г, представляет собой оптимальную стратегию.
Чтобы найти оптимальную стратегию Г* = / < ,
нужно последовательно перемещаться от конечномалого момента времени / = , к началу. Можно показать что оптимальная стратегия для к-го от последнего такта , равна
где вектор параметров Ь = (Ь1=...= Ьт )= а
У1 = (х{_ 1=...= х{_ т) - вектор входных переменных
управляющего устройства.
Идентификация объекта осуществляется с помощью алгоритма «изучения»
С = с,-1 +1С,(х,-с11^)^ (32)
{(х<-сТг< )2}
при квадратичном критерии качества М х1 - с z.
идентификации.
Алгоритм управления может быть представлен с учетом (29)-(32) в следующем виде:
ь, = К-1 + уь, (х *,-сТ-1У,с„
(33)
где х * - задающее воздействие= а Vt имеет вид матрицы функций чувствительности размера т х (т +1).
V =
дх,-1 дх,-т ди,-1
ЗЬ1-1 " дЬ1-1 дЬ1-1
дх,-1 дх,-ш ди,-1
аь,” " дЬ”_1 дЬ,”
(34)
а
и
Таким образом, адаптивные алгоритмы дуального управления представлены формулами (30)—(33), а структурная схема на рис. 2.
Рис. 2
Видно, что она представляет собой объединение блоков идентификации (оценка параметров с) и управление (оценка параметров Ь). В этой адаптивной системе каждое новое значение состояния объекта X/; вызывает изменение параметров е и Ь/. Возможны и иные стратегии «изучения» и «управления» [3]. Блок УУ реализует закон управления (31).
Заметим, что математическая технология синтеза рекуррентных параметрических адаптивных алгоритмов дуального управления существенно отличается от рассмотренных выше, которые основаны на Байесовой постановке задачи синтеза оптимальной стратегии управления.
Непараметрическое дуальное управление. Вернемся к объекту, показанному на рис. 1. В теории дуального управления [2] и в теории адаптивных систем
[3] предполагается математическое описание объекта с точностью до вектора параметров (2), (29). В большинстве случаев, априорной информации недостаточно, чтобы обосновано выбрать управление исследуемого процесса. Поэтому приходится проводить серию экспериментов на объекте (часто длительных и дорогостоящих), чтобы качественно, с практической точки зрения, решить задачу идентификации.
В условиях непараметрической неопределенности
[4] уравнение процесса с точностью до вектора параметров неизвестно, но известны свойства объекта качественного характера, например, однозначность характеристик или неоднозначность для безынерционных процессов; линейность или тип нелинейности -для динамических. Если вид уравнения, описывающего процесс, неизвестен, то известные параметрические методы теории управления [5; 6] не применяются для решения задач идентификации и управления.
Из соображений простоты рассмотрим схему, представленную на рис. 3.
х*Ц) ^ А'1 и*(ґ) А х^)
На схеме А является неизвестным оператором, описывающим процесс, т. е.
х(/) = А < и(/) >. (35)
Если существует оператор, обратный А, т. е. А-1, АА_1 = I - единичный оператор, то
и(/) = А-1 < х(/) >. (36)
Задавая теперь траекторию х*(/), находим из (36) идеальное значение и*(/). Таким образом, (36) может быть отнесен к категории идеальных регуляторов. В дальнейшем будем его называть и-регулятор, чтобы отличить от многих известных. Однако проблема состоит в том, что в большинстве случаев его построить нельзя, тем более, что оператор А - неизвестен. Попытки, как то, хотя бы частично, решить эту проблему введением в УУ корректирующих цепочек, компенсирующих звеньев и т. п. предпринимались. В некоторых технических системах это приводило к успеху [6].
В 1950-х гг. прошлого столетия академиком
В. С. Кулебакиным был предложен и существенно развит метод К(^)-изображений, который привел к появлению теории инвариантности автоматически регулируемых и управляемых систем. Но в этом случае, необходима высокая точность описания исследуемых процессов дифференциальными уравнениями. Если вид уравнения, оценивающего исследуемый процесс, неизвестен, то классические методы теории управления не применяются.
Рассмотрим частный случай. Пусть объект описывается линейным дифференциальным уравнением неизвестного порядка, например п, п - неизвестно. В этом случае при нулевых начальных условиях х(/) равен [7]
х^) = | h(t -х)u(х)d х,
(37)
где - х) - весовая функция системы, являющаяся производной переходной функции Щ), т. е. И(І) = К(і). Известно, что обратным оператором (37) является оператор [7]
І(Г) = |-х)х(х^х,
(38)
где у(ґ) - весовая функция объекта в направлении «выход-вход» и у(0 = м>' (0, где w(t) - переходная функция системы в том же направлении. В этом случае (см. рис. 3), А представлен оператором (37), а А- -выражением (38). Следовательно, теперь проблема состоит в отыскании весовой функции И(ґ). Один из возможных путей решения этого вопроса состоит в решении уравнения Винера-Хопфа. Другой - в снятии переходной характеристики на реальном объекте с последующей оценкой его весовой функции по результатам измерений {х, = к, 4 і = 1, і }.
Непараметрическая модель (37) будет иметь вид
Рис. 3
х, ^) = |Ь^ -х, к,, I.)и(х^х,
(39)
где к.,, Ї. - временные векторы к. = (к^..., к.), Ї. = = ^..^ і,), а ^(-)равна
1
к (і) —I кд'
ґ і - і л
(40)
Н(•) - колоколообразные (ядерные) функции; - параметр размытости, удовлетворяющий условиям сходимости [4].
Весовую функцию у(/) в направлении «выход-вход», а также переходную w(t) на объекте «снять» нельзя. Было предложено переходную функцию «вспять» снять на модели. По-видимому, впервые это было сделано в [8]. Таким образом, из соотношения
х,(/) = 1(/) = | К(/ - ^ К, I )и(х)аx, (41)
0
можно получить выборки {ц, ^, ] = 1, 5 }. Тогда непараметрический алгоритм управления линейной динамической системы примет вид
и
(і)=}
-I '
, }=1
і — х — і
\Л
уУ
х(х)с1 х. (42)
Ясно, что объемы выборок при «снятии» переходных характеристик на реальном объекте и модели могут не совпадать. Фрагмент работы алгоритма (42) будет представлен ниже. Отметим лишь, что была реализована схема, соответствующая рис. 3, неизвестные операторы А и А 1 оценивались по исходным переходным характеристикам процесса (уравнение процесса было неизвестно) в классе непараметрических статистик.
Поскольку операторы А и А 1 по реальным данным будут оценены неточно, то возникает необходимость несколько изменить схему, представленную на рис. 3 (рис. 4).
Рис. 4
Непараметрической оценкой обратного оператора объекта в данном случае является А—1, и* - выход
(оценка А-1), помеха к действует в канале обратной связи (см. рис. 4). Непараметрический алгоритм дуального управления имеет вид
и,+и = и*л +Ли,+и, (43)
где
определяется по формуле (42), а
Ди5+1 { = е(хг - хг, 5) - поисковые шаги.
Таким образом, в и**( сосредоточены «знания» об объекте, а Ди5+1/ - «изучающие» поисковые шаги. В этом и состоит дуализм алгоритма (43).
Поясним его на примере безынерционного объекта х = _Ди), в качестве оценки которого примем непараметрическую оценку функции регрессии по наблюдениям {хь ии I = 1, 5 } [4]:
У Л
и — и
ІФ
у Л
и — и
(44)
где колоколообразные функции Ф() и параметр размытости удовлетворяют некоторым условиям сходимости [4]. Аналогом выражения (42) в этом случае будет и = /1(х), а и* из (43) будет равно
*,і = I иф
ІФ
(45)
Ясно, что класс функций х = Ди) - взаимнооднозначные и непрерывные. В дальнейшем мы увидим, что он может быть расширен.
Проанализируем характер дуализма алгоритма (43). На начальной стадии управления основная роль принадлежит второму слагаемому Ди5+1/ формулы
(43). Это случай активного накопления информации в системе дуального управления, который начинается с появления первого наблюдения входной и выходной переменной объекта. По мере процесса обучения (накопления информации) все возрастающую роль при формировании управляющего воздействия и,,+1 / начинает играть первое слагаемое, т. е. и*(. Таким образом, в процессе дуального управления объектом фигурируют как этап изучения объекта, так и этап приведения его к цели.
Численные эксперименты. Ниже приведем некоторые результаты расчетов, иллюстрирующих частные задачи при исследовании динамических и безынерционных объектов.
Первый эксперимент иллюстрирует «снятие» весовых функций линейной динамической системы. На рис. 5 показаны аналитическая весовая функция полученная при решении дифференциального уравнения типа (2), когда в правой части принята дельтафункция, здесь же приведены весовые функции для различных аналогов дельта-функций.
Рис. 5
V У
х
х
х
и
с
с
с
и
Весовые функции, показанные на рис. 5, получены при различных дельтаобразных ступенчатых функциях следующего вида:
8,(0 =
82(0 =
8з(/) =
At 1, если Дt є [0; 0,1]; 0,если Дt г [0; 0,1];
Дt 1, если Дt є [0; 0,01]; 0,если Дt г [0; 0,01];
Дt 1, если Дt є [0; 0,001];
0, если Дt г [0; 0,001].
Как видно, весовая функция, полученная аналитическим путем, а также весовые функции, полученные при воздействии на объект, существенно отличающихся дельтаобразных функций практически совпадают. Это приводит к выводу, что на практике в эксперименте по наблюдению весовых функций возможна подача на вход объектов, существенно отличающихся дельтаобразных управляющих воздействий. Существенным здесь, однако, является связь (соотношение) двух элементов: «динамический объект (процесс) - дифференциальное уравнение».
Результаты управления линейным динамическим объектом, соответствующие схеме представленной на
рис. 3, показаны на рис. 6, при условии, что х1 - случайная величина, генерируемая датчиком равномерно распределенных случайных чисел.
Эксперимент был проведен по следующей схеме: сначала на объекте снимались переходные характеристики и с их использованием оценивался оператор A по формуле (39) и обратный оператор А4 по формуле (42). Благодаря рис. 6, можно увидеть хорошее качество управления даже в таком «экзотическом» случае. С подобной задачей не справится ни один из известных регуляторов.
В случае безынерционного объекта рассмотрим следующую задачу: пусть имеется выборка наблюдений {хі, ui, і = 1, і}. В качестве оценки М{х|и} и М{и|х} примем оценки функции регрессии вида (44) и (45) (рис. 7).
Выборка наблюдений и непараметрическая оценка М{х|и} (44) показаны на рис. 7, а, а непараметрическая оценка М{х | М{и | х*}} - на рис. 7, б.
В качестве характеристики объекта был взял отрезок параболы (рис. 7, а). Результаты функционирования схемы, представленной на рис. 3, приведены на рис. 7, б.
Рис. 6
/
І
/
/
/
/
^—— шг*1
0 0.5 1 1.5 2 2.5 и
а
о ; 4 з
б
Рис. 7
Контроль переменных, измерения. Здесь мы подчеркнем важность проблемы измерения «вход-ных-выходных» переменных исследуемого объекта, процесса. Ранее [9; 10] уже отмечалось, что отличающиеся средства контроля даже для одних и тех же процессов приводят к различным формулировкам задач идентификации. Главное, что следует выделить в этой проблеме, состоит в том, что нередко динамический объект мы вынуждены рассматривать как статический с запаздыванием из-за длительной процедуры контроля (измерения, анализа) некоторых переменных, существенно превышающей постоянную времени объекта.
Безусловно, при моделировании и управлении дискретно-непрерывными процессами, целесообразно использовать сигналы или аналогичные им, но это требует тщательного анализа не только самого конкретного объекта, но и средств и технологии контроля всех доступных переменных, а также априорной информации, которая одновременно по различным каналам измерения переменных многомерной системы объекта может соответствовать различным уровням априорной информации. Неучет тех или иных переменных, параметров, характера измерения и контроля, априорной информации, а также некоторая «вольность» при принятии тех или иных допущений, неизбежных при математической постановке задачи, может привести, в конечном счете, к негативным последствиям. Вся эта сумма вопросов часто обходится при исследовании проблемы моделирования с теоретической точки зрения [11; 12]. При решении же прикладных задач, построении моделей конкретных процессов, это просто невозможно, ибо истина ничуть не страдает от того, если кто-либо ее не признает (И. Ф. Шиллер). Представляется уместным еще раз акцентировать внимание исследователя на формулировку проблемы идентификации реального процесса на самой начальной стадии: гораздо труднее увидеть проблему, чем найти ее решение. Для первого требуется воображение, а для второго - только умение (Д. Д. Бернал).
Отметим еще одну важную черту, которая сопутствует измерению многих переменных. Это непред-ставительность пробы, предназначенной для контроля. Проблема здесь состоит в том, что результат измерения (анализа) тех или иных переменных присваивается целой партии продукта (изделия). При этом, для анализа берутся десятки грамм продукта, а результат анализа присваивается многотонной партии. Следует заметить, что сам анализ проводится с высокой точностью, например, химический, физико-химический, физико-механический и др. Существенно другое: где и как брать пробу? В некоторых отраслях это регламентируется ГОСТом, в других случаях приняты те или иные рекомендации. Одним словом, вопрос очень серьезный и требует тщательного анализа в каждом конкретном случае. Неточности на этой стадии часто приводят к очень «грубым» моделям процесса, а, следовательно, и к неудовлетворительным системам управления. Мы здесь не будем обсуждать проблемы
разрушающего контроля. Это отдельный, самостоятельный вопрос, требующий специального исследования.
Математические постановки задач моделирования и управления. Совершенно очевидным является факт наличия существенно различной априорной информации об исследуемом процессе [10]. Как следствие этого - различные математические постановки задач, с точки зрения математической строгости. Одним из основных «камней преткновения» на этом пути является несоответствие наших предположений об исследуемом объекте самому объекту. После традиционно произносимого «Пусть процесс...», следуют такие предположения, гипотезы, которые, к сожалению, часто имеют отдаленное отношение к реальности. Трудно представить себе процесс, объект, характеристики которого были бы неизменными или менялись бы по известному закону с течением времени. Мы имеем в виду процессы, описанные в [9], средства и технологии измерения переменных объектов, которые представляют интерес в теории автоматического управления. Основные их черты состоят в недостатке априорной информации, воздействии случайных факторов, характеристики которых нам неизвестны, недостаток и несовершенства средств контроля переменных, непредставительность отбора проб для измерений и др. Наше незнание приходится, к сожалению, заменять, говоря «Пусть.». Ясно, что если наши допущения достаточно близки к реальности, то в итоге можно рассчитывать на успех при решении той или иной задачи, если же нет, то неудача неизбежна. Действительно, многие процессы и объекты, в основе функционирования которых лежат фундаментальные законы физических, химических, электрических, механических и других явлений, могут быть описаны с высокой степенью точности. Соответственно, для них могут создаваться и модели и системы управления достаточно высокого качества, что во многих случаях имеет место [5; 6].
Если же допущения слишком «грубые», то, видимо, есть два пути. Первый - восполнение нашего «незнания» о процессе, когда можно будет сделать аккуратную, с математической точки зрения, постановку задачи. Второй путь состоит в развитии математического подхода, адекватного тому уровню априорной информации, которым мы реально располагаем.
В этой связи, хотелось бы напомнить некоторые факты, известные, например из статьи Р. Калмана [13]. Приведем некоторые выдержки из этой статьи: «.классический (колмогоровский) вероятностный подход не может работать в реальных задачах с недостоверными данными. Для того, чтобы моделировать неопределенность при помощи вероятностного механизма необходимо иметь чересчур много информации, которая не может быть извлечена из доступных данных в большей массе практических задач». И еще, Л. С. Понтрягин: «Математики не верят в вероятность»; А. Н. Колмогоров: «.со статистикой что-то не в порядке».
Несколько отличающаяся аксиоматика теории вероятностей изложена в [14].
Нам предстоит в будущем моделировать и управлять реальными процессами, описанными в [9], включая организационные, потому что этого требует реальность, практика. В частности многие экономические процессы могут быть отнесены к организационным. Еще в середине прошлого столетия по поводу применения математики в экономике Дж. фон Нейман и О. Моргенштерн писали [15]: «Прежде всего отдадим себе отчет в том, что в настоящее время в экономической теории не существует универсальной системы и, что если она и будет создана, то едва ли это произойдет в ближайшее время. Причина этого кроется в том, что экономика является слишком сложной наукой...». И далее: «Часто аргументация против применения математики состоит из ссылок на субъективные элементы, психологические факторы и т. п. ...». «Важно осознать, что экономисты не могут надеяться на более легкую судьбу, чем та, которая постигла ученых других специальностей».
Прошло более полувека, но математики для экономической науки, а также для моделирования и управления организационными процессами не появилось, хотя некоторые продвижения в этом направлении есть: теория размытых множеств, теория принятия решений, системный анализ и теория систем и др.
О теории непараметрических систем. Термины «непараметрическая идентификация», «непараметрические методы обработки данных» встречаются в монографиях по идентификации [11; 12], но непараметрических алгоритмов идентификации не приведено. Обычно непараметрическую идентификацию линейных динамических процессов связывают с отысканием весовых или переходных функций системы в результате решения интегральных уравнений Фред-гольма 1-го рода, в частности уравнения Винера-Хопфа [11; 12; 16].
Выше мы говорили о моделях и и-регуляторах, которые свободны от выбора с точностью до вектора параметров моделей исследуемого процесса или параметрической структуры управляющих устройств, а также параметрической структуры других характеристик процесса, например, корреляционных функций, спектральных плотностей и др. Таким образом, речь идет об идентификации и управлении в условиях непараметрической неопределенности [4]. Представляется, что это наименьший уровень априорной информации об исследуемом объекте, когда возможно решение широкого класса задач кибернетики, наиболее адекватных реальным процессам. Заметим также, что первые исследования по непараметрическому управлению безынерционными объектами относятся к началу 1970-х гг. прошлого столетия. Можно считать, что теория непараметрических систем охватывает различные задачи кибернетики, ориентированные на непараметрический уровень априорной информации.
Вышеизложенное охватывает некоторые задачи идентификации и управления на уровне параметрической и непараметрической априорной информации. В отличие от хорошо развитой параметрической теории, непараметрическая ориентирована на уровень меньшей априорной информации об исследуемых объектах и процессах. Обращается специальное внимание на системы дуального управления байесового типа, адаптивного дуального управления и непараметрического дуального управления. Приводятся некоторые непараметрические модели и алгоритмы дуального управления, а также частные результаты численных расчетов, имеющих иллюстративный характер.
Библиографические ссылки
1. Медведев А. В. Теория непараметрических систем. Общий подход II Вестник СибГАУ. Вып. З. Красноярск, 2008.
2. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 196З.
3. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968.
4. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 198З.
5. Методы классической и современной теории автоматического управления. Статистическая динамика и идентификация систем автоматического управления
I под ред. К. А. Пупкова, Н. Д. Егупова. Т. 2. М. : Изд-во МГТУ им. Н. Э. Баумана, 2004.
6. Методы классической и современной теории автоматического управления. Синтез регуляторов систем автоматического управления I под ред. К. А. Пупкова, Н. Д. Егупова. Т. З. М. : Изд-во МГТУ им. Н. Э. Баумана, 2004.
7. Куликовский Р. Оптимальные и адаптивные процессы в системах автоматического регулирования. М. : Наука, 1967.
8. Medvedev A. V. Identification and control for linear dynamic System of unknown order I A. V. Medvedev II Optimization techniques IFIP Technical Conference. Berlin-Heidelberg-New York : Springer-Verlag, 1975. P. 48-56.
9. Медведев А. В. Теория непараметрических систем. Процессы II Вестник СибГАУ. Вып. З. Красноярск, 2010.
10. Медведев А. В. Теория непараметрических систем. Моделирование II Вестник СибГАУ. Вып. 4. Красноярск, 2010.
11. Эйкхофф П. Основы идентификации систем управления. М. : Мир, 1975.
12. Льюнг Л. Идентификация систем. М. : Наука,
1 9 9 1.
13. Калман Р. Е. Идентификация систем с шумами II Успехи математических наук. Вып. 4. Т. 40. 1985.
14. Уиттл П. Вероятность. М. : Наука, 1982.
15. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М. : Наука, 1970.
16. Заде Л., Дезоер Ч. Теория линейных систем. М. : Наука, 1970.