О теории непараметрических систем управления

Медведев Александр Васильевич

2013

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА Управление, вычислительная техника и информатика

№ 1(22)

УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

УДК 62.501

А.В. Медведев

О ТЕОРИИ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ УПРАВЛЕНИЯ

Приводятся краткие сведения о параметрической теории управления дискретно-непрерывными процессами, в частности теории дуального управления и параметрической теории адаптивных систем. Обсуждается вопрос о месте теории непараметрических систем в общей теории управления. Рассматриваются некоторые модели и алгоритмы управления в условиях непараметрической неопределенности.

Ключевые слова: дискретно-непрерывный процесс, дуальное управление, непараметрические методы, адаптивное управление, априорная информация.

Современная теория управления, в значительной степени, относится к разряду параметрических. Это означает, что на этапе формулировки задачи идентификации и управления предполагается каким-то образом выбранная параметрическая структура, описывающая процесс, или некоторое уравнение, известное с точностью до параметров. Ранее [1] был описан дискретно-непрерывный процесс и пути идентификации стохастических систем, которые тесно связаны с имеющейся априорной информацией. Часто априорной информации бывает недостаточно для обоснованного выбора параметрического класса моделей. Это один из «камней» преткновения, как в теории моделирования, так и в теории управления. Основное внимание в дальнейшем будет уделено задачам идентификации в «широком» смысле. Более того, нас будет интересовать, прежде всего, моделирование и управление в условиях непараметрической неопределенности, а также случай, когда априорная информация об исследуемом процессе соответствует одновременно как непараметрическому, так и параметрическому классу.

1. Теория дуального управления

Феномен дуализма в системах управления был открыт в 1962 г. А. А. Фельд-баумом и в последующем существенно развит им и его последователями. Сущность дуализма состоит в том, что управляющие воздействия носят двойственный характер. Они, как замечает А. А. Фельдбаум, «должны быть в известной мере изучающими, но, в известной мере, направляющими» [2]. Приведем схему дуального управления [2].

*

Введем следующие обозначения: х* - задающее воздействие, которое смешивается с шумом И* и поступает в качестве у* в регулятор; выход объекта xs также смешивается с шумом И* в виде у* и поступает в регулятор; управляющее воздействие и* смешивается с помехой g* и поступает в виде V* на объект, ко-

торый находится под воздействием помехи |*; * - дискретное время; Н*, Н, О -каналы связи.

Рис. 1

Далее предполагается следующее:

- рассматриваемая задача - байесова, И*, И*, g* - последовательности незави-

симых случайных величин с неизменными плотностями вероятности Р(И*), Р(И*), Р(g*); £* = §(*, ц), где ц - случайный вектор с известной априорной плотностью вероятности Р(ц). Аналогично полагаем х* = х(Х, *), где X - случайный вектор с заданной плотностью вероятности Р(Х) и все внешние воздействия - , И*, И*, g*, х* - статистически независимы;

о -1 о -1 о -1 ^ о -1 о 7

- объект не имеет памяти и описывается уравнением х* = РЙ*, V*), где Р -

ограничена, однозначна и дифференцируема;

- способы комбинации сигнала и шума считаются известными и неизменными, т.е. у* = у*(х*, И_^), V* = v(us,g*), у* = у*(х*, И_^), вместо которых и вероятностных характеристик шумов можно сразу задать условные плотности вероятности р(У* /и*) , Р(у* /х*) , Р(у* /х*) .

Задача состоит в определении оптимальной стратегии регулятора.

2. Постановка задачи дуального управления

Введём удельную функцию потерь V* = V(*, х*, х*), тогда общая функция потерь V имеет вид [2]

V = ]ТШ* (*, х*, х*). (1)

*=0

Назовём оптимальной систему, для которой полный риск минимален, Я5 -удельный риск:

Я = м{V} = £ М{V* (*, х*, х*)} = ]Тя* , (2)

*=0 *=0

Будем считать, что регулятор в общем случае обладает памятью и характеризуется случайной стратегией. Введём временные векторы и* = (и0,..., и*),

х* = (х0,..., х*) и по аналогии V*, х*, у*, у* ,0 < * < п.

Теперь поставим задачу отыскания оптимальной случайной стратегии регулятора, т.е. оптимальных плотностей вероятности [2]

Р* (и* ) = Г* (и* /и*-и ys-1,у*Х 0 < * < п , ()

при которых полный риск я минимален.

Поскольку Г* суть плотность вероятности, то

Г * > 0, |Г * (и* )й П(и*) = 1. (4)

□

Здесь □ - область возможных значений и*, Г* (* = 0,...,п ) называются удельными стратегиями, а их совокупность - полной стратегией. В подобной постановке задача управления была рассмотрена в [2]. Несколько иная трактовка теории дуального управления была дана Я.З.Цыпкиным в [3].

3. Непараметрическое дуальное управление

В теории дуального управления [2] и в теории адаптивных систем [3] предполагается математическое описание объекта с точностью до вектора параметров. В большинстве случаев априорной информации недостаточно, чтобы обосновано выбрать параметрическую модель исследуемого процесса. Поэтому приходится проводить серию экспериментов на объекте (часто длительных и дорогостоящих), чтобы качественно, с практической точки зрения, решить задачу идентификации.

В условиях непараметрической неопределённости [4] уравнение процесса с точностью до вектора параметров не известно, но известны свойства объекта качественного характера, например однозначность характеристик или неоднозначность для безынерционных процессов; линейность или тип нелинейности для динамических. Если вид уравнения, описывающего процесс, не известен, то известные параметрические методы теории управления [2, 3] не применимы для решения задач идентификации и управления.

Введем оператор объекта А , описывающий процесс, т.е.

х(/) = А < и(/) > , (5)

где и(/) - управляющее воздействие, х(/) - выходная переменная объекта.

Если существует оператор, обратный А , т.е. А-1, А-1 А = I - единичный оператор, то

А-х(/) = А- А < иЦ) >, и (Г) = А~'х(/). (6)

Задавая теперь траекторию х(/) = х*(/), находим из (6) идеальное значение и*(/). Таким образом (6) может быть отнесён к категории идеальных регуляторов. В дальнейшем будем его называть ^-регулятор, чтобы отличить от многих известных. Однако проблема состоит в том, что в большинстве случаев его построить нельзя, тем более, что оператор А - неизвестен. Попытка, хотя бы частично, решить эту проблему введением в устройство управления (УУ) корректирующих цепочек, компенсирующих звеньев и т. п. предпринимались ранее. В некоторых технических системах это приводило к успеху.

В 50-х годах прошлого столетия академиком В.С. Кулебакиным был предложен и существенно развит метод К(Б)-изображений, который привел к появлению

теории инвариантности автоматически регулируемых и управляемых систем. Но в этом случае необходима высокая точность описания исследуемых процессов дифференциальными уравнениями. Если вид уравнения, описывающий исследуемый процесс, не известен, то классические методы теории управления не применимы.

Рассмотрим частный случай. Пусть объект описывается линейным дифференциальным уравнением неизвестного порядка. В этом случае при нулевых начальных условиях х(/) [5]

х(О = |- т)и(т)ёт , (7)

0

где h(t -т) - весовая функция системы, является производной переходной функции к (О, т.е. h(t) = к '(О. Известно, что обратным оператором (7) является оператор [5]

t

и^) = | v(t - т) х(т)ё т, (8)

0

где у(1) - весовая функция объекта в направлении «выход - вход» и у(1) = w'(t), где ^(0 - переходная функция системы в том же направлении. В этом случае А

представлен оператором (7), а А-1 - выражением (8). Следовательно, теперь проблема состоит в отыскании весовых функций К(0, v(t). Один из возможных путей решения этого вопроса состоит в решении уравнения Винера - Хопфа. Другой

- в снятии переходной характеристики на реальном объекте с последующей оценкой его весовой функции по результатам измерений {хг = кг, ti, г = 1, *} . Непараметрическая модель (7) будет иметь вид

х* (О = { К* ^-т, к*, 7* )и (т)ё т, (9)

0

где к*, Т* - временные векторы: к* = (к2,...,к*), Т* = (^,...,I*), а К*(-)равна

К(О = — ±ЬИ'Г, (10)

*С* г =1 I С* )

Н(•) - колоколообразные (ядерные) функции, с* - параметр размытости, удовлетворяющие некоторым условиям сходимости [4].

Предлагается переходную функцию v(t) получить на модели в направлении «выход - вход», т.е. «вспять». По-видимому, впервые это было сделано в [6]. Таким образом, из соотношения

х* (0 = 1(0 = | К* О1 -т, к*, 7* )и(т)ё т, (11)

0

можно получить выборки {и^, tj, у = 1, *}. Тогда непараметрический алгоритм управления линейной динамической системой примет вид

где х*(х) - задающее воздействие, интегрирование выражений (11), (12) осуществляется численно.

Ясно, что объемы выборок при определении переходных характеристик на реальном объекте и на модели могут не совпадать. Фрагмент работы алгоритма (12) будет представлен ниже.

Поскольку операторы А и А_1 по реальным данным будут оценены не точно, то возникает необходимость несколько изменить схему «включения» на входе объекта А-, добавив обратную связь в следующем виде:

Рис. 2

Отметим, что неизвестные операторы А и А-1 оценивались по исходным переходным характеристикам процесса (уравнение процесса было неизвестно) в классе непараметрических статистик [4].

На рис. 2: А*-1 - непараметрическая оценка обратного оператора объекта, и* -выход (оценка А-1), помеха К действует в канале обратной связи. Непараметрический алгоритм дуального управления имеет вид

и*+1 = и* + Ли*+1. (13)

Здесь и* определяется по формуле (12), а Ли*+1 =е(х*+1 - х:!) - поисковые шаги. Таким образом в и* сосредоточены «знания» об объекте, а Ли*+1 - «изучающие» поисковые шаги. В этом и состоит дуализм алгоритма (13).

Поясним его на примере безынерционного объекта х = /(и, ц), в качестве оценки которого примем непараметрическую оценку функции регрессии по наблюдениям {хг, иг, цг, г = 1, *}, где ц - контролируемое, но неуправляемое входное воздействие [4]

.......=;5хг.(исЧ.(ц?У:!:.(и-1)»(^)-

где колоколообразные функции Ф() и параметр размытости с* удовлетворяют

некоторым условиям сходимости [4]. Более подробные асимптотические исследования алгоритмов класса (14) приводятся в [7]. Аналогом выражения (8) в этом случае будет и = /-1(х, ц), где /-1(х, ц) - функция, обратная /(и, ц), а и* из

(13) будет равно

и*=Е'и ф

ф

Тф

ф

(15)

где х*+1 - задающее воздействие. Функции х = /(и, ц) являются взаимнооднозначными и непрерывными.

Проанализируем характер дуализма алгоритма (13). На начальной стадии управления основная роль принадлежит второму слагаемому Ли*+1 формулы (13).

Это случай активного накопления информации в системе дуального управления, который начинается с появления первого наблюдения входной и выходной переменных объекта. По мере процесса обучения (накопления информации) всё возрастающую роль при формировании управляющего воздействия и*+1 начинает

играть первое слагаемое, т.е. и*. Таким образом, в процессе дуального управления объектом фигурируют как этап изучения объекта, так и этап приведения его к цели.

Более общая схема непараметрического дуального управления представлена ниже:

Рис. 3

Здесь (рис. 3) в результате функционирования замкнутого контура управления происходит уточнение оценки обратного оператора объекта.

4. Вычислительные эксперименты

Приведем некоторые результаты вычислительных экспериментов, которые носят иллюстративный характер. Поэтому ниже не приводятся сведения о выборе параметра размытости на каждом этапе эксперимента, поискового шага, а показаны только итоговые результаты, из соображений краткости изложения. На рис. 4 показан случай, когда на вход объекта действуют управляемая переменная и (/) и неуправляемая, но контролируемая переменная ц(/). Обучение управляющей системы, включающей в себя блоки А- и УУ, начинается с первой триады наблюдения, т. е. выработка управляющего воздействия осуществляется при наличии триады (и1, ц1, х1). На рис. 4 показано обучение непараметрической системы

дуального управления при изменяющихся задающих воздействиях х* и ц . На начальной стадии управления I необходимо некоторое время (накопление выборки) для приведения объекта в заданное состояние. На этапе II задающее значение х * выбиралось вне имеющихся наблюдений выхода объекта х , поэтому требовалось

некоторое время для приведения объекта в заданное состояние х * . На этапе III задающее воздействие представляло собой траекторию, а на этапе IV - случайную величину. Как видно, на III и IV этапах процесс управления достаточно высокого качества. Приведенные выше результаты имеют иллюстративный характер, как и было отмечено выше, поскольку из соображений краткости не приводятся конкретные сведения о настройке параметров размытости, поисковых шагов.

х* ^ -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< ■ к ™

1 х* 1 / ш А!

V Ж\

II

40

60 80 Рис. 4

100

120

6

4

2

0

г

Результаты управления линейным динамическим объектом (было взято дифференциальное уравнение третьего порядка), представлены на рис. 5. Задающее воздействие х* - случайная величина, генерируемая датчиком равномерно распределенных случайных чисел. Были проведены многочисленные эксперименты, один из которых и приведен. Преднамеренно был взят достаточно малый объем выборки. При увеличении объема выборки процессы, представленные на рис. 5, практически совпадают.

Рис. 5

Эксперимент был проведен по следующей схеме: сначала на объекте (уравнения объектов были неизвестны) снимались переходные характеристики, и с использованием их оценивался оператор А по формуле (9) и обратный оператор А— по формуле (12). Из рисунков видно удовлетворительное качество управления даже в таком «экзотическом» случае. С подобной задачей не справится ни один из известных регуляторов.

5. Общая схема реального процесса

Ниже приведена схема дискретно-непрерывного реального процесса, чаще всего встречающегося на практике, и некоторые пути моделирования.

Рис. 6

На рис. 6 обозначено: А - неизвестный оператор объекта, х(г), д(*), 2 (г) -выходные переменные процесса, и(г) - управляющее воздействие, ц(г) - входная контролируемая, но неуправляемая переменная процесса, ю(г)- переменная, характеризующая промежуточное состояние процесса, ^ (г) - векторное случайное

воздействие, г - непрерывное время, ИН, Ни, Нх , Ии , И4 , И2 - каналы связи, соответствующие различным переменным, включающие в себя средства контроля, устройства для измерения наблюдаемых переменных, , иг, хг, qt, 2).,

- измерения н(г), и(г), х(г), q(t), 2 (г), ю(г) в дискретное время г. Контроль переменных (х,и, н, q, 2) осуществляется через некоторый интервал времени, т.е. х^, и, н , qi, 2:1, юг-, I = 1,5, - выборка измерений переменных процесса (х,и1,н:,q1,2Х,ю1), (х2,и2,н2,q2,22,ю2), ...,(хв,и,,,,qs,2,,), 5 - объем выборки, ИН (г), Их (г), Ии (г), И® (г), ^ (г), И2 (г) со значком вверху - случайные помехи измерений соответствующих переменных процесса.

Отметим существенное отличие выходных переменных 2(г) , q(t) и х(г), представленных на рис. 6. Выходная переменная х(г) контролируется через интервалы времени Д, q(t) контролируются через существенно большие интервала! времени ДТ , 2(г) - через Т (Т >> ДТ >> Дг). С практической точки зрения для исследуемого процесса наиболее важным часто является контроль переменных 2(г). Например, выходные переменные х(г) контролируются с помощью различного рода индукционных, емкостных и других датчиков, q(t) - на основе лабораторных анализов, а 2(г) - в результате длительного химического анализа, физико-механических испытаний и др. Этим и обусловлено существенное отличие дискретности контроля выходных переменных х(г) и 2 (г). Особенностью здесь является то, что измеренное значение выхода объекта станет известным только через определенные промежутки времени, этим объясняется запаздывание

в измерениях выходных переменных объекта х(г), q(t) и 2(г). Дг, ДТ и Т - дискретность, с которой происходят измерения. Очевидно, что в матрице наблюдений появляются пропуски при наблюдении q (г), 2 (г), но мы специально сейчас

не будем останавливаться на этом вопросе.

В этом случае выходные переменные, как и ранее, зависят от входных и ю(г) (дополнительная информация), то есть следующим образом:

Достаточно подробный анализ такого процесса был проведен в [8]. Конкретные задачи идентификации будут ниже приведены с указанием различий в каждом рассматриваемом случае. Из рис. 6 ясно, что значения выходных переменных х (г), q (г), 2 (г) объекта зависят от входных и (г), н(г), |(г). Полученные ю(г) представляют дополнительную информацию о протекании исследуемого процесса, которую целесообразно использовать при построении модели. Таким образом, задача идентификации состоит в построении моделей, которые, в достаточно общем виде, могут быть представлены следующим образом:

где т - запаздывания, отличающиеся по различным каналам, но из соображений простоты записи не снабжены соответствующими индексами.

Многообразие задач идентификации будет обусловлено различными объемами априорной информации, типами процессов, наличием запаздывания в объекте и каналах связи.

Ниже рассмотрим задачу построения модели динамического процесса, представленного на рис. 6. Отметим, что АТ и Т значительно превышают постоянную времени объекта по всем остальным каналам. Без нарушения общности можно считать, что контроль переменных q (ґ), г (ґ) осуществляется через интервалы

времени АТ и Т , где АТ << Т . Следовательно, процесс по каналам q (ґ) и г (ґ) относится к классу безынерционных с запаздыванием, а по каналам ю(ґ) и х (ґ) может быть отнесен к классу динамических, так как их контроль осуществляется через интервал Аґ значительно меньший, чем постоянная времени объекта по соответствующим каналам. В этом случае, достаточно общая ^-модель может быть принята в виде

х(ґ) = А(и (ґ), ц(ґ), ю(ґ), |(ґ), ґ).

(16)

х (ґ) = А (и (ґ -т), ц(ґ -т), ю(ґ -т)); q (ґ) = А (и (ґ -т), ц(ґ -т), ю(ґ -т), х (ґ)); г (ґ) = А (и (ґ -т), ц(ґ -т),ю(ґ -т), х(ґ), q (ґ)) ,

(17)

(18) (19)

6. ^-модели динамических объектов

]'і (ґ-т),ц^ (ґ-т),ю^ (ґ-т),х® (ґ),(ґ),г® (ґ),р)0, і=к+1,1, (20)

(и® (ґ-т),ц® (ґ-т),ю^ (ґ-т),х® (ґ),q^ (ґ),г^ (ґ),№^)0, і =1 +1^,

где первая система уравнений (20) определена на основе известных фундаментальных законов соответствующих исследуемому процессу с точностью до параметров а. Вторая система уравнений объекта получена на основе имеющейся априорной информации с точностью до вектора параметров р . Третья группа уравнений (20) неизвестна с точностью до параметров, но класс функций, описывающих взаимосвязь «входных-выходных» и промежуточных переменных, определен на основе априорной информации. Знак (•) обозначает составной вектор [3], объединяющий различные наборы компонент соответствующих векторных переменных, представляет собой совокупность всех имеющихся наблюдений пере-

менных объемом 5 , т.е.

= (и5),,,4г),qiг),25г)), i = I+1V1.

Оценка значений компонент векторов выходных переменных х (г), q (г), 2 (г), может быть найдена в результате решения системы уравнений (20) при фиксированных значениях и (г), н(г),ю(г). ^-модели принципиально отличаются от общепринятых прежде всего тем, что учитывают во взаимосвязи все имеющиеся переменные и связи между ними в ситуации, когда дискретность контроля последних существенно различается. Отличаются также и уровни априорной информации о различных каналах исследуемого процесса. Таким образом, ^-модели представляют собой органический синтез разнотипных априорных сведений об исследуемом процессе или системе взаимосвязанных объектов во всем их многообразии, включающий в себя фундаментальные законы процесса, параметрические модели различных его каналов и качественные свойства.

7. Контроль переменных, измерения

Здесь мы подчеркнём важность проблемы измерения «входных-выходных» переменных исследуемого объекта, процесса. Ясно, что отличающиеся средства контроля даже для одних и тех же процессов приводят к различным формулировкам задач идентификации. Главное, что следует выделить в этой проблеме, состоит в том, что нередко динамический объект мы вынуждены рассматривать как статический с запаздыванием из-за длительной процедуры контроля (измерения, анализа) некоторых переменных, существенно превышающей постоянную времени объекта.

Безусловно, при моделировании и управлении дискретно-непрерывными процессами целесообразно использовать все переменные объекта, доступные для измерения, но это требует тщательного анализа не только самого конкретного объекта, но и средств и технологии контроля всех доступных переменных, а также априорной информации, которая одновременно по различным каналам измерения переменных многомерной системы объекта может соответствовать различным уровням априорной информации. Неучет тех или иных переменных, параметров, характера измерения и контроля, априорной информации, а также некоторая «вольность» при принятии тех или иных допущений, неизбежных при математической постановке задачи, может привести, в конечном счете, к негативным последствиям. Вся эта сумма вопросов часто обходится при исследовании проблемы моделирования с теоретической точки зрения. При решении же прикладных за-

дач, построении моделей конкретных процессов это просто невозможно, ибо «истина ничуть не страдает от того, если кто-либо её не признает» (И.Ф. Шиллер).

Отметим ещё одну важную черту, которая сопутствует измерению многих переменных. Это непредставительность пробы, предназначенной для контроля. Проблема здесь состоит в том, что результат измерения (анализа) тех или иных переменных присваивается целой партии продукта (изделия). При этом для анализа берутся десятки грамм продукта, а результат анализа присваивается многотонной партии. Следует заметить, что сам анализ, например химический, физикохимический, физико-механический и др., проводится с высокой точностью. Существенно другое: где и как брать пробу? В некоторых отраслях это регламентируется ГОСТом, в других случаях приняты те или иные рекомендации. Одним словом, вопрос очень серьёзный и требует тщательного анализа в каждом конкретном случае. Неточности на этой стадии часто приводит к очень «грубым» моделям процесса, а следовательно, и к неудовлетворительным результатам управления. Мы здесь не будем обсуждать проблемы разрушающего контроля. Это отдельный, самостоятельный вопрос, требующий специального исследования.

8. Математические постановки задач моделирования и управления

Совершенно очевидным является факт наличия существенно различной априорной информации об исследуемом процессе. Как следствие этого - различные математические постановки задач с точки зрения математической строгости. Одним из основных «камней преткновения» на этом пути является несоответствие наших предположений об исследуемом объекте самому объекту. После традиционно произносимого «Пусть процесс.» следуют такие предположения, гипотезы, которые, к сожалению, часто имеют отдаленное отношение к реальности. Трудно представить себе процесс, объект, характеристики которого были бы неизменными или менялись бы по известному закону с течением времени. Мы имеем в виду процессы, представленные на рис. 6 и описанные в [8], средства и технологии измерения переменных объектов, которые представляют интерес в теории автоматического управления. Основные их черты состоят в недостатке априорной информации, воздействии случайных факторов, характеристики которых нам не известны, недостаток и несовершенства средств контроля переменных, непредста-вительность отбора проб для измерений и многого другого. Наше незнание, приходится, к сожалению, заменять, говоря «Пусть.». Ясно, что если наши допущения достаточно близки к реальности, то в итоге можно рассчитывать на успех при решении той или иной задачи, если же - нет, то неудача неизбежна. Действительно, многие процессы и объекты в основе функционирования которых лежат фундаментальные законы физических, химических, электрических, механических и других явлений, могут быть описаны с высокой степенью точности. Соответственно для них могут создаваться и модели, и системы управления достаточно высокого качества, что, во многих случаях, имеет место.

Если же допущения слишком «грубые», то, видимо, есть два пути. Первый -восполнение нашего «незнания» о процессе, когда можно будет сделать аккуратную, с математической точки зрения, постановку задачи. Второй путь состоит в развитии математического подхода, адекватного тому уровню априорной информации, которым мы реально располагаем.

В этой связи хотелось бы напомнить некоторые факты, известные, например, из статьи Р. Калмана [9]. Приведем без комментариев некоторые выдержки из

этой статьи: «.классический (колмогоровский) вероятностный подход не может работать в реальных задачах с недостоверными данными. Для того чтобы моделировать неопределенность при помощи вероятностного механизма, необходимо иметь чересчур много информации, которая не может быть извлечена из доступных данных в большей массе практических задач». И еще: Л.С. Понтрягин: «Математики не верят в вероятность»; А.Н. Колмогоров: «.со статистикой что-то не в порядке». Несколько отличающаяся аксиоматика теории вероятностей изложена в [10]. Из этого следует, что возможно возникнет необходимость ухода от общепринятых на сегодняшний день методов исследования стохастических систем и систем управления стохастическими процессами.

9. Замечания о теории непараметрических систем

Термин «непараметрическая идентификация», «непараметрические методы обработки данных» встречаются в монографиях по идентификации и управлению, но непараметрических алгоритмов идентификации и управления, как правило, не приводится. Обычно непараметрическую идентификацию линейных динамических процессов связывают с отысканием весовых или переходных функций системы в результате решения интегральных уравнений Фредгольма 1-го рода, в частности уравнения Винера - Хопфа.

Выше мы говорили о ^-моделях и ^-регуляторах, которые свободны от выбора с точностью до вектора параметров моделей исследуемого процесса или параметрической структуры управляющих устройств, а также параметрической структуры других характеристик процесса, например корреляционных функций, спектральных плотностей и др. Таким образом, речь идет об идентификации и управлении в условиях непараметрической неопределенности [4]. Представляется, что это наименьший уровень априорной информации об исследуемом объекте, когда возможно решение широкого класса задач кибернетики, наиболее адекватных реальным процессам. Заметим также, что первые исследования по непараметрическому управлению безынерционными объектами относятся к началу 70-х годов прошлого столетия. Можно считать, что теория непараметрических систем охватывает различные задачи кибернетики, ориентированные на непараметрический уровень априорной информации.

Выделим несколько наиболее важных, с нашей точки зрения, аспектов, имеющих непосредственное отношение к теории непараметрических систем. Необходимость «работать» в условиях непараметрической неопределенности привела к тому, что мы не можем формулировать задачу управления в общепринятой постановке: параметрическая модель - критерий оптимальности - синтез алгоритмов управления и т. д. Наиболее целесообразным представляется введение на вход объекта оценки обратного оператора. Сама по себе эта идея не нова, но проблема состоит в трудности его построения. Некоторые приемы решения этой задачи приведены в [4]. Конечно же, представляет интерес построение непараметрических систем управления для процессов, показанных на рис. 6.

Другим важным направлением исследований является построение ^-моделей в условиях разнотипной априорной информации и нелинейной стохастической зависимости различных входных переменных, действующих на процесс. В частности, это приводит к процессам «трубчатой» структуры в пространстве «входных-выходных» переменных [11]. Представляется перспективным развитие теории идентификации в русле построения моделей нового типа, названных ^-моделями.

Принципиальным является то, что Х-модели объединяют во взаимосвязи следующую триаду: фундаментальные законы, определяющие поведение процесса по некоторым каналам, параметрические модели, полученные в результате предшествующих исследований, и качественные свойства, присущие различным каналам процесса.

Вышеизложенное позволяет несколько иначе посмотреть и на определение адаптивной системы. Общепринятое определение: «адаптивные автоматические системы - это управляющие устройства, функционирование которых изменяется в зависимости от неизвестных заранее характеристик объекта управления и внешних воздействий. Процесс обучения адаптивной системы определяется принятым алгоритмом обучения и состоит в приспособлении работы устройства к поступающей на его вход информации об объекте. Результат обучения - это способ функционирования, осуществляющий успешное или наилучшее в каком-либо смысле управление объектом, которое зависит не только и не столько от принятого алгоритма обучения, сколько от той информации, которая поступила в систему. В этом смысле адаптивная система может выполнять действия по правилам, не заложенным в нее конструктором заранее». Представляется необходимым отметить следующее: при создании адаптивной системы того или иного назначения целесообразно базироваться на триаде: максимальный учет имеющейся разнотипной априорной информации и формулировка на ее основе постановки задачи; второе - всесторонний анализ текущей информации, необходимой для организации процесса адаптации и обучения и, наконец, третье - аккуратное применение теории адаптивных систем. Естественно ожидать, что при несоблюдении любого из трех перечисленных выше этапов построенная система вряд ли будет адаптивной или обучающейся.

Заключение

Вышеизложенное охватывает некоторые задачи идентификации и управления на уровне параметрической и непараметрической априорной информации. В отличие от хорошо развитой параметрической теории непараметрическая ориентирована на уровень меньшей априорной информации об исследуемых объектах и процессах. Обращается специальное внимание на построение непараметрических систем дуального управления и подчеркиваются их отличия от систем байесового или параметрического типов. Введен новый класс комплексных моделей дискретно-непрерывных процессов (Х-модели), а также ^-регуляторов. Приводятся некоторые непараметрические модели и алгоритмы дуального управления, а также частные результаты численных расчетов, имеющих иллюстративный характер.

ЛИТЕРАТУРА

1. Медведев А.В. Теория непараметрических систем. Общий подход // Вестник. СибГАУ им. ак. М.Ф. Решетнева. Красноярск, 2008. Вып. 3. С. 65-69.

2. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Физматгиз, 1963. 552 с.

3. Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968. 320 с.

4. Медведев А.В. Непараметрические системы адаптации. Новосибирск: Наука, 1983. 174 с.

5. Куликовский Р. Оптимальные и адаптивные процессы в системах автоматического регулирования. М.: Наука, 1967. 397 с.

6. MedvedevA.V. Identification and control for linear dynamic system of unknown order // Optimization Techniques IFIP Technical Conference. Berlin - Heidelberg - New York: Springer-Verlag, 1975. P. 48-56.

7. Кошкин Г.М. Пивен И.Г. Непараметрическая идентификация стохастических объектов. Хабаровск: Российская академия наук, Дальневосточное отделение, 2009. 336 с.

8. Медведев А.В. Теория непараметрических систем. Процессы. // Вестник СибГАУ им. ак. М.Ф. Решетнева. Красноярск, 2010. Вып. 3.

9. Калман Р.Е. Идентификация систем с шумами // Успехи математических наук. 1985. Т. 40. № 4. 244 с.

10. Уиттл П. Вероятность. М.: Наука, 1982. 288 с.

11. Медведев А.В. Анализ данных в задаче идентификации // Компьютерный анализ данных моделирования. Минск: БГУ, 1995. Т. 2. С. 201-206.

Медведев Александр Васильевич

Сибирский аэрокосмический университет им. акад. М.Ф.Решетнева E-mail: Saor_medvedev@sibsau.ru ru

Поступила в редакцию 5 мая 2012 г.

Medvedev Alexander V. (Reshetnev Siberian State Aerospace University).On the theory of non-parametric control systems.

Keywords: discrete-continuous process, dual control, nonparametric methods, adaptive control, a priori information.

The elements of nonparametric dual control systems theory of static and dynamic objects of discrete-continuous type are discussed. Its principal difference from the earlier dual control theory is the incompleteness of a priori information about the object under control, which the main singularity is the absence of selection phase of the parametric class of models describing the object. The original formulation of control problem differs significantly from previous known. The main idea of nonparametric control is reduced to «inclusion» of the inverse operator and feedback simultaneous use at the object input. The control of dynamic systems uses the idea of measuring the transitional characteristic in the direction of «output-input», which can be carried out on the obtained nonparametric models. Thus, the nonparametric algorithm of the dual control combines two main features: the study of the process under control and reduction it to the target.

The issues of control variables that characterize the process state, including a variety of discrete control, the formulation features of control problems and characteristics of the processes appertained to the active class are described. Nonparametric models of discrete-continuous processes, nonparametric control algorithms and some results of simulation are presented. Some problems of organization systems modeling and control and the decision algorithms of the non-parametric class are discussed.

О теории непараметрических систем управления Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Медведев Александр Васильевич

Похожие темы научных работ по математике , автор научной работы — Медведев Александр Васильевич

On the theory of nonparametric control systems

Текст научной работы на тему «О теории непараметрических систем управления»