Научная статья на тему 'Об управлении безынерционными дискретно-непрерывными процессами с запаздыванием'

Об управлении безынерционными дискретно-непрерывными процессами с запаздыванием Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
232
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АПРИОРНАЯ ИНФОРМАЦИЯ / НЕПАРАМЕТРИЧЕСКОЕ УПРАВЛЕНИЕ / СТОХАСТИЧЕСКИЙ ПРОЦЕСС / ДУАЛЬНОЕ УПРАВЛЕНИЕ / БЕЗЫНЕРЦИОННЫЙ ОБЪЕКТ / A PRIORI INFORMATION / NONPARAMETRIC CONTROL / STOCHASTIC PROCESS / DUAL CONTROL / THE INSTANTANEOUS OBJECT

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Банникова А.В., Корнеева А.А.

Рассматривается задача управления стохастическими объектами с дискретно-непрерывным характером технологического процесса в условиях непараметрической неопределенности, в частности, исследуется задача управления безынерционными объектами с запаздыванием. Подобные процессы часто имеют место в различных контурах управления аэрокосмическими объектами и системами. Например, при изготовлении электрорадиоизделий (ЭРИ), которых в космическом аппарате порядка 150 тыс., ЭРИ могут быть представлены как последовательность локальных объектов, как динамического характера, так и безынерционных с запаздыванием. Рассматривается ситуация, когда на вход объекта поступает несколько управляемых входных переменных. Это накладывает свой отпечаток при управлении подобными процессами и обусловливает актуальность рассматриваемой задачи. Приводятся теоретические сведения о непараметрических алгоритмах управления в условиях неполной информации об управляемом процессе. Основное внимание уделяется построению непараметрических алгоритмов дуального управления. Существенное отличие алгоритмов дуального управления от общепринятых состоит в том, что управляющее устройство выполняет две функции: изучение и управление в процессе активного накопления информации. Алгоритм вычисления последователь-ности управляющих входных воздействий (цепочки) строится по следуещей схеме: первое управляющие воздействие выбирается произвольным на основе практических соображений, а следующие вычисляются с помощью непараметрических алгоритмов дуального управления уже с учетом первого. Далее эта схема повторяется, т. е. каждые последующие значения компоненты вектора управляющих воздействий рассчитываются с учетом всех предыдущих. При этом вид уравнения, описывающий локальный процесс, остается неизвестным из-за недостатка априорной информации. Подробно приводятся результаты численного исследования применения алгоритмов непараметрического адаптивного дуального управления при нескольких управляемых воздействиях. При моделировании характеристики объектов описывались нелинейными звеньями, вид которых был неизвестен и которые в процессе активного накопления информации автоматически восстанавливались на основании измерения входных-выходных переменных процесса. Исследование проводилось при различных задающих воздействиях, которые могли иметь ступенчатый характер или соответствовали тем или иным траекториям. Также исследовалось влияние различных помех, действующих на объект и в каналах измерения. Результаты численного исследования показали достаточно высокую эффективность непараметрических алгоритмов дуального управления многомерными безынерционными объектами в условиях неполной информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT CONTROL OF INERTIA LESS DISCRETE-CONTINUOUS PROCESSES WITH RETARDATION

Presented is the problem of stochastic control objects with discrete-continuous nature of the process in non-parametric uncertainties, in particular, the problem of the process management without memory delay has been studied. Similar processes occur in many different control loops of aerospace objects and systems. For example, in the manufacture of electro-radio products, in the spacecraft about reaching 150 thousand, can be represented both as a series of local objects dynamic nature and freewheeling delay. This article describes a situation where the input object receives several controlled input variables. It leaves its mark in the management of such processes, and determines the relevance of the problem. The article provides theoretical information on nonparametric control algorithms under incomplete information about the controlled process. The focus is on the construction of nonparametric algorithms of dual control. The essential difference between dual control algorithms from the standard is that the control unit performs two functions: research and management in the process of active accumulation of information. Algorithm for computing the sequence of control input actions (chain) is based on following Manufacture scheme: first control actions are chosen at random, based on practical considerations, but the following one is calculated using the nonparametric algorithms of dual control taking into account the first. Further, this pattern is repeated, i. e. each subsequent value of the components of the control actions is calculated taking into account all the previous ones. Thus, the form of the equation describing the local process remains unknown due to the lack of a priori information. Detailed results of the numerical investigation of the use of nonparametric algorithms for adaptive dual control at several control actions are given. In the simulation, the characteristics of the objects were described by non-linear components, the form of which was unknown, and which, in the active acquisition of information automatically restored on the basis of measurement of the input-output variables of the process. The study was conducted at different reference variables that could have stepped character, or comply with one or another path. Also the effect of different noise acting on the object and the measurement channels were investigated. The results of numerical studies have shown high enough efficiency of nonparametric algorithms of dual control multidimensional process without memory under conditions of incomplete information.

Текст научной работы на тему «Об управлении безынерционными дискретно-непрерывными процессами с запаздыванием»

УДК 519.87

Вестник СибГАУ Т. 16, № 3. С. 560-565

ОБ УПРАВЛЕНИИ БЕЗЫНЕРЦИОННЫМИ ДИСКРЕТНО-НЕПРЕРЫВНЫМИ ПРОЦЕССАМИ С ЗАПАЗДЫВАНИЕМ

А. В. Банникова*, А. А. Корнеева

Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79 'Е-mail: bannikova.anast@gmail.com

Рассматривается задача управления стохастическими объектами с дискретно-непрерывным характером технологического процесса в условиях непараметрической неопределенности, в частности, исследуется задача управления безынерционными объектами с запаздыванием. Подобные процессы часто имеют место в различных контурах управления аэрокосмическими объектами и системами. Например, при изготовлении электрорадиоизделий (ЭРИ), которых в космическом аппарате порядка 150 тыс., ЭРИ могут быть представлены как последовательность локальных объектов, как динамического характера, так и безынерционных с запаздыванием. Рассматривается ситуация, когда на вход объекта поступает несколько управляемых входных переменных. Это накладывает свой отпечаток при управлении подобными процессами и обусловливает актуальность рассматриваемой задачи. Приводятся теоретические сведения о непараметрических алгоритмах управления в условиях неполной информации об управляемом процессе. Основное внимание уделяется построению непараметрических алгоритмов дуального управления. Существенное отличие алгоритмов дуального управления от общепринятых состоит в том, что управляющее устройство выполняет две функции: изучение и управление в процессе активного накопления информации. Алгоритм вычисления последовательности управляющих входных воздействий (цепочки) строится по следуещей схеме: первое управляющие воздействие выбирается произвольным на основе практических соображений, а следующие вычисляются с помощью непараметрических алгоритмов дуального управления уже с учетом первого. Далее эта схема повторяется, т. е. каждые последующие значения компоненты вектора управляющих воздействий рассчитываются с учетом всех предыдущих. При этом вид уравнения, описывающий локальный процесс, остается неизвестным из-за недостатка априорной информации. Подробно приводятся результаты численного исследования применения алгоритмов непараметрического адаптивного дуального управления при нескольких управляемых воздействиях. При моделировании характеристики объектов описывались нелинейными звеньями, вид которых был неизвестен и которые в процессе активного накопления информации автоматически восстанавливались на основании измерения входных-выходных переменных процесса. Исследование проводилось при различных задающих воздействиях, которые могли иметь ступенчатый характер или соответствовали тем или иным траекториям. Также исследовалось влияние различных помех, действующих на объект и в каналах измерения. Результаты численного исследования показали достаточно высокую эффективность непараметрических алгоритмов дуального управления многомерными безынерционными объектами в условиях неполной информации.

Ключевые слова: априорная информация, непараметрическое управление, стохастический процесс, дуальное управление, безынерционный объект.

Vestnik SibGAU Vol. 16, No. 3, P. 560-565

ABOUT CONTROL OF INERTIA LESS DISCRETE-CONTINUOUS PROCESSES WITH RETARDATION

A. V. Bannikova*, A. A. Korneeva

Siberian Federal University 79, Svobodny Av., Krasnoyarsk, 660041, Russian Federation *Е-mail: bannikova.anast@gmail.com

Presented is the problem of stochastic control objects with discrete-continuous nature of the process in non-parametric uncertainties, in particular, the problem of the process management without memory delay has been studied. Similar processes occur in many different control loops of aerospace objects and systems. For example, in the manufacture of electro-radio products, in the spacecraft about reaching 150 thousand, can be represented both as a series of local objects dynamic nature and freewheeling delay. This article describes a situation where the input object

receives several controlled input variables. It leaves its mark in the management of such processes, and determines the relevance of the problem. The article provides theoretical information on nonparametric control algorithms under incomplete information about the controlled process. The focus is on the construction of nonparametric algorithms of dual control. The essential difference between dual control algorithms from the standard is that the control unit performs two functions: research and management in the process of active accumulation of information. Algorithm for computing the sequence of control input actions (chain) is based on following Manufacture scheme: first control actions are chosen at random, based on practical considerations, but the following one is calculated using the nonparametric algorithms of dual control taking into account the first. Further, this pattern is repeated, i. e. each subsequent value of the components of the control actions is calculated taking into account all the previous ones. Thus, the form of the equation describing the local process remains unknown due to the lack of a priori information. Detailed results of the numerical investigation of the use of nonparametric algorithms for adaptive dual control at several control actions are given. In the simulation, the characteristics of the objects were described by non-linear components, the form of which was unknown, and which, in the active acquisition of information automatically restored on the basis of measurement of the input-output variables of the process. The study was conducted at different reference variables that could have stepped character, or comply with one or another path. Also the effect of different noise acting on the object and the measurement channels were investigated. The results of numerical studies have shown high enough efficiency of nonparametric algorithms of dual control multidimensional process without memory under conditions of incomplete information.

Keywords: a priori information, nonparametric control, stochastic process, dual control, the instantaneous object

Введение. В настоящие время наиболее развитой теорией, в рамках задач идентификации и управления, является теория параметрических систем. Данная теория предполагает, что на этапе формулировки задачи идентификации и управления каким-то образом выбирается параметрическая структура модели, описывающая процесс, или некоторое уравнение, известное с точностью до параметров. Данный подход получил значительное развитие в рамках теории адаптивных управляющих систем [1-3]. Но часто априорной информации бывает недостаточно для обоснованного выбора параметрического класса моделей, так как исследователю часто приходится сталкиваться с малоизученными процессами и объектами, структура моделей для которых неизвестна. В случае, когда априорной информации недостаточно, чтобы выбрать параметрическую структуру модели исследуемого процесса, естественно использовать теорию непараметрической системы управления [4; 5]. Непараметрическая теория, в отличие от предыдущей, предполагает, что известны только качественные характеристики системы [6]. Основное внимание в дальнейшем будет уделено задачам управления в условиях непараметрической неопределенности, а также случаю, когда на вход исследуемого процесса будут поступать несколько управляемых входных воздействий. Подобные ситуации возникают при изготовлении ракетных двигателей, диагностике электрорадиоизделий [7] и решении других задач в области аэрокосмической промышленности.

Актуальность рассматриваемой задачи обусловлена тем, что, как правило, реальные технологические процессы являются многомерными, а управляющее воздействие представляет собой вектор, состоящий из нескольких входных переменных. При этом расчет входных управляющих воздействий в данном случае представляет собой специальный самостоятельный интерес. В настоящей статье сделан акцент на исследовании непараметрического алгоритма дуального управления безынерционными процессами с запаздыванием.

Постановка задачи управления. Пусть объект представляет собой безынерционную систему и опи-

сывается уравнением х(/) = f (и1^), ..., ит (/)), где/(.) -неизвестный функционал; х(/) - выходная переменная процесса; и1(/), ..., ит (/) - управляющие воздействия. Если на вход объекта управления поступает несколько управляющих воздействий, то тут можно говорить уже о цепочке алгоритмов управления. Рассмотрим схему, представленную на рис. 1, где приняты следующие обозначения: ) - задающие воздействие, (/) - непрерывное время, - векторная

случайная помеха.

Контроль переменных осуществляется через интервал времени At. Таким образом, можно получить исходную выборку входных-выходных переменных

{х^,иь, ...,ит, i = 1,5}, где 5 - объем выборки.

Большинство окружающих нас процессов можно отнести к классу дискретно-непрерывных [8], т. е. сам процесс протекает во времени непрерывно, а контроль его переменных осуществляется в дискретные моменты времени. Следует заметить, что важность задачи управления безынерционным объектами обусловлена, прежде всего, средствами контроля выходных переменных объекта х(0, так как следует учитывать, что контроль доступен не электрическими средствами, а соответствующей методикой лабораторного контроля, и зачастую оказывается, что время, затраченное на измерение переменных, может значительно превышать постоянную времени объекта. По этой причине мы вынуждены рассматривать динамический по своей природе процесс как безынерционный объект с запаздыванием.

Непараметрическое дуальное управление. Дуальное управление было открыто А. А. Фельдбау-мом и развито на основе теории статистических решений [9]. Следует отметить, что обучающиеся системы управления являются системами «с памятью», т. е. они не только способны изучать характеристики объекта, но и, сохраняя их в памяти, вырабатывать рациональные управляющие воздействия. Теория непараметрических систем управления достаточно подробно изложена в [10; 11].

Рис. 1. Блок-схема управления

Непараметрический алгоритм дуального управления, подробно описанный в [12; 13], имеет вид

+1 = им + Диг*+1 =

(1)

I < Пф

г=1 1=1

( Щ - Щ Л

ПФ

]=1

где в и* 5 сосредоточены «знания» об объекте, а Диг $+1 - «изучающие» поисковые шаги:

$ т-1

IП ф

г=1 1=1

и1 - и,

ПФ

]=1

( * г Л

Х],$+1 Х]

с?

V $ у

* г Л

Х],$+1 Х]

СХ

$ V

(4)

Диг

= е( +1 ).

(2)

В этом и состоит дуализм алгоритма (1).

В данном случае на вход объекта управления поступает векторное управляющее воздействие и = (и1, и2, ..., ит) е Кт . В этом случае управление и1, в принципе, может быть задано произвольным из 0(и1). При выборе и1 можно руководствоваться практическими соображениями, например, экономическими или экологическими. Тогда формула для расчета и*2$ принимает вид

Расчет коэффициента размытости ядра сЩ по каждой компоненте производится в соответствии со следующей формулой :

С = РЩ+1 -и

(5)

где коэффициент р >1; и0 - точка из выборки {иг}, г = 1, $ , по своему значению наиболее близкая

и2 $ =

1Ё«2 ф г=1 г и1 - и1 Л п ПФ V ]=1 / » х],$+1 х.

Си1 V сХ V $

$ ( I Ф г=1 V г и1 - Щ п ПФ ]=1 V * г Х],$+1 Х]

Си1 V С?

(3)

где О (•) - ядерная колоколообразная функция [14];

с$ - коэффициенты размытости ядра, которые удовлетворяют условиям сходимости [15].

Таким образом, значение управляющего воздействия и2 на данной итерации рассчитывается с учетом

значения переменной и1. Для расчета значения и3

будут приниматься во внимание значения и1 и и2 .

В итоге для расчета значения переменной ит может

быть использована формула:

к значению точки и,,+1.

Таким образом, значение каждой компоненты вектора управляющего воздействия и = (и1, и2, ..., ит) е Ят выбирается последовательно, с учетом уже определенных значений предыдущих компонент, что позволяет осуществлять более качественное управление процессом.

Проанализируем характер дуализма алгоритма (1). На начальной стадии управления основная роль принадлежит второму слагаемому Дщ+1 из формулы (1). Это случай активного накопления информации в системе дуального управления, который начинается с появления первого наблюдения входной и выходной переменных объекта. По мере процесса обучения (накопления информации) всё возрастающую роль при формировании управляющего воздействия и$+1 начинает играть первое слагаемое, т. е. и*. Таким образом, в процессе дуального управления объектом фигурируют как этап изучения объекта, так и этап приведения его к цели.

ит,$ ~

Численное исследование. Проверим работоспособность алгоритмов управления в рамках вычислительного эксперимента. Пусть исследуемый объект описывается уравнением вида

х(:) = 0,4 • 8ш(и1 (:)) + и2 (:) + 0,5и3 (:) , (6)

где х(:) - выходная переменных процесса; и1(7), и2(:), и3 (:) - входные управляемые переменные процесса.

Пусть задание имеет вид траектории х*(7) = 2,5 + + соб(0,05 •:). Результат работы непараметрических алгоритмов дуального управления представлен на рис. 2, где приняты следующие обозначения: х(7) - выход объекта при управлении непараметрическим регулятором; х*(:) - задание. Ошибка регулирования равна 0,09.

Проанализируем качество управления при изменении задающего воздействия. Увеличим частоту колебаний задания, пусть х*(:)-задание имеет вид траектории х*(0 = 2 + зт(0,2 •:) (рис. 3).

Ошибка регулирования для случая, изображенного на рис. 3, равна 0,12. Из рис. 3 и значений относительной ошибка регулирования можно сделать вывод, что при более изменчивом характере уравнения

задающего воздействия качество управления уменьшается.

Пусть задание имеет вид ступенчатого воздействия (рис. 4).

Рассмотрим работу непараметрического дуального алгоритма управления подробнее. Обучение управлению начинается с первых наблюдений х1, Ы1, Ы2, из. На начальной стадии управления необходимо некоторое время (накопление выборки) для приведения объекта в заданное состояние, но уже на следующих этапах работы алгоритм почти мгновенно достигает задания.

Рассмотрим зависимость качества регулирования с помощью непараметрических методов дуального управления от уровня помех, действующих на объект. Пусть задание имеет вид ступенчатого воздействия, а помеха, действующая на объект, равна 7 %.

Ошибка регулирования для случая, представленного на рис. 5, равна 0,167. Как можно заметить, непараметрический алгоритм дуального управления устойчив к внешним воздействиям, хотя, естественно, ошибка регулирования возросла по сравнению с предыдущим случаем.

1-г * ^

Представим случаи, когда х задается случайным образом (рис. 6).

Рис. 2. Результаты управления при задающем воздействии в виде траектории

Рис. 3. Результаты управления при задающем воздействии в виде траектории при увеличении частоты колебаний задания

Рис. 4. Результаты управления при задающем воздействии в виде ступеньки

Рис. 5. Результаты управления при задающем воздействии в виде ступеньки, помеха 7 %

Рис. 6. Результаты управления при задающем воздействии в виде случайного задания

На рис. 6 показано, как ведет себя алгоритм при не справится ни один из известных регуляторов.

случайном задании. Видно хорошее качество управ- На практике такой вариант задающего воздействия не

ления с помощью непараметрического регулятора встречается, однако это представляет интерес с теоре-

даже при таком «экзотическом» варианте, когда зада- тической точки зрения. ние носит случайный характер. С подобной задачей

Заключение. Подводя итог настоящей статьи, следует заметить, что рассматривается очень важная с практической точки зрения задача управления в замкнутом контуре для дискретно-непрерывных процессов в условиях непараметрической неопределенности. Предлагаются непараметрические алгоритмы дуального управления, представляющие последовательность покомпонентного вычисления управляющих воздействий при измеряемых неуправляемых входных переменных. Достаточно подробно изложены результаты численного исследования.

Библиографические ссылки

1. Цыпкин Я. З. Адаптация и обучение в автоматических системах. М. : Наука, 1968. 400 с.

2. Эйкхофф П. Основы идентификации систем управления. М. : Мир, 1975. 683 с.

3. Цыпкин Я. З. Информационная теория идентификации. М. : Наука. Физматлит, 1995. 336 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Медведев А. В. Теория непараметрических систем. Моделирование // Вестник СибГАУ. 2010. № 4 (30). С. 4-9.

5. Медведев А. В. Теория непараметрических систем. Общий подход // Вестник СибГАУ. 2008. № 3 (20). С. 65-69.

6. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983. 174 с.

7. Орлов В. И., Сергеева Н. А., Чжан Е. А. Техническая диагностика электрорадиоизделий // Труды XII Всерос. совещания по проблемам управления (ВСПУ-2014) (16-19 июня 2014, г. Москва). С. 7676-7682.

8. О непараметрическом управлении стохастическими объектами с памятью / А. В. Банникова, [и др.] // Вестник СибГАУ. 2014. № 3 (55). C. 28-35.

9. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 1963. 552 с.

10. Медведев А. В. Теория непараметрических систем. Управление-I // Вестник СибГАУ. 2013. № 2

(48). С. 57-63.

11. Медведев А. В. Теория непараметрических систем. Процессы / Вестник СибГАУ. 2010. № 3 (29). С. 4-9.

12. Медведев А. В. Теория непараметрических систем. Управление-II // Вестник СибГАУ. 2013. № 3

(49). С. 85-90.

13. Medvedev A. V. Identification and control for linear dynamic system of unknown order/ Optimization Techniques IFIP Technical Conference (july 1-7, 1974, Novosibirsk). Р. 48-55.

14. Eddy W. F. Optimum kernel estimators of the mode // Ann. Math. Statist. 1980. №. 8. P. 870-882.

15. Надарая Э. А. Непараметрические оценки плотности вероятности и кривой регрессии. Тбилиси : Изд. Тбил. ун-та, 1983. 194 с.

References

1. Tsypkin Ya. Z. Adaptatsiya i obuchenie v avtomaticheskikh sistemakh. [Adaptation and learning in automatic systems]. Moscow, Nauka Publ., 1968, 400 p.

2. Eykkhoff P. Osnovy identifikatsii sistem upravleniya. [Identity-based control systems]. Moscow, Mir Publ, 1975, 683 p.

3. Tsypkin Ya. Z. Informatsionnaya teoriya identifikatsii [Information theory of identification]. Moscow, Nauka Publ, 1995. 336 p.

4. Medvedev A. V. [The theory of nonparametric systems. Simulation]. Vestnik SibGAU. 2010, No. 4 (30), P. 4-9 (In Russ.).

5. Medvedev A. V. [The theory of non-parametric systems. The general approach]. Vestnik SibGAU, 2008, № 3 (20), P. 65-69 (In Russ.).

6. Medvedev A. V. Neparametricheskie sistemy adaptatsii. [Nonparametric system adaptation]. Novosibirsk, Nauka Publ, 1983, 174 p.

7. Orlov V. I., Sergeeva N. A., Chzhan E. A. [Technical diagnostics electrical radio]. Trudy XII vserossiyskogo soveshchaniya po problemam upravleniya VSPU-2014. [Proceedings XII National Conference on Control VSPU 2014]. Moscow, 16-19 June, 2014, P. 7676-7682.

8. Bannikova A. V. et al. [On the non-parametric stochastic control objects with memory]. Vestnik SibGAU. 2014, No. 3 (55), P. 28-35 (In Russ.).

9. Fel'dbaum A. A. Osnovy teorii optimal'nyh avtomaticheskih system [Fundamentals of the theory of optimal automatic systems]. Moscow. Fizmatgiz Publ., 1963, 552 p.

10. Medvedev A. V. [The theory of non-parametric systems. Control-I]. Vestnik SibGAU, 2013, No. 2 (48), P. 57-63 (In Russ.).

11. Medvedev A. V. [The theory of non-parametric systems. Processes]. Vestnik SibGAU, 2010, No. 3 (29) p. 4-9. (In Russ.)

12. Medvedev A. V. [The theory of non-parametric systems. Control-II]. Vestnik SibGAU. 2013, No. 3 (49), P. 85-90 (In Russ.).

13. Medvedev A. V. Identification and control for linear dynamic system of unknown order. Optimization Techniques IFIP Technical Conference. Novosibirsk, july 1-7, 1974, P. 48-55

14. Eddy W. F. [Optimum kernel estimators of the mode]. Ann. Math. Statist. 1980, No. 8, P. 870-882.

15. Nadaraya E. A. Neparametricheskie otsenki plotnosti veroyatnosti i krivoy regressii [Nonparametric estimation of probability density and the regression curve], Tbilisi, izd. Tbil. un-t Publ., 1983, 194 p.

© Банникова А. В., Корнеева А. A., 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.