УДК 62.501
О НЕПАРАМЕТРИЧЕСКИХ СИСТЕМАХ ДУАЛЬНОГО УПРАВЛЕНИЯ
А. А. Корнеева
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 Е-mail: anna.korneeva.90@mail.ru
Рассматриваются задачи идентификации и управления в условиях непараметрической неопределенности. Предлагаемый в работе путь управления объектом относится к классу непараметрического дуального управления.
Ключевые слова: дискретно-непрерывный процесс, адаптивное управление, непараметрическая идентификация, дуальное управление.
ABOUT NONPARAMETRIC DUAL CONTROL SYSTEMS
А. A. Korneeva
Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. Е-mail: anna.korneeva.90@mail.ru
Problems of identification and control in a non-parametric uncertainty are discussed. Proposed in this paper the object control method in a non-parametric uncertainty is referred to the class of nonparametric dual control.
Keywords: discrete and continuous process, adaptive control, nonparametric identification, dual control.
Большую роль при математической формулировке задачи управления играет уровень априорной информации об объекте. В этой связи проблемы адаптивных и обучающихся систем, соответствующих различным уровням априорной информации, являются на сегодняшний день важнейшими в теории автоматического управления. Такие системы позволяют осуществлять оптимальное управление сложными объектами в условиях малой априорной информации за счет использования текущей информации, получаемой в результате функционирования объекта управления. Существенный интерес представляет развитие теории дуального управления в условиях малой априорной информации, при которой управляющие воздействия используются не только для приведения объекта к желаемому состоянию, но и для его изучения. Потребность в построении подобных систем возникает во многих сферах деятельности.
Дуальное управление было открыто и развито А. А. Фельдбаумом [1]. Первоначально теория дуального управления была развита в байесовой постановке, когда известны параметрическая модель объекта исследования с точностью до параметров, плотности распределения внешних воздействий и параметров управляемого объекта. Такой подход предполагает наличие довольно большого объема априорной информации об исследуемом объекте и каналах связи. Это часто вызывает серьезные затруднения при разработке систем дуального управления реальными процессами и объектами. В этой связи существенный интерес представляют исследования Я. З. Цыпкина по синтезу систем дуального управления в условиях
параметрической априорной информации [2]. Здесь априорные требования к плотности вероятности случайных факторов ослабевают, но требуются знания о параметрической структуре объекта исследования. Параметризация структуры исследуемого объекта требует тем не менее значительного объема априорной информации, которого зачастую недостаточно. Неточность при выборе параметрической модели объекта может привести к тому, что адаптивная система утрачивает свои свойства и перестает быть в достаточной степени обучающейся. В условиях малой априорной информации интерес представляют задачи идентификации и управления в условиях непараметрической неопределенности. Основой для построения адаптивных и обучающихся моделей и систем управления явились методы непараметрической статистики [3] и развиваемая сегодня теория непараметрических адаптивных систем [4]. Ее отличие от существующей параметрической теории адаптивных систем состоит в отсутствии этапа выбора параметрической структуры модели на основании имеющейся априорной информации. В этом случае требования к априорной информации ослабевают. Здесь требуется информация на качественном уровне (статический или динамический объект, линейный или нелинейный и др.).
Введем оператор объекта А, описывающий процесс, т. е. х(/) = А<и(/)>, где и(/) - управляющее воздействие, х(/) - выходная переменная объекта. Если существует оператор, обратный А, т. е. А-1, где А-1 А = I - единичный оператор, то А-1х(/) = А-1 А < и(0 >, и(0 = А-1х((). Задавая теперь желаемую траекторию х(Г) = х*(/) можно найти идеальное значение и*(/).
Математические методы моделирования, управления и анализа данных
Рассмотрим рис. 1, на котором представлена общая схема дуального управления многомерным дискретно-непрерывным процессом.
УУ */ \ u*(t) А-1
х, (и, ц) = -
ф((и - и)/сИ )ф((ц-ц,)/сЦ) 2=1_
Т ф((и - И, )/сИ )ф((Ц-Ц, )/сЦ)
(2)
где колоколообразные функции Ф(0, параметры размытости с-. и с£ удовлетворяют некоторым условиям сходимости [4]. Компонента и* в этом случае будет равна
¿И ф(+1 - х,.)/с; )ф((ц,+1 -h)/сц) 2=1_
Т ф((х*+1 - х, )/сх )ф( -ц,.)/сЦ)
(3)
Рассмотрим, как ведет себя алгоритм. На первых шагах алгоритм «не обучен». И здесь основную роль играет поисковая составляющая Ди^+1 алгоритма (1), которая «тянет» выход объекта х(/) к заданию х*(/). По ходу своего функционирования алгоритм накапливает «знания» об объекте. Роль поисковой составляющей снижается, и основной вклад в алгоритм (1) *
вносит компонента и5. Как только алгоритм попадает в неизвестную ему область, процесс обучения повторяется.
Рис. 1. Дуальная схема управления многомерным безынерционным процессом
Здесь А-1 - непараметрическая оценка обратного оператора А4 по выборке наблюдений входных-выходных переменных объема д(/) - это входная контролируемая, но неуправляемая переменная, -векторная случайная помеха, №(() и Их(Г) - случайные помехи в каналах измерения. Модель исследуемого процесса в этом случае может имеет вид: х^) = Л(и((), д(0, £(/)). Непараметрический алгоритм дуального управления имеет вид:
и-+1 = и** + Aus+1, (1)
где и* - компонента, в которой сосредоточены «знания» об объекте, она вычисляется в блоке обратного оператора А"1; Аих+1 =у(х*+1 - х-) - «изучающие» поисковые шаги; у - некоторый коэффициент. В этом и состоит дуализм алгоритма.
Поясним его на примере безынерционного объекта х = _Ди, д), в качестве оценки которого примем непараметрическую оценку функции регрессии по наблюдениям {хи и, I = 1, 2, ..., -}[4]:
Для вычислительного эксперимента был выбран объект, описывающийся уравнением вида х(/) = 2740 + ). Переменная д(/) описывается зависимостью ) = зт(0,015/'). Задание х*(?) носит характер ступенчатого. Полученные результаты представлены на рис. 2.
Рис. 2. Результат работы непараметрического дуального алгоритма управления
Статья посвящена проблеме дуального управления многомерными дискретно-непрерывными системами в условиях непараметрической неопределенности. Исследуются непараметрические системы дуального управления, подчеркиваются их отличия от систем байесового и параметрического типа.
Вычислительные эксперименты показали, что качество работы непараметрического адаптивного алгоритма управления во многом зависит от характера изменения входных переменных процесса и сложности описания управляемого объекта. Если переменные процесса имеют простую (близкую к линейной) характеристику, то алгоритм находится в «благоприятных» условиях и процесс его «обучения» требует меньшего времени. И наоборот, если поведение входных переменных процесса описывается более сложными, нелинейными зависимостями, то процесс «обучения» может быть весьма затянутым.
Библиографические ссылки
1. Фельдбаум А. А. Основы теории оптимальных автоматических систем. М. : Физматгиз, 1963. 552 с.
2. Цыпкин Я. З. Основы информационной теории идентификации. М. : Наука, 1984. 320 с.
3. Надарая Э. А. Непараметрические оценки плотности вероятности и кривой регрессии. Тбилиси : Изд. Тбил. ун-та, 1983. 194 с.
4. Медведев А. В. Непараметрические системы адаптации. Новосибирск : Наука, 1983. 174 с.
References
1. Feldbaum A. A. Osnovi teorii optimalnih avtomaticheskix system (The basis of theory optimal automatic systems). Moskow : Izd. Fizmatgiz, 1963. 552 с.
, =1
1. Cypkin Ja. Z. Osnovy informacionnoj teorii identifikacii (The foundation of information identification theory). Moscow : Nauka, 1984. 320 p.
3. Nadaraia E. A. Neparametricheskie ocenki plotnosti verojtnosti i krivoy regresii (Nonparametric estimation of
the probability density and the regression curve). Izd. Tbiliskogo university, 1983. 194 p.
4. Medvedev A. V. Neparametricheskie sistemy adapticii (Nonparametric adaptive systems). Novosibirsk : Nayka, 1983. 174 p.
© KopHeeBa A. A. 2013
УДК 62.501
НЕПАРАМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ ПРОЦЕССА КОНВЕРТЕРНОЙ ПЛАВКИ СТАЛИ
М. Е. Корнет
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: maria4business@mail.ru
Рассматривается задача непараметрической идентификации дискретно-непрерывного процесса конвертерной плавки стали. Приводятся результаты моделирования, показывающие, что полученные модели могут быть использованы в целях управления.
Ключевые слова: идентификация дискретно-непрерывных процессов, непараметрическая регрессия, непараметрическая идентификация кислородно-конвертерной плавки.
NONPARAMETRIC MODELING OF OXYGEN-CONVERTER STEELMAKING
M. E. Kornet
Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: maria4business@mail.ru
Discrete-continuous process identification under parametric and nonparametric uncertainty is discussed. The case study of oxygen-converter steelmaking modeling is described.
Keywords: discrete-continuous process identification, nonparametric regression, nonparametric identification for oxygen-converter steelmaking.
Идентификация разнообразных технологических процессов по-прежнему является центральной задачей кибернетики. В условиях малой априорной информации об исследуемом процессе из-за действия случайных возмущений, отсутствия измерений некоторых параметров возникают значительные трудности при выборе структуры модели и оценки помех. В работе анализируются методы непараметрической статистики, в частности, стохастические аппроксимации входных-выходных переменных процесса применительно к процессам черной металлургии, а именно, к процессу конвертерной плавки стали.
Постановка задачи. В теории идентификации исследуемый объект описывается неизвестным с точностью до параметров оператором А . На вход объекта поступает входное воздействие и(/) = (и1(/), и2(/), ..., ит(/)), на выходе объекта - выходная переменная х(/). На объект действует векторное случайное воздействие Непрерывное время обозначено (/). Измерения переменных процесса осуществляются с помощью каналов связи Ни, Нх, которые включают в себя средства контроля. Измерения переменных процесса
осуществляются под действием случайных помех Ъи(р), Лх(/), которые имеют нулевое математическое ожидание и ограниченную дисперсию. Контроль и(/), х(/) осуществляется через интервал времени Д/. Таким образом, мы имеем выборку входных-выходных переменных процесса {х, и, I = 1, 2, ., 5}, где 5 - объем выборки. Итак, стоит задача идентификации, т. е. необходимо восстановить зависимости между входными-выходными характеристиками процесса. В зависимости от уровня априорной информации об объекте различают параметрическую и непараметрическую идентификацию.
Параметрическая идентификация состоит из двух этапов: идентификация параметрической структуры модели и идентификация параметров в модели выбранной структуры [1]. Данный класс идентификации требует высокого уровня априорной информации об исследуемом объекте. Зачастую имеющихся априорных сведений не достаточно для выбора параметризованной структуры модели исследуемого объекта, однако мы можем иметь информацию о его качественных свойствах.