Научная статья на тему 'О методе определения скорости обучения нейронной сети для задачи оперативной настройки линейных регуляторов при управлении нелинейными объектами'

О методе определения скорости обучения нейронной сети для задачи оперативной настройки линейных регуляторов при управлении нелинейными объектами Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
827
78
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АДАПТИВНОЕ УПРАВЛЕНИЕ / ADAPTIVE CONTROL / ПИ-РЕГУЛЯТОР / PI-CONTROLLER / СКОРОСТЬ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ / NEURAL NETWORK LEARNING RATE / ВТОРОЙ МЕТОД ЛЯПУНОВА / LYAPUNOV'S SECOND METHOD / УСТОЙЧИВОСТЬ / SUSTAINABILITY

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Глущенко Антон Игоревич

Рассмотрена проблема выбора скорости оперативного обучения нейронной сети, являющейся составной частью нейросетевого настройщика, осуществляющего адаптацию П-/ПИ-регулятора в реальном масштабе времени. Выходами сети являются параметры регулятора. Данный вопрос непосредственно связан с оценкой устойчивости изучаемой системы управления, поскольку излишне высокие скорости обучения могут привести к переходу объекта в неустойчивое состояние. В работе предложен подход, основанный на втором методе Ляпунова и позволяющий, не имея модели объекта управления, определять верхний допустимый предел для скорости обучения нейронной сети в различных ситуациях. Проведено моделирование и натурные эксперименты для типовых агрегатов из классов нагревательных печей и двигателей постоянного тока, подтверждающие адекватность предложенного подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Глущенко Антон Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

On development of neural network learning rate calculation method to adjust linear controllers online solving nonlinear plant control problem

The problem of a neural network learning rate calculation for online training process is considered. The network is a part of a neural tuner used to adjust linear P-/PI-controllers parameters in real time. Its outputs are the controller parameters values. The problem under consideration is closely related to a control system sustainability estimation, as too high learning rates might make the system unstable. So we propose an approach based on the second Lyapunov’s method to calculate learning rate upper acceptance limit for different situations without knowing the plant model. Modeling and laboratory experiments have been conducted using typical plants of heating furnaces and DC drives classes to prove the method reliability. Having analyzed obtained results, the conclusion can be made that for both plant classes learning rate estimations allow to keep the control system stable. At the same time, constant usage of maximum allowed value of the learning rate during the online training process may result in the plant energy efficiency decrease.

Текст научной работы на тему «О методе определения скорости обучения нейронной сети для задачи оперативной настройки линейных регуляторов при управлении нелинейными объектами»

УДК 004.89 + 681.51 ББК 32.813

О МЕТОДЕ ОПРЕДЕЛЕНИЯ СКОРОСТИ ОБУЧЕНИЯ НЕЙРОННОЙ СЕТИ ДЛЯ ЗАДАЧИ ОПЕРАТИВНОЙ

НАСТРОЙКИ ЛИНЕЙНЫХ РЕГУЛЯТОРОВ ПРИ УПРАВЛЕНИИ НЕЛИНЕЙНЫМИ ОБЪЕКТАМИ

Глущенко А. И.1

(Старооскольский технологический институт им. А.А. Угарова (филиал) ФГАОУВО НИТУ «МИСиС», Старый Оскол)

Рассмотрена проблема выбора скорости оперативного обучения нейронной сети, являющейся составной частью нейросе-тевого настройщика, осуществляющего адаптацию П-/ПИ-регулятора в реальном масштабе времени. Выходами сети являются параметры регулятора. Данный вопрос непосредственно связан с оценкой устойчивости изучаемой системы управления, поскольку излишне высокие скорости обучения могут привести к переходу объекта в неустойчивое состояние. В работе предложен подход, основанный на втором методе Ляпунова и позволяющий, не имея модели объекта управления, определять верхний допустимый предел для скорости обучения нейронной сети в различных ситуациях. Проведено моделирование и натурные эксперименты для типовых агрегатов из классов нагревательных печей и двигателей постоянного тока, подтверждающие адекватность предложенного подхода.

Ключевые слова: адаптивное управление, ПИ-регулятор, скорость обучения нейронной сети, второй метод Ляпунова, устойчивость.

1 Антон Игоревич Глущенко, кандидат технических наук, доцент (г. Старый Оскол, м-н Макаренко, д. 42, тел. (4725) 45-12-17, strondutt@mail. ги).

1. Введение

Линейные П-/ПИ-регуляторы с постоянными параметрами являются основой для построения контуров управления промышленными технологическими агрегатами в 90-95% случаев [2, 34]. В то же время такие агрегаты являются нелинейными, то есть меняют значения своих параметров в процессе функционирования. Например, для нагревательных объектов причинами подобного изменения могут являться изменение загрузки и/или задания, замена футеровки, отказ горелки, изменение теплотворности энергоносителя. Для электродвигателей - изменение температуры обмоток якоря и возбуждения, изменение нагрузки, износ электрической и механической частей.

Для учета подобных ситуаций необходимо использовать принципы адаптивного или оптимального управления [1]. В противном случае при смене режима работы объекта управления (ОУ) качество регулирования ухудшится, что приведет к повышенному энергопотреблению ОУ как при отслеживании графика заданий [56], так и отработке возмущений [61].

Рассматривая методы оптимального управления [1, 12, 13, 16, 17, 21, 24] необходимо отметить, что их применение возможно лишь при условии наличия точной модели ОУ (идентификация которой в условиях производства весьма затруднительна), а кроме того, полученное решение задачи оптимизации не гарантирует требуемого качества переходных процессов с точки зрения перерегулирования, колебательности и т.д.

Применим для решения рассматриваемой задачи методы адаптивного управления, используя в качестве базового закона регулирования стандартный ПИД-алгоритм. Согласно [22], именно его имеет смысл рассматривать как основу для построения подобных систем, а в случае недостаточного качества работы системы автоматического управления решение следует искать не в усложнении алгоритма работы контроллера, а в его более тесной связи с объектом управления. При этом Д-канал довольно редко применяется на производстве ввиду его высокой подверженности помехам [59], поэтому далее в качестве базовых законов управления рассматриваются П и ПИ алгоритмы.

Для настройки параметров П-/ПИ-регулятора применяются различные подходы, обзор которых подробно приведен в [34, 50, 51]. Значительная часть методов основана на использовании модели ОУ [34], получаемой в результате идентификации с применением тестовых сигналов: ступенчатых [29, 39, 49, 56, 58, 65] и полигармонических [23, 31]. Основной проблемой является то, что применяемые методы идентификации могут давать существенно отличающиеся результаты даже из сходных начальных условий.

Другим походом является применение эталонных моделей (ЭМ) [28, 35, 62]. В этом случае формулы коррекции параметров регулятора выводятся с использованием передаточной функции ЭМ. В качестве методов синтеза законов настройки регулятора могут выступать градиентный метод, метод скоростного градиента, второй метод Ляпунова и др. Проблемой подхода является выбор шага настройки параметров регулятора для указанных выше методов и недостаточная способность к компенсации действующих возмущений.

Подходом к решению указанных выше проблем является применение интеллектуальных методов, большая часть которых представляет собой попытки моделирования логики, опыта специалистов АСУ ТП, работающих на производстве и обладающих наибольшей эффективностью в решении задачи настройки регуляторов, не используя при этом модель ОУ. Кроме того, согласно [27], применение интеллектуальных методов может быть оправдано тем фактом, что для построения эффективной адаптивной системы управления необходимо введение механизма обучения в ту часть системы, которая осуществляет адаптацию. В большинстве случаев для рассматриваемой задачи применяются: экспертные системы [19, 30, 32, 36], нечеткая логика [14, 15, 43, 45], нейронные сети [4, 38, 44, 55, 57, 59, 63].

Экспертные системы позволяют отразить опыт инженера АСУ ТП, однако полученная в итоге база знаний оказывается привязана к динамике ОУ, поскольку в следствиях, например, продукционных правил явно указано [32] на сколько следует менять значение того или иного параметра регулятора в конкретной ситуации.

Сходная ситуация наблюдается и для нечетких настройщиков. Его входные и выходные переменные определяют в диапазоне [-1; 1] или [0; 1]. Реальные же измеряемые на ОУ значения параметров затем приводятся в данные диапазоны с помощью коэффициентов нормировки [15, 43, 45]. Также поступают с получаемыми с выходов настройщика значениями КР, КI (их переводят из промежутка [0; 1] в диапазон, требуемый для данного ОУ). Данные коэффициенты нормировки также необходимо подстраивать в процессе работы. Возможности оперативного обучения весьма ограничены для указанных двух подходов.

Нейронные сети, в свою очередь, способны к подобному обучению. В то же время каждое конкретное применение сети требует сложной детальной подстройки под конкретную задачу и специфику объекта управления (в частности - наличие нейросетевой модели ОУ). Под спецификой понимается несимметричность ОУ [53], ограничения на сигналы управления и пр.

Попыткой избежать недостатков описанных методов является их совместное использование. В частности, авторами [8-10, 41, 42] предложен нейросетевой настройщик ПИ-регулятора, представляющий собой сочетание нейронной сети, ответственной за вычисление параметров регулятора и обучаемой оперативно в процессе работы, и базы правил ситуаций, определяющей, когда необходимо вести обучение сети и с какой скоростью это делать. Данный подход является методом непрерывной адаптации для задач отслеживания графика уставок и отработки возмущений без необходимости наличия модели ОУ или явной ЭМ. Авторами были разработаны методы построения подобных настройщиков [8], определения дискретности их вызова [10], базы правил для ступенчатой смены задания [9] и линейно нарастающего задания [41, 42] для одноконтурных систем управления и систем подчиненного регулирования.

Важным нерешенным вопросом для нейросетевого настройщика остается определение предельно допустимых скоростей обучения нейронной сети для каждого конкретного момента его вызова. В следствиях правил используются эмпирически полученные формулы для вычисления скорости обуче-

ния нейронов выходного слоя сети. Однако возможна ситуация, когда такая скорость может оказаться слишком высокой, что приведет к возможности возникновения недопустимого перерегулирования, выхода на границу устойчивости или даже ее потери. Поэтому в первую очередь необходимо оценить устойчивость данной системы управления.

В соответствии с [60, 64], из-за того, что коэффициенты регулятора в данном случае являются функциями времени и изменяются даже в течение конкретного переходного процесса, а кроме того, ОУ изменяет свои параметры в процессе работы, оценка устойчивости подобной системы классическими математическими методами является весьма затруднительной. Решением данной задачи могут являться:

1. Оценка устойчивости системы на ограниченном интервале времени, например, стабильность конкретного переходного процесса, на основе методов технической устойчивости [5, 7, 11, 18, 32, 54]. В случае обнаружения нестабильности необходимо возвращать регулятору коэффициенты, которые использовались в рамках последнего устойчивого переходного процесса. Однако техническая устойчивость может служить лишь для оценки работы системы управления с настройщиком «по факту», когда система «регулятор - ОУ» уже стала неустойчивой. Этот подход не может быть применен для коррекции скорости обучения настройщика непосредственно в течение переходного процесса, что позволило бы предотвратить потерю устойчивости.

2. Оценка устойчивости системы управления с использованием функций Ляпунова [52]. Данный подход применяется для систем управления с интеллектуальными регуляторами/настройщиками, в частности, для оценки допустимой скорости обучения нейронных сетей [20, 26, 33, 37, 40, 46, 48, 59].

Однако в работах [26, 33, 37, 40, 46, 48] нейронная сеть рассматривается как регулятор, а не настройщик его параметров. В [20] используется ЭМ объекта управления, получение которой в условиях реального производства является достаточно сложной задачей. Кроме того, не рассматривается вопрос выбора величины шага адаптации. В работе [59] оценивается устойчивость системы управления с нейронной сетью, настраивающей

параметры ПИ-регулятора, однако скорость обучения принимается постоянной и выбирается исследователем. Общей проблемой применения второго метода Ляпунова является требование наличия модели ОУ или ЭМ.

В рамках данной работы модель ОУ считается неизвестной, что соответствует реальным условиям на промышленных предприятиях. При этом предполагается производить оценку устойчивости не проектируемой системы управления, а реально работающей. Поэтому для вычисления функции Ляпунова и ее производной будут использоваться получаемые в реальном времени значения выхода ОУ не с модели, а с реального агрегата. И устойчивость будет оцениваться для каждого конкретного момента времени в течение переходного процесса. При такой постановке модель ОУ остается неизвестной и не требуется для расчетов.

Таким образом, целью данной работы является разработка метода вычисления предельной скорости обучения нейронной сети настройщика в каждый конкретный момент времени с использованием результатов оценки устойчивости рассматриваемой системы управления. Данный метод работает, не требуя модели ОУ или явной ЭМ. Проверка работоспособности метода была произведена для двух задач управления типовыми для промышленности объектами различных классов: 1) объект с низкой динамикой: управление печью нагрева (модель и лабораторная печь) в условиях изменения задания и загрузки -одноконтурная система; 2) объект с высокой динамикой: управление двигателем постоянного тока (ДПТ) (модель и лабораторная установка) в условиях изменения параметров обмотки якоря двигателя и механической части - система подчиненного регулирования.

2. Постановка задачи

Объектом исследований является схема управления, представленная на рис. 1. Причем задание может приходить не только с задатчика, но и являться, например, сигналом с внешнего по отношению к рассматриваемому контура управления.

Таким образом, настройщик может применяться и в многоконтурных системах, но отвечает он за настройку регулятора конкретного контура (подобный подход использован при управлении электроприводом, см. п. 7).

Рис. 1. Система управления с нейросетевым настройщиком

В данном исследовании в качестве ОУ выступают типовые для промышленности агрегаты: нагревательный ОУ (на примере нагревательной печи для литой заготовки перед ее прокатом) и электропривод постоянного тока (на примере системы управления электроприводом реверсивной прокатной клети, построенная по принципу «тиристорный преобразователь (Т11) - двигатель постоянного тока (ДПТ)»). Для второго ОУ система управления является многоконтурной [25]. В данном исследовании рассматривается и контур управления током якоря электродвигателя, и контур управления скоростью.

Если рассматривать нагревательную печь и контур управления током якоря электропривода, то объект управления для обоих случаев описывается двумя апериодическими звеньями первого порядка со звеном задержки (1). Первое из них является моделью самого ОУ (печи, якорной цепи двигателя постоянного тока), а второе - моделью термопары для печи или моделью тиристорного преобразователя для двигателя:

(1) =

К

К

— . "Л

Т^ +1 Т2ъ +1

где Ж(я) - передаточная функция ОУ; К - коэффициент усиления ОУ; Т - постоянная времени ОУ, с; К2 - коэффициент усиления преобразователя (для измерительного прибора он

е

равен единице); ^ - постоянная времени измерительного прибора/преобразователя, с; т - время запаздывания, с.

Такая передаточная функция отражает одно конкретное состояние ОУ, поскольку T\ и ^ здесь являются константами. Для реального ОУ они являются переменными. В частности, для нагревательных объектов постоянная времени печи может изменяться в зависимости от количества материала, загруженного в эту печь. Коэффициент усиления уменьшается по мере увеличения температуры в печи, а кроме того, зависит от качества энергоносителя, подаваемого на печь. Для ДПТ влияние будет оказывать температура обмотки якоря и ее износ.

Если рассматривать контур управления скоростью электропривода, то ОУ - это последовательно расположенные контур управления током якоря электропривода и интегральное звено, описывающее механическую часть электропривода:

(2) Ж(я) = .

Для реального ОУ параметры контура тока изменяются, а кроме того, постоянная времени механической части электропривода TM не является константой ввиду износа механики и изменения момента нагрузки.

Задачей контура управления, изображенного на рис. 1, является отслеживание графика уставок таким образом, чтобы, с одной стороны, переходные процессы протекали за минимальное количество времени. Это позволит интенсифицировать производство и сократить потери энергоносителя. С другой стороны, качество получаемых переходных процессов по перерегулированию, колебательности, статической ошибке должно находиться в пределах допуска согласно технологической инструкции. Для печи график уставок представляет собой набор ступенчатых изменений задания, для ДПТ в контуре тока задание изменяется плавно, поскольку формируется как выход внешнего относительно рассматриваемого контура управления - выход регулятора скорости вращения ротора двигателя. Для контура скорости ДПТ задание имеет линейно нарастающий/убывающий характер с насыщением.

Соответственно, для поддержания времени переходного процесса близким к минимальному в условиях изменения параметров Ть К и/или Тм необходимо оперативно в процессе работы настраивать коэффициенты регулятора КР, К/.

ОУ уже функционирует под управлением П-, или ПИ-регулятора и его коэффициенты изначально подобраны для одного из состояний объекта (или «в среднем» на все известные состояния). Задачей является подстройка (а не полное переопределение) коэффициентов регулятора в соответствии с изменениями режима работы ОУ.

Для этого предлагается применить нейросетевой настройщик параметров линейных регуляторов. Он не предполагает построение модели ОУ. Вместо этого производится оценка ситуации на ОУ (в частности, текущей скорости переходного процесса) с помощью базы правил с дальнейшими выводами о необходимости обучения НС.

Задачей работы является разработка метода определения верхней допустимой границы для скорости оперативного обучения нейронной сети настройщика на основе применения методов оценивания устойчивости рассматриваемой системы управления. При этом полученный подход не должен требовать наличия модели ОУ или явной ЭМ. Далее рассматривается структура нейросетевого настройщика и оценка устойчивости системы управления, изображенной на рис. 1.

3. Структура нейросетевого настройщика

Функциональная схема нейросетевого настройщика приведена на рис. 2. Количество выходов настройщика зависит от числа настраиваемых параметров регулятора.

Установлено [8], что количество НС в нейросетевом настройщике, ответственных за настройку регулятора в течение переходных процессов, зависит от того, является ли ОУ симметричным [53] или нет. Если ОУ является несимметричным, т.е. для оптимальности ведения процесса первого и второго типов (например, нагревания и остывания для печей) требуется

два набора коэффициентов регулятора, а не один, то, соответственно, применяются две нейронных сети.

Значения параметров, получаемых из системы управления

База правил, определяющая в какие моменты и с какой скоростью учить НС

Переключатель

_

НС для процессов типа 2

НС для отработки возмущений

НС для процессов Кр, К; (

типа 1

Кр, К:

Кр, К;

Кр, К;

Рис. 2. Функциональная схема нейросетевого настройщика

Но регулятор, оптимально настроенный на переходные процессы, в большинстве случаев неэффективно отрабатывает возникающие в установившемся режиме возмущения [34]. Поэтому в настройщик добавлена еще одна нейронная сеть для настройки параметров регулятора при возникновении возмущающего воздействия (не является предметом рассмотрения данной статьи).

Структура нейронных сетей выбирается согласно методу, предложенному в [8]. В целом это всегда многослойные сети прямого распространения сигнала с одним скрытым слоем с сигмоидальной функцией активации (в выходном слое применяется линейная функция активации).

Настройщик вызывается дискретно. Интервал времени А( между последовательными вызовами нейросетевого настройщика вычисляется согласно [10]. Этот интервал не совпадает с дискретностью работы контроллера Л (значение Л в секундах меньше АО, в котором реализован П- или ПИ-регулятор, поскольку нейросетевой настройщик должен иметь возможность оценить, как изменилась динамика переходного процесса (в результате его действия или бездействия) между его двумя последовательными вызовами. В противном случае работа

настройщика будет невозможна, поскольку при использовании в качестве значения А^ значения Л динамика изменения выхода ОУ окажется ниже уровня помех измерения. Поэтому А( вычисляется относительно времени переходных процессов до установки настройщика в систему и того факта, что нейронной сети настройщика необходимо показать определенное число точек переходного процесса, совпадающее с количеством нейронов в скрытом слое [10, 47].

Для несимметричного ОУ переключение между НС для процессов разных типов предлагается производить в момент очередной смены задания. При возникновении возмущения задействуется третья сеть. Все НС настройщика начинают работу с формирования на своем выходе одинаковых коэффициентов регулятора, используемых на ОУ в текущий момент (до внедрения настройщика) [9]. В процессе функционирования производится оперативное обучение нейронных сетей настройщика методом обратного распространения ошибки [8, 55].

Подробно оперативное обучение настройщика описано в [8]. В целом скорость обучения для всех нейронов скрытого слоя п(1) является одинаковой и не меняется в течение работы системы. Численное значение данной величины заимствовано из работы [55] и составляет 10-4. Значения скоростей обучения нейронов выходного слоя ц^12 (к = 1, 2 для ПИ-регулятора) являются различными и изменяются в течение работы системы (вычисляются в следствиях правил); ^1(2) - скорость коррекции весовых коэффициентов и смещений, отвечающих за формирование выхода НС О/2), т.е. КР. Соответственно, п2(2) отвечает за К/. Каждый из нейронов выходного слоя обучается пропорционально своему значению ошибки (3). Здесь в\ - величина ошибки обучения для нейрона, ответственного за формирование КР; е2 -ошибка обучения для нейрона, ответственного за формирование К/; г -задание для контура управления; у - выходной сигнал с ОУ; А^ - интервал дискретизации вызова настройщика. (3) е2(0 = т($) - у(0, ^(0 = е2(1) - в2(1 -Д).

База правил содержит в себе описание ситуаций, когда необходимо вести оперативное обучение НС (в условиях пра-

вил), а также формулы вычисления скоростей обучения и п2(2) (в следствиях правил). Перед инициализацией базы правил необходимо определить: 1) какой регулятор будет настраиваться - П (тогда п2(2) всегда будет равна нулю) или ПИ;

2) какой тип смены задания используется в рассматриваемом контуре управления - ступенчатый, линейный, или это задание для внутреннего контура подчиненной системы регулирования;

3) какие требования по скорости, перерегулированию, статической ошибке и колебательности предъявляются к переходному процессу - эти значения подставляются в условия правил, и с ними в дальнейшем ведется сравнение фактических данных. Для ступенчатой смены заданий данная база приведена в [9], для линейно изменяющегося задания и задания внутреннего контура подчиненной системы регулирования - в [41, 42].

Разработанный обобщенный алгоритм работы настройщика параметров линейных регуляторов приведен на рис. 3.

(начало)

Получение данных от контроллера Вычисление усредненного значения выхода объекта и рассогласований для всех 1

Начальное* ^ состояние НС

установлено-

Установить начальное состояние

| Установить все скорости обучения равными нулю | | | Вызов базы правил | |

Рис. 3. Алгоритм работы нейросетевого настройщика

Если полученное с помощью эмпирических формул значение скорости обучения для нейронной сети окажется выше предельно допустимого, то параметры регулятора могут быть изменены слишком сильно, что может привести к ухудшению

качества переходных процессов или даже потере устойчивости. Поэтому необходим метод ограничения значений упомянутых скоростей обучения на основе оценки устойчивости описанной системы управления.

4. Устойчивость системы управления с нейросетевым настройщиком

В соответствии с [6], система управления может быть устойчива технически, но неустойчива по Ляпунову, и наоборот. Поэтому в данной работе предлагается для оценки устойчивости использовать оба подхода.

4.1. ОЦЕНКА ТЕХНИЧЕСКОЙ УСТОЙЧИВОСТИ СИСТЕМЫ УПРАВЛЕНИЯ С НЕЙРОСЕТЕВЬМНАСТРОЙЩИКОМ

Существует ряд критериев для оценки технической устойчивости. В рамках данной работы использовались подходы, описанные в [32, 54]. Система считалась неустойчивой если:

1) график выхода ОУ более трех раз пересекал установившееся значение задания, и каждый раз амплитуда колебаний возрастала

ИЛИ

2) разница между значением выхода ОУ и задания в любой момент времени после первого пересечения задания графиком выхода ОУ достигла более 30% разницы между текущим заданием и предыдущим.

Как уже упоминалось выше, данный подход не позволяет оценить требуемую скорость обучения нейронных сетей настройщика. Поэтому применим второй метод Ляпунова.

4.2. ОЦЕНКА УСТОЙЧИВОСТИ С ПОМОЩЬЮ ВТОРОГО МЕТОДА ЛЯПУНОВА

Функция Ляпунова для линейных систем является квадратичной формой фазовых координат системы [3]. При этом для нелинейных и нестационарных систем используется, в частности, вид функции Ляпунова, предложенный А.И. Лурье и В.И. Постниковым. Он представляет собой сумму двух слагае-

мых, где первое - это квадратичная форма фазовых координат системы, а второе - «интеграл от нелинейности системы» [3].

В данной работе контур управления работает по рассогласованию. Настройщиком П/ПИ-регулятора выступает нейронная сеть (с базой правил). Ее выходы и являются параметрами регулятора. Обучение каждого из нейронов выходного слоя ведется пропорционально своей величине e2 (см. (3)). И именно эти две величины одновременно являются и фазовыми координатами системы, и элементами, вносящими нелинейность, поскольку если они равны нулю, то и обучение нейронной сети не произойдет, и, соответственно, коэффициенты П-/ПИ-регулятора не изменятся. На основании вышеизложенного предлагается следующий вид функции Ляпунова для оценки устойчивости системы управления с настройщиком:

1 Noutput

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(4) V(E) = - Х>г 2(0 .

2 i=1

Такая функция является знакоопределенной. Согласно теореме Ляпунова, если существует знакоопределённая функция V(e\, ,..., en), полная производная которой по времени в силу дифференциальных уравнений является знакопостоянной функцией противоположного с V(E) знака, то невозмущенное движение устойчиво. Вычислим производную функции V по времени:

лтл/ч V(t + At)-V(t) i N'pp?' 2i л ч 2/чч

AV(t) = --(-1 = — X (e (t + Л') - e, (t)) =

At 2At ~f

1 Noutput

= ^ X (ei (t + At) - e, (t)) * (e, (t + At) + e, (t)) =

(5) 2At i=i

1 Noutput

=^ XAe,(t)*(2et(t) + Ae,(t)) = 2At i=i

1 Noutp ut 1 No utp ut

= — X Aei (t) * et (t) +- X Aei2 (t).

At X i У) i У) 2 At X i У)

Здесь At имеет тот же смысл, что и в п.3. Несмотря на то, что At - это интервал времени между последовательными вызовами настройщика, данная функция Ляпунова и ее производная позволяют оценивать не только сходимость обучения нейрон-

ной сети настройщика, но и устойчивость системы «Настройщик - ПИ-регулятор - объект управления». Согласно постановке задачи (см. п.2) система управления уже функционирует и является устойчивой (до внедрения настройщика), а настройщик подстраивает изначально известные параметры ПИ-регулятора для улучшения качества переходных процессов в условиях изменения значений параметров ОУ. То есть нарушить устойчивость системы управления может настройщик путем неверного изменения значений параметров регулятора. Поэтому каждые А? секунд производится оценка его действий (или факта бездействия) на существующую систему управления с целью предотвращения подобных ситуаций. Если производная АV станет положительной, то это будет говорить о нарушении достаточного условия устойчивости системы «ПИ-регулятор - объект управления». Если производить вычисление АV с меньшим интервалом дискретизации по сравнению с А?1, то даже если значение АV станет положительным, коррекцию параметров регулятора сможет провести только настройщик, вызываемый раз в А? секунд.

В соответствии с требованиями теоремы Ляпунова, АV(t) < 0.

Дальнейшие рассуждения ведутся для ПИ-регулятора.

Распишем выражения (3), заменив рассогласование е(?) на разницу между заданием г(?) и выходом ОУ у(?): к (г) = Ае(г) = (г(г) - у(г)) - (г(г- ДО - у(г - ДО), [е2(0 = е(г) = г(0 - у(г).

В выражении (6) предполагается, что задание изменяется в течение переходного процесса. Если задание изменяется ступенчато, т.е. является постоянным для конкретного переходного процесса г(?) = г(? - А?), то данные выражения примут вид

и (г) = Ае(г) = (г(г) - у(г)) - (г(г) - у(г - А)) = у(г - Д) - у(г), 1^2 (г) = е(г) = г (г) - у(г).

Теперь необходимо получить подобные выражения для Аег(?) (при условии, что длительность переходного процесса

(8) (9)

существенно больше А?) для неступенчатого и ступенчатого задания (формулы (8) и (9) соответственно):

[Ае (г) = г(г) - 2г(г -Д) + г (г - 2Д) - у(г) + 2 у(г - Д) - у(г - 2Д), [Де2 (г) = г(г) - у(г) - г (г - Аг) + у(г - Аг); [Ае, (г) = 2у(г - А) - у(г) - у(г - 2Д), IАе2(г) = у(г -АО - у(г).

Подставим полученные выражения в производную функции Ляпунова (5), рассмотрев ПИ-регулятор. Итоговое выражение для производной выбранной функции Ляпунова для неступенчатого задания примет следующий вид: 2 1 2

1 2 1 2 1

АУ (г) = ^ ЁАе, (г )* е, (г) +—£Де2, (г) = —[6 у2 (г) Аг 2Аг 2Аг

+ у(г)(-\2г(г) + \4г(г - Аг) - 4г(г - 2А) -14у(г - А) +

(10) + 4 у(г - 2Аг)) + 9 у2 (г - А) + у (г - Аг )(14г (г) - 18г (г - А) +

+ 6г (г - 2Аг) - 6 у(г - 2Аг)) + у2 (г - 2Аг) + у (г - 2Аг )(-4г (г) + + 4г (г - А)) + 6г2 (г) + г(г)(-14г(г - А) + 4г(г - 2Аг)) + + 9г2(г - А) - 6г(г - А)г(г - 2Аг) + г2(г - 2Аг)] < 0. Итоговое выражение для производной выбранной функции Ляпунова для ступенчатого задания примет следующий вид: 1 2 12 1 АУ (О =—Ё Ае, (г) * е1 (г) +—£ Ае2, (г) =—[6 у2(0 + А 2Д 2Д

(11) + 9 у2 (г - а ) + у2 (г - 2Аг) -14 у (г) у (г - а ) + 4 у (г) у (г - 2 А) -- 6 у(г - Д) у(г - 2Д) + 2г (г)(у(г - Д) - у(г))] < 0. Величина А? является положительной, поэтому устойчивость системы управления будет зависеть от соотношения значений остальных слагаемых. Используя указанное выше выражение, в любой момент работы системы в реальном времени производится проверка, выполняется ли достаточное условие устойчивости. Для этого берутся известные значения задания г(?) и выхода ОУ у(?) в текущий момент, предыдущий момент г(? - А?) и у(? - А?) и два такта назад г(? - 2А?) и у(? - 2А?).

Получим выражения для АУ для П-регулятора ((12) - неступенчатое задание, (13) - ступенчатое):

1 1 1 1 1 А¥ «)=^ Х,Ае{ а )* е а)2 ■■ а) =^1:[зу)+

Лг 2 А 2Лг

+ у(г)(-6г(г) + 10г(г - А) - 4г(г - 2Ал) -10у(г - А) +

(12) + 4 у (г - 2 А)) + 8 у2 (г -Лг) + у (г - А )(10г (г) -16г (г - А) +

+ 6г (г - 2А) - 6у(г - 2 А)) + у2 (г - 2А) + у(г - 2А)(-4г (г) + + 4г (г - А)) + Зг2 (г) + г (г)(- 10г(г - А) + 4г(г - 2Лг)) + + 8г 2 (г - А) - 6г(г - Л)Г(г - 2 А) + г 2 (г - 2Лг)] < 0;

11 11 1

ЛУ (г) = - XАе, (г )* е (г) + —%Ае2< (г) = —[3у 2(г) + А 2Лг 2Лг

(13) + у (г)(-10 у (г -А) + 4 у (г - 2Лг)) + 8 у2 (г - А) + + у(г - Лг)(-6у(г - 2А)) + у2 (г - 2Лг)] < 0.

Подобные рассуждения возможно повторить и для ПИД-регулятора.

На точность вычисления значения производной функции Ляпунова оказывает влияние погрешность измерений величины у(0. Для борьбы с этим используется усреднение данной величины по нескольким замерам, в частности, для опытов, приведенных в данной работе, - по трем измерениям, отстоящим друг от друга на А^ секунд. В таком случае, значение у(0 для (10)-(13) - это фактически среднее от у(0, у(^ - АО и у(^ - 2 А); значение у^ - АО для (10)-(13) - это среднее от у(^ - АО, у(^ - 2А) и у(^ - 3А); значение у(^ - 2-АО для (10)-(13) - это среднее от у^- 2А), у(^ - 3А) и у(Г - 4-АО. Это позволяет минимизировать влияние рассматриваемой погрешности.

Кроме того, вычислительная точность подобного подхода зависит от величины А( (имеющей смысл дискретности вызова настройщика), значение которой зависит от длительности переходных процессов до установки настройщика в систему управления и определяется согласно [10]. С уменьшением шага дискретизации точность вычислений производной функции

Ляпунова будет возрастать, однако выбирать А? произвольно в данном случае невозможно, поскольку, согласно [8], настройщику необходимо предоставить определенное число точек конкретного переходного процесса для анализа. И именно тот факт, что эти точки отстоят друг от друга на А? секунд, позволяет настройщику оценить, как изменяется устойчивость системы «ПИ-регулятор - объект управления» из-за его действия или бездействия по настройке параметров ПИ-регулятора.

Имея подобную оценку устойчивости, возможно разработать метод определения предельно допустимого значения скорости обучения нейронов выходного слоя НС настройщика.

5. Метод оценки предельно допустимой скорости обучения НС настройщика

Дальнейшие рассуждения проведены для ПИ-регулятора.

Вызывается нейросетевой настройщик (раз в А? секунд). Вызывается база правил. Если какое-либо правило срабатывает, то по следствию правила определяется, какой коэффициент регулятора нуждается к коррекции (веса и смещения какого нейрона выходного слоя необходимо настраивать). Далее вычисляется А^?) (10), (11). Затем возможно два варианта.

1. Значение АV(t) положительно или равно нулю. То есть система на границе устойчивости или неустойчива по Ляпунову. Тогда обучение нейронной сети произойдет лишь в том случае, если в базе правил сработало правило, предполагающее уменьшение значения параметра КР или К/, так как это повышает устойчивость системы. Иначе необходимо вернуть регулятору значения коэффициентов, использовавшихся в течение последнего устойчивого переходного процесса.

Если сработало правило по уменьшению КР или К/, тогда:

1.1. Необходимо определить, насколько реальный выход ОУ отличается от значения, для которого АV(t) было бы неположительным. Для этого необходимо решить квадратное неравенство (10) или (11) относительно у(?). Если дискриминант квадратного уравнения В, полученного из неравенства, положительный, то будет получен интервал значений (уш„; утах). у(?)

находится вне этого интервала. Желаемым устойчивым положением уДО будет являться ближайшая к у(0 граница интервала. Если дискриминант В равен нулю, то решением неравенства является одна точка уДО. Если дискриминант квадратного уравнения В будет отрицательным, то в окрестности данного состояния ОУ (его текущего выхода у(0) нет устойчивых точек. Соответственно, система стала неустойчивой по Ляпунову, и необходимо вернуть регулятору значения коэффициентов, использовавшиеся в течение последнего устойчивого переходного процесса. Если В > 0, то перейти к пп.1.2.

1.2. Необходимо вычислить величину сигнала управления с ПИ-регулятора при условии, что выход ОУ был бы равным уД 0. В настоящий момент ^ известен текущий сигнал управления и(0 = ир(0 + иг(0. Здесь ир(0 - составляющая сигнала управления с П-канала регулятора: ир(0= КР(0^е(0, е(0 = г(0 - у(0; иг(0 -составляющая сигнала управления с И-канала регулятора. Если бы выход ОУ в текущий момент был бы равен уДО, то сигнал управления имел бы следующую амплитуду: иДО = ир ДО + иг(0. Здесь ир ДО - составляющая сигнала управления с П-канала при условии, что выход ОУ равен уДО: ир ДО = КДО^еДО, еДО = г(0 - уДО. Соответственно, сигнал управления в данный момент времени может быть изменен максимум на

Аи(0 = (и(0 - иД 0).

1.3. Если требуется уменьшение КР, то максимально допустимая коррекция КР рассчитывается как АК = АКР < < (Аи(0/е(0). Если требуется уменьшение К/, то максимально допустимая коррекция К/ рассчитывается как

АК2 = АК/ < (Ды(0/(е(0-А/Л)).

А затем, при учете, что в выходном слое нейронной сети используется линейная функция активации, максимально допустимую скорость обучения весов и смещений выходного слоя для к-го нейрона выходного слоя определяют следующим образом. Рассмотрим выходной слой нейронной сети:

sf = К • Of + bf\

(14) ^

"hidden _

Of = /2)Ю = sf = ■ Of + bf\ k = 1,2.

j=1

Здесь Nhidden - число нейронов в скрытом слое сети; - весовой коэффициент связи между k-м нейроном выходного слоя и j-м нейроном скрытого слоя; 2) - линейное смещение k-го нейрона выходного слоя; Of1 - выходной сигнал j-го нейрона скрытого слоя; Ok® - выходной сигнал k-го нейрона выходного слоя; sk(2) - взвешенная сумма для k-го нейрона выходного слоя; f (2) -функция активации выходного слоя (линейная).

Oi(2) - это Kp, а O2(2) - это К Тогда AOi(2) - это АКр, т.е. ДКЬ а AO2(2) - это AKj, т.е. ДК1. И тогда, используя формулы метода обратного распространения ошибки [8], получены выражения

(15), (16) и (17) (ДК1 и ДК2, используемые в формулах (16) и (17), были вычислены в пп.1.3, приведенном выше).

AOf = "Г • Of +Abf =

j=i

= "т VfS^Of + aAaj(t-At) + [JAaf (t-2At))• Of +

j=i

+ v(2)S(2) + aAbf> (t -At) + jBAb<(2) (t - 2 At) =

V2 T (Sk?(O?f) +

(15) j=

+ T (pArnj(t-At) + JAwj(t-2At))• Of + vfS? +

j=i

+ aAbf} (t -At) + jBAb'f (t - 2 At) =

bk (l A) + HAbk

Nh sdden

^ ) ) +Sk

= v(2)( Г S^Off)+S(2)) +

j=i

+ "Г" (aA®(f (t -At) + JAajp (t - 2 At)) • Of +

j=i

+ aAbf\t -At) + JAbf>{t - 2At), k = 1/2. (16) AOf <AKk, k = 12

N

№г)( TO)2) + -) ^AKk -

j=i

N hidden

(17) - X(aAa(2)(t - At) + f3Aa(2)(t - 2At)) ■ Of -

j=i

- aAb(2) (t - At) - /3Abf) (t - 2 At), k = -2.

Здесь nk(2) - скорость обучения для k-го нейрона выходного слоя; а и в - коэффициенты инерции, применяемые для ускорения сходимости; Sk(2) - совокупная ошибка k-го нейрона выходного слоя (в данном случае, учитывая линейность функции активации выходного слоя, = ek); ek - ошибка k-го нейрона выходного слоя (см. (3)). Далее выражаем скорость обучения НС, учитывая знак ¿k(2), и получим выражение

AKk - X (aA®kf(t-At) + pAoj\t-2At))■ Of

,(2) s j=1

(18)

mr

sk2\ X ((от+1)

j=i

aAb{2) (t - At) + f}Ab{k ) (t - 2At)

S^ilL (j2) +1)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

j=i

если SSp > 0,

AKk - l" (aAaj\t-At) + pA®j)(t-2At))■ Of

m2 > —-

'k — Nuaa

, , hidden n, -

Sf ]( X ((Off) +1)

j=i

aAb(2) (t - At) + j3Ab(2) (t - 2At)

Nhidden

skf>( x ((Off)+1)

j=1

, если Sk2) < 0.

к = 1,2.

Таким образом, предельную скорость обучения можно обозначить как пк таХ'Т> и вычислять ее по формуле (19) - это правая часть неравенств в (18). Именно формула (19) будет использоваться в опытах для вычисления цк тах(2):

N

N

^Шйеп

АКк - £ (аАф-А!) + ^(1 " 2Щ • 0(

1(1)

^ к тах

у=1

$2)( ТО)2)+1)

У=1

аАд(2) - лл + паи(2^-2А1) —

, к = 1,2.

Рассмотрим второй случай: 2. Значение АУф отрицательно. В этом случае не важно, какое правило сработало. Скорость обучения выбранного нейрона должна определяться исходя из имеющегося запаса устойчивости. Его предлагается определять следующим образом. Необходимо решить квадратное неравенство (10) или (11) относительно у(().

2.1. Дискриминант квадратного уравнения В, полученного из неравенства, является положительным (так как текущее значение АК(0 < 0), т.е. будет получен интервал значений

Утах). При этом у(1) принадлежит интервалу (Утгп, Утах).

Соответственно, если сработало правило о том, что необходимо увеличивать значения КР или Къ то запас устойчивости ввиду такой настройки будет уменьшаться, а его оценка производится следующим образом: если текущее значение задания г больше установившегося значения задания для предыдущего переходного процесса г_оМ, то должно идти нарастание выхода ОУ, т.е. у«(1) = Утах, иначе у^(1) = Утгп.

Если сработало правило о том, что необходимо уменьшать значения КР или К/, то запас устойчивости ввиду такой настройки будет увеличиваться, т.е. предельным желаемым значением выхода ОУ в такой ситуации будет являться У^) = (Утгп + Утах)/2.

2.2. Совпадает с пп.1.2.

2.3. Совпадает с пп.1.3.

Далее, пользуясь рассуждениями в (15)—(17), по формуле (19) рассчитывается предельное значение цк тах(2) для скорости обучения выбранного в соответствии со сработавшим правилом нейрона выходного слоя, к = 1, 2.

Покажем, что цк тах'2 является верхней допустимой оценкой скорости обучения. Согласно выражению (18), при 4(2) > 0 определяется верхняя граница скорости, а при Зк2 < 0 - нижняя. Однако это не так. Необходимо также учитывать исходные формулы метода обратного распространения ошибки из [8], на основе которой и была получена (18).

Согласно этим формулам, если коэффициенты регулятора неотрицательные (а в подавляющем большинстве случаев это именно так), то для увеличения значения КР или КI необходимо получить положительное значение коррекции весов и смещений. Учитывая, что выход скрытого слоя является числом в интервале (0; 1) (сигмоидальная функция активации), получается, что Зк2 и цкт> должны быть одного знака. Согласно (18), модуль скорости обучения цк2 в таком случае будет заключен между нулем и модулем значения, вычисленного в правой части неравенства (верхняя граница).

Для уменьшения значения КР или КI необходимо получить отрицательное значение коррекции весов и смещений. То есть Зк2 и цк2 должны быть разных знаков. Согласно (18), скорость обучения ЦкТ> в таком случае будет заключена в интервал от -да до вычисленного в правой части неравенства значения при Зк2 > 0 или от этого значения до +да при Зк(2) < 0. Обе эти границы, по сути, будут являться нижними, поскольку, взяв значительное по модулю значение скорости пк(2), будет произведено существенное уменьшение КР или К/. Это повысит устойчивость, но может существенно замедлить переходный процесс. Если скорость обучения приравнять значению цк таХ2 (19), то это означает:

1) при АУ > 0 - стремление к устойчивому положению (в соответствии с (10), (11)). Если взять любое значение скорости пк(2), по модулю большее цк тах(2), это будет означать излишнее замедление переходного процесса. Поэтому цк2 = цк тах(2).

2) при АУ < 0 - стремление из одного устойчивого положения к наиболее устойчивому положению уД?) = (утт + утах)/2, причем такое положение является предельно допустимым, иначе переходный процесс будет излишне замедлен. Поэтому скорость |пк тж21 является верхней допустимой границей.

Тогда для всех случаев справедливо выражение \Пк2) = ||тах> если АУ > 0 и Кр или К следует снижать,

(20) |о < |||2)| <|||22)ах| для всех остальных случаев,

к = 1/2.

Необходимо заметить, что правила составлены таким образом, что, во-первых, невозможна ситуация, когда в течение одного вызова нейросетевого настройщика будут скорректированы и КР, и К/ одновременно, а во-вторых, если в течение текущего переходного процесса уже хотя бы раз было скорректировано значение КР, то К/ в течение этого же переходного процесса корректироваться уже не будет, и наоборот.

Изложенное позволяет получить максимально допустимую скорость пк тах'2 (19) с точки зрения устойчивости по Ляпунову. В следствиях правил записаны эмпирические формулы для вычисления скорости обучения нейронов пк(2). Используемая скорость обучения для всех приведенных ниже опытов выбирается с помощью выражения (20) (рис. 4). Данный метод может быть использован и для П-регулятора.

Далее рассмотрим применение предложенного подхода к решению задач управления нелинейными объектами с различной динамикой.

В промышленности возможно выделить два класса объектов: с низкой динамикой (управление температурой, давлением, влажностью, концентрацией) и высокой динамикой (управление скоростью электродвигателей различного вида). Именно на такие процессы приходится значительная часть энергопотребления [34], что позволяет говорить о целесообразности применения для них методов адаптивного управления. Покажем применимость подхода для обоих классов ОУ на примере их типовых представителей.

Проверка Л стойчивостИ системы

работ нет ^хотя бы одно^ равило

Получить вычисленную им скорость обучения Пк(2)

_1_

Решить квадратное неравенство ДУ < 0 относительно у(), Вычислить _дискриминант Б_

Решить квадратное неравенство ДУ < 0 относительно у(), Вычислить дискриминант Б

Найти два корня

_Утт и ут

Система управления неустойчива. Отключить оперативную настройку параметров регулятора.

Установить значения Кр, К1 до начала

настройки -□-

Вычислить допустимую скорость Щ тоХ12

Рис. 4. Алгоритм определения скорости обучения НС

6. Результаты экспериментов с нагревательным объектом управления

Для проверки предложенного подхода по определению предельно допустимой скорости обучения НС настройщика был использован типовой нагревательный ОУ и его модель.

6.1. РЕЗУЛЬТАТЫ МОДЕЛИРОВАНИЯ

В пакете Matlab была реализована схема управления (рис. 5) нагревательным объектом, представленным блоком Subsyst, с ПИ-регулятором (Subsystem) с нейросетевым настройщиком (S-function neuCPI).

Рис.5. Схема для моделирования системы управления с настройщиком в Matlab

Здесь Ui, Up, Upi - сигналы управления на выходе i-, p-каналов и всего ПИ-регулятора соответственно; e - текущее рассогласование. Блок Saturation использован для ограничения получаемого с ПИ-регулятора сигнала управления до диапазона [0; 100]; U - управляющее воздействие, подаваемое на ОУ. Блок Subsyst реализует типовой нагревательный ОУ вида (1), на выход которого наложена помеха амплитудой N, равной 10C. Задание будет изменяться ступенчато. На настройщик подается не текущее значение температуры, а его усредненное значение (y(t) + y(t - At) + y(t - 2At))/3.

Для данной задачи, в соответствии с методом, описанным в [8], выбрана НС следующей структуры: 4 входных нейрона -

13 скрытых нейронов (сигмоидальная функция активации) -2 выходных нейрона (линейная функция активации). Входные сигналы: задание, выход ОУ в текущий момент и А( с назад, текущий выход ПИ-регулятора.

Блок ^иЪну81ет1, формирующий вектор входов нейросете-вого настройщика, принимает пять сигналов. Первые четыре из них являются входами НС. Пятый вход необходим для корректной работы базы правил.

Для моделирования в качестве параметров модели использовались результаты идентификации незагруженной и загруженной металлической заготовкой муфельной электропечи СНОЛ 40/1200. Загрузка составляла ориентировочно 20-30% от рабочего пространства каждой печи. Параметры моделей:

1) пустая печь: К = 34,2, Т = 9000 с, Т2 = 100 с, т = 12 с;

2) загруженная печь: К = 34,2, Т = 22000 с, Т2 = 100 с, т = 20 с.

Реализованы они были в пакете МаЙаЬ в виде ^-функций при помощи метода структурного моделирования. Для изменения состояния ОУ непосредственно в процессе моделирования производилась замена набора параметров модели (1): модель пустой печи (12 смен задания) ^ модель загруженной печи (12 смен задания) ^ модель пустой печи (12 смен задания).

Исходя из технологического регламента для печей нагрева металлургических предприятий, был сформирован график температурного режима нагрева литой заготовки (рис. 5, блок Б-Рипе1 «Задание»). Смена заданий по температуре производилась путем повторения последовательности значений: 1000°С ^ 10500С ^ 9150С ^ 1000°С и т.д. Для смены уставки температура должна удерживаться в течение 30 минут в окрестности задания, равной 5% разности текущего задания и предыдущего. При выходе из окрестности счетчик сбрасывался в ноль. Для модели незагруженной печи были подобраны значения параметров ПИ-регулятора, обеспечивающие не более 5% перерегулирования для указанного графика заданий: КР = 1,2; КI = 1,2^10-4. Настройщик начинал работу с формирования этих значений на своих выходах; А( было вычислено как 10 с.

Результаты моделирования для систем с настройщиком и обычным ПИ-регулятором приведены на рис. 6-7.

Рис. 6. Результаты моделирования для системы управления

с обычным ПИ-регулятором (1 - переключение на модель загруженной печи, 2 - переключение на модель пустой печи)

На рис. 7г и 7д показаны графики изменения скорости обучения нейронов выходного слоя нейронной сети настройщика, причем на каждом из этих рисунков по два графика - модуль предельно допустимой скорости цк „J'12, k = 1, 2, рассчитанной по методу, описанному в п.5 - формула (19), и модуль скорости ПД k = 1, 2, рассчитанной по формулам, приведенным в правилах базы правил. Большую часть времени скорости равны нулю, так как в эти моменты не сработало ни одного правила.

Для того чтобы сделать данные графики более наглядными, все моменты с нулевой скоростью были удалены. Полученные результаты приведены на рис. 8. Скорости обучения |^k(2)|, k = 1, 2, нейронов сети все время несколько ниже, чем расчетные предельные „ш:(2)|, k = 1, 2.

0 2 4 6 10 12

0 ,п4 2 х 10 4 6 10 12

пттллшгтгпптг

0 2 4 6 10 12

х 10 4 6 10 12

1 1 ,1

„I-,-!_,-,-1_1-и-1А

О 2 4 6 8 10 12

время, с х ю

Рис. 7. Результаты моделирования для системы управления с нейросетевым настройщиком (1 - переключение на модель загруженной печи, 2 - переключение на модель пустой печи)

Рис.8.Графики изменения скоростей обучения нейронов выходного слоя нейронной сети настройщика

Сравнительные результаты экспериментов по времени и суммарному сигналу управления (который является косвенным показателем энергопотребления) приведены в таблице 1.

На следующем этапе исследований был проведен эксперимент, в котором для системы управления с настройщиком для обучения нейронной сети вместо расчетных скоростей из следствий правил базы правил п^Ч к = 1, 2, были использованы предельные скорости цк тах(2\ к = 1, 2. Сравнительные характеристики с системой из предыдущего эксперимента сведены в таблицу 2.

Таблица 1. Сравнительные характеристики для систем управления с настройщиком и без него__

Показатели ПИ + настройщик ПИ- регулятор

Время эксперимента, часов 30,78 35,17

Экономия по времени, % 12,5 0

Суммарное управление, ед. 3836103 4299394

Экономия по суммарному управлению, % 10,8 0

Таблица 2. Сравнительные результаты при использовании предельных скоростей обучения и скоростей из правил

Показатели Скорости из правил Скорости из критерия из п.5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Время эксперимента, часов 30,78 31,08

Экономия по времени, % 1 0

Суммарное управление 3836103 3894521

Экономия по суммарному управлению, % 1,5 0

На основе выполненных модельных экспериментов возможно сделать следующие выводы. Разработанные эмпирические формулы для расчета скорости обучения [9, 41, 42], записанные в следствиях правил, являются адекватными, так как

полученные с их помощью скорости не превосходят предельно допустимых.

Более того, применение таких скоростей обучения позволяет выиграть примерно 1% по времени опыта и энергопотреблению относительно предельных скоростей. Определим, чем вызван такой результат. Рассмотрим пример. Допустим, принято решение об увеличении КР или Кг. Вычисленные предельные скорости позволят системе остаться стабильной, но неизвестно, как они повлияют на другие показатели качества переходного процесса, поскольку явная эталонная модель в данном случае не используется, а функция Ляпунова зависит только от рассогласования и скорости его изменения. Если выбрать предельно допустимую скорость и провести обучение сети, то значения КР или КI будут максимально возможно изменены. Это максимально увеличит скорость переходного процесса, однако, при этом перерегулирование может выйти за пределы допуска.

Рассмотрим другой пример. Принято решение об уменьшении КР или К/ и А У < 0. Вычисленные предельные скорости обучения позволят максимально допустимо снизить значения параметров регулятора. Но при этом скорость переходного процесса может стать меньше необходимой. Если так случится, то переходный процесс затянется, что повысит время технологической операции и расход энергоресурсов.

Поэтому скорость обучения должна вычисляться в следствии правила на основе текущих значений рассогласования, требуемого значения перерегулирования, скорости переходного процесса и пр. Выбор скорости обучения производится в соответствии с выражением (20).

6.2. РЕЗУЛЬТАТЫНАТУРНЫХЭКСПЕРИМЕНТОВ

Функциональная схема управления печью приведена на рис. 9. На нижнем уровне находились термопара, измеряющая температуру рабочей зоны печи, и реле, посредством симисто-ров включающее нагревательный элемент.

Управляющий уровень (Simatic S7-300) осуществлял непосредственное управление муфельной электропечью. Контроллер получал данные от термопары через термопреобразователь,

производил их обработку и отправлял на рабочую станцию, от которой он получал значение управляющего воздействия. В контроллере производилась широтно-импульсная модуляция управляющего воздействия и его выдача на исполнительный механизм включения нагревательного элемента.

уровень визуализации

¡"рабочая станция

ОРС

МаНаЪ

ЕШетпёП

управляющий уровень

Эшшйс 87-300

т-сг

нижнии уровень

Электрическая сеть -«■220 В

Реле

Ш

Симисторьг

Муфельная Рабочая^-,

зона

печи

\_

■электропечь

Термопара

Рис. 9. Функциональная схема управления печью

На уровне визуализации находилась рабочая станция с системой визуализации '^пСС и пакетом МаАаЬ, в котором реализован нейросетевой настройщик параметров ПИ-регулятора. WinCC и МайаЬ взаимодействовали между собой через ОРС-интерфейс посредством тегов. В Matlab была реализована схема, подобная приведенной на рис. 5. Для опытов использовался тот же график заданий, что и для модельных экспериментов.

Исследовалась работа системы в следующих условиях: с начального момента и до момента, когда задание было изменено 12 раз, муфельная печь была пустой, далее в нее загружалась литая заготовка объемом примерно 30% от рабочего пространства печи, и задание изменялось еще 12 раз, а затем печь разгружалась и проводилось еще 12 переходных процессов.

Для рассматриваемой незагруженной печи были подобраны значения коэффициентов ПИ-регулятора, обеспечивающие не более 5% перерегулирования для рассматриваемого графика заданий: КР = 2,5, КI = 0,01. Нейросетевой настройщик начинал работу с формирования этих значений коэффициентов на своих выходах. Результаты экспериментов для схем управления с

нейросетевым настройщиком и обычным ПИ-регулятором приведены на рис. 10-11 и в таблице 3.

Рис. 10. Результаты для системы управления с ПИ-регулятором (1 - загрузка печи, 2 - разгрузка печи)

Рис. 11. Результаты для системы управления с нейросетевым настройщиком (1 - загрузка печи, 2 - разгрузка печи)

Таблица 3. Сравнительные характеристики для систем управления с настройщиком и без него для печи СНОЛ 40/1200

Показатели ПИ + настройщик ПИ- регулятор

Время эксперимента, часов 28,6 30,01

Экономия по времени, % 4,7 0

Расход электроэнергии, кВтч 34,48 36,94

Экономия по расходу электроэнергии, % 6,7 0

Как и в случае с рис. 7, для рис. 11г и 11д были удалены все моменты, когда скорости обучения были равны нулю. Полученные графики приведены на рис. 12.

Рис. 12 Графики изменения скоростей обучения нейронов выходного слоя нейронной сети настройщика

7. Результаты экспериментов с электроприводом постоянного тока

С целью проверки предложенного подхода вычисления предельной скорости обучения проведены эксперименты с математической и физической моделями электропривода посто-

янного тока, широко применяемом в различных отраслях промышленности. Настройщик применен для адаптации параметров регуляторов контуров скорости (п) и тока якоря (1А) в условиях изменения параметров ОУ.

7.1. ПОСТАНОВКА ЗАДАЧИ УПРАВЛЕНИЯ ПРИВОДОМ

Система управления скоростью состоит из внутреннего контура управления током якоря и внешнего по отношению к нему контура скорости (рис. 13). Здесь З - задание; ЗИ - задат-чик интенсивности; РС - регулятор скорости; РТ - регулятор тока; ТП - тиристорный преобразователь; Д - двигатель; М - механика; ДТ - датчик тока; ДС - датчик скорости.

Рис. 13. Функциональная схема электропривода

Задачей является исследование работы нейросетевых настройщиков параметров ПИ-регулятора (РТ) контура тока и П-регулятора (РС) контура скорости, не требующих наличия модели ОУ.

Задание для контура скорости является линейно нарастающим/убывающим с насыщением. Задание для контура тока имеет вид, определяемый выходом регулятора скорости.

Данные об измеренных значениях тока якоря и скорости вращения ротора электропривода усредняются по трем измерениям и лишь затем подаются на настройщик (подобно тому, как это было организовано для экспериментов с нагревательными объектами).

7.2. РЕЗУЛЬТАТЫ МОДЕЛЬНЫХ ЭКСПЕРИМЕНТОВ

7.2.1. НАСТРОЙКА П-РЕГУЛЯТОРА СКОРОСТИ

Для проведения моделирования в качестве ОУ выбран главный электропривод двухвалковой прокатной клети 1000 с двигателями постоянного тока 1JW5539-5DK07-Z-001, являющийся типовым электроприводом постоянного тока. Разработанная модель системы управления приведена на рис. 14. На нем КР (0,489) и К] (13,649) - коэффициенты ПИ-регулятора тока, значения которых были рассчитаны в соответствии с настройкой контура на технический оптимум. На этот же оптимум (КР^ = 1,745) был настроен и П-регулятор контура скорости, реализованный в подсистеме «П-регулятор». Модель обмотки якоря (ОЯ) представляет собой апериодическое звено первого порядка со значениями параметров Кя = 41,7 и Тэ = 0,036 с. Механическая часть электропривода представлена одной массой, описываемой интегрирующим звеном (Тмех = 4,798 1 03 с). Оно реализовано в виде ^-функции, поскольку Тмех изменяет свое значение непосредственно в процессе моделирования. Коэффициент обратной связи по скорости Кос равен 0,637; коэффициент обратной связи по току Кот равен 9,407-10-4.

Рис. 14. Модель системы управления с настройщиком регулятора скорости

Нейросетевой настройщик также реализован в виде ^-функции «neuC_P». Его входные сигналы (скрыты в блоке «Входы») включают в себя: задание по скорости, действующее

значение скорости и выход П-регулятора скорости. Также в блоке «Входы» реализуются задержки действующего значения скорости на Дt и 2Д^ с. Выход нейросетевого настройщика совпадает с выходом нейронной сети.

Задание по скорости реализовано с помощью ^-функции setpoint и представляет собой следующую последовательность уставок: 0 об/мин (0 В) ^ 60 об/мин (4 В) ^ 0 об/мин (0 В) ^ ^ -60 об/мин (-4 В). В соответствии с максимальным ускорением рассматриваемого электропривода сигнал задания изменялся линейно со скоростью 8 В/с. Время нахождения на уставке составляло 1 с. Требуемое перерегулирование о составляет 0,35-0,55% от разницы между текущим и предыдущим установившимися значениями задания по скорости.

Структура нейронной сети настройщика определена в соответствии с [8] и имеет следующий вид: 3-10-1. Входные сигналы: задание по скорости, действующее значение скорости и выход П-регулятора скорости. Выходной сигнал - КР.. В скрытом слое использована сигмоидальная функция активации, в выходном - линейная. База правил для данного случая приведена в [41]. Оперативное обучение нейронной сети для отслеживания изменений, происходящих в контуре скорости, производится методом обратного распространения ошибки. Каждые Дt секунд происходит вызов настройщика и выполнение одной итерации указанного метода. В соответствии с методом, предложенным в [10], значение Дt определено как 5 мс.

Был проведен эксперимент, в котором с помощью блока моделировалось плавное изменение (дрифт) постоянной времени механической части электропривода прокатной клети (Тмех) в пределах 50% ^ 150% от номинального значения. Задачей настройщика, начинавшего свою работу с формирования на своем выходе расчетного значения КР. = 1,745, являлась постоянная подстройка КР. для удержания перерегулирования о в требуемых пределах 0,35-0,55%. Полученные результаты приведены на рис. 15 и рис. 16. Рис. 16 получен путем удаления всех моментов, когда скорости обучения были равны нулю на рис. 15д.

Графики КР. (рис. 15в) и Тмех (рис. 15б), в целом, схожи по характеру своего изменения, что говорит об адекватности адаптации, производимой настройщиком. Перерегулирование на рис. 15г постоянно удерживается в требуемых пределах.

Анализируя рис. 16, возможно сделать вывод о том, что модуль скорости обучения п/2) практически все время несколько ниже, чем модуль п . Отдельно рассмотрим два момента времени на рис. 15, когда Тмех максимально отклонилась от номинального значения - примерно 100 и 300 секунд от начала опыта. Данные моменты времени показаны на рис. 17.

Там же приведены графики для системы с обычным П-регулятором без адаптации. Для системы с П-регулятором перерегулирование составляет: для момента примерно 102 с -0%, для момента примерно 309 с - 1,5%. При этом система с настройщиком удерживает перерегулирование в районе 0,45%. Это позволяет добиться экономии порядка 2% по суммарному управлению за весь опыт относительно системы с обычным П-регулятором.

50 100 150 200 250 300 350 400 время, с

Рис. 15. Результаты эксперимента с дрейфом значения Тм

скорость скорость

такты срабатывания правил

Рис. 16. Графики изменения скоростей обучения нейрона выходного слоя нейронной сети настройщика

Рис. 17. Графики переходных процессов для моментов времени 102 и 309 секунд для систем с настройщиком и без него

7.2.2. НАСТРОЙКА ПИ-РЕГУЛЯТОРА ТОКА ЯКОРЯ

Модель, приведенная на рис. 14, была переделана путем удаления настройщика регулятора скорости и установки настройщика регулятора тока якоря (рис. 18).

Рис. 18. Модель электропривода прокатной клети (НН - нейросетевой настройщик; ТП- тиристорный преобразователь; ОЯ- обмотка якоря; М- механика;

З - задание по скорости)

Все основные параметры имеют те же значения. В данном случае введено обозначение коэффициента связи между током якоря и электромагнитным моментом кФ = 145 Н*м/А. Кроме того, блок механики привода имеет явный вид интегрального звена, так как в данном случае его параметры менять не предполагается. В то же время, блок, описывающий обмотку якоря, представлен в виде ^-функции именно по этой причине. Эта функция описывает апериодическое звено первого порядка с параметрами К ном = 41,7 и Тэ ном = 0,036 с.

Нейросетевой настройщик также реализован в виде S-функции «пеиС_Р1». Он имеет шесть входов (скрыты в блоке «Входы»). Первые пять совпадают со входами нейронной сети, а шестой - это задание для контура скорости (необходим для корректной работы базы правил). Выходы нейросетевого настройщика совпадают с выходами сети.

Структура нейронной сети настройщика определена в соответствии с [8] и имеет следующий вид: 5-14-2. Входные сигналы: задание по току в данный момент и один такт вызова

нейросетевого настройщика назад, значение тока якоря в текущий момент и один такт вызова нейросетевого настройщика назад, выход ПИ-регулятора один такт вызова настройщика назад. Выходные сигналы - КР и К/. В скрытом слое использована сигмоидальная функция активации, в выходном - линейная. База правил для данного случая приведена в [42]. В соответствии с методом, предложенным в [10], А( определено как 5 мс.

Задание по скорости имеет такой же вид, как и для опытов, приведенных в п.7.2.1. Требованиями является наличие перерегулирования по току якоря относительно задания, но не более 3% от модуля амплитуды первого пика задания по току якоря. Кроме того, должно быть не более трех колебаний кривой тока.

Эксперимент заключался в том, что начальные параметры регулятора тока были равны расчетным КР = 0,489 и К] = 13,649, а параметры обмотки якоря динамически изменялись в следующих пределах Кя е [0,8К ном; 1,2К тм] и Тэ е [0,8 Тэ ном; 1,2 Тэ ном], имитируя дрейф параметров ОУ. Задачей настройщика являлось поддержание качества переходных процессов в контуре тока на требуемом уровне, несмотря на подобные колебания параметров. Результаты эксперимента приведены на рис. 19.

В целом, ориентируясь на колебания перерегулирования по скорости о (рис. 19з) вокруг требуемого диапазона 0,35-0,55% и учитывая тот факт, что настройка регулятора скорости не производилась, можно сделать вывод о том, что настройщик поддерживал требуемое качество переходных процессов в контуре тока в течение всего опыта. Также можно заметить, что изменение КР (рис. 19б) в некоторой мере повторяет кривую изменения ТЭ (рис. 19е), а изменение К] (рис. 19в) в некоторой мере повторяет кривую изменения КЯ (рис. 19ж). Для рис. 19г и рис. 19д были вырезаны все моменты времени, когда скорость обучения равна нулю. В результате были получены графики, приведенные на рис. 20.

Рис. 19. Результаты эксперимента с дрейфом Тэ и КЯ

О1-1-1-1-1-1-1-

О 200 400 600 800 1000 1200 1400 такты срабатывания правил

Рис. 20. Графики изменения скоростей обучения нейронов выходного слоя нейронной сети настройщика

Скорости обучения |nk J|, к = 1, 2, ниже, чем расчетные предельные |nk max(2)|, к = 1, 2, для моментов, когда AV < 0, и выше -в противном случае (тогда для обучения, в соответствии с (20), берутся значения цк max(2)).

Применение настройщика позволило добиться экономии порядка 1,5% по суммарному управлению за весь опыт относительно системы с обычным ПИ-регулятором.

7.3. РЕЗУЛЬТАТЫНАТУРНЫХЭКСПЕРИМЕНТОВ

Эксперименты по применению нейросетевого настройщика для системы подчиненного регулирования скорости электродвигателя постоянного тока производились на экспериментальном стенде, состоящем из персонального компьютера (ПК) и учебной лаборатории NI ELVIS II с установленной платой Quanser DCMCT. NI ELVIS II подключается к ПК по USB кабелю.

Плата Quanser DCMCT оснащена электродвигателем постоянного тока с энкодером и маховиком на валу электродвигателя. Управление двигателем реализуется изменением питающего напряжения с применением широтно-импульсной модуляции (ШИМ). Плата Quanser DCMCT реализует измерение тока, передачу сигнала с датчика поворота (энкодера), расчет скорости на основании датчика поворота и усиление аналогового сигнала в 2,4 раза: преобразование диапазона ±10 В ^ ±24 В.

В LabVIEW 2013 была построена система управления, состоящая из регулятора скорости РС и регулятора тока РТ, а также блока компенсации противоЭДС (рис.21).

Рис.21. Фрагмент системы управления с настройщиками

Выходом системы управления является сигнал задания, подаваемый на преобразователь напряжения.

Картина уставок представляет собой следующую последовательность смен заданий по скорости: 0 об/мин ^ 60 об/мин ^ ^ 0 об/мин ^ -60 об/мин. Причем на скорости ±60 об/мин электропривод работает 0,88 с, а на скорости 0 об/мин - 1 с. Смена задания происходит в виде линейно-нарастающего сигнала, причем значение задания по скорости ±60 об/мин достигается за 0,06 с.

Нейросетевой настройщик, реализованный в виде программного кода MATLAB и описанный в п.7, был импортирован в LabVIEW при помощи узла MathScript Node.

Параметры регуляторов тока (KP = 8,33, Kj = 1670) и скорости (KPs = 0,01) рассчитаны в соответствии с настройкой на модульный оптимум. На рис. 22 показана работа системы с данными настройками регуляторов при номинальных параметрах электропривода. Перерегулирование по скорости равно 0, а статическая ошибка - 13%. Она возникает из-за большого статического момента относительно момента вращения двигателя.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

-1—--задание .

-скорость

0 0.8 1.6 2.4 3.2 4 4.8

время, с

Рис.22. Переходные процессы при номинальных параметрах регулятора и привода

В данном случае устранить статическую ошибку, используя регулятор скорости П-типа, невозможно. Таким образом, для проведения экспериментов по применению настройщика на натурном стенде база правил для контура скорости была доработана, используя значение статической ошибки в качестве установившегося режима.

7.3.1. НАСТРОЙКА РЕГУЛЯТОРА КОНТУРА СКОРОСТИ

Для изменения момента инерции электропривода был установлен маховик удвоенной массы. Задачей настройщика регулятора контура скорости был поиск нового значения Кр^, позволяющего поддерживать требуемое качество переходных процессов. Настройка регулятора контура тока не производилась. Результаты эксперимента приведены на рис. 23.

Значение Кр, = 0,019, позволившее вернуть контуру необходимую динамику, было получено по итогам трех предъявлений указанной последовательности заданий по скорости. На рис. 24 приведены фактические и максимально допустимые скорости обучения нейронов сети настройщика, полученные из рис. 23в путем удаления всех моментов, когда = 0.

Скорость обучения все время несколько ниже, чем

расчетная предельная \п тах(2)|.

время, с

Рис. 23. Эксперимент с маховиком удвоенной массы

Рис. 24. Графики изменения скоростей обучения нейронов выходного слоя нейронной сети настройщика

7.3.2. НАСТРОЙКА РЕГУЛЯТОРА КОНТУРА ТОКА ЯКОРЯ

Для изменения сопротивления обмотки якоря ДПТ был дополнительно добавлен резистор сопротивлением 4 Ом (что составляет примерно 20% от номинального сопротивления). Регулятор контура скорости не подвергался настройке (_КР¡, = 0,01). В соответствии с базой правил настройщик изменял значения КР и К/. Это позволило по итогам трех предъявлений последовательности смен задания по скорости добиться требуемого качества переходных процессов в контуре тока (рис. 25) по сравнению с переходными процессами в начале эксперимента.

В данном случае производилась настройка только К/. Это соответствует результатам эксперимента, приведенным на рис. 19. Соответственно, исключив все моменты, когда п2(2) = 0, были получены графики, приведенные на рис. 26. Скорость обучения |п2(2)| все время несколько ниже, чем |п2тах(2)|.

Полученные результаты позволяют утверждать о применимости предложенного подхода для управления классом промышленных объектов, имеющих в своем составе ДПТ.

Рис. 25. Результаты эксперимента с дополнительным сопротивлением в обмотке якоря электродвигателя

такты срабатывания правил

Рис.26. Графики изменения скоростей обучения нейрона выходного слоя нейронной сети настройщика

8. Заключение

В работе предложен подход к вычислению верхней допустимой границы скорости оперативного обучения нейронной сети нейросетевого настройщика параметров линейных регуляторов, основанный на использовании функции Ляпунова и оценке устойчивости системы управления.

Метод реализован средствами Matlab Script Language, интегрирован в нейросетевой настройщик и апробирован на математических и физических моделях нагревательного объекта и электропривода. Полученные результаты позволяют сделать вывод об адекватности предложенного подхода.

В течение всех опытов система управления оставалась устойчивой с точки зрения выбранных критериев.

В целом скорость обучения |nk(2)|, k = 1, 2, рассчитываемая на основе базы правил, в большинстве случаев ниже, чем скорость |nkmax(2)l|, рассчитанная по предложенному критерию. Однако во всех экспериментах эта разница составляет менее одного порядка (в большинстве случаев - в 2-4 раза). В случае если скорость из базы правил выше верхнего допустимого предела, для обучения используется предельное значение Пкmax^2. Причем кривые ЦкТ> и nkmaJ22 имеют одинаковый характер практически для всех опытов. Все это также подтверждает адекватность формул для расчета скорости обучения, используемых в базе правил. Кроме того, за все время проведения экспериментов не произошло срабатываний ветви алгоритма, требующей остановки адаптации, что говорит и об адекватности предложенных правил.

При этом постоянное использование предельных скоростей Пк maJ'T> вместо скоростей из базы правил nk2) может приводить к снижению энергоэффективности работы ОУ.

Предложенный подход применим как для систем подчиненного регулирования, так и для одноконтурных систем. Задание может быть ступенчатым, линейно нарастающим с насыщением или может формироваться внешним контуром по отношению к рассматриваемому.

В целом использование нейросетевого настройщика параметров П-/ПИ-регулятора для учета нелинейных свойств ОУ позволило сократить перерегулирование и время, требуемое на выполнение графика заданий, а также сократить расход электроэнергии для рассматриваемых ОУ. Таким образом, в условиях реального производства на данных агрегатах может быть интенсифицировано производство продукции и сокращено удельное энергопотребление.

В дальнейшем предполагается исследовать возможность использования предложенного подхода для вычисления скоростей обучения нейронной сети настройщика в режиме компенсации возмущений для систем управления нагревательными объектами и электродвигателями.

Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект №15-07-06092).

Литература

1. АЛЕКСАНДРОВ А.Г. Оптимальные и адаптивные системы. - М.: Высшая школа, 1989. - 263 с.

2. АЛЕКСАНДРОВ А.Г., ПАЛЕНОВ М.В. Состояние и перспективы развития адаптивных ПИД-регуляторов в технических системах // Автоматика и телемеханика. - 2014. -№2. - С. 16-30.

3. БАРБАШИН Е.А. Функции Ляпунова. - М.: Наука, 1970. -240 с.

4. ВАСИЛЬЕВ В.И., ИДРИСОВ И.И. Алгоритмы проектирования и анализа устойчивости интеллектуальной системы управления // Вестник Уфимского государственного авиационного технического университета. - 2008. - Т. 11, №1. -С.34-42.

5. ВОРОНОВ А.А. и др. Теория автоматического управления. Часть 1. Теория линейных систем автоматического управления. - М.: Высшая школа, 1986. - 367 с.

6. ВОРОНОВ А.А., КИМ Д.П., ЛОХИН В.М. и др. Теория автоматического управления: Учеб. для вузов по спец. «Автоматика и телемеханика». В 2-х ч. Ч. II. Теория нелинейных и специальных систем автоматического управления. -2-е изд., перераб. и доп. - М.: Высш. шк., 1986. - 504 с.

7. ДРУЖИНИНА О.В., КЛИМАЧКОВА Т.С., МУЛКИ-ДЖАН А.С. Анализ технической устойчивости и стабилизация управляемых динамических систем // Наукоемкие технологии. - 2013. - Т. 14, №6. - С. 59-65.

8. ЕРЕМЕНКО Ю.И., ГЛУЩЕНКО А.И. О разработке метода выбора структуры нейронной сети для решения задачи адаптации параметров линейных регуляторов // Управление большими системами. - 2016. - Вып. 62. - С. 75-123.

9. ЕРЕМЕНКО Ю.И., ПОЛЕЩЕНКО Д А., ГЛУЩЕНКО А.И. О применении нейросетевого оптимизатора параметров ПИ-регулятора для управления нагревательными печами в различных режимах работы // Управление большими системами. - 2015. - Вып. 56. - С. 143-175.

10. ЕРЕМЕНКО Ю.И., ПОЛЕЩЕНКО Д А., ГЛУЩЕНКО А.И. О разработке метода определения значений задержек входных сигналов нейронной сети при реализации нейросе-тевого оптимизатора параметров ПИ-регулятора // Известия ЮФУ. Технические науки. - 2015. - №10. -С. 157-168.

11. КРАСОВСКИИ А.А. Основы автоматики и технической кибернетики. - М.: Госэнергоиздат, 1962. - 600 с.

12. КРАСОВСКИЙ А.А., БУКОВ ВН., ШЕНДРИК В С. Универсальные алгоритмы оптимального управления непрерывными процессами. - М.: Наука, 1977. - 272 с.

13. КРУГЛОВ С.П. Взаимосвязь двух подходов к аналитическому конструированию оптимальных регуляторов // Автоматика и телемеханика. - 2003. - №4. - С. 56-69.

14. КУДИНОВ Ю.И., КЕЛИНА А.Ю. Упрощенный метод определения параметров нечетких ПИД регуляторов // Ме-хатроника, автоматизация, управление. - 2013. - №1. -С.12-22.

15. КУДИНОВ Ю.И., КОЛЕСНИКОВ В.А., ДУРГАРЯН И.С., ПАЩЕНКО А.Ф., БЕЛОВА О Н. Построение и настройка нечеткого адаптивного ПИД-регулятора // Информатика и системы управления. - 2016. - №3(49). - С. 86-96.

16. ЛЕТОВ А.М. Математическая теория процессов управления. - М.: Наука, 1981. - 255 с.

17. ЛОВЧАКОВ В.И., СУХИНИН Б.В., СУРКОВ В В. Оптимальное управление электротехническими объектами. -Тула: Издательство ТулГУ, 2004. - 149 с.

18. МАКАРОВ Г.Н. Техническая устойчивость нейросетевой системы автоматического управления // Нейрокомпьютеры: разработка, применение. - 2012. - №8. - С. 57-62.

19. МАКАРОВ И М., ЛОХИН В.М. Интеллектуальные системы автоматического управления. - М.: ФИЗМАТ ЛИТ, 2001. - 576 с.

20. МАКАРОВ ИМ., ЛОХИН В.М., МАНЬКО СВ., РОМАНОВ М.П., СИТНИКОВ М.С. Устойчивость интеллектуальных систем автоматического управления. Приложение к журналу // Информационные технологии. - 2013. - №2. -32 с.

21. ОМОРОВ Т Т., ДЖОЛДОШЕВ Б.О Краткий обзор методов анализа и синтеза нелинейных САУ // Известия Кыргызского государственного технического университета им. И. Раззакова. - 2012. - №26. - С. 172-183.

22. РОТАЧ В.Я. Теория автоматического управления. 5-е изд., перераб. и доп. - М.: Изд-во МЭИ, 2008. - 396 с.

23. РОТАЧ В.Я. КУЗИЩИН В.Ф. ПЕТРОВ СВ. Настройка регуляторов по переходным характеристикам систем управления без их аппроксимации аналитическими выражениями // Автоматизация в промышленности. - 2009. -№11. - С. 9-12.

24. САЛИХОВ З.Г., АРУНЯНЦ ГГ., РУТКОВСКИЙ АЛ.

Системы оптимального управления сложными технологическими объектами. - М.: Теплоэнергетик, 2004. - 496 с.

25. СТАШИНОВ Ю.П. К вопросу о настройке системы управления электропривода постоянного тока на модульный оптимум. Часть 1 // Электротехника. - 2016. - №1. - С. 2-7.

26. ТЕРЕХОВ В.А., ЕФИМОВ Д.В., ТЮКИН И.Ю. Нейросете-вые системы управления: Учеб. пособие для вузов. - М.: Высш. шк., 2002. - 183 с.

27. ТЮКИН И.Ю., ТЕРЕХОВ В.А. Адаптация в нелинейных динамических системах. - М.: ЛКИ, 2008. - 384 с.

28. ШПИЛЕВАЯ О.Я. Формирование управляющих воздействий в системах прямого адаптивного управления // Автометрия. - 2009. - Т. 45, №5. - С. 90-102.

29. ШУБЛАДЗЕ А.М., КУЗНЕЦОВ СИ. Автоматически настраивающиеся промышленные ПИ и ПИДрегуляторы // Автоматизация в промышленности. - 2007. - №2. -С.15-17.

30. ALAIZ H. et al. Knowledge Based Expert System for PID Controller Tuning under Hazardous Operating Conditions // Advances in Intelligent and Soft Computing. - 2009. - Vol. 63. -P.203-210.

31. ALEXANDROV AG., PALENOV M.V Self-tuning PID-I controller // Proc. of the 18th IFAC World Congress, Milano, Italy, 2011. - P. 3635-3640.

32. ANDERSON K.L., BLANKENSHIP G.I., LEBOW L.G. A rule-based adaptive PID controller // Proc. of the 27th IEEE Conf. Decision, Control (CDC-1988). - 1988. - P. 564-569.

33. ANDRASIK A., MESZAROS A., DE AZEVEDO S.F. On-line tuning of a neural PID controller based on plant hybrid modeling // Computers & Chemical Engineering. - 2004. - Vol. 28, No. 8. - P. 1499-1509.

34. ASTROM K.J., HAGGLUND T. Advanced PID Control. -Research Triangle Park: ISA - The Instrumentation, Systems, and Automation Society, 2006. - 461 p.

35. ASTROM K.J., WITTENMARK B. Adaptive Control. - New York: Dower Publications, 2008. - 573 p.

36. CALVO-ROLLE J.L. et al. A hybrid intelligent system for PID controller using in a steel rolling process // Expert Systems with Applications. - 2013. - Vol. 40, No. 13. - P. 5188-5196.

37. CHANGA W.-D., HWANGB R.-C., HSIEHA J.-G. A self-tuning PID control for a class of nonlinear systems based on the Lyapunov approach // J. of Process Control. - 2002. -Vol. 12. - P. 233-242.

38. CHEN J., HUANG T. Applying neural networks to on-line updated PID controllers for nonlinear process control // J. of Process Control. - 2004. - Vol. 14. - P. 211-230.

39. CHIEN K.L., HRONES I.A., RESWICK J.B. On the automatic control of generalized passive systems // Trans. on ASME. -1952. - Vol. 74. - P. 633-640.

40. CONG S., LIANG Y. PID-like neural network nonlinear adaptive control for uncertain multivariable motion control systems // IEEE Trans. on Industrial Electronics. - 2009. - Vol. 56, No. 10. - P. 3872-3879.

41. EREMENKO Y.I., GLUSHCHENKO A.I., PETROV V.A. DC Electric Drive Adaptive Control System Development Using Neural Tuner // Proc. of the 2017 IEEE Russia Section Young Researchers in Electrical and Electronic Engineering Conference (ElConRus-2017). - P. 1-6.

42. EREMENKO Y.I., GLUSHCHENKO A.I., PETROV V.A. On PI-controller Parameters Adjustment for Rolling Mill Drive Current Loop Using Neural Tuner // Procedia Computer Science. - 2017. - Vol. 103. - P. 355-362.

43. ERENOGLU I., EKSIN I., YESIL E. et al. An intelligent hybrid fuzzy PID controller // European Conference on Modelling and Simulation. - Bonn: European Council for Modelling and Simulation, 2006. - P. 62-67.

44. FANG M., ZHUO Y., LEE Z. The application of the self-tuning neural network PID controller on the ship roll reduction in random waves // Ocean Engineering. - 2010. - No. 37. -P. 529-538.

45. GUZELKAYA M., EKSIN I., YESIL E. Self-tuning of PID-type fuzzy logic controller coefficients via relative rate observer // Engineering Applications of Artificial Intelligence. - 2003. -Vol. 16(3). - P. 227-236.

46. HAN C. A Type of Directly Self-adaptive PID Controller Based on Neural Network // Proc. of 4th National Conference on Electrical, Electronics and Computer Engineering (NCEECE-2015). - Amsterdam: Atlantis Press, 2016. - P. 1512-1515.

47. HUANG G.-B., WANG D.H., LAN Y. Extreme learning machines: a survey // Int. J. of Machine Learning and Cybernetics. - 2011. - Vol. 2, No. 2. - P. 107-122.

48. KANG J. et al. An adaptive PID neural network for complex nonlinear system control // Neurocomputing. - 2014. -Vol. 135. - P. 79-85.

49. KUHN U. A practice oriented setting rule for pid-controllers: The t-sum-rule // Automatisierungstechnische Praxis. - 1995. -Vol. 37, No. 5. - P. 10-16.

50. LEVA A., COX C., RUANO A.E. Hands-on PID autotuning: a guide to better utilisation // IFAC Professional Brief. - Laxen-burg: IFAC, 2002. - 84 p.

51. LI Y., ANG K., CHONG C. Patents, software, and hardware for PID control - an overview and analysis of the current art // IEEE Control Systems Magazine. - 2006. - No. 26(1). -P. 42-54.

52. LYAPUNOV A.M. The general problem of stability of motion // Int. J. of Control. - 1992. - Vol. 55. - P. 531-534.

53. MIMURA K., SHIOTSUKI T. Experimental study of PID autotuning for unsymmetrical processes // Proc. of IEEE ICCAS-SICE-2009. - 2009. - P. 2967-2971.

54. NESLER C.G. Experiences in applying adaptive control to thermal processes in buildings // Proc. Amer. Control Conf., Boston, MA, 1985. - P. 1535-1540.

55. OMATU S., KHALID M., YUSOF R. Neuro-Control and its Applications. - London: Springer, 1995. - 255 p.

56. PFEIFFER B.-M. Towards «plug and control»: self-tuning temperature controller for PLC // Int. J. of Adaptive Control and Signal Processing. - 2000. - No. 14. - P. 519-532.

57. REYES J., ASTORGA C., ADAM M. et al. Bounded neuro-control position regulation for a geared DC motor // Engineering Applications of Artificial Intelligence. - 2010. - No. 23. -P. 1398-1407.

58. SCHAEDEL H.M. A new method of direct PID controller design based on the principle of cascaded damping ratios // IEEE European Control Conference (ECC-1997). - 1997. -P. 1265-1271.

59. SONG Y., GUO J., HUANG X. Smooth Neuroadaptive PI Tracking Control of Nonlinear Systems with Unknown and Non-smooth Actuation Characteristics // IEEE Trans. on Neural Networks and Learning Systems. - 2016. - Vol. 99. - P. 1-13.

60. TAN S.-H., HANG C.-C., CHAI J.-S. Gain scheduling: from conventional to neuro-fuzzy // Automatica. - 1997. - Vol. 33, No. 3. - P. 411-419.

61. VISIOLI A. Improving the load disturbance rejection performances of IMC-tuned PID controllers // IFAC Proc. Volumes (15th IFAC World Congress). - 2002. - Vol. 35, No. 1. -P. 295-300.

62. ZHANG D., WEI B. Convergence performance comparisons of PID, MRAC, and PID+ MRAC hybrid controller // Frontiers of Mechanical Engineering. - 2016. - Vol. 11, No. 2. -P. 213-217.

63. ZHANG J. et al. PID neural network control of hydraulic roll gap control system // IEEE Int. Conference on Measurement, Information and Control (MIC-2012). - 2012. - Vol. 2. -P.791-795.

64. ZHAO Z.Y., TOMIZUKA M., ISAKA S. Fuzzy gain scheduling of PID controllers // IEEE Trans. on Systems. Man. and Cybernetics. - 1993. - Vol. 23, No. 5. - P. 1392-1398.

65. ZIEGLER J., NICHOLS N. Optimum settings for automatic controllers // Trans. ASME. - 1942. - No. 65. - P. 759-768.

ON DEVELOPMENT OF NEURAL NETWORK LEARNING RATE CALCULATION METHOD TO ADJUST LINEAR CONTROLLERS ONLINE SOLVING NONLINEAR PLANT CONTROL PROBLEM

Anton Glushchenko, Stary Oskol technological institute n.a. A.A. Ugarov (branch) NUST "MISIS", Stary Oskol, Cand.Sc., assistant professor (Stary Oskol, Makarenko microdistrict, 42, (4725) 45-12-17, strondutt@mail.ru).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Abstract: The problem of a neural network learning rate calculation for online training process is considered. The network is a part of a neural tuner used to adjust linear P-/PI-controllers parameters in real time. Its outputs are the controller parameters values. The problem under consideration is closely related to a control system sustainability estimation, as too high learning rates might make the system unstable. So we propose an approach based on the second Lyapunov's method to calculate learning rate upper acceptance limit for different situations without knowing the plant model. Modeling and laboratory experiments have been conducted using typical plants of heating furnaces and DC drives classes to prove the method reliability. Having analyzed obtained results, the conclusion can be made that for both plant classes learning rate estimations allow to keep the control system stable. At the same time, constant usage of maximum allowed value of the learning rate during the online training process may result in the plant energy efficiency decrease.

Keywords: adaptive control, PI-controller, neural network learning rate, Lyapunov's second method, sustainability.

Статья представлена к публикации членом редакционной коллегии М.В. Губко.

Поступила в редакцию 25.04.2017.

Опубликована 31.03.2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.