Научная статья на тему 'Применение алгоритма тренировки нейронной сети прямого распространения для оптимизации настроек дискретного регулятора'

Применение алгоритма тренировки нейронной сети прямого распространения для оптимизации настроек дискретного регулятора Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
860
136
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Конох Игорь Сергеевич

Излагается подход к созданию регулятора, работающего с дискретными отчетами сигнала рассогласования, как искусственной нейронной сети прямого распространения. Оптимизация настроек производится при помощи специального алгоритма, базирующегося на анализе функционала качества, вычисляемого на протяжении переходного процесса. Разработанное программное обеспечение позволяет оптимизировать регуляторы такого типа, визуализировать и анализировать качество процессов управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Конох Игорь Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of the algorithm feedforward neural network training to optimize the setup of digital controller

The paper describes an approach to the creation of a discrete controller as artificial feedforward neural network, which consisting of three single neurons with linear activation function. Control setting is in accordance with the training of the neural network algorithm, based on the analysis of the quality criterion. Development can be adapted to the control of the power converter, the engine. Software developed on environment LabView 8.X. It visualizes the control process, analyzing the control quality and is used in the learning process.

Текст научной работы на тему «Применение алгоритма тренировки нейронной сети прямого распространения для оптимизации настроек дискретного регулятора»

КОМПЬЮТЕРНЫЕ НАУКИ А

УДК621.313:004.89

тоспособности даже при наличии исходных неопределенностей;

- высокая степень параллельности в нейронных сетях позволяет осуществлять быстрые методы обработки (особенно при использовании специализированных аппаратных средств), причем повреждения отдельных звеньев не критичны для работы нейроконтроллеров в целом.

ПРИМЕНЕНИЕ АЛГОРИТМА ТРЕНИРОВКИ НЕЙРОННОЙ СЕТИ ПРЯМОГО РАСПРОСТРАНЕНИЯ ДЛЯ ОПТИМИЗАЦИИ НАСТРОЕК ДИСКРЕТНОГО РЕГУЛЯТОРА

КОНОХ И.С.________________________________

Излагается подход к созданию регулятора, работающего с дискретными отчетами сигнала рассогласования, как искусственной нейронной сети прямого распространения. Оптимизация настроек производится при помощи специального алгоритма, базирующегося на анализе функционала качества, вычисляемого на протяжении переходного процесса. Разработанное программное обеспечение позволяет оптимизировать регуляторы такого типа, визуализировать и анализировать качество процессов управления.

1. Введение

Нейросетевой подход к формированию алгоритмов автоматического регулирования относится к классу интеллектуальных технологий управления и позволяет реализов ать любой необходимый нелинейный алгоритм управления, если существует возможность создания базы экспериментальных и контрольных данных путем многократного проведения модельных или натурных экспериментов.

Существует несколько причин, которые обуславливают перспективы применения нейронных сетей для задач управления:

- корректный выбор нейронной модели и достаточный объем обучающей выборки избавляет от необходимости использовать аппарат математического анализа как в классических методах адаптивного и оптимального управления;

- нелинейные функции активации позволяют реализовать нелинейные зависимости входных и выходных сигналов, что очень важно для решения задач управления с существенно нелинейными процессами, для которых традиционные методы не обеспечивают лучших решений во всех режимах работы;

- для применения традиционных методов оптимизации управляющих алгоритмов необходим большой объем информации об объекте управления в аналитической форме;

- способность искусственных нейронных сетей к самообучению, что обеспечивает повышение рабо-

Известен ряд подходов к способам построения и обучения систем управления на основе искусственных нейронных сетей, обобщающие варианты их построения. Это обучающаяся адаптивная система, включающая в свою структуру один ассоциативный поисковый и один адаптивный критический элемент, построенные как нейронные сети прямого распространения, исследованные А. Г. Барто (A. G. Barto) [1].

Схема нейронного управления на основе инверснопрямой модели: сначала нейронная сеть обучается на основании инверсной модели объекта управления, а затем может быть донастроена на непосредственное управление этим объектом.

В исследованиях Д. Псалтиса (D. Psaltis) приведены архитектуры обобщенного и специализированного обучения [1]. В архитектуре обобщенного обучения (рис. 1) сеть обучается автономно, с использованием образцов, полученных по характеристикам разомкнутого или замкнутого объекта управления. Обученная таким образом сеть настраивается на работу как контроллер объекта управления, подобно обычной системе, использующей обратную связь и реагирующей на отклонение [1].

Рис. 1. Архитектура обобщенного обучения

Архитектура специализированного обучения (рис. 2) используется для «управляемого целью» обучения сети; при этом ошибка выполнения распространяется по сети в обратном направлении при каждой выборке.

Рис. 2. Архитектура специализированного обучения

30

РИ, 2014, № 2

Однако при этом нужно знать все частные производные объекта управления в текущей точке, представленные определителем Якоби. Вместо элементов якобиана могут использоваться знаки этих элементов, которые представляют собой направления влияния параметров управления на выходы объекта управления.

Архитектура использует вариант алгоритма обратного распространения, называемый «обратное распространение во времени». Для управления объектом применяются две нейронные сети: в качестве эмулятора и контроллера. Сеть-эмулятор может быть обучена отдельно динамике объекта управления. Данная архитектура обеспечивает более точное непосредственное обучение нейроконтроллера, поскольку ошибка может распространяться в обратном направлении через эмулятор в каждой выборке (рис. 3).

Рис. 3. Архитектура, использующая алгоритм обратного распространения

у

Для построения эффективных систем регулирования целесообразно исследовать минимальную конфигурацию нейроконтроллера, без внутренних обратных связей, с нейронами, имеющими единичную с ограничениями передаточную функцию. В качестве входных сигналов будут подаваться временные отсчеты сигнала рассогласования. Выходной нейрон осуществляет финальную обработку и формирует сигнал управления на силовой преобразователь. Обучение сети для управления объектами, описанные передаточными функциями первого и второго порядков, целесообразно выполнять по архитектуре специализированного обучения, анализируя цель управления.

2. Структура и обучение нейронного регулятора

В качестве тестовой системы был использован лабораторный стенд [2] с механически связанными приводами систем преобразователь частоты-асинхронный двигатель и широтно-импульсный преобразователь-двигатель постоянного тока независимого возбуждения. Асинхронный двигатель 4АМ56В4У3 мощностью 0,18 кВт имеет скорость вращения 1370 об/мин. Максимальный/минимальный ток -1,15/0,67 А. Система управляемого привода постоянного тока выступает в качестве формирователя механической нагрузки для асинхронного двигателя и может обеспечить, в том числе, вентиляторную, насосную и экскаваторную характеристики.

РИ, 2014, № 2

На этапе проведения модельных экспериментов (рис. 4) переходная характеристика системы асинхронных двигателя и частотного преобразователя, в котором ограничена интенсивность разгона, аппроксимирована апериодическим звеном первого порядка:

W =

1

TS+I.

Для определения минимально допустимого количества нейронов была составлена линеаризованная модель. В общем виде для систем замкнутого управления управляющее воздействие должно формироваться на основе информации о рассогласовании, производной рассогласования, интеграла рассогласования. Таким требованиям отвечает дискретная структура второго порядка, выход которой интегрируется. Два звена временной задержки (0,0218 и 0,011с) обеспечивают нейронную сеть информации об изменении рассогласования во времени, фактически позволяя учитывать значение производных. Структура и способ включения нейронной сети приведены на рис.5. Структура нейронов N2 и N3 идентична N1.

Рис. 4. Переходные характеристики системы силовой преобразователь - электрический

Для оптимизации был разработан алгоритм настройки нейронного регулятора:

1. Установка значений весовых коэффициентов а1-а5 в 1, а6 в 0.

2. Настройка коэффициентов а1-а3 (основная настройка).

2.1. Произвольно определить направление приращения весовых коэффициентов (лучше выбирать два положительных и один отрицательный).

2.2. Изменить значения весовых коэффициентов приращением на 1-5 единиц.

2.3. При расхождении процесса или слишком большом увеличении значения критерия перейти к п. 2.1.; если различия отсутствует, перейти к следующему пункту.

2.4. Поочередно инкрементировать веса по 0-3 единицы в заданных направлениях.

31

2.5. При улучшении переходной характеристики продолжить изменять веса до достижения удовлетворительного переходной характеристики с минимальным значением интегрального критерия.

3. Настройка коэффициентов а4-а6.

3.1. Определить направление изменения весовых коэффициентов (как правило, направление а1 совпадает с а4, а2 с а5, а3 с а6).

3.2. Выполнить пункты 2.1-2.5 для коэффициентов а4-а6.

4. Корректировка системы путем увеличения каждого весового коэффициента в диапазоне [3; -3].

5. При уменьшении интегрального критерия - перейти к п. 4.

6. Если очередная эпоха закончилась - запомнить значения критерия.

7. Если приращение критерия от предыдущей эпохи больше порогового значения, то перейти к п.2, иначе - конец.

3. Программная реализация

Программное обеспечение было разработано в среде LabView 8.5 на языке блок-диаграмм G. Кроме функций графического интерфейса пользователя программа реализует функции вычисления выхода нейрорегулятора, эмулирование объекта управления и анализа качества переходных процессов (рис. 6).

Можно выбрать тип задающего воздействия: единичный импульс, единичный импульс с циклическим

повторением, двухуровневый сигнал с циклическим повторением. Оценивания качества регулятора выполняется по трем интегральным критериям: максимальная точность, максимальная точность с ограничением по скорости изменения управляемой величины, максимальное быстродействие. Переключаться между типом интегральных критериев на осциллографе можно в любое время. На числовом индикаторе верхний ряд указывает на текущий интегральный критерий, нижний - на разницу между текущим и предыдущим значением критериев. Зеленый цвет индикаторов - критерий не изменился или улучшился, красный -процесс регулирования ухудшился (см.рис. 6) [3,4].

Рис. 5. Структурная схема включения нейронного регулятора: х - входной сигнал, у - выходной сигнал, WQY - передаточная функция объекта управления, е -ошибка регулирования, u - сигнал управления; N1, N2 - нейроны входного слоя, N3 - выходной слой; а1, а2 -весовые коэффициенты нейронов

Наиболее характерные блоки, в том числе, что показаны на рис. 7-8, разрабатывались самостоятельно.

' Интегральные критерии качества Рис. 6. Интерфейс программы при одиночном задающем сигнале

32

РИ, 2014, № 2

Первый и второй нейроны принимают на одном из входов задержанный сигнал. Блок нейрона с задержкой включает в себя входы для задания весовых коэффициентов, подачу сигнала и задержку на время, а также функцию активации.

Рис. 7. Нейрон со звеном чистого запаздывания

Блок вычисления разницы между текущим и предыдущим интегральным критерием (рис. 8) вычисляет разницу интегральных критериев для предварительного и текущего запусков, выводит ее на индикатор, а также показывает направление изменения с помощью светового индикатора. Блок состоит из элементов интегрирования квадрата рассогласования и производной рассогласования. Блоки сравнения нужны для сброса интегратора при изменении задающего воздействия.

Рис. 8. Блок вычисления интегрального критерия максимальной точности с ограничением по скорости изменения управляемой величины

4. Исследование качества работы нейронного регулятора

По данным алгоритма поэтапно была проведена настройка весовых коэффициентов сети. Каждый из этапов приведен в табл. 1.

Оптимальные настройки были достигнуты на шестом и седьмом этапах. При этом шестой показывал меньший уровень перерегулирования и ошибки, а седьмой - меньше времени доходил до установленного режима.

Оптимизированные весовые коэффициенты нейрорегулятора на шестом и седьмом этапах показаны в табл. 2.

Были проведены исследования при изменении параметров объекта управления. Система выдерживает

изменение характеристик объекта управления без потери устойчивости и с приемлемыми показателями регулирования.

Для проверки качества работы регулятора были проведены натурные эксперименты, в которых реальный объект управления совместно с нагрузкой имел колебательный характер:

Таблица 1

Изменение интегральных критериев в процессе настройки регулятора

№ этапа Интегральный критерий

максимальной точности максимальной точности с ограничением по скорости изменения управляемой величины

і 0,0036010 0,1842

2 0,0018160 0,1962

3 0,0010460 0,2320

4 0,0007771 0,2207

5 0,0007588 0,2255

6 0,0007870 0,1923

7 0,0006266 0,2183

Таблица 2

Оптимизированные настройки нейрорегулятора

Весовой коэффициент Критерий макс. точности Критерий макс. точности с ограничением по скорости

а1 9 14

а2 -6 -9

а3 10 17

а4 8 9

а5 -10 -11

а6 11 10

Используя описанный выше алгоритм, были определены следующие коэффициенты регулятора для колебательного объекта управления (табл. 3).

Таблица 3

Весовые коэффициенты искусственной нейронной сети для реального объекта управления

а1 а2 а3 а4 а5 а6

6,625 -6,16 10 4,45 -4,985 5

В результате эксперимента (сглаженный переходный процесс показан на рис. 9) было определено, что при кардинальном изменении характера объекта управления, используя изложенный выше алгоритм, можно

РИ, 2014, № 2

33

настроить нейрорегулятор с упрощенной структурой на достаточное качество переходного процесса.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 9. Оптимизация переходных характеристик для объекта с колебательными свойствами

По результатам исследований можно вывести следующие зависимости для звеньев временной задержки:

^ , T ^ , Delay]

Delay] = —, Delay-, =---L.

16 1.98

ВЫВОДЫ. Рассмотрены вопросы синтеза однокон -турного регулятора с применением принципов тренировки искусственных нейронных сетей. Разработано программное обеспечение в среде LabView

8.Х для исследования качества управления. Достигнутые результаты можно использовать для настройки регуляторов дискретного и непрерывного действия в случаях управления электромеханическими объектами, которые аппроксимируются апериодическими звеньями или звеньями второго порядка с незначительной колебательностью. По сравнению с дискретными регуляторами разработанная система имеет минимальный порядок.

Программное обеспечение позволяет наглядно продемонстрировать процессы тренировки искусственной нейронной сети и работу регулятора угловой скорости, что повышает эффективность обучения теории автоматического управления и уменьшает трудоемкость настройки реальных систем.

Достигнуты лучшие показатели качества:

- при настройке нейрорегулятора по интегральному критерию I1 = 0,0006266;

- при настройке нейрорегулятора по интегральному критерию I2 = 0,2183;

- время регулирования не превышает - 0,6 с;

- перерегулирование не превышает - 20%;

- при изменении параметров объекта управления на 25-30% интегральный критерий по точности ухудшается на 16-47%.

В некоторых случаях критерий по точности может улучшаться, но тогда интегральный критерий по точности с ограничением по скорости будет ухудшаться до 50%.

Доказано, что изменение характера объекта управления с апериодического на колебательный при изменении значений весовых коэффициентов, согласно предлагаемому алгоритму, позволяет оставить замкнутую систему устойчивой без изменения структуры регулятора. Улучшение динамических показателей качества регулирования для объектов второго порядка и выше требует добавления к существующей структуре новых нейронов и поиска оптимальных временных задержек для формирования входных сигналов.

Программные модули можно использовать для управления электроприводом с системами преобразователь частоты-асинхронный двигатель и широтно-импульсный преобразователь-двигатель постоянного тока.

Литература: 1. Omatu S., Khalid M., Yusof R. NeuroControl and its application. Corrected edition, Springer: 1996. 255 с. 2. Конох І.С, Найда В.В., Гула І.С. Комп’ютеризований лабораторний комплекс для дослідження інтелектуальних цифрових систем керування електроприводом // Вісник Кременчуцького державного політехнічного університету ім. М. Остроградського. Вип. 4/2008 (51), ч. 1. 2008. С. 17 - 21. 3. Тревис Дж. LabVіEW для всех: Пер. с англ. Клушин Н. А. М.: ДМК Пресс; Прибор Комплект. 2005. 544 с. 4. Виноградова Н.А., Листратов Я.И., Свиридов Э.В. Разработка прикладного программного обеспечения в среде LabVіEW: Учебное пособие. М.: Издательство МЭИ. 2005. 245 с.

Поступила в редколлегию 26.04.2014

Рецензент: д-р техн. наук, проф. Оксанич А.П.

Конох Игорь Сергеевич, канд. техн. наук, доцент кафедры информационно-управляющих систем КрНУ им. М. Остроградского. Научные интересы: автоматизация, интеллектуальные системы управления. Адрес: Украина, 39600, Кременчуг, ул. Первомайская, 20, тел.: (05366) 30157. E-mail: kis_saue@mail.ru.

34

РИ, 2014, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.