Научная статья на тему 'СИНТЕЗ НЕЙРОСЕТЕВОГО РЕГУЛЯТОРА УПРАВЛЕНИЯ НЕЛИНЕЙНОЙ МОДЕЛЬЮ ПЕРЕВЕРНУТОГО МАЯТНИКА НА ТЕЛЕЖКЕ'

СИНТЕЗ НЕЙРОСЕТЕВОГО РЕГУЛЯТОРА УПРАВЛЕНИЯ НЕЛИНЕЙНОЙ МОДЕЛЬЮ ПЕРЕВЕРНУТОГО МАЯТНИКА НА ТЕЛЕЖКЕ Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
166
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОСЕТЕВОЙ РЕГУЛЯТОР / УПРАВЛЕНИЕ НЕЛИНЕЙНЫМ ОБЪЕКТОМ / СИСТЕМА УПРАВЛЕНИЯ / МНОГОКАНАЛЬНАЯ СИСТЕМА / АРХИТЕКТУРА НЕЙРОННОЙ СЕТИ / ПЕРЕВЕРНУТЫЙ МАЯТНИК / ВЫБОР НАЧАЛЬНЫХ ВЕСОВЫХ КОЭФФИЦИЕНТОВ / ВЫБОР СТРУКТУРЫ НЕЙРОННОЙ СЕТИ

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Воевода Александр Александрович, Шипагин Виктор Игоревич

В рамках настоящей статьи рассматривается алгоритм выбора структуры нейронной сети, используемой для регулирования объекта «перевернутый маятник на тележке» с учетом его дополнительных особенностей математического описания, а именно нелинейных параметров. Работа алгоритма иллюстрируется на примере синтеза системы автоматического управления, включающей два нейрорегулятора. Один из них отвечает за вывод тележки в заданное положение, а второй - за удержание перевернутого маятника в вертикальном положении. Преобразования структуры будем осуществлять для регулятора, отвечающего за вывод тележки в заданное положение. За основу берется архитектура нейросетевого регулятора, полученного из дискретного регулятора, синтезированного с использованием полиномиального матричного разложения. Для исходного регулятора определим границы его возможного управления нелинейной системой. С целью увеличения диапазона управления нелинейным объектом выполним преобразования структуры нейросети исходного регулятора. Проведем некоторые усложнения структуры нейронной сети регулятора, а именно: увеличим количество нейронов и заменим некоторые функции активации на нелинейные (гиперболический тангенс). Далее предлагается один из способов выбора начальных значений весовых коэффициентов. Затем обучаем нейросеть и проверяем работоспособность полученного регулятора на нелинейном объекте. На следующем этапе сравниваются показатели качества регулирования (быстродействие, астатизм, перерегулирование) полученного регулятора с усложненной структурой нейросети и исходного регулятора. Таким образом, целью настоящего исследования является формализация процедуры синтеза нейросетевого регулятора для управления нелинейным объектом по рассчитанному с использованием полиноминального матричного разложения регулятору для линеаризованной модели объекта. Представляемый способ генерации архитектуры нейронной сети управляющих регуляторов дает возможность увеличить диапазон регулирования нелинейным объектом по сравнению с регулятором, полученным методом полиномиального матричного разложения для линейного объекта. Предлагаемая структура нейронной сети не избыточна и поэтому не требует дополнительных вычислительных ресурсов для ее настройки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Воевода Александр Александрович, Шипагин Виктор Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SYNTHESIS OF A NEURAL NETWORK CONTROL REGULATOR OF A NONLINEAR MODEL OF AN INVERTED PENDULUM ON A CART

In this article, we consider a method for selecting a structure of a neural network used to regulate an "inverted pendulum on a cart" object taking into account its additional features of a mathematical description, namely, nonlinear parameters. The algorithm is illustrated by the example of control synthesis which includes two neuroregulators. One of them is responsible for bringing the cart to the specified position, and the second is responsible for holding the pendulum in a vertical position. The structure transformations will be performed for the controller responsible for bringing the cart to the specified position. The architecture of a neural network controller is based on a discrete controller synthesized using polynomial matrix decomposition. For the original controller, we define the limits of its possible control of a nonlinear system. To increase the range of control of a nonlinear object, we perform transformations of the neural network structure of the original controller. We will make some complications in the structure of the neural network of the regulator, namely, increase the number of neurons and replace some activation functions with nonlinear ones (hyperbolic tangent). Next, we suggest one of the ways to select initial values of weight coefficients. Then we train the neural network and check the performance of the resulting controller on a nonlinear object. At the next stage, we compare the obtained performance of a controller having a complicated neural network structure with the performance of a classical controller. Thus, the purpose of this study is to formalize the synthesis procedure for a neural network controller for controlling a nonlinear object using a calculated classical controller for a linearized object model. The proposed method of generating the architecture of a neural network of controllers makes it possible to increase the range of control by a nonlinear object in comparison with the controller obtained by the method of polynomial matrix decomposition for a linear object. Compared to the typical ones, the proposed neural network structure is not redundant and therefore does not require additional computing resources to configure it.

Текст научной работы на тему «СИНТЕЗ НЕЙРОСЕТЕВОГО РЕГУЛЯТОРА УПРАВЛЕНИЯ НЕЛИНЕЙНОЙ МОДЕЛЬЮ ПЕРЕВЕРНУТОГО МАЯТНИКА НА ТЕЛЕЖКЕ»

ISSN 1814-1196 Научный вестник НГТУ том 79, № 2-3, 2020, с. 25-36

http://journals.nstu.ru/vestnik Science Bulletin of the NSTU Vol. 79, No. 2-3, 2020, pp. 25-36

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

INFORMATICS, COMPPUTER ENGINEERING AND CONTROL

УДК 681.513 Б01: 10.17212/1814-1196-2020-2-3-25-36

Синтез нейросетевого регулятора управления

нелинейной моделью перевернутого маятника

*

на тележке

А.А. ВОЕВОДА", В.И. ШИПАГИН4

630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет

а [email protected] ь [email protected]

В рамках настоящей статьи рассматривается алгоритм выбора структуры нейронной сети, используемой для регулирования объекта «перевернутый маятник на тележке» с учетом его дополнительных особенностей математического описания, а именно нелинейных параметров.

Работа алгоритма иллюстрируется на примере синтеза системы автоматического управления, включающей два нейрорегулятора. Один из них отвечает за вывод тележки в заданное положение, а второй - за удержание перевернутого маятника в вертикальном положении. Преобразования структуры будем осуществлять для регулятора, отвечающего за вывод тележки в заданное положение.

За основу берется архитектура нейросетевого регулятора, полученного из дискретного регулятора, синтезированного с использованием полиномиального матричного разложения. Для исходного регулятора определим границы его возможного управления нелинейной системой. С целью увеличения диапазона управления нелинейным объектом выполним преобразования структуры нейросети исходного регулятора. Проведем некоторые усложнения структуры нейронной сети регулятора, а именно: увеличим количество нейронов и заменим некоторые функции активации на нелинейные (гиперболический тангенс). Далее предлагается один из способов выбора начальных значений весовых коэффициентов. Затем обучаем нейросеть и проверяем работоспособность полученного регулятора на нелинейном объекте. На следующем этапе сравниваются показатели качества регулирования (быстродействие, астатизм, перерегулирование) полученного регулятора с усложненной структурой нейросети и исходного регулятора.

Таким образом, целью настоящего исследования является формализация процедуры синтеза нейросетевого регулятора для управления нелинейным объектом по рассчитанному с использованием полиноминального матричного разложения регулятору для линеаризованной модели объекта.

Представляемый способ генерации архитектуры нейронной сети управляющих регуляторов дает возможность увеличить диапазон регулирования нелинейным объектом по сравнению с регулятором, полученным методом полиномиального матричного разложения для линейного объекта. Предлагаемая структура нейронной сети не избыточна и поэтому не требует дополнительных вычислительных ресурсов для ее настройки.

Статья получена 16 января 2020 г.

Ключевые слова: нейросетевой регулятор, управление нелинейным объектом, система управления, многоканальная система, архитектура нейронной сети, перевернутый маятник, выбор начальных весовых коэффициентов, выбор структуры нейронной сети

ВВЕДЕНИЕ

Многослойные нейронные сети широко используются для решения задач обработки сигналов в режиме реального времени, управления динамическими и статическими системами и прогнозирования временных рядов [1-3].

Особую ценность нейросетевые регуляторы представляют для регулирования нелинейными объектами. Применение классических регуляторов в этом случае затруднительно в связи со сложностью расчета их параметров [4-6]. А линеаризация объекта, упрощающая вычисление параметров для классических регуляторов, может не всегда отражать существенные для исследования свойства объекта.

Однако при синтезе регуляторов с использованием нейросетевого подхода возникает вопрос выбора структуры нейронной сети. Обычно он решается подбором из стандартного набора архитектур. В связи с этим одним из вопросов, связанных с применением этого подхода, является определение достаточной сложности структуры используемой нейронной сети [7-10]. Избыточные нейронные связи неоптимальной структуры приводят к увеличению количества настраиваемых коэффициентов, а значит, к увеличению времени настройки и требований к вычислительным мощностям аппаратной части, а в некоторых случаях и к невозможности нахождения оптимального решения [11, 12], и напротив: недостаточная сложность не позволяет обеспечить требуемые показатели качества регулирования системы.

Таким образом, актуальность исследования продиктована отсутствием формализованного подхода к выбору структуры при проектировании нейросетевых регуляторов.

В рамках настоящей работы исследуются возможности регулирования с помощью нейросетевого подхода для нелинейной модели «перевернутый маятник на тележке». Целью является формализация процедуры синтеза нейросетевого регулятора для нелинейного объекта. Процесс синтеза регулятора состоит из выбора структуры нейросетевого регулятора, предназначенного для регулирования нелинейной модели, на основе архитектуры нейросе-тевого регулятора, предназначенного для регулирования линейного объекта; выбора начальных значений весовых коэффициентов полученной нейросети на основе коэффициентов усиления дискретного регулятора.

В первом разделе излагается постановка решаемой задачи и описывается система управления линеаризованной моделью объекта. Определяются проблемные вопросы, связанные с регулированием нелинейного объекта. Во втором разделе исследования рассматривается способ увеличения диапазона регулирования нелинейного объекта, а именно: производится небольшое усложнение структуры нейросетевого регулятора, описывается процесс задания и настройки весовых коэффициентов.

1. МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ

1.1. ПОСТАНОВКА ЗАДАЧИ

Из статьи [13] возьмем нелинейную модель перевернутого маятника, которая описывается уравнениями:

1 ml 2 V. ml . ml . ■2 1 1--cos 0 1 s н--gsinecose--sine-e =-u ; (1)

MtL ) MtL Mt Mt

/ ml о V- g ml ■ о 1 1--cos2 e I e-^ sin e+—sin ecos e-e2 =--cos e-u, (2)

MtL ) L MtL MtL

2

где Mt = M + m , M - масса тележки, m - масса маятника; L = (I + ml ) / ml, I - момент инерции маятника относительно центра тяжести, l - длина стержня маятника; s - координата центра тяжести тележки (по горизонтальной оси; e - угол отклонения перевернутого маятника от вертикали; u -управляющее воздействие.

Для удобства моделирования уравнения (1) и (2) преобразуем к виду:

• 2

а 1 . _ _ aml sin e-e

s =-u -bsinecose+--; (3)

Mt Mt

2

■a . n ь sin e cos e-e acos e-u

e = sin e----——, (4)

g MtL

где а 1 = 1 - т1 оо82 9 / М{Ь , Ь = ат1% /М{Ь , с = а% / Ь . В дальнейшем будем считать параметры объекта для случая, когда I = 0, т = 70 кг, М = 30 кг, I = 1 м, % = 10 м/с2.

Структурная схема, составленная по формулам (3) и (4), выглядит следующим образом (рис. 1).

Начальные условия для системы «перевернутый маятник на тележке»: положение центра тяжести тележки = 0, угол отклонения перевернутого маятника от вертикали 90 = 0°. Потребуем от системы управления данным объектом вывод тележки в положение 5 = ^ (задается пользователем), при этом обеспечивая 9 - угол отклонения перевернутого маятника в заданных пределах. Управление осуществляется по одному каналу. В рамках данной задачи считаем, что если угол отклонения от вертикали 9 £ [-60°: 60°], то задача считается «нерешенной».

Рис. 1. Нелинейная модель перевернутого маятника Fig. 1. A nonlinear inverted pendulum model

В следующем разделе сравниваются показатели качества регулирования линеаризованной модели объекта [14] и нелинейной модели объекта (3,4) с помощью двух нейросетевых регуляторов, отвечающих за регулирование системы по углу перевернутого маятника и вывод тележки в заданное положение.

1.2. ПОСТРОЕНИЕ СИСТЕМЫ УПРАВЛЕНИЯ

Для регулирования системы используются два нейросетевых регулятора (рис. 2). Регулятор Neuroreg1 используется для вывода тележки в заданное положение 5 = 5^. Регулятор Neuroreg2 необходим для стабилизации угла перевернутого маятника в вертикальном положении 9 = 0°.

Рис. 2. Система «регулятор-модель» Fig. 2. The regulator-model system

Нейрорегуляторы были рассчитаны по ПИД-регуляторам, используемым для работы с линеаризованной системой «перевернутый маятник на тележке», представленной в статье [14]. Показатели качества регулирования нейро-регуляторами идентичны ПИД-регуляторами. Метод синтеза нейрорегулято-

ра представлен в статье [15]. Архитектура нейронных сетей Neuroreg1 и Ыеи-roreg2 одинаковая и представлена на рис. 3.

Fig. 3. Architecture of neural network regulators

Структура нейросети для регуляторов представлена двумя слоями. В первом слое два нейрона и один - во втором. В качестве функций активации используются линейные (y = x). На рис. 3 обозначение 9(t)/ s(t) значит, что по первому каналу регулятор Neuroregl будет использовать данные о положении тележки s (t), а регулятор Neuroreg2 будет использовать информацию об угле отклонения перевернутого маятника от вертикали 9(t). Кроме этого, для обоих регуляторов по второму каналу присутствует обратная связь (т. е. данные о выходе регулятора также подаются на его вход). Во втором слое

сети используется задержка на один временной интервал z-1, равный 1 мс,

-2

и z - задержка на два временных интервала.

При запуске работы системы было выяснено, что нейросетевые регуляторы Neuroregl, Neuroreg2, которые показывают хорошее управление на линейной модели, работают на ограниченном диапазоне в нелинейной модели перевернутого маятника (рис. 4). Граница возможного регулирования лежит в диапазоне задания положения тележки маятника s(t) е [-3 : 3] метров (при этом колебания угла маятника лежат в диапазоне 9(t) е [-50° : 45°]).

Из рис. 4 видно, что при движении тележки (изменение центра тяжести s(t)) происходит также изменение угла отклонения перевернутого маятника 9(t). Этим и объясняется колебательный процесс при нулевых начальных условиях для центра тяжести тележки и угла отклонения перевернутого маятника.

Однако для случая управления нелинейным объектом характерно большее число колебаний за время переходного процесса, чем при управлении линейным объектом (рис. 4, а, б). Это связано с нелинейными параметрами модели объекта, которые не учитывались при синтезе регуляторов. В случае управления нелинейным объектом за пределами границы (рис. 4, в, г) воз-

можного регулирования 5(?) е [-3 : 3] происходит постоянное удаление центра тяжести тележки 5 от требуемого значения 51 и увеличение угла отклонения от вертикали перевернутого маятника 9 на величину больше допустимой 9 > 60° (согласно постановке задача является «нерешенной»).

lime (seconds) a

time (seconds) б

time (seconds) в

time (seconds)

г

Рис. 4. Сравнение переходных процессов для линейного и нелинейного объекта:

a - по углу на границе устойчивости; б - по положению тележки на границе устойчивости; в - по углу за пределами устойчивости; г - по положению тележки за пределами устойчивости

Fig. 4. Comparison of transient processes for a linear and nonlinear object:

a is by the angle at the stability boundary; б is by the position of the cart at the stability boundary; в is by the angle outside the stability limits; г is by the position of the cart beyond stability

Необходимы некоторые усложнения архитектуры нейросетевых регуляторов для улучшения возможностей регулирования нелинейного объекта. В дальнейшем будем преобразовывать архитектуру регулятора, отвечающего за вывод положения тележки в заданное положение Neuroregl.

2. СИНТЕЗ РЕГУЛЯТОРА ДЛЯ НЕЛИНЕЙНОГО ОБЪЕКТА

В разделе 1 было показано, что нейросетевые регуляторы, полученные из ПИД-регуляторов для линейного объекта, обладают существенными ограничениями по регулированию нелинейного объекта. Это связано с тем, что при построении таких регуляторов они рассчитывались для линеаризованной модели, а значит, не учитывались нелинейные составляющие модели объекта. Кроме того, видно, что структура нейросетевых регуляторов (см. рис. 3) содержит только линейные функции активации, а значит, учитывая нелинейный характер выбранной модели объекта, необходимо усложнить выбранную структуру нейрорегулятора (в том числе добавлением нелинейных функций активации).

Модификация архитектуры нейрорегулятора проводилась только в отношении регулятора Ыешоге%1 (см. рис. 2). Этого оказалось достаточно для расширения возможностей по регулированию нелинейной моделью объекта.

2.1. УСЛОЖНЕНИЕ СТРУКТУРЫ

НЕЙРОСЕТЕВОГО РЕГУЛЯТОРА И ВЫБОР НАЧАЛЬНЫХ ВЕСОВЫХ КОЭФФИЦИЕНТОВ

Для управления нелинейным объектом «перевернутый маятник на тележке» проведем некоторые преобразования структуры нейросетевого регулятора Neurоreg1. В качестве усложнений применялось следующее: использование в качестве функции активации функции «гиперболический тангенс», увеличение количества нейронов в слое и увеличение количества слоев.

При постепенном небольшом увеличении сложности структуры нейро-регулятора удалось эмпирическим путем получить архитектуру, способную справиться с задачей регулирования нелинейным объектом. Полученный нейросетевой регулятор Neuroreg3 представлен на рис. 5.

Рис. 5. Усложненная структура нейронной сети регулятора Neuroreg3

Fig. 5. A complicated structure of the neural network of the Neuroreg3 regulator

По сравнению со структурой, представленной на рис. 3, приняты некоторые изменения. Усложненная структура представлена уже тремя слоями. При этом в первом и втором слое используются нелинейные функции активации - «гиперболический тангенс». В первом слое количество нейронов увеличилось до четырех. Дополнительный третий слой представлен одним нейроном с линейной функцией активации.

В качестве начальных весовых коэффициентов будем использовать данные из регулятора Neuroreg1, которые были взяты из коэффициентов усиления дискретного регулятора. А для вновь введенных нейронных связей, не присутствовавших в регуляторе Neuroreg1, выберем случайные значения в диапазоне от [-1:1], взятые по равномерному закону распределения.

Далее будем формировать обучающую выборку и настраивать весовые коэффициенты регулятора.

2.2. ОБУЧЕНИЕ УСЛОЖНЕННОГО НЕЙРОСЕТЕВОГО РЕГУЛЯТОРА И РЕЗУЛЬТАТЫ УПРАВЛЕНИЯ

В качестве обучающей выборки для настройки регулятора Neuroreg3 используем данные переходного процесса линейного регулятора Neuroreg1. Обучающая выборка формировалась из входных и выходных данных с шагом дискретизации 0,01 с.

Для того чтобы расширить диапазон регулирования при разных задающих сигналах, обучение будем проводить на 40 случайных сигналах. Значения сигнала берем в пределах от -10 до +10.

В статье [15] показано, что при определенных условиях возможно повышение показателей регулирования по сравнению с эталонным. Для этого необходимо, чтобы обучающая выборка была снабжена информацией преимущественно о статическом режиме работы. Увеличим длительность сбора информации о положении тележки 5(0 и угле перевернутого маятника 9^) с 10 (рис. 4, а и б) до 20 секунд.

В качестве метода обучения использовался алгоритм Левенберга - Марк-вардта. В качестве оптимизируемой функции выступает среднеквадратичная ошибка между переходными процессами эталонного регулятора Ыеитоге%1 и оптимизируемого регулятора Ыеиготе%3. Для обучения нейросетевого регулятора понадобилось 57 865 итераций. Процесс обучения завершился по достижении минимального градиента функции потерь и занял около 60 минут.

Сравним показатели линейной модели, управляемой регуляторами Ыешоге%1 и Ыешоге%2, и нелинейной модели, управляемой модифицированным регулятором Ыеигоге%3 и регулятором Ыеигоге%2 (рис. 6). Начальные условия были взяты из постановки задачи.

---nonlinear

-linear

15

time (seconds)

б

Рис. 6. Переходные процессы нелинейного и линейного регуляторов:

а - по углу перевернутого маятника, б - по положению тележки

Fig. 6. Transient processes of nonlinear and linear regulators:

a is by the angle of the inverted pendulum and б is by the position of the trolley

a

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как видно из рис. 6, б, регулятор выводит тележку с перевернутым маятником в положение +20 метров как в случае управления линейным объектом (переходный процесс - сплошная линия), так и в случае управления нелинейным объектом (переходный процесс - пунктирная линия). Вывод тележки в заданное положение регуляторами Neuroreg1 и Neuroreg2 для линейной модели происходит примерно за 8 секунд, а регуляторами Neuroreg3 и Neuroreg2 для нелинейной модели примерно за 22 секунды. Также для нелинейной модели системе автоматического управления приходится постоянно корректировать местоположение тележки в связи с недостижением устойчивого положения перевернутого маятника (т. е. имеем дело с незатухающим колебательным процессом с постоянной амплитудой). Однако усложнение архитектуры регулятора Neuroreg1 (получили регулятор Neuroreg3) позволило снять ограничения на диапазон регулирования для нелинейного объекта (5(?) £ [-3:3] метра). Расширение возможностей регулирования на нелинейной модели достигнуто в том числе благодаря перемещению тележки с постоянной скоростью, без ускорения. При этом угол отклонения перевернутого маятника от вертикали незначителен по сравнению с углом отклонения на линейной модели (рис. 6, а)

ЗАКЛЮЧЕНИЕ

В рамках настоящей работы были исследованы возможности регулирования с помощью нейросетевого подхода для нелинейной модели «перевернутый маятник на тележке», а именно: вывод тележки в заданное положение при сохранении вертикального положения перевернутого маятника.

Выяснено, что существующий нейросетевой регулятор, полученный из передаточной функции дискретного регулятора для линейного объекта, обладает весьма ограниченными возможностями для регулирования при включении в модель нелинейностей. Для расширения возможности регулирования осуществлены преобразования в архитектуре исходной нейронной сети. В качестве первоначальных значений весовых коэффициентов использованы коэффициенты усиления дискретного регулятора и случайные значения в диапазоне [-1: +1]. Описан алгоритм и параметры обучения нейросетевой модели.

В результате получен нейросетевой регулятор, позволяющий управлять положением «тележки с перевернутым маятником» для нелинейной модели при сохранении угла перевернутого маятника в допустимых пределах. Таким образом, в рамках работы продемонстрирован метод синтеза нейросетевого регулятора для нелинейной модели объекта на основе знаний о регулировании линеаризованной модели объекта

В дальнейшем планируется преобразовать схему управления нелинейным объектом «перевернутый маятник на тележке» с целью соединения двух регуляторов в один, а также применить вышеописанный подход для синтеза обобщающего нейросетевого регулятора.

СПИСОК ЛИТЕРАТУРЫ

1. Artificial neural network classification of motor-related EEG: an increase in classification accuracy by reducing signal complexity / V.A. Maksimenko, S.A. Kurkin, E.N. Pitsik, V.Y. Musatov, A.E. Runnova, T.Y. Efremova, A.E. Hramov, A.N. Pisarchik // Complexity. - 2018. - Vol. 2018. -Art. 9385947. - P. 1-10.

2. YangX.C., YungM.H., WangX. Neural-network-designed pulse sequences for robust control of singlet-triplet qubits // Physical Review A. - 2018. - Vol. 97. - P. 042324.

3. Eggensperger K., Lindauer M., Hutter F. Neural networks for predicting algorithm runtime distributions // Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence (IJCAI-18). - Stockholm, Sweden, 2018. - P. 1442-1448.

4. Golnaraghi F., Kuo B.C. Automatic control systems. -10th ed. - New York: McGraw-Hill, 2017. - 1160 p.

5. Isidori A. Lectures in feedback design for multivariable systems. - Switzerland: Springer, 2016. - 414 p. - (Advanced Textbooks in Control and Signal Processing).

6. Воевода А.А., Бобобеков К.М., Шипагин В.И. Синтез одноканальных регуляторов с использованием факторизации передаточной функции объекта // Сборник научных трудов НГТУ. - 2019. - № 2 (95). - С. 7-17. - DOI: 10.17212/2307-6879-2019-2-7-17.

7. Lopez-Martin M., Carro B., Sanchez-Esguevillas A. Neural network architecture based on gradient boosting for IoT traffic prediction // Future Generation Computer Systems. - 2019. -Vol. 100. - P. 656-673.

8. Silva A.J. da, Oliveira W.R. de, Ludermir T.B. Weightless neural network parameters and architecture selection in a quantum computer // Neurocomputing. - 2016. - Vol. 183. - P. 13-22.

9. Zoph B., Le Q. Neural architecture search with reinforcement learning // arXiv preprint. -arXiv:1611.01578, 2016.

10. Elsken T., Metzen J., HutterF. Neural architecture search: a survey // arXiv preprint. -arXiv:1808.05377, 2018.

11. Pascanu R., Mikolov T., Bengio Y. On the difficulty of training Recurrent Neural Networks // arXiv preprint. - arXiv: 1211.5063 [cs. LG].

12. Arjovsky M., Shah A., Bengio Y. Unitary evolution Recurrent Neural Networks // arXiv preprint. - arXiv:1511.06464.

13. ВоеводаА.А., Шоба Е.В. О модели перевернутого маятника // Сборник научных трудов НГТУ. - 2012. - № 1 (67). - С. 3-14.

14. Воевода А.А., Шоба Е.В. Управление перевернутым маятником // Сборник научных трудов НГТУ. - 2012. - № 2 (68). - С. 3-14.

15. Шипагин В.И. Нейросетевая реализация регулятора для устойчивого объекта // Сборник научных трудов НГТУ. - 2019. - № 3-4 (96). - С. 53-63. - DOI: 10.17212/2307-6879-20193-4-53-63.

Воевода Александр Александрович, доктор технических наук, профессор кафедры автоматики Новосибирского государственного технического университета. Основное направление научных исследований - управление многоканальными объектами. Имеет более 300 публикаций. E-mail: [email protected]

Шипагин Виктор Игоревич, аспирант кафедры автоматики Новосибирского государственного технического университета. В настоящее время специализируется в области синтеза систем управления техническими системами. E-mail: [email protected]

Voevoda Alexander A., D.Sc. (Eng.), professor at the automation department of the Novosibirsk State Technical University. The main field of his research is control of multichannel objects. He is the author of over 300 publications. E-mail: [email protected]

Shipagin Viktor I., post-graduate student at the department of automation, Novosibirsk State Technical University. Currently he specializes in the synthesis of control systems for technical systems. E-mail: [email protected]

DOI: 10.17212/1814-1196-2020-2-3-25-36

Synthesis of a neural network control regulator of a nonlinear model of an inverted pendulum on a cart *

VOEVODAa, V.I. SHIPAGIN

Novosibirsk State Technical University, 20, K. Marx Prospekt, Novosibirsk, 630073, Russian Federation

a [email protected] b [email protected]

Abstract

In this article, we consider a method for selecting a structure of a neural network used to regulate an "inverted pendulum on a cart" object taking into account its additional features of a mathematical description, namely, nonlinear parameters.

The algorithm is illustrated by the example of control synthesis which includes two neu-roregulators. One of them is responsible for bringing the cart to the specified position, and the second is responsible for holding the pendulum in a vertical position. The structure transformations will be performed for the controller responsible for bringing the cart to the specified position.

The architecture of a neural network controller is based on a discrete controller synthesized using polynomial matrix decomposition. For the original controller, we define the limits of its possible control of a nonlinear system. To increase the range of control of a nonlinear object, we perform transformations of the neural network structure of the original controller. We will make some complications in the structure of the neural network of the regulator, namely, increase the number of neurons and replace some activation functions with nonlinear ones (hyperbolic tangent). Next, we suggest one of the ways to select initial values of weight coefficients. Then we train the neural network and check the performance of the resulting controller on a nonlinear object. At the next stage, we compare the obtained performance of a controller having a complicated neural network structure with the performance of a classical controller.

Thus, the purpose of this study is to formalize the synthesis procedure for a neural network controller for controlling a nonlinear object using a calculated classical controller for a linearized object model.

The proposed method of generating the architecture of a neural network of controllers makes it possible to increase the range of control by a nonlinear object in comparison with the controller obtained by the method of polynomial matrix decomposition for a linear object. Compared to the typical ones, the proposed neural network structure is not redundant and therefore does not require additional computing resources to configure it.

Keywords: neural network controller, nonlinear object control, control system, multichannel system, neural network architecture, inverted pendulum, choice of initial weight coefficients, choice of neural network structure

REFERENCES

1. Maksimenko V.A., Kurkin S.A., Pitsik E.N., Musatov V.Y., Runnova A.E., Efremova T.Y., Hramov A.E., Pisarchik A.N. Artificial neural network classification of motor-related EEG: an increase in classification accuracy by reducing signal complexity. Complexity, 2018, vol. 2018, art. 9385947, pp. 1-10.

2. Yang X.C., Yung M.H., Wang X. Neural-network-designed pulse sequences for robust control of singlet-triplet qubits. Physical Review A, 2018, vol. 97, p. 042324.

Received 16 January 2020.

3. Eggensperger K., Lindauer M., Hutter F. Neural networks for predicting algorithm runtime distributions. Proceedings of the Twenty-Seventh International Joint Conference on Artificial Intelligence (IJCAI-18), Stockholm, Sweden, 2018, pp. 1442-1448.

4. Golnaraghi F., Kuo B.C. Automatic control systems. 10th ed. New York, McGraw-Hill, 2017. 1160 p.

5. Isidori A. Lectures in feedback design for multivariable systems. Switzerland, Springer, 2016. 414 p.

6. Voevoda A.A., Bobobekov K.M., Shipagin V.I. Sintez odnokanal'nykh regulyatorov s is-pol'zovaniem faktorizatsii peredatochnoi funktsii ob"ekta [Synthesis of single-channel regulators using factorization of the object transfer function]. Sbornik nauchnykh trudov Novosibirskogo gosu-darstvennogo tekhnicheskogo universiteta = Transaction of scientific papers of the Novosibirsk state technical university, 2019, no. 2 (95), pp. 7-17. DOI: 10.17212/2307-6879-2019-2-7-17.

7. Lopez-Martin M., Carro B., Sanchez-Esguevillas A. Neural network architecture based on gradient boosting for IoT traffic prediction. Future Generation Computer Systems, 2019, vol. 100, pp. 656-673.

8. Silva A.J. da, Oliveira W.R. de, Ludermir T.B. Weightless neural network parameters and architecture selection in a quantum computer. Neurocomputing, 2016, vol. 183, pp. 13-22.

9. Zoph B., Le Q. Neural architecture search with reinforcement learning. arXiv preprint, arXiv:1611.01578, 2016.

10. Elsken T., Metzen J., Hutter F. Neural architecture search: a survey. arXiv preprint, arXiv:1808.05377, 2018.

11. Pascanu R., Mikolov T., Bengio Y. On the difficulty of training Recurrent Neural Networks. arXiv preprint, arXiv:1211.5063 [cs.LG].

12. Arjovsky M., Shah A., Bengio Y. Unitary evolution Recurrent Neural Networks. arXiv preprint, arXiv:1511.06464.

13. VoevodaA.A., ShobaE.V. O modeli perevernutogo mayatnika [About model inverted pendulum]. Sbornik nauchnykh trudov Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta = Transaction of scientific papers of the Novosibirsk state technical university, 2012, no. 1 (67), pp. 3-14.

14. Voevoda A.A., Shoba E.V. Upravlenie perevernutym mayatnikom [About model inverted pendulum] Sbornik nauchnykh trudov Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta = Transaction of scientific papers of the Novosibirsk state technical university, 2012, no. 2 (68), pp. 3-14.

15. Shipagin V.I. Neirosetevaya realizatsiya regulyatora dlya ustoichivogo ob"ekta [Neural network implementation of a controller for a stable object]. Sbornik nauchnykh trudov Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta = Transaction of scientific papers of the Novosibirsk state technical university, 2019, no. 3-4 (96), pp. 53-63. DOI: 10.17212/2307-6879-2019-3-453-63.

Для цитирования:

Воевода А.А., Шипагин В.И. Синтез нейросетевого регулятора управления нелинейной моделью перевернутого маятника на тележке // Научный вестник НГТУ. - 2020. - № 2-3 (79). -С. 25-36. - DOI: 10.17212/1814-1196-2020-2-3-25-36.

For citation:

Voevoda A.A., Shipagin V.I. Sintez neirosetevogo regulyatora upravleniya nelineinoi model'yu perevernutogo mayatnika na telezhke [Synthesis of a neural network control regulator of a nonlinear model of an inverted pendulum on a cart]. Nauchnyi vestnik Novosibirskogo gosudarstvennogo tekhnicheskogo universiteta = Science bulletin of the Novosibirsk state technical university, 2020, no. 2-3 (79), pp. 25-36. DOI: 10.17212/1814-1196-2020-2-3-25-36.

ISSN 1814-1196, http://journals.nstu.ru/vestnik Science Bulletin of the NSTU Vol. 79, No 2-3, 2020, pp. 25-36

i Надоели баннеры? Вы всегда можете отключить рекламу.