Научная статья на тему 'СИНТЕЗ ГАРАНТИРОВАННО УСТОЙЧИВЫХ НЕЙРОСЕТЕВЫХ РЕГУЛЯТОРОВ С ОПТИМИЗАЦИЕЙ КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА'

СИНТЕЗ ГАРАНТИРОВАННО УСТОЙЧИВЫХ НЕЙРОСЕТЕВЫХ РЕГУЛЯТОРОВ С ОПТИМИЗАЦИЕЙ КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
39
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННЫЕ СЕТИ / СИСТЕМЫ УПРАВЛЕНИЯ / ФУНКЦИЯ ЛЯПУНОВА / УСТОЙЧИВОСТЬ / НЕЙРОСЕТЕВОЙ РЕГУЛЯТОР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Феофилов Сергей Владимирович, Козырь Андрей Владимирович, Хапкин Дмитрий Леонидович

В статье рассматривается синтез гарантированно устойчивого нейрорегулятора для следящих систем с оптимизацией по времени переходного процесса. Предлагаемый подход основан на одновременном формировании регулятора и функции Ляпунова в виде нейросетей. Рассмотрено применение целочисленного линейного программирования для поиска функции Ляпунова. Предлагается использовать комплексный критерий оптимизации, позволяющий обеспечивать устойчивость и настраивать нейросетевой регулятор с учетом качества переходного процесса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Феофилов Сергей Владимирович, Козырь Андрей Владимирович, Хапкин Дмитрий Леонидович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SYNTHESIS OF GUARANTEED STABLE NEURAL NETWORK CONTROLLERS WITH TRANSIENT QUALITY OPTIMIZATION

In this article we consider the synthesis of a guaranteed stable neuroregulator for tracking systems with transient time optimization. The proposed approach is based on the simultaneous formation of regulator and Lyapunov function in the form of neural networks. The application of integer linear programming to find the Lyapunov function is considered. It is offered to use complex criterion of optimization, allowing to provide stability and to adjust the neural network regulator taking into account quality of transition process.

Текст научной работы на тему «СИНТЕЗ ГАРАНТИРОВАННО УСТОЙЧИВЫХ НЕЙРОСЕТЕВЫХ РЕГУЛЯТОРОВ С ОПТИМИЗАЦИЕЙ КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА»

Шпрехер Дмитрий Маркович, д-р техн. наук, профессор, shpreher-d@yandex.ru, Россия, Тула, Тульский Государственный Университет,

Зеленков Александр Вадимович, ассистент, sashazelnkv@mail. ru, Россия, Тула, Тульский Государственный Университет,

Новаков Александр Викторович, аспирант, sanyatopor87@gmail.com, Россия, Тула, Тульский Государственный Университет

ADEQUACY VERIFICATION OF THE SHEARER MATHEMATICAL MODEL CONTROL SYSTEM MOVING

DRIVE

D.M. Shprekher, A.V. Zelenkov, A.V. Novakov

The article verification the adequacy of the shearer mathematical model control system moving drive by conducting a multifactorial machine experiment and comparing it with a crushing and milling machine (CMM) from the point of view of temporal similarity. It is shown that the CMM with its control system for its functional purpose is an object similar and homochronous to Shearer. Temporary similarity is observed, because a constant value is maintained between similar time intervals of the process. To verify the adequacy of the developed mathematical model to the investigated transient process of stabilizing the current of the cutting motor, the following was performed: planning a machine experiment on the Shearer model taking into account random surges in the resistance of coal to cutting, its implementation using the MATLAB/Simulink environment, processing the results of the experiment, conducting a similar full-scale experiment on the CMM. The adequacy of the mathematical model is verification by checking the significance of the regression coefficients using the Student's criterion and comparing the calculated value of the Fisher criterion with the tabular one. A comparison of the results of calculating the output parameter obtained from a mathematical model and a full-scale experiment in the studied range offactor variation is performed. The discrepancy between the results of modeling and full-scale experiments does not exceed 10%.

Key words: control system, mathematical model, transition time, adequacy.

Shprekher Dmitry Markovich, doctor of technical science, professor, shpreher-d@yandex.ru, Russia, Tula, Tula State University,

Zelenkov Alexandr Vadimovich, assistant, sashazelnkv@mail.ru, Russia, Tula, Tula State University,

Novakov Alexandr Viktorovich, postgraduate, sanyatopor8 7@gmail.com, Russia, Tula, Tula State

University

УДК 004.032.26

DOI: 10.24412/2071-6168-2022-12-128-134

СИНТЕЗ ГАРАНТИРОВАННО УСТОЙЧИВЫХ НЕЙРОСЕТЕВЫХ РЕГУЛЯТОРОВ С ОПТИМИЗАЦИЕЙ КАЧЕСТВА ПЕРЕХОДНОГО ПРОЦЕССА

Д.Л. Хапкин, С.В. Феофилов, А.В. Козырь

В статье рассматривается синтез гарантированно устойчивого нейрорегулятора для следящих систем с оптимизацией по времени переходного процесса. Предлагаемый подход основан на одновременном формировании регулятора и функции Ляпунова в виде нейросетей. Рассмотрено применение целочисленного линейного программирования для поиска функции Ляпунова. Предлагается использовать комплексный критерий оптимизации, позволяющий обеспечивать устойчивость и настраивать нейросетевой регулятор с учетом качества переходного процесса.

Ключевые слова: нейронные сети, системы управления, функция Ляпунова, устойчивость, нейросетевой регулятор.

Введение. В настоящее время активно развиваются методы применения искусственного интеллекта и нейронных сетей в робототехнике, в том числе и для задач управления. Достижения в области машинного обучения и аппаратных вычислительных устройств упрощают практическое использование нейросетевых регуляторов в системах управления динамическими системами (промышленными манипуляторами [1], следящими приводами, беспилотными летательными аппаратами [2], силовой электроникой и т.д.). Несмотря на успешное применение таких регуляторов, для них не имеется теоретических обоснований устойчивости системы управления, что затрудняет их использование в промышленности. Существующие подходы к оценке обученных моделей часто основаны на тестировании с использованием наборов данных [3]. В работе [4] впервые предложен метод тестирования простых нейронных сетей с одним скрытым слоем. Однако, это не может гарантировать отсутствие неустойчивых режимов.

128

Большим недостатком современных нейросетевых регуляторов является отсутствие теоретически обоснованной методики синтеза, гарантирующей устойчивость замкнутой системы. Система считается устойчивой, если, начиная с любого состояния внутри некоторой области, она в конечном итоге приходит к равновесию. Выполнение условий теоремы Ляпунова об асимптотической устойчивости дает гарантию такого поведения системы для любого состояния внутри области притяжения. Существуют различные подходы к численному построению функций Ляпунова для нелинейных систем с нейросете-вым управлением [5], [6]. Многие существующие подходы основаны на полиномиальной аппроксимации динамики и поиске суммы квадратов полиномов в качестве функций Ляпунова с помощью полуопределенного программирования (SDP) [5]. На практике полиномиальные приближения накладывают значительные ограничения на системы и структуру функций Ляпунова, а также возникает проблема чувствительности алгоритма SDP [6].

В данной работе предлагается подход к исследованию устойчивости систем управления с нейросетевым регулятором, в котором задача поиска функции Ляпунова для замкнутой системы сводится к обучению дополнительной нейронной сети на данных, полученных в результате решения задачи целочисленного линейного программирования (ЦЛП) [7, 8, 9, 10].

1. Структура системы управления. В работе рассматривается замкнутая дискретная система управления (рис. 1).

Для обучения используется метод обратного пропуска ошибки через прямой нейроэмулятор, поэтому на первом этапе обучается имитатор объекта управления [11, 12], основанный на нейронной сети, который описывается следующим образом:

xt+1 = f(xt,ut)-ф (xt,ut)-ф (x,и) + /, (1)

ayn

umin - ut — umax,

где Х(; - вектор состояния объекта управления в момент времени и— значение управляющего сигнала в момент /; итт и итах- нижний/верхний пределы сигнала управления объекта; х* - точка равновесия системы в фазовом пространстве; и* - значение управления в данной точке; ф^уП - нейронная сеть прямого

распространения с функцией активации leakyReLU [13].

НС регулятор

НС функция Ляпунова Рис. 1. Заткнутая система управления

Нейросетевой регулятор описывается следующим образом:

* *

щ = г(х() = фг(х()-фг(х ) + и , (2)

где фг - нейронная сеть в основе регулятора.

Такая запись в уравнениях (1) и (2) позволяет в точке равновесия гарантированно иметь соответственно.

Хорошо известно, что по Ляпунову система устойчива только тогда, когда существует функция, которая является строго положительной и строго убывает везде, кроме случая равновесного состояния, т.е. функция Ляпунова должна удовлетворять следующим условиям:

V(х[ф > 0 V х^] е £, х^] * х*; (3)

V(х[Г +1]) - V(х[Г]) < 0 V х[Г] е £; (4)

V (х*) = 0; (5)

где хг - состояние объекта управления в момент времени /, х* - равновесное состояние, £- область начальных условий, в которой система устойчива.

Функция Ляпунова представляется с помощью нейронной сети фу как

V (Xt) = фф (Xt) - фф (х ) + 129

R(xt - х )

где Я-матрица, имеющая полный ранг, а — х*)1 позволяет удовлетворить (3). При х4 = х* данное уравнение позволяет удовлетворить требование (5).

2. ЦЛП для нейронных сетей. В работе все нейронные сети являются сетями прямого распространения с функцией активации leakyReLU (рис. 3):

а( у) = тах( у, су), где с - значение коэффициента отрицательной части.

Рис. 3. Функция активации IеакуЯеЫ/

Также данную функцию можно описать в виде системы неравенств:

а> у, а> су,

ю< су — (с — 1)уир0, (6)

у — (с — 1) у1о (0 — 1), 0е{О,1}, а е Я,

где а - выход 1еакуЯеии, в - бинарная переменная (в = 0 - для отрицательной, в = 1 - для положительной), у - значение входа leakyReLU, уир и у/о- ограничения на входную переменную. Для расчета уир и у/одля каждого нейрона используется интервальная арифметика [14].

Таким образом можно представить всю нейронную сеть в виде системы алгебраических равенств и неравенств, описывая каждый нейрон с учетом (6). Данная система будет использоваться для решения задачи ЦЛП.

3. Синтез устойчивой нейросетевой системы с оптимизацией по времени регулирования.

Для обучения нейрорегулятора и нейросетевой функции Ляпунова следует сформировать данные, которые получаются из найденных в ограниченной области фазового пространства точек, которые максимально нарушают требования (3) и (4). Поиск таких точек сводится к задаче (ЦЛП). Т.е. выполняется оптимизация следующих целевых функций:

R(x[t] - x )

- V (x[t ]));

max (s. x[t ]eS

max (V(x[t +1]) + (s -1) • V(x[t])). x[t ]eS

Далее, эти точки используются для обучения нейронных сетей, которые должны минимизировать найденные нарушения:

j1 = max(s xeS

jj2 = max(V ( x[ t

xeS

R(x[t] - x ) 1])-130

- V (x[t ])), (s-1) • V (x[ t ])).

Также, для контроля времени регулирования ^ из каждой найденной точки выполняется процесс моделирования системы с шагом дискретизации системы Ж, состоящей из нейросетевых регулятора и имитатора, на время 1т превышающее Ъ. Каждая точка, записанная после времени и, сравнивается с точкой устойчивости для получения ошибки стабилизации, которая минимизируется, тем самым требуя от нейросетевого регулятора уменьшения времени регулирования в процессе обучения. Критерий выглядит так:

*

щ = х[/] - X ,

где х[1] - состояние в дискретный шаг / от начала моделирования, / - номера дискретного шага от требуемого времени регулирования до конца моделирования,

Общая функция потерь выглядит следующим образом:

^ = |Щ +ы+Ы1 (7)

Таким образом, минимизируя (7) обучаются нейронные сети функции Ляпунова и нейрорегу-лятора. Полученная замкнутая система будет гарантированно устойчивой в локальной области с подтверждающей функцией Ляпунова и время регулирования будет минимизировано.

Пример. Рассмотрим пример синтеза нейросетевого стабилизирующего регулятора для упрощенной модели перевернутого маятника (рис. 4). Динамика системы представлена в следующем виде:

Х1 =

и - mgl ■ sin(Х1) - dx2 Х2 = '

т - масса маятника, I - длина маятника, g = 9,81 м/с2, d - коэффициент демпфирования, хг - угловое положение маятника, х2 - угловая скорость маятника, и - управляющее воздействие.

Задачей является синтез регулятора, который должен удерживать маятник в вертикальном положении, а время переходного процесса должно составлять 1 сек. Для подтверждения устойчивости строится нейросетевая функция Ляпунова. Для системы, с помощью метода обратного распространения ошибки был получен нейросетевой имитатор объекта управления и стабилизирующий регулятор. С помощью ЦЛП была получена нейросетевая функция Ляпунова, которая показана на рис. 6.

Поверхность функции Ляпунова

0 12 3 15 6

XI

Рис. 6. Поверхность нейросетей функции Ляпунова

На рис. 7 показан график перехода системы с перевернутым маятником из начальной точки в заданную точку равновесия (вертикальное положение).

/ - fc —

00 95 10 J-5 2.0 2.5 30

f\ - Xi — to*

00 05 10 IS 20 25 30

V

0X1 OS Го 15 ?0 Z.5 М

еремя. с

Рис. 7. График состояний системы с перевернутым маятником, переходящий из начальной точки фазового пространства в точку равновесия с оптимизацией времени регулирования

Для сравнения на рис. 8 показан переходный процесс без требования к времени регулирования.

п 30

П

а

§ 25

U

■о

CL

А 025

0 ООО

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

St

v

1 -0 25

5

Ш

О

0 5 10 15 20 25 30 J540 время, с

Рис. 8. График состояний системы с перевернутым маятником, переходящий из начальной точки фазового пространства в точку равновесия без требований к времени регулирования.

Заключение. В работе показано, что решение задач оптимизации в системах с нейронной сетью можно свести к задаче ЦЛП. Далее этот подход распространяется на синтезнейросетевой функции Ляпунова для замкнутой системы управления с нейросетевым регулятором, что позволяет гарантировать устойчивость системы. На примере стабилизации неустойчивого динамического объекта типа перевернутый маятник синтезирована устойчивая нейросетевая система управления с оптимизацией переходного процесса.

Работа выполнена при финансовой поддержке Министерства науки и высшего образования РФ в рамках государственного задания по теме "Развитие теории прикладных интеллектуальных систем вооружения и военной техники" (FEWG-2022-0003).

Список литературы

l.Osbert Bastani, Yaniloannou, Leonidas Lampropoulos, DimitriosVytiniotis, Aditya V Nori, and Antonio Criminisi. Measuring neural net robustness with constraints. In Proceedings of the 30th International Conference on Neural Information Processing Systems, 2016. P. 2621- 2629.

2. Bonna R., Camino JF. Trajectory tracking control of a quadrotor using feedback linearization. In International Symposium on Dynamic Problems of Mechanics, 2015.

3. Akshay Agrawal, Brandon Amos, Shane Barratt, Stephen Boyd, Steven Diamond, and Zico Kolter. Differentiable convex optimization layers. In Advances in neural information processing systems, 2019.

4. Cheng, Chih-Hong, Nuhrenberg, Georg, and Ruess, Harald. Verification of binarized neural networks. arXiv:1710.03107, 2017.

5. Katz, Guy, Barrett, Clark, Dill, David, Julian, Kyle, andKochenderfer, Mykel. Reluplex: An efficient smt solver for verifying deep neural networks. CAV, 2017.

6. Pablo A. Parrilo. Structured semidefinite programs and semialgebraic geometry methods in robustness and optimization. PhD thesis, California Institute of Technology, 2000.

7. Ross Anderson, Joey Huchette, Will Ma, Christian Tjandraatmadja, and Juan Pablo Vielma. Strong mixed-integer programming formulations for trained neural networks. Mathematical Programming, pages 1-37, 2020.

8. Vigerske S., Gleixner A.M. Global Optimization of Mixed-Integer Nonlinear Programs in a Branch-and-Cut Framework. Optimization Methods and Software, 2017, doi:10.1080/10556788.2017.1335312.

9.Rudy Bunel, IlkerTurkaslan, Philip HS Torr, Pushmeet Kohli, and M Pawan Kumar. A unified view of piecewise linear neural network verification. In Advances in Neural Information Processing Systems, 2018.

10.Hongkai Dai, Benoit Landry, Marco Pavone, and Russ Tedrake. Counter-example guided synthesis of neural network lyapunov functions for piecewise linear systems. In 2020 59th IEEE Conference on Decision and Control (CDC), IEEE, 2020. P. 1274-1281.

11.Feofilov S.V., Khapkin D.L. Synthesis of neural network controllers for objects with non-linearity of the constraint type, Journal of Physics: Conference Series. 11. Сер. "XI International Scientific and Technical Conference on Robotic and Intelligent Aircraft Systems Improving Challenges, RIASIC 2020, 2021. P. 012-014.

12.Чернодуб А.Н., Дзюба Д.А. Обзор методов нейроуправления // Проблемы программирова-ния.2011. Вып. 2. P. 79-94.

13.Goodfellow I., Bengio Y., Courville A. Deep Learning. Cambridge: MA: MIT Press, 2016.

14.Eric Wong, Zico Kolter. Provable defenses against adversarial examples via the convex outer adversarial polytope, International Conference on Machine Learning,PMLR, 2018.P. 5286-5295.

Феофилов Сергей Владимирович, д-р техн. наук, ведущий научный сотрудник, svfeofilov@mail.ru, Россия, Тула, Тульский государственный университет,

Козырь Андрей Владимирович, канд. техн. наук, сташий научный сотрудник, kozyr_a_v@mail.ru, Россия, Тула, Тульский государственный университет,

Хапкин Дмитрий Леонидович, младший научный сотрудник, dima-hapkin@ya. ru, Россия, Тула, Тульский государственный университет

SYNTHESIS OF GUARANTEED STABLE NEURAL NETWORK CONTROLLERS WITH TRANSIENT QUALITY

OPTIMIZATION

D.L. Khapkin, S.V. Feofilov, A.V. Kozyr

In this article we consider the synthesis of a guaranteed stable neuroregulator for tracking systems with transient time optimization. The proposed approach is based on the simultaneous formation of regulator and Lyapunov function in the form of neural networks. The application of integer linear programming to find the Lyapunov function is considered. It is offered to use complex criterion of optimization, allowing to provide stability and to adjust the neural network regulator taking into account quality of transition process.

Key words: neural networks, control systems, Lyapunov function, stability, neural network

controller.

Feofilov Sergey Vladimirovich, doctor of technical sciences, leading researcher, svfeofilov@mail.ru, Russia, Tula, Tula State University,

Kozyr Andrey Vladimirovich, candidate of technical sciences, senior researcher, kozyr_a_v@mail. ru, Russia, Tula, Tula State University,

Khapkin Dmitry Leonidovich, junior researcher, Dima-Hapkin@ya.ru, Russia, Tula, Tula State

University

i Надоели баннеры? Вы всегда можете отключить рекламу.