Научная статья на тему 'Обучение нейросетевых регуляторов для стабилизации комбинированных динамических систем'

Обучение нейросетевых регуляторов для стабилизации комбинированных динамических систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
113
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИНАМИЧЕСКИЕ СИСТЕМЫ / КОМБИНИРОВАННЫЕ ДИНАМИЧЕСКИЕ СИСТЕМЫ / НЕЙРОННЫЕ СЕТИ / УПРАВЛЕНИЕ / DYNAMIC SYSTEMS / HYBRID DYNAMIC SYSTEMS / NEURAL NETWORKS / CONTROL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Андрейченко Дмитрий Константинович, Жадаев Фёдор Михайлович

Устройства управления на основе искусственных нейронных сетей в настоящее время довольно часто используются для управления объектами с сосредоточенными по пространству параметрами. Объекты управления в таких системах характеризуются конечным множеством собственных частот. Поэтому применение нейросетевых управляющих устройств после соответствующей настройки внутренних параметров (обучения) либо полностью исключает, либо минимизирует вероятность появления неустойчивых собственных частот колебаний объекта управления в течение достаточно продолжительного периода времени. В то же время если в состав объекта управления входят объекты с распределёнными по пространству параметрами (например, гибкие стержни), число его характерных собственных частот колебаний будет как минимум счётно-бесконечным. Таким образом, для использования нейросетевых управляющих устройств для управления такими объектами требуется дополнительная проверка устойчивости системы. В случае использования классических управляющих устройств (таких как ПИД-регуляторы) для выполнения этого условия их параметры выбираются из области устойчивости системы. Такой подход неприменим к устройствам управления на основе искусственных нейронных сетей, так как их параметры подбираются в процессе обучения. В данной работе выводится правило, гарантирующее, что после обучения выбранные веса будут принадлежать области устойчивости системы. Описываемое правило является модификацией функции ошибки нейронной сети и не накладывает существенных ограничений на выбор алгоритма обучения. Полученные результаты могут быть использованы при управлении комбинированными динамическими системами при помощи нейросетевых управляющих устройств на основе искусственных нейронных сетей прямого распространения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Андрейченко Дмитрий Константинович, Жадаев Фёдор Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Learning Neural Network Controllers for Stabilizing Hybrid Dynamic Systems

Control modules based on artificial neural networks (NN) are often used for controlling objects with lumped parameters. Controled objects in such systems have finite set of natural oscillation frequencies. Thereby applying NN-based controllers after setting appropriate internal parameters (learning) minimize or fully exclude probability of appearing unstable natural oscillation frequencies for a long period of time. On the other hand if the controlled object includes objects with distributed parameters (such as elastic rods) the number of its natural oscillation frequencies is at least countable infinite. Thus, for using NN-based controlers for such systems additional check of stability is needed. In case of using classic controllers (such as PID-controller) stability is guarantied by choosing internal parameters of controller from the area of stability of the system. Such approach is not applyable for NN-based controllers since their parameters are determed during the learning process. This article develops the rule which guaranties that after the learning process set of NN weights will belong to the area of stability of the system. That rule in fact appears as modification of loss function and does not apply valuable limitations on choosing a learning method. The obtained results could be used in cases of controlling hybrid dynamic systems with help of control modules based on feedforward neural networks.

Текст научной работы на тему «Обучение нейросетевых регуляторов для стабилизации комбинированных динамических систем»

УДК 501.1

ОБУЧЕНИЕ НЕЙРОСЕТЕВЫХ РЕГУЛЯТОРОВ ДЛЯ СТАБИЛИЗАЦИИ КОМБИНИРОВАННЫХ ДИНАМИЧЕСКИХ СИСТЕМ

Д. К. Андрейченко, Ф. М. Жадаев

Андрейченко Дмитрий Константинович, доктор физико-математических наук, профессор кафедры математического обеспечения вычислительных комплексов и информационных систем, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского, Россия, 410012, Саратов, Астраханская, 83, kp_andreichenko@renet.ru

Жадаев Фёдор Михайлович, аспирант, Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского, Россия, 410012, Саратов, Астраханская, 83, ZhadaevFM@gmail.com

Устройства управления на основе искусственных нейронных сетей в настоящее время довольно часто используются для управления объектами с сосредоточенными по пространству параметрами. Объекты управления в таких системах характеризуются конечным множеством собственных частот. Поэтому применение нейросетевых управляющих устройств после соответствующей настройки внутренних параметров (обучения) либо полностью исключает, либо минимизирует вероятность появления неустойчивых собственных частот колебаний объекта управления в течение достаточно продолжительного периода времени. В то же время если в состав объекта управления входят объекты с распределёнными по пространству параметрами (например, гибкие стержни), число его характерных собственных частот колебаний будет как минимум счётно-бесконечным. Таким образом, для использования нейросетевых управляющих устройств для управления такими объектами требуется дополнительная проверка устойчивости системы. В случае использования классических управляющих устройств (таких как ПИД-регуляторы) для выполнения этого условия их параметры выбираются из области устойчивости системы. Такой подход неприменим к устройствам управления на основе искусственных нейронных сетей, так как их параметры подбираются в процессе обучения. В данной работе выводится правило, гарантирующее, что после обучения выбранные веса будут принадлежать области устойчивости системы. Описываемое правило является модификацией функции ошибки нейронной сети и не накладывает существенных ограничений на выбор алгоритма обучения. Полученные результаты могут быть использованы при управлении комбинированными динамическими системами при помощи нейросетевых управляющих устройств на основе искусственных нейронных сетей прямого распространения.

Ключевые слова: динамические системы, комбинированные динамические системы, нейронные сети, управление.

001: https://doi.Org/10.18500/1816-9791-2018-18-3-354-360 ВВЕДЕНИЕ

В настоящее время наблюдается повышенный интерес к проектированию нейросетевых устройств для управления движением объектов с сосредоточенными по пространству параметрами [1-5]. Обучение нейросетевого управляющего устройства выполняется на основе минимизации взвешенной разности желаемых и фактических координат траектории движения объекта, взятых на достаточно большом, но конечном множестве дискретных моментов времени. Поскольку математическая модель

собственно управляемого объекта представляет собой систему обыкновенных дифференциальных уравнений (ОДУ), объект характеризуется конечным множеством собственных частот. Следовательно, в данном случае применение подобных алгоритмов обучения либо минимизирует вероятность возникновения неустойчивых собственных частот колебаний управляемого объекта, либо делает невозможным развитие неустойчивости в течение достаточно длительного периода, когда происходит управление объектом.

Комбинированные динамические системы (КДС) представляют собой математические модели в форме связанных посредством граничных условий и условий связи систем ОДУ и уравнений в частных производных [6,7]. Из-за наличия объектов управления с распределенными по пространству параметрами спектр характерных собственных частот будет как минимум счетно-бесконечным. Следовательно, при проектировании алгоритмов обучения нейросетевых регуляторов для управления движением подобных объектов нужно априорно ограничивать параметры регулятора условием их принадлежности области устойчивости.

1. УПРАВЛЕНИЕ КОМБИНИРОВАННЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

На рисунке показана структурная схема КДС, где £ е М, х : М ^

^ М^х, у : м ^ м^у, х(£) = (ж! (£),

ж2 (£),..., хмх (£))т — кусочно-непрерывная входная вектор-функция,

У(£) = (У! (¿),У2(£),...,У^(£))т — непрерывная выходная вектор-функция. Здесь ОДУ — обыкновенные дифференциальные уравнения, моделирующие движение объектов управления с сосредоточенными по пространству параметрами; УЧП — уравнения в частных производных, моделирующие движение объектов управления с распределенными по пространству параметрами; ГУ, УС, НУ — граничные условия, условия связи и начальные условия соответственно.

^руктурная схема КДС Structural scheme of hybrid dynamic system

Уравнения управляемых КДС зависят от параметров обратных связей р

= (pi )

T

В результате линеаризации и применения одностороннего

интегрального преобразования Лапласа по времени /(£) ^ /(Л) = /0° / (£)е Л е С динамическая модель КДС представляется в виде матрицы передаточных функций Ф(Л,р), Ф : С х М^ ^ >:

У(Л) = ф(л, р)х(л), ф(л, р) = [ф^(Л, р)] = Оу(Л, р)/^(л, р)], (1)

Я(Л, р)= , Qkj (Л, р) = Qkj (Л, р), к = 1, , ; = 1, , (2)

где ^(Л, р) — характеристический, а Qkj(Л, р) —возмущающие квазимногочлены. Если математические модели элементов КДС с распределёнными по пространству

p

параметрами учитывают малую конечную диссепацию энергии и выполнен ряд условий, сформулированных и доказанных в [8], то при

Re Л > 0о, 0о € (-то, 0) (3)

функции ^(Л, p) и Qkj(Л, p) аналитичны по Л.

Обобщённая степень [7] n € R характеристического квазимногочлена ^(Л, p) определяется следующим условием:

lim Л-п£(Л,p) = Ca(p), 0 < |Ca(p)| < то, ReЛ> -то. (4)

Как следует из теорем об устойчивости КДС, для проверки принадлежности параметров обратных связей p области устойчивости Qst с RNp достаточно проверить условие

p € Üst & А arg p) = nn/2. (5)

В работе [9] была обоснована применимость теорем и методов проверки устойчивости КДС из [7,10] для систем с нейросетевыми управляющими устройствами на основе нейронных сетей прямого распространения. При этом роль параметров обратных связей p играют внутренние параметры (веса) нейросетевых управляющих устройств.

В отличие от задач параметрического синтеза КДС с ПД и ПИД регуляторами [10-14], в нейросетевых управляющих устройствах внутренние параметры p подбираются в процессе обучения с использованием специальных алгоритмов, например, алгоритма обратного распространения ошибки, минимизирующих некоторую определённую функцию ошибки. Для обеспечения устойчивости КДС необходимо, чтобы после обучения искусственной нейронной сети управляющего устройства условие (5) выполнялось для полученного набора весов p.

2. ОБУЧЕНИЕ НЕЙРОСЕТИ В ОБЛАСТИ УСТОЙЧИВОСТИ

Для выполнения условия устойчивости, сформированного выше, наиболее эффективным решением является обеспечение условий, при которых во время обучения нейронной сети веса p будут выбираться в пределах области устойчивости Ost. Так как в процессе обучения происходит минимизация некоторой функции ошибки, наиболее простым решением будет модификация этой функции таким образом, чтобы она интенсивно возрастала при приближении изнутри к границе области устойчивости üst и при выходе за границу этой области. То есть требуется некоторая скалярная функция параметров обратных связей fd(p), fd : RNp ^ R, позволяющая оценить расстояние от границы области устойчивости (по направлению изнутри к границе области устойчивости).

Рассмотрим представление КДС в виде (1). Пусть выполнены условия (2)-(4), и Л0 = Л0(p) — корень характеристического квазимногочлена ^(Л, p) с наибольшей вещественной частью. Из теорем об устойчивости [6, 7] следует, что система асимптотически устойчива, если Re Л0 < 0, и неустойчива при Re Л0 > 0, а случай Re Л0 = 0 соответствует границе области устойчивости. То есть можно полагать, что расстояние от границы области устойчивости оценивается следующим образом:

fd (p)= Re Л0 (p). (6)

Аналогично [7] на основе принципа аргумента доказывается следующее утверждение.

Утверждение. Если справедливы условия (2)-(4) и а > а0, то функция ^(Л, р) не будет иметь нулей при Ив Л0 ^ 0, если

Если при а = а! не выполняется условие (7), то а! < Ив Л0. Если при а = а2 > а! условие (7) выполняется, то а2 > Ив Л0. Таким образом, значение Ив Л0 из правой части определения (6) достаточно быстро может быть найдено методом половинного деления отрезка [а! ,а2].

Полученная метрика (6) позволяет легко модифицировать имеющуюся функцию ошибки, выбранную для обучения нейросетевого управляющего устройства путём добавления коэффициента к(р), к : ^ М, интенсивно возрастающего при переходе изнутри вовне через границу области устойчивости . Например, в качестве такого коэффициента может быть использована функция к(р) = /(/(р)), где / : М ^ М — кусочно-заданная функция вида

Получена метрика, позволяющая без существенного изменения процесса обучения искусственной нейронной сети гарантировать выбор весов, принадлежащих области устойчивости КДС, тем самым позволяя использовать соответствующий класс управляющих устройств для управления динамическими системами с распределёнными по пространству параметрами. Заметим, что полученные результаты почти не накладывают ограничений на метод обучения нейронной сети, внося лишь дополнительный коэффициент в функцию ошибки.

Таким образом, описанный подход к ограничению возможных значений весов областью устойчивости динамической системы может быть использован как для упомянутого ранее алгоритма обратного распространения ошибки, так и для более сложных алгоритмов, например, использующих квазиньютоновские методы оптимизации [15].

Библиографический список

1. Luoren L., Jinling L. Research of PID Control Algorithm Based on Neural Network // Energy Procedia. 2011. Vol. 13. P. 6988-6993.

2. MacKunis W., Leve F., Patre P. M, Fitz-Coy N., Dixon W. E. Adaptive neural network-based satellite attitude control in the presence of CMG uncertainty // Aerospace Science and Technology. 2016. № 54. P. 218-228.

3. Ajorkar A., Fazlyab A., Saberi F. F., Kabganian M. Design of an Adaptive-Neural Network Attitude Controller of a Satellite using Reaction Wheels // JACM. 2014. Vol. 1, iss. 2. P. 67-73. DOI: https://doi.org/10.22055/jacm.2014.10757

Д arg + a, p) = nn/2.

(7)

ЗАКЛЮЧЕНИЕ

4. MacKunis W, Dupree K, Bhasin S., Dixon W. E. Adaptive neural network satellite attitude control in the presence of inertia and CMG actuator uncertainties // 2008 American Control Conference. 2008. P. 2975-2980. DOI: https://doi.org/10.1109/ACC.2008.4586948

5. Sivaprakash NShanmugam J. Neural network based three axis satellite attitude control using only magnetic torquers // 24th Digital Avionics Systems Conference. 2005. Vol. 2. P. 6. DOI: https://doi.org/10.1109/DASC.2005.1563440

6. Андрейченко Д. К., Андрейченко К. П. К теории комбинированных динамических систем // Изв. РАН. Теория и системы управления. 2000. № 3. С. 54-69.

7. Андрейченко Д. К., Андрейченко К. П. Моделирование, анализ и синтез комбинированных динамических систем : учеб. пособие. Саратов : ООО «ИД «Райт-Экспо», 2013. 144 с.

8. Портенко М. С., Мельничук Д. В., Андрейченко Д. К. Условия аналитичности характеристического и возмущающих квазимногочленов комбинированных динамических систем // Изв. Сарат. ун-та. Нов. сер. Сер. Математика. Механика. Информатика. 2016. Т. 16, вып. 2. С. 208-217. DOI: https://doi.org/10.18500/1816-9791-2016-16-2-208-217

9. Андрейченко К. П., Никишов Д. А., Жадаев Ф. М. Синтез передаточной функции нейронной сети в нейросетевом управляющем модуле // Докл. Академии военных наук. 2016. № 2(70). С. 13-15.

10. Андрейченко Д. К., Андрейченко К. П., Комарова М. С. Выбор оптимальных параметров комбинированных динамических систем // Изв. Сарат. ун-та. Нов. сер. Сер. Математика. Механика. Информатика. 2013. Т. 13, вып. 1, ч. 2. С. 7-11

11. Андрейченко Д. К., Андрейченко К. П., Комарова М. С. Выбор параметров систем и динамический анализ газореактивных систем стабилизации с упругими стержнями// Изв. РАН. Теория и системы управления. 2012. № 4. С. 101-114.

12. Андрейченко Д. К., Андрейченко К. П., Кононов В. В. Параллельный алгоритм вычисления оптимальных параметров одноканальной системы угловой стабилизации// Изв. Сарат. ун-та. Нов. сер. Сер. Математика. Механика. Информатика. 2013. Т. 13, вып. 4, ч. 1. С. 109-117.

13. Андрейченко Д. К., Андрейченко К. П., Мельничук Д. В., Портенко М. С. Адаптивный алгоритм параметрического синтеза комбинированных динамических систем// Изв. Са-рат. ун-та. Нов. сер. Сер. Математика. Механика. Информатика. 2016. Т. 16, вып. 4. С. 465-475. DOI: https://doi.org/10.18500/1816-9791-2016-16-4-465-475

14. Андрейченко Д. К., Андрейченко К. П., Кононов В. В. Параллельный алгоритм параметрического синтеза системы угловой стабилизации вращающегося упругого стержня под действием продольного ускорения// Изв. РАН. Теория и системы управления. 2017. № 2. С. 22-37.

15. Robitaille B., Marcos B., Veillette M., Payre G. Quasi-Newton methods for training neural networks // WIT Transactions on Information and Communications Technologies. 1993. Vol. 2. P. 323-335. DOI: https://doi.org/10.2495/AIENG930242

Образец для цитирования:

Андрейченко Д. К., Жадаев Ф. М. Обучение нейросетевых регуляторов для стабилизации комбинированных динамических систем // Изв. Сарат. ун-та. Нов. сер. Сер. Математика. Механика. Информатика. 2018. Т. 18, вып. 3. С. 354-360. 001: https://doi.org/10.18500/1816-9791-2018-18-3-354-360

Learning Neural Network Controllers for Stabilizing Hybrid Dynamic Systems

D. K. Andreichenko, F. M. Zhadaev

Dmitrii K. Andreichenko, https://orcid.org/0000-0003-0525-984X, Saratov State University, 83, Astrakhan-skaya Str., Saratov, 410012, Russia, kp_andreichenko@renet.ru

Fedor M. Zhadaev, https://orcid.org/0000-0002-2609-8590, Saratov State University, 83, Astrakhanskaya Str., Saratov, 410012, Russia, ZhadaevFM@gmail.com

Control modules based on artificial neural networks (NN) are often used for controlling objects with lumped parameters. Controled objects in such systems have finite set of natural oscillation frequencies. Thereby applying NN-based controllers after setting appropriate internal parameters (learning) minimize or fully exclude probability of appearing unstable natural oscillation frequencies for a long period of time. On the other hand if the controlled object includes objects with distributed parameters (such as elastic rods) the number of its natural oscillation frequencies is at least countable infinite. Thus, for using NN-based controlers for such systems additional check of stability is needed. In case of using classic controllers (such as PID-controller) stability is guarantied by choosing internal parameters of controller from the area of stability of the system. Such approach is not applyable for NN-based controllers since their parameters are determed during the learning process. This article develops the rule which guaranties that after the learning process set of NN weights will belong to the area of stability of the system. That rule in fact appears as modification of loss function and does not apply valuable limitations on choosing a learning method. The obtained results could be used in cases of controlling hybrid dynamic systems with help of control modules based on feedforward neural networks.

Key words: dynamic systems, hybrid dynamic systems, neural networks, control. References

1. Luoren L., Jinling L. Research of PID Control Algorithm Based on Neural Network. Energy Procedia, 2011, vol. 13, pp. 6988-6993.

2. MacKunis W., Leve F., Patre P. M., Fitz-Coy N., Dixon W. E. Adaptive neural network-based satellite attitude control in the presence of CMG uncertainty. Aerospace Science and Technology, 2016, no. 54, pp. 218-228.

3. Ajorkar A., Fazlyab A., Saberi F. F., Kabganian M. Design of an Adaptive-Neural Network Attitude Controller of a Satellite using Reaction Wheels. JACM, 2014, vol. 1, iss. 2. P. 6773. DOI: https://doi.org/10.22055/jacm.2014.10757

4. MacKunis W., Dupree K., Bhasin S., Dixon W. E. Adaptive neural network satellite attitude control in the presence of inertia and CMG actuator uncertainties. 2008 American Control Conference, 2008, pp. 2975-2980. DOI: https://doi.org/10.1109/ACC.2008.4586948

5. Sivaprakash N., Shanmugam J. Neural network based three axis satellite attitude control using only magnetic torquers. 24th Digital Avionics Systems Conference, 2005, vol. 2, pp. 6. DOI: https://doi.org/10.1109/DASC.2005.1563440

6. Andreichenko D. K., Andreichenko K. P. On the theory of hybrid dynamical systems. J. Comput. Syst. Sci. Int., 2000, vol. 39, no. 3, pp. 383-398.

7. Andreichenko D. K., Andreichenko K. P. Modelirovanie, analiz i sintez kombinirovan-nykh dinamicheskikh sistem : ucheb. posobie. [Modeling, analysis and synthesis of hybrid dynamic systems : Schoolbook]. Saratov, OOO "ID "Rait-Ekspo" [Publ. House "Write-Expo"], 2013. 144 p. (in Russian).

8. Portenko M. S., Melnichuk D. V., Andreichenko D. K. Analyticity conditions of characteristic and disturbing quasipolynomials of hybrid dynamical systems. Izv. Saratov Univ. (N. S.), Ser. Math. Mech. Inform2016, vol. 16, iss. 2, pp. 208-217 (in Russian). DOI: https://doi.org/10.18500/1816-9791-2016-16-2-208-217

9. Andreichenko K. P., Nikishov D. A., Zhadaev F. M. The Synthesis of Transfer Function of Neural Network in NN Control Module. Reports of Military Sciences Academy, 2016, no. 2(70), pp. 13-15 (in Russian).

10. Andreichenko D. K., Andreichenko K. P., Komarova M. S. The Choice of Optimal Parameters for Combined Dynamical Systems. Izv. Saratov Univ. (N. S.), Ser. Math. Mech. Inform., 2013, vol. 13, iss. 1, pt. 2, pp. 7-11 (in Russian).

11. Andreichenko D. K., Andreichenko K. P., Komarova M. S. Parameter Selection and Dynamic Analysis of Gas Jet Stabilization Systems with Elastic Rods. J. Comput. Syst. Sci. Int., 2012, vol. 51, no. 4, pp. 573-586. DOI: https://doi.org/10.1134/S1064230712030021

12. Andreichenko D. K., Andreichenko K. P., Kononov V. V. Parallel Algorithm of Optimal Parameters Calculation for the Single Channel Angular Stabilization System. Izv. Saratov Univ. (N.S.), Ser. Math. Mesh. Inform., 2013, vol. 13, iss. 4, pt. 1, pp. 109-117 (in Russian).

13. Andreichenko D. K., Andreichenko K. P., Melnichuk D. V., Portenko M. S. Adaptive Algorithm of Parametric Synthesis of Hybrid Dynamical Systems. Izv. Saratov Univ. (N.S.), Ser. Math. Mesh. Inform., 2016, vol. 16, iss. 4, pp. 465-475 (in Russian). DOI: https://doi.org/10.18500/1816-9791-2016-16-4-465-475

14. Andreichenko D. K., Andreichenko K. P., Kononov V. V. A Parallel Algorithm for the Parametric Synthesis of a System for the Angular Stabilization of a Rotating Elastic Beam under the Action of Longitudinal Acceleration. J. Comput. Syst. Sci. Int., 2017, vol. 56, no. 2, pp. 192-207. DOI: https://doi.org/10.1134/S1064230717020034

15. Robitaille B., Marcos B., Veillette M., Payre G. Quasi-Newton methods for training neural networks. WIT Transactions on Information and Communications Technologies, 1993, vol. 2, pp. 323-335. DOI: https://doi.org/10.2495/AIENG930242

Cite this article as:

Andreichenko D. K., Zhadaev F. M. Learning Neural Network Controllers for Stabilizing Hybrid Dynamic Systems. Izv. Saratov Univ. (N.S.), Ser. Math. Mech. Inform., 2018, vol. 18, iss. 3, pp. 354-360 (in Russian). DOI: https://doi.org/10.18500/1816-9791-2018-18-3-354-360

i Надоели баннеры? Вы всегда можете отключить рекламу.