Математическая модель искусственной нейронной сети для управления робототехническим комплексом в экстремальных условиях
Е.Г. Царъкова
Федеральное казенное учреждение «Научно-исследовательский институт Федеральной службы исполнения наказаний», НИЦ-1, Москва
Аннотация: В работе исследуется математическая модель искусственной нейронной сети с запаздыванием в аргументах функций состояния и управления, предназначенной для управления робототехническим комплексом при проведении аварийно-спасательных операций в экстремальных условиях. Процесс обучения рассматриваемой искусственной нейронной сети описан задачей оптимального управления с запаздыванием. С использованием принципа максимума Понтрягина и метода быстрого автоматического дифференцирования разработан метод решения полученной задачи оптимального управления. Приведены результаты работы программного средства, при создании которого использован алгоритм построения приближенного оптимального управления рассматриваемой задачи.
Ключевые слова: аварийно-спасательные работы, искусственная нейронная сеть, нейроуправление, робототехника, принцип максимума, безопасность.
Сегодня успехи в развитии отечественной робототехники обеспечивают возможность использования робототехнических комплексов (РК) в проведении аварийно-спасательных работ и в пожаротушении. Разработка и внедрение в практическую деятельность спасательных служб автоматизированных комплексов, позволяющих снизить риск гибели людей при проведении спасательных мероприятий в экстремальных условиях, является перспективным направлением современных научных исследований. Актуальность разработки таких систем, в том числе, продиктована растущим уровнем террористических угроз, реализация которых на крупных производственных, химически и радиационно опасных объектах может приводить к техногенных авариям и катастрофам с непредсказуемыми последствиями. В связи с этим целесообразна разработка моделей и алгоритмов управления робототехническими системами, предназначенными для использования спасательными службами при ликвидации чрезвычайных ситуаций на важных объектах. К таким объектам может быть отнесен ряд
производственных и иных объектов уголовно-исполнительной системы Российской Федерации, характеризующихся большим скоплением людей и существованием высокого уровня криминогенных угроз.
Для разработки роботизированных комплексов эффективно применение искусственных нейронных сетей (ИНС). В работе рассматривается построение нейросетевой модели управления роботизированным спасательным комплексом, предназначенным для проведения аварийно-спасательных работ в экстремальных условиях.
За последние десятилетия искусственные нейронные сети активно внедряются в различные сферы деятельности человека, в том числе, для создания робототехнических систем и транспортных средств с автоматическим управлением. Так, в [1] приводится пример применения ИНС при создании адаптивного нейроконтроллера со свойствами ПИД-регулятора; согласно [2] ИНС могут быть использованы при прогнозировании состояния инженерно-технических средств охраны и в транспортных системах; в [3] отмечается целесообразность применения ИНС в организации систем физической защиты объектов особой важности; в [4] рассматривается возможность применения нейросетевого подхода к оценке надежности локальных компьютерных сетей. Подобные технические комплексы находят широкие перспективы применения в разработке систем поддержки принятия решений при работе в экстремальных условиях [5]. При этом наиболее перспективными для применения в сложных технических системах являются динамические нейронные сети, обладающие способностью, в отличие от статических ИНС, адаптировать свою структуру и параметры к входным данным за счет процесса обучения. Данное свойство ИНС обеспечивают преимущество их применения в сравнении со статическими моделями. В моделировании процессов управления сложными техническими системами необходим учет запаздываний [3]. Данный факт
приводит к необходимости рассмотрения ИНС с нетривиальной архитектурой. Согласно предлагаемому подходу для обучения таких нейронных сетей требуется осуществить поиск решения задачи оптимального управления (ЗОУ) с запаздыванием [6]. В исследовании рассматриваются запаздывания в функциях состояния и управления, используемых для построения нейросетевой модели управления робототехническим комплексом с обратной связью, что обеспечивает возможность уточнения модели, а также служит разработке численного алгоритма построения оптимального управления системой. Указанные выше факторы обуславливают новизну, актуальность и практическую значимость исследования.
Рассмотрим математическую модель ИНС, использующуюся для объезда препятствий при управлении передвижением РК, имеющего дифференциальный привод колес. Автоматическое расстояние до препятствия обеспечивает возможность установления соответствующей скорости и направления дальнейшего движения РК, при этом скорости левого и правого привода для передвижения комплекса в необходимом направлении зависит от входных параметров - расположения препятствий и значения коэффициента ускорения. Для описания соответствующей ИНС, содержащей N нейронов, используется нелинейная система дифференциальных уравнений (ДУ) второго порядка с запаздыванием [4]:
х, (0 + * (1 - Д V (0) + V,2*, (0 = щ (0 + 2 ^ (0 (/ - А,) - х, (/)), / = 1, * е [О, Т]. (1}
1=1
С учетом обозначений: ^ (0 = ^(0, =
уравнение (1) перепишется в виде системы ДУ первого порядка следующего вида:
(О = у (О , ] = Г е [0, Т], (2)
и
г
у (0 = -УГХ, (0 - £ (1 - Длу(Г)) + щ (0 + X МЛ (0 (Г -и.)- у. (0
7=1 V
Учитываются условия, которым должны удовлетворять функции состояния и управления на начальном отрезке времени:
X(0) = аг,X(г) = Щ(г), , = Щг е[-шах{^},0], (3)
щ (г) = щ (г), , = 1, ы, г е [-шах^ }, 0], где ),щ (г) - заданные функции.
Вводятся следующие ограничения на управляющие воздействия:
Щ (г )| < Б, (г )| < С. (4)
В введенных соотношениях х (г) определяет амплитуду колебаний /-го
нейрона в момент времени у (г) выражает скорость изменения амплитуды колебаний /-го нейрона; N - количество нейронов сети; Т - заданное время протекания процесса; - коэффициенты, которые характеризуют
общее воздействие на /-ый нейрон всего ансамбля нейронов. В модель вводятся весовые коэффициенты ^ (г), ,, 7 = 1, N, а также функции управления
и (г),, = 1, N, характеризующие величину внешнего воздействия на ансамбль нейронов. Полученная ЗОУ с запаздывающим аргументом принимает следующий вид. Требуется минимизировать функционал:
I (и) = м| / (г, х(г), и(г), w(г)) Жг + М3 Ф( х(Т)) ^ м (5)
0
при заданных ограничениях (2) - (4). Здесь константы М, М з играют роль весовых коэффициентов. Необходимо осуществить построение оптимального процесса, минимизирующего функционал (5) при заданных ограничениях
NN N
(2) - (4). Пусть /0 (г, х(г), и(г), w(г)) = Мх £ щ2 (г) + М2 £ ^2 (г), Фх(Т)) = £ (X (Т) - А )2.
Целевой функционал принимает следующий вид:
,=1
и
Т ( Ы Ы Л Ы (6)
I(и) =ПмX^(0 + М2 X Ж + М3(Т) -4)2 ^ 1ПГ .
о V г=1 '•■'=1 У г=1
Для полученной задачи минимизации рассматриваемого функционала применяются необходимые условия оптимальности в форме принципа максимума Понтрягина [7, 8]. Функция Понтрягина для рассматриваемой задачи примет следующий вид:
N N N
Н (Яо, Л, У, г, ), Ч(*), и, w) = -ХМх X и,2 (*) - Л0М2 X (*) + X Рг (*)У +
1=1
¿,./=1
г=1
+X Ъ (*) - (Уг )2 Хг - ^ (1 - ДХг' ) + ^ + X ^ I ~ У<
¿г V ■'=1 ^
Здесь г (*) = У (* -^),г,' = * е[0,Т], введенные функции р^), q(t) являются
сопряженными функциями, удовлетворяющими системе ДУ с опережающим аргументом. При этом условие максимума примет вид:
' N N Л N
-Яо Мх X и2 (*) + М2 X ^г,2 (*) + X Р, (*)Уг +
V г,'=1 г,./=1 У г=1
N ^ N / лЛ
+X Ъ (*) -Уг2Л - ^ (! - 2 ) + иг + X ^ I ~ У<
'=1
У
N — N _
X Рг (*)Уг ^ Ч, (*) (-уг2 Лг - * (1 - Д Л2 )) + ШаХие[/
г=1 г=1
N N
-ДоМ1 X и2(*)+X ч)и
г,/=1
+ шах,.
N N N _ _ .
ЯМгX^г,2(*) + X X(V(г/ -Уг))
г=1 '=1
Для построения приближенного численного решения строим дискретную ЗОУ (ДЗОУ) с использованием равномерного разбиения интервала [0,Т] q точками. Для аппроксимации интеграла применяем правило левых прямоугольников, систему ДУ аппроксимируем по схеме Эйлера. Получаем ДЗОУ следующего вида:
( N
I (и, w) = М X(uг) +М2 X( ^ ) А* +М2Ф(хч) ^ 1пГ ,
I г=1 , )
х'+1 = х'+Ау' , г=, I = 14,
(7)
(8)
и
УГ = у! [-{у1 )2 *i -ß (xl )2) +u/+ j - yi )j:
(9)
X,0 = a, у/ =щ', I e[-maxty},0],|u/| < Bt. (10)
В соотношениях (7) - (10) индекс i = 1, Ж обозначает номер координаты вектора, индекс I = 1, q определяет номер нейронного слоя. Для решения ДЗОУ используем метод быстрого автоматического дифференцирования (БАД) [1, 7, 9]. Для реализации реализующего метод градиентного спуска вычислительного алгоритма, построенного с учетом полученных соотношений и метода БАД, автором разработано программное средство в среде IDE Lazarus. Схема алгоритма приведена на рис. 1.
Рис. 1. - Схема вычислительного алгоритма
При заданных значениях штрафных коэффициентов М,М2,М3 и параметров задачи программой выполнено 13946 итераций. Полученные результаты приведены на рис. 2 - 4.
Рис. 2. - Графики функций состояния
-еч-1-1-1-I-,
а 5вЗг 1558 6 Н».4 2НЫ2 45Э5
Рис. 3. - Графики управляющих воздействий
ин-т Тйш>1 | №«1 Тйш>|1 Тйш Щ Р 0 1кв-т>л-«*-л Гр*эна Ж V и Г ____. Г
В Ст^тл. 1Г. ш
1-1
Л1/ з,Ы Ш У. и I 1лИ\ к 1 Г Т . 1 * лЛ/1 А /А/ЯУ. .1
у и \1/ рОА/ 1/ ^ ^ 1) \ / V V \у
й ала 10Й.6 23«. 2 41е»
Рис. 4. - Графики значений весовых коэффициентов
и
На рис. 2 приведены графики трех нейронов, участвующих в построении модели (х0 (*), х(*), х2(*)). Графики, представленные на рис. 3, отражают изменение функций управления и0 (*), щ (*), и2 (*). На рис. 4 приведены графики управлений ^ (*), г = 0,2,' = 0,2. Критерием останова в работе алгоритма служит достижение допустимой величины ошибки обучения ег = 0,08 либо выполнение максимально допустимого количества выполненных итераций = 15000. Ключевой особенностью разработанного алгоритма является возможность его применения для моделирования ИНС, динамика которых описывается системой ДУ с запаздываниями.
Обозначим через Хр, Ур координаты РТК, через Уж ,УВЬ линейные
скорости, соответствующие левому и правому приводу, полученные с использованием обученной ИНС. Пусть далее обозначают ширину и угол поворота, выполняемого РТК, [ Х0, У0 ] - координаты начального положения РТК. Тогда координаты РТК в каждый момент времени заданного временного интервала могут быть вычислены с учетом системы дифференциальных уравнений:
1"вв lo1„W4_ у
о,
(11)
х (t) = \ т BL sin6> + X(
fp (0 = cos в + 70, t е [0, Т].
Построенная математическая модель ИНС может быть использована для создания автопилотируемых РТК, предназначенных для проведения аварийно-спасательных работ в экстремальных условиях. В силу гибкости, устойчивости и возможности адаптации к внешним условиям ИНС позволяют решать задачи управления сложными техническими системами в широком диапазоне параметров [10].
Литература
1. Шанин Д.А., Чикин В.В. Нейросетевой адаптивный контроллер для задачи управления объектом с неизвестной структурой посредством глобальной обратной связи // Инженерный вестник Дона, 2008, № 2.
URL: ivdon.ru/ru/magazine/archive/n2y2008/60.
2. Душкин А.В., Цветков В.В. Вопросы моделирования состояний инженерно-технических средств охраны и надзора // Вестник Воронежского института ФСИН России, 2014, №3, с. 28-31.
3. Сумин В.И., Чураков Д.Ю., Царькова Е.Г. Разработка моделей и алгоритмов информационных структур и процессов объектов особой важности // Промышленные АСУ и контроллеры, 2019, № 4. С. 30-39.
4. Каяшев А.И., Рахман П.А., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ. 2013. №5, с. 140-149.
5. Омельченко В.В. Информационное обеспечение системы государственного управления национальными ресурсами: риск-ориентированный подход // Правовая информатика, 2019, № 1. С. 4-17.
6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Technical Diagnostics of Equipment Using Data Mining Technologies // Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. Pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.
7. Игнатьева О.В. Архитектурные приемы при разработке программного обеспечения, зависимого от интерфейса пользователя // Инженерный вестник Дона, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.
8. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972.
55 с.
9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. An improved method for predicting the evolution of the characteristic parameters of an information system // Journal of Physics: Conference Series, Vol. 973, № 1, 2018. P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.
10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.
References
1. SHanin D.A., CHikin V.V. Inzhenernyj vestnik Dona, 2008, №2. URL: ivdon.ru/ru/magazine/archive/n2y2008/60.
2. Dushkin A.V., Cvetkov V.V. Vestnik Voronezhskogo instituta FSIN Rossii, 2014, №3, pp.28-31.
3. Sumin V.I., CHurakov D.YU., Car'kova E.G. Promyshlennye ASU i kontrollery, 2019, № 4. pp. 30-39.
4. Kayashev A. I., Rahman P. A., SHaripov M. I. Vestnik UGATU, 2013, №5, pp. 140-149.
5. Omel'chenko V.V. Pravovaya informatika, 2019, № 1. pp. 4-17. URL: ivdon.ru/uploads/article/pdf/IVD_86_Akolzin.pdf_2394.pdf.
6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.
7. Ignat'eva O.V. Inzhenernyj vestnik Dona, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.
8. Ventcel' E.S. Issledovanie operacij [Operations research]. M.: Sovetskoe radio, 1972. 55 p.
9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. Journal of Physics: Conference Series. 2018, P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.
10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.