МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМ КОМПЛЕКСОМ В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ

Царькова Е.Г.

Математическая модель искусственной нейронной сети для управления робототехническим комплексом в экстремальных условиях

Е.Г. Царъкова

Федеральное казенное учреждение «Научно-исследовательский институт Федеральной службы исполнения наказаний», НИЦ-1, Москва

Аннотация: В работе исследуется математическая модель искусственной нейронной сети с запаздыванием в аргументах функций состояния и управления, предназначенной для управления робототехническим комплексом при проведении аварийно-спасательных операций в экстремальных условиях. Процесс обучения рассматриваемой искусственной нейронной сети описан задачей оптимального управления с запаздыванием. С использованием принципа максимума Понтрягина и метода быстрого автоматического дифференцирования разработан метод решения полученной задачи оптимального управления. Приведены результаты работы программного средства, при создании которого использован алгоритм построения приближенного оптимального управления рассматриваемой задачи.

Ключевые слова: аварийно-спасательные работы, искусственная нейронная сеть, нейроуправление, робототехника, принцип максимума, безопасность.

Сегодня успехи в развитии отечественной робототехники обеспечивают возможность использования робототехнических комплексов (РК) в проведении аварийно-спасательных работ и в пожаротушении. Разработка и внедрение в практическую деятельность спасательных служб автоматизированных комплексов, позволяющих снизить риск гибели людей при проведении спасательных мероприятий в экстремальных условиях, является перспективным направлением современных научных исследований. Актуальность разработки таких систем, в том числе, продиктована растущим уровнем террористических угроз, реализация которых на крупных производственных, химически и радиационно опасных объектах может приводить к техногенных авариям и катастрофам с непредсказуемыми последствиями. В связи с этим целесообразна разработка моделей и алгоритмов управления робототехническими системами, предназначенными для использования спасательными службами при ликвидации чрезвычайных ситуаций на важных объектах. К таким объектам может быть отнесен ряд

производственных и иных объектов уголовно-исполнительной системы Российской Федерации, характеризующихся большим скоплением людей и существованием высокого уровня криминогенных угроз.

Для разработки роботизированных комплексов эффективно применение искусственных нейронных сетей (ИНС). В работе рассматривается построение нейросетевой модели управления роботизированным спасательным комплексом, предназначенным для проведения аварийно-спасательных работ в экстремальных условиях.

За последние десятилетия искусственные нейронные сети активно внедряются в различные сферы деятельности человека, в том числе, для создания робототехнических систем и транспортных средств с автоматическим управлением. Так, в [1] приводится пример применения ИНС при создании адаптивного нейроконтроллера со свойствами ПИД-регулятора; согласно [2] ИНС могут быть использованы при прогнозировании состояния инженерно-технических средств охраны и в транспортных системах; в [3] отмечается целесообразность применения ИНС в организации систем физической защиты объектов особой важности; в [4] рассматривается возможность применения нейросетевого подхода к оценке надежности локальных компьютерных сетей. Подобные технические комплексы находят широкие перспективы применения в разработке систем поддержки принятия решений при работе в экстремальных условиях [5]. При этом наиболее перспективными для применения в сложных технических системах являются динамические нейронные сети, обладающие способностью, в отличие от статических ИНС, адаптировать свою структуру и параметры к входным данным за счет процесса обучения. Данное свойство ИНС обеспечивают преимущество их применения в сравнении со статическими моделями. В моделировании процессов управления сложными техническими системами необходим учет запаздываний [3]. Данный факт

приводит к необходимости рассмотрения ИНС с нетривиальной архитектурой. Согласно предлагаемому подходу для обучения таких нейронных сетей требуется осуществить поиск решения задачи оптимального управления (ЗОУ) с запаздыванием [6]. В исследовании рассматриваются запаздывания в функциях состояния и управления, используемых для построения нейросетевой модели управления робототехническим комплексом с обратной связью, что обеспечивает возможность уточнения модели, а также служит разработке численного алгоритма построения оптимального управления системой. Указанные выше факторы обуславливают новизну, актуальность и практическую значимость исследования.

Рассмотрим математическую модель ИНС, использующуюся для объезда препятствий при управлении передвижением РК, имеющего дифференциальный привод колес. Автоматическое расстояние до препятствия обеспечивает возможность установления соответствующей скорости и направления дальнейшего движения РК, при этом скорости левого и правого привода для передвижения комплекса в необходимом направлении зависит от входных параметров - расположения препятствий и значения коэффициента ускорения. Для описания соответствующей ИНС, содержащей N нейронов, используется нелинейная система дифференциальных уравнений (ДУ) второго порядка с запаздыванием [4]:

х, (0 + * (1 - Д V (0) + V,2*, (0 = щ (0 + 2 ^ (0 (/ - А,) - х, (/)), / = 1, * е [О, Т]. (1}

1=1

С учетом обозначений: ^ (0 = ^(0, =

уравнение (1) перепишется в виде системы ДУ первого порядка следующего вида:

(О = у (О , ] = Г е [0, Т], (2)

и

г

у (0 = -УГХ, (0 - £ (1 - Длу(Г)) + щ (0 + X МЛ (0 (Г -и.)- у. (0

7=1 V

Учитываются условия, которым должны удовлетворять функции состояния и управления на начальном отрезке времени:

X(0) = аг,X(г) = Щ(г), , = Щг е[-шах{^},0], (3)

щ (г) = щ (г), , = 1, ы, г е [-шах^ }, 0], где ),щ (г) - заданные функции.

Вводятся следующие ограничения на управляющие воздействия:

Щ (г )| < Б, (г )| < С. (4)

В введенных соотношениях х (г) определяет амплитуду колебаний /-го

нейрона в момент времени у (г) выражает скорость изменения амплитуды колебаний /-го нейрона; N - количество нейронов сети; Т - заданное время протекания процесса; - коэффициенты, которые характеризуют

общее воздействие на /-ый нейрон всего ансамбля нейронов. В модель вводятся весовые коэффициенты ^ (г), ,, 7 = 1, N, а также функции управления

и (г),, = 1, N, характеризующие величину внешнего воздействия на ансамбль нейронов. Полученная ЗОУ с запаздывающим аргументом принимает следующий вид. Требуется минимизировать функционал:

I (и) = м| / (г, х(г), и(г), w(г)) Жг + М3 Ф( х(Т)) ^ м (5)

0

при заданных ограничениях (2) - (4). Здесь константы М, М з играют роль весовых коэффициентов. Необходимо осуществить построение оптимального процесса, минимизирующего функционал (5) при заданных ограничениях

NN N

(2) - (4). Пусть /0 (г, х(г), и(г), w(г)) = Мх £ щ2 (г) + М2 £ ^2 (г), Фх(Т)) = £ (X (Т) - А )2.

Целевой функционал принимает следующий вид:

,=1

и

Т ( Ы Ы Л Ы (6)

I(и) =ПмX^(0 + М2 X Ж + М3(Т) -4)2 ^ 1ПГ .

о V г=1 '•■'=1 У г=1

Для полученной задачи минимизации рассматриваемого функционала применяются необходимые условия оптимальности в форме принципа максимума Понтрягина [7, 8]. Функция Понтрягина для рассматриваемой задачи примет следующий вид:

N N N

Н (Яо, Л, У, г, ), Ч(*), и, w) = -ХМх X и,2 (*) - Л0М2 X (*) + X Рг (*)У +

1=1

¿,./=1

г=1

+X Ъ (*) - (Уг )2 Хг - ^ (1 - ДХг' ) + ^ + X ^ I ~ У<

¿г V ■'=1 ^

Здесь г (*) = У (* -^),г,' = * е[0,Т], введенные функции р^), q(t) являются

сопряженными функциями, удовлетворяющими системе ДУ с опережающим аргументом. При этом условие максимума примет вид:

' N N Л N

-Яо Мх X и2 (*) + М2 X ^г,2 (*) + X Р, (*)Уг +

V г,'=1 г,./=1 У г=1

N ^ N / лЛ

+X Ъ (*) -Уг2Л - ^ (! - 2 ) + иг + X ^ I ~ У<

'=1

У

N — N _

X Рг (*)Уг ^ Ч, (*) (-уг2 Лг - * (1 - Д Л2 )) + ШаХие[/

г=1 г=1

N N

-ДоМ1 X и2(*)+X ч)и

г,/=1

+ шах,.

N N N _ _ .

ЯМгX^г,2(*) + X X(V(г/ -Уг))

г=1 '=1

Для построения приближенного численного решения строим дискретную ЗОУ (ДЗОУ) с использованием равномерного разбиения интервала [0,Т] q точками. Для аппроксимации интеграла применяем правило левых прямоугольников, систему ДУ аппроксимируем по схеме Эйлера. Получаем ДЗОУ следующего вида:

( N

I (и, w) = М X(uг) +М2 X( ^ ) А* +М2Ф(хч) ^ 1пГ ,

I г=1 , )

х'+1 = х'+Ау' , г=, I = 14,

(7)

(8)

и

УГ = у! [-{у1 )2 *i -ß (xl )2) +u/+ j - yi )j:

(9)

X,0 = a, у/ =щ', I e[-maxty},0],|u/| < Bt. (10)

В соотношениях (7) - (10) индекс i = 1, Ж обозначает номер координаты вектора, индекс I = 1, q определяет номер нейронного слоя. Для решения ДЗОУ используем метод быстрого автоматического дифференцирования (БАД) [1, 7, 9]. Для реализации реализующего метод градиентного спуска вычислительного алгоритма, построенного с учетом полученных соотношений и метода БАД, автором разработано программное средство в среде IDE Lazarus. Схема алгоритма приведена на рис. 1.

Рис. 1. - Схема вычислительного алгоритма

При заданных значениях штрафных коэффициентов М,М2,М3 и параметров задачи программой выполнено 13946 итераций. Полученные результаты приведены на рис. 2 - 4.

Рис. 2. - Графики функций состояния

-еч-1-1-1-I-,

а 5вЗг 1558 6 Н».4 2НЫ2 45Э5

Рис. 3. - Графики управляющих воздействий

ин-т Тйш>1 | №«1 Тйш>|1 Тйш Щ Р 0 1кв-т>л-«*-л Гр*эна Ж V и Г ____. Г

В Ст^тл. 1Г. ш

1-1

Л1/ з,Ы Ш У. и I 1лИ\ к 1 Г Т . 1 * лЛ/1 А /А/ЯУ. .1

у и \1/ рОА/ 1/ ^ ^ 1) \ / V V \у

й ала 10Й.6 23«. 2 41е»

Рис. 4. - Графики значений весовых коэффициентов

и

На рис. 2 приведены графики трех нейронов, участвующих в построении модели (х0 (*), х(*), х2(*)). Графики, представленные на рис. 3, отражают изменение функций управления и0 (*), щ (*), и2 (*). На рис. 4 приведены графики управлений ^ (*), г = 0,2,' = 0,2. Критерием останова в работе алгоритма служит достижение допустимой величины ошибки обучения ег = 0,08 либо выполнение максимально допустимого количества выполненных итераций = 15000. Ключевой особенностью разработанного алгоритма является возможность его применения для моделирования ИНС, динамика которых описывается системой ДУ с запаздываниями.

Обозначим через Хр, Ур координаты РТК, через Уж ,УВЬ линейные

скорости, соответствующие левому и правому приводу, полученные с использованием обученной ИНС. Пусть далее обозначают ширину и угол поворота, выполняемого РТК, [ Х0, У0 ] - координаты начального положения РТК. Тогда координаты РТК в каждый момент времени заданного временного интервала могут быть вычислены с учетом системы дифференциальных уравнений:

1"вв lo1„W4_ у

о,

(11)

х (t) = \ т BL sin6> + X(

fp (0 = cos в + 70, t е [0, Т].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Построенная математическая модель ИНС может быть использована для создания автопилотируемых РТК, предназначенных для проведения аварийно-спасательных работ в экстремальных условиях. В силу гибкости, устойчивости и возможности адаптации к внешним условиям ИНС позволяют решать задачи управления сложными техническими системами в широком диапазоне параметров [10].

Литература

1. Шанин Д.А., Чикин В.В. Нейросетевой адаптивный контроллер для задачи управления объектом с неизвестной структурой посредством глобальной обратной связи // Инженерный вестник Дона, 2008, № 2.

URL: ivdon.ru/ru/magazine/archive/n2y2008/60.

2. Душкин А.В., Цветков В.В. Вопросы моделирования состояний инженерно-технических средств охраны и надзора // Вестник Воронежского института ФСИН России, 2014, №3, с. 28-31.

3. Сумин В.И., Чураков Д.Ю., Царькова Е.Г. Разработка моделей и алгоритмов информационных структур и процессов объектов особой важности // Промышленные АСУ и контроллеры, 2019, № 4. С. 30-39.

4. Каяшев А.И., Рахман П.А., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ. 2013. №5, с. 140-149.

5. Омельченко В.В. Информационное обеспечение системы государственного управления национальными ресурсами: риск-ориентированный подход // Правовая информатика, 2019, № 1. С. 4-17.

6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Technical Diagnostics of Equipment Using Data Mining Technologies // Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. Pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.

7. Игнатьева О.В. Архитектурные приемы при разработке программного обеспечения, зависимого от интерфейса пользователя // Инженерный вестник Дона, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.

8. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972.

55 с.

9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. An improved method for predicting the evolution of the characteristic parameters of an information system // Journal of Physics: Conference Series, Vol. 973, № 1, 2018. P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.

10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.

References

1. SHanin D.A., CHikin V.V. Inzhenernyj vestnik Dona, 2008, №2. URL: ivdon.ru/ru/magazine/archive/n2y2008/60.

2. Dushkin A.V., Cvetkov V.V. Vestnik Voronezhskogo instituta FSIN Rossii, 2014, №3, pp.28-31.

3. Sumin V.I., CHurakov D.YU., Car'kova E.G. Promyshlennye ASU i kontrollery, 2019, № 4. pp. 30-39.

4. Kayashev A. I., Rahman P. A., SHaripov M. I. Vestnik UGATU, 2013, №5, pp. 140-149.

5. Omel'chenko V.V. Pravovaya informatika, 2019, № 1. pp. 4-17. URL: ivdon.ru/uploads/article/pdf/IVD_86_Akolzin.pdf_2394.pdf.

6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.

7. Ignat'eva O.V. Inzhenernyj vestnik Dona, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.

8. Ventcel' E.S. Issledovanie operacij [Operations research]. M.: Sovetskoe radio, 1972. 55 p.

9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. Journal of Physics: Conference Series. 2018, P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.

10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Царькова Е.Г.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Царькова Е.Г.

MATHEMATICAL MODEL OF AN ARTIFICIAL NEURAL NETWORK FOR CONTROLLING A ROBOTIC COMPLEX IN EXTREME CONDITIONS

Текст научной работы на тему «МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМ КОМПЛЕКСОМ В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ»