Научная статья на тему 'МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМ КОМПЛЕКСОМ В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ'

МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМ КОМПЛЕКСОМ В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
18
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВАРИЙНО-СПАСАТЕЛЬНЫЕ РАБОТЫ / ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ / НЕЙРОУПРАВЛЕНИЕ / РОБОТОТЕХНИКА / ПРИНЦИП МАКСИМУМА / БЕЗОПАСНОСТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Царькова Е.Г.

В работе рассматривается математическая модель искусственной нейронной сети с запаздыванием в аргументах функций состояния и управления, предназначенной для управления робототехническим комплексом при проведении аварийно-спасательных операций в экстремальных условиях. Процесс обучения рассматриваемой искусственной нейронной сети описан задачей оптимального управления с запаздыванием. С использованием принципа максимума Понтрягина и метода быстрого автоматического дифференцирования разработан метод решения полученной задачи оптимального управления. Приведены результаты работы программного средства, при создании которого использован алгоритм построения приближенного оптимального управления рассматриваемой задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Царькова Е.Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MATHEMATICAL MODEL OF AN ARTIFICIAL NEURAL NETWORK FOR CONTROLLING A ROBOTIC COMPLEX IN EXTREME CONDITIONS

The paper considers a mathematical model of an artificial neural network with a delay in the arguments of the state and control functions, designed to control a robotic complex during emergency rescue operations in extreme conditions. The learning process of the considered artificial neural network is described by the problem of optimal control with a delay. Using the Pontryagin maximum principle and the method of rapid automatic differentiation, a method for solving the resulting optimal control problem has been developed. The results of the work of the software tool, the creation of which uses an algorithm for constructing an approximate optimal control of the problem under consideration.

Текст научной работы на тему «МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ ДЛЯ УПРАВЛЕНИЯ РОБОТОТЕХНИЧЕСКИМ КОМПЛЕКСОМ В ЭКСТРЕМАЛЬНЫХ УСЛОВИЯХ»

Математическая модель искусственной нейронной сети для управления робототехническим комплексом в экстремальных условиях

Е.Г. Царъкова

Федеральное казенное учреждение «Научно-исследовательский институт Федеральной службы исполнения наказаний», НИЦ-1, Москва

Аннотация: В работе исследуется математическая модель искусственной нейронной сети с запаздыванием в аргументах функций состояния и управления, предназначенной для управления робототехническим комплексом при проведении аварийно-спасательных операций в экстремальных условиях. Процесс обучения рассматриваемой искусственной нейронной сети описан задачей оптимального управления с запаздыванием. С использованием принципа максимума Понтрягина и метода быстрого автоматического дифференцирования разработан метод решения полученной задачи оптимального управления. Приведены результаты работы программного средства, при создании которого использован алгоритм построения приближенного оптимального управления рассматриваемой задачи.

Ключевые слова: аварийно-спасательные работы, искусственная нейронная сеть, нейроуправление, робототехника, принцип максимума, безопасность.

Сегодня успехи в развитии отечественной робототехники обеспечивают возможность использования робототехнических комплексов (РК) в проведении аварийно-спасательных работ и в пожаротушении. Разработка и внедрение в практическую деятельность спасательных служб автоматизированных комплексов, позволяющих снизить риск гибели людей при проведении спасательных мероприятий в экстремальных условиях, является перспективным направлением современных научных исследований. Актуальность разработки таких систем, в том числе, продиктована растущим уровнем террористических угроз, реализация которых на крупных производственных, химически и радиационно опасных объектах может приводить к техногенных авариям и катастрофам с непредсказуемыми последствиями. В связи с этим целесообразна разработка моделей и алгоритмов управления робототехническими системами, предназначенными для использования спасательными службами при ликвидации чрезвычайных ситуаций на важных объектах. К таким объектам может быть отнесен ряд

производственных и иных объектов уголовно-исполнительной системы Российской Федерации, характеризующихся большим скоплением людей и существованием высокого уровня криминогенных угроз.

Для разработки роботизированных комплексов эффективно применение искусственных нейронных сетей (ИНС). В работе рассматривается построение нейросетевой модели управления роботизированным спасательным комплексом, предназначенным для проведения аварийно-спасательных работ в экстремальных условиях.

За последние десятилетия искусственные нейронные сети активно внедряются в различные сферы деятельности человека, в том числе, для создания робототехнических систем и транспортных средств с автоматическим управлением. Так, в [1] приводится пример применения ИНС при создании адаптивного нейроконтроллера со свойствами ПИД-регулятора; согласно [2] ИНС могут быть использованы при прогнозировании состояния инженерно-технических средств охраны и в транспортных системах; в [3] отмечается целесообразность применения ИНС в организации систем физической защиты объектов особой важности; в [4] рассматривается возможность применения нейросетевого подхода к оценке надежности локальных компьютерных сетей. Подобные технические комплексы находят широкие перспективы применения в разработке систем поддержки принятия решений при работе в экстремальных условиях [5]. При этом наиболее перспективными для применения в сложных технических системах являются динамические нейронные сети, обладающие способностью, в отличие от статических ИНС, адаптировать свою структуру и параметры к входным данным за счет процесса обучения. Данное свойство ИНС обеспечивают преимущество их применения в сравнении со статическими моделями. В моделировании процессов управления сложными техническими системами необходим учет запаздываний [3]. Данный факт

приводит к необходимости рассмотрения ИНС с нетривиальной архитектурой. Согласно предлагаемому подходу для обучения таких нейронных сетей требуется осуществить поиск решения задачи оптимального управления (ЗОУ) с запаздыванием [6]. В исследовании рассматриваются запаздывания в функциях состояния и управления, используемых для построения нейросетевой модели управления робототехническим комплексом с обратной связью, что обеспечивает возможность уточнения модели, а также служит разработке численного алгоритма построения оптимального управления системой. Указанные выше факторы обуславливают новизну, актуальность и практическую значимость исследования.

Рассмотрим математическую модель ИНС, использующуюся для объезда препятствий при управлении передвижением РК, имеющего дифференциальный привод колес. Автоматическое расстояние до препятствия обеспечивает возможность установления соответствующей скорости и направления дальнейшего движения РК, при этом скорости левого и правого привода для передвижения комплекса в необходимом направлении зависит от входных параметров - расположения препятствий и значения коэффициента ускорения. Для описания соответствующей ИНС, содержащей N нейронов, используется нелинейная система дифференциальных уравнений (ДУ) второго порядка с запаздыванием [4]:

х, (0 + * (1 - Д V (0) + V,2*, (0 = щ (0 + 2 ^ (0 (/ - А,) - х, (/)), / = 1, * е [О, Т]. (1}

1=1

С учетом обозначений: ^ (0 = ^(0, =

уравнение (1) перепишется в виде системы ДУ первого порядка следующего вида:

(О = у (О , ] = Г е [0, Т], (2)

и

г

у (0 = -УГХ, (0 - £ (1 - Длу(Г)) + щ (0 + X МЛ (0 (Г -и.)- у. (0

7=1 V

Учитываются условия, которым должны удовлетворять функции состояния и управления на начальном отрезке времени:

X(0) = аг,X(г) = Щ(г), , = Щг е[-шах{^},0], (3)

щ (г) = щ (г), , = 1, ы, г е [-шах^ }, 0], где ),щ (г) - заданные функции.

Вводятся следующие ограничения на управляющие воздействия:

Щ (г )| < Б, (г )| < С. (4)

В введенных соотношениях х (г) определяет амплитуду колебаний /-го

нейрона в момент времени у (г) выражает скорость изменения амплитуды колебаний /-го нейрона; N - количество нейронов сети; Т - заданное время протекания процесса; - коэффициенты, которые характеризуют

общее воздействие на /-ый нейрон всего ансамбля нейронов. В модель вводятся весовые коэффициенты ^ (г), ,, 7 = 1, N, а также функции управления

и (г),, = 1, N, характеризующие величину внешнего воздействия на ансамбль нейронов. Полученная ЗОУ с запаздывающим аргументом принимает следующий вид. Требуется минимизировать функционал:

I (и) = м| / (г, х(г), и(г), w(г)) Жг + М3 Ф( х(Т)) ^ м (5)

0

при заданных ограничениях (2) - (4). Здесь константы М, М з играют роль весовых коэффициентов. Необходимо осуществить построение оптимального процесса, минимизирующего функционал (5) при заданных ограничениях

NN N

(2) - (4). Пусть /0 (г, х(г), и(г), w(г)) = Мх £ щ2 (г) + М2 £ ^2 (г), Фх(Т)) = £ (X (Т) - А )2.

Целевой функционал принимает следующий вид:

,=1

и

Т ( Ы Ы Л Ы (6)

I(и) =ПмX^(0 + М2 X Ж + М3(Т) -4)2 ^ 1ПГ .

о V г=1 '•■'=1 У г=1

Для полученной задачи минимизации рассматриваемого функционала применяются необходимые условия оптимальности в форме принципа максимума Понтрягина [7, 8]. Функция Понтрягина для рассматриваемой задачи примет следующий вид:

N N N

Н (Яо, Л, У, г, ), Ч(*), и, w) = -ХМх X и,2 (*) - Л0М2 X (*) + X Рг (*)У +

1=1

¿,./=1

г=1

+X Ъ (*) - (Уг )2 Хг - ^ (1 - ДХг' ) + ^ + X ^ I ~ У<

¿г V ■'=1 ^

Здесь г (*) = У (* -^),г,' = * е[0,Т], введенные функции р^), q(t) являются

сопряженными функциями, удовлетворяющими системе ДУ с опережающим аргументом. При этом условие максимума примет вид:

' N N Л N

-Яо Мх X и2 (*) + М2 X ^г,2 (*) + X Р, (*)Уг +

V г,'=1 г,./=1 У г=1

N ^ N / лЛ

+X Ъ (*) -Уг2Л - ^ (! - 2 ) + иг + X ^ I ~ У<

'=1

У

N — N _

X Рг (*)Уг ^ Ч, (*) (-уг2 Лг - * (1 - Д Л2 )) + ШаХие[/

г=1 г=1

N N

-ДоМ1 X и2(*)+X ч)и

г,/=1

+ шах,.

N N N _ _ .

ЯМгX^г,2(*) + X X(V(г/ -Уг))

г=1 '=1

Для построения приближенного численного решения строим дискретную ЗОУ (ДЗОУ) с использованием равномерного разбиения интервала [0,Т] q точками. Для аппроксимации интеграла применяем правило левых прямоугольников, систему ДУ аппроксимируем по схеме Эйлера. Получаем ДЗОУ следующего вида:

( N

I (и, w) = М X(uг) +М2 X( ^ ) А* +М2Ф(хч) ^ 1пГ ,

I г=1 , )

х'+1 = х'+Ау' , г=, I = 14,

(7)

(8)

и

УГ = у! [-{у1 )2 *i -ß (xl )2) +u/+ j - yi )j:

(9)

X,0 = a, у/ =щ', I e[-maxty},0],|u/| < Bt. (10)

В соотношениях (7) - (10) индекс i = 1, Ж обозначает номер координаты вектора, индекс I = 1, q определяет номер нейронного слоя. Для решения ДЗОУ используем метод быстрого автоматического дифференцирования (БАД) [1, 7, 9]. Для реализации реализующего метод градиентного спуска вычислительного алгоритма, построенного с учетом полученных соотношений и метода БАД, автором разработано программное средство в среде IDE Lazarus. Схема алгоритма приведена на рис. 1.

Рис. 1. - Схема вычислительного алгоритма

При заданных значениях штрафных коэффициентов М,М2,М3 и параметров задачи программой выполнено 13946 итераций. Полученные результаты приведены на рис. 2 - 4.

Рис. 2. - Графики функций состояния

-еч-1-1-1-I-,

а 5вЗг 1558 6 Н».4 2НЫ2 45Э5

Рис. 3. - Графики управляющих воздействий

ин-т Тйш>1 | №«1 Тйш>|1 Тйш Щ Р 0 1кв-т>л-«*-л Гр*эна Ж V и Г ____. Г

В Ст^тл. 1Г. ш

1-1

Л1/ з,Ы Ш У. и I 1лИ\ к 1 Г Т . 1 * лЛ/1 А /А/ЯУ. .1

у и \1/ рОА/ 1/ ^ ^ 1) \ / V V \у

й ала 10Й.6 23«. 2 41е»

Рис. 4. - Графики значений весовых коэффициентов

и

На рис. 2 приведены графики трех нейронов, участвующих в построении модели (х0 (*), х(*), х2(*)). Графики, представленные на рис. 3, отражают изменение функций управления и0 (*), щ (*), и2 (*). На рис. 4 приведены графики управлений ^ (*), г = 0,2,' = 0,2. Критерием останова в работе алгоритма служит достижение допустимой величины ошибки обучения ег = 0,08 либо выполнение максимально допустимого количества выполненных итераций = 15000. Ключевой особенностью разработанного алгоритма является возможность его применения для моделирования ИНС, динамика которых описывается системой ДУ с запаздываниями.

Обозначим через Хр, Ур координаты РТК, через Уж ,УВЬ линейные

скорости, соответствующие левому и правому приводу, полученные с использованием обученной ИНС. Пусть далее обозначают ширину и угол поворота, выполняемого РТК, [ Х0, У0 ] - координаты начального положения РТК. Тогда координаты РТК в каждый момент времени заданного временного интервала могут быть вычислены с учетом системы дифференциальных уравнений:

1"вв lo1„W4_ у

о,

(11)

х (t) = \ т BL sin6> + X(

fp (0 = cos в + 70, t е [0, Т].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Построенная математическая модель ИНС может быть использована для создания автопилотируемых РТК, предназначенных для проведения аварийно-спасательных работ в экстремальных условиях. В силу гибкости, устойчивости и возможности адаптации к внешним условиям ИНС позволяют решать задачи управления сложными техническими системами в широком диапазоне параметров [10].

Литература

1. Шанин Д.А., Чикин В.В. Нейросетевой адаптивный контроллер для задачи управления объектом с неизвестной структурой посредством глобальной обратной связи // Инженерный вестник Дона, 2008, № 2.

URL: ivdon.ru/ru/magazine/archive/n2y2008/60.

2. Душкин А.В., Цветков В.В. Вопросы моделирования состояний инженерно-технических средств охраны и надзора // Вестник Воронежского института ФСИН России, 2014, №3, с. 28-31.

3. Сумин В.И., Чураков Д.Ю., Царькова Е.Г. Разработка моделей и алгоритмов информационных структур и процессов объектов особой важности // Промышленные АСУ и контроллеры, 2019, № 4. С. 30-39.

4. Каяшев А.И., Рахман П.А., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ. 2013. №5, с. 140-149.

5. Омельченко В.В. Информационное обеспечение системы государственного управления национальными ресурсами: риск-ориентированный подход // Правовая информатика, 2019, № 1. С. 4-17.

6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Technical Diagnostics of Equipment Using Data Mining Technologies // Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. Pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.

7. Игнатьева О.В. Архитектурные приемы при разработке программного обеспечения, зависимого от интерфейса пользователя // Инженерный вестник Дона, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.

8. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972.

55 с.

9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. An improved method for predicting the evolution of the characteristic parameters of an information system // Journal of Physics: Conference Series, Vol. 973, № 1, 2018. P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.

10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.

References

1. SHanin D.A., CHikin V.V. Inzhenernyj vestnik Dona, 2008, №2. URL: ivdon.ru/ru/magazine/archive/n2y2008/60.

2. Dushkin A.V., Cvetkov V.V. Vestnik Voronezhskogo instituta FSIN Rossii, 2014, №3, pp.28-31.

3. Sumin V.I., CHurakov D.YU., Car'kova E.G. Promyshlennye ASU i kontrollery, 2019, № 4. pp. 30-39.

4. Kayashev A. I., Rahman P. A., SHaripov M. I. Vestnik UGATU, 2013, №5, pp. 140-149.

5. Omel'chenko V.V. Pravovaya informatika, 2019, № 1. pp. 4-17. URL: ivdon.ru/uploads/article/pdf/IVD_86_Akolzin.pdf_2394.pdf.

6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.

7. Ignat'eva O.V. Inzhenernyj vestnik Dona, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.

8. Ventcel' E.S. Issledovanie operacij [Operations research]. M.: Sovetskoe radio, 1972. 55 p.

9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. Journal of Physics: Conference Series. 2018, P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.

10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, № 1, 2021. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.

i Надоели баннеры? Вы всегда можете отключить рекламу.