Научная статья на тему 'Применение параллельных полумарковских цепей для моделирования процессов управления мобильными роботами'

Применение параллельных полумарковских цепей для моделирования процессов управления мобильными роботами Текст научной статьи по специальности «Математика»

CC BY
69
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛУМАРКОВСКИЙ ПРОЦЕСС / ВРЕМЕННЫЕ И ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ / ПАРАЛЛЕЛЬНЫЕ ПОЛУМАРКОВСКИЕ ЦЕПИ / ПАРАМЕТРЫ БЛУЖДАНИЯ / SEMI-MARKOV PROCESS / TEMPORAL AND PROBABILISTIC CHARACTERISTICS / PARALLEL SEMI-MARKOV CHAINS / WALK PARAMETERS

Аннотация научной статьи по математике, автор научной работы — Ларкин Евгений Васильевич, Привалов Александр Николаевич, Акименко Татьяна Алексеевна

Получены зависимости для решения поставленных задач с использованием формирования характеристической матрицы, возведения характеристической матрицы в степень, выделения матричного элемента и определения плотности распределения из характеристической функции. Формулы для прямого расчета математических ожиданий и дисперсий получены с использованием введенной операции свертки для числовых характеристик полумарковских матриц. Предложены алгоритм и система математических выражений для последовательного упрощения полумарковского процесса, что позволяет снизить вычислительную сложность анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF PARALLEL SEMI-MARKOV CHAINS FOR MODELING THE PROCESSES OF MANAGEMENT OF MOBILE ROBOTS

Dependencies are obtained for solving these problems using the formation of the characteristic matrix, raising the characteristic matrix to a power, isolating the matrix element and determining the distribution density from the characteristic function. Formulas for the direct calculation of mathematical expectations and variances are obtained using the introduced convolution operation for the numerical characteristics of semi-Markov matrices. An algorithm and a system of mathematical expressions are proposed for the sequential simplification of the semi-Markov process, which reduces the computational complexity of the analysis.

Текст научной работы на тему «Применение параллельных полумарковских цепей для моделирования процессов управления мобильными роботами»

СИСТЕМНЫЙ АНАЛИЗ, УПРАВЛЕНИЕ И ОБРАБОТКА ИНФОРМАЦИИ

УДК 004.42; 519.85

ПРИМЕНЕНИЕ ПАРАЛЛЕЛЬНЫХ ПОЛУМАРКОВСКИХ ЦЕПЕЙ ДЛЯ МОДЕЛИРОВАНИЯ ПРОЦЕССОВ УПРАВЛЕНИЯ

МОБИЛЬНЫМИ РОБОТАМИ

Е.В. Ларкин, А.Н. Привалов, Т.А. Акименко

Получены зависимости для решения этих задач с использованием формирования характеристической матрицы, возведения характеристической матрицы в степень, выделения матричного элемента и определения плотности распределения из характеристической функции. Формулы для прямого расчета математических ожиданий и дисперсий получены с использованием введенной операции свертки для числовых характеристик полумарковских матриц. Предложен алгоритм и система математических выражений для последовательного упрощения полумарковского процесса, что позволяет снизить вычислительную сложность анализа.

Ключевые слова: полумарковский процесс, временные и вероятностные характеристики, параллельные полумарковские цепи, параметры блуждания.

Мобильные роботы (МР), способные решать целевые задачи в воздушной, надводной, подводной и наземной среде, функционирующие автономно, или под дистанционным управлением оператора, в настоящее время широко используются в различных областях человеческой деятельности, таких как экология, военное дело, мониторинг опасных объектов, ликвидация последствий чрезвычайных ситуаций и т.д.

Независимо от среды передвижения, функциональная схема МР является типовой, а, следовательно, структура цифровой системы управления является типовой также. Типовая система управления предполагает ее разделение на стратегический, тактический и функционально-логический уровни, на каждом из которых решается свой круг задач:

на функционально-логическом уровне замыкаются обратные связи контуров управления бортового оборудования МР,

на тактическом уровне осуществляется согласование функционирования единиц бортового оборудования во времени для решения общей целевой задачи;

на стратегическом уровне определяются (человеком-оператором, или с применением методов искусственного интеллекта) алгоритмы решения целевых задач и тактические задачи, решаемые каждой единицей бортового оборудования.

На основании предложенной концепции иерархической системы цифрового управления мобильным роботом показано, что построение оптимальных циклограмм управления связано с анализом и синтезом ординарных, М-параллельных и М-£-параллельных полумарковских процессов. С целью алгоритмизации процедуры анализа и синтеза М-параллельных полумарковских процессов предложено представлять континуальные плотности распределения в дискретной форме, а также разработан формальный метод расчета числовых характеристик блужданий по полумарковским процессам исследуемого типа.

Полумарковские процессы [1, 2, 3, 4] являются основным математическим аппаратом, с помощью которого можно рассчитать временные характеристики производительности мобильных робототехнических комплексов целевых задач [5, 6, 7]. В то же время последовательность операций, выполняемых мобильными роботами при достижении цели, может быть организована путем проверки множества условий, проверка которых приводит к усложнению управляющих программ мобильных роботов и их элементов [8, 9] и, следовательно, к сложность задачи расчета временных характеристик.

Основной операцией, выполняемой над полумарковской матрицей

т(2),п(2 )(0], (1)

где Ь1т$)п&)(1) - элемент полумарковской матрицы; 1(2) < т(2), и(х)< N(2).

Элементы

N (2)х N (2) полумарковской матрицы определяются следующим образом:

Ьт(2),п(2)()- Рт(2),п(2) ' /т(2),п(2)((), (2)

где рт (2) п (2) - элемент стохастической матрицы комплексного полумарковского процесса; /т(2)п(2)(^) - элемент матрицы чистых плотностей распределения.

Матрицы, стохастическая и чистых плотностей распределения, определяются как

Р2 =|Рт(2),и(2)]; (3)

^ )

- 1^(2) ,п(2 )(0] (4)

Будем считать, что состояния объединенного полумарковского процесса могут быть только поглощающими и непоглощающими (полупоглощающие состояния отсутствуют).

Для непоглощающих состояний т(2) справедливы следующие свойства:

N (Е)

I Рт(Е),п(Е) = 1; п(х)=1(х)

0 < а/х^Е) (<)] < ¥,1(Е) < п(х) < N (х) (5)

Для поглощающих состояний т(Е) справедливы следующие свойства:

N (Е)

I Рт(Е),п(Е) = п(Е)=1(Е)

/т(Е)п(Е)(' ) = //тТт(Е,,п(Е)®¥ ^ - Тт(Е),п(Е))1 (6)

1(е)< п(е)< n(е), . ( )

где 8(г -Тт(Е),п(Е)) - 5-функция Дирака.

Основной задачей определения параметров блуждания по полумарковской цепи является задача определения взвешенной плотности распределения времени блуждания из состояния т(х) в состояние п(х). Эта задача может быть решена только для случая, если т(х) - непоглощающее состояние. Единственным ограничением на траектории при определении времени блуждания является то, что в ни в состояние т(х), ни в состояние п(х) процесс не должен попадать дважды. Для того, чтобы удовлетворить этому ограничению состояние т(Е) должно получить статус стартового, а состояние п(х) - статус поглощающего. Для этого из полумарковской матрицы Нх^) должны быть удалены ссылки на состояние т(х) во всех строках, матрицы, а из строки, определяющей состояние п(х) должны быть удалены все ссылки на все состояния матрицы Не (7), т.е. должны быть обнулены т(х) -й столбец и п(х) -я строка. Обозначим указанное преобразование следующим образом

Нх(г)® НЕ() (7)

Для того, чтобы получить требуемую плотность распределения, необходимо стохастически просуммировать плотности распределения, которые поучаются при блужданиях по всем возможным траекториям

Е^т(Х),«(Х)(/ )=Г ^т(Е)-1 1

I Ин£(*)]}

к=1

к

СI п(Е), (8)

где г 1т(х) - вектор-строка, т(х) -й элемент которого равен единице, а

остальные элементы равны нулю; С 1п(х) - вектор-столбец, п(Е)-й элемент

которого равен единице, а остальные элементы равны нулю; £[...] и £-1[...] - соответственно, прямое и обратное преобразование Лапласа, вводимое для того, что бы заменить операцию матричной свертки на операцию перемножения характеристических матриц, формируемых из НЕ(^).

Исследуемый комплексный полумарковский процесс описывается матрицей Нх(?) самого общего вида, поэтому в матрице НЕ(?), сформированной в результате выполнения операции (7) могут быть другие погло-

5

щающие состояния, кроме искусственно созданного состояния п(2). Из этого следует, что не все траектории блуждания по комплексному полумарковскому процессу, которые начинаются в состоянии т(2), оканчиваются в состоянии п(2). Это, в свою очередь, означает, что группа событий достижения состояния п(2) из состояния т(2) не является поной, а следовательно, в общем случае Н'т (2) п(2)(^) имеет характер взвешенной, а не

чистой плотности распределения. Вероятность и чистая плотность распределения времени достижения состояния п(2) из состояния т(2) определяется как

¥

г 2,

>т(2),п(2)- | ^т(2),п(2)^№; (9)

0

2 /т(2),„(2)(г)- ^т(?ш(>). (10)

рт(2),п(2)

Другой характеристикой блуждания по комплексной полумарковской цепи, требующей несколько иного подхода, чем вышеизложенный метод, является время и вероятность возвращения процесса в состояние, например в состояние т(2). Для определения указанных параметров т(2) разделяется на два: т(2,Ь) и т(2,а). Состоянию т(2,Ь) придается статус стартового, а состоянию т(2, а) придается статус поглощающего. С учетом того, что при блужданиях процесс не должен попадать ни в состояние т(2, Ь), ни в состояние т(2, а) дважды, матрица Н2^) должен быть преобразована следующим образом:

в матрицу должны быть добавлены одна строка и один столбец, и таким образом она увеличивается в размере с N (2)х N (2) до [N (2) + l]х[N (2) +1];

за состоянием т(2) следует закрепить статус стартового, а за состоянием N (2) +1 - статус поглощающего, т.е.

т(2)=т(2, Ь); (11)

N (2) +1 = т(2, а); (12)

вследствие (4.11) столбец матрицы Н2^) с номером т(2) должен быть перенесен столбец с номером N(2) +1, а сам столбец с номером т(2) должен быть заполнен нулями;

вследствие (12), добавленная строка с номером N(2) +1 должна быть заполнена нулями.

Таким образом, выполняется преобразование

Н2($)® Н2(;) (13)

Временной интервал возврата полумарковского процесса в состояние т(2) определяется по зависимости

^т (2 ),т (2))- Г1т (2)-Ь -

I [ьШ )]}к

к -1

С (2)+1, (14)

где г1т(Е) - вектор-строка, т(Е) -й элемент которого равен единице, а

остальные элементы равны нулю; с 1п(е) - вектор-столбец, (N(Е) + 1)-й элемент которого равен единице, а остальные матриц, формируемых из ^).

Исследуемый комплексный полумарковский процесс описывается матрицей Не(*) самого общего вида, поэтому в матрице ), сформированной в результате выполнения операции (13) могут быть другие поглощающие состояния, кроме искусственно созданного состояния N (Е) +1. Из этого следует, что не все траектории блуждания по комплексному полумарковскому процессу, которые начинаются в состоянии т(Е), оканчиваются в состоянии N (е) +1. Это, в свою очередь, означает, что группа событий достижения состояния N(Е) +1 из состояния т(Е) не является поной, а следовательно, в общем случае ^(е)т(Е)(^) имеет характер взвешенной, а не чистой плотности распределения. Вероятность и чистая плотность распределения времени достижения состояния п(е) из состояния т(Е) определяется как

¥

ЕР"„,(Е),т(Е) - I Ък"т(Е),т(Е)(>№ ; (15)

Е

рт(Е),т(Е)

Из (10) и (16) могут быть получены числовые характеристики соответствующих плотностей распределения, а именно, математические ожидания и дисперсии:

¥

Етт(Е),п(Е) = I^(ЕМЕ)^; (17)

0

0

Е Г^ , ,(/)- ЕЬ'т(Е),т(Ер) (16)

/т(Е),т(Е)(' -. (16)

Е ^тт(Е),«(Е)-1-Етт(Е),и(Е)Г-Е/т(Е),и(Е)(? № (18)

ЕТт(Е),т(Е) - /^'Е/т(Е),т(Е)(^№ ; (19)

0

Е^тт(Е),т(Е) - 7(?-ЕТт(Е)т(Е)^/т(Е),т(Е)('№ . (20)

0

Полученные зависимости являются сложными для реализации на ЭВМ, поскольку предусматривают сначала аналитические преобразования математических выражений, а потом - собственно расчет основных числовых характеристик плотностей распределения, математического ожидания и дисперсии.. Поэтому для решения задач анализа временных и вероятностных характеристик систем управления мобильными роботами целесо-

0

образно получение математических выражений, которые позволяют напрямую рассчитывать основные числовые характеристики соответствующих плотностей по исходным числовым характеристикам плотностей, включенных в матрицу hs(t).

Таким образом, общий метод вычисления вероятностных и временных характеристик блуждания в полумарковском процессе является сложным и плохо поддается алгоритмизации. Для расчета числовых характеристик его можно заменить методом оценки только числовых характеристик с использованием операции свертки числовых характеристик полумарковских матриц. Для процессов, характеризуемых многомерными полумарковскими матрицами, рекомендуется использовать метод последовательных упрощений с постепенным уменьшением размерности матрицы и рекурсивным пересчетом значений элементов стохастической матрицы, матрицы ожидания и дисперсионная матрица.

Эта статья написана в рамках проекта 2.3121 / ГЗ «Параллельные полумарковские процессы в мобильных системах управления роботами» и поддержана РФФИ по проекту 19-47-710004 .

Список литературы

1. Jiang Q., Xi H.-S., Yin B.-Q. Event-driven semi-Markov switching state-space control processes // IET Control Theory & Applications, 2012. Vol. 6. Iss. 12, 2012. P. 1861 - 1869.

2. Yang T., Zhang L., Yin X. Time-varying gain-scheduling-error mean square stabilisation of semi-Markov jump linear systems // IET Control Theory & Applications, 2016. Vol. 10. Iss. 11. P. 1215 - 1223.

3. Korolyuk V., Swishchuk A. Semi-Markov random evolutions. Springer-Science+Buseness Media, 1995. 309 p.

4. Limnios N., Swishchuk A. Discrete-Time Semi-Markov Random Evolutions and their Applications // Adv. in Appl. Probab. 2013. V. 45, N. 1. P. 214 - 240.

5. Semi-Markov Modeling of Command Execution by Mobile robots // E.V.Larkin, A.N.Ivutin, V.V.Kotov, A.N.Privalov. Interactive Collaborative Robotics (ICR 2016) Budapest, Hungary, Lecture Notes in Artifical Intelligence. Subseries of Lecture notes in Computer Science. Springer, 2016. P. 189 - 198. DOI 10.1007/978-3-319-43955-6.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Data Buffering in Mobile Robot Control Systems // E.V.Larkin, V.V.Kotov, N.A.Kotova, M.A.Antonov. 4-th International Conference on Control, Automation and Robotics (ICCAR). Auckland, New Zealand: Conference Proceedings, 2018. P. 50 - 54. DOI: 10.1109/ICCAR.2018.83 84643.

7. Simulation of Relay-races // E.V.Larkin, A.N.Ivutin, V.V.Kotov, A.N.Privalov. Bulletin of the South Ural State University. Mathematical Modelling, Programming & Computer Software, 2016. Vol. 9. N 4. P. 117 -128.

8. Siegwart R., Nourbakhsh I.R., Scaramuzza D. Introduction to Autonomous Mobile Robots. The MIT Press, 2011. 472 p.

9. Akimenko T.A. Formation of the image on the receiver of thermal radiation. Proceedings of SPIE - The International Society for Optical Engineering 10696,1069627, 2018.

10. Larkin E., Bogomolov A., Privalov A., Antonov M. About One Approach to Robot Control System Simulation. In: Ronzhin A., Rigoll G., Meshcheryakov R. (eds) Interactive Collaborative Robotics. ICR 2018. Lecture Notes in Computer Science, 2018. Vol. 11097. Springer, Cham. P. 159 - 169.

11. Shiryaev A.N. Probability. Springer Science+Business Midia, 1996.

611 p.

12. Larkin E., Ivutin A., Esikov D. Recursive Approach for Evaluation of Time Intervals between Transactions in Polling Procedure // 2016 8th International Conference on Computer and Automation Engineering (ICCAE 2016). Melbourne, Australia - MATEC Web of Conferences, 2016. Vol. 56. 01004. UNSP 01004 DOI: 10.1051/matecconf/20165601004. (SCOPUS< W0S:000386717000004).

Ларкин Евгений Васильевич, д-р техн. наук, профессор, заведующий кафедрой, elarkin@,mail.ru, Россия, Тула, Тульский государственный университет,

Привалов Александр Николаевич, д-р техн. наук, профессор, privalov. 61@mail.ru, Россия, Тула, Тульский государственный педагогический университет им. Л.Н. Толстого,

Акименко Татьяна Алексеевна, канд. техн. наук, доцент, tcintan72@mail.ru, Россия, Тула, Тульский государственный университет

APPLICA TION OF PARALLEL SEMI-MARKO V CHAINS FOR MODELING THE PROCESSES OF MANAGEMENT OF MOBILE ROBOTS

E. V. Larkin, A.N. Privalov, T.A. Akimenko

Dependencies are obtained for solving these problems using the formation of the characteristic matrix, raising the characteristic matrix to a power, isolating the matrix element and determining the distribution density from the characteristic function. Formulas for the direct calculation of mathematical expectations and variances are obtained using the introduced convolution operation for the numerical characteristics of semi-Markov matrices. An algorithm and a system of mathematical expressions are proposed for the sequential simplification of the semi-Markov process, which reduces the computational complexity of the analysis.

Key words: semi-Markov process, temporal and probabilistic characteristics, parallel semi-Markov chains, walk parameters.

Larkin Eugene Vasilevich, doctor of technical science, professor, head of chair, elarkin@,mail. ru, Russia, Tula, Tula State University,

Privalov Aleksandr Nikolaevich, doctor of technical sciences, professor, privalov.61@mail.ru, Russia, Tula, Tula State Pedagogical University namedL. N. Tolstoy,

Akimenko Tatiana Alekseevna, candidate of technical sciences, docent, tantan 72@mail. ru, Russia, Tula, Tula State University

9

i Надоели баннеры? Вы всегда можете отключить рекламу.