ЧЕБЫШЕВСКИЙ СБОРНИК
Том 19. Выпуск 2
УДК 681.5 (519.95) DOI 10.22405/2226-8383-2018-19-2-248-258
Параллельные полумарковские процессы в задачах группового
управления объектами 1
Привалов Александр Николаевич — доктор технических наук, профессор, профессор кафедры информатики и информационных технологий, Тульский государственный педагогический университет им. Л. Н. Толстого. e-mail: [email protected]
Ларкин Евгений Васильевич — доктор технических наук, профессор, заведующий кафедрой, Тульский государственный университет. e-mail: [email protected]
Аннотация
Исследуется функционирование сложных объектов, управляемых ЭВМ. Показано, что абстрактным аналогом функционирования каждого контура управления является ординарный полу марковский процесс. Указанной абстракции недостаточно для аналитического моделирования объекта в целом, поэтому для описания синхронизационных процессов необходима более сложная модель, которая получается интегрированием ординарных процессов в комплексный полумарковский процесс. Для определения подобной абстракции введен термин «функциональные состояния», которые получаются как все возможные комбинации структурных состояний. Предложен метод определения элементов полумарковской матрицы комплексного процесса. Показано, каким образом могут быть определены временные интервалы блужданий по комплексному полумарковскому процессу.
Ключевые слова: групповое управления, эргодический полумарковский процесс, комбинация состояний, декартово произведение полумарковских матриц.
Библиография: 16 названий. Для цитирования:
А. Н. Привалов, Е. В. Ларкин. Параллельные полумарковские процессы в задачах группового управления объектами // Чебышевский сборник. 2018. Т. 19, вып. 2, С. 248-258.
1 Исследование было проведено в Соответствии с Госзаданием Минобрнауки № 2.3121.2017/ПЧ.
CHEBYSHEVSKII SBORNIK Vol. 19. No. 2
UDC 681.5 (519.95) DOI 10.22405/2226-8383-2018-19-2-248-258
The parallel semi-Markov processes in objects group control tasks
Privalov Alexander Nikolaevich Doctor of Technical Sciences, Professor, Professor of the
Department of Informatics and Information Technologies, Tula State Pedagogical University. L.N.
Tolstoy.
e-mail: [email protected]
Larkin Eugene Vasilyevich — doctor of technical science, professor, head of chair, Tula State
University.
e-mail: [email protected]
Abstract
Functioning of complex objects, controlled with computer, is investigates. It id shown, that the abstract analogue of every control loop is the ordinary semi-Markov process. Such abstraction is insufficient for analytical modeling the object as a whole, this is why for the description of synchronizing processes it is necessary to have more complex model, which maybe obtained by means integration of ordinary processes into complex semi-Markov processes. For determining of the abstraction the term "functional state", as all possible combination of structural states is introduced. The method of calculation of complex process semi-Markov matrix elements is proposed. It is shown, how may be evaluated time intervals of wandering through complex semi-Markov process.
Keywords: group control, ergodic semi-Markov process, ctate combination, Cartesian product of semi-Markov matrices, wandering
Bibliography: 16 titles.
For citation:
A. N. Privalov, E. V. Larkin, 2018, "The parallel semi-Markov processes in objects group control
tasks" , Chebyshevskii sbornik, vol. 19, no. 2, pp. 248-258.
1. Введение
Необходимость управления сложными многоконтурными объектами достаточно часто встречается в инженерной практике. Характерным объектом управления, с этой точки зрения, является мобильный робот, который включают ряд единиц бортового оборудования, каждая из которых управляется своим контроллером и функционирует по своему собственному алгоритму. [1, 2]. Функционирование каждого контура управления приводит к достижению корпоративной цели функционирования объекта в целом, поэтому он не может рассматриваться отдельно от других контуров. Таким образом, для управления объектом в целом необходимо уметь оценивать состояния всех контуров в произвольный момент времени. [3, 4].
В свою очередь, управление сложными объектами является цифровым и осуществляется с помощью ЭВМ Фон Неймановского типа, которая функционирует в соответствии с заложенными в ее программное обеспечение алгоритмами. Известно, что работа каждого отдельного контура может быть описана с использованием теории полумарковских процессов [5, 6] вследствие следующих особенностей управляющих алгоритмов [5, 6, 7]:
управляющие алгоритмы являются циклическими и разделяются на операторы, таким образом, после достижения оператора «конец» алгоритм мгновенно возвращается в оператор «начало;
каждая операция связана с определенным физическим состоянием единицы оборудования; все операторы циклического алгоритма являются актуальными, таким образом, из любого оператора существует хотя бы один путь к любому оператору, и в любой оператор существует хотя бы одтн путь из любого оператора;
Время интерпретации оператора случайно и определяется с точностью до плотности распределения, переключение в сопряженные операторы происходит случайным образом.
Таким образом, состояния полумарковского процесса являются абстрактными аналогами состояний контуров управления. При исследовании множества контуров, связанных общей целью знания состояния отдельных единиц оборудования, входящих в объект управления, недостаточно. Таким образом, необходим механизм объединения множества полумарковских процессов в один комплексный случайный процесс. Это позволит определить так называемые функциональные состояния, под которыми понимается комбинация состояний отдельных контуров управления в текущий момент времени. Полумарковские процессы, описывающие сложные системы, в настоящее время используются недостаточно, что определяет необходимость и актуальность исследований в данной области.
2. М-параллельный полу марковский процесс
М-параллельный полумарковский процесс может быть определен как множество, состоящее из М ординарных процессов
м
v = U W
т= 1
when т = к;
п ^=( L
^т = {Ami hm (¿)} > (2)
,, otherwise;
где ^т - ординарный полумарковский процесс [8, 9, 10]; Ат = |а1(т), ..., ...,
множество состояний; кт (£) = [hj(m),n(m) (£)] = рт ® /т (£) - полумарковская матрица размером 3 (т) х 3 (т)\ рт = /0° hm (^ № = [Р1(т),п(т)\ - стохастическая матрица размером
= \1](т),п(т) (£)] " матрица чистых плотностей распределения.
Структура процесса (2) показана на рис. 1 а. Подобные процессы принадлежат категории эргодических полумарковских процессов, процессы 1 ^ т, ^ М, функционируют одновременно, и для правильного управления системой в целом необходимо сформировать модель сложного полумарковского процесса.
J (т) х J (m); fm (t) =
^j(m) ,n(m
Vj(m) ,n(m)
3. Сложный полу марковский процесс
Сложный полумарковский процесс показан на рис. 1 Ь. Этот процесс может быть определен следующим образом [11, 12, 13]:
м» = {МА,мh (i)} , (3)
где м А - множество состоянпй; м h (t) - полумарковская матрица.
Ниже будет использоваться термины «структурное состояние» и «функциональное состояние» (fig. 1). Структурное состояние представляет собой абстрактный аналог оператора циклического алгоритма, таким образом, т-й циклический алгоритм включает J(m) состояний, а общее количество структурных состояний равно сумме
м м
Ns = £ = £ J (т). (4)
т=1 т=1
Декартово произведение [14] множеств Ат дает множество функциональных состояний
м
Ма = П С(5)
т=1
где П С ' знак группового декартова произведения.
Множество функциональных состояний имеет вид:
м
(6)
А = {а1(а), а^а), ..., ал^а)} = {[ац^ al(m), ацм)] , [aJ•(l), aj(m), ..., а^(М)] , [а^^ aJ(m), ..., а](м)]} ,
где а^(а) = [aj(l), ..., з(м)] - функциональное состояние;
м м
з («) = П^ I = П(т). (?)
т=1 т=1
Для определения полумарковской матрицы следует рассмотреть М простейших полумарковских процессов
г 11ъ ъ \ \ 0 (í)
Гт =< {0l(m), 02(т)] , о 0
1 < т < М. (8)
Процессы (8) не являются эргодическими, они имеют стартовое &1(т) и поглощающее &2(т) состояния, 1 ^ т ^ М. Если все М процессов стартуют одновременно, то взвешенная плотность распределения достижения т-м процессом поглощающего состояния первым определяется по зависимости;
м
Кт (г) = /т (г) П [1 - ^ (*)], к = 1, к = т
г
где Рк (Ь) = / /к (т) йт - функция распределения, о
Из (9) могут быть получена вероятность и чистая плотность распределения следующим образом [15, 16]:
те м
Ршш = !ш (*) ■ П [1 - ^ (^(10) о к = 1
к = т
ит ® = . (11)
Ртт
Математическое ожидание и дисперсия /^т аопределяются как обычно:
те
Рыт — ^ ЛЬ, (12)
о
те
= ! (í - Ртт)2 ит (I) <и, 1 < т < М. (13)
о
Полумарковской матрицы м h (¿) находится как декартово произведение матриц hm (£):
м
мh (*) = П Сhш (*). (14)
<>т 1
т=1
Строки и столбцы матрицы мh (t) должны быть пронумерованы следующим образом:
П™=1 с {1(ш), 3 (т), J (rn)} = = {[1 (1), 1 (т), ..., 1 (М)], [j (1), j (т), ..., j (М)],
[п (1), ..., п (т), ..., п (М), ..., [J (1), ..., J (т), ..., J (М)]]} = . 1
= {1 (а), ..., j (а), ..., п (а), ..., J (а)}
Декартово произведение двух полумарковских матриц имеет вид;
2h (t) = hk (t) X hm (t) = [hj(k),n(k)] X [hj(k),n(k)] = [hj(a),n(a) . (16)
где j (a) = [j (k), j (m)], n (a) = [n (к), n (m)] - индексы в двумерном пространстве; х - обозначение декартова произведения матриц, в котором hk (t) и hm рассматриваются как специально организованные множества, таким образом декартово произведение матриц представляет собой также матрицу.
Рассмотрим функциональное состояние a[j(k),j(m)]: которое представлено в декартовом произведении (16). Функциональное состояние ^[j(k),j(m)] описывает соревнование между процессами в структурных состояниях a,j(k) и aj(m)- Пусть после переключения функциональное состояние становится a[n(k),n(m)]- В соревновании может быть только один победитель (вероятность ничьей ничтожно мала, таким образом расстояние Хемминга между индексами j (a) и п (а) может быть следующим:
{0, when j (к) = п (к), j (т) = п (т);
2, when j (к) = п (к), j (т) = п (т); . (17)
1 in all other cases.
Плотность распределения времени пребывания процесса hk (t) в структурном состоянии a,j(k) ¿определяется как
J (к)
fj(k) (t) = ^2 h3(k),n(k) (t) . (18)
n=1
Плотность распределения процесса hm (t) m структурном состоянии aj(m) ¿определяется как:
J (т)
fj(m) (t) = hj(m),n(m) (t) . (19)
n=1
Элемент полумарковской матрицы 2h (t), расположенный на пересечении [j (к) ,j (т)]-й строки и [п (к), п (т,)]-го столбца определяет взвешенную плотность распределения времени переключения из функционального состояния ^[j(k),j(m)] в функциональное состояние а[п(к),п(т)] - Указанный элемент может быть получен следующим образом:
если H = 0, то
hj(a),n(a) (t) = fj(k),j(k) (t) 1 - YJJ}{m^ = 1 Hj(m,n(m)) (t) +fj(m),j(m) (t) 1 - Y.n$=1 Hj(k,n(k)) (t)
+
где fj(k),j(k), fj(m),j(m) определяются как (1);
t
Hj(k,n(k)) (t) = j hj(k,n(k)) (r) dr;
hj(m,n(m)) ) d-T,
0
если H = 1, j (к) = n (к), j (m) = n (m), то
(21)
если H = 1, j (k) = n (к), j (m) = n (m), то
(22)
n(m) = 1
если H = 2, то
hj(a),n(a) (t) = 0.
(23)
Полумарковская матрица сложного процесса (14) может быть получена с использованием рекурсивной процедуры:
where м-1h (t) - декартово произведение М - 1 матриц ординарных процессов; hi (t) - М-я полумарковская матрица ординарного процесса.
Перестановка множителей в (16), (24) приводит только к перестановке строк и столбцов и не изменяет матрицу в целом. Также необходимо заметить, что если все ординарные процессы являются эргодическими, то сложный полумарковский процесс (14) также является эргодическим. Сложный полумарковский процесс подобен ординарному процессу, но с функциональными состояниями, и для его исследования могут быть применены широко известные методы [5, 6, 11].
4. Время блуждания по сложному полу марковскому процессу
Типичной задачей, решаемой с помощью полумарковского моделирования, является задача определения временных интервалов блуждания из состояния Qj^a) в состояние ап(а). Структура эргодического полумарковского процесса, для которого определяется состояние, приведена на рис. 2 а.
При определении времени блуждания единственным ограничением на траектории то, что ни в состояние ап (а), ни в состоян ие aj (а) процесс не должен попадать дважды. Для того, чтобы удовлетворить этому ограничению, должен быть сформирован граф состояний, приведенный на рис. 2 Ь. Для этого из полумарковской матрицы мh (t) должны быть удалены ссылки на состояние aj(a) в0 всех строкж матрицы, а из строки, определяющей состояние ап(а), должны быть удалены все ссылки на все состояния матриц. Так производится преобразование
Полумарковский процесс мй (I) не является эргодическим. Он имеет единственное начальное состояние ^ ^^^^^^^^^^^^ ^^гаощающее состояние ап(а). Все возможные траектории блуждания по полумарковскому процессу составляют полную группу несовместных событий.
м
м
h (i)= П С hm (t) = м-1h (t) X h (t),
(24)
Mh (t)^Mh (t).
Рис. 2: Комплексные полумарковекие процессы а - эргодичеекий, Ь - неэргодичеекий, с - с расщепленным состоянием
Поэтому плотность распределения времени достижения состояния а.(а) из состояния ап(а) определяется по зависимости
!.(а),п(а) = Ч.(а) ■ ^ МК (€) | ■ С1п(а^ , (25)
где г1](а) ' вектор-строка, j(a)-й элемент которого равен единице, а остальные элементы равны
нулю; с1п(а) - вектор-столбец, п{а)-й элемент которого равен единице, а остальные элементы -1
Другой задачей, решаемой с помощью полумарковского моделирования, является задача определения времени возврата в состояние Для решения этой задачи следует расщепить
состояние а^(а) па стартовое состояние Щ(а)ь и поглощающее состояние а.(а)е (рис. 2 с). При этом в полумарковскую матрицу МК (£) должны быть добавлены справа один столбец и снизу одна строка с номером 7(а) + 1. В получившейся матрице МК (I) размером [/(а) + 1]х[ 7(а) + 1] ]{о)-е строка и столбец будут определять одно из созданных состояний, например состояние Щ(а)ь, а [7(а) + 1]-е строка и столбец будут определять другое созданное состояние, а именно а^^е. В состояние не входит ни одна дуга, поэтому элементы ]{а)-го столбца бу-
дут равны нулю. Из состояния а.(а)е не выходит ни одна дуга, поэтому элементы [,1(а) + 1]-й строки будут равняться нулю. В состояние <У.ца)е входят все дуги, которые в исходной структуре входили в состояние а.^), поэтому столбец матрицы МК (I) должен быть перенесен на [7(а) + 1]-е место в матрице МК (I). Так производится преобразование МК К (I). Полумарковский процесс МК (I) не является эргодическим. Он имеет единственное начальное состояние а.(а)ь и единственное поглощающее состояние а.(а)е. Все возможные траектории
блуждания по этому полумарковскому процессу составляют полную группу несовместных событий. Поэтому плотность распределения времени достижения из <У.ца)ъ определяется по зависимости
fj(a),j(a) (t)= L 1 ^Ij(a) ■ Y^ {L Mh (t) } ' ClJ(a) + l^
(26)
где г 1](а) ' 1У(а) + 1]-мерный вектор-строка, j(a)-й элемент которого равен единице, а остальные элементы равны нулю; с1л^а)+\ - [</(а)+ 1]-мерный вектор-столбец, [,1(а)+ 1]-й элемент которого равен единице, а остальные элементы равны нулю.
Из плотностей распределения (25), (26) могут быть получены основные числовые характеристики [15, 16]
те
Tj(a),n(a), Tj(a),j(a) =j t f j(a),n(a) (t) , fj(a),j(a) (t)
dt;
(27)
те
/
0
Dj(a),n(a), Dj(a),j(a)
t - Tj{a),n(a)) f j(a),n(a) (t) , U - rrj(a),j(a)) fj(a),j(a) (t)
dt.
(28)
Основные числовые характеристики, математическое ожидание и дисперсия, дают достаточно полное описание динамики блужданий по состояниям комплексного полумарковского процесса.
5. Заключение
Таким образом, выше предложен общий подход к аналитическому описанию М-параллель-ного полумарковского процесса и показано, что он сводим к ординарному полумарковскому процессу, вероятностные и временные характеристики которого вычисляются с помощью достаточно простых математических операций. Дальнейшие исследования в данной области могут быть направлены на построение моделей сложных многоконтурных объектов управления, описания функционирования отдельных контуров управления, использование более грубых абстракций, в частности, строго Марковские процессов для описания, а также развитие чисто числовых методов оценки состояний сложного полумарковского процесса.
СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ
1. Tzafestas S.G. Introduction to Mobile Robot Control. Elsevier, 2014. 692 Pp.
2. Kaharl S., Sulaimanl R., Prabuwonol A.S., Akma N. Ahmad S.A., Abu Hassan M.A. A Review of Wireless Technology Usage for Mobile Robot Controller // 2012 International Conference on System Engineering and Model-ing (ICSEM 2012). International Proceedings of Computer Science and Infor-mation Technology IPCSIT. Vol. 34. Pp. 7 - 12.
3. Cook G. Mobile robots: Navigation, Control and Remote Sensing. Wiley-IEEE Press, 2011. 319 Pp.
4. Siciliano B. Springer Handbook of Robotics. Springer-Verlag Berlin Heidelberg. 2008. 1611 Pp.
5. Larkin E.V., Ivutin A.N. Estimation of Latency in Embedded Real-Time Systems // 3-rd Meditteranean Conference on Embedded Computing (MECO-2014). Budva, Montenegro, 2014. - Pp. 236 - 239.
6. Larkin E.V., Ivutin A.N., Kotov V.V., Privalov A.N. Semi-Markov Modeling of Command Execution by Mobile robots // Interactive Collaborative Robotics (ICR 2016) Budapest, Hungary, Lecture Notes in Artifical Intelligence. Subseries of Lecture notes in Computer Science. Springer, 2016. Pp. 189 - 198.
7. Buttazo G.C. Hard Real-Time Computing Systems. Predictable Sched-uling Algorithms and Applications. Springer Science+Buseness Media. LLC 2011. 521 Pp.
8. Limnios N., Swishchuk A. Discrete-Time Semi-Markov Random Evo-lutions and their Applications // Adv. in Appl. Probab. 2013. V. 45, N. 1. Pp. 214 - 240.
9. Bielecki T.R., Jakubowski J., Niew^glowski M. Conditional Markov chains: Properties, construction and structured dependence // Stochastic Process-es and their Applications. 2017. V. 127, N. 4. Pp. 1125-1170.
10. Janssen J., Manca R. Applied Semi-Markov processes. Springer US, 2005. 310 Pp.
11. Larkin E.V., Lutskov Yu.I., Ivutin A.N., Novikov A.S. Simulation of concurrent process with Petri-Markov nets // Life Science Journal. - 2014. - N. 11 (11). - Pp. 506 - 511.
12. Ivutin A.N, Larkin E.V. Simulation of Concurrent Games // Bulletin of the South Ural State University. Series: Mathematical Modeling, Program-ming and Computer Software. Chelyabinsk, 2015. Vol. 8. N 2. Pp. 43 - 54.
13. Larkin E.V., Ivutin A.N., Kotov V.V., Privalov A.N. Simulation of Relay-races // Bulletin of the South Ural State University. Mathematical Model-ling, Programming k, Computer Software. 2016. Vol. 9. N 4. - Pp. 117 - 128.
14. Gallied J. Discrete Mathematics. Elementary and Beyond. Under-graduate Texts in Mathematics. Springer. N.Y. 2003. 453 Pp.
15. Bauer H. Probability Theory. Walter de Gruvter: Berlin, N.Y., 1996. - 523 Pp.
16. Shirvaev A.N. Probability. Springer Science+Business Midia, 1996. 611 Pp.
REFERENCES
1. Tzafestas S.G., 2014, Introduction to Mobile Robot Control. Elsevier, 692 Pp.
2. Kaharl S., Sulaimanl R., Prabuwonol A.S., Akma N. Ahmad S.A., Abu Hassan M.A., 2012, "A Review of Wireless Technology Usage for Mobile Robot Controller:" , 2012 International Conference on System Engineering and Model-ing (ICSEM 2012). International Proceedings of Computer Science and Infor-mation Technology IPCSIT. Vol. 34. Pp. 7 - 12.
3. Cook G. 2011, Mobile robots: Navigation, Control and Remote Sensing. WTilev-IEEE Press, 319 Pp.
4. Siciliano B., 2008, Springer Handbook of Robotics. Springer-Verlag Berlin Heidelberg. 1611 Pp.
5. Larkin E.V., Ivutin A.N., 2014, "Estimation of Latency in Embedded Real-Time Systems" , 3-rd Meditteranean Conference on Embedded Commuting (MECO-2014) Budva, Montenegro -Pp. 236 - 239.
6. Larkin E.V., Ivutin A.N., Kotov V.V., Privalov A.N., 2016, "Semi-Markov Modeling of Command Execution by Mobile robots" , Interactive Collaborative Robotics (ICR 2016) Budapest, Hungary, Lecture Notes in Artifical Intelligence. Subseries of Lecture notes in Computer Science. Springer, Pp. 189 - 198.
7. Buttazo G.C., 2011, "Hard Real-Time Computing Systems." , Predictable Sched-uMng Algorithms and Applications. Springer Science+Buseness Media. LLC 521 Pp.
8. Limnios N., Swishchuk A., 2013, "Discrete-Time Semi-Markov Random Evo-lutions and their Applications", Adv. in Appl. Probab. V. 45, N. 1. Pp. 214 - 240.
9. Bielecki T.R., Jakubowski J., Niew^glowski M., 2017, "Conditional Markov chains: Properties, construction and structured dependence" , Stochastic Process-es and their Applications. V. 127, N. 4. Pp. 1125-1170.
10. Janssen J., Manca R., 2005, Applied Semi-Markov processes. Springer US, 310 Pp.
11. Larkin E.V., Lutskov Yu.I., Ivutin A.N., Novikov A.S., 2014, "Simulation of concurrent process with Petri-Markov nets" , Life Science Journal. N. 11 (11). - Pp. 506 - 511.
12. Ivutin A.N, Larkin E.V., 2015, "Simulation of Concurrent Games" , Bulletin of the South Ural State University. Series: Mathematical Modeling, Program-ming and Computer Software. Chelyabinsk, Vol. 8. N 2. Pp. 43 - 54.
13. Larkin E.V., Ivutin A.N., Kotov V.V., Privalov A.N., 2016, "Simulation of Relay-races" , Bulletin of the South Ural State University. Mathematical Model-ling, Programming & Computer Software. Vol. 9. N 4. - Pp. 117 - 128.
14. Gallied J. Discrete Mathematics., 1996, Elementary and Beyond. Under-graduate Texts in Mathematics. Springer. N.Y. 2003. 453 Pp.
15. Bauer H. Probability Theory. Walter de Gruvter: Berlin, N.Y., - 523 Pp.
16. Shirvaev A.N. 1996, Probability. Springer Science+Business Midia, 611 Pp.
Получено 13.06.2018
Принято в печать 17.08.2018