Модель роботизированной платформы как ординарный полумарковский процесс

Гришин Константин Анатольевич

УДК 519.216

МОДЕЛЬ РОБОТИЗИРОВАННОЙ ПЛАТФОРМЫ КАК ОРДИНАРНЫЙ ПОЛУМАРКОВСКИЙ ПРОЦЕСС

К.А. Гришин

Исследуются проблемные вопросы управления группами роботизированных платформ. Построена полумарковская модель циклограммы управления платформой. Определены вероятности переключения состояний. Рассмотрен полумарковский процесс с помощью математического ожидания и дисперсии.

Ключевые слова: роботизированные платформы, стохастическая матрица, модель управления, полумарковский процесс.

Определим вероятностное пространство борелевской тройкой (О, 0, Р), включающей множество элементарных событий О, носитель 0 алгебры 0, формируемый из подмножеств множества О, и вероятностную меру Р.

Множество О = {(й1,..., юп,..., } включает события, каждое из

которых не разлагается на другие события, и поэтому называется элементарным. Из элементов множества О могут быть сформированы подмножества, составляющие носитель алгебры Е, которые также являются событиями. На множестве 0 определена сигнатура алгебры, включающая двуместные операции: объединение, пересечение и одноместную операцию дополнение [1].

При моделировании роботизированных платформ множество элементарных событий может быть представлено как объединение:

О = О* иОа , (1)

где О* = {(°1 (*),..., (*),..., (у (*)} - подмножество элементарных событий,

формирующих временные интервалы; Оа =((0),.", (до),---, ю/(а)} -

подмножество элементарных событий, формирующих дискретную величину, называемую состоянием физического объекта.

Под состоянием роботизированной платформы понимается как выполнение оборудованием некоторого действия, причем в этом состоянии платформа пребывает от начала выполнения действия до его окончания [2]. При многократном появлении элементарных событий подмножества

О* формируется поток временных интервалов, представляющих собой

функцию т(о/).

В реальности Wt = {coj(t),...,wj(t),...}, Wt =™и t(wt) представляет

континуум, а временные интервалы являются случайными непрерывными величинами. В этом случае для j(t)-ro интервала временного потока может быть определена вероятностная мера:

Fj(t)(t) = P(C : 0 <т(С) < t), (2)

Для стационарного потока число временных интервалов, попадающих на любой фиксированный интервал времени, будет распределено по закону Пуассона:

Pm =L exp(-p), (3)

m!

где b- некоторая положительная величина, называемая параметром закона Пуассона.

Плотность распределения значений временных интервалов ) для подобного потока определяем в виде:

f (t) = l(t )1 exp(-1t), (4)

Очевидно, что если на временные интервалы t(wt) не накладываются ограничения по ординарности и отсутствию последействия, то они могут быть распределены по произвольному закону, отличному от (4). При этом единственным ограничением, накладываемым на плотность распределения произвольного закона, является то, что его область определения лежит в положительной полуплоскости:

Г> 0, если 0 < tmln < t < tmax

f (t) j : , nmin max , (5)

[ = 0, если t < 0;

На верхний предел области ненулевых значений плотности распределения tmax никаких дополнительных ограничений, кроме (5), не накладывается. Для некоторых физических объектов возможна ситуация, когда

t = ¥ lmax

Функция a(wa) от элементарных событий подмножества состояний

J /V /у /-у I

объекта W = р^),..., ®j(a), •••, ®j(a)j является дискретной одноместной и взаимно однозначной:

aj(a) G A = a(WJ(a)), (6)

где A = {ai(a),..., aj(a),..., aj(a)} - множество физических состояний роботизированной платформы.

п I п п п I

Множеству W = Pj(a),..., wj(a),..., Wj(a) j ставится в соответствие

мера:

Р](а) = РЮ : а(ю ) = а](а) ], (7)

Выражение (7) характеризует вероятность пребывания платформы в одном из состояний множества А для внешнего по отношению к внешнему наблюдателю. Тот факт, что система может находиться в одном и только в одном из состояний, накладывает следующее ограничение на вероятности (7):

у (а)

Е Р] (а) = 1, (8)

] (а)=1(а)

п I п п п I

Возведение подмножества О = р^),..., Ю](а), - -, (а)1 во вторую декартову степень дает множество пар элементарных событий.

Двуместная функция а(ю(°(а), ю((а)) = (а),п(а) от пары элементарных событий подмножества Оа определяем через пару одноместных функций:

°(Ю(Д а), Ю°(а)) = (а),п(а) = ^ (ар,К(а))] = а(а] (а)),(ап(а)), (9) Назовем кортеж о(ю((а), ю((а)) = $](а),п(а) переключением роботи-

зированной платформы, или переходом платформы из состояния а ](а) в состояние ап(а). Каждой паре одноместных функций [ а(ю((а)), о(юаИ(а))] и

границе временных интервалов ](*) поставим в соответствии вероятностную меру:

р] (а )п(а ) ] (*)

Р

(ю((а),Ю((а))](*) : ((ю((а)) = (а),](*),((<(а))

ап(а),] (* )+1

(10)

где (ю((а), ю((а)) ] (*) - пара элементарных событий подмножества Оа, определенных на ](*)-й границе ](*)-го и ](*) + 1]-го временных интервалов; а](а) ](*) - состояние системы до переключения; ап(а) ](*)+ - состояние

системы после переключения.

Повторяющиеся появления элементарных событий подмножества

Оа , формирует последовательность смен состояний роботизированной платформы в моменты, определяемые элементарными событиями подмножества О* [3]. Потребуем, чтобы при переключениях состояний процесса выполнялись следующие допущения.

Вероятности смены состояний (10) не зависят от предыстории процесса:

Рj(a)n(a)j(t) = РИда)>%(арМ : a(wj{a)) = aj{a),а(%(ар = ап(а)1 (11)

Временные интервалы (2.3) не зависят от предыстории процесса, а зависят только от функции переключения о(юа(а), ®П(а)).

Если для элементарного случайного процесса справедливы эти допущения, то такой процесс будет являться полумарковским.

Полумарковский процесс полностью определяется полумарковской матрицей И(1), представляющей собой прямое (поэлементное) произведение матрицы вероятностей и матрицы плотностей распределения:

40 = hj(а),п(а/ = Р ® /«), (12)

где р = Рj (а) п(а)1 - стохастическая матрица (она же матрица вероятностей, она же вложенная цепь Маркова); / = fj(а) п(ау - матрица плотностей распределения; ® - символ, означающий прямое (поэлементное) произведение матриц.

Из (12) стохастическая матрица и матрица плотностей распределения могут быть получены в соответствии со следующими выражениями:

f (' )=

р = | р(г )м, (13)

о

hj (а ),п(а ^ )

(14)

pj(a ),п(а)

Полумарковский процесс, кроме стохастической матрицы, может быть охарактеризован следующие числовыми характеристиками, наиболее часто используемыми в теории вероятностей:

1) математическими ожиданиями времени пребывания в состояниях множества А:

Т = У ^Г «)Л = Т (а),п(а) ], (15)

о

2) дисперсиями времени пребывания в состояниях множества А

В = У12^(*- Т ® Т =В(а),п(а) ], (16)

о

Множество состояний ^ = а1(а), •••, aj(а), • ••, а^(а)| и множество

^ = { : ^j(а),п(а) = [аj(а),ап(а)] аj(а) е Л ап(а) е Л 1(а) £ 7(а), п(а) £ ^(а)| могут быть представлены в виде ориентированного графа. Граф, в свою очередь, также задан входной и выходной функцией или матрицей смежности:

г = Ь (а ),п(а )1 (17)

73

Уравнения (17) будет иметь два состояния:

Г1, если Р](а),п(а0;

г](а ),п(а)

= (18) 0 если Р](а),п(а) = 0.

Под выходной функцией 0(а ) состояния а здесь и ниже будет пониматься множество состояний, в которые можно переключиться непосредственно из состояния а. Под входной функцией I(а) состояния а здесь и ниже будет пониматься множество состояний, из которых можно переключиться непосредственно в состояние а [4]. Как матрица смежности, так и пара «входная/выходная функция» определяют структуру графа состояний полумарковского процесса.

Состояния могут быть перенумерованы произвольным образом. Без нарушения общности можно считать, что поглощающие состояния имеют номера с У (а)-У (е) + 1 по У (а).

Безусловная плотность распределения времени пребывания полумарковского процесса в непоглощающих состояниях а](а) до его переключения в состояния аг(а) е 0[а](а)] определяется зависимостью:

У (а)

//(а)(0 = Е И] (а), п(а)(*), (19)

п(а)=1(а)

Последовательность смены состояний роботизированной платформы, описываемой с помощью полумарковского процесса, для внешнего наблюдателя может быть представлена как блуждание по полумарковской цепи (рис. 1). При блужданиях процесс пребывает в состоянии а] (а) в течение случайного времени, а затем с вероятностью р ] (а) п(а) переключается в состояние ап(а). Элемент И] (а) п(а) (*) полумарковской матрицы определяет временные и вероятностные характеристики между двумя переключениями. Время, в течение которого процесс пребывает в состоянии а](а), определено с точностью до условной плотности распределения

/](а) п(а)(*). Состояния, в которые последовательно попадает процесс при

блужданиях, ниже будет называться траекторией блуждания. Очевидно, что для каждой реализации полумарковского процесса траектория блуждания детерминирована и строго определяется логикой управления роботизированной платформой. Для внешнего же, по отношению к процессу, наблюдателя каждая конкретная траектория реализации является случайной.

Начало процесса определим вектором вероятностей:

Ч = Ч] (а) (20)

74

Введение вектора q означает, что в процессе появляется «нулевое», или стартовое состояние яд,?)- При этом формируется полумарковский

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

процесс (рис. 2).

Ла)

Рис. 1. Блуждания по полумарковской цепи

Рис. 2. Полумарковский процесс

Запишем полумарковский процесс в матричной форме:

'О ?1(<7)б(0 ... - 9у(д)5(0

лч о =

0 0

0 Л./(Д)Д(йг)(0 - -

75

(21)

где 8(t) - 5-функция Дирака.

Таким образом, было определено понятие полумарковского процесса, который используется в качестве инструментария для моделирования состояний роботизированных платформ, показано, что полумарковские процессы являются математическим подобием циклограмм управления отдельными узлами и блоками платформ, а состояния полумарковских процессов связаны с выполнением роботизированной платформой определенных действий.

Список литературы

1. Ивутин А.Н., Ларкин Е.В. Обобщенная полумарковская модель алгоритма управления цифровыми устройствами // Известия Тульского государственного университета. Технические науки. Тула: Изд-во ТулГУ, 2013. Вып. 1. С. 221 - 228.

2. Ивутин А.Н., Ларкин Е.В. Временные и вероятностные характеристики транзакций в цифровых системах управления // Известия Тульского государственного университета. Технические науки. Тула: Изд-во ТулГУ, 2013. Вып. 1. С. 252 - 258.

3. Ларкин Е.В., Ивутин А.Н. Определение временных интервалов в алгоритмах управления // Известия Томского политехнического университета. Томск: Томский политехнический университет, 2014. Т. 124. №5. Управление, вычислительная техника и информатика. С. 6 - 12.

4. Larkin E.V., Ivutin A.N. Estimation of Latency in Embedded RealTime Systems // 3-rd Mediterranean Conference on Embedded Computing (MECO-2014). Budva, Montenegro, 2014. P. 236 - 239.

Гришин Константин Анатольевич, асп., [email protected], Россия, Тула, Тульский государственный университет

THE MODEL OF THE ROBOTIC PLATFORM AS AN ORDINARY SEMI-MARKOV PROCESS

K.A. Grishin

The problem questions of control of groups of robotic platforms are investigated. Effectiveness of distribution of functions between control hardware units is evaluated. The probability of switching conditions is determined .Semi-Markov process with mathematical expectation and dispersion is considered.

Key words: robotic platform, the stochastic matrix, formalism of control, semi-Markov process.

Grishin Konstantin Anatolyevich, postgraduate, GrishKons92@yandex. ru, Russia, Tula, Tula, Tula State University

Модель роботизированной платформы как ординарный полумарковский процесс Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Гришин Константин Анатольевич

Похожие темы научных работ по математике , автор научной работы — Гришин Константин Анатольевич

THE MODEL OF THE ROBOTIC PLATFORM AS AN ORDI NARY SEMI -MARKOV PROCESS

Текст научной работы на тему «Модель роботизированной платформы как ординарный полумарковский процесс»