Научная статья на тему 'ПАРНОЕ ДИСКРЕТНОЕ СОРЕВНОВАНИЕ СО СВОБОДНЫМ ВЫБОРОМ МАРШРУТА'

ПАРНОЕ ДИСКРЕТНОЕ СОРЕВНОВАНИЕ СО СВОБОДНЫМ ВЫБОРОМ МАРШРУТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
42
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СОРЕВНОВАНИЕ / МАРШРУТ / ГАМИЛЬТОНОВ ПУТЬ / ПОЛНАЯ ГРУППА НЕСОВМЕСТНЫХ СОБЫТИЙ / ДИСКРЕТНОЕ РАСПРЕДЕЛЕНИЕ / ДИСЦИПЛИНА ШТРАФОВАНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ларкин Евгений Васильевич, Привалов Александр Николаевич, Богатырева Юлия Игоревна

В работе рассмотрена проблема оптимизации расписания функционирования многопроцессорных систем. Решение данной проблемы предполагает формирование жесткого графика работы, который определяет ритм процессов, но на практике на функционирование систем оказывает влияние множество побочных факторов, которые делают интервалы времени выполнения работ случайными. В работе построена полумарковская модель формирования стохастического расписания в условиях парного соревнования. Показано, что если при функционировании системы возможно исполнение пунктов расписания в произвольном порядке, то эволюция полумарковского процесса проходит по гамильтонову пути. Доказано, что все возможные реализации гамильтоновых путей образуют полную группу несовместных событий. Отмечается, что вследствие наложения ограничений по характеру эволюции, процесс эволюции не является строго полумарковским, и поэтому предложен метод формирования из первичной модели, строго полумарковского процесса с древовидной структурой. Получены зависимости для расчета плотностей распределения и вероятностей переключения из состояний полумарковского процесса в сопряженные состояния, а также времени блуждания от стартового до поглощающих состояний. С использованием понятия парного дискретного соревнования и распределенного штрафа оценивается эффективность выбора гамильтонова пути одним из субъектов с учетом того, что алгоритм поведения его оппонента известен с точностью до построения полумарковской модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PAIRED DISCRETE COMPETITION WITH A FREE ROUTE CHOICE

The paper considers the problem of optimizing the operation schedule for multiprocessor systems. The solution to this problem involves the formation of a rigid work schedule, which determines the rhythm of the processes, but in practice the functioning of systems is influenced by many side factors that make the intervals of work execution random. In the work, a semi-Markov model of the formation of a stochastic schedule in conditions of pair competition is constructed. It is shown that if during the functioning of the system it is possible to execute the items of the schedule in an arbitrary order, then the evolution of the semi-Markov process follows the Hamiltonian path. It is proved that all possible realizations of Hamiltonian paths form a complete group of incompatible events. It is noted that, due to the imposition of restrictions on the nature of evolution, the evolution process is not strictly semi-Markov, and therefore a method of forming a strictly semi-Markov process with a tree structure from the primary model is proposed. Dependences are obtained for calculating the distribution densities and the probabilities of switching from states of a semi-Markov process to conjugate states, as well as the time of walking from the starting to absorbing states. Using the concept of paired discrete competition and a distributed penalty, the effectiveness of the choice of a Hamiltonian path by one of the subjects is estimated, taking into account the fact that the algorithm of his opponent’s behavior is known up to the construction of a semi-Markov model.

Текст научной работы на тему «ПАРНОЕ ДИСКРЕТНОЕ СОРЕВНОВАНИЕ СО СВОБОДНЫМ ВЫБОРОМ МАРШРУТА»

ЧЕБЫШЕВСКИЙ СБОРНИК Том 22. Выпуск 2.

УДК 519.217.1 DOI 10.22405/2226-8383-2021-22-2-145-159

Парное дискретное соревнование со свободным выбором маршрута

Е. В. Ларкин, А. Н. Привалов, Ю. И. Богатырева

Ларкин Евгений Васильевич — доктор технических наук, Тульский государственный университет (г. Тула). e-mail: elarkin@mail.ru

Привалов Александр Николаевич — доктор технических наук, профессор, Тульский государственный педагогический университет им. Л. Н. Толстого (г. Тула). e-mail: privalov.61@mail.ru

Богатырева Юлия Игоревна — доктор педагогических наук, Тульский государственный педагогический университет им. Л. Н. Толстого (г. Тула). e-mail: kiit@tsput.ru

Аннотация

В работе рассмотрена проблема оптимизации расписания функционирования многопроцессорных систем. Решение данной проблемы предполагает формирование жесткого графика работы, который определяет ритм процессов, но на практике на функционирование систем оказывает влияние множество побочных факторов, которые делают интервалы времени выполнения работ случайными. В работе построена полумарковская модель формирования стохастического расписания в условиях парного соревнования. Показано, что если при функционировании системы возможно исполнение пунктов расписания в произвольном порядке, то эволюция полумарковского процесса проходит по гамильтонову пути. Доказано, что все возможные реализации гамильтоновых путей образуют полную группу несовместных событий. Отмечается, что вследствие наложения ограничений по характеру эволюции, процесс эволюции не является строго полумарковским, и поэтому предложен метод формирования из первичной модели, строго полумарковского процесса с древовидной структурой. Получены зависимости для расчета плотностей распределения и вероятностей переключения из состояний полумарковского процесса в сопряженные состояния, а также времени блуждания от стартового до поглощающих состояний. С использованием понятия парного дискретного соревнования и распределенного штрафа оценивается эффективность выбора гамильтонова пути одним из субъектов с учетом того, что алгоритм поведения его оппонента известен с точностью до построения полумарковской модели.

Ключевые слова: соревнование, маршрут, гамильтонов путь, полная группа несовместных событий, дискретное распределение, дисциплина штрафования.

Библиография: 13 названий. Для цитирования:

Е. В. Ларкин, А. Н. Привалов, Ю. И. Богатырева. Парное дискретное соревнование со свободным выбором маршрута // Чебышевский сборник, 2021, т. 22, вып. 2, с. 145-159.

CHEBYSHEVSKII SBORNIK Vol. 22. No. 2.

UDC 519.217.1 DOI 10.22405/2226-8383-2021-22-2-145-159

Paired discrete competition with a free route choice

E. V. Larkin, A. N. Privalov, Yu. I. Bogatyreva

Larkin Evgenii Vasil'evich — doctor of technical sciences, Tula State University (Tula). e-mail: elarkin@mail.ru

Privalov Alexander Nikolaevich — doctor of technical sciences, Tula State Lev Tolstoy Pedagogical University (Tula). e-mail: privalov.61@mail.ru

Bogatyreva Yulia Igorevna — doctor of pedagogical sciences, Tula State Lev Tolstoy Pedagogical University (Tula). e-mail: kiit@tsput.ru

Abstract

The paper considers the problem of optimizing the operation schedule for multiprocessor systems. The solution to this problem involves the formation of a rigid work schedule, which determines the rhythm of the processes, but in practice the functioning of systems is influenced by many side factors that make the intervals of work execution random. In the work, a semi-Markov model of the formation of a stochastic schedule in conditions of pair competition is constructed. It is shown that if during the functioning of the system it is possible to execute the items of the schedule in an arbitrary order, then the evolution of the semi-Markov process follows the Hamiltonian path. It is proved that all possible realizations of Hamiltonian paths form a complete group of incompatible events. It is noted that, due to the imposition of restrictions on the nature of evolution, the evolution process is not strictly semi-Markov, and therefore a method of forming a strictly semi-Markov process with a tree structure from the primary model is proposed. Dependences are obtained for calculating the distribution densities and the probabilities of switching from states of a semi-Markov process to conjugate states, as well as the time of walking from the starting to absorbing states. Using the concept of paired discrete competition and a distributed penalty, the effectiveness of the choice of a Hamiltonian path by one of the subjects is estimated, taking into account the fact that the algorithm of his opponent's behavior is known up to the construction of a semi-Markov model.

Keywords: competition, route, Hamiltonian path, full group of inconsistent events, discrete distribution, forfeit discipline.

Bibliography: 13 titles. For citation:

E. V. Larkin, A. N. Privalov, Yu. I. Bogatyreva, 2021, "Paired discrete competition with a free route choice", Chebyshevskii sbornik, vol. 22, no. 2, pp. 145-159.

Введение

Одним из важных факторов, определяющих эффективность функционирования многопроцессорных систем, является формирование задела на обработку данных, который затем выбирается программой-диспетчером в соответствии с принятым алгоритмом составления расписаний [1, 2, 3, 4]. Подобные задачи, помимо многопроцессорных систем, возникают на производстве, в бизнесе, военной сфере, спорте (Соревнования по «Охоте на лис») и т.п. [5, 6, 7,

8]. Рационально составленное расписание позволяет оптимально загружать вычислительные мощности многопроцессорных систем, технологическое оборудование на производстве, решать проблемы логистики в бизнесе, распределять ресурсы в военной сфере и т.п.

Задача оптимизации расписания обычно предполагает формирование жесткого графика работы, который определяет ритм процессов, но на практике на функционирование систем оказывает влияние множество побочных факторов, которые делают интервалы времени выполнения работ случайными. Кроме того, случайным является и выбор каждой следующей работы для исполнения. Поэтому адекватным подходом к моделированию случайной динамики является использование теорий марковских и полумарковских процессов [9, 10, 11, 12]. Однако прямое применение указанных теорий затруднительно вследствие ограничений, накладываемых на траектории блуждания по марковским/полумарковским цепям. Кроме того, для решения задач оптимизации необходимо использование аппарата, позволяющего оценивать эффективность принимаемых решений, в качестве которого может быть использован аппарат распределенного штрафования, изложенный в [13, 14]. С целью упрощения практического использования этого аппарата ниже он будет изложен в дискретном варианте [15]. Предложенный подход к моделированию не получил широкого распространения, что и объясняет актуальность работы.

Для реализации подхода сделаны следующие допущения:

1) в соревновании участвуют два субъекта, Л и Б, каждый из которых должен пройти маршрут, включающий ] контрольных пунктов;

2) маршрут субъекта Л начинается в пункте ао и заканчивается в пункте аз+1;

3) маршрут субъекта Б начинается в пункте Ьо и заканчивается в пункте Ьз+1;

4) маршруты субъектов должны проходить через все без исключения контрольные пункты маршрутов по одному разу;

5) на последовательность прохождения контрольных пунктов субъектами не накладывается никаких ограничений;

6) после прохождения очередного контрольного пункта субъект немедленно, без задержек, выбирает в качестве цели следующий пункт и начинает движение к нему;

7) временные интервалы прохождения участков маршрутов между каждой парой контрольных пунктов являются случайными, величины временных интервалов зависят от участка маршрута и определяются с точностью до дискретного распределения;

8) субъекты соревнуются между собой, причем результат соревнования реализуется в виде штрафа, который проигравший субъект платит выигравшему субъекту;

9) сумма начисляемого штрафа определяется разностью номеров участков маршрута, временем, в течение которого эта разность сохраняется и дисциплиной распределенного штрафования.

Модель системы

Модель соревнования со свободным выбором маршрута приведена на рис. 1. Модель включает полумарковские процессы ц,а и ц,в [16], у которых

РА = { А,кл (*)}; Ц-в = {В,кв (*)} (1)

где А = {ао(^) ,al(A),ai(A),..., а^(А),аз , В = {bо(в),bl(в),Ьг(в) Ьj(в), Ьз —

множества состояний; На Нв (Ь) — полумарковские матрицы; Ь — время.

Вследствие того, что процессы (1) являются в известном смысле одинаковыми, для определения их свойств может быть исследован обобщенный процесс (рис. 1)

{§,Нз (*)} = т } . (2)

Рис. 1: Полумарковский процесс (а) и древовидная структура (Ь), поясняющая формирование гамильтонова пути.

Множество состояний процесса (2) имеет вид:

2 = {£о(5),£1(5),...,й(5),...,Ь(3),Ь(3)+4 , (3)

где Со(з) — состояния, моделирующее начальный пункт движения (точку старта соревнования); ^(н)+1 — поглощающее состояния, моделирующие конечный пункт движения (точку финиша соревнования); £1(3),..., Сг(з), -., О(з) — состояния, моделирующие контрольные пункты соревнования.

Вследствие допущения 4) исключающего возврат в ранее пройденные контрольные пункты, на полумарковские матрицы из (1)

Ьз (*) = Рз ® /з = [Ь(3),](3) №] = [Рг(3)^(3) ■ Мз),т №] ,

(4)

где рз — стохастическая матрица; /з (¿) — матрица плотностей распределения; р^з)^(з), /г(з)^(з) (¿) — вероятность и плотность распределения времени пребывания полумарковского процесса в состоянии Сг(з) с последующим переключением в состояние ^(з), накладываются следующие ограничения:

'Рг(3),](3)

= 0, wheш (2) = 0, $ (2) = 3 (2) + 1, оп (2) = з (2), оп (2) = 3 (2) + 1; = 1, wheш (2) = 3 (2), 3 (2) = 3 (2) + 1; = 0otherwise;

Е Рг(з),Я.

3(3)=0

1, wheш (2) = 3 (2) + 1;

0, wheш (2) = 3 (2) + 1;

(5)

= lim^^ 5 (t — ■&), whern (S) = 0, j (S) = J (S) + 1,

( . oh (s) = j (S), orf(S) = J (S) + 1; (7)

И(з),](з) 5 (t) , wheni (S) = 0,j (S) < J (S): (7) = limr^^ 5 (t — т) otherwise,

где § — вспомогательный параметр, имеющий размерность времени; 5 (t) — ¿-функция Дирака.

Как следует из (1), априорная модель представляет собой 2-параллельный полумарковский процесс [16] с ограничениями (5) - (7), эволюция которого происходит следующим образом. Из исходного состояния £о(з) полумарковский процесс (2) переключается в одно из состояний подмножества (£цз), ...,£¿(3),..., (з)}, причем в соответствии с допущением 4) в это состояние при дальнейшей эволюции процесс больше не возвращается. Эволюция завершается, когда полумарковский процесс, побывав во всех без исключения состояниях подмножества {£i(3), ...,Ci(s), ...,£j(s)}, достигает поглощающего состояния (j(s)+i. Подобный характер эволюции указывает на то, что маршрут представляют собой прокладываемый субъектом из пункта £о(з) в пункт (3)+i гамильтонов путь [17, 18, 19], который может быть представлены в виде вектора

Нп(3) = [£o(3),£l[Я,ra(3)], ...,(г[H,n(S)], -n^J[Н,п(3)], £j(3)+i] ; (8)

где п (S) — номер возможного сформированного гамильтонова пути; {¿[Яга(з)] G {£i(3),-., &(з),».,6(з)}; 1[Н,п (S)] < i [Н,п (S)] < J [Н,п (S)].

Индексы в элементах вектора (8) не повторяется, следовательно, указанное множество векторов формируется путем перестановок элементов {£1(3), -.,£¿(3), ...,(j(3)}. Общее количество перестановок равно

N (S) = J (S)!. (9)

Плотность распределения времени достижения поглощающего состояния £j(3)+i из стартового состояния по гамильтонову пути (7) определяются по зависимости:

fn(3) (t) = L

i

J[H,n(3)]

П L [fi[H,n(3)] W]

i[H,n(3)] = i[H,n(3)]

(10)

где /¿[н,п(з)| (*) е /з (*), 1 [Н, п (2)] < г [Н,п (2)] < 3 [Н,п (2)].

Для определения вероятностей движения по гамильтоновым путям следует доказать утверждение. Факты достижения поглощающего состояния £^з)+1 из их стартового состояния £о(з) при блуждании по полумарковскому процессу (2) по всем возможным гамиль-тоновым путям (8) образуют полную группу несовместных событий [20, 21].

Доказательство. Несовместность событий следует из определения гамильтонова пути и утверждения, что все возможные пути подобного типа формируются за счет перестановок элементов в векторе (8). Перестановки не повторяются, следовательно, события несовместны.

Для доказательства полноты группы событий достаточно показать, что сумма вероятностей формирования всех возможных гамильтоновых путей на графах, определяющих структуры полумарковских процессов (1), равна единице.

Полнота группы доказывается методом математической индукции. Базой индукции является простейший полумарковский процесс 1^з с множеством состояний

i

= (Со, 6,6} , (11)

стохастическая матрица которого имеет вид:

0 i Po,i 0

ip = I 0 0 iPi,2 I , (12)

0 0 0

где выполняется ограничение (6), т.е. 1р0>1=1р1>2=1 (принадлежность индекса (2) для краткости опущена).

В процессе существует единственный гамильтонов путь

= [со , £ъ6].

(13)

Вероятность достижения ^2(Е) из £о(з) по единственному пути равна единице, т.е. для базы индукции утверждение выполняется.

Шагом индукции является добавление в полумарковский процесс четвертого состояния, после чего

V- ^ 2^з; (14)

^ ^ (15)

1 2

Р ^ р

22 = {со ^Ъ^ы

/ 0 2 Р0,1 2Р0,2 0 \

0 0 2Р1,2 2Р1,3

0 2 Р2,1 0 2Р2,3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V 0 0 00 )

(16)

где выполняется ограничение (6), т.е. 2р0,1 + 2р0,2 = 1; 2р1,2 + 2р1,3 = 1; 2р2,1 + 2Р2,3 = 1. В полумарковском процессе 2существует два гамильтоновых пути:

первый путь формируется, когда с вероятностью 2ро,1 процесс переключается в состояние второй путь формируется, когда с вероятностью 2ро2 процесс переключается в состояние

6.

В первом случае, поскольку последующий возврат в состояние £1 невозможен, вероятность переключения в £3 из £2 определяется по зависимости

2~ 2Р2,з

2Р2,3 = ,

= 1.

1 - 2Р2,1

Во втором случае, поскольку последующий возврат в состояние £2 невозможен, вероятность переключения в £3 из £1 определяется по зависимости

Р1,3

2Р\,з

1 - 2Р1,2

= 1.

Таким образом, гамильтоновы пути 2Н1 = [£0, £1, (2, £3] и 2Н2 = [^0,^2,^1,^3], выбираемые с вероятностями 2ро,1 и 2Ро,2, с вероятностями 1 каждый ведут в состояние £3. Но 2ро,1+2Ро,2 = 1, значит и в этом случае событья выбора гамильтоновых путей 2Н1 и 2Н2 составляют полную группу.

Для завершения доказательства следует предположить, что утверждение выполняется для полумарковского процесса 3 у,- с множеством состояний

2 = |£о,6,...,&,...,6- ,£з+1} , (17)

стохастическая матрица которого имеет вид:

3 р =

( 0 3Р0,1 ... 3 Р0,г ... \\ Р0,з 0 \

0 0 ... 3 Р1,г ... 3Р1,3 j Ри+1

0 3Рг,1 ... 0 ... j Рг,3 j Рг,3+1

0 ^3,1 ... 3 Р],г ... 0 j Рз,з+1

V 0 0 ... 0 ... 0 0 /

(18)

где выполняются ограничение (6), т.е. 3Р1^ = 1, 0 ^ I ^ ].

В процессе 3существует N = ^! гамильтоновых путей Нп = [{о, (1[н,п], ...,(г[н,п],..., С3[н,п], £3+1 ], вида (8) каждый из которых получается в результате перестановок элементов н,п] € {^1, ...,^г,...,£3}. Вероятность достижения £3+1 из £о по одному из возможных путей, по предположению, равна единице.

Шагом индукции является добавление в полумарковский процесс 3 состояния £3+2, после чего

(19)

(20)

^ 3+1 ^

j+U

= {^{ъ ...^и ...,ij Л]+1 ^^

j p

d+i

p =

/ 0 3+1Р0,1 ... 3+1P0,i . . i+1P0,j 3+1Po, 3 0 \

0 0 ... 3+1p1,i . . 3+1Р1,3 3+1Po,3+1 3+1P0,3+2

0 3+1РИ ... 0. . 1+1Рг,1 3+1Pi,3+1 3+1Pi, 3+2

0 3+1р3,1 ... 3+1p3,i . . j+1Pj,i j+1Pi,i+1 3+1P3, 3+2

0 3+1р,+1,1 ... 3+hPJ+1,i . . i+1Pj+U 3+hPj+1,j+1 3+1 Pj+U+2

V 0 0 ... 0. .. 0 0 0 /

где выполняется ограничение (6), т.е. ^{+13+1Р1,г = 1, 0 ^ I ^ ] + 1.

В полумарковском процессе 3+1 существует + 1)! гамильтоновых путей, начинающихся в £о и оканчивающихся £3+2, в том числе по путей, которые могут быть сформированы после первого переключения из £о в 1 ^ г ^ ] + 1 с вероятностью 3+1ро,г на подмножестве {£1,..., £¿-1, £¿+1,..., £7, £3'+ъ£3+2}. Вследствие того, что возврат в ^ из состояний подмножества {£1, ...,£^1,^+1, , £3+ъ£3+2} невозможен (по определению гамильтонова пути) вероятности переключения в остальные состояния подмножества должны быть пересчитаны по зависимости

3+1Pi,k =

+l

Pi,k

0 ^ l,k ^ j + 1,1, к = i.

(21)

1 - 2Pi,i

При этом очевидно, что ограничение (6), накладываемое на значения вероятностей, сохра-

няется, т.е.

+2

Е

к = 1 к = г

3+1Pi,k = 1, 0 < I < j + 1,1 = i.

(22)

са 3+1 д

Это, в свою очередь, означает, что после первого переключения полумарковского процесс вероятностями 3+1ро,г формируется з + 1 полумарковских процессов, для каждого из которых, в соответствии с предположением, выполняется условие утверждения. Но 3+1Ро,г = 1, и это означает, что сумма вероятностей достижения состояния £3+2 по всем возможным гамильтоновым путям равна единице, что и доказывает утверждение.

Следствие из утверждения. Процесс движения по гамильтонову пути не является строго полумарковским, так как после каждого переключения в состояние ^ оно исключается из дальнейшего возможного продолжения пути, и вероятности переключения в оставшиеся состояния-претенденты на гамильтонов путь должны быть пересчитаны, чтобы выполнялось условие (6). Таким образом, вероятности каждого следующего переключения, в соответствии с доказанным утверждением, зависят от предыстории процесса.

С использованием доказанного утверждения и следствия из него может быть получена рекурсивная процедура расчета вероятностей формирования гамильтонова пути Нпгв\, аналогичная изложенной в [22], В соответствии с ней полумарковский процесс преобразуется в

процесс с древовидной структурой, показанный на рис. 1 Ь. Без нарушения общности можно стшатц что в гамильтоновом пути (8) С1[Я,п(3)| = 6(3), ..., &[Н,п(3)] = 6(3), ..., &[Н,п(3)] = &(3). Рекурсивная процедура заключается в следующем.

На первом шаге рекурсии вероятность переключения в состояние £1(3) определяется как

о

Ро[3],1[3] = Р1[Н,(п)] = РоНД^ (23)

После первого переключения состояние ^1[н,п(3)] = £1(3) уже не может быть включено в гамильтонов путь, поэтому вероятности дальнейших возможных переключений должны быть пересчитаны по формуле

о»

^(3),Л3) = 1 о^?3! ,, 2 (2) < < (2), з (2) < 2 (5), (24)

1 - Рг(3),1(3)

где °Рт,](3) = Рг(3)^(3), 1 (2) < г(2) (2) < 2 (2).

При втором переключении вероятность перехода в состояние £1(3) определяется как

1Р1[3],2[3] = Р2[Н,(п)]. (25)

Пересчет вероятностей после второго переключения осуществляется по формуле

2Рг(3Ы3) = , гТ,т , 3 (2) < * (2), з (2) < 2 (2). (26)

1 - 1Рг(3),1(3)

При I-м переключении вероятность перехода в состояние £¿(3) определяется как

1 №[3]-1,г[3] = Р1[н,(п)]. (27)

Пересчет вероятностей после I-го переключения осуществляется по формуле

1+1Рг(3Ы3) = ,1 (2) + 1 < i (2) ,3 (2) < 2 (2). (28)

1 - Й(3),1(3)

И наконец, при (,7+1)-м переключении вероятность перехода в состояние £7(3)+! равна единице, поскольку 0(3) и (3)+1 являются предпоследним и последним состояниями п-го гамильтонова пути.

В итоге вероятность выбора гамильтонова пути (8), плотность распределения времени движения по которому рассчитывается по зависимости (10), равна

7 [Н,п(3)]

Рп(3) (*) = П Рг[Н,п(3)]. (29)

г[Н,п(3)] = 1[Н,п(3)]

Общая плотность распределения времени достижения £7+1 из ^ по одному из возможных гамильтоновых путей определяется стохастическим суммированием плотностей (10):

"(3)

/3 (*)= ^ Рп(3)/п(3) (I) . (30)

п(3) = 1

Следует отметить, что в (30) формируется чистая плотность распределения, £7+1 из ^.

Оценка эффективности соревнований со свободным выбором маршрута

Для оценки эффективности соревнования между участниками А и В следует определить, для какого из субъектов оценивается эффективность. Ниже рассчитывается эффективность стратегии участника А, который определяет свой порядок прохождения контрольных пунктов маршрута. Без нарушения общности можно предположить, что порядок прохождения маршрута указанным субъектом является жестким и определяется как

На = [ao(A),al(A), ...,aг(A), ...,aj(A),aJ(A)+^ = (31)

где аг(А) € А — состояния полумарковского процесса /л а.

С точки зрения субъекта А маршрут субъекта В является случайным, о котором известно только то, что он представляет собой гамильтонов путь с номером п(В), и поэтому

Нп(в) = [bo(b),bl[H,n(B)], ...,bг[H,n(B)], ...,b.J[H,n(b)],ЬJ(B)+l] , (32)

где Ьцн,п(в)] € В — состояния полумарковского процесса цв.

Полумарковские процессы являются дискретными, и поэтому распределения времени пребывания в состояниях определяются как для гамильтонова пути На -

к

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/¿(А) = Рк[ЦЛ)]5 ^ - т ■к [г (А)]), (33)

к[г(А)]=0

где т — шаг дискретизации, одинаковый для всех распределений; Рк[г(А)] — значения отсчетов; ^Кг(А)]=о Рк[г(А)] = 1; й (¿) — ¿-функция Дирака; К — общее количество отсчетов в дискретном распределении, одинаковое для всех распределений. для гамильтонова пути Нп(в) -

к

/ ¿[ н,п(в)] = ^ Рк{1 [н,п(в)]}£ (* - Т ■к {г [Н,п (В)]}), (34)

к{ г [Н,п(в)]}=0

к

где Рк{г[Н,п(в)]} — значения отсчетов^К{г[н,п(в)]}=о Рк{г[ н,п(в)]} = 1.

Индексы при значениях отсчетов распределений (33), (34) могут быть сведены в следующие множества, упорядоченные по возрастанию:

Хг(А) = (1 [г (А)] ,..., к [г (А)] ,..., К [г (А)]); (35)

*г[н,п(в)] = [1 (г [Н, п (В)]),..., к (г [Н, п (В)]),..., К (г [Н, п (Б)])]. (36)

Декартовы произведения множеств (35), (36) дают множества детерминированных реализаций гамильтоновых путей;

Ц..а5)=1(А) Хг(А) = {(0 [1 (А)] ,..., 0 [г (А)],..., 0 [7 (А)]),..., (к [1 (А)],..., к [г (А)],..., к [.7 (А)]),..., (К [1 (А)],..., К [г (А)] ,..., К [.7 (А)])} = (37) = {1(Х,А),..., к(Х,А),..., К (Х,А)} ;

Ц^^в)] Хг[н,п(в)] = {[0 (1 [Н, п (В)]),..., 0 (г [Н, п (В)]),..., 0 (.7 [Н, п (Б)])] ,

..., к (1 [Н, п (В)]),..., к (г [Н, п (В)]),..., к (.7 [Н, п (В)]),..., (38)

К (1 [Н, п (В)]),..., К (г[Н,п (В)]),..., К (.7 [Н,п (Б)])] = = {1 [Х, п (В)] ,..., к [Х, п (В)] ,..., К [Х, п (В)]} ,

где к (Х,А), к [Х,п (В)] — индексы-векторы, определяющие номер реализации маршрутов.

Каждый выбранный маршрут предполагает его прохождение по жесткому расписанию. Общее количество выбранных маршрутов равно

IK (Х,А)1 = IK [Х,п (ß)]| = Kj.

(39)

где |...| — мощность множества.

Вероятности формирования к (X, А)-й и к [X, п (В)]-й реализаций маршрутов и плотности распределения времени движения по ним определяются по зависимостям:

J (А)

Рк(Х,А) = П

i (Л) = 1(Л)

к [г (А)] е к (X, А)

Рк[г(А)]'; Рк[Х,п(В)]

Л [Н,п(В)]

п

i [Н,п (В)] = 1[Н,п (В)] к (г [Н,п (В)]) е к [Х,п (В)]

Рк(г[Н,'п(В)]);

(

fk(X,A) (t) = S

t -

J(A)

Щг(А)]

i (A) = 1(A)

v к [г (А)] е к (X, А)

(

; fk[x,n(B)] (t) = ö

/

(40) \

J [Н,п(В)]

t -

Е

Tk(i[H,n(B)])

г [Н,п (В)] = 1[Н,п (В)] V к (i [Н,п (В)]) е к [Х,п (В)]

/

Выделение к (X, А)-й и к [X, п (В)] реализаций маршрутов позволяет оценим штраф, который субъект A получает от субъекта B. Введем вспомогательные переменные в (А) и в (В), которые имеют размерность времени. Рекурсивная процедура начинается в функциональном состоянии [0 (А), 0 (5)], при этом ни одного переключения сделано не было, и r = 0.

На первой шаге рекурсии должна быть выполнена подстановка во (А) := тща)] и в* (В) := тк(1[н,п(В)]) и временные интервалы в0 (А), в0 (В) начинают соревноваться между собой. Возможный исход соревнования определяется следующим образом:

a) если в0 (А)<в0 (В), то побеждает субъект A, и 6* = {9* (А)} = min {в0 (А) ,в0 (В)}, в** := в* (А), г = 1;

b) если во (А)>во (В), то побеждает субъект B, и 6* = {0* (В)} = min {в0 (А) ,в0 (В)}, в* := в* (В), г = 1;

c) если во (А)=во (В), то имеет место эффект ничьей и 6* = {0* (А) , 0* (В)} = min {в0 (А), в* (В)}, 0* := в* (А) = в* (В), г = 2.

Сумма штрафа определяется по зависимости [13. 14]:

Ск(Х,А),к[Х,п(В)],0 = с1(А),1[Н,п(В)] (t) dt, *

(41)

где С1А),1\нп(в)] Ю — дисциплина штрафования субъектом А субъекта В, если субъекты находятся в первых состояниях гамильтоновых путей; Ск(Х,А),к[х,п(Б)],о — штраф, который получает субъект А от субъекта В, если первый субъект реализует к (X, А)-ю траекторию, второй субъект реализует к [Х,п (В)]-ю траекторию, и не было никаких переключений, кроме переключения в первые состояния гамильтоновых путей (г = 0).

Для подготовки следующего этапа рекурсии должны быть сделаны следующие подстановки:

индексы интервалов во (А), во (В), и элемента Аца)!^) (¿) должны быть заменены на следующие -

г := 0 + г; (42)

: (А) + 1тШеса8еа),с); ! (А) тЛесавеа);

г (А) :=

- {::

(43)

г ( В) •={ ^(В) + 11п1Ьеса8еЬ),с); /44)

( \ В) тЛееавеа);

временные интервалы, которые будут соревноваться далее, должны быть скорректированы следующим образом -

(А):—i r2(^)ntheiaStebSa)'C)M (45)

'v ' \ ft0 (А) - ft*inthecaseb); v '

ft ( R) — i T(B)inthecasesb),c) (46)

s (В) \ fto ( А) - ft*inthecasea); ( )

Таким образом, на второй фазе рекурсии будут соревноваться жесткие временные интервалы ftr (А) и ftr (В), где r определяется по зависимости (42).

Допустим, что на очередной фазе рекурсии, после r переключений вектор функционального состояния имеет вид [г (А), г (В)], и между собой соревнуются временные интервалы ftr ( А) и ftr ( В), которые, также, как и индекс r, формируются на предыдущих фазах рекурсии. Результаты соревнования выражаются следующим образом:

a) если 0г(А)<ftr ( В), то выигрывает субъект A, и в* — {ft* ( А)} — min {ftr ( А) , ftr ( В)}, ft* :— ft** ( А), f — 1;

b) если ftr (А)>ftr ( В), то выигрывает субъект B, и в* — {ft* (В)} — min {ftr ( А) , ftr ( В)}, ft* :— ft* ( В), f — 1;

c) если ftr ( А)= ftr (В), то имеет место эффект ничьей в* — {ft* ( А), ft* (В)} — min {ftr (А), ftr (В)}, f —2.

Величина штрафа рассчитывается следующим образом:

гК

Ck(X,A),k[X,n(B)],r — / сг(А),г\Н,п(В)] (t) dt. (47)

o

Для подготовки следующей фазы рекурсии должны быть сделаны следующие подстановки:

г — г + f; (48)

индексы распределенного штрафа с^а) j(B) (t) должны быть изменены в соответствии с (43), (44);

временные интервалы, которые будут участвовать в соревновании дальше, определяются выражениями:

ftr (А):—{ W^ftt^T^ (49)

r ( А) - r*inthecaseb);

ftr (В):— { Tt(B]lntheecas!sb),c)\ (50)

у ' \ ftr ( А) - ft*inthecasea). v 7

Допустим, что на последней стадии рекурсии на маршруте остается только субъект А, и остаток времени, который он тратит на преодоление ]-го этапа равен 0*к_ 1. Величина штрафа рассчитывается следующим образом:

Г 0*к-1

Ск(Х,А),к[Х,п(В)],К-1 = / О(А)-1^[Н,п(В)] (^М (51)

Общая сумма штрафа, который субъект А получает от субъекта В определяется последовательно: суммированием штрафов по стадиям маршрута, стохастическим суммированием по траекториям и стохастическим суммированием по маршрутам по зависимости

Г (В) [Х,п(В)] (Х,А)

= 2^ п(В) Рп(В) ' 2-*к[Х,п(В)\ = 1[Х,п(В)\ Рк[Х,п(В)\ ' 2^к(Х,А) = 1(Х,А) Рк(Х,А)Х (52)

Ск(Х,А),к[Х,п(В)],г, где рп(в) рассчитывается по зависимости (29).

Заключение

Мы представили соревнование как прохождение контрольных пунктов в произвольном порядке. Поскольку в этой игре сумма штрафа зависит от сочетания пунктов, в которых в настоящее время находятся участники соревнования, выбор порядка прохождения контрольных пунктов существенно влияет на сумму штрафа, а значит, вектор гамильтонова пути может быть варьируемой дискретной переменной в задаче оптимизации. Рекуррентная процедура оценки суммы штрафа является ключом к формированию оптимальных маршрутов обхода контрольных пунктов. Дальнейшие исследования в данной области могут быть направлены как на решение общей задачи поиска указанных стратегий, так и на разработку прикладных алгоритмов оптимизации поведения участников соревнования при прохождении маршрута. Исследование выполнено при финансовой поддержке РФФИ по проекту 19-47-710004_р_а.

СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ

1. Haefner J. W. Parallel computers and individual-based models: an overview // Individual-based models and approaches in ecology, Chapman and Hall/CRC, 2018, pp. 126 - 164.

2. Gupta C.B., Optimization techniques in operation research, 2-nd Kindle edition. U.K. International Publishing House, 2012, 386 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Wooldridge M., An Introduction to Multi-Agent Systems. 2nd Edition. Chichester, U.K: John Wiley & Sons, 2009, 484 p.

4. Deng C. et all., An effective grid-based and density-based spatial clustering algorithm to support parallel computing // Pattern Recognition Letters, 2018, vol. 109. pp.. 81 - 88.

5. Pinedo M.L., Scheduling. Theory: Algorithms and systems // Springer. Science+Business media, 2016, 670 p.

6. Khodr Y.M., Scheduling Problems and Solutions (Computer Science, Technology and Application) // Nova Science Pub Inc., 2012, 330 p.

7. Drozdowski M., Scheduling for Parallel Processing (Computer Communications and Networks) // Springer, 2009, 386 p.

8. Gawiejnowicz S., Time-Dependent Scheduling (Monographs in Theoretical Computer Science. An EATCS Series). Springer, 2008, 380 p.

9. Ching W.K., Huang X., Ng M.K., Siu T.K., Markov Chains: Models, Algorithms and Applications /// International Series in Operations Research & Management Science, 2013, vol. 189, Springer Science + Business Media NY, 241 p.

10. Yang T., Zhang L., Yin X., Time-varying gain-scheduling-error mean square stabilization of semi-Markov jump linear systems // IET Control Theory & Applications, 2016, vol. 10. Iss. 11, pp. 1215 - 1223.

11. Jiang Q., Xi H.-S., Yin B.-Q., Event-driven semi-Markov switching state-space control processes // IET Control Theory & Applications vol. 6, Iss. 12, 2012, pp. 1861 - 1869.

12. Janssen J., Manca R., Applied Semi-Markov processes // Springer US, 2005, 310 p.

13. Ivutin A.N, Larkin E.V., Simulation of Concurrent Games // Bulletin of the South Ural State University. Series: Mathematical Modelling, Programming and Computer Software, Chelyabinsk, 2015, vol. 8. no. 2, pp. 43 - 54.

14. Larkin E.V., Ivutin A.N., Kotov V.V., Privalov A.N., Simulation of Relay-races // Bulletin of the South Ural State University. Mathematical Modelling, Programming & Computer Software, 2016, vol. 9, no. 4, pp. 117 - 128.

15. Larkin E., Bogomolov A., Privalov A., Discrete model of mobile robot assemble fault-tolerance // Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2019, vol. 11659 LNAI, pp. 204-215.

16. Akimenko, T.A., Larkin, E.V., The temporal characteristics of a wandering along parallel semi-Markov chains // Communications in Computer and Information Science. 4th International Conference on Data Mining and Big Data, Chiang Mai; Thailand, 2019, vol. 1071, pp. 80-89.

17. Bielecki T.R., Jakubowski J., Nieweglowski M., Conditional Markov chains: Properties, construction and structured dependence // Stochastic Processes and their Applications, 2017, vol. 127, no 4, pp. 1125-1170.

18. Deo N., Graph theory with applications to Engineering and computer science // N.Y.: Dover Publications, 2016, 496 p.

19. Oltean M., A light-based device for solving the Hamiltonian path problem // Unconventional Computing. Lecture Notes in Computer Science. Unconventional Computing, 2006, vol. 4135 Springer LNCS, pp. 217-227.

20. Bjorklund A., Determinant sums for undirected Hamiltonicity // Proc. 51-st IEEE Symposium on Foundations of Computer Science (FOCS '10), 2010, pp. 173-182.

21. Kobayashi H., Marl B.L., Turin W., Probability, Random Processes and Statistical Analysis // Cambridge University Press, 2012, 812 p.

22. Grimmett G.R., Stirzaker D.R., Probability and Random Processes // Oxford: Clarendon Press, 2001, 608 p.

23. Larkin E.V., Ivutin A.N., Troshina A., Model of interruptions in Swarm unit // Advances in swarm intelligence. Proceedings of 8-th International conference ICSI, Fukuoka, Japan. 2017, part 1, pp. 50 - 59.

REFERENCES

1. Haefner J. W., 2018, "Parallel computers and individual-based models: an overview" In: Individual-based models and approaches in ecology, Chapman and Hall/CRC, pp. 126 - 164.

2. Gupta C.B., 2012, Optimization techniques in operation research, 2-nd Kindle edition. U.K. International Publishing House, 386 p.

3. Wooldridge M., 2009, An Introduction to Multi-Agent Systems. 2nd Edition. Chichester, U.K: John Wiley & Sons, 484 p.

4. Deng C. et all., 2018, An effective grid-based and density-based spatial clustering algorithm to support parallel computing, In: Pattern Recognition Letters, vol. 109. pp.. 81 - 88.

5. Pinedo M.L., 2016, Scheduling. Theory: Algorithms and systems, Springer. Science+Business media, 670 p.

6. Khodr Y.M., 2012, Scheduling Problems and Solutions (Computer Science, Technology and Application), Nova Science Pub Inc., 330 p.

7. Drozdowski M., 2009, Scheduling for Parallel Processing (Computer Communications and Networks), Springer, 386 p.

8. Gawiejnowicz S., 2008, Time-Dependent Scheduling (Monographs in Theoretical Computer Science. An EATCS Series). Springer, 380 p.

9. Ching W.K., Huang X., Ng M.K., Siu T.K., 2013, Markov Chains: Models, Algorithms and Applications, In: International Series in Operations Research & Management Science, vol. 189, Springer Science + Business Media NY, 241 p.

10. Yang T., Zhang L., Yin X., 2016, Time-varying gain-scheduling-error mean square stabilization of semi-Markov jump linear systems In: IET Control Theory & Applications, vol. 10. Iss. 11, pp. 1215 - 1223.

11. Jiang Q., Xi H.-S., Yin B.-Q., 2012, Event-driven semi-Markov switching state-space control processes, In: IET Control Theory & Applications, vol. 6, Iss. 12, pp. 1861 - 1869.

12. Janssen J., Manca R., 2005, Applied Semi-Markov processes. Springer US, 310 p.

13. Ivutin A.N, Larkin E.V., 2015, Simulation of Concurrent Games In: Bulletin of the South Ural State University. Series: Mathematical Modelling, Programming and Computer Software, Chelyabinsk, vol. 8. no. 2, pp. 43 - 54.

14. Larkin E.V., Ivutin A.N., Kotov V.V., Privalov A.N., 2016, Simulation of Relay-races In: Bulletin of the South Ural State University. Mathematical Modelling, Programming & Computer Software, vol. 9, no. 4, pp. 117 - 128.

15. Larkin E., Bogomolov A., Privalov A., 2019, Discrete model of mobile robot assemble fault-tolerance In: Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol. 11659 LNAI, pp. 204-215.

16. Akimenko, T.A., Larkin, E.V., 2019, The temporal characteristics of a wandering along parallel semi-Markov chains In: Communications in Computer and Information Science. 4th International Conference on Data Mini ng and Big Data, Chiang Mai; Thailand, vol. 1071, pp. 80-89.

17. Bielecki T.R., Jakubowski J., Nieweglowski M., 2017, Conditional Markov chains: Properties, construction and structured dependence In: Stochastic Processes and their Applications, vol. 127, no 4, pp. 1125-1170.

18. Deo N., 2016, Graph theory with applications to Engineering and computer science. N.Y.: Dover Publications, 496 p.

19. Oltean M., 2006, A light-based device for solving the Hamiltonian path problem In: Unconventional Computing. Lecture Notes in Computer Science. Unconventional Computing, vol. 4135 Springer LNCS, pp. 217-227.

20. Bjorklund A., 2010, Determinant sums for undirected Hamiltonicity In: Proc. 51-st IEEE Symposium on Foundations of Computer Science (FOCS '10), pp. 173-182.

21. Kobayashi H., Marl B.L., Turin W., 2012, Probability, Random Processes and Statistical Analysis, Cambridge University Press, 812 p.

22. Grimmett G.R., Stirzaker D.R., 2001, Probability and Random Processes, Oxford: Clarendon Press, 608 p.

23. Larkin E.V., Ivutin A.N., Troshina A., 2017, Model of interruptions in Swarm unit In: Advances in swarm intelligence. Proceedings of 8-th International conference ICSI 2017, Fukuoka, Japan. part 1, pp. 50 - 59.

i Надоели баннеры? Вы всегда можете отключить рекламу.