Научная статья на тему 'Модель решения задач в автоматизированной информационной системе'

Модель решения задач в автоматизированной информационной системе Текст научной статьи по специальности «Математика»

CC BY
144
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ РЕШЕНИЯ ЗАДАЧ / АВТОМАТИЗИРОВАННЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ / ФУНКЦИЯ / АГРЕГАТИВНЫЙ ПОДХОД

Аннотация научной статьи по математике, автор научной работы — Иванов А. Ю.

Разработана модель обработки запросов к распределению баз данных для автоматизированных информационных систем. Использован агрегативный подход для разработки систем; в качестве агрегатов применены объекты, с помощью которых генерируются и преобразуются моделируемые процессы. Показана динамическая связь между этими агрегатами. Разработана структурная схема модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модель решения задач в автоматизированной информационной системе»

МОДЕЛЬ РЕШЕНИЯ ЗАДАЧ В АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННОЙ СИСТЕМЕ

А. Ю. Иванов, кандидат технических наук, доцент. Санкт-Петербургский университет ГПС МЧС России

Разработана модель обработки запросов к распределению баз данных для автоматизированных информационных систем. Использован агрегативный подход для разработки систем; в качестве агрегатов применены объекты, с помощью которых генерируются и преобразуются моделируемые процессы. Показана динамическая связь между этими агрегатами. Разработана структурная схема модели.

Ключевые слова: модель решения задач, автоматизированные информационные системы, функция, агрегативный подход

В настоящее время интенсивно проводятся работы в сфере комплексной информатизации управления в МЧС. Основу процессов информатизации составят автоматизированные информационные системы (АИС). Цель внедрения этих систем в практику управления состоит в повышении оперативности и обоснованности принимаемых решений за счет более полного использования информации. Накопление, хранение и выдачу информации для решения задач управления в автоматизированном режиме обеспечивают базы данных. Территориальная рассредоточенность элементов системы управления МЧС определяет необходимость построения и использования распределенных баз данных (РБД). Очевидно, что временные показатели процессов решения задач в существенной степени зависят от характеристик РБД. В связи с этим оценка оперативности АИС и своевременности информационного процесса в системе управления требует построения и использования двухуровневого комплекса математических моделей. На нижнем уровне анализу подлежит процесс обработки запросов к РБД с целью оценки реактивности базы данных. Результаты этой оценки должны выступать в качестве исходных данных для получения интегрированных характеристик на верхнем уровне - при получении вероятностно-временных показателей процесса решения задач управления в АИС.

Модель обработки запросов к распределенной базе данных

По характеру функционирования АИС относятся к стохастическим сетям массового обслуживания (СеМО). Сеть представляет собой совокупность взаимосвязанных систем массового обслуживания (СМО), каждая из которых интерпретирует один из элементов АИС.

Основным показателем оперативности функционирования подобных сетей является функция распределения времени между поступлением и удовлетворением запроса и/или его моменты [1].

Стохастическая СеМО, определяется следующей совокупностью характеристик [2-4]:

1) множеством СМО {8^8^...^}, образующих сеть;

2) числом каналов К1,К2,..,КП в системах 8ь82,...,8„, соответственно;

3) матрицей траекторий движения заявок Я=||ги||, где Гу - номер СМО, на которую переходит заявка, продвигающаяся по /-му пути на]-й фазе обслуживания при детерминированной процедуре маршрутизации, или матрицей вероятностей перехода заявок из одной СМО в другую Р =||ру||, где Ру - вероятность того, что заявка, покидающая 8;, поступает в 8];

4) числом заявок, циркулирующих в замкнутой сети (2);

5) интенсивностью источников заявок в разомкнутой сети Л={Л/к)}, где у - тип заявки; к - категория срочности;

6) законами распределения времени Г1(к)), Г2(к)^),...,к)^) и дисциплинами

обслуживания заявок в системах 81, 82,.., 8п.

Элементами, участвующими в обработке запросов к РБД и представляющими различные СМО, являются:

1) сети передачи данных (моноканалы - МК) локальных вычислительных сетей, входящих в состав общей сети АИС;

2) серверы базы данных (СБД), на которых размещены ФД;

3) коммутационные устройства (КУ), обеспечивающие обмен данными между удаленными узлами;

4) каналы передачи данных (КПД).

Помимо числа обслуживающих приборов, каждый тип СМО характеризуется следующими параметрами:

1) интенсивностью обслуживания заявок ), где / - тип системы, ] - тип заявки, к -

ее категория срочности;

2) длиной очереди (если таковая имеется);

3) интенсивностями входного А(к и выходного ЛЫ потоков заявок;

4) механизмом дообслуживания прерванных заявок

Заявки описываются вектором V = ({, к, 7, ё, а1 .а2), где ^ - время поступления заявки в СеМО, к - категория срочности, 7 - тип, ё - длина, а} и а2 - адреса отправителя и получателя соответственно.

Расчет показателей реактивности РБД сводится к отысканию функции распределения времени пребывания заявок в СеМО. Как показано в теории распределений [5, 6], для удовлетворительного описания функции распределения случайной величины достаточно найти первые четыре центральные момента этой величины и при необходимости аппроксимировать закон распределения с помощью семейств кривых.

При построении модели целесообразно применить агрегативный подход. В качестве агрегатов выступают объекты, с помощью которых генерируются и преобразуются моделируемые процессы. Для моделирования процесса обработки запросов к РБД, представленной в виде СеМО, в качестве агрегатов выступают: источники заявок, системы массового обслуживания и управляющие процедуры.

Учитывая конкретную предметную область, можно выделить конечное множество типовых агрегатов - СМО, интерпретирующих элементы АИС, а также источники заявок в соответствии с типами запросов, поступающих в систему. По своей сути эти агрегаты представляют собой модели источников запросов и элементов АИС.

Динамические связи между этими агрегатами осуществляются с помощью процедуры, моделирующей процесс движения заявок и выполняющей функции коммутации входов и выходов агрегатов. Структурная схема модели, представленной с помощью агрегативного подхода, показана на рис. 1.

В качестве выходных переменных (результатов моделирования) могут выступать значения показателей реактивности РБД (среднее время отклика на запросы), а также дополнительные характеристики, необходимые для работы модели верхнего уровня. К ним относятся функции распределения и моменты времени пребывания в сети заявок каждого типа и категории срочности.

Описание • структуры

Значения показателей реактивности РБД

Рис. 1. Структурная схема модели процесса обработки запросов к РБД

Модель решения задач в АИС

В модели верхнего уровня процесс решения задачи в АИС представляется ориентированным графом, узлы которого отображают операции по обработке запросов к РБД, а дуги - связи между операциями (рис. 2)

Рис. 2. Граф процесса решения задачи

Узел 0 является начальным, а узел к+1 - конечным. Каждому узлу ставится в соответствие вектор, определяющий параметры закона распределения времени его обработки. Дуги характеризуются вероятностями рк1 перехода от к-го запроса к /-му

(к = 0, К; / = 1, К +1). Если из узла выходит единственная дуга, то переход по ней идет с вероятностью, равной 1. Если из узла выходит несколько дуг (к,/), (к,ш),...,(к,м?), то выбор направления рассматривается как случайное событие, характеризуемое вероятностями

w

исходовРк/, ры.,-,р*м, причем ^р^ = 1.

]=/

Определение вероятностно-временных показателей решения задач в АИС состоит в нахождении значений функции распределения времени по характеристикам элементов модели.

Исследование представленной модели возможно с помощью аппарата марковских цепей [7]. При этом задача сводится к расчету числовых характеристик многомерной случайной величины Х=(х1, х2,_,хм) - количества попаданий случайного процесса в

состояния 81, ___,8м, соответствующие выполнению запросов. На основе полученных

значений и и заданных характеристик узлов (законов распределения времени обработки

запросов) определяются вероятностно-временные характеристики процесса решения задач. Следует отметить, что неотъемлемым свойством непрерывного марковского процесса является экспоненциальность распределения времени пребывания запроса в состоянии sk

( к = 0, К +1). В общем случае законы распределения времени выполнения запросов отличны от экспоненциального. В этом случае процесс решения задач описывается с помощью вложенных марковских цепей (полумарковский процесс). Характеристики полумарковского процесса определяются значительно сложнее, чем для марковского процесса, и вычисление стационарных вероятностей состояний выливается в сложную математическую задачу.

Граф, описывающий процесс решения задачи, может быть интерпретирован разомкнутой сетью массового обслуживания, в которой характеристики СМО (параметры законов распределения времени обработки запросов) определяются на представленной ранее модели. Узел 0 представляет собой источник заявок, а узел к+1 - выход из сети. Конкуренция заявок за ресурсы АИС учитывается во временных параметрах узлов, что позволяет рассматривать процесс решения различных задач, а также одной и той же задачи в различные моменты времени независимо друг от друга.

Как было отмечено, для определения функции распределения случайной величины (в рассматриваемом случае - времени пребывания заявок в сети) достаточно знать первые четыре центральные момента этой величины. Дальнейший переход к искомой функции осуществляется с помощью семейств кривых, охватывающие различные виды распределений, конечных рядов и т.д.

Рассмотрим процесс перемещения заявки по сети. После возникновения в узле 0

заявка с вероятностью р01 поступит в узел 1, с вероятностью р02 - в узел 2 и т.д., причем

и

^ р0= 1, где И - число узлов, смежных с узлом 0, так как. случайные события выбора

1=1

различных направлений движения заявки из узла составляют полную группу. Аналогично

w

для произвольного узла к ^ рк]- = 1. Значения вероятностей рк1 существенно зависят от

1=к+1

интенсивности потока запросов, поступающих в систему. При этом для узла к с альтернативными путями вероятности рк1, ркт пропорциональны интенсивностям 1-го и т-го потоков запросов.

Для вероятностей выбора путей от узла 0 до узла к+1 также выполняется условие

Ь

^ pi = 1, где рг - вероятность прохождения заявки по /-му пути, Ь - число путей.

/=1

Из этого следует, что плотность распределения времени пребывания заявки в сети

Ь

определяется равенством /(() = ^ р/// ((), где (г) - плотность распределения времени

/=1

прохождения заявкой /-го пути [2].

Интегрируя обе части этого равенства в пределах от 0 до гдоп, и учитывая, что интеграл суммы равен сумме интегралов, получим

Р ((< г доп ) = £ рР, ((< г доп), (1)

/=1

гдоп

где р((< гдоп )= | / (().

0

Имея в виду допущение о независимости времени пребывания заявок на каждом элементе сети, центральные моменты времени прохождения заявкой /-го пути находятся по известным соотношениям [8]:

Мцц = £т<?, к = 13;

/=1

м4?тц+т2ц х т

(ц)

2и 5

У=1 У=1 и=у+1

где Му(/ц) - центральный момент к-го порядка времени пребывания заявки в у-м узле; -

число слагаемых в сумме (узлов, входящих в 1-й путь).

Переход от начальных моментов времени пребывания заявок на узле к центральным моментам осуществляется согласно [6]:

г (Г ^ ! \

= 11 (- тн)),

т(;) ='

х=0

( г ^

где

V х

г!

V х У

х! (г - х)

т(ц} = т(н}; т(ц} = т(3"} - 3т2ну>т\н} + 2^}

т2у = т2у -(<})2; т™ = т4н) - 4т3н)т™ + 6т2н) (т^ )2 - з(т(н) )4,

где т(м) - г-й начальный момент случайной величины ^ - времени пребывания заявки на

у-м узле (г = 1,4;у = 1, М).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Использование взвешенного суммирования (1) требует существенных затрат вычислительных ресурсов для многократного нахождения величины ¥{ (( < 1доп). Упростить

решение данной задачи позволяют некоторые особенности исследуемой СеМО:

1) в произвольный момент в сети присутствует только одна заявка и никакая другая не поступает на вход до тех пор, пока не будет обслужена предыдущая;

2) при обслуживании заявка продвигается строго по одному пути, определяемому вероятностью его выбора.

Учитывая эти особенности, можно рассматривать сеть как состоящую из независимых путей. Поскольку операция взвешенного суммирования применима по отношению к законам распределения случайных величин, уместно предположить возможность ее использования и для нахождения некоторых других числовых характеристик времени пребывания заявки в сети. Доказательством этой гипотезы выступает следующая теорема.

Теорема. Начальные моменты к-го порядка множества случайных величин равны взвешенной сумме начальных моментов того же порядка входящих в множество величин при условии, что события, заключающиеся в выборе случайных величин, несовместны.

Дано: Множество случайных величин Х1, Х2,..., Хт, для которых указаны их

возможные значения Ху. = {xi} ( = 1, п; у = 1, т) и соответствующие им вероятности Ру = Р(Х' = X ).

п

Требуется доказать: М((н) = ХауМ(н), где М(кн)- к-й начальный момент множества

У=1

случайных величин, М^"-1- к-й начальный момент у-й случайной величины, входящей в

множество, а у - весовой коэффициент этой величины, выбранный при условии = 1.

у=1

п

Доказательство: По определению начальных моментов М^ х\р у . Так как

=1

события XJ = х1,Ху = х2,...,Ху = хп образуют полную группу попарно несовместных

п

событий, то X р у = 1.

=1

Обобщая на случай множества случайных величин, получим М(кн) = 2 х\р[, где

г=1

рг = Р[(( 1 VX2 V...V)= X].

Учитывая, что события, заключающиеся в выборе различных случайных величин из множества, несовместны, а выбор одной из величин и выпадение ее возможного значения

т

есть события независимые, можно записать рг = 2Р]Ру , где р- вероятность выбора

1=1

случайной величины X1. Следовательно,

п т п т т п т п т

Мкн) = 22рр = 22х1ргрц = 22х\р3р 1 =2Р12*гР! =2рМ1).

г=1 1=1 г=1 1=1 1=1 г=1 1=1 г=1 1=1

Для несовместных событий выбора случайной величины Х}- из множества

т

выполняется условие 2 р1 = 1, поэтому вероятности р1 являются весовыми

1=1

коэффициентами а1 (/ = 1, т) и справедливо утверждение М(к") = 2 р^М^ .

1=1

Применительно к исследуемой СеМО можно утверждать, что к-й начальный момент времени пребывания заявки в сети равен взвешенной сумме начальных моментов того же порядка времени прохождения каждого из путей, причем в качестве весовых коэффициентов используются вероятности выбора путей.

Значения начальных моментов времени прохождения г-го пути Мг(н) могут быть получены на основе выражения [6]:

Г (Г Л / ч

М(н) =2 М(г^ (М 1(н)) . ¿=0 V ^ У

Для г = 1,4 имеем

М(Н) = М(Ц); М3Н) = М£) + 3М 2ц} М 1(Н) +(М1гН) )3;

М 2 Н) = М 2Ц) +(М (н) )2; М4н) = м 4ц) + 4М 3(ц) М 1(н) + 6М 2ц) (МН) )2 + Мн ) )4,

где М(м)- г-й начальный момент случайной величины М((Ц)- г-й центральный момент той же величины.

Таким образом, дуальность свойств моментов (центральные моменты могут подвергаться сложению, а начальные - взвешенному суммированию) позволяет оперировать только этими числовыми характеристиками при вычислении промежуточных расчетов и однократно вычислять значение функции распределения времени пребывания заявки в СеМО.

Восстановление функции распределения по ее моментам проводится в предположении об унимодальности функции плотности случайной величины [6, 8]. В общем случае суперпозиция унимодальных функций плотности времени прохождения заявкой независимых путей может приводить к наличию многих максимумов. Иначе говоря, результирующая функция плотности является мультимодальной. Тем не менее, уместно предположить, что при большом числе независимых путей суммарная функция плотности сглаживается, стремясь к унимодальной. Показано, что распределения, имеющие конечное число соответственно одинаковых низших моментов (четыре или даже три) в некотором смысле аппроксимируют друг друга [6]. При этом представляется возможным аппроксимировать исследуемое распределение, найдя другое, известного вида с теми же моментами. Принимая полученные моменты за числовые характеристики с унимодальной плотностью, правомочно считать это распределение за искомое.

Восстановление функции распределения конечными рядами часто оказывается неудовлетворительным, особенно в хвостовой части распределения, поэтому более широкое распространение получил метод кривых Пирсона. Подробное описание метода приводится в ряде работ, в том числе в [6, 8]. В основе метода лежит нахождение выражений для функции плотности случайной величины по значениям первых четырех центральных моментов и дальнейшее численное интегрирование этих выражений, так как для основных типов распределений интегралы от функций плотности через элементарные функции не выражаются. Метод не лишен ряда недостатков, связанных с вычислительным аспектом его реализации. К ним относятся:

1) необходимость численного интегрирования в процессе вычислений, что в сущности приводит к возникновению погрешности результата;

2) наличие уникальных выражений для вычисления каждого типа функции распределения, требующее предварительной идентификации типа кривой и существенного расхода памяти ЭВМ.

Попытка устранения перечисленных недостатков явилась причиной поиска других подходов к аппроксимации функции распределения, заключающихся в подборе кривых непосредственно к искомой функции распределения, а не к ее плотности.

В работе [9] показано, что в общем виде функция распределения может быть описана как

x

F(x) = {l + exp[- G(x)]}-1, где G(x) = Jg(t)dt. Здесь g(t) - некоторая функция которая должна

0

быть неотрицательной при 0 < F(x) < 1 и в области изменения x. Существует ряд функций, таких как с, ct-1, ((c -1))), c + sec21, c x ch(t), где c > 0, для которых интеграл на интервале - ^ < x < да таков, что 0 < F(x) < 1. При этом задача аппроксимации сводится к отысканию функции g(t), через которую находятся значения функции F(x). Известны функции,

удовлетворяющие признакам функции распределения

X N 0 < x < 1;

F (x ) = (e - x +1)-", - да < x < да;

F (x )=(x - * +1), 0 < x < да;

F (x )=(( ~tgx +1), П2 < x <П2;

F (x ) = ((-cshx +1), - да < x < да;

F (x ) = 1 -(1 + xc)- *, 0 < x < да

9]. Среди них следующие:

и другие, причем с, к и г - некоторые положительные константы.

В общем случае вычисление значений функции распределения включает в себя три

этапа:

1) выбор типа функции;

2) определение параметров распределения;

3) расчет значения функции.

Для отыскания функции Е(х) требуется найти ее параметры с, к и г через значения числовых характеристик, таких как среднее значение (х), стандартное отклонение (<г), параметр асимметрии (^в) и параметр эксцесса (Р2). Величины ^в и Р2 находятся по соотношениям:

4Ж = тз/ лТ™^ Рг = да4/ да22.

где тк - к-й центральный момент случайной величины (к = 2,4).

В своей сущности метод основан на вычислении кумулятивных моментов, определяемых

ш 0 _

как М у =| х1 [1 - ¥ (х)]] - | х1 ¥ (х)х, и перехода от них к значениям х, а, и в2 •

0 -ш

С точки зрения практического использования особый интерес представляет функция

, ч Г 0, х < 0

¥(х) = 1.1 -(1 + , х,0- (2)

Вычисленные для этой функции возможные значения и в2 образуют широкий

диапазон, который охватывает многие распределения. При этом в область этих распределений попадают только функции плотности колоколообразного вида, к которым относятся и функции плотности времени пребывания заявок в СеМО.

Применительно к функции (2) выражение для нахождения кумулятивных моментов выглядит следующим образом:

Г

M = ■

Г j+1] Г Гк _ j+4

c c

сГ(к)

где Г - гамма-функция, у = 0, 1,..., кроме у < ск-1, с и к - действительные числа, лежащие на оси от 1 до ш.

Полагая m j) = jM _ (j > 0)

и m=

j_ ( i _ Л

(ц) = j S _ |(_ M 0 )Mj _1_. +(_ Mo )) (j > 1),

j=0

l

получим соотношения для первых четырех центральных моментов распределения

т(ц) = m™ = M 0; т3(ц ) = 3M 2 _ 12M j M 0 + 2M 03;

m(2 ) = 2Mj _M02; m'* ) = 4M 3 _ 12M 2 M 0 + 12M j M 02 _ 3M 04,

от которых осуществляется переход к параметрам x, а, ^¡в, в2 и далее к коэффициентам c и к.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Рыжиков Ю. И., Хомоненко А. Д. Расчет разомкнутых немарковских цепей с преобразованием потоков // АВТ.- 1989.- №3.- С.15-24.

2. Клейнрок Л. Теория массового обслуживания.- М., 1979.- 432 с.

3. Бусленко Н. П. Моделирование сложных систем.- М., 1978.- 399 с.

4. Иванов Е. В. Имитационное моделирование средств и комплексов связи и автоматизации.- СПб., 1992.- 206 с.

5. Демиденко Ю. А., Рыжиков Ю.И. Определение моментов распределения времени пребывания заявки в вычислительной сети. // АВТ.- 1986.- №3.- С.24-27.

6. Кендалл М., Стьюарт А. Теория распределений.- М., 1986.- 588 с.

7. Разработка САПР: В 10 кн. Кн. 8. Математические методы анализа надежности и производительности САПР: Практ. пособие. / В. И. Кузовлев, П. Н. Шкатов / Под ред.

А. В. Петрова - М., 1990.- 144 с.

8. Ходасевич Г. Б. Математическое обеспечение АСОД / Под ред. П. И. Волкова. - Л., 1981.- 176 с.

9. Burr I. W. Cumulative Frequency Functions // Ann. Math, Statist., Vol. 13.- Baltimore, 1942. - p.215-232.

i Надоели баннеры? Вы всегда можете отключить рекламу.