УДК 004.4236
РАЗРАБОТКА СИСТЕМЫ СБОРА СТАТИСТИКИ ДЛЯ СРЕДЫ ИМИТАЦИОННОГО
МОДЕЛИРОВАНИЯ
Д.А. Герасимов, С.А. Олейникова, О.Я. Кравец
В статье описаны основные подходы для сбора статистической информации о реальной системе, проанализированы преимущества и недостатки каждого из подходов, а также определены формулы для оценки основных параметров функционирования систем на основе статистической информации
Ключевые слова: вероятность, статистические характеристики, имитационное моделирование
Основным методом, позволяющим получить сведения о функционировании систем с помощью имитационных моделей, является метод статистического моделирования. Его сущность сводится к построению и реализации некоторого моделирующего алгоритма, имитирующего поведение и взаимодействие элементов исследуемой системы 8. В результате получается серия частных значений искомых величин или функций, статистическая обработка которых позволяет получить сведения о поведении исследуемого объекта [1]. Если количество реализаций достаточно велико, то полученные результаты моделирования приобретают
статистическую устойчивость и с достаточной точностью могут быть приняты в качестве оценок искомых характеристик функционирования исследуемой системы.
Теоретической основой метода
статистического моделирования являются предельные теоремы теории вероятностей [1]. В частности, рассмотрим статистическую
вероятность или частоту некоторого события А, которая определяется по формуле:
г»* / л\
Р (А) = —, (1)
п
где т - число появления события А, п - общее число произведенных опытов.
При небольшом количестве опытов частота носит случайный характер. Однако, при увеличении числа опытов случайные обстоятельства, свойственные отдельному опыту, взаимно уничтожаются и частота проявляет тенденцию стабилизироваться, приближаясь к средней величине [2]. В частности, Я. Бернулли доказал, что при неограниченном количестве опытов с практической достоверностью можно
Герасимов Дмитрий Александрович - ВГТУ, аспирант, E-mail: [email protected] Олейникова Светлана Александровна - ВГТУ, канд. техн. наук, доцент, E-mail: [email protected] Кравец Олег Яковлевич - ВГТУ, д-р техн. наук, профессор, E-mail: [email protected]
утверждать, что частота события будет сколь угодно мало отличаться от вероятности появления данного события [2].
Таким образом, получив информацию о числе появлений некоторого события (например, о числе заявок, вошедших в очередь) можно оценить вероятности этих событий (например, вероятность наличия очереди).
Рассмотрим определение статистических данных для разрабатываемой системы имитационного моделирования. Существуют различные способы сбора статистической информации. Особенности сбора выходной статистики связаны с особенностями самой среды имитационного моделирования.
В [3] было отмечено, что моделируемая система будет состоять из элементов, транзактов, действий и событий. Под элементом здесь подразумевается некоторая часть системы, обладающая законченным функционалом, то есть такая часть, которую с точки зрения исследования можно рассматривать, как некоторый чёрный ящик. Транзактом будет являться не что иное, как набор характеристик, присущих в реальной системе некоторым подвижным объектам. Выполнение некоторого действия всегда приводит к наступлению некоторого события. Под моделью будем понимать совокупность, связанных между собой, элементов, которые будут представлять отдельные блоки реального объекта, и алгоритмов, задающих их поведение [3].
Статистическую информацию предлагается собирать и обрабатывать одним из двух способов. В основе первого лежит идея фиксации каждого события и момента времени, в который это событие произошло. Это может быть выполнение какого -либо действия, совершаемого с транзактом и приводящего к изменению состояния системы.
Для сбора статистической информации на основе этого подхода в системе должна происходить запись в «журнал событий». В нём отражается текущее состояние тех «элементов» модели, с которыми связано наступившее «событие». Поскольку в данном журнале должна быть зафиксирована любая информация об изменениях состояние модели, журнал можно представить в виде совокупности строк, каждая из которых будет содержать сведения о том, в какой
момент времени произошли определенные действия, связанные с некоторой заявкой и некоторым элементом модели. Структурно журнал можно представить в виде табл. 1.
Таблица 1
Журнал событий
№ тран- закта № элемента время дейст- вие
п т t а
После окончания моделирования в журнале будут сохранены все временные значения,
характеризующие изменения показателей системы. Поэтому на основании сохраненных записей
можно в дальнейшем определить любые статистические характеристики.
Очевидным преимуществом данного подхода является возможность расчета любых характеристик на основании данных из журнала. В частности, если после проведения
продолжительного эксперимента потребуется вычислить какие-либо новые показатели, то у исследователя имеется возможность расчета
требуемых данных на основании уже сформированного журнала без проведения повторных опытов.
Однако, необходимость хранения такого объема данных требует большого объема ПЗУ. Особенно существенным это является при большом числе транзактов и большой сложности модели. Рассчитаем примерно для наглядности, какой объём будет иметь журнал, если модель состоит из 30 элементов и эксперимент проходит над 100 000 транзактов. Номер транзакта и номер элемента занимают по 4 байта (32 бита) памяти каждый. Это даёт нам возможность адресовать 2Л32 различных сущностей, что является достаточным количеством. Время, являясь в модели дискретной величиной, займёт 8 байт (64 бита), так как это позволит проводить эксперимент продолжительностью 2Л64 условных временных единиц. Параметр журнала «действие» указывает на характер события и для его описания достаточно 1 байта. Таким образом, для одной строки журнала нам необходимо 4+4+8+1=17 байт. Для рассматриваемой модели из 30 элементов каждый транзакт будет фигурировать в журнале примерно 100 раз. Тогда для хранения журнала событий данной модели потребуется 100 * 100 000 * 17 = 170 000 000 байт или около 160 Мб. Как можно видеть, даже для средней модели журнал занимает существенный объём ПЗУ, что относится к недостаткам данного подхода.
Второй подход заключается в текущем подсчете характеристики непосредственно в момент прогона модели и выводе результатов по окончании моделирования в отдельный файл. В этом случае требования к ресурсам, в частности к объему ПЗУ, будут не столь значительными. Однако, недостатком данного подхода является невозможность получения новых характеристик
после проведения эксперимента. В частности, если прогон занимает длительное время, для определения дополнительных статистических параметров потребуются проводить эксперимент ещё раз, что может привести к значительным временным затратам.
Анализируя оба подхода, можно прийти к выводу, что в случае наличия достаточного места на диске более целесообразно будет использование журналирования событий, так как на основании имеющихся записей можно будет найти любые характеристики без повторных экспериментов. В случае, если требования к объему ПЗУ достаточно жесткие или известно, что модель будет достаточно сложной и для точности статистической информации будет проводиться прогон на очень большом числе транзактов, эффективнее использовать текущие расчеты характеристик в момент проведения эксперимента.
Поскольку предусматривается возможность использования программы на разных машинах с разными характеристиками, к тому же сложность моделей может быть также разной, самым эффективным способом сбора статистической информации о функционировании системы будет возможность выбора подхода для обработки информации. В этом случае пользователь в зависимости от специфики исходной системы и ее модели, а также на основании характеристик своего компьютера может выбрать возможность или журналирования событий или непосредственный подсчет характеристик при прогоне модели.
В разрабатываемой системе будут определяться следующие характеристики:
- среднее число занятых каналов устройства;
- средняя длина очереди;
- среднее время ожидания.
Рассмотрим процесс определения этих характеристик более подробно.
Среднее время ожидания в очереди будет определяться с помощью формулы:
дг = ^------, (2)
пд
где qt1 - время ожидания в данной очереди 1-й заявки;
^ - число заявок, вошедших в данную очередь.
Чтобы определить среднюю длину очереди, необходимо вычислять ее длину в каждый момент времени. Разделив суммарную длину, полученную в результате всех измерений, на количество измерений, найдем искомую характеристику:
Е д! >
д! = ^—~. (3)
к
Здесь ql1 - длина очереди в момент времени 1;
к - число измерений длины очереди.
Данная формула нуждается в значительных вычислительных ресурсах при расчёте, поскольку
требует определения характеристик в каждый квант времени. Ее можно оптимизировать следующим образом. Поскольку длина очереди может меняться лишь в момент прихода в неё заявки или в момент освобождения очереди, можно определять длину очереди лишь при возникновении этих двух ситуаций и учитывать время пребывания определенного числа транзактов в очереди. Таким образом, вычисление средней длины очереди можно произвести по формуле:
Е д1 •1і
ql =
T
(4)
Здесь индекс і будет соответствовать лишь моментам времени, когда длина очереди изменится; Ъ - длина периода времени, в течение которого число заявок, стоящих в очереди, было qli.
Рассмотрим способ определения
характеристик для простейшей одноканальной системы с неограниченной очередью. Заявки поступают в систему через 1с, а обслуживаются 2 с. Для реализации модели данной системы потребуются следующие элементы, имитирующие работу:
- генератора (элемент 1);
- очереди (элемент 2);
- одноканального устройства (элемент 3).
Для простоты пусть время генерации и
обслуживания будет постоянным. Тогда фрагмент журнала будет иметь вид, представленный в табл.
2.
Таблица 2
Результат работы
№ тран- закта № элемента время дейст- вие
1 1 0 +
1 1 0 -
1 2 0 +
1 2 0 -
1 3 0 +
2 1 1 +
2 1 1 -
2 2 1 +
1 3 2 -
2 2 2 -
2 3 2 +
3 1 2 +
3 1 2 -
3 2 2 +
4 1 3 +
4 1 3 -
4 2 3 +
2 3 4 -
3 2 4 -
3 3 4 +
5 1 4 +
5 1 4 -
5 2 4 +
Найдем для данного примера среднюю длину очереди. Для этого сгруппируем в отдельную таблицу все значения, связанные с очередью (элемент 2). В результате получим следующие сведения (табл. 3).
Таблица 3
Результат работы
№ тран-закта № элемента время дейст- вие
1 2 0 +
1 2 0 -
2 2 1 +
2 2 2 -
3 2 2 +
4 2 3 +
3 2 4 -
5 2 4 +
Воспользуемся формулой (?). Поскольку очередь моделирует элемент 2, рассмотрим все случаи изменения этого элемента.
, 1 • 0 +1 -1 +1 -1 +1-2 +1 • 2 , г
ді =--------------4-------------= 1.5 (5)
Сравним данный результат с результатом работы системы имитационного моделирования вР88. На этом языке текст модели будет выглядеть следующим образом:
Ж Simple_Moled.gps
GENERATE 1
QUEUE 1
SEIZE 1
DEPART 1
ADVANCE І2
RELEASE 1
TERMINATE
GENERATE 4
TERMINATE 1
START 1
IN 1 SI
В результате прогона данной модели получили в файле статистики информацию о средней длине очереди, которая совпала с рассчитанным по формуле (5) значением.
Следует также отметить о следующей характеристической особенности разрабатываемой системы. Она заключается в возможности использования так называемых комбинированных моделей. Этот подход позволяет описывать поведение непрерывных и дискретных, детерминированных и стохастических систем, т.е. является универсальным. Стохастические элементы должны быть созданы на основе генераторов случайных чисел. Задавая различные законы распределения и необходимые параметры, могут
быть получены требуемые по условиям адекватности случайные последовательности. Т.е. в результате мы описали чёрный ящик, на вход которого подаются параметры распределения, а на выходе получаются элементы случайной последовательности. Детерминированные элементы будут разработаны на основе алгоритмов, реализованных пользователем. С их помощью на основании исходных данных можно решать различные оптимизационные и другие задачи. Таким образом, в разрабатываемой среде в полной мере могут быть использованы преимущества комбинированных моделей, что не мешает применить оба рассматриваемых способа сбора статистической информации.
Отличительной чертой разрабатываемого файла статистики от существующих отчетов, например, в GPSS является возможность для пользователя определять любые необходимые ему характеристики в этом файле. Как было сказано ранее, в данном файле будут представлены основные характеристики системы, рассчитанные с помощью формул (2) - (4) и некоторых других. Однако, в определённых случаях пользователь сам может задать формулу для определения некоторой характеристики и система автоматически рассчитает требуемые значения. Это свойство приобретает особую значимость в связи с отличительной особенностью данной среды, позволяющей сочетать основные преимущества, как языков имитационного моделирования, так и языков программирования высокого уровня. В частности, предполагается, что на основании результатов моделирования новая система будет иметь возможность решать различные оптимизационные задачи. Поэтому возможность определения самим пользователем содержания
файла статистики и возможность программно определять основные характеристики является несомненным преимуществом данной системы имитационного моделирования.
Основные результаты.
1. Определены и проанализированы
достоинства и недостатки основных подходов для сбора статистической информации при проведении
имитационного моделировании.
2. Выявлено отсутствие влияния характера функционирования комбинированных моделей на процесс сбора статистической информации.
3. Определены формулы, на основании которых будут рассчитываться основные характеристики моделей.
Литература
1. Советов Б.Я., Яковлев С.А. Моделирование систем: Учеб. для вузов. - М.: Высш. шк., 2001, 343с.
2. Вентцель Е.С. Теория вероятностей. М: Наука, 1969.-572с.
3. Герасимов Д.А., Олейникова С.А. Среда построения имитационных моделей // Территория науки. 3(4). Воронеж: «Научная книга», 2007. с. 333-337.
4. Герасимов Д.А., Кравец О.Я. Возможность создания комбинированных моделей в разрабатываемой системе// Образование, наука, производство и управление: труды научнопрактической конф., Старый Оскол, 2009. с. 3334.
Воронежский государственный технический университет
DEVELOPMENT OF COLLECTION OF THE STATISTIC SYSTEM FOR ENVIRONMENT OF SIMULATION MODELING
D.A. Gerasimov, S.A. Oleynikova, O. Y. Kravets
In this article the main approaches of collection of statistic information on real system are described, advantage and defects each of approach are analyzed and formulas for estimating the main parameters of the operating the system on the basis of statistic information are determined
Key words: Probability, statistical characteristics, simulation modeling