Научная статья на тему 'Метод оценивания информационных моделей наблюдаемых процессов в компьютерной сети'

Метод оценивания информационных моделей наблюдаемых процессов в компьютерной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
235
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АППРОКСИМАЦИЯ / МОНИТОРИНГ КОМПЬЮТЕРНОЙ СЕТИ / НАБЛЮДАЕМЫЙ ПРОЦЕСС / WINDOWS MANAGEMENT INSTRUMENTATION (WMI) / APPROXIMATION / COMPUTER NETWORK MONITORING / CON-TROLLED PROCESS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гриценко А. И.

Решается задача аппроксимации контролируемых процессов в компьютерной сети с целью снижения уровня служебного трафика, генерируемого при мониторинге контролируемых процессов. Предложен метод оценивания информационных моделей контролируемых процессов в компьютерной сети. Метод позволяет рассчитать значения параметров информационных моделей, на основании которых может быть выбрана адекватная аппроксимирующая модель контролируемого процесса

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гриценко А. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Evaluation method of information models of observed processes in computer network

The problems of remote data collection about the state of various network components always appear during computer network administration. This leads to increased levels of official traffic in communication channels, which may adversely affect the user data transmission quality. One of the ways to solve the problem is an approximation of the processes, observed when computer network monitoring. This method reduces the number of measurement points by replacing the measured values by the approximated ones. For effective approximation, it is important to develop adequate approximation models of the observed processes.A formalized approach to the evaluation of previously proposed information models of the observed processes in a computer network was developed in the paper. These models describe the behavior of the observed processes in the form of a preselected set of numerical and mathematical characteristics. Using the considered information models allows to form a sufficiently detailed picture of the behavior of the observed processes to select an adequate approximating model. For evaluating models, a method, representing a sequence of steps for the analysis of the observed processes to calculate the parameters of the models was developed. The advantage of the method lies in its adequacy, flexibility, ease of implementation and low computational cost. As a practical example of using the developed method, evaluation of models for the two observed processes in the computer network: the process “established TCP connections” and the process “disk data recording/ reading flow rate” was performed. The results show the feasibility of the proposed method.As a result of the research, it was found that the stages of evaluating the information models can be coordinated with the general network monitoring organization scheme. Weaknesses of the existing rules for estimating the parameters of the models were identified and improved rules were proposed. In particular, the accuracy of estimating the linearity, dynamics and lifetime of the observed processes was improved.The obtained results allow to approach solving the problem of selecting an effective approximating model for the observed processes in the computer network.

Текст научной работы на тему «Метод оценивания информационных моделей наблюдаемых процессов в компьютерной сети»

ju.-t-.nEjrvii:ji ; i jnuut-it: "rcvunñnn .;¡

Виршуеться задача апроксимацй контрольова-них процеыв в комп'ютернш мережi з метою зни-ження pieня службового трафжу, що генеруеть-ся при мотторингу контрольованих процеыв. Запропоновано метод оцЫювання шформацшних моделей контрольованих процеыв в комп'ютертй меpежi. Метод дозволяе розрахувати значен-ня паpаметpiв шформацшних моделей, на пiдставi яких може бути обрана адекватна апроксимуюча модель контрольованого процесу

Ключовi слова: апроксимащя, мотторинг комп'ютерно1 меpежi, спостережуваний процес,

Windows Management Instrumentation (WMI) □-□

Решается задача аппроксимации контролируемых процессов в компьютерной сети с целью снижения уровня служебного трафика, генерируемого при мониторинге контролируемых процессов. Предложен метод оценивания информационных моделей контролируемых процессов в компьютерной сети. Метод позволяет рассчитать значения параметров информационных моделей, на основании которых может быть выбрана адекватная аппроксимирующая модель контролируемого процесса

Ключевые слова: аппроксимация, мониторинг компьютерной сети, наблюдаемый процесс, Windows Management Instrumentation (WMI)

УДК 004.738.52:004.031

|РО!: 10.15587/1729-4061.2015.36277|

МЕТОД ОЦЕНИВАНИЯ ИНФОРМАЦИОННЫХ

МОДЕЛЕЙ НАБЛЮДАЕМЫХ ПРОЦЕССОВ В КОМПЬЮТЕРНОЙ

СЕТИ

А. И. Гриценко

Аспирант

Кафедра информационных управляющих систем Харьковский национальный университет радиоэлектроники пр. Ленина 14, г. Харьков, Украина, 61000 E-mail: alegris@inbox.ru

1. Введение

Мониторинг компьютерной сети - это множество мероприятий организационно и технического характера, осуществляемых для решения задач сбора, хранения и анализа информации о состоянии элементов компьютерной сети. Решение этих задач необходимо для обеспечения требуемой функциональности компьютерной сети: своевременного обнаружения и исправления неисправностей, сбора статистической информации, обеспечения требуемого уровня качества сервиса и т. д.

Существуют различные подходы и способы реализации мониторинга сети [1-3], зависящие от целей мониторинга, технических условий, организационных возможностей. Большой выбор программных средств позволяет решать практически любые по степени сложности задачи удаленного сбора и анализа данных.

2. Анализ литературных данных и постановка проблемы

Как правило, сбор данных во время мониторинга компьютерной сети производится централизовано с помощью клиент-серверных технологий. С одной стороны это повышает оперативность и надежность данных, с другой стороны приводит к появлению дополнительного служебного трафика, снижающего по-

лезную пропускную способность сети. Важно выбрать правильный способ сбора данных, позволяющий не только обеспечивать требуемый уровень оперативности и точности данных, но и приемлемый уровень служебного трафика. Для решения этой проблемы разрабатываются различные методы, перераспределяющие нагрузку на сеть [4, 5], использующие компрессию [6] или аппроксимацию [7, 8]. Для более глубокого понимания проблемы и поиска новых способов ее решения проводится анализ существующих средств мониторинга [9, 10].

Мониторинг компьютерной сети неизбежно связан с накоплением данных, соответствующих результатам наблюдений за определенными переменными V; е V, где V - все множество наблюдаемых переменных. В итоге, для каждой переменной можно получить представление в виде процесса В ряде задач мониторинга компьютерных сетей требуется аппроксимация [7, 8]. Для этого строится соответствующая аппроксимирующая модель Построение состоит из этапов структурной и параметрической идентификации, для которых важна информация о поведении ф;^). От точности, полноты и непротиворечивости зависит эффективность решения задачи аппроксимации, а следовательно, и задачи мониторинга сети в целом.

Эффективность аппроксимации наблюдаемых процессов с помощью существующих методов (например, [11-13]) значительно зависит от качества

© :

экспертного оценивания. Только при наличии необходимой и достаточной информации о поведении случайного процесса ф^) можно построить адекватную аппроксимирующую модель. Основываясь на том, что все процессы в компьютерной сети заранее частично определены, в работе [14] был сформирован набор значимых для аппроксимации характеристик наблюдаемых процессов, на основании которых были разработаны две информационные модели наблюдаемых процессов.

Актуальной проблемой рассматриваемых информационных моделей является отсутствие формализованного подхода к их оцениванию. Решение проблемы предполагает разработку метода, позволяющего последовательно вычислить параметры моделей с помощью специальных правил, описанных в работе [14].

3. Цель и задачи исследования

Целью работы является разработка формализованного подхода к оцениванию информационных моделей наблюдаемых процессов. В работе [14] дано определение рассматриваемым информационным моделям.

Для достижения поставленной цели рассматривается следующая постановка задачи: предположим, что планируется мониторинг некоторых процессов в компьютерной сети. Пусть известно, что во время мониторинга будут аппроксимироваться наблюдаемые процессы с целью минимизации уровня служебного трафика. При этом для повышения эффективности аппроксимации формируются специальные информационные модели [14].

Основной задачей является разработка метода оценивания информационных моделей наблюдаемых процессов в компьютерной сети.

Для достижения поставленной цели необходимо выполнить следующие задачи:

1. Согласовать этапы оценивания моделей с этапами организации мониторинга компьютерной сети.

2. Проанализировать и улучшить правила оценивания моделей.

3. Разработать алгоритм вычисления значений параметров моделей.

4. Разработать и описать метод оценивания моделей.

4. Материалы и методы исследования способов оценивания информационных моделей наблюдаемых процессов в компьютерной сети

4. 1. Положения об информационных моделях наблюдаемых процессов в компьютерной сети

Рассматриваются информационные модели наблюдаемых процессов в компьютерной сети, предложенные в статье [14]. В статье указывается, что оценивание моделей осуществляется последовательно в два этапа (рис. 1): на этапе предварительного оценивания формируется априорная модель С_1, на этапе экспериментального оценивания формируется апостериорная модель С1.

Однако в работе не рассматривается вопрос им-плементации этапов оценивания моделей в контексте

общей схемы организации мониторинга. Основные этапы мониторинга описаны в [1]: инициализация, планирование, выбор инструментария, проведения измерений и анализ результатов. Исходя из того, что модели должны быть сформированы до проведения измерений, но после получения всей необходимой информации об объекте мониторинга, будем полагать, что этапы оценивания рассматриваемых информационных моделей должны следовать непосредственно после этапа выбора инструментария (рис. 2).

Этап предварительного оценивания

Оценивание априорной модели

Выбор плана проведения эксперимента

Этап

экспериментального оценивания

Проведение эксперимента

Оценивание апостериорной модели

Рис. 1. Этапы оценивания информационных моделей

Рис. 2. Этапы оценивания информационных моделей в контексте этапов организации мониторинга компьютерной сети

Таким образом, для оценивания моделей С_1 и С1 может быть использована информация, полученная на первых трех этапах организации мониторинга. Обозначим ее как спецификацию мониторинга М = , где G - цели мониторинга, F -

задачи мониторинга, S - среда мониторинга, D - предметная область, О - объекты мониторинга, V - наблюдаемые переменные, I - инструментальные средства мониторинга.

4. 2. Описание этапа предварительного оценивания

Оценивание априорной информационной модели. Описанная в [14] модель С_1 оценивается экспертным путем на основании априорных данных, то есть исходной спецификации мониторинга М. Задача оценивания С_1 заключается в расчете определенных статистических характеристик наблюдаемых процессов. Формально эти характеристики описаны как параметры модели С_1 = ,1ф}, где dф - динамичность, 1ф - линейность, sф - стационарность, ^ - время жизни. Расчет параметров модели С_1 осуществляется с помощью использования правил Я_1 в ходе графо-визуального анализа измеренных значений наблюдаемых процессов.

Формирование плана проведения эксперимента. Основным результатом этапа предварительного оце-

нивания является план проведения эксперимента Е, состоящий из множества испытаний е1 е Е. Каждое испытание е1 представляет собой систематическое измерение наблюдаемых процессов, проводимое в соответствии со спецификацией е1 = {Т,Т0, ДТс, Дтс,Рс}, где Т - длительность испытания, Т0 - начальное время испытания, ДТс - длина интервала актуализации данных, Дтс - длина интервала измерений, Рс - произвольный набор правил преобразований значений.

4. 3. Описание этапа экспериментального оценивания

Проведение эксперимента. Согласно выбранному плану проведения эксперимента Е проводится ряд испытаний, в ходе которых, с помощью инструментальных средств I, измеряются наблюдаемые процессы V и формируется множество данных .

Оценивание апостериорной информационной модели. В соответствии с [14] модель С формируется на основании спецификации мониторинга М, ранее оцененной модели С_1 и полученных в ходе эксперимента данных Х1!. Модель С1 состоит из всех ранее перечисленных параметров модели С_1, а также дополнительных параметров, отражающих математические характеристики функций наблюдаемых процессов. Модель описывается как С1 = ЯрЛФ,lf,Cf,mf,uf}, где dф - дтгш^шзсть 1ф -линейность, sф - стационарность, ^ - время жизни, ^ - степень нелинейности, с - непрерывность, mf - монотонность, и - выпуклость/вогнутость. Расчет параметров модели осуществляется с помощью специальных правил Я1 . Основным результатом этапа экспериментального оценивания является оцененная модель С1.

4. 4. Правила оценивания информационных моделей

В [14] не указывается, как использовать правила Я_1 и Я1 при наличии выборок значений наблюдаемых процессов Х_1! и Х1!. Однако очевидно, что для получения адекватных априорной и апостериорной моделей, измеренные значения необходимо предварительно обработать. Будем использовать следующий алгоритм расчета параметров моделей на основании Х_1! и Х1!. В соответствии с ДТс выборки Х_1! и Х1! разбиваются на интервалы ДТс(1). Для каждого интервала ДТс(1) рассчитываются описанные в пп. 4.1, 4.2 характеристики наблюдаемых процессов с помощью правил Я_1 и Я1. Значения параметров моделей С_1 и С1 выбираются на основании относительных или средних значений рассчитанных характеристик. Например, если все множество измеренных значений Х11 разбивается на 100 интервалов ДТс(1) и для 80 % интервалов характеристика динамичности dф равна 1, то считаем процесс высокодинамичным. Все пороговые значения относительных показателей выбираются экспертным путем для каждого параметра модели. На этапе оценивания модели С_1 расчет априорных характеристик для интервалов ДТс(1) проводится визуально, а правила Я_1 носят рекомендательный характер.

Дополнительно к уточненным общим правилам оценивания моделей опишем улучшенные правила

множества Я_1, а именно правила расчета параметров динамичности, линейности и времени жизни.

Динамичность процесса ( dф ) будем оценивать на основании коэффициента вариации С^=о[Х]/ц[Х], где о - стандартное отклонение, ц - математическое ожидание, X - множество измеренных значений. Выберем пороговое значение коэффициента вариации CVф . Если С^ > CVф , то считаем процесс высокодинамичным ^ф = 1) , иначе низкодинамичным = 0). Рекомендуемое значение для CVф* = 0.33 (соответствует однородной совокупности).

Линейность процесса ( 1ф ) будем оценивать путем построения линейной регрессии и расчета ее коэффициент детерминации я2. Если я2 > я2*, то процесс считаем линейным (1 ф = 1), иначе нелинейным(1ф = 0). Рекомендуемое значение для Я2* = 0,8 .

Время жизни процесса ( ^ ) можно оценить на основании его абсолютного отклонения от среднего D. Если D >0, то считаем процесс долговременным (^ = 1), иначе кратковременным (^ = 0).

5. Результаты исследований способов оценивания информационных моделей наблюдаемых процессов в компьютерной сети

5. 1. Описание метода оценивания информационных моделей наблюдаемых процессов в компьютерной сети

Предлагается метод оценивания информационных моделей наблюдаемых процессов, разработанных в [14]. Метод заключается в последовательном вычислении характеристик наблюдаемых процессов и формировании априорной и апостериорной информационных моделей. Входная и выходная информация, а также уточненные правила описаны в разделе 2 текущей статьи. Шаги метода, соответствующие этапам предварительного и экспериментального оценивания информационных моделей (рис. 1):

1. Формирование краткой экспертной характеристики наблюдаемых процессов.

2. Проведение кратковременной сессии измерений наблюдаемых процессов и представление полученных значений в графическом виде.

3. Оценивание априорной информационной модели С_1 = ,1ф } с помощью правил Я_1.

4. Выбор плана проведения эксперимента Е:е1 = {Т,Т0, ДТс, Дтс,Рс}, е1 еЕ на основании априорной модели С_1 и спецификации мониторинга М.

5. Проведение эксперимента в соответствии с выбранным планом Е и формирование множества данных Х11.

6. Оценивание апостериорной информационной модели С1 = ,1ф ,1рсртри^ с помощью правил Я1.

5. 2. Характеристика метода оценивания информационных моделей наблюдаемых процессов

Анализируя цели и задачи разработанного метода, особенности алгоритма его реализации и типы объектов, к которым он применяется, можно сформулировать его обобщённую характеристику.

Выделим следующие моменты, характеризующие предложенный метод:

1. Основывается на идее частичной априорной определенности наблюдаемых процессов.

2. Не требует высоких вычислительных затрат. Объем затрат прямо пропорционален количеству наблюдаемых процессов.

3. Может адаптироваться к изменениям среды мониторинга. Простота реализации метода и не высокие вычислительные затраты позволяют реализовать динамическую адаптацию информационных моделей к условиям изменения среды мониторинга.

4. Позволяет оценить уровень ошибочного оценивания моделей путем сравнения аппроксимируемых значений наблюдаемых процессов с реальными значениями измерений.

Таким образом, метод обладает гибкостью реализации, позволяющей учитывать особенности среды мониторинга, адаптировать к ее изменениям и оценивать риски ошибочных расчетов.

5. 3. Описание алгоритма метода оценивания информационных моделей наблюдаемых процессов

Реализация разработанного метода состоит из следующих шагов:

1. Формируем краткую экспертную характеристику наблюдаемых процессов V в произвольной описательной форме.

2. Проводим кратковременную сессию измерений наблюдаемых процессов V. Длительность измерений и длину интервала измерений выбираем такие, что бы получаемые выборки были репрезентативными с экспертной точки зрения.

3. Для каждого наблюдаемого процесса V; е V выбираем длину интервала актуализации данных ДТс. Значение ДТс зависит от характера поведения vi. Если процесс высокодинамичный, нестационарный или не линейный, то рекомендуется выбирать небольшой интервал ДТс в диапазоне от 5 до 9 значений. Для низкодинамичного или линейного процесса ДТс может находится в диапазоне от 10 до 20 значений.

4. Оформляем измеренные на 2 шаге значения в виде линейных графиков, на которых отмечаем интервалы ДТс(;) в соответствии с ДТс.

5. С помощью визуального анализа поведения наблюдаемых процессов V и на основании правил Я_1 оцениваем характеристики динамичности, линейности, стационарности и времени жизни.

6. Записываем рассчитанные характеристики в виде параметров априорной информационной модели С , = }.

_1 I ф" ф" ф" ф >

7. На основании С_1 и М формируем план провер дения эксперимента Е. Экспертным путем выбираем количество и спецификацию испытаний е; еЕ, где е; = {Т,Т0, ДТс, ДТс,Рс}.

8. В соответствии с Е измеряем V и формируем общую выборку Х1;.

9. Проводим постобработку Х1; в соответствии с правилами Рс (округление, преобразование и т. д.).

10. Для всех ДТс(;) аналитическим и экспертным путем рассчитываем априорные и апостериорные характеристики с помощью правил Я _1 и Я1 .

11. Записываем полученные характеристики в виде параметров апостериорной информационной

модели С1 = Я,,1ф^^.

6. Пример реализации метода оценивания информационных моделей наблюдаемых процессов в компьютерной сети

6. 1. Описание исходной информации о планируемых наблюдениях

Для примера использования разработанного метода проведем наблюдение нескольких процессов в компьютерной сети. Предположим, что задана спецификация мониторинга М = , где G - оценка интенсивности использования рабочих станций сети, F - сбор статистических данных об интенсивноо сти использования дисковой и сетевой подсистем, S - небольшая компьютерная сеть предприятия (до 400 узлов) с доступом в Интернет, рабочее время предприятия с 9 до 18 часов в будние дни, D - разработка программного обеспечения, О - умеренно нагружене ные рабочие станции сети, I - программные средства мониторинга, основанные на WMI [15], V - параметры классов модели DMTF С1М [16] (табл. 1).

Таблица 1

Наблюдаемые переменные

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

CIM класс Параметр класса

Win32_PerfFormattedData_PerfDisk_ PhysicalDisk DiskTransfersPersec

Win32 PerfFormattedData Tcpip TCP ConnectionsEstablished

6. 2. Этап предварительного оценивания (априорная модель)

Дадим краткую экспертную характеристику для процессов vi еV (табл. 2).

Таблица 2

Экспертная характеристика наблюдаемых процессов

Процесс Экспертная характеристика

DiskTransfersPersec Переменная характеризует уровень использования (количество операций чтения и записи) физического носителя данных. Описывает высокодинамичный нелинейный нестационарный процесс

ConnectionsEstablished Переменная характеризует количество TCP соединений, находящихся в статусе ESTABLISHED или CLOSE-WAIT. Описывает низкодинамичный кусочно линейный процесс

Что бы собрать данные для предварительного анализа, произведем измерения значений наблюдаемых процессов с помощью системы мониторинга AggreGate, поддерживающей WMI. Выберем длительность наблюдения 5 минут с длиной интервала измерений 1 секунда.

Для каждого наблюдаемого процесса выберем длину интервала актуализации ДТс . Для высокодинамичного процесса DiskTransfersPersec выберем ДТс равным 5 значениям. Для низкодинамичного и линейного ConnectionsEstab1ished ДТс будет равняться 15 значениям.

Представим полученные значения наблюдаемых процессов в виде графиков, на которых отметим интервалы ЛТс(1) (рис. 3, а, б).

вущим. Будем считать оба процесса являются долговременными ( ^ = 1 ).

Полученные характеристики запишем в виде модели С_1 (табл. 3).

80

I 60

S

9" 40

и

20

1 А

\ 1 1 la

J 1 Г / J

.1 Г l^J 1 ls J t Г ! "J

(Nm^^^OOOO^OH^'Jin^hOO

Момент измерения

Таблица 3

Параметры априорной модели наблюдаемых процессов

Процесс {dp,lp,sp,tp} i p> p> p> pj

DiskTransfersPersec {1,0,0,1}

ConnectionsEstablished {0,1,1,1}

0

45

«

и

не40

н и

Э 35

30

О н

25

г \

1 r r / N

1 у

4 s_ _ f J \ /

Моме т измерения

Рис. 3. Графики значений наблюдаемых процессов: а — DiskTransfersPersec; б — ConnectionsEstablished

Путем графо-визуального анализа поведения процессов на интервалах ATc(l), определим характеристики динамичности, линейности, стационарности и времени жизни наблюдаемых процессов с помощью правил R_4, описанных в [14] и уточненных в п. 4.4 текущей работы.

Динамичность процесса. Для расчета этой характеристики используется коэффициент вариации, показывающий степень пульсации процесса. В ходе графо-ви-зуального анализа определим, как часто и как сильно процесс отклоняется от своего среднего значения. В результате, DiskTransfersPersec считаем высокодинамичным процессом ( dp = 1), а ConnectionsEstablished низкодинамичным ( dp = 0 ).

Линейность процесса. Для расчета этой характеристики оценивается ошибка линейной регрессионной модели. В ходе визуального анализа определим, линейны ли графики наблюдаемых процессов на интервалах ATc(l). В результате, считаем, что DiskTransfersPersec - нелинейный процесс (lp = 0 ), а Connections-Established - линейный ( lp = 1 ).

Стационарность процесса. Будем рассматривать стационарность процесса в широком смысле, т. е. среднее и дисперсия являются постоянными величинами, а корреляционная функция зависит только от разницы времени. В результате, считаем, что DiskTransfersPersec не стационарен ( sp = 0 ), а ConnectionsEstablished стационарен ( sp = 1).

Время жизни процесса. Для расчета этой характеристики необходимо оценить колебания значений на графиках. Если для 80 % интервалов ATc(i) колебания значений отсутствуют, то считаем процесс короткожи-

Выберем план проведения эксперимента Е. Согласно спецификации мониторинга М известно, что основной период утилизации сети приходится на офисное рабочее время будних дней, характер поведения процессов может незначительно изменяться в течении дня, объекты мониторинга не являются высоконагруженными. На основании моделей С_1 можно утверждать, что DiskTransfersPersec является слабо предсказуемым процессом, следовательно интервал измерений и интервал актуализации должны быть короткими (1-3 секунды и 5-9 значений соответственно). Для более предсказуемого ConnectionsEstablished можно выбрать больший интервал измерений и интервал актуализации (3-6 секунды и 10-15 значений соответственно).

Исходя из полученной информации, выберем следующие параметры испытаний. Для каждого наблюдаемого процесса проведем 4 испытания, распределенных в течении рабочего дня. Для всех испытаний DiskTransfersPersec выберем следующую спецификацию: Т1 - 15 мин., Т01 - 11:00, Т02 - 14:00, Т03 - 15:00, Т04 - 17:00, ЛТс - 5 значений, Лтс -1 сек., Рс - округление до 10 знаков после запятой, сглаживание с помощью простого скользящего среднего с окном в 10 значений. Для всех испытаний ConnectionsEstablished выберем следующую спецификацию: Т1 - 30 мин., Т01 - 11:00, Т02 - 14:00, Т03 -15:00, Т04 - 17:00, ЛТс - 15 значений, Лтс - 3 сек., Рс - сглаживание с помощью простого скользящего

среднего с окном в 5 значений.

6. 3. Этап экспериментального оценивания (апостериорная модель)

Проведем измерения значений наблюдаемых процессов в соответствии с выбранным планом эксперимента Е. Для каждого наблюдаемого процесса выборки всех испытаний объединяем в одну Х11 (рис. 4, а, б).

Проведем постобработку Х11 в соответствии с Рс: отформатируем значения и сгладим с помощью простого скользящего среднего. Результаты приведены на рис. 5, а, б.

Рассчитаем параметры апостериорной модели С1 с помощью правил Я_1 и Я1. Для этого разобьем исходную выборку значений Х11 на интервалы в соответствии с ЛТс и вычислим их распределение в соответствии со значениями априорных и апостериорных характеристик.

а

JS 400 ж

g 300

И 200

CD 100 0

1 .Li I il .и .1 1 J 1

ТЖЦ'1"" ' '^ЧГТТГТП TTffH|Pr/TTi ri

2001

Момент измерения

Рис. 4. Выборки значений наблюдаемых процессов: а — DiskTransfersPersec; б — ConnectionsEstablished

Рис. 5. Сглаженные значения наблюдаемых процессов: а — DiskTransfersPersec; б — ConnectionsEstablished

В табл. 4 приведены результаты распределения интервалов ЛТс(1) по значениям характеристик

d

1Ф - t -

lf, mf, uf.

Таблица 4

Распределение интервалов ATc(l) по значениям характеристик

Переменная d<p , % l„, % 4, % lf, % mf, % uf , %

DiskTransfers Persec 0: 92,20 1: 7,80 0: 69,78 1: 30,22 0: 0 1: 100 0: 0 1: 0 2: 100 0: 73,82 1: 12,95 1: 13,23 0: 61,98

1: 18,52 -1: 19,50

Connections Established 0: 99,16 1: 0,84 0: 49,37 1: 50,63 0: 9,62 1: 90,38 0: 9,62 1: 14,23 2: 76,15 0: 35,57 1: 23,01 -1: 41,42 0: 30,54 1: 24,27 -1: 45,19

Проанализируем данные приведенные в табл. 4 и выберем окончательные значения рассмотренных характеристик для каждого наблюдаемого процесса.

Динамичность процесса. Сглаживание DiskTransfersPersec привело к значительному снижению его динамичности - только для 7,8 % интервалов ATc(l) процесс является высокодинамичным. Следовательно, в целом процесс является низкодинамичным (d9 = 0) . Для ConnectionsEstablished подтверждается априорная оценка - для подавляющего количества интервалов актуализации данных ATc(l) процесс является низкодинамичным (d9 = 0).

Линейность процесса. Для 69,78 % интервалов ATc(l) DiskTransfersPersec характеризуется как нелинейный (1ф = 0). Для ConnectionsEstablished наблюдается приблизительно одинаковое количество интервалов ATc(i) , на которых процесс линейный или нелинейный (кусочно линейный процесс). В целом охарактеризуем его как линейный процесс (1 ф = 1) .

Время жизни процесса. Оба процесса являются долговременными (tф = 1) .

Степень нелинейности процесса. DiskTransfersPersec имеет третью степень нелинейности (1f = 2) . ConnectionsEstablished в целом также относится к третьей степени нелинейности (1f = 2), однако для большого количества интервалов ATc(i) (23,85 %) процесс относится к первой или второй степени нелинейности.

Монотонность процесса. Для DiskTransfersPersec условие монотонности не выполняется для подавляющего количества интервалов ATc(i) (mf = 0) . ConnectionsEstablished убывает для 41,42 % интервалов

ATc(i) (mf = -1).

Выпуклость/вогнутость. Так как, DiskTransfersPersec не монотонный, то и условие выпуклости/ вогнутости не выполняется (uf = 0). Connections Established является выпуклым для 45,19 % интервалов ATc(i) (uf = -1).

Стационарность. Проверим соблюдение условий стационарности в широком смысле. Первое условие стационарности - постоянство математического ожидания. Рассчитаем средние значения наблюдаемых процессов для каждой из 4 проведенных сессий измерений (рис. 6).

Условие постоянства математического ожидания не соблюдается для обоих наблюдаемых процессов. Следовательно, DiskTransfersPersec и ConnectionsEstablished не стационарны (s9 = 0) .

Непрерывность. Эту характеристику рассчитаем как экспертную оценку с помощью визуального анализа графиков функций наблюдаемых процессов. DiskTransfersPersec: высокая динамичность процесса и высокая степень нелинейности характеризует его функцию как непрерывную (cf = 1) . ConnectionsEstablished: на графиках процесса можно выделить уровни и перепады. Будем утверждать, что в точках перепадов функция процесса терпит разрыв первого рода (cf = 0).

На основании полученных данных запишем параметры апостериорной модели C1 (табл. 5).

а

а

12 3 4

Сессия измерений

б

Рис. 6. Средние значения наблюдаемых процессов: а — DiskTransfersPersec; б — ConnectionsEstablished

Таблица 5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Апостериорные информационные модели наблюдаемых процессов

Процесс {d9 Лф ^ ,t9 ,lf,Cf,mf,Uf}

DiskTransfersPersec {0,0,0,1,2,1,0,0}

ConnectionsEstablished {0,1,0,1,2,0,-1,-1}

На основании вычисленных апостериорных моделей видно, что значения некоторых характеристик наблюдаемых процессов изменились по сравнению с предварительным оцениванием. Это связано с тем, что на этапе экспериментального оценивания можно бо-

лее точно вычислить эти характеристики. Но следует заметить, что разница в значениях может быть также обусловлена трансформацией экспериментальных данных.

После вычисления апостериорных моделей следует выбрать аппроксимирующие функции наблюдаемых процессов и приступит к этапу проведения измерений. Эти вопросы в данной работе не рассматриваются.

7. Выводы

В результате решения поставленной задачи разработан метод оценивания информационных моделей наблюдаемых процессов в компьютерной сети. Данный метод позволяет оценивать информационные модели, предложенные в статье [14]. Шаги метода сформированы в строгом соответствии с этапами реализации мониторинга наблюдаемых процессов. На каждом этапе осуществляется расчет математических и статистических характеристик наблюдаемых процессов с помощью правил, описанных в [14]. Эффективность метода обуславливается его простотой и не высокими вычислительными затратами. Адекватность метода подтверждается примером его использования.

Дальнейшая работа может вестись над разработкой метода мониторинга процессов в компьютерной сети, который будет основываться на разработанных моделях и технологиях WBEM-CIM.

Научная новизна состоит в том, что предложен метод оценивания информационных моделей наблюдаемых процессов в компьютерной сети. Метод отличается тем, что позволяет в строгой соответствии с этапами реализации мониторинга сети, рассчитать заранее выбранные статистические и математические характеристики наблюдаемых процессов и оценить предложенные в [14] информационные модели.

Практическая ценность метода заключается в повышении эффективности решения задачи аппроксимации наблюдаемых процессов в компьютерной сети для снижения уровня служебного трафика систем мониторинга.

Литература

1. Hoeksema, F. W. A methodical approach to performance measurement experiments: measure and measurement specification [Text] / F. W. Hoeksema, J. T. van der Veen, B. J. van Beijnum. - University of Twente, Centre for Telematics and Information Technology (CTIT), 1997. - 113 p.

2. Sidibé, M. QoS monitoring for end-to-end heterogeneous networks configurations management [Text] / M. Sidibé, A. Mehaoua // IEEE International Conference on Automation, Quality and Testing, Robotics AQTR. - 2008. - Vol. 1. - P. 364-368. doi: 10.1109/ aqtr.2008.4588769

3. Lahmadi, A. Efficient distributed monitoring in 6LoWPAN networks [Text] / A. Lahmadi, A. Boeglin, O. Festor // In proceedings of the 9th international conference on network and service management, 2013. - P. 268-276.

4. Yu, C. FlowSense: Monitoring Network Utilization with Zero Measurement Cost [Text] / C. Yu, C. Lumezanu, Y. Zhang, V. Singh, G. Jiang, H. V. Madhyasth // In proceedings of the 14th international conference on Passive and Active Measurement, 2012. -P. 31-41.

5. Ballard, J. R. Extensible and Scalable Network Monitoring Using OpenSAFE [Text] / J. R. Ballard, I. Rae, A. Akella // In proceedings of the 2010 internet network management conference on Research on enterprise networking, 2010. - P. 1-6.

6. Narayanan, H. T. S. Feasibility of SNMP OID compression [Text] / H. T. S. Narayanan, I. Geetha, N. Sumitra // Journal of King Saud University - Computer and Information Sciences. - 2013. - Vol. 25, Issue 1. - P. 35-42. doi: 10.1016/j.jksuci.2012.05.006

7. Саенко, В. И. Метод выбора моментов измерений для процессов непрерывного мониторинга [Текст] / В. И. Саенко, А. И. Гриценко // Радиоэлектроника и информатика. - 2007. - № 4. - C. 119-122.

8. Hernandez, E. Adaptive Sampling for Network Management [Text] / E. Hernandez, M. Chidester, A. George // Journal of Network and Systems Management. - 2001. - Vol. 9, Issue 4. - P. 409-434.

9. Andrey, L. Survey of SNMP performance analysis studies [Text] / L. Andrey, O. Festor, A. Lahmadi, A. Pras, J. Schönwälder // International journal of network management. - 2009. - Vol. 19, Issue 6. - P. 527-548. doi: 10.1002/nem.729

10. Pras, A. Comparing the Performance of SNMP and Web Services-Based Management [Text] / A. Pras, T. Drevers, R. van de Meent, D. Quartel // IEEE: Transactions on network and service management. - 2004. - Vol. 1, Issue 2. - P. 72-82. doi: 10.1109/ tnsm.2004.4798292

11. Айвазян, С. А. Прикладная статистика и основы эконометрики [Текст] / С. А. Айвазян, В. С. Мхитарян. - Юнити. -1998. - 1005 с.

12. Стрижов, В. В. Методы выбора регрессионных моделей [Текст] / В. В. Стрижов, Е. А. Крымова. - Вычислительный центр РАН, 2010. - 60 с.

13. Карабутов, Н. Н. Выбор структуры модели при обработке результатов измерений в системах управления [Текст] / Н. Н. Карабутов // Измерительная техника. - 2008. - № 9. - С. 29-33.

14. Саенко, В. И. Информационные модели наблюдаемых процессов для мониторинга компьютерных сетей [Текст] / В. И. Са-енко, А. И. Гриценко // Вестник национального технического университета «ХПИ». Серия: «Новые решения в современных технологиях». - 2014. - № 48. - С. 55-66.

15. Lavy, M. Windows Management Instrumentation (WMI) [Text] / M. Lavy, A. Meggitt. - New Riders Publishing, 2001. - 432 p.

16. DMTF Std. DSP0004, Specification Version 2.6.0. Common Information Model (CIM) Infrastructure [Text] / March 2010. - 186 p.

-□ □-

У данш роботi розглянуто процес побудови мульти-базових сховищ даних на основi властивостей даних, для яких воно будуеться, i запитiв, як виконуються до цих даних. Проаналiзовано показники швидкоди побу-дованого сховища, зокрема на рiзних етапах побудови. Дослиджено вплив параметрiв двофазного алгоритму, зокрема порогу адаптаци процесу пошуку на основi гетв Ключовi слова: мультибазовi сховища даних, струк-туроватсть даних, модифжований генетичний алгоритм з адаптащею

□-□

В данной работе рассмотрен процесс построения мультибазових хранилищ данных на основе свойств данных, для которых оно строится, и запросов, которые выполняются с этими данными. Проанализированы показатели быстродействия построенного хранилища, в том числе на различных этапах построения. Исследовано влияние параметров двухфазного алгоритма, в частности порога адаптации процесса поиска на основе генов

Ключевые слова: мультибазовые хранилища данных, структурированность данных, модифицированный генетический алгоритмы с адаптацией -□ □-

УДК 004.652

|doi: 10.15587/1729-4061.2015.36646|

ПОБУДОВА МУЛЬТИБАЗОВИХ СХОВИЩ ДАНИХ НА ОСНОВ1 СТРУКТУРОВАНОСТ1 ДАНИХ ТА ЗАПИТ1В

А. Ю. Яцишин

Провщний прикладний програмют ДП «Головфштех» вул. Дегтярiвська, 38-44, м. Кшв, УкраТна, 04119 E-mail: andrew.yatsyshyn@hotmail.com

1. Вступ

На сьогодш шнують рiзнi роботи та лиературш джерела, що описують сховища даних, 1х проекту-вання та штегращю даних. Зокрема, запропоноваш шдходи е у авторiв У. 1нмона [1], Р. Юмболла [2] та Д. Хекш [3]. Для сховищ даних формалiзовано низку моделей що визначають сховище даних i дозволяе описувати процес 1х побудови. Щ моделi будуються на основi схеми «сутшсть-зв'язок» або похщно! вщ не1 схеми <^рка». Також представлена низка роби, що описують рiзнi методики оптимiза-

цп баз даних - побудову шдекив, вибiр матерiалi-зованих представлень, горизонтальну та вертикальна фрагментащю.

Автором у робоН [4] було введено мультибазовi сховища даних, як включать не Нльки реляцшну i багатовимiрну базу даних, а також бази даних з вщсутшстю жорстко'! схеми - XML та NoSQL, i файлове сховище.

Таю сховища даних проектуються для оптимального збертння даних рiзного рiвня структу-рованосН, спрямованого на шдвищення швидкоди виконання запиНв.

©

i Надоели баннеры? Вы всегда можете отключить рекламу.