Научная статья на тему 'Стохастическая модель процесса идентификации сервисов информационной системы'

Стохастическая модель процесса идентификации сервисов информационной системы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
279
74
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕРВИС / ИДЕНТИФИКАЦИЯ / СТОХАСТИЧЕСКАЯ МОДЕЛЬ / ВЕТВЯЩИЙСЯ ПРОЦЕСС / СЛУЧАЙНЫЙ ГРАФ / ОЦЕНКА ВРЕМЕНИ ПРОЕКТИРОВАНИЯ / ТРУДОЗАТРАТЫ / СЕРВИС-ОРИЕНТИРОВАННАЯ АРХИТЕКТУРА / SERVICE / IDENTIFICATION / STOCHASTIC MODEL / BRANCHING PROCESS / RANDOM GRAPH / DESIGN TIME ESTIMATION / LABOR COSTS / SERVICE-ORIENTED ARCHITECTURE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Циперман Г. Н.

В статье рассматривается задача оценки объема трудозатрат на проектирование функциональных требований к информационной системе в сервис-ориентированной архитектуре. Для этого предлагается стохастическая модель процесса идентификации сервисов информационной системы, позволяющая при минимальных исходных данных дать оценку ожидаемого количества объектов проекта и связей между ними. Модель основана на представлении процесса декомпозиции автоматизируемого бизнес-процесса как ветвящегося случайного надкритического процесса Гальтона-Ватсона. Проектирование связей между элементами декомпозиции моделируется как процесс построения связного случайного графа в модели Эрдеша-Реньи. Предсказания модели подтверждаются проверкой на экспериментальных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The stochastic model of information system services identification process

This article refers to labor costs estimation of information system functional requirements design problem in a service-oriented architecture. Stochastic model of information system services identification process is offered for this purpose, which allows providing the estimation of expected project objects and interrelations amount using minimal initial data. This model is based on automated business-process decomposition representation as a branching random supercritical Galton-Watson process. Decomposition elements relation design is been modeled as connected random graph construction process by Erdosh-Renyi model. Model predictions have been confirmed through verification by experimental data.

Текст научной работы на тему «Стохастическая модель процесса идентификации сервисов информационной системы»

Стохастическая модель процесса идентификации сервисов информационной системы

Г. И. Циперман <е. ¡вгрегтап®;voskhod.ru> ФГУП НИИ «Восход», 119607, Россия, г. Москва, ул. Удалъцова, дом 85.

Аннотация. В статье рассматривается задача оценки объема трудозатрат на проектирование функциональных требований к информационной системе в сервис-ориентированной архитектуре. Для этого предлагается стохастическая модель процесса идентификации сервисов информационной системы, позволяющая при минимальных исходных данных дать оценку ожидаемого количества объектов проекта и связей между ними. Модель основана на представлении процесса декомпозиции автоматизируемого бизнес-процесса как ветвящегося случайного надкритического процесса Гальтона-Ватсона. Проектирование связей между элементами декомпозиции моделируется как процесс построения связного случайного графа в модели Эрдеша-Реньи. Предсказания модели подтверждаются проверкой на экспериментальных данных.

Ключевые слова: сервис, идентификация, стохастическая модель, ветвящийся процесс, случайный граф, оценка времени проектирования, трудозатраты, сервис-ориентированная архитектура.

1. Введение

Процесс идентификации сервисов информационной системы (ИС) в парадигме сервис-ориентированной архитектуры (СОА)представляет собой суть проектирования ИС, включающего стадии разработки концепции, технического и рабочего проектирования.

На раннем этапе проектирования трудно предсказать сложность проекта, характеризуемую количеством и структурой связей между фактами предметной области, которые порождают соответствующие требования к сервисам ИС. Однако, для практики проектирования ИС этот вопрос имеет особую актуальность, вызванную необходимостью обеспечения объективной стоимости проекта.

Поэтапная оценка такой сложности не актуальна, т.к. в сложившейся практике создания ИС отдельное финансирование стадий проекта, когда стоимость каждой последующей стадии оценивается на основе результатов предыдущей, является исключительно редким явлением. Заказчик хочет получить оценку стоимости проекта до того, как проект начнется.

Данная работа посвящена изучению общих свойств процесса идентификации сервисов, обеспечивающих прогнозирование трудоемкости стадий формирования функциональных требований к создаваемой ИС.

2. Модель процесса идентификации сервисов

Основным методом идентификации сервисов является декомпозиция автоматизируемого бизнес-процесса, в результате которойсначала определяется дерево бизнес-функций [1]. Каядая бизнес-функция представляет собой описание некоторого промежуточного результата, получаемого при выполненииосновного бизнес-процесса. Например, бизнес-процесс проектирования технического сложного объекта

(ТСО) на первом уровне декомпозируется на следующие бизнес-функции:

• Инициация проектирования. Результатом является организация проекта по проектированию ТСО.

• Анализ структуры проектируемого ТСО, в результате которого формируются функциональная и логическая модель изделия.

• Разработка конструкции, предполагающая получение конструктивной модели ТСО и определение его комплектующих.

• Многоаспектный анализ предлагаемой конструкции ТСО, определяющий на основе технических и экономических расчетов соответствие характеристик проекта требованиям технического задания.

• Завершение проектирования, результатом которого является проект ТСО.

В свою очередь, каждая бизнес-функция может быть декомпозирована далее, исходя из более детальных промежуточных результатов ее выполнения. Понятно, что для составления полной картины бизнес-процесса на каждом уровне декомпозиции должна быть определена последовательность выполнения бизнес-функций, т.е. объекты декомпозиции должны быть связаны управляющими потоками. Такая модель называется сценарием бизнес-функции и представляет собой связный граф, узлами которого являются объекты декомпозиции, а ребрами - потоки управления. Конечный уровень декомпозиции бизнес-процесса соответствует описанию необходимых действий (операций), которые должен выполнить субъект

бизнес-процесса, чтобы получить требуемый промежуточный результат. Объекты этого уровня называются бизнес-операциями.

Таким образом, декомпозиция бизнес-функции бизнес-процесса включает в себя как бизнес-функции следующего уровня, так и бизнес-операции и описывается соответствующим сценарием.

Собственно, идентификация сервисов ИС начинается с определения сервисов операций. Под сервисом операции мы будем понимать спецификацию функций информационной системы, поддерживающих исполнение соответствующей бизнес-операции. Между бизнес-операцией и сервисом операции устанавливается однозначное соответствие. В связи с этим мы можем рассматривать их в связке как единый конструкт. Визуальное представление процесса декомпозиции бизнес-процесса приведено нарис. 1.

БИ11М<

II «чт* |р

I т— - - ■ -

грм :чг1и.ич

Рис. 1. Дерево декомпозиции бизнес-процесса.

Дадим формальное определение процессу декомпозиции бизнес-процесса. Пусть В{пс = {/¿} и Ворг = {о;]. где ¿,у 6 М- множества бизнес-функций и

бизнес-операций бизнес-процесса (вместе с сервисами операций). Определим отношение декомпозиции:

^/пс ^/пс и^орг (1)

= (2)

При этом

= С/д.....Гц. Од.....Од)

ЯгьГШ/ = 0 ^

я* ия2й и... 1шпй = (в/пс \ /о) иворг

В (3)/0- исходный бизнес-процесс. Таким образом, каждая бизнес-функция и бизнес-операция присутствуют только в одной декомпозиции. Определяем условие завершения декомпозиции, отражающее тот факт, что декомпозиция имеет смысл, если в результате порождается не менее одного элемента:

VI е М: |£)£ь| > 1 (4)

Дадим формальное определение сценарию бизнес-функции. Рассмотрим множество пар элементов

5й = {(^ 5,); VI,у ЕЫЛФ у, 5и 6 (ВГпс \ /о) №орг] (5)

Сценарием бизнес-функции /к с декомпозицией называется подмножество

с 5й

= £>к с КЛ; е 1 * }• 5и е (Втс \ /о) ив0рг] (6)

Сценарий бизнес-функции в отличие от ее декомпозиции может включать бизнес-функции и бизнес-операции из других декомпозиций. Этот факт отражает повторное использование конструктов при проектировании информационной системы. Как видно из (6), в случае, если бизнес-функция не имеет собственной декомпозиции она может иметь сценарий, в который входят элементы иных декомпозиций.

Пара элементов сценария соответствует отношению передачи управления между элементами и, вообще говоря, является ориентированной. Однако, нас интересует оценка количества таких пар и вопросы ориентации этой связи мы рассматривать не будем.

Вдентификация сервисов ИС представляет собой декомпозицию сервисов операций: сервисы системы обеспечивают выполнение функциональности, специфицированной сервисами операций. Аналогично последовательность вызова сервисов системы моделируется управляющими потоками, связывающими сервисы в соответствующий сценарий сервиса операции. Формально это определяется следующим образом.

Пусть Сорг = {(^множество сервисов операций. Связь сервисов операций модели с бизнес-операциями обеспечивается однозначным отношением зависимости

6 D ,Vi,j,p,s,n 6 И:

Ь\ о1 -> С;, о1 6 Ворг, с1 6 Сорг (7)

Как отмечалось выше, пару (ои с;)в силу характера однозначного отношения между ними мы будем рассматривать как единый объект. Пусть СБуБ = {/Г;} множество системных сервисов модели. Аналогично (1) - (3) определяем отношение декомпозиции для сервисов:

£>х: Сорг -» С5у5 (8)

(9)

= (гг1.....ггк),С/ = (гд.....г,,)) 6 05,Уи],к,1,п 6 МГ

Я?П£>/ = 0

...ис® |0Л > 1

(10)

Сервис операции, не имеющий самостоятельной декомпозиции, тем не менее, может иметь сценарий, включающий элементы декомпозиции других сервисов операций. Сценарий сервиса операции определяется аналогично сценарию бизнес-функции (5) - (6): Рассматриваем множество пар элементов

Б* = Ф у, г^ Е С5у5} (11)

Сценарием сервиса операции ск с декомпозицией называется

подмножество

^ с 5х

= {{П. пУ 05к с {гу}; I Ф }, ги 6 Схух} (12)

2.1. Вероятностная модель процесса декомпозиции

Процесс декомпозиции модели информационной системы мы будем рассматривать как случайный ветвящийся процесс Гальтона-Ватсона[2]. Обобщим оператор декомпозиции:

_ = й 6 ВГпс

V ^ — £ С5у5

Множество элементов декомпозиции будем обозначать как

А = -О СО = (хи> х12> ■■■> хт) (14)

В таких обозначениях ветвящийся процесс может быть описан следующим образом:

D0 =D( 0) = (/0) Di = D(f0) = (x1,x2,... ,xn) ^21 = Dipc-t) = (xUl... ,xlm);... ;D2n = D(xn) = (xnl,..., xni) (15)

Пусть ] - количество элементов декомпозиции 0/а;. Элементарной реализацией процесса декомпозиции назовем набор

со

= (jo. (li. $2ip. - - $kip...j) (16)

Вероятностное пространство(/2, T, Р)процесса декомпозиции определяется на пространстве событий, представляющем собой множество всех элементарных реализаций

П = {w} (17)

При этом, о-алгсбраГ порождается подмножествами пространства Q. а вероятностная мера Р задается соотношениями:

P{ZkiP...j = к] = Рк

(lL' %2ip' ■■■' %kip...j) = (к0> Ко k2ip, ..., fcfcip...;)} (18)

Pk0Pk1iPk2ip "'Pkkip j

Процесс декомпозиции, как и соответствующий ему процесс Гальтона-Ватсона, можно представить в виде плоского дерева, корнем которого является бизнес-процесс/0. Будем называть k-ым поколением процесса декомпозиции или уровнем дерева подмножество декомпозиций процесса

4 = {DkiJ (19)

Количество элементов k-ого поколения будем обозначать

Z(k) = \{DkLJ

(20)

I...]

Сформулируем основную задачу исследования этапа определения структурных элементов информационной системы. Для процесса декомпозиции, представляющего основной механизм определения структуры, Z(0) = 1 и, положим ■?(!) = /V,,. где/V,, неслучайная величина, соответствующая количеству бизнес-функций первого уровня декомпозиции бизнес-процесса, специфицированных при предварительном изучении темы проекта создания ИС.

Будем рассматривать процесс декомпозиции £>0какЛ/0подпроцессов £>1Ь представляющих собой надкритические процессы Гальтона-Ватсона с ненулевой вероятностью вырождения а (соответственно, вероятность невырождения процесса у = 1 - а). Надкритичность процесса означает, что математическое ожидание числа элементов декомпозиции

Щ] > 1 (21)

Требуется найти наиболее вероятное число элементов декомпозиции (ожидаемое число структурных компонент модели ИС) при указанных условиях.

2.2. Вероятностная модель построения сценария

Положим мы определили структуру модели информационной системы, спроектировав множество ее компонент, представляющее собой множество декомпозиций

Я={Яг},|Я|=п (22)

На следующем этапе проектирования мы должны построить сценарии бизнес-функций и сервисов операций, определяющих использование ИС в автоматизируемом бизнес-процессе. Мы будем рассматривать структуру системы перед началом построения сценариев как несвязный граф С(п), состоящий из п изолированных вершин. При таком подходе, исходя из смысла проектирования информационной системы, результатом проектирования сценариев должен явиться сценарий использования системы, представляющий собой связный граф С(п,М), где М - количество ребер этого графа. Формально, используя определения (6) и (12):

М = \Б\=^к\

к

5 = {5к} = (23)

= № = с е ки е (в/пе\/о)иворг}

I Я = {(П, о); О/с с {гу}; I Ф ]\ Гу 6 Схух}

Задачей исследования процесса построения сценария использования проектируемой информационной системы является определение необходимого количества времени для получения сценария 8 или, иными словами, формирования связного графа в(п,М).

Будем рассматривать граф в(п,М) как случайный граф в модели Эрдеша-Реньи. Формальное описание этой модели приведем, следуя изложению из монографии [3].

Определим вероятностное пространство всех графов £(п, М)порядка п и размера М, каждый элемент которого равновероятен. Очевидно

0<M<N = Q,\&(n,M)\ = (I¡¡í) (24)

Тогда вероятность формирования любого графа С(п,М) из этого пространства

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р{С = С{п,М)}=[^)1 (25)

В общем случае М функционально зависит от п: М=М(п). Введем понятие процесса на случайном графе.

Пусть V = {1,2,...,п]. Процессом С = (С4)о- где N = называется марковский процесс на V такой, что:

1) (« = о

2) Каждый представляет собой граф на V

3) в), имеет Ь ребер, где Ь = 1,2,..., N

4) С0 с ^ с-

Пусть £ = {¿г}, |£| = Л/¡вероятностное пространство, элементами которого являются равновероятные процессы^ .Отображение£ —> £(п, М)определяется как

С = (С4)У->С(п,М) (26)

Иначе: состояние процесса С4в момент времени £ = М отождествляется с элементом пространства £(п, М).

Мы рассмотрим процесс формирования сценария использования информационной системы как процесс на случайном графе. Момент завершения формирования сценария соответствует моменту Т5, когда граф С(п,М) становится связным. Под связностью мы будем понимать вершинную односвязность (/с(С) = 1). На практике это означает, что полностью определена связь бизнес-функций и входящих в них бизнес-операций и все состояния проектируемой информационной системы связаны между собой хотя бы одним маршрутом.

3. Метрики процесса идентификации сервисов

В качестве основной метрики процесса идентификации сервисов ИС, отражающей его стохастические закономерности, мы рассмотрим общее

количество элементов функциональной модели бизнес-процесса: бизнес-функций, бизнес-операций и системных сервисов

к

7Ь = |Д|=^/(0 (27)

1=0

Определение процесса декомпозиции (15) служит основой для рассмотрения всех элементов в единой вероятностной модели, несмотря на различие их природы. Другие метрики процесса (общее время проектирования и его эффективность) определяются количеством элементов модели. Модель процесса проектирования в части определения структуры функциональной модели автоматизируемого бизнес-процесса определяется следующими исходными предположениями:

1) В основе определения структурных элементов функциональной модели лежит процесс декомпозиции автоматизируемого бизнес-процесса.

2) Процесс декомпозиции рассматривается как ветвящийся процесс Гальтона-Ватсона с граничными условиями Z(0) = 1; Z(l) = /V,,. где Л/0- неслучайная величина.

3) Рассматриваемый ветвящийся процесс является надкритическим с ненулевой вероятностью вырождения. Процесс вырождается в случае, если каждая декомпозиция Л-ого поколения включает 0 или 1 элемент.

4) Число элементов декомпозиций, относящихся к к-ощ поколению имеет распределение Пуассона

= х] = ~те~Л (28)

х!

5) Математическое ожидание распределения элементов декомпозиций Л = ей НС зависит от поколения процесса.

Другой метрикой, зависящей от общего количества элементов функциональной модели, является количество связей между элементами. Это количество мы будем определять,как минимально необходимое для связности графа функциональной модели бизнес-процесса.

3.1. Ожидаемое количество элементов функциональной модели

Для количества элементов Л-ого поколения ветвящегося процесса математическое ожидание определяется как [4]

г(0 =Х\1 = (0,1,2,...) (29)

Соответственно оценка для общего количества элементов модели, учитывая независимость X от номера поколения, может быть определено по формуле суммы геометрической прогрессии

V1 - 1

п = 2/(0= Я_1 (30)

1=0

Учитывая граничные условия рассматриваемого процесса декомпозиции, мы будем рассматривать общий процесс как /V,, независимых процессов, начинающихся со второго уровня модели (считаем с нулевого уровня). Тогда выражение (30) примет вид

/Л* - 1\

п = 1+ЛЧт^т) (31)

Для того, чтобы сделать оценку (31) применимой необходимо оценить математическое ожидание элементов единичной декомпозиции и ожидаемое число уровней модели.

Обсудим вероятности вырождения ветвящегося процесса а и, соответственно, невырождения у = 1 — а. Интуитивно понятно, что чем выше вероятность невырождения процесса, тем больше структурных элементов декомпозиции удастся получить. В практике проектирования информационных систем это соответствует глубине понимания проектировщиком автоматизируемого бизнес-процесса: чем больше деталей предметной области известно, тем больше фактов (элементов) может быть отражено в функциональной модели бизнес-процесса. В связи с этим мы будем называть вероятность у детальностью модели бизнес-процесса, обратную вероятность а - ее неопределенностью.

Детальность проектируемой модели может служить входным параметром для оценки основных метрик процесса проектирования. Чем выше детальность, тем подробнее должна быть модель и, соответственно, больше трудозатрат такая работа потребует.

Известным фактом теории ветвящихся процессов является зависимость вероятности вырождения надкритического ветвящегося процесса от математического ожидания X [4]. Неопределенность модели является наименьшим неотрицательным корнем уравнения

/(а) = а

(32)

Здесь /(а) вероятностная производящая функция, задающая распределение случайной величины Для пуассоновского распределения [5]

¿=о ¿=о

(Да)'

,-Я _ _,Л(а-1) _ р-Лу

(33)

Подставив (33) в (32), легко видеть

¿71(1 - у)

Л =

1п(а)

Г

(34)

Уравнение (34) определяет зависимость ожидаемого количества элементов единичной декомпозиции от детальности (неопределенности) функциональной модели бизнес-процесса.

Для оценки ожидаемого количества уровней декомпозиции воспользуемся следующими соображениями. Пусть вырождение процесса декомпозиции начинается с уровняК. Мы рассмотрим каждый элемент этого уровнях^ как начальный для отдельного процесса В этом случае для каждого такого процесса декомпозиции общее количество элементов определяется выражением [4]

Пг! = '

1-/4«)

Учитывая (32) и (33) выражение (35) принимает вид

1

пк, = ■

(35)

(36)

1 — Ла

Как видно из (36) число элементов, возникающих при вырождении любого из процессов 0/а.определяется выражением

Ла

АП= Т^М

-1 =■

1 — Ла

Диапазон, в котором лежит Апк1 определяется неравенством1

=

Ла

1 — Ла

Ла

1 — Ла

= Ап

Лед

(37)

(38)

Общее число процессов Отравно Лк количеству элементов на/\"-ом уровне декомпозиции бизнес-процесса, относящихся к подпроцессу О,;. Тогда

'Мы будем обозначать символами [а] и [а! значения округления числа авниз и вверх соответственно.

количество элементов, входящих в следующие за АТ-ым уровни (уровни вырождения), будет определяться как диапазоне

&Ndeg = Лк 1 Andegn лежит в

ANdeg = A*"1 Andeg < ANdeg < ANdeg = A*"1 Andeg

(39)

Значение количества элементов декомпозиции на уровне вырождения процесса £>1Ь определяемое выражением (39), мы будем относить к последнему АТ+1-ому поколению декомпозиции этого процесса. Для того, чтобы оценить значение К, положим, что уровень К является последним, т.е. на уровне вырождения нет элементов. Это означает, что

2 си

Разрешая неравенство (40)относительно К. получаем оценку ln( 1 — Ла) — 1п(Ла)

К =

1п(Л)

+ 1

(41)

На рис. 2 приведен график зависимости количества уровней декомпозиции ^.'функциональной модели бизнес-процесса от детальности Л.

Детальность модели ti-и jh- l:l процесса

Рис. 2. График зависимости количества уровней декомпозиции функционапъной модели бизнес-процесса от детальности.

Определение уровня начала вырождения декомпозиции основывалось на предположении, что следующий уровень модели, соответствующий вырождению, не содержит элементов декомпозиции. На самом деле, это не так: мы должны учесть элементы на уровне вырождения (на практике их вполне заметное количество). Однако, полученные значения уровня начала декомпозиции в предположении, с ростом числа элементов уровня вырождения меняются медленно. Можно показать, что К растет медленнее логарифма числа элементов на уровне вырождения декомпозиции. В связи с этим оценка, определяемая уравнением (41), является вполне приемлемой и, что важно, согласуется с реальной практикой проектирования, где в основном декомпозиция заканчивается на третьем уровне, а уровень 5 встречается достаточно редко.

Теперь мы имеем все необходимые данные для оценки общего числа элементов декомпозиции исходного бизнес-процесса:

<1К -

(42)

TD=n + N0ANdeg = 1 + N0

13Г+ ^

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Учитывая неравенство (39) ожидаемое количество элементов декомпозиции определяется диапазоном

<ХК-

TD =

1 +N0

1 + N0

ÄK-1

<TD<TD =

Ä-l

+ AN,

deg

(43)

3.2. Время проектирования сценариев

Как отмечалось, момент завершения проектирования сценариев модели определяется наступлением в случайном процессе G связности графа G(n,M), вершинами которого являются элементы декомпозиции бизнес-процесса (бизнес-функции, бизнес-операции и системные сервисы). При этом Tsопределяется количеством ребер М в модели. В работе [3] показано, что для Vk 6 И,х 6 R, если

М(п) = | (Zn(n) + kln(ln(n)) + х + о(1)) (44)

то вероятность того, что состояние процесса G является ^-связным определяется предельным соотношением

P{k(G(n,М)) = k] -> 1 - е~е~х/к> (45)

Используем это соотношение следующим образом. Положим, что требуемая вероятность связности сценариев определяется детальностью модели, т.е.

Р{/с(С(п,М)) = 1} = / (46)

Используя требование (45), из (46)получаем

х = -1п(-1п(1 -у)) (47)

Тогда, с учетом (47), время Т5, необходимое для того, чтобы граф С(п,М) стал связным, на основании выражения (44) можно оценить как Т

т5 = М{ТВ) = (1п(Тв) + Ы{Ы{ТВ)) - Ы{-Ы{1 - 7))) (48)

Здесь Твопределяется соотношением (43). Диапазон для Т5соответственно определяется как

М(7Ь) <Г5 <М(7Ь) (49)

3.3. Оценка трудоемкости проектирования

На основании оценки количества элементов декомпозиции модели бизнес-процесса мы можем оценить ожидаемуютрудоемкость проектирования. Исходим из того, что трудоемкость, необходимая для декомпозиции пропорционально количеству элементов декомпозиции (43), а трудоемкость построения сценариев бизнес-функций и сервисов операций пропорциональна количеству ребер связного графа модели, определяемому выражением (48):

ТР = каТв + к5Т3 (50)

Здесь ка и кБ- экспертно определяемые коэффициенты. Эти коэффициенты определяются временем, необходимым для проектирования одним человеком одного элемента декомпозиции и одной связи сценария соответственно. Длярасчетов мы будем исходить из следующей экспертной оценки:

/сл = 1,5 -н 2,0 чел • час

(51)

к5 = 0,1 -н 0,3 чел • час

Отметим, что эти экспертные оценки отражают опыт автора и, вообще говоря, зависят от квалификации специалиста. В каяедом конкретном случае представленные коэффициенты должны уточняться с учетом специфики проектной организации.

В качестве примера прогнозную оценкутрудоемкости проектирования в зависимости от детальности модели бизнес-процесса представляют табл. 1 для Л/0 = 4 ирис.З для Л/0 = 8.

Табл. 1. Оценка трудоемкости проектирования для = 4.

1 К То Т5 Трудоемкость (чел*час)

пип тах тт тах пип тах

0,83 2 14 23 21 43 34 59

0,86 2 15 24 23 44 37 61

0,87 2 15 24 22 43 37 61

0,88 3 38 62 79 149 100 169

0,9 3 42 68 89 164 111 185

0,93 3 50 82 107 201 132 224

0,96 3 64 109 141 276 170 301

0,98 3 85 149 194 391 228 415

0,985 3 95 168 220 447 256 470

0,99 3 111 197 263 534 301 554

0,991 3 115 205 273 558 312 577

0,992 4 581 1042 1929 3810 1741 3227

0,993 4 624 1123 2089 4139 1875 3488

Рис 3. График зависимости трудоемкости от детальности модели при N0 = 8.

Скачки на графике зависимости времени проектирования от детальности модели соответствуют изменению уровня начала вырождения модели. Интерпретация таких переходов связана со стадиями проектирования информационной системы. Уровень начала вырождения 2 соответствует стадии разработки концепции системы и предполагает определение автоматизируемых операций. Третий или четвертый уровень соответствует стадии технического проектирования, на котором специфицируются требования к системным сервисам. Наконец, пятый и последующие уровни предполагают детальную разработку требований к программным компонентам системных сервисов и соответствуют стадии рабочего проектирования.

4. Проверка модели на экспериментальный данных

Для проверки предложенной стохастической модели процесса идентификации сервисов информационной системы мы рассмотрим два выполненных автором технических проекта информационных систем. Первый проект связан с проектированием аналитической (OLAP) системы, а второй касается информационной системы поддержки концептуального проектирования технически сложных объектов морской техники (проект TCO МТ). Проверка будет осуществлена по следующим направлениям:

1) Проверка распределения количества элементов декомпозиции каждого уровня на соответствие распределению Пуассона2

2) Попадание общего количества элементов декомпозиции проектной модели ^ в рамки теоретически предсказанного интервала

3) Соответствие общего количества связей в сценариях проектной модели предсказаниям стохастической модели процесса проектирования.

4.1. Проект 01-АР-системы

Распределение количества элементов декомпозиции в модели ОЬАР-

системы представляет рис. 4.

Рис. 4. Структура декомпозиции модели ОАР-системы. Исходные характеристики модели:

• Количество элементов декомпозиции первого уровня Л/0 = 8

• Количество уровней декомпозиции к=3 (начиная с нулевого)

• Количество элементов декомпозиции ^ = 83

2 Проверка гипотезы о том, что распределение количества элементов в декомпозиции соответствует распределению Пуассона, выполнено при помощи интернет-ресурса http://math.semestr.ru/group/poisson-examples.php.

• Количество связей в сценариях/^ = 249.

Распределение количества элементов декомпозиции для уровней 2 и 3, а также для всей модели, полученное на основе анализа структуры модели, представляет табл. 2.

Табл. 2. Распределение количества элементов декомпозиции в модели ОЬАР-системы.

i fz i i ft

1 1 8 9

2 1 7 8

3 4 4 8

4 0 4 4

5 2 0 2

т ЗДЗ 2,17 2,42

Проверка гипотезы о соответствии распределения количества элементов декомпозиции распределению Пуассона дает следующие результаты:

1) Для уровня 2. При уровне значимости 0,4 критическое значение статистики Пирсона Ккр = 7,38, а наблюдаемое значение Кнабл = 0,87.

2) Для уровня 3. При уровне значимости 0,4 критическое значение статистики Пирсона Ккр = 7,38, а наблюдаемое значение Кнабл = 3,72.

3) Для всей модели. При уровне значимости 0,4 критическое значение статистики Пирсона Ккр = 9,35, а наблюдаемое значение Кнабл = 3,91.

Во всех случаях наблюдаемое значение статистики Пирсона не попадает в критическую область (Кнабл < Ккр), поэтому справедливо предположение о том, что данные выборки имеют распределение Пуассона. Расчет определяет для Я = ^ = 2,42 ожидаемые значения:

у = 0,881 К = 3 76 <TD< 122 192 <TS< 343

Как видно, экспериментальное значение fyблизко к нижней границе диапазона. Это объясняется тем, что уровень вырождения в модели отсутствует, т.е. последний уровень декомпозиции равен теоретическому уровню начала вырождения К=3.

4.2. Проект TCO МТ

На рис. 5 представлено распределение количества элементов декомпозиции Çki...jB модели информационной системы поддержки концептуального проектирования TCO МТ.

Рис. 5. Структура декомпозиции модели информационной системы поддержки концептуапъного проектирования ТСОМГ. Исходные характеристики модели:

• Количество элементов декомпозиции первого уровня N0 = 4

• Количество уровней декомпозиции к = 4 (начиная с нулевого)

• Количество элементов декомпозиции = 187

• Количество связей в сценариях Mf = 345.

Распределение количества элементов декомпозиции для уровней 2 и 3, а также для всей модели, полученное на основе анализа структуры модели, представляет табл. 3.

Табл. 3. Распределение количества элементов декомпозиции в модели проекта ТСО МГ

i i ki ki Kt

1 0 5 3 7

2 0 2 2 4

3 2 2 2 10

4 0 2 6 3

5 1 3 1 9

6 1 1 5 2

7 0 2 0 3

8 0 0 1 0

9 0 1 0 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

m 5,25 4,72 4,00 4,43

Проверка гипотезы о соответствии распределения количества элементов декомпозиции распределению Пуассона дает следующие результаты:

1) Для уровня 2. При уровне значимости 0,05 критическое значение статистики Пирсона Ккр = 3,84, а наблюдаемое значение Кнабл = 2,63.

2) Для уровня 3. При уровне значимости 0,05 критическое значение статистики Пирсона Ккр = 12,59, а наблюдаемое значение Кнабл = 9,01.

3) Для уровня 4. При уровне значимости 0,05 критическое значение статистики Пирсона Ккр = 11,07, а наблюдаемое значение Кнабл = 6,68.

4) Для всей модели. При уровне значимости 0,05 критическое значение статистики Пирсона Ккр = 14,07, а наблюдаемое значение Кнабл = 9,21.

Во всех случаях наблюдаемое значение статистики Пирсона не попадает в критическую область (Кшабл < Ккр), поэтому справедливо предположение о том, что данные выборки имеют распределение Пуассона. Расчет определяет для Я = ^{ = 4,43 ожидаемые значения:

у = 0,987

К = 3

102 < Тв < 181

239 < Т3 < 487

Экспериментальное значение ~ Тв близко к верхней границе диапазона (расхождение составляет 3%). Близость к верхней границе ожидаемого диапазона объясняется тем, что в модели присутствует уровень вырождения, т.е. последний уровень декомпозиции на единицу превосходит теоретический уровень начала вырождения К=3.

Таким образом, можно сделать заключение, что предлагаемая стохастическая модель процесса идентификации сервисов информационной системы дает хорошее приближение к экспериментальным данным.

Список литературы

[1]. Г.Н. Циперман. Применение метода адаптивной кластеризации для проектирования сложных информационных систем. III Научно-практическая конференция «Актуальные проблемы системной и программной инженерии». Сборник научных трудов. Москва, МЭСИ, 6 -7 июня 2013 г.

[2]. В.А. Ватутин, A.M. Зубков. Ветвящиеся процессы. I. Сборник «Итоги науки и техники». Серия «Теория вероятностей. Математическая статистика. Теоретическая кибернетика». Москва, ВИНИТИ, 1985, том 23, стр. 3-67.

[3]. BelaBollobas. RandomGraphs. Secondedition, CambridgeUniversityPress 2001

[4]. В.А. Ватутин. Ветвящиеся процессы Беллмана-Харриса. Лекционные курсы НОЦ. Математический институт им. В.А. Стеклова. Москва, МИАН, 2009.

[5]. Н. Алон, Дж. Спенсер. Вероятностный метод. Москва, БИНОМ. Лаборатория знаний, 2011.

The stochastic model of information system services identification process

G. Tsiperman <g. tsiperman&yoskhod. ru > Federal State Unitary Enterprise Organization "VOSKHOD", 85 Udaltsova Str., Moscow, 119607, Russian Federation

Abstract. This article refers to labor costs estimation of information system functional requirements design problem in a service-oriented architecture. Stochastic model of information system services identification process is offered for this purpose, which allows providing the estimation of expected project objects and interrelations amount using minimal initial data. This model is based on automated business-process decomposition representation as a branching random supercritical Galton-Watson process. Decomposition elements relation design is been modeled as connected random graph construction process by Erdosh-Renyi model. Model predictions have been confirmed through verification by experimental data.

Keywords: service, identification, stochastic model, branching process, random graph, design time estimation, labor costs, service-oriented architecture

References

[1]. G.N.Tsiperman. Primenenie metoda adaptivnoi klasterizatsii dly aproekturovaniya slozhnyh informatsionnyh system [Application of a method of adaptive clustering for complex information systems design] III Nauchno-prakticheskaya konferentsiya «Aktualnye problemy sistemnoii programmnoi inzhenerii» [III Scientific-practical conference "Actual problems of system and software engineering"]. Sbornik nauchnyh trudov [Collection of proceedings], Moscow, MESI, 6 -7 June 2013 r. (in Russian).

[2]. V.A. Vatutin, A.M. Zubkov. Vetvyaschiesya protsessy. I [Branchingprocess. 1]. Sbornik «Itogi nauki I tekhniki». [The book "The Results of science and technology"]. Moscow, VINITI, 1985, vol. 23, 3-67 p.(in Russian).

[3]. BelaBollobas. RandomGraphs. Secondedition, CambridgeUniversityPress 2001

[4]. V.A. Vatutin. Vetvyaschiesya protsessy Bellman-Harris [Branching processes Bellman-Harris]. LektsionnyekursyNOTS [Lecture courses]. Mathematical instituteV.A. Steklov. Moscow, MIAN, 2009.(in Russian).

[5]. N. Alon, J.H. Spencer. The Probabilistic Method. Third Edition. JohnWiley&Sons, 2008.

i Надоели баннеры? Вы всегда можете отключить рекламу.