Научная статья на тему 'АНАЛИЗ БИЗНЕС ПРОЦЕССОВ НА ОСНОВЕ СТАТИСТИЧЕСКИХ ДАННЫХ'

АНАЛИЗ БИЗНЕС ПРОЦЕССОВ НА ОСНОВЕ СТАТИСТИЧЕСКИХ ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
90
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОЦЕСС / МОДЕЛЬ / КАЧЕСТВО / ИННОВАЦИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Строителев В.Н., Жидкова Е.А.

Начальный и основной этап научного анализа бизнес процесса любой направленности включает в себя построение аналитической модели процесса. Для «владельца» процесса подобная модель должна позволять с некоторой степенью доверия проводить оценку и измерение настоящих и будущих (перспективных) характеристик анализируемой продукции, являющейся участником процесса.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF BUSINESS PROCESSES ON THE BASIS OF STATISTICAL DATA

The initial and main stage of the scientific analysis business of process any orientation includes creation analytical model of process. For "owner" process the similar model has to allow to carry out an assessment and measurement of the present and future (perspective) characteristics the analyzed production which is the participant of process with some degree trust.

Текст научной работы на тему «АНАЛИЗ БИЗНЕС ПРОЦЕССОВ НА ОСНОВЕ СТАТИСТИЧЕСКИХ ДАННЫХ»

АНАЛИЗ БИЗНЕС ПРОЦЕССОВ НА ОСНОВЕ СТАТИСТИЧЕСКИХ ДАННЫХ

Строителев В.Н.

дтн, профессор, Государственное бюджетное образовательное учреждение высшего профессионального образования Московской области, «Финансово-технологическая академия», г. Королев.

Жидкова Е.А.

старший преподаватель, Государственное бюджетное образовательное учреждение высшего профессионального образования Московской области, «Финансово-технологическая академия», г. Королев.

ANALYSIS OF BUSINESS PROCESSES ON THE BASIS OF STATISTICAL DATA Stroitelev V.N., Zhidkova E.A.

АННОТАЦИЯ

Начальный и основной этап научного анализа бизнес процесса любой направленности включает в себя построение аналитической модели процесса. Для «владельца» процесса подобная модель должна позволять с некоторой степенью доверия проводить оценку и измерение настоящих и будущих (перспективных) характеристик анализируемой продукции, являющейся участником процесса.

SUMMARY

The initial and main stage of the scientific analysis business of process any orientation includes creation analytical model of process. For "owner" process the similar model has to allow to carry out an assessment and measurement of the present and future (perspective) characteristics the analyzed production which is the participant of process with some degree trust.

Ключевые слова: процесс; модель; качество; инновации.

Keywords: process; model; quality; innovations.

Основой для построения аналитической модели процесса служат результаты предыдущего опыта применения аналогичной продукции или результаты планируемых и проведенных экспериментальных испытаний создаваемой продукции. Каким бы сложным ни был процесс, прежде всего, должны быть определены его цели, задачи и конечные результаты. И, в конечном счете, модель должна быть достаточно простой, позволяющей наглядно и с требуемой точностью анализировать процесс, предвидеть его результаты. Следует иметь в виду, что любая модель всегда является лишь приближенной

_Матрица процесса

копией реально происходящих преобразований. При выборе аналитической модели всегда необходимо исходить из возможности выбора простейших вариантов, обеспечивающих требуемую точность аппроксимации анализируемого процесса.

Рассмотрим гипотетический пример. Предположим, что по результатам проведения и исследования некоторого бизнес процесса получены значения входного (X) и выходного показателей качества продукции. Соответствующие численные показатели приведены в табл. 1.

Таблица 1

испытаний продукции_

X Y

1 2

2 5

3 9

4 15

5 9

6 5

7 7

По набору экспериментальных данных желательно построить аналитическую модель процесса, которая бы позволяла с требуемой точностью и достоверностью предсказывать и другие пары значений (х^ у^, как внутри анализируемого диапазона значений, так и за его пределами. Имея аналитическую модель, в дальнейшем можно прогнозировать рациональное распределение ресурсов, предвидеть возможные изменения и принимать меры для устранения негативных последствий.

Варианты различного вида аналитических моделей, построенные по результатам экспериментальных исследований, приведены в табл. 1.

Из рисунка видно, что из всех приведенных аппроксимаций статистических данных аналитическими моделями, только одна из них точно проходит через все 7 анализируемых точек. Другие модели в большей или меньшей степени имеют отклонения от наборов экспериментальных точек (х^ у^. В общем случае набор из п точек (х^ уО может быть описан полиномом (п - 1)-й степени, кривая которого проходит через все п экспериментальных точек. Наряду с этим, возникает вопрос - стоит ли добиваться такой высокой степени аппроксимации? Во-первых, сами экспериментальные точки, являясь результатами измерений, получены с некоторой погрешностью.

Поэтому любая аналитическая модель не является идеальной. Во-вторых, полиномиальная модель не адаптивна относительно числа точек эксперимента, т.к. любое их изменение приводит к необходимости нового этапа вычислений для определения всех коэффициентов полинома. И наконец, коэффициенты полинома высокой степени должны рассчитываться с предельной точностью.

Иначе ошибки аппроксимации могут превосходить любые разумные пределы.

На рис. 2 приведены полиномиальные модели различной степени - от первой ^1) до шестой ^6). Полиномы первой и шестой степени выделены по цвету.

Рис. 1. Варианты аналитических моделей, построенные по результатам эксперимента

Рис. 2. Полиномиальные модели аппроксимации статистических данных

Ниже приведена система полиномиальных уравнений (1), коэффициенты каждого из которых определены по методу наименьших квадратов (МНК). Это означает, что для каждого полинома ^й степени его коэффициенты гарантируют минимальную сумму квадратов отклонений экспериментальных точек (х^ у^эксп. от их соответствующих теоретических значений (х^ у^ теорет., получаемых из моделей аппроксимации полиномами первой ^1),...,шестой ^6) степени.

У3=

Y1= 5,2857+ 0,5357х У2 = - 4,5714 + 7,1071х - 0,8214x2 9,5714 +12,802х - 2,4881x2 + 0,1389x3

(1)

У4 = 18,286- 31,376х + 18,792x2 - 3,8005x3 +0,2462x4 У5 = 10,429- 15,856x + 8,375x2 - 0,7102x3 - 0,1705x4 + +0,0208x5

У6 =-140+331,22x - 285,7x2 +119,56x3-25,687x4+2,7208x5--0,1125x6

Из представленного набора полиномов, попытаемся определить какой из них целесообразно использовать для практического применения. С этой целью, прежде всего, вычислим в заданных точках эксперимента Xi числовые значения зависимой переменной Y i для каждой из шести моделей аппроксимации. Результаты вычислений приведены в табл. 2.

Таблица 2

Теоретические оценки результатов эксперимента

Числовые значения

X исходные Y исходные Y1 Y2 Y3 Y4 Y5 Y6

теорет. теорет. теорет. теорет. теорет. теорет.

1 2 5,821 1,719 0,881 2,148 2,088 2,001

2 5 6,357 6,366 7,191 4,237 4,473 4,994

3 9 6,893 9,371 10,192 10,615 10,305 8,975

4 15 7,428 10,734 10,717 13,249 13,203 14,947

5 9 7,964 10,455 9,599 10,019 10,186 8,913

6 5 8,500 8,534 7,671 4,709 4,163 4,869

7 7 9,036 4,971 5,768 7,017 6,428 6,806

Очевидно, что из всех шести моделей простейшей моделью является линейная аппроксимация результатов эксперимента. Другие модели более сложные, и эта сложность будет проявляться в результате дельнейшего использования и практического применения того или иного аналитического выражения.

Учитывая тот факт, что все полином описывают один и тот же набор статистических данных, применим к набору чисел Y, представленных в семи столбцах табл.2, методологию дисперсионного анализа. При этом мы ясно понимаем, что в дальнейшем необходимо обосновать корректность принимаемых решений. Результаты одно-факторного дисперсионного анализа приведены в табл. 3.

Таблица 3

Однофакторный дисперсионный анализ

ИТОГИ

Группы Счет Сумма Среднее Дисперсия

Столбец Y исх. 7 52 7,428571 17,28571

Столбец Y1теор. 7 51,999 7,428429 1,33964

Столбец Y2теор 7 52,15 7,45 10,80747

Столбец Y3теор 7 52,019 7,431286 11,48407

Столбец Y4теор 7 51,994 7,427714 16,06284

Столбец Y5теор 7 50,846 7,263714 16,32554

Столбец Y6теор 7 51,505 7,357857 17,23523

Дисперсионный анализ

Источник вариации SS df MS F P-Знач. F крит.

Между группами 0,183394 6 0,030566 0,00236 0,9999 2,324

Внутри групп 543,2431 42 12,93436

Итого 543,4265 48

Из таблицы дисперсионного анализа следует, что все аналитические зависимости примерно с равной степенью успеха характеризуют среднее арифметическое значение набора исходных статистических данных. На уровне значимости а = 0,05 оценки средних значений, получаемые различными моделями, статистически не различимы:

F = 0,00236 << F крит. = 2,324.

Однако при этом выполнении дисперсионного анализа было нарушено одно из необходимых условий его применения, заключающееся в однородности дисперсий. Данные табл. 3 свидетельствуют о том, что дисперсия выборочных значений для Y1теор. Существенно меньше дисперсий выборок, полученных по другим моделям.

Для проверки однородности дисперсий в группах выборок используется критерий Левенэ или F-критерий. Результаты оценки существенности различий дисперсий для двух выборок (Y исх. и Y1теор.), выполненные с помощью программы Microsoft Ехсе1, приведены в табл.4.

О чем свидетельствуют результаты табл. 4, и какие выводы нужно сделать при принятии решений о качестве бизнес процесса? Во-первых, линейная модель является простейшей моделью из всех рассматриваемых и ее целесообразно использовать для анализа бизнес процессов. Особенно часто возникает подобная необходимость при выполнении ориентировочных предположений о качестве анализируемой продукции. Во-вторых, дисперсии двух выборок, полученные экспериментально и рассчитанные по линейной модели, существенно различаются:

Р = 12,90322489 >> Р кр. = 4,283865714.

Поэтому, даже в случаях крайней необходимости при использовании линейной модели для аппроксимации реального бизнес процесса, характеризуемого данными табл. 1, следует делать поправки на диапазон рас-

Двухвыборочный Р-

пределения возможных результатов. Учитывая, что доверительный интервал для точечной оценки прямо пропорционален выборочному стандартному отклонению S, то доверительный интервал для анализируемого процесса (см. табл. 1), определяемый по линейной модели необходимо умножить на коэффициент 3,592.

Таблица 4

-тест для дисперсии_

Y исх. Y1теор.

Среднее 7,428571429 7,428428571

Дисперсия 17,28571429 1,339642952

Наблюдения 7 7

с^ 6 6

Р 12,90322489

Р(Р<=^ одностороннее 0,003331048

Р критическое одностороннее 4,283865714

Этот коэффициент получен из данных, представ ленных в табл. 4:

-у/17,28571

= 3,592.

,33964

Метод расчета доверительного интервала для предсказываемого значения зависимой переменной для линейной модели подробно изложен в работе [4], в разделе «Регрессионный анализ».

Еще раз следует подчеркнуть, что для процессов, подобных анализируемому, использование линейной модели весьма проблематично. Приведенный выше материал иллюстрирует только ход и возможные модели анализа, которые необходимо использовать для подтверждения адекватности аналитической модели набору реальных статистических данных. Некорректность непосредственного применения линейной модели лучше всего иллюстрируют данные табл. 5, в которой показано, что корреляция между исходным набором данных и теоретических данных линейной модели крайне низкая - коэффициент корреляции Пирсона К = 0,278.

Таблица 5

Парный двухвыборочный ^тест для средних_

Y исх. У1

Среднее 7,428571 7,428429

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Дисперсия 17,28571 1,339643

Наблюдения 7 7

Корреляция Пирсона 0,278245

Гипотетическая разность средних 0

Cf 6

^статистика 9,46Е-05

Р(Т<=^ одностороннее 0,499964

t критическое одностороннее 1,94318

Р(Т<=^ двухстороннее 0,999928

t критическое двухстороннее 2,446912

Теоретически любой набор точек можно аппроксимировать линейной моделью, но адекватность полученной модели статистическому набору данных подлежит дополнительному исследованию. А если уж имеется настоятельная потребность опираться только на линейные модели, то можно попытаться разбить анализируемый интервал на перекрывающиеся участки более или менее близкие к линейным. Например, в табл. 6 представлены результаты аппроксимации статистических данных, приведенных в табл. 1, двумя прямыми, подобранными

по МНК соответственно для четырех первых и четырех последних эксперимента. Уравнения этих прямых приведены в первой строке таблицы, а их теоретические значения при 7-и фиксированных значениях X исх - в третьем и шестом столбцах табл. 6.

Результаты сравнений статистических данных и теоретических значений, получаемых линейной аппроксимаций представленного набора двумя прямыми с различными углами наклона, приведены в табл. 7 и табл. 8. Из рассмотрения таблиц можно сделать вывод о том, что

экспериментальные и теоретические данные статистически не различимы и между ними имеется высокий уровень корреляции.

В заключении попытаемся установить, какая простейшая модель, из приведенных в системе уравнений (1), позволяет адекватно описать характер изменения статистических данных. Анализ начнем с, простейшего из всех оставшихся, уравнения:

Y2 = - 4,5714 + 7,1071х - 0,8214x2 (2)

Сплайновая

Как и ранее, проведем парные сравнения теоретических значений ^2теор) с исходными опытными данными (Y исх) при соответствующих значениях независимой переменной (X исх). Исследования по сравнению статистических и теоретических результатов будем проводить, опираясь на опции пакета «Анализ данных» программы Microsoft Ехсе1.

Прежде всего, определим, статистически различимы и нет дисперсии двух пар данных (см. табл. 2). Результаты вычислений с помощью программы Microsoft Ехсе1 приведены в табл.9.

Таблица 6

результатов эксперимента_

Y11= - 3+4,3X Y12 = 24,4 - 2,8x

X исх. Y исх. Yll^. X исх. Y исх. Y12 тер

1 2 1,3 4 15 13,2

2 5 5,6 5 9 10.4

3 9 9,9 6 5 7,6

4 15 14,2 7 7 4,8

Таблица 7

Парный двухвыборочный t-тест для средних_

Y исх. Yll-ер.

Среднее 7,75 7,75

Дисперсия 31,58333 30,81667

Наблюдения 4 4

Корреляция Пирсона 0,987788

Гипотетическая разность средних 0

df 3

t-статистика 3,8E-16

P(T<=t) одностороннее 0,5

t критическое одностороннее 2,353363

P(T<=t) двухстороннее 1

t критическое двухстороннее 3,182446

Таблица 8

Парный двухвыборочный t-тест для средних_

Y исх. Y12 тер

Среднее 9 9

Дисперсия 18,66667 13,06667

Наблюдения 4 4

Корреляция Пирсона 0,83666

Гипотетическая разность средних 0

df 3

t-статистика 1,88E-16

P(T<=t) одностороннее 0,5

t критическое одностороннее 2,353363

P(T<=t) двухстороннее 1

t критическое двухстороннее 3,182446

Таблица 9

Двухвыборочный F-тест для дисперсии_

Y исх Y2теор

Среднее 7,428571 7,45

Дисперсия 17,28571 10,8074727

Наблюдения 7 7

df 6 6

F 1,599422

P(F<=f) одностороннее 0,291356

F критическое одностороннее 4,283866

Полученные результаты:

Р = 1,599422 < Р кр = 3,238867 -

свидетельствуют, что между дисперсиями внутри каждой группы существенной разницы нет. Дополни_Парный двухвыбороч

тельные исследования по проверке статистического равенства средних, приведенные в табл. 10, подтверждают: гипотеза Н0 отклонена быть не может, т.к. Y исх и Y2теор статистически не различимы ни по дисперсиям, ни по средним значениям и между существует довольно высокий уровень корреляции.

Таблица 10

лй ^тест для средних_

Y исх Y2теор

Среднее 7,428571 7,45

Дисперсия 17,28571 10,80747

Наблюдения 7 7

Корреляция Пирсона 0,789909

Гипотетическая разность средних 0

df 6

t-статистика -0,02224

P(T<=t) одностороннее 0,49149

t критическое одностороннее 1,94318

P(T<=t) двухстороннее 0,98298

t критическое двухстороннее 2,446912

Уравнение (2) является простейшим из системы (1), предназначенным для аппроксимации исходных данных бизнес процесса.

Список литературы

1. Глоссарий по управлению качеством, стандартизации, метрологии [Текст]: учебное пособие / Под ред. Т.Е. Старцевой, О.А. Горленко. Сост. Н.П. Асташева, Т.Н. Антипова, Е.А. Гришина, А.В. Грекова, А.В. Знайда, М.В. Максимова, И.А. Меркулова, Е.С. Слуднякова, В.Н. Строителев. - Ярославль: Изд-во «Канцлер», 2010. - 184 с.

2. Основы методологии нормирования и оценки показателей качества испытаний технической продукции на соответствие установленным требованиям:

учебное пособие для вузов/ Г.П. Богданов, Е.А. Жидкова, В.Н. Строителев, Л.П. Шумская, А.В. Яшин.-М: РГУИТП, 2012.

3. Управление инновациями и качеством [Текст] / Т.Н. Антипова, Н.П. Асташева, О.А. Горленко, В.Г. Исаев, О.А. Копылов, В.А. Коновалова, Е.А. Жидкова, В.Н. Строителев, А.Г. Суслов: учебное пособие / под.ред. Т.Е. Старцевой. - Москва. ФТА, 2013-300с.

4. Управление инновациями на основе априорной и статистической информации: монография / В. Н. Строителев, Е. Ю. Гаврючин, Е. А. Жидкова, Л. П. Шумская, Е. А. Росовская, Е. С. Слуднякова. - М.: РГУИТП, 2011.-260с.

НЕЧЕТКО-МНОЖЕСТВЕННЫЙ ПОДХОД В АНАЛИЗЕ ЭКОЛОГИЧЕСКОГО ВРЕДА _ОТ ТЕПЛОЭЛЕКТРОСТАНЦИЙ

Стулова Наталья Вячеславовна

Аспирант, Волгоградский государственный архитектурно-строительный университет, г. Волгоград

FUZZY-MULTIPLE APPROACH IN THE ANALYSIS OF ENVIRONMENTAL HARM FROM THERMAL POWER PLANTS Stulova Natalya, Postgraduate student, Volgograd state University of architecture and construction, Volgograd АННОТАЦИЯ

Определено понятие риска загрязнения окружающей среды промышленным предприятием на примере теплоэлектростанций. Представлен порядок формализации исходной качественной информации с помощью аппарата нечетких множеств. Нечеткий логический вывод производится по алгоритму Мамдани. ABSTRACT

The concept of environmental pollution risk of industrial enterprise on the thermal power plants' example is defined. The procedure of formalization quality information using fuzzy sets is considered. Fuzzy inference is made on the Mamdani algorithm.

Ключевые слова: риск; нечеткий вывод. Keywords: risk; fuzzy conclusion.

В законе «Об охране окружающей среды» от 10.01.2002 № 7-ФЗ экологический риск понимается как вероятность наступления события, имеющего неблагоприятные последствия для природной среды и вызванного

негативным воздействием хозяйственной и иной деятельности, чрезвычайными ситуациями природного и техногенного характера.

i Надоели баннеры? Вы всегда можете отключить рекламу.