Научная статья на тему 'О концепциях статистических измерений'

О концепциях статистических измерений Текст научной статьи по специальности «Математика»

CC BY
113
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНЦЕПЦіЯ / СТАТИСТИКА / ВИМіРЮВАННЯ / КОНЦЕПЦИЯ / ИЗМЕРЕНИЕ / CONCEPT / STATISTICS / MEASUREMENT

Аннотация научной статьи по математике, автор научной работы — Блохин Е. П., Коротенко М. Л., Грановский Р. Б., Гаркави Н. Я., Федоров Е. Ф.

Описаны четыре концепции статистических измерений и реализующие эти концепции методики обработки наблюдений; приведены примеры, в которых продемонстрированы случаи правомерного и неправомерного использования при решении производственных задач результатов, полученных по этим методикам.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Блохин Е. П., Коротенко М. Л., Грановский Р. Б., Гаркави Н. Я., Федоров Е. Ф.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT THE CONCEPTS OF STATISTICAL MEASUREMENTS

There are described four concepts of the statistical measurements and the methods realizing these concepts for processing the observations. There are adduced the examples in which correct and incorrect using of the results obtained by this methods for solutions of the industrial problems are demonstrated.

Текст научной работы на тему «О концепциях статистических измерений»

УДК 519.22/25

Е. П. БЛОХИН, М. Л. КОРОТЕНКО, Р. Б. ГРАНОВСКИИ, Н. Я. ГАРКАВИ,

Е. Ф. ФЕДОРОВ (ДИИТ), Е. И. ФИЛИППЕНКО (Ленинский районный в городе совет,

Днепропетровск), О. Н. ЛИТВИНЕНКО (ИСЦ ГП «Приднепровская железная дорога»)

О КОНЦЕПЦИЯХ СТАТИСТИЧЕСКИХ ИЗМЕРЕНИЙ

Описано чотири концепци статистичних вимiрiв та методики обробки спостережень, як1 реалiзують щ концепцiï; наведено приклади, в яких продемонстровано випадки правомiрного i неправомiрного викорис-тання при вирiшеннi виробничих задач результатiв, отриманих по цих методиках.

Описаны четыре концепции статистических измерений и реализующие эти концепции методики обработки наблюдений; приведены примеры, в которых продемонстрированы случаи правомерного и неправомерного использования при решении производственных задач результатов, полученных по этим методикам.

There are described four concepts of the statistical measurements and the methods realizing these concepts for processing the observations. There are adduced the examples in which correct and incorrect using of the results obtained by this methods for solutions of the industrial problems are demonstrated.

Постановка проблемы в общем виде

Многие производственные задачи решаются на основании результатов статистической обработки предварительно собранной в испытаниях информации. Зачастую производственная задача ограничивается предъявлением какого-либо браковочного признака к испытанному изделию или доказательством того, что никаких браковочных признаков предъявить к испытанному изделию нельзя. При этом иногда браковочным признаком испытуемого изделия считается недопустимо высокая (или недопустимо низкая) вероятность появления какого-либо события, а иногда браковочный признак вырабатывается на основании сравнения статистической оценки измеряемой характеристики с наперёд заданной константой или со статистической оценкой аналогичной характеристики другого изделия.

Отметим, что в испытаниях возможен и полный перебор, и репрезентативная (представительная) выборка производственных ситуаций (результаты, полученные в репрезентативной выборке, не противоречат результатам, которые гипотетически можно было бы собрать при полном переборе производственных ситуаций). В качестве примера полного перебора можно привести проверку включения и выключения электрической цепи выключателем. Репрезентативными, например, являются результаты форсированных испытаний. Иногда решение производственной задачи должно распространяться и на те производственные ситуации, которые в испытаниях не исследовались. В таких случаях говорят, что «серия испытаний»

была «незаконченной» или «недостаточно представительной».

В статье описаны четыре концепции статистических измерений, методики обработки наблюдений, реализующие эти концепции; приведены примеры, в которых продемонстрированы случаи правомерного и неправомерного использования при решении производственных задач результатов, полученных по этим методикам. Отметим, что, согласно ГОСТ 8.207-76 [1], измерением называется результат статистической обработки результатов наблюдений, а наблюдением называется получение каждого отсчёта, необходимого для последующей статистической обработки.

1. Определение вероятности попадания результата измерения в заданные границы

1.1. Постановка задачи. Задана выборка N

N

случайных чисел ^х7. Требуется определить

7=1

вероятность Р того, что любое число из выборки попадает в заранее заданные (гарантированные, гарантийные) границы, т.е. что

Х7 е [Хн, Хк ] .

1.2. Решение задачи. Искомая вероятность равна отношению количества чисел, попавших

в заданные границы, к объёму выборки

( \

N

V

I 1

P = 1 = \ Хн ^ Х- ^ Хк /

N

(1.1)

1.3. Замечания.

Постановка задачи предполагает проверку попадания результатов каждого наблюдения в заданные границы при помощи шаблона. В противном случае гарантийные границы должны учитывать допустимую ошибку (точность) измерений (или сравнение наблюдённых значений с допустимыми осуществляется с учётом возможной при данном способе измерений случайной ошибки) [2].

1.4. Ниже приведены примеры использования в стандартах концепции определения вероятности попадания результатов измерения в заданные границы.

1.4.1. Пример 1. Американский стандарт ASTM A496-95a [3] нормирует рифление арматурной проволоки: «не менее 3,5 и не более 5,5 деформаций (выступов или вмятин) на дюйм длины в каждом продольном ряду рифления». В том же стандарте [3] нормируется «предел прочности >585 МПа». Заданием допустимого процентного содержания каждого элемента нормируется химсостав сталей во многих стандартах [4, 5]. При этом конкретный метод контроля (а, значит, и допустимая ошибка измерения) в этих стандартах обычно не указывается. Обычно в стандартах оговаривается число образцов для испытаний, а иногда - и число обмеров каждого образца. Зачастую стандарты требуют, чтобы все измеренные величины попали в свои гарантийные границы (т. е. отсутствие браковочных признаков нормируется при P = 1).

1.4.2. Пример 2. Некоторые стандарты [6] отсутствием браковочных признаков считают Pj = 1 при N1 числе измерений и (если P1 < 1) P0 < P2<1 при N2 > N1 числе измерений (P0 -нормативная минимально допустимая вероятность, при которой еще нельзя предъявлять браковочные признаки к испытанному изделию). Например, международный стандарт ISO 10544 [5], нормируя испытания партии арматурной проволоки, при которых сопротивление разрыву должно быть не менее заданной величины, считает отсутствием браковочных признаков P=1 при N1 =15 опытных образцов, а, если в первых 15-и опытах измеряемая величина выйдет за гарантийные пределы, то количество опытных образцов увеличивают до N2 =60 и при N2 опытов браковочные признаки отсутствуют, если P2 > 29/30. Надо думать, что гармонизированные с этим стандартом строительные нормы за счет коэффициента запаса допускают отсутствие в арматуре двух прутков из каждых 60-и.

1.4.3. Пример 3. В уже недействующем документе [7] нормировался интервал, в который должны попасть все (т.е. с вероятностью Р = 1) зарегистрированные в ходовых испытаниях коэффициенты динамики железнодорожного подвижного состава. При этом класс точности измерительной аппаратуры нормировался, а случайные ошибки в испытаниях считались невозможными. Принципиально это не противоречит здравому смыслу: руководитель испытаний несёт ответственность за все результаты. От руководителя испытаний можно потребовать, чтобы он гарантировал отсутствие ошибочного (случайного) выхода значений коэффициента динамики за границы интервала допустимых значений. Теоретически опыт, в котором был зарегистрирован выход значений коэффициента динамики за границы интервала, можно многократно повторить, добившись при этом повторения браковочного результата.

2. Выравнивание закона распределения (в том числе по недостаточно представительным выборкам)

2.1. Постановка задачи. Задана выборка N

N

случайных чисел ^х{. Требуется определить:

1=1

какое значение случайной величины хр соответствует заданной вероятности Р («вероятности безотказной работы»). Другими словами, требуется определить квантиль вероятности безотказной работы при бесконечном количестве наблюдений.

2.2. Решение задачи.

Предполагаем, что нам известен закон распределения случайной величины, выборкой значений которой мы располагаем. Выравниваем имеющееся у нас распределение случайной величины этим известным законом распределения [1, 8]. Для этого необходимо определить математическое ожидание т, дисперсию с2 и (иногда) некоторые константы выравнивающего закона. В формулу, описывающую выравнивающий закон распределения, подставляем необходимые характеристики (математическое ожидание, дисперсию, ...) выравнивающего закона. Из полученного выражения определяем выравнивающие дифференциальный /(х) и интегральный ^(х) законы распределения. В интегральном законе распределения определяем квантиль хр , соответствующий вероятности Р . Описанные выше процедуры соответст-

вуют следующей вычислительном схеме [8, 9].

1 М

х =— V ;

I =1

52 =■

1 Н _ 2 =-V ( - х)

I =1

1 Н _ 2

-V (х, - х) .

N -г '

I=1

(2.1)

Здесь х - среднее; 5 - смещённая, а 5 - несмещённая оценка среднего квадратичного.

Для выравнивающего нормального закона распределения справедливо [1, 8, 9]

х - к (N - ^ ^ < т < х + (N - 1)|1-а , (2.2)

где (N - 1)|1-а - квантиль к-распределения

Стьюдента с (N - 1) степенью свободы для двухсторонней доверительной вероятности (1 - а). Допускается определять пределы величины т из выражения [2, 8, 9]

_ II и _ II и

х -и т < х + \и\ , (2.3)

1 |1-а 1 |1-а л/Й

где и

- квантиль нормального распределе-

ния для двухсторонней доверительном вероятности (1 - а). Если исходная выборка является представительной выборкой из генеральной совокупности, распределённой по нормальному закону, справедливо [8, 9]

<с<-

>/х2-а (N -1) у1ХКN - 1)

(2.4)

где хО, (N -1) - квантиль %2 -распределения с ^ - 1) степенью свободы для односторонней доверительной вероятности а, при которой

х2( N -1) <х2 < х2-а (N -1).

Для любого выравнивающего закона распределения справедливо [8, 9]

р •

^(хр) = | /(х)ёх = Р

-да

(2.5)

2.3. Замечания.

В общем случае законность описанного выше выравнивания необходимо доказать (например, по критерию Колмогорова) [1, 8]. Для недостаточно представительной выборки («незавершённой серии испытаний») доказывать законность выравнивания необязательно [10].

Если обработчик может доказать, что его выборка состоит из случайных чисел, соответствующих более, чем одному, закону распределения (т.е. в исходной выборке присутствуют числа, соответствующие разным значениям аргументов неполностью наблюдаемой системы [11]), то из исходной выборки можно «выбросить» значения, не соответствующие выравнивающему закону распределения. Это допустимо, например, когда есть сомнения в правильности получения отдельных значений в выборке [1]. В общем случае не допустимо «выбрасывать» значения случайной величины, не соответствующие выравнивающему закону распределения.

Вместо выравнивающего закона иногда можно воспользоваться аппроксимирующим законом (например, нормальным или равномерным). Такая аппроксимация иногда допустима (например, «в запас»), если полученный в результате квантиль хр не смягчает эксплуатационные требования к испытуемому объекту.

Если есть уверенность, что исходная выборка представляет собой представительную выборку из генеральной совокупности, распределённой по нормальному закону, допустимо определять искомый квантиль хтах « хР из выражения [9]

хтах х = г (N - 2) Р

(2.6)

где г(N - 2)Р - квантиль г-распределения [9] с ^ - 2) степенями свободы, соответствующий вероятности Р.

2.4. Иногда производственная задача заканчивается определением величины хР (хтах). При обработке результатов испытаний по описанной выше методике браковочным признаком испытанного изделия может быть (например) условие хР > х0, где х0 - заданная в соответствующем стандарте константа.

Существуют ещё две производственные задачи, решаемые при помощи описанной выше вычислительной схемы.

2.4.1. Сертификация производства (т.е. контроль стабильности значений т и с). Фактически необходимо контролировать попадание т и с в области своих гарантийных значений (с учётом точности измерений). Однако, вместо этого (или вместо контроля значений с) допускается контролировать отсутствие значений х,, не соответствующих нормальному закону распределения с фиксированными тис (см. часть 6 документа [12]).

2

5

5

2.4.2. Определение пределов неопределённости измерений. Предельные значения случайной, нормально распределённой ошибки _ . ■ ■ с

измерений ±и

1-а

л/Й'

согласно международ-

ному стандарту [2], определяются в соответствии с выражением (2.3) для доверительной вероятности (1 - а) = 0,95 фактически при с = стах , определённом по формуле (2.4).

Ниже приведены примеры оправданного и неоправданного использования описанной выше методики при решении производственных задач.

2.5. Пример 1. Оправданное выравнивание экспериментального распределения нормальным законом распределения.

Добраться от СШ № 106 до ПТУ № 54 в Днепропетровске можно различным городским транспортом, обязательно с пересадками и участками пути, которые необходимо пройти пешком. Необходимо определить, с каким запасом времени необходимо ежедневно, в одно и то же время выходить из школы, чтобы не опоздать в ПТУ.

Ниже представлена выборка длительностей «путешествия» от школы до ПТУ в течение 29 дней: 1 час 25 мин, 1 час 17 мин, 1 час 23 мин, 1 час 28 мин, 1 час 15 мин, 1 час 22 мин, 1 час 20 мин, 1 час 35 мин, 1 час 11 мин, 1 час 22 мин, 1 час 17 мин, 1 час 15 мин, 1 час 24 мин, 1 час 13 мин, 1 час 25 мин, 1 час 10 мин, 1 час 23 мин, 1 час 25 мин, 1 час 20 мин, 1 час 20 мин, 1 час 20 мин, 1 час 15 мин, 1 час 23 мин, 1 час 10 мин, 1 час 19 мин, 1 час 26 мин, 1 час 15 мин, 1 час 21 мин, 1 час 27 мин.

Допустим, что опоздать на работу можно не чаще 1-го раза в 2 месяца. Т.е.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 - Р «-1-= 0,022222... Что следует из сле-

22 + 23

дующих соображений. В течение месяца должно быть 8... 10 выходных (за 4 недели и 2...3 дня), если в этом месяце не было праздников. Будем считать, что выходных - 8. Это самый худший случай, т.к. больше всего дней нельзя опаздывать. Очевидно, если в месяце 30 дней, то рабочих дней 30 - 8 = 22, если в месяце 31 день, то рабочих дней 31 - 8 = 23.

Поскольку в интегральном распределении, построенном на основании экспериментальной N

выборки, ^ Гэкс (х7) = 1, а в нормальном рас-

7 =1

пределении ^ Г(х) < 1, для тех значений ар-

х <да

гументов, при которых Г(х) ^ 1, экспериментальное распределение можно аппроксимировать нормальным законом, считая экспериментальную выборку незаконченной серией испытаний [9].

2.5.1. Согласно изложенной выше схеме ((2.1), (2.2), (2.4)) х = 1 час 20,207 мин; 5 = 5,720 мин; ^ = 5,821 мин (в промежуточных вычислениях будем удерживать три знака после запятой). Примем вероятность ошибиться при определении т и с равной а = 0,01. Тогда к(N - 1)|1-а = (28)|1-001 = 2,763. Очевидно:

(N -1)|

= 2,763 •5821 = 2,987 мин; 1-а л/й л/29

1 час 17,220 мин < т < 1 час 23,194 мин. (2.7) Для односторонней вероятности а = 0,01 при N = 29 определим квантили х2-а (N -1) =

= х2-0,01(28) = 48,278 и Ха (Й -1) = х2,01(28) = = 13,565. Очевидно:

5,720 •Тад 5,720 • ^ , <с< ' ^ .

^48,278 л/13,565

Или, что то же:

4,433 < с< 8,363 мин. (2.8)

2.5.2. Интересно отметить, что в данной конкретной задаче примерно такие же, как в (2.7), пределы неопределённости математического ожидания получаются согласно выражению (2.3):

и •ста^ = 2,326 • —-363 = 3,612 мин;

I 11-а

729

1 час 16,595 мин < т < 1 час 23,819 мин.

Здесь стах = 8,363 мин соответствует выражению (2.8), согласно которому стт <с<стах, а | и |1-а = 2,326 - квантиль нормального распределения для двухсторонней доверительной вероятности (1 - 0,01) при а = 0,01. 2.5.3. Согласно (2.5), вместо

хр

Г(хр) = | /(х)ск = 1 - 0,0222 = 0,9778

-да

по таблице [9] для Ф(и) =0,4778 определим и = 2,845, а затем найдём наибольшее значение

хр

-U-с =

max

= 1час 23,194мин+2,845-8,363мин « 1час 47мин

xmax = mm + U - с„

1час 43мин.

и наименьшее значение x

p

хшш = тШп - и •СТшах =

= 1час 17,220мин - 2,845^8,363мин « 53мин.

2.5.4. Отметим, что, поскольку нас интересует только наибольшее значение хр, достаточно было определить квантиль односторонней [1, 8] вероятности распределения Стьюдента

t(N - 1>1-а = |t(N - 1)|1-2„ = \t(28)|ь Тогда

0,02

=2,467.

5 821

m < mm = 1час 20,207мин+ 2,467 - — мин = m V29

= 1час 20,207мин + 2,667мин =

= 1час 22,874мин, (2.9)

а наибольшее значение xp

Xmax = mm + U - C max =

= 1час 22,874мин + 2,845-8,363мин « « 1час 47мин.

2.5.5. Вычисленное согласно выражению (2.3) значение mm

m < mm = x + u

1-a

4N

8 363

= 1час 20,207мин + 2,053 мин =

ч/29

= 1час 20,207мин + 3,188мин = 1час 23,395мин,

как и результат (2.9), в данном примере, мало отличаются от полученного согласно выражению (2.2) результата (2.7). Здесь и1-а = | и |1-2а -квантиль нормального распределения для односторонней [8] доверительной вероятности

(1 - а).

2.5.6. Интересно показать, как зависит результат расчёта от вероятности ошибиться при определении т и с. Пусть а = 0,05. Тогда

t(N - 1)]-a = t(N - 1)|]_2a = t(28)L

0,10

= 1,701;

x2(N -1) = x2,05 (28) = 16,928;

m < mm= 1час 20,207мин + 1,839мин =

= 1час 22,046мин, (2.10)

с < 7,486мин, наибольшее значение x

2.5.7. Оценивая при а = 0,05 математическое ожидание согласно выражения (2.3), получим примерно такое же значение тш , как и в (2.10):

т < тш = х + и1-а • =

= 1час 20,207мин + 1,281 • 7,486 мин =

л/29

= 1час 20,207мин + 1,781мин = 1час 21,988мин.

Здесь и1-а = | и |1-2а = 1,281 - квантиль нормального распределения для односторонней доверительной вероятности (1 - 0,05) при а = 0,05.

2.5.8. Для нормального закона распределения при Р = 0,9778 и N = 29 запас времени, необходимый, чтобы добраться от школы до ПТУ, можно определить в соответствии с выражением (2.6): г (27)0,9778 = 2,97 и Хшах =

= 1час 20,207мин + 5,720-2,97мин « 1час 37мин.

Интересно, что этот результат заметно отличается от полученного из отношений (2.2),

(2.4), (2.5). Возможно, выравнивание исходного распределения нормальным законом недостаточно обосновано.

2.5.9. Резюмируя результаты, полученные в п.2.5.1 и п.2.5.2, в п.2.5.4 и п.2.5.5, а также в п.2.5.6 и п.2.5.7, можно сказать, что в данной конкретной задаче доверительные интервалы математического ожидания, полученные по формулам (2.1), (2.2) и по формулам (2.1), (2.4), (2.3), оказались достаточно близкими. Также близкими оказались доверительные интервалы математического ожидания, полученные для односторонней и двусторонней вероятности распределения Стьюдента (п.2.5.3 и п.2.5.4). Достаточно близкими оказались доверительные интервалы математического ожидания, полученные для вероятности ошибки а = 0,01 (п.2.5.3) и а = 0,05 (2.5.6). Значение хшах , полученное по формуле (2.6) в п.2.5.8, в данной задаче заметно отличается от значения хшах, полученного по формуле (2.5) в п.2.5.3. Поскольку значение хшах , полученное по формуле

(2.5), по отношению к значению хшах , полученному по формуле (2.6), оказалось «в запас», целесообразно именно его считать решением данной задачи.

2.6. Пример 2. Неудачное использование выравнивания экспериментального распределения нормальным законом распределения.

Российский стандарт СТ ССФЖТ ЦТ 15-98 [13] предписывает измерять коэффициент динамики локомотива следующим образом. Для конкретного диапазона скоростей, в каждой реализации длительностью не менее 10 с в криволинейном участке пути определяется максимальное замеренное значение коэффициента динамики (согласно стандарту [13], криволинейный участок начинается ещё в прямой, захватывает всю круговую или 8-образную кривую, обе переходные кривые и заканчивается на прямой). Согласно стр. 21 стандарта [13], статистическое значение коэффициента динамики Кд в ансамбле из N реализаций определяется по наибольшим значениям в реализациях формулой Кд тах = Кд + 2с (что в общем не

противоречит выражению (2.6)). Здесь Кд -

среднее в ансамбле значение Кд, ас - несмещённая оценка среднего квадратического отклонения в ансамбле. Согласно стандарту [13], полученное значение Кдтах сравнивается со

своим критериальным значением [Кд]. Если Кдтах > [Кд], локомотив бракуется.

При испытаниях пассажирского электровоза

в режиме тяги на скоростях 100___115 км/ч в

реализациях, зарегистрированных на криволинейных участках пути, были зафиксированы следующие максимальные по абсолютной величине значения коэффициента вертикальной динамики первой ступени подвешивания: 0,188; 0,259; 0,239; 0,254; 0,314; 0,270; 0,295; 0,205; 0,287; 0,189; 0,157; 0,091; 0,312; 0,152; 0,170; 0,093; 0,261; 0,082. Очевидно, что Кд = 0,2121, с = 0,0762, К^ = 0,3645.

Т.к. согласно стандарту [13] для пассажирского локомотива [Кд] = 0,35, испытанный электровоз надо браковать (поскольку Кдтах > 0,35).

Между тем, если из ансамбля реализаций исключить числа 0,091; 0,093; 0,082 (т.е. самые меньшие значения коэффициентов динамики среди всех кривых), электровоз требованиям стандарта [13] начинает удовлетворять, поскольку Кд = 0,2368, с = 0,0559 и Кд,тах =

= 0,3486 < 0,35. Интересно, что электровоз находится в эксплуатации уже много лет, т.к. в свое время в соответствие требованиям «старой» нормативной документации забракован не был. И в эксплуатации этот электровоз себя зарекомендовал хорошо.

Возможно, в данном случае аппроксимация экспериментального распределения нормаль-

ным законом распределения недостаточно обоснована.

3. Статистика экспертных оценок

3.1. Постановка задачи. Задана выборка N случайных чисел (оценок исследуемого объекта

N

или события) ^ х1. Допускается, что какое-то

1 =1

количество этих оценок необъективно. Требуется определить объективную оценку хр в

предположении, что эта оценка соответствует заданной вероятности Р.

3.2. Замечание.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Существуют 2 варианта обработки исходной информации.

3.2.1. Отбросить те оценки, которые могут быть необъективными (предвзятыми).

3.2.2. Оставить те оценки, которые можно считать объективными (непредвзятыми).

Перечисленные варианты имеют принципиальное различие. При втором варианте обработки может оказаться, что вообще ничего не отброшено.

Отметим, что при обоих вариантах обработки отброшенная информация может быть связана с каким-то достаточно редким (но требующим учёта) событием и не обязательно связана с необъективностью оценок.

3.3. Решение задачи.

Рассортируем все оценки по возрастанию.

3.3.1. При первом варианте обработки отбросим п = ^(N-(1-^)) оценок. Если необъективность односторонняя, то отбрасываются только п наибольших или только п наименьших оценок. Если необъективность двусторонняя, то отбрасываются п./2 = т1;(^(1-Р)/2) наибольших и п/ наименьших оценок (соответственно принимается п = 2п/). Здесь подразумевается, что т1;(а) - целая часть, ближайшая к числу а. Теперь объективная средняя оценка определяется по формуле

1

х = -

N - п

N - п 1=1

(3.1)

а объективная наименьшая и объективная наибольшая - это соответственно первая и последняя оценки среди оставшихся N - п) оценок.

3.3.2. При втором варианте обработки для монотонно возрастающего ряда

I 1

i:{X <Я,} У

max (i)

Xi <Я,

N

M

V q, e[ min (xi), max (xi)] строим распре-

j=1 1<i < N 1<i < N

деление

N ' ^

V

M i=1

V F(Я; ) = Pj = — j=1

(при этом можно M

V F(q, + 0) = F(q,+1), а можно считать, что

j=1 M

V F (q, + 0) = F (Я;)).

j=1

При односторонней вероятности Р наибольшим с вероятностью Р будет

(3.3)

N

считать,

(3.2)

что

x.

max,P = min (q j )

Pj >P

и, соответственно, наименьшим с вероятностью Р будет

Xmin,P = maX (q; ).

P, <1-P

(3.4)

При двусторонней вероятности Р наибольшим и наименьшим с вероятностью Р будут, соответственно

max,P

min

( я, ) =

min

p, >1-(1-P)/2 p>1/2+P/2

(Я,), (3.5)

Xmin, P = maX y?j

P, <(1-P)/2

(q,) = max (q,). (3.6)

p} <1/2 - P /2

Ниже приведены примеры (удачные и неудачные) применения концепции статистики экспертных оценок при решении различных (в основном, производственных) задач.

3.4. Пример 1. Отбрасывание необъективных данных (правильнее: отбрасывание того количества данных, которое может быть необъективным).

До появления электрофиксаторов [14] соревнования по фехтованию судили 7 судей. Бой у мужчин продолжался до 5-и уколов. Каждый судья фиксировал количество уколов (ударов), нанесенных противниками. После каждого укола при подсчёте отбрасывали самую высокую и самую низкую оценку преимущества одного фехтовальщика над другим, а по средней из оставшихся оценок определяли победителя.

3.5. Пример 2.

При обработке результатов ходовых испытаний железнодорожного подвижного состава согласно документам [15,16] для конкретного диапазона скоростей, в прямых участках пути (а также в кривых и при прохождении стрелок) коэффициенты динамики экипажа определяются с вероятностью 0,999. Очевидно, достаточно редкие события, при которых коэффициенты динамики выходили за пределы допустимых значений, в эту статистику не попадут. По-видимому, такой подход целесообразен для приёмочных испытаний, когда принципиально решается вопрос с оплатой выполненной изготовителем работы (при испытаниях могли возникнуть ситуации, не предусмотренные в техническом задании, утверждённом изготовителем и согласованном с покупателем). Однако вероятностный подход неприемлем для выработки эксплуатационных ограничений, связанных с безопасностью эксплуатации. Авторы статьи располагают информацией, когда в процессе ходовых испытаний на новых колесах один раз за 5000 км на пути отличного содержания при движении с разрешённой скоростью на стыках компенсационной вставки между двумя однонаправленными кривыми в связи с особенностями своей подвески испытуемый локомотив вышел за габарит по низу из-за возбудившихся колебаний галопирования. Очевидно, что на изношенных колесах при эксплуатации локомотива без модернизаций такая ситуация (весьма редкая, но, как выяснилось, вполне возможная) может привести к крушению.

3.6. Пример 3. Неоправданное отбрасывание редко появляющихся (но регулярно повторяющихся) данных.

С вероятностью Р = 0,95 измеряется выходное напряжение генератора прямоугольных импульсов. Длительность импульса А( « 0,1 с. Амплитуда импульса и« 20 В. Повторяемость импульсов (время от переднего фронта одного импульса до переднего фронта следующего импульса) АТ « 1 мин = 60 с. Очевидно, вероятность замерить амплитудное значение напряжения р = А/ / АТ » 0,0017 < (1 - Р) = 0,05. Таким образом, наибольшее с вероятностью 0,95 значение напряжения х0 95 « 0 В совершенно не соответствует амплитуде прямоугольных импульсов.

3.7. Пример 4. Неоправданное отбрасывание наибольших замеренных значений, не приведшее к значительным ошибкам.

Процесс, описываемый функциональной зависимостью х^) = 8т(2п), при 0 < t < 1 имеет интегральный закон распределения

^(х) =1 + агс5'п(х) . Определим |х|0 90 стати-2 п

стически наибольшее значение |х| для двусторонней доверительной вероятности Р=0,90.

Очевидно, статистически наибольшее положительное значение аргумента 0 < х0,95 = |х|0,90 определится зависимостью

1 а1тат( х0,95)

2 п

((х(1),р ) = Р) А (^ (х(2),р ) = Р) Л

• = 0,95 .

= зш(0,45п)« 0,988.

Поскольку

Л( х(

(1),Р < х(2),Р

(4.1)

Откуда

тах(| х |) = тах(8т(2пф = 1, относительная t

ошибка неоправданного отбрасывания наибольших замеренных значений при определении максимальных значений аргумента закона

1 - 0,988 Д распределения в =-1-= 0,012. Другими

словами, хотя концептуально нельзя считать допустимым отбрасывание амплитудных (неслучайных) значений синусоиды, статистически наибольшие с вероятностью Р = 0,95 значения х0 95 «0,988 незначительно (всего на

1,2 %) меньше амплитудных.

4. Сравнение статистических величин

4.1. Постановка задачи. Задана первая вы-

N1

борка из N1 случайных чисел V х(1)1 и вторая

1=1

N2

выборка из N2 случайных чисел V . Зада-

1=1

на вероятность Р. Необходимо определить, можно ли на уровне вероятности Р считать одну случайную величину большей, чем вторая.

4.2. Замечания.

Пусть х) - интегральный закон распределения (выравнивающий) первой случайной величины, а х) - интегральный закон распределения (выравнивающий) второй случайной величины. Вторую случайную величину на уровне вероятности Р можно считать большей, чем первую, в двух случаях.

4.2.1. Когда интегральное распределение первой случайной величины достигает вероятности Р при меньшем значении аргумента, чем аргумент, при котором интегральное распределение второй случайной величины достигает вероятности Р [10]:

4.2.2. Когда интегральное распределение первой случайной величины достигает вероятности Р при каком-то значении аргумента, то при этом значении аргумента интегральное распределение второй случайной величины вероятности Р ещё не достигает [17]:

((х0),р) = Р) л (*2(х0),р) < Р)). (4.2)

Теоретически вероятность Р может быть любой, если Р е (0; 1]. Однако, как показано в главе 3 данной статьи, при неоправданно низкой вероятности Р на сформированный по результатам обработки вывод может не повлиять достаточно редкая (но требующая учёта) информация.

4.3. Решение задачи.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как и в п.3.3.2 данной статьи, рассортируем обе выборки по возрастанию, построим инте-

2

гральные распределения V ^экс 7 (х) обеих

7=1

случайных величин и согласно (3.3), (3.4) найдём значения аргументов, при которых построенные интегральные распределения пересекают

линию ^0(х) = Р: Х1 = х(1),тах,Р и Х2 = х(2),тах,Р .

4.3.1. Методика сравнения статистических величин согласно выражения (4.1).

Как и в п.2.2 данной статьи для выборки с номером 7 (для 7-й случайной величины), найдём х- среднее; я - смещённую и - несмещённую оценки среднего квадратичного:

N.

^ 1 7

V х =± I

7=1

N

\} ),1

7 1=1

2 N]

V *) = 7),1 - ^ )2

7=1 1=1

N.

V = ^ 1(Х(7),1 - х- ) (4.3)

7=1 7 1=1

Дальнейшее справедливо только в том случае, если выравнивающий (аппроксимирующий) закон распределения можно считать нормальным в области х > Х1.

Определим [8, 9]

х

с, =

1 VXOCN7!)' Vxi2-a(N-1)

(4.4)

VAm. = t(Nj - 1)i-j=1

Sj

(4.5)

где Ха (Ц, -1) и Х1-а (N -!) - квантили

Х2 -распределения с (Ц- - 1) степенью свободы для односторонних доверительных вероятностей а и (1 - а), а ((Ц- - 1)1-а - квантиль

¿-распределения Стьюдента с (Ц- - 1) степенью свободы для односторонней доверительной вероятности (1 - а).

В выражениях (4.4), (4.5) а - односторонняя вероятность того, что определяемые в форму-2

лах С) и ^ Ат- будут ещё больше, а с2 - ещё

-=1

меньше.

По таблице [9] для Ф(и) = Р - 0,5 определим и.

Решение задачи можно записать следующим выражением [10]:

[Х(!) < Х(2)]р ^

^ шах(Х1 + Ат1; Х1 + Ат1 + и • с1) <

< ш1и(Х2 - Ат2; Х2 - Ат2 + и • с2). (4.6)

В выражении (4.6) предполагается, что меньшее значение аргумента при обработке могло быть определено с недостатком, а большее значение аргумента - с избытком.

4.3.2. Методика сравнения статистических величин согласно выражения (4.2).

Определим вероятности, соответствующие аргументам Х1 и Х2:

^да, ^(х,), ^да и

^экс 2 (х2). Здесь предполагается, что Р - ^эксД (X1) > ^экс,2 (X1) и желательно, чтобы

Р - ^эКС,2(X2) - ^эКсД(X2).

Очевидно, что вероятности ^экс 1 (X1),

^экс,1(X2), ^экс,2(X1) и ^экс,2(X2) определены с

ошибкой, имеющей нормальный закон распределения. В таком случае, если вероятность р считать математическим ожиданием случайной величины, то среднее квадратическое этой слу-

чайной величины определится выражением

s2 = p - p2, а max (s) = 0,5. Теперь, в соот-

0< p<1

ветствии с [8],

[Х(1) < Х(2) ]р ^ ^ ^зкс,1(X1) - F)KC,2 (X1) >

(4.7)

s 2 — t1 а (N1 -N 1 -1)- s 2 t1 а(N2 -1) N2 1_aV 2

2 2

s1 s2

i N1 N2

где а - вероятность ошибочно посчитать равными неравные на уровне вероятности Р слу-

2

чайные величины х^ и Х(2), ^ ¿1-а (Ц- -1) -

-=1

квантили ¿-распределения Стьюдента,

*12 = ^ксд(X1) - (^эКсД(X1))2,

= ^ТО - (^ад2. Выражение (4.7) «в запас» можно ужесточить [8]:

[Х(1) < Х(2) ]р

^зкс,1 (X1) - ^зкс,2(X1)

0,5

VN N2

■ > u

1-а •

Отметим, что для односторонней доверительной вероятности (1 - а) = 0,95 квантиль = 1,645, а для (1 - а) = 0,98 соответственно

1-а

1-а

= 2,054 [8].

Желательно проверить, чтобы при значении аргумента х = Х2 нельзя было сказать, что для выравнивающих законов распределения X2) < ^2(X2). Другими словами, желательно, чтобы при весьма маловероятном ^экс 2 (X2) > ^экс 1 (X2) выполнялось отношение

^экс.2 (X 2) - X 2) -

2 2

^ • t1 а (N -1)+^ • t1 а (n2 -1)

N 1 N 1-а 2

2 2

s1 +

1 N1 N2

(4.8)

или хотя бы

и

>

< и

11

0,5 — + — V N N2

В выражении (4.8)

^ = ^ксд( X 2) - (^эКсЛ( X2 ))2 ,

= ^эКс,2( X 2) - (^эКс,2( X 2 ))2 .

Необходимо отметить, что методические указания [17] и Д. Химмельблау [18] предлагают вместо выражений (4.7), (4.8) пользоваться другими отношениями, не очень удобными для выборок объёмом 20 и больше чисел.

4.4. Пример. Ниже продемонстрированы обе методики сравнения случайных величин [10, 19].

В п.2.5 данной статьи описан один из способов добраться от СШ № 106 до ПТУ № 54 в Днепропетровске. Существует ещё и второй способ. Тоже различным городским транспортом, тоже с обязательными пересадками и участками пути, которые необходимо пройти пешком. Причём, описываемые маршруты нигде не пересекаются.

Ниже представлена выборка длительностей «путешествия» вторым маршрутом от школы до ПТУ в течение 36 дней: 1 час 5 мин, 1 час 44 мин, 1 час 21 мин, 1 час 25 мин, 1 час 15 мин, 1 час 7 мин, 1 час 23 мин, 1 час 8 мин, 1 час 35 мин, 1 час 24 мин, 1 час 12 мин, 1 час 41 мин, 1 час 23 мин, 1 час 18 мин, 1 час 32 мин, 1 час 45 мин, 1 час 25 мин, 1 час 23 мин, 1 час 21 мин, 1 час 16 мин, 1 час 30 мин, 1 час 28 мин, 1 час 40 мин, 1 час 28 мин, 1 час 20 мин, 1 час 35 мин, 1 час 33 мин, 1 час 15 мин, 1 час 16 мин., 1 час 30 мин, 1 час 17 мин, 1 час 8 мин, 1 час 15 мин, 1 час 12 мин, 1 час 12 мин, 1 час 48 мин.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Необходимо определить, каким маршрутом можно гарантировано быстрее добраться из школы до ПТУ.

4.4.1. Сравнение статистических величин согласно выражения (4.1).

Как и в п.2.5 данной статьи Р = 0,9778, и = 2,845. Пусть а = 0,05 - односторонняя вероятность ошибиться (в большую сторону для Дт1, Дт2, с1 и в меньшую сторону для а2).

Очевидно (см. п.2.5 настоящей статьи): N1 = 29, Х1 = 1час 35мин, х1 = 1час 20,207мин, = 5,720мин, 51 = 5,821мин, Дт1 = 1,839мин, с1 = 7,486мин, X1 + Дт1 = 1час 36,839мин, х + Дт1 + и • с1 = 1час 43,344мин,

тах(X1 + Дт1; х1 + Дт1 + и • а1) =

= 1час 43,344мин. Для второй выборки несложно определить: N = 36, Х2 = 1час 48мин, х2 = 1час 23,611мин, 52 = 11,226мин, 52 = 11,385мин, Дт2 = 3,207мин, с2 = 9,525мин, X2 -Дт2 =

х2 - Дт2 + и • с2

= 1час 44,793мин, = 1час 47,503мин,

min(X2 - Дт2; х2 - Дт2 + и • ст2) = = 1час 44,793мин. Поскольку 1час 43,344мин < 1час 44,793мин, т.е.

max(X1 + Дт1; х1 + Дт1 + и • а1) <

< тт(X2 - Дт2; х2 - Дт2 + и • с2),

значит, [Х(1) < Х(2) ]р . Другими словами, согласно выражения (4.1) с вероятностью 1 - а = 0,95 можно сказать, что для того, чтобы с вероятностью Р = 0,9778 не опоздать из школы в ПТУ, запас времени при «путешествии» вторым маршрутом должен быть больше.

4.4.2. Сравнение статистических величин согласно выражения (4.2).

Очевидно, что N = 29, Х1 = 1час 35мин, ^(Х) = 1, N2 = 36, Х2 = 1час 48мин, ^(х) = 32/36 = 0,8889. Определим

52 = Р^,) -(^Щ)2^ и

= ^эКс2 (X 2) - ((X2 ))2 =8/81. По таблицам

[9] для *1-а (N1 - 1)

а

= 0,05

^0 95 (28)

определим 1,701,

?1-а(N2 -1) = ^0,95 (35) = 1,690. Согласно (4.7), необходимо определить:

5 2

рэ^т-^э^^) = 0,1111, = 0, 2 8

N

32 _

N2

81 36

N1

= 0,00274,

^ • ^ (N1 - 1) + # • ^1-а (N2 - 1) =

1-а V Т1 V 1 д.- Ч-а V т2 1 ™ 2

= 0 + 0,00274-1,690 = 0,00463,

V

2 2 5, 5.

+ -^=70 + 0,00274=0,0523,

N1 N2

^ • ч а (N1 -1) + ^ • Г1 а N -1) N 1 N

2 2

+-52-

1 N1 N2

0,00463

= 0,0885.

0,0523

Т.к. 0,1111 > 0,0885, очевидно, что [х(1) < х(2)]р . Таким образом, согласно выражения (4.2) с вероятностью 1 - а = 0,95 можно сказать, что для того, чтобы с вероятностью Р=0,9778 не опоздать из школы в ПТУ, запас времени при «путешествии» вторым маршрутом должен быть больше.

Поскольку F1(X2) = F2(X2) = 1, делать проверку согласно формуле (4.8) не нужно.

Выводы

1. В связи с существованием большого количества различных методик статистической обработки результатов испытаний, если в стандарте предусмотрен статистический подход к обработке результатов испытаний, желательно в этом же стандарте подробно описать методику статистической обработки данных, используемую в данном стандарте.

2. Поскольку в испытаниях могут возникнуть ситуации, не проработанные во время составления стандарта, для облегчения принятия решений руководителем испытаний в стандарте желательно описывать принятую концепцию статистической обработки результатов испытаний.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. ГОСТ 8.207-76. Прямые измерения с многократными наблюдениями. Методы обработки результатов наблюдений. Основные положения [Текст].

2. ДСТУ ГОСТ ИСО 5725:2005. Точшсть (правь льнють i прецизшнють) методiв та результапв вимiрювання (ГОСТ ИСО 5725-2003. Точность (правильность и прецизионность) методов и результатов измерений) [Текст].

3. ASTM A496-95a. Standard Specification for Steel Wire, Deformed, for Concrete Reinforcement [Текст].

4. О реализации требований ISO 10544 и некоторых национальных стандартов к тестированию арматурной проволоки на свариваемость [Текст] / В. И. Большаков и др. // Металл и литьё Украины. - 2000. - № 3-4. -C. 34-37.

5. ISO 10544:1992(E). Cold-reduced steel wire for the reinforcement of concrete and the manufacture of welden fabric [Текст].

6. О реализации требований ISO 10544 и некоторых национальных стандартов к тестированию механических свойств арматурной проволоки [Текст] / В. И. Большаков и др. //

Металознавство та теpмiчна обробка металiв. -2000. - № 3 (10). - C. 38-45.

7. Типовая методика испытаний подвижного состава по воздействию на путь после изготовления или перед вводом в эксплуатацию [Текст]. -М.: ВНИИЖТ МПС (ИЦЖТ), 1990. - 20 с.

8. Пустыльник, Е. И. Статистические методы анализа и обработки наблюдений [Текст] / Е. И. Пустыльник. - М.: Наука, 1968. - 288 с.

9. Корн, Г. Справочник по математике для научных работников и инженеров [Текст] / Г. Корн, Т. Корн. - М.: Наука, 1968. - 720 с.

10. Большаков, В. И. Сравнительная статистическая обработка экспериментального материала по недостаточно представительным выборкам [Текст] / В. И. Большаков, H. Я. Гаркави, И. В. Добров // Методы менеджмента качества. Надёжность и контроль качества. - 1999. -№ 7. - C. 41-44.

11. Идентификация тенденций динамических процессов методом сортировок и визуализации экспериментальных данных [Текст] / Н. Я. Гарка-ви и др. // Системные технологии. Региональный межвузовский сборник научных работ. -Вып. 1 (42). - Д., 2006. - C. 131-140.

12. DIN 488. DEUTSCHE NORM. Betonstahl. (09.1984-06.1986) [Текст].

13. СТ ССФЖТ ЦТ 15-98. Стандарт системы сертификации на федеральном железнодорожном транспорте. Тяговый подвижной состав. Типовая методика динамико-прочностных испытаний локомотивов [Текст]. - М.: МПС России. -Введ. в действие 15.02.99 г. указанием МПС России № Г-165у. - 26 с.

14. МСЭ [Текст].

15. Статистическая обработка результатов ходовых испытаний рельсового транспорта [Текст] / Е. П. Блохин и др. // Сб. науч. тр. Нац. горного ун-та. - № 15, т. 2. - Д., 2002. - C. 166-175.

16. РД 24.050.37-95. Вагоны грузовые и пассажирские. Методы испытаний на прочность и ходовые качества [Текст].

17. РД 50-398-83. Методические указания. Расчёты и испытания на прочность в машиностроении. Методы механических испытаний. Планирование механических испытаний и статистическая обработка результатов [Текст].

18. Химмельблау, Д. Анализ процессов статистическими методами [Текст] / Д. Химмельблау. -М.: Мир, 1973. - 959 с.

19. О сравнении двух статистических величин [Текст] / В. И. Большаков и др. // Системш технологи. - 1999. - № 6. - C. 8-12.

Поступила в редколлегию 24.09.2008.

i Надоели баннеры? Вы всегда можете отключить рекламу.