Ъъ&мшь Qfr/IQHQj
Уфа : УГАТУ, 2011_^_Sri_Т. 15, № 2 (42). С. 22-28
УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
УДК 62-19:519.2
В. Е. Гвоздев, Г. И. Таназлы, А. Ю. Хасанов, М. А. Абдрафиков
АНАЛИЗ НАДЕЖНОСТИ ТЕХНИЧЕСКИХ СИСТЕМ НА ОСНОВЕ МАТЕМАТИКО-СТАТИСТИЧЕСКОГО МОДЕЛИРОВАНИЯ
Статья посвящена вопросам математико-статистического моделирования в задачах управления надежностью. Основой моделирования в этих задачах является оценивание закона распределения случайных величин, в том числе - порядковых статистик, по выборочным данным. Особое внимание уделено исследованию влияния априорного знания о случайной величине на оценки статистических характеристик в зависимости от свойств выборки. Надежность; точность; устойчивость; малая выборка; порядковая статистика; закон распределения
Мате матико -статистиче ское моде лирование занимает центральное место среди методов математического обеспечения системы информационной поддержки управления надежностью технических изделий. Основное назначение этих методов - статистическое оценивание критериев и показателей надежности по экспериментальным данным.
Особое место математико-статистических моделей среди других математических моделей обусловлено сложностью исследования процессов, протекающих в технических изделиях, недостаточной изученностью механизмов изменения их состояния.
1. ЗАДАЧИ, СВЯЗАННЫЕ С УПРАВЛЕНИЕМ НАДЕЖНОСТЬЮ
Основу математико-статистического моделирования в задачах управления надежностью составляет оценка закона распределения слу-
л
чайной величины р (х), определяемая по выборке {х} объема N. Особенностью задач надежности является то, что достаточно часто объем исходных данных не превышает нескольких десятков единиц. В известной литературе вопросам оценивания законов распределения случайных величин, в том числе по выборкам малого объема, уделено достаточно внимания. При этом в общем случае задача сводится к построению оператора А, преобразующего выборочные данные {х} в оценку закона распределе-л
ния р (х):
л
А: {х}® р(х). (1)
Контактная информация: 8-917-44-55-980 Приведенные результаты получены в рамках проведения исследований по гранту РФФИ 10-09-00359-а.
По поводу термина «малая выборка» отметим следующее. На наш взгляд, отнесение выборки к классу «малых» либо «больших» зависит от двух обстоятельств: во-первых, от требований к точности результата, во-вторых, от используемого способа обработки данных, то есть от того, насколько математический аппарат настроен на «выжимание» информации из выборочных данных.
Решение задачи (1) создает основу для решения «производных» задач, связанных с управлением надежностью. Примерами таких «производных» задач являются:
• Оценка сопротивляемости технических устройств.
Решение задачи сводится к реализации следующих преобразований:
А(1): {и}® р (и),
А(2): {х}® р (х),
лл
А : р (и), р (х) ® Р(х < и).
Здесь {и} - выборочные данные, характеризующие нагрузку; {х} - выборочные данные,
лл
характеризующие сопротивление; р (и), р (х) -законы распределения нагрузки и сопротивления соответственно; Р(х < и) - вероятность того, что сопротивляемость оказывается меньше нагрузки.
• Прогнозирование отказов технических изделий
Решение задачи сводится к реализации следующих преобразований
А(1): {и(0},{х(0} ® {*}, А(2): {*} ® Р(Г < Т).
Здесь {и(0}, {х(0} - временные ряды, характеризующие изменение нагрузки и сопротив-
*
ляемости во времени; Р(и < х, ^) - вероятность
*
того, что во временном сечении ^ нагрузка окажется меньше сопротивляемости.
• Пересчет характеристик надежности на разные условия испытаний
Решение задачи сводится к реализации следующих преобразований:
А(1) : |х(£1)} ® Р(х, £1)
|хЦ ® Р(х, е2), А2) : Ях,а), Р(л;г2) ® /2
здесь |х(£1)} - выборочные значения характеристик надежности, полученные в условиях е1;
|х(е2)} - выборочные значения характеристик надежности, полученные в условиях е2;
Р(х, в1), Р(х, е2) - законы распределения характеристик надежности, соответствующие разным условиям;
х£2 = ф(х(£1)) - правила пересчета данных, соответствующих условиям е1, в данные, соответствующие условиям е2.
• Оценка технологической зрелости процесса производства технических изделий
Основу решения этой задачи составляет следующее утверждение: технологическая зрелость характеризуется разбросом характеристик надежности технических изделий.
Известно, что существует функциональная взаимосвязь между такими показателями разброса, как среднеквадратическое отклонение и размах.
Выборочное значение размаха, особенно при малом числе исходных данных, определяется с низкой точностью. К тому же при определении размаха как расстояния между максимальным и минимальным элементами выборки, теряется информация, содержащаяся в остальных выборочных данных. В связи с этим для оценки размаха по выборке объема N целесообразно использовать следующую схему решения задачи:
л
г т л
: |х} ® FN (х)
л
л
А(2) : FN (х) ® FN (хтах), FN (хтп),
^^ ^ V N чхта^' ГN^
(3) л л
А : FN (Xmax), FN (хтт) ®
л л л
® М [хтах], М [хтт], dN ,
здесь FN (х) - оценка закона распределения случайной величины, получаемая по выборке
объема N
л л
FN (хтах), FN (хтт) - оцеИШ зак°н°в распределения минимального и максимального элементов выборки объема N
лл
М [хтах], М [хтт] - оценки математических ожиданий минимального и максимального элементов в выборке объема N
л
dN - оценка размаха по выборке объема N.
Перечисленные задачи не покрывают всего множества задач, основанных на статистическом моделировании надежности.
2. СТАТИСТИЧЕСКИЕ МОДЕЛИ
л
Статистическая модель FN (х), получаемая в результате решения задачи (1), ориентирована на получение «средней» оценки закона распределения случайной величины, так как в ее основе лежит использование всех выборочных данных. В то же время решение ряда задач основано на использовании законов распределения т-х порядковых статистик фдт(хт) в выборке объема N. Примером является описанная выше задача оценки технологической зрелости процесса производства технических изделий.
К настоящему времени в известной литературе по статистическому моделированию в теории надежности аспект, посвященный использованию аппарата порядковых статистик, не получил должного развития. Причиной этого, на наш взгляд, является то, что в основе построения дифференциальной функции распределения т-й порядковой статистики в выборке объема N лежит известное соотношение:
%(хт) = CN[F(x)]m-l[1-F(x)]л-mf(x) . (2)
Из него следует, что получить ф^хт) можно лишь зная Т(х). Как было отмечено ранее, пол
строение оценки FN (х) по выборке малого объема в случае, когда тип закона распределения априорно неизвестен, представляет достаточно непростую задачу. В случае, когда тип закона распределения F(x) априорно известен,
л
оценка закона распределения FN (х) сводится к задаче оптимального оценивания параметров по выборочным данным. В обоих случаях решению задачи (1) посвящено немалое количество работ.
Как видно из выражения (2), плотность распределения т-й порядковой статистики зависит
от закона распределения F(x) и объема выборки N. Однако, как будет показано далее, оценивал
ние закона распределения FN (х) и оценивание функции распределения т-й порядковой статистики Ф^хт) - две разные задачи со своими особенностями, причем первая из них является подзадачей при решении второй.
Поскольку на практике оценивание показателей надежности по экспериментальным данным в большинстве случаев осуществляется параметрическим методом (при известном типе закона распределения, например наработки на отказ), в рамках проводившихся исследований рассматривался случай, когда закон распределения случайной величины априорно известен. Целью исследования являлся анализ влияния априорного знания закона распределения случайной величины на точность и эффективность оценивания статистических характеристик в зависимости от свойств выборки. Под свойствами выборки понимается ее объем и точность регистрации выборочных данных.
3. АНАЛИЗ ТОЧНОСТИ И ЭФФЕКТИВНОСТИ ОЦЕНИВАНИЯ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ ПОРЯДКОВЫХ СТАТИСТИК В ЗАВИСИМОСТИ ОТ ОБЪЕМА И ТОЧНОСТИ РЕГИСТРАЦИИ ИСХОДНЫХ ДАННЫХ
Влияние объемов выборочных
данных на точность и эффективность оценивания статистических характеристик
Для исследования точности и эффективности оценок законов распределения порядковых статистик в зависимости от объема исходных данных выполнялся машинный эксперимент. Суть эксперимента состояла в генерации выборок объема Ж, оценивании по выборкам параметров распределения х) при априорно известном типе закона распределения F(x), оценивании интегральных функций крайних порядко-
А А
вых статистик Ф N (хтп) и Ф N (хтах), расчете показателей, характеризующих среднюю погрешность оценивания М\Вм] и среднеквадра-тическое отклонение погрешности оценивания Sko[DN].
В ходе исследования рассматривались различные типы распределений: экспоненциальный, Гаусса, Вейбулла и Гамма.
Обобщенная схема вычислительного эксперимента представлена на рис. 1.
Рис. 1. Обобщенная схема исследования влияния объема исходных данных на точность и эффективность оценивания законов распределения порядковых статистик
Для того чтобы как можно более полно охарактеризовать влияние объема и точности регистрации исходных данных на точность и устойчивость оценок законов распределения порядковых статистик, недостаточно знать значение величин DN в отдельности для каждого испытания. Только совокупность величин за несколько циклов испытаний действительно позволяет оценить это влияние. В соответствии с рекомендациями, приведенными в известных литературных источниках, число проведения эксперимента п принималось равным 50.
В качестве показателей точности оценивания статистических характеристик использовалась метрика доминирования: • точность оценивания
F(x): D(NД]
F (х) = тах
х >0
F (х) - Е (х)
точность оценивания Ф(хт^):
^мД )_ Ф( хтп) = тах
х>0
Ф(хтп) -Ф(хтт)
А
точность оценивания Ф(хтах):
£>ЬД)_ Ф( хтах) = тах
Ф(хтах) -Ф(хтах)
Обработка результатов эксперимента сводится к вычислению показателей точности, характеризуемой величиной математического ожидания совокупности значений
М Д ] =1 £ Д
Л 1=1
и устойчивости, характеризуемой величиной среднеквадратического отклонения совокупности значений:
БкаД ] = - £ (М [Д ]-ДЫ } .
V Л1=1
Оценки точности, получаемые в результате обработки случайных выборок, также являются случайными. В связи с этим, для сглаживания полученных результатов использовалась модель
А + ВЫ
вида г = е , где в качестве г выступает М[ДЫ]; ££о[ДЫ]. Параметры модели А и В определялись в соответствии с рекомендациями [8] методом наименьших квадратов. Для наглядно -сти зависимости представлялись в виде непрерывных кривых.
На рис. 2, 3 представлены результаты эксперимента для экспоненциального закона распределения при N = 5;100.
Практическое совпадение зависимостей точности и устойчивости оценивания законов распределения минимальной порядковой статистики и функции распределения от объема исходных данных объясняется следующим образом.
О 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 N Рис. 2. Точность оценивания р(Х), р(Хтах), р(Хтш) при экспоненциальном законе распределения
Рис.
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 N 3. Эффективность оценивания р(Х), р(Хтах), р(Хтш) при экспоненциальном законе распределения
Интегральная функция распределения для экспоненциального распределения определяется
выражением F(х) = 1 — в'1. Выразим для нее интегральную функцию распределения минимальной (первой) порядковой статистики:
ФЛ(XmIM%XXmUdx=Jж1(1—(1—в-ЧГ в^х=
Точность и эффективность оценивания F(x) и Ф^х^) зависит от точности и устойчивости оценивания параметра X по выборочным данным. Поэтому точность и устойчивость оценивания F(x) и ФДх^) по одним и тем же выборкам совпадают.
Точность и эффективность оценивания как функции распределения, так и крайних порядковых статистик улучшаются с увеличением объема выборок. Чем больше объем выборки, тем точнее можно оценить функцию распределения и крайние порядковые статистики.
В рамках проводившихся исследований было установлено, что для экспоненциального закона распределения точность оценивания максимальной порядковой статистики (средняя погрешность М^^]1™") ниже точности оценивания минимальной порядковой статистики (средняя погрешность М^]™11) в 2-4,7 раза
( М [ DN ]тах
Л
= 2 + 4,7
для закона распределе-
М [ DN ]
ния Вейбулла с параметром формы С = 2
М ^ ]тах
= 1,1 - 2 ; для закона распределения параметром формы С = 2 = 0,8 -1,9; для закона распределения параметром формы С = 3 = 0,7 -1,2; для закона распределения и М^^™1 практически совпа-
М [ DN Гп Гамма с
М р ]тах
М^ад™
Гамма с М ^ ]тах М ^ ]т1П Гаусса M[DN]rí дают.
Чем более ассиметричен вид закона распределения, тем ниже точность оценивания максимальной порядковой статистики относительно точности оценивания минимальной порядковой статистики. С увеличением симметричности закона распределения, разница между точностью оценивания максимальной порядковой статистики и точностью оценивания минимальной порядковой статистики уменьшается. Так, например, для экспоненциального закона распределения точность оценивания максимальной
порядковой статистики ниже точности оценивания минимальной порядковой статистики почти в 2-4,7 раза, а для закона распределения Гаусса они практически совпадают.
Влияние точности регистрации выборочных данных на точность оценивания статистических характеристик
Для исследования точности оценок законов распределения порядковых статистик в зависимости от точности регистрации исходных данных выполнялся машинный эксперимент, аналогичный вышеописанному (рис. 1). Все отличие заключалось в преобразовании выборочных данных, получаемых с датчиков случайных чисел и соответствующих заданному закону распределения F(x). В ходе эксперимента анализировалось влияние аддитивной помехи, то есть выборочные данные, получаемые с датчиков случайных чисел и соответствующие закону распределения F(x), преобразовались по следующему правилу:
хГ = х (I = 1Т),
где Ъ - случайная величина (помеха), соответствующая закону распределения Fп°м(Ъ). В ходе исследования в качестве Fп°м(Ъ) рассматривался закон распределения Гаусса.
Параметры закона распределения Fп°м(Ъ) подбирались таким образом, чтобы соблюдалось условие:
0х = а-0 х,
где о^ - среднеквадратическое отклонение помехи (математическое ожидание помехи принималось равным нулю);
ох - значение среднеквадратического отклонения, соответствующее F(x).
а - коэффициент, характеризующий соотношение масштабов помехи о^ и случайной величины ох. В ходе исследований а варьировалось в диапазоне а е [0;1].
В ходе эксперимента рассматривалось 5 значений коэффициента а, характеризующего соотношение масштабов помехи о^ и случайной величины ох: а = 0,00; 0,25; 0,50; 0,75; 1,00.. Объем выборки N менялся в диапазоне
N = 5100.
На рис. 4, 5, 6 представлены результаты эксперимента для экспоненциального закона распределения.
Рис. 4. Оценивание р(х) при экспоненциальном законе распределения и разных коэффициентах помехи а
Рис. 5. Оценивание р(хтах) при экспоненциальном законе распределения и разных коэффициентах помехи а
Рис. 6. Оценивание р(хт1П) при экспоненциальном законе распределения и разных коэффициентах помехи а
4. ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ
Полученные результаты позволяют заключить, что с увеличением значения коэффициента а, характеризующего соотношение масштабов помехи о^ и случайной величины ох, точность оценивания функции распределения р(х) перестает улучшаться с увеличением объема выборки, а при а = 1 вообще не зависит от объема выборки. Точность оценивания крайних порядковых статистик при а > 0,75 (для максимальной порядковой статистики ФЫ(хтах) - при а > 0,5) с увеличением объема выборки не только не улучшается, она ухудшается. Это объясняется тем, что при а > 0,75 выборка настолько «засорена» помехой, что увеличение объема выборки N только ухудшает точность оценивания - каждый новый элемент выборки содержит в себе больше помехи, чем полезной информации.
ВЫВОДЫ
При априорно известном законе распределения случайной величины точность оценивания его параметров с увеличением объема выборки повышается независимо от точности регистрации исходных данных. Однако при оценивании крайних порядковых статистик данное утверждение неверно. Точность оценивания крайних порядковых статистик с увеличением объема выборки повышается лишь до определенного уровня точности регистрации исходных данных. При точности регистрации исходных данных ниже данного уровня увеличение объема выборки приводит к снижению точности оценивания крайних порядковых статистик. Поэтому при отсутствии уверенности в достаточной точности регистрации исходных данных даже при априорном знании вида функции распределения случайной величины, целесообразно воспользоваться унифицированной моделью оценивания функции распределения [9].
СПИСОК ЛИТЕРАТУРЫ
1. Смирнов Н. В., Дунин-Барковский И. В.
Курс теории вероятности и математической статистики. М.: Наука, 1969. 512 с.
2. Гаскаров Д. В., Шаповалов В. И. Малая выборка. М.: Статистика, 1978. 248 с.
3. Дружинин Г. В. Надежность автоматизированных систем. М.: Энергия, 1977. 536 с.
4. Барлоу Р., Прошан Ф. Математическая теория надежности. М.: Советское радио, 1969. 488 с.
5. Гумбель Э. Статистика экстремальных значений. М.: Мир, 1965. 450 с.
6. Дэйвисон М. Многомерное шкалирование. Методы наглядного представления данных. М.: Финансы и статистика, 1987. 254 с.
7. Рябинин И. А. Основы теории и расчета надежности судовых электроэнергетических систем. Л.: Судостроение, 1971. 362 с.
8. Демиденко Е. З. Линейная и нелинейная регрессии. М.: Финансы и статистика, 1981. 320 с.
9. Статистическое исследование территориальных систем / М. Б. Гузаиров [и др.]. М.: Машиностроение, 2008. 187 с.
ОБ АВТОРАХ
Гвоздев Владимир Ефимович, зав. каф. автоматизации проектирования инф. систем. Дипл. инженер по электронике (УАИ). Д-р техн. наук по автоматизированным системам управлениям (УГАТУ, 2002). Иссл. в обл. мат. моделирования, прикладной статистики, управления сложными объектами
Таназлы Георгий Иванович, доц. той же каф. Дипл. магистр по информатике и вычисл. технике (УГАТУ, 2002). Канд. техн. наук по матем. моделированию, численным методам и комплексам программ (УГАТУ, 2005). Иссл. в обл. матем. моделирования.
Хасанов Айрат Юлаевич, доц. той же каф. Дипл. математик (МГУ, 1976). Канд. техн. наук по системн. анализу и автоматическому управлению (УАИ, 1986). Иссл. в обл. матем. моделирования, матем. статистики
Абдрафиков Михаил Асхатович, асп. той же каф. Дипл. инженер по системам автоматизированного проектирования (УГАТУ). Иссл. в обл. матем. моделирования.