ISSN 0868-5886
НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2023, том 33, № 2, c. 49-61
- МАТЕМАТИЧЕСКИЕ МЕТОДЫ -
И МОДЕЛИРОВАНИЕ В ПРИБОРОСТРОЕНИИ
УДК 519.248+ 681.2 © А. Л. Буляница, 2023
ОЦЕНКА ВЕРОЯТНОСТИ ОШИБОЧНОЙ ИНТЕРПРЕТАЦИИ РЕЗУЛЬТАТОВ ПЦР-АНАЛИЗА. Ч. 1. ОТКАЗЫ ТЕХНИЧЕСКИХ УСТРОЙСТВ
На основе признанных вероятностных моделей распределения времен первого отказа технических устройств дана оценка вероятности получения ошибочного результата генетического анализа при реализации полиме-разной цепной реакции в реальном времени. Использованы модели плотности распределения вероятности времен первого отказа из множества распределений Вейбулла с различными параметрами. Большая часть временных оценок построена, исходя из распределения Вейбулла с параметром 1, что совпадает с наиболее признанным экспоненциальным законом распределения времен отказа. Исследованы случаи малых времен непрерывной работы прибора (от 100 до 1200 ч). Используя понятие "слабого звена" как наиболее вероятно отказывающего блока, а также элемента в соответствующем блоке, подтверждено, что в рассматриваемых условиях более чем в 65% случаев отказ прибора вызван отказом именно соответствующего элемента. При этом часто применяемая гипотеза отказа единственного элемента, например, при построении таблицы функций неисправностей, недостаточно обоснована даже при малых временах непрерывной работы прибора. Полученные оценки могут быть ориентиром при прогнозировании времен безотказной работы в условиях, когда замена элементов (блоков) практически невыполнима. В случае использования вероятностной модели — распределения Вейбулла с параметрами 1.5 и 2, что предполагает возрастание вероятностей отказа на больших временах, оценочные значения вероятности отказа для времен непрерывной работы до 700 ч уменьшаются примерно вдвое по сравнению с экспоненциальным законом.
Кл. сл.: время первого отказа, распределение Вейбулла, экспоненциальное распределение, условная вероятность, формула Байеса, "слабое звено"
ВВЕДЕНИЕ
Оценка вероятности безотказной работы прибора или/и связанного с ней времени средней наработки до первого отказа, очевидно, имеет большое практическое значение. Имеется достаточно большое число работ, описывающих различные вероятностные модели отказа технических устройств (элементов), параметров распределений, в т.ч. и характерных времен наработки на отказ, средних времен до первого отказа или между отказами, интенсивностей отказов и т.п. Однако в большинстве случаев интересы авторов касаются именно указанного набора оценок и вероятностей отказов при условии продолжительной эксплуатации оборудования.
В данной работе на основе известных статистических моделей, оценок характерных времен или интенсивностей отказов рассматривается случай малых времен непрерывной работы устройства для количественного генетического анализа методом полимеразной цепной реакции в реальном времени (ПЦР-РВ). Малые времена — времена, не превышающие среднего времени до первого отка-
за наименее надежного элемента или блока, которые далее будут называться "слабым звеном". В наших условиях эти времена составляют сотни часов непрерывной работы.
Принципиально важным представляется невозможность дублирования любого элемента. При этом его отказ или нештатная работа приводит к получению некорректного результата анализа.
При получении количественных оценок вероятности некорректного результата анализа по причине отказа элементов прибора, рассматриваются следующие основные аспекты и ограничения.
Первый аспект — исследование зависимости оценок вероятности отказа от вида закона распределения. При этом ограничиваемся классом распределений Вейбулла с различными показателями, а другие вероятностные модели, например усеченное нормальное и логнормальное распределения не рассматриваются. Наиболее известное и часто используемое модельное вероятностное распределение — экспоненциальное — относится также к распределениям Вейбулла (параметр равен 1).
Второй аспект связан с тем, что часто в расчетах, например, при построении таблиц функций
неисправностей и связанных с ними моделей поиска ошибок применяется схема отказа только одного элемента. В связи с этим требуется определить, во-первых, в какой мере некорректность результатов анализа связана с отказом "слабого звена", во-вторых, насколько обоснована гипотеза отказа только одного элемента (или блока), и, наконец, сколь обоснованно предположение о наибольшей вероятности отказа только "слабого звена" без сопровождающих его отказов других элементов. Естественно, описывается примерный набор элементов прибора и выявлено его "слабое звено".
В первой части статьи не учитываются эффекты, связанные непосредственно с постановкой и проведением ПЦР-РВ, корректностью обработки информативного сигнала (кривой ПЦР), а также интерпретацией результата.
Кроме того, не учитывается аспект, связанный с наличием человеческого фактора. Известно, что при 6-часовой рабочей смене без необходимости выполнения сложных операций, отсутствии жестких требований по быстродействию и при проведении предварительных 4 тренировок, вероятность ошибки из-за человеческого фактора примерно равна 0.9% [1]. Эти аспекты будут рассмотрены в следующих частях статьи.
ИСХОДНЫЕ ДАННЫЕ И РАСЧЕТНЫЕ ФОРМУЛЫ
Выражение для плотности распределения вероятностей, содержащее положительный параметр k, определяется формулой (1)
f (х) = Х-'кх1 -1 ехр(- (х / Х)1). (1)
Эта зависимость описывает класс распределений Вейбулла. При этом масштабный параметр Х связан со средним временем до первого отказа, х — время. Величина, обратная Х, определяет интенсивность потока отказов. Если 1 больше 1, то интенсивность отказов возрастает со временем. В случае 1 = 1 получается экспоненциальное распределение.
Математическое ожидание времени до первого отказа при вероятностной модели (1) есть
т = ХГ(1 +1/1). (2)
В формуле (2) символ Г обозначает гамма-функцию.
Сравнение вероятностей отказов для разных законов (соответствующих различным 1) проводится, исходя из равенства среднего времени отказа (первого отказа) прибора, которое определяется формулой (3):
Ф(х) = 1 - ехр(-(х / Х)к) . (3)
В связи с этим проводится пересчет параметра Х, согласно (2).
"Слабое звено" — это блок (элемент) с наибольшей вероятностью отказа к рассматриваемому времени 700 или 1000 часов. Очевидно, что соответствующий параметр распределения Х должен быть наименьшим. Вероятность отказа обратно пропорциональна Х только на очень малых временах работы, в условиях, когда выполнено 1 - ехр(- х / Х)« х / Х, а это отношение имеет порядок несколько сотых. Например, для х / Х = 0.0500 в левой части предыдущего приближенного равенства стоит 0.04877, для х / Х = 0.0300 получаем 0.02955.
Если в качестве события А рассматривать отказ блока или прибора в целом, то вероятность сопровождающего его отказа какого-либо элемента при условии достижения отказа прибора (блока) — апостериорная вероятность, рассчитываемая по формуле Байеса:
Р(Н|А) = Р(АН)/ Р(А).
Здесь событие А — отказ схемы, Н — отказ элемента, например, "слабого звена", АН — отказ схемы, сопровождаемый отказом "слабого звена". Указанная формула показывает, в какой мере отказ схемы связан с отказом именно "слабого звена", поскольку причины общего отказа схемы могут быть и иными и объясняться отказом других элементов.
Общая схема прибора для реализации ПЦР-РВ может быть сведена к виду, представленному на рис. 1. Блоки и их функции кратко описаны в тексте после рис. 1.
Рис. 1. Укрупненная схема прибора для количественного генетического анализа методом ПЦР-РВ (пояснения в тексте)
Данная укрупненная структурная схема прибора не детализирует особенностей его конструкции, не раскрывает иных аспектов, которые могли бы содержать элементы "know-how". Она иллюстрирует общий принцип измерений, отражая соответствующие логике функционирования связи между блоками. Блок 1 "Питание" представляет очевидную закономерность — при его отсутствии невозможно проведение корректного анализа по причине неработоспособности последующих блоков 24. Блок 2 — "Блок пробоподготовки", 3 — "Оптический блок" и 4 — "Тепловой блок". Последний должен обеспечивать требуемое циклическое изменение температуры в пределах 60-95 оС с определенной продолжительностью каждой фазы. Условно названная блоком 5 "Установка картриджа" предполагает обеспечение требуемого позиционирования планшета или картриджа с пробирками, содержащими анализируемые пробы. Очевидно, что ошибочное позиционирование картриджа приведет к неэффективному проведению ПЦР либо вообще к невозможности ее проведения. Блок 6 "Сигнал ошибки установки картриджа" подтверждает правильность позиционирования картриджа. Отказ выполнения операции по отображению этого сигнала приведет к тому, что будут рассмотрены результаты анализа при ошибочном размещении проб в приборе. Тем самым очевидно, что результат анализа будет неверным. Кнопка 7 "Ручное отключение" позволяет прервать цикл анализа при явном нарушении штатных условий его проведения. Соответственно, несрабатывание этой кнопки приведет к учету результатов анализа, проводимых в неприемлемых условиях. В целом отказы блоков (устройств) 5-7 приведут к ошибочному учету результата анализа, проведенного в недопустимых условиях. Блок 8 "ПК" — персональный компьютер — осуществляет управление другими блоками и элементами, например 2-4, а также с его помощью обеспечивается выход результата анализа 10.
Элемент 9 — анализ пробы в рамках рассматриваемой приближенной расчетной модели считается идеально функционирующим, не имеющим никаких погрешностей в работе. Т.е. в число возможных источников (причин) некорректного результата анализа, в т.ч. по причине отказа блока или элемента, некорректный анализ пробы и его ошибочная интерпретация не входят. Блок 10 представляет собой конечную точку, в которой фиксируется результат анализа, корректно или некорректно полученный.
Задав в качестве событий Аг- события, связанные с безотказной работой соответствующих блоков, а события А — безошибочную интерпретацию анализа, событие А может быть записано как
А = А1А2А3А4А8 + А5А6 + А7. (4)
События, входящие в (4), являются независимыми, но могут быть совместными. Т.о. вероятность произведений будет произведением соответствующих вероятностей, а вероятность суммы считается по формуле суммы 3 совместных слагаемых, не имеющих общих множителей.
Вычисление вероятностей будет проходить в два этапа: вначале вычисляется вероятность отказа оптического блока 3, как "слабого звена" среди блоков, а затем вероятность отказа к заданному времени (от 100 до 1200 ч непрерывной работы) прибора в целом.
Расчет строится на распределении Вейбулла с параметром 1 (экспоненциальное распределение).
РАСЧЕТ ВЕРОЯТНОСТЕЙ ОТКАЗА ДЛЯ ОПТИЧЕСКОГО БЛОКА
Состав оптического блока: ФЭУ, 3 шаговых двигателя с оптопарами, 5 светофильтров и свето-диод. Это основные элементы, максимально "обезличенные". Для дальнейших расчетов используются средние значения времени до первого отказа либо пересчет данных по интенсивности потока отказов.
Т.к. ни один из элементов не дублируется, для корректной работы блока необходима безотказная работа всех элементов. Исходные данные были представлены в двух форматах: среднее время до первого отказа в часах либо интенсивность потока отказов, являющаяся обратной величиной по отношению к среднему времени отказа или, что то же самое для экспоненциального распределения, параметру распределения X. При наличии нескольких элементов, выполняющих одну функцию, например шаговых двигателей, светофильтров и т.п., интенсивности потоков отказов суммируются.
Необходимые исходные данные для расчета вероятностей отказов элементов оптического блока и методика расчета взяты из учебного пособия [2], в котором, в свою очередь, использованы сведения из [3-10]. Очевидно, для оптического блока "слабым звеном" является ФЭУ. Далее на рис. 2 представлен график вероятности отказа оптического блока при временах непрерывной работы 1001200 ч.
В табл. представлены литературные данные по времени непрерывной работы отдельных элементов или связанные с ними значения интенсивности потока отказов.
Табл. Расчетные данные по надежности элементов прибора
Элемент Среднее время до первого отказа, ч
Фотоэлектронный умножитель (ФЭУ) 2.0103
Светодиод (15^25)103
Оптопара (10^20)103
Светофильтр (интерференционный) 3.3105
Элемент Пельтье 2.0105
Нагреватель 1.3105
Шаговый двигатель (ШД)* 2.7106
Компьютер** 9.85103
Ручное отключение 1.0107
Блок 6 (аналог жидкокристаллического 2.5104
индикатора)
* — как обратная величина от интенсивности потока отказов;
** — пересчет на основе вероятности отказа за год непрерывной работы.
Исходные данные взяты преимущественно из [2], а также из [3, с. 280-284], [4-10], в которых содержится информация о характеристиках надежности элементов и приборов разных типов: оптико-электронных [7-9], тепловых, механических [6] и т.п. В табл. представлены среднее значение либо диапазон значений, а расчет проводится на основе среднего времени наработки до первого отказа. В частности, для разных типов ФЭУ
указан достаточно большой диапазон времен в пределах 500-10 000 ч [4]. Для оценок интенсивности отказов механических элементов используются данные для зубчатых передач (0.11-0.36)10-6 1/ч [5] и берется среднее значение 0.25 10-6 1/ч.
Детальный расчет вероятности отказа ПК при непрерывной работе 1 год, т.е. 8760 ч, дает 0.89, что выражено через отказы основных элементов: системной платы, ЯАМ-модулей 1 и 2, вентилято-
ров 1 и 2, блока питания [10]. Отсюда по экспоненциальному закону вычислен параметр распределения (3), указанный в табл.
Т.к. для работоспособности оптического блока необходимо отсутствие отказов всех элементов, то при ограничительном условии независимости отказов соответствующая вероятность будет произведением вероятностей безотказной работы элементов. Далее рассматриваются: апостериорная вероятность отказа именно ФЭУ ("слабого звена") при условии отказа оптического блока, а также вероятность отказа только одного элемента (любого) при условии безотказной работы всех остальных элементов.
Зависимость на рис. 2 с учетом перевода в проценты хорошо аппроксимируется параболой вида:
Р(%) = 0.553 + 0.066^ -1.591 -10512. (5)
Здесь t — время непрерывной работы в часах. Коэффициент детерминации зависимости превышает 0.99, что свидетельствует о высоком качестве аппроксимации. На малых временах зависимость близка к линейной.
Далее на рис. 3 представлены зависимости от времени непрерывной работы вероятности отказа ФЭУ как "слабого звена" оптического блока, так и вероятности отказа только одного элемента при условии отказа блока. Логика последнего случайного события упрощена, т.к. отсутствует дублирование элементов: отказ одного элемента сопровождается безотказной работой остальных элементов, а соответствующие слагаемые, состав-
ляющие суммарное событие "отказ одного элемента", оказываются несовместными.
Обе зависимости носят характер, близкий к линейному убывающему. Рассматриваемые времена существенно меньше среднего времени первого отказа "слабого звена" — ФЭУ — и тем более многократно меньше средних времен первого отказа остальных элементов блока.
При этом даже при очень малых временах непрерывной работы понятие "слабого звена" достаточно условно, т.к. в 30-40% случаев отказ блока связан с отказом не "слабого звена", а других элементов.
РАСЧЕТ ВЕРОЯТНОСТИ ПОЛУЧЕНИЯ
НЕКОРРЕКТНОГО РЕЗУЛЬТАТА АНАЛИЗА
В качестве единственной причины некорректного анализа в этой Ч. 1 статьи рассматривается отказ элементов (блоков), вызывающий либо невозможность проведения ПЦР-РВ, либо отказ в фиксации аномальных условий проведения анализа, к которым относится некорректное размещение картриджа с пробами и отсутствие информации об этом, а также неосуществимость ручного завершения анализа по решению оператора.
Аспекты, связанные с неэффективным и некорректным проведением собственно ПЦР (блок 9), а также с человеческим фактором, будут проанализированы в следующей части статьи.
Методика расчета вероятности отказа прибора ориентирована на формулу (4), которая выражает вероятность противоположного события — вероятность безотказной работы. Динамика условной вероятности отказа оптического блока как "слабого звена" прибора в целом иллюстрируется рис. 4.
100
20а 400 600 800 1000 1200
Время,ч
Рис. 3. Вероятности отказа (1) ФЭУ, (2) только одного элемента при условии отказа оптического блока
200 4 00 6 00 8 00 1000 1200
Время, ч
Рис. 4. Условная вероятность отказа оптического блока при отказе прибора
200 400 000 800 1000 1200
Время работы, ч
Рис. 5. Вероятности отказа хотя бы одного из блоков прибора
На рис. 5 приведена зависимость вероятности отказа хотя бы одного из блоков прибора, следствием чего является отказ прибора в целом и, естественно, некорректный результат анализа.
Условная вероятность отказа именно оптического блока меняется по закону, близкому к линейному, и в очень небольшом диапазоне значений (80-87%). Тем самым фактор оптического блока как "слабого звена" прибора (блока, а не отдельного элемента) подтверждается. График на рис. 5 свидетельствует о том, что в условиях относительно небольших времен непрерывной работы (порядка месяца, т.е. примерно 700 ч) вероятности отказа могут превышать 40%.
ТАБЛИЦА ФУНКЦИЙ НЕИСПРАВНОСТЕЙ
Таблица функций неисправностей (ТФН) является признанной, достаточно универсальной математической моделью объекта диагноза и принадлежит к классу явных моделей. Ее построение служит важным этапом синтеза алгоритма тестирования устройства, целью которого является разработка схем выявления неисправного элемента на основе формирования выборки тестовых сигналов и их анализа. Методология формирования ТФН описана, например, в работах [11-17].
Процесс построения логической модели состоит из следующих этапов [11]:
1. В системе выделяют отдельные функциональные элементы, входы и выходы которых доступны для измерения.
2. Для каждого элемента указывают диапазоны допустимых входных и выходных воздействий.
3. Составляют функциональную схему, содержащую выделенные элементы и связи между ними.
4. Выявляют возможные состояния системы.
5. Составляют ТФН.
В подавляющем большинстве случаев ТФН строится, исходя из гипотезы, что происходит отказ (неисправность, некорректная работа) только одного элемента. В других случаях построение ТФН усложняется многократно. Как показывают оценки предыдущего раздела, доля случаев, когда происходит отказ не единственного элемента или блока, достаточно велика (до 30-40%).
ЗАКЛЮЧЕНИЕ
Все представленные оценки характерных вероятностей некорректной работы оптического блока и прибора в целом и методология расчетов практически не зависят от параметра распределения 1 в формуле (1). Количественные оценки базировались только на одном варианте распределения Вейбулла с параметром 1 (оно же экспоненциальное).
Закономерности, выявленные ранее, свидетельствуют об относительной условности понятия "слабого звена": вероятность отказа указанного элемента или блока лишь на 60-70% является причиной отказа прибора в целом; гипотеза отказа единственного элемента также не всегда правомерна, в особенности для времен более 20% от среднего времени до первого отказа. Эти закономерности будут, скорее всего, проявлены и при использовании других вероятностных моделей отказа из класса распределений Вейбулла.
В то же время количественные значения вероятностей отказа будут уменьшаться при увеличении параметра 1, что проиллюстрировано графиком на рис. 6.
Относительное (безразмерное) время нормировано на среднее время до первого отказа. Соответственно подбирается параметр распределения Вейбулла. Известно, что модель (1) при 1 = 1 соответствует случаю экспоненциального распределения; для распределений, соответствующих параметрам 1.5 и 2, свойственно увеличение вероятности отказа элементов со временем. В частности, применительно к ФЭУ со средним временем до первого отказа 2 000 ч, время непрерывной работы 1 месяц или около 700 ч соответствует относительному времени около 0.3. Видно, что для вероятностной модели с 1 = 2 вероятность отказа уменьшилась примерно вдвое по сравнению с экспоненциальным распределением 1 = 1. В то же время плотность распределения вероятностей (1) для параметра 1 = 2 при больших рассматриваемых вре-
Отн. время
Рис. 6. Вероятности отказа прибора в зависимости от параметра распределения Вейбулла
менах существенно больше, чем для аналогичной зависимости при k = 1 даже с учетом согласования параметра Л, исходя из равенства математических ожиданий времен отказа (2).
Определение значения параметра k, наиболее соответствующего схемам отказа элементов реальных приборов, требует специального обследования на репрезентативной выборке серийно выпускаемых приборов достаточно большого объема, поскольку чувствительность вероятностных оценок к изменениям параметра k достаточно мала.
Следовательно, выявленные закономерности по изменению вероятностей отказов элементов и блоков приборов для малых времен работы, связанные с условными и апостериорными вероятностями, могут быть использованы для различных оценок, связанных с вкладами т.н. "слабых звеньев". При этом для использования абсолютных оценок вероятностей потребуется верификация вероятностных моделей (1), как минимум связанная с адекватным выбором параметра k.
Аспекты, связанные с некорректным проведением собственно ПЦР-РВ (блок 9), а также с учетом человеческого фактора, предполагается рассмотреть во второй части данной работы.
Работа выполнена в рамках Государственного задания Министерства науки и высшего образования Российской Федерации № 075-01157-23-00 (тема FFZM-2022-0012).
СПИСОК ЛИТЕРАТУРЫ
1. Дружинин Г.В. Человек в моделях технологий. Часть I: Свойства человека в технологических системах. М.: МИИТ, 1996. 124 с.
2. Коняхин И.А., Зверева Е.Н. Типовые расчеты по определению характеристик надежности оптико-электронных приборов. СПб.: Университет ИТМО, 2016. 65 с.
3. Ефимов А.В. Надежность и диагностика систем электроснабжения железных дорог: Учебник для вузов ж/д транспорта / А.В. Ефимов, А.Г. Галкин. М.: УМК МПС России, 2000. 510 с.
4. Справочник. Надежность "ЭРИ". 2004. URL: https://areliability.com/wp-content/uploads/2018/08/Intensivnost-otkazov-elektroradioizdelij.pdf (дата доступа 07.03.2023).
5. Гурвич И.Б., Сыркин П.Э., Чумак В.И. Эксплуатационная надежность автомобильных двигателей. М.: Транспорт, 1994. 144 с.
6. Ишанин Г.Г. Источники излучения. Учебное пособие / Г.Г. Ишанин, В.В. Козлов. СПб.: СПбГУИТМО, 2004. 395 с.
7. Аксененко М.Д. Приемники оптического излучения: Справочник / М.Д. Аксененко, М.Д. Бараночников. М.: Радио и Связь, 1987. 296 с.
8. Приборы оптоэлектронные. Излучатели полупроводниковые. Оптопары. СПб.: Издательство РНИИ "Электронстандарт", 1992. 250 с.
9. Ишанин Г.Г. Приемники излучения / Г.Г. Ишанин, Э.Д. Панков, В.П. Челибанов. СПб.: Издательство "Папирус", 2003. 528 с.
10. Первый сервис-справочник по настройке компьютеров и программных продуктов.
URL: https://doma35.ru/computers/srednyaya-narabotka-na-otkaz-kompyutera (дата доступа 07.03.2023).
11. Mourad S., Zorian Y. Principles of testing electronic systems. John Wiley&Sons, 2000. 420 p.
12. Agrawal V.D., Bushnell M.L. Essentials of electronic testing for digital, memory and mixed-signal VLSI circuits. Kluwer academic publishers, 2001. 690 p.
13. Скобцов В.Ю., Скобцов Ю.А. Логическое моделирование и тестировании цифровых устройств. Донецк: ИПММ НАНУ, ДонНТУ, 2005. 436 с.
14. Kang S., Lebeltvici Y. CMOS digital integrated circuits Analysis and design. Boston, McGrow-Hill, 1999.
15. Барашко А.С., Скобцов Ю.А., Сперанский Д.В. Моделирование и тестирование дискретных устройств. Киев: Наукова думка, 1992. 288 с.
16. Яблонский С.В. Введение в дискретную математику. М.: Наука, 1979. 272 с.
ISSN0868-5886 NAUCHNOE PRIBOROSTROENIE, 2023, Vol. 33, No. 2, pp. 49-61
17. Breuer M.A., Friedman A.D., Abramovici M. Digital Sys- Контакты: Буляница Антон Леонидович, tem Testing and Testable Design. New York: Computer antbulyan@yandex.ru Science Press, 1990. 652 p.
Институт аналитического приборостроения РАН, Материал п0ступил в редяктшю 05 04 2023 Санкт-Петербург
ESTIMATION OF THE PROBABILITY OF ERRONEOUS INTERPRETATION OF THE RESULTS OF PCR ANALYSIS. PART 1. FAILURES OF TECHNICAL DEVICES
A. L. Bulyanitsa
Institute for Analytical Instrumentation of RAS, Saint Petersburg, Russia
Based on recognized probabilistic models of the distribution of time periods to the first failure of technical devices, an estimate of the probability of obtaining an erroneous result of genetic analysis during a real-time polymerase chain reaction is given. Models of the probability distribution density of the time periods to the first failure from a set of Weibull distributions with different parameters are used. Most of the time estimates are based on the Weibull distribution with parameter 1, which coincides with the most recognized exponential law of the distribution of time periods to failure.
Cases of short uptimes (from 100 to 1200 hrs) of the device are investigated. Using the concept of a "weak link" as the most likely failing unit, or an element in this unit, it is confirmed that in the conditions under consideration, in more than 65% of cases, the failure of the device is caused by the failure of this element. The often used hypothesis of failure of an only element, for example, for constructing a table of fault functions, is insufficiently justified even for short uptimes of the device. The estimates obtained can be a guideline for predicting uptime in conditions when replacing elements (unit) is practically impossible.
In the case of using a probabilistic model — the Weibull distribution with parameters 1.5 and 2, which implies an increase in the probability of failure over long periods — the estimated values of the probability of failure for continuous operation time periods up to 700 hrs are reduced by about half compared to the exponential law.
Keywords: time to the first failure, Weibull distribution, exponential distribution, conditional probability, Bayes formula, "weak link"
INTRODUCTION
The estimation of the probability of non-failure operation of the device and/or the associated mean operating time to the first failure is obviously of great practical importance. There are quite a large number of studies describing various probabilistic models of failure of technical devices (elements), distribution parameters, including characteristic time periods to failure, mean operating times to the first failure or between failures, failure rates, and the like. However, in most cases, the interests of the authors concern pre-
cisely the set of estimates and failure probabilities specified under the condition of long-term operation of the equipment.
In this paper, based on known statistical models, estimates of characteristic uptimes or failure rates, we consider the case of short uptimes of a device for quantitative genetic analysis using real-time polyme-rase chain reaction (RT-PCR). Short uptimes are time periods that do not exceed the mean time to the first failure of a "weak link", which is the least reliable element or unit. In our conditions, these uptimes amount to hundreds of hours of continuous work.
Of fundamental importance is the impossibility of duplicating any element. Wherein, its refusal or abnormal work results in incorrect analysis.
When obtaining quantitative estimates of the probability of an incorrect analysis result due to the failure of instrument elements, the following main aspects and limitations are considered.
The first aspect is the study of the dependence of estimates of the probability of failure on the type of distribution law. We restrict ourselves to the class of Weibull distributions with various indicators, and other probabilistic models, for example, truncated normal and log-normal distributions, are not considered. The most well-known and commonly used probability model distribution, the exponential, also applies to Weibull distributions (the parameter is equal to 1).
The second aspect is related to the fact that often the failure scheme of only one element is used in calculations, for example, when constructing tables of fault functions and related error search models. In this regard, it is required to determine, first, to what extent the incorrectness of the analysis results is associated with the failure of the "weak link", second, to what extent the hypothesis of failure of only one element (or block) is justified, and, finally, how justified is the assumption of the greatest probability of failure of only the "weak link" without accompanying failures of other elements. Naturally, an exemplary set of device elements is described, and its "weak link" is identified.
The first part of the article does not take into account the effects directly related to the formulation and conduct of RT-PCR, the correctness of processing the informative signal (PCR curve), or the interpretation of the result.
In addition, the aspect associated with the presence of the human factor is not taken into account. It is known that the probability of error due to the human factor is approximately equal to 0.9% under the conditions of a 6-hour work shift without the need to perform complex operations, 4 preliminary training sessions, and no strict performance requirements [1]. These aspects will be considered in the following sections of the article.
INITIAL DATA AND CALCULATION FORMULAS
The expression for the probability distribution density, containing a positive parameter k, is determined by the formula (1)
f (x) = Vkxk -1exp(- (x / X)k). (1)
This dependence describes a class of Weibull distributions. In this case, the scale parameter X denotes the mean time to the first failure, x is the time. The
reciprocal of X determines the failure rate. If k is greater than 1, then the failure rate increases over time. In the case of k = 1, an exponential distribution is obtained.
The mathematical expectation of time to the first failure in terms of a probabilistic model (1) is
m = Xr(1 +1/ k). (2)
In formula (2), the symbol r denotes the gamma function.
The comparison of failure probabilities for different laws (corresponding to different k) is carried out based on the equality of the mean failure time (first failure) of the device, which is determined by formula
(3):
0(x) = 1 - exp(-(x / X)k ) . (3)
In this regard, the parameter X is recalculated according to (2).
"Weak link" is a unit (element) with the highest probability of failure over the considered time of 700 or 1000 hrs. Obviously, the corresponding distribution parameter X must be the smallest. The probability of failure is inversely proportional to X only for very short uptimes of operation, under conditions when 1 - exp(- x / X)« x / X, and this ratio is of the order of several hundredths. For example, for x / X = 0.0500, the left side of the previous approximate equality is 0.04877, for x / X= 0.0300 we obtain 0.02955.
If we consider the failure of a unit or a device as a whole as an event A, then the probability of an accompanying failure of any element, provided that the failure of the device (unit) is reached, is an a posteriori probability calculated by the Bayes formula:
P(H|A) = P(AH) / P(A).
Here, the event A is the circuit failure, H is the failure of the element, for example, the "weak link", AH is the failure of the circuit, accompanied by the failure of the "weak link". This formula shows to what extent the failure of the circuit is associated with the failure of the "weak link", since the reasons for the overall failure of the circuit can be different and can be caused by the failure of other elements.
The general scheme of the device for real-time PCR can be reduced to the form presented in Fig. 1. Units and their functions are briefly described below.
Fig. 1. General scheme of the device for real-time PCR quantitative genetic analysis
This general unit diagram of the device does not detail the features of its design, does not disclose other
aspects that could contain "know-how" elements. It illustrates the general principle of measurements, reflecting the connections between the units that correspond to the logic of functioning. Unit 1 "Power supply" represents an obvious regularity — in its absence, it is impossible to conduct a correct analysis due to the inoperability of subsequent units 2-4. 2 is "Sample preparation unit", 3 is "Optical unit", and 4 is "Thermal unit". The latter should provide the required cyclic change in temperature within 60-95 °C with a certain duration of each phase. Notionally named "Cartridge installation" unit 5 involves ensuring the required positioning of the tablet or cartridge with test tubes containing analyzed samples. It is obvious that erroneous positioning of the cartridge will lead to inefficient PCR, or even to the impossibility of carrying it out. Unit 6 "Cartridge installation error signal" confirms the correct positioning of the cartridge. Failure to perform the operation to display this signal will lead to the fact that the results of the analysis will be considered in the case of erroneous placement of samples in the instrument. Thus, it is obvious that the result of the analysis will be incorrect. Button 7 "Manual shutdown" allows you to interrupt the analysis cycle in case of a clear violation of the regular conditions for its implementation. Accordingly, the failure of this button will result in taking into account the results of the analysis carried out under unacceptable conditions. In general, failures of units (devices) 5-7 will lead to an erroneous accounting of the result of an analysis carried out under unacceptable conditions. Unit 8 "PC" — a personal computer — controls other units and elements, for example, 2-4, and also provides the output of the analysis result 10.
Element 9 is a sample analysis and is considered to be perfectly functioning within the framework of the considered approximate calculation model, it has no errors in operation. That is, incorrect analysis of the sample and its erroneous interpretation are not among the possible sources (causes) of an incorrect analysis result, including the failure of a block or element. Unit 10 is the end point at which the result of the analysis is fixed, whether correctly or incorrectly obtained.
After setting events A, as the events associated with the uptime operation of the corresponding blocks, and events A as the error-free interpretations of the analysis, event A can be written as
A = A!A2A3A4A8 + A5A6 + A7. (4)
The events included in (4) are independent, but can be joint. Hence, the probability of products is the product of the corresponding probabilities, and the probability of the sum is calculated according to the formula for the sum 3 of joint terms that do not have common factors.
The calculation of probabilities will take place in two stages: first, the probability of failure of optical
unit 3, as a "weak link" among the units, is calculated, and then the probability of failure of the device as a whole within a given time (from 100 to 1200 hours of continuous operation).
The calculation is based on the Weibull distribution with parameter 1 (exponential distribution).
CALCULATION OF FAILURE PROBABILITIES FOR OPTICAL UNIT
The composition of the optical unit is as follows: PMT, 3 stepper motors with optocouplers, 5 light filters, and a LED. These are the main elements, maximally "impersonal". For further calculations, the mean values of the time to the first failure or the recalculation into the failure flow intensity are used.
As none of the elements is duplicated, for the correct operation of the unit, the uptime operation of all elements is necessary. Raw data were presented in two formats: the mean time to the first failure (in hours), or the intensity of the flow of failures, which is the reciprocal of the mean failure time, or, in the case of an exponential distribution, the distribution parameter X. If there are several elements that perform the same function, for example, stepper motors, light filters, etc., the failure rates are summed up.
The necessary initial data for calculating the failure probabilities of the elements of the optical unit and the calculation procedure were taken from the textbook [2], which, in turn, used information from [3-10]. Obviously, for the optical unit, the "weak link" is the PMT. Fig. 2 shows a graph of the probability of failure of the optical unit for continuous operation of 100-1200 hrs.
Fig. 2. Probability of optical unit failure vs various uptime periods
The table presents literature data on the time of continuous operation of individual elements or associated failure rates.
Tab. Calculated data on the reliability of the elements of the device
The initial data are taken mainly from [2], as well as from [3, pp. 280-284], [4-10], which contain information on the reliability characteristics of elements and devices of various types: optoelectronic [7-9], thermal, mechanical [6], etc. In the table, an average value or a range of values are presented, and the calculation is based on the mean operational time to the
first failure. In particular, for various types of PMTs, a rather large time range is indicated within 50010 000 hrs [4]. To estimate the failure rate of mechanical elements, data for gears (0.11-0.36). 10-6 1/h [5] are used, and an average value of 0.25 ■ 10-6 1/h is taken.
Detailed calculation of PC failure probability during continuous operation within 1 year, i.e., 8760 hrs, gives 0.89, which is expressed in terms of failures of the main elements: motherboard, RAM modules 1 and 2, air fans 1 and 2, power supply [10]. Hence, the distribution parameter (3) is calculated according to the exponential law and indicated in the table.
As the absence of failures in all elements is necessary for the operability of the optical unit, then under the restrictive condition of independence of failures, the corresponding probability will be the product of the probabilities of uptime operation of the elements. Next, we consider: the a posteriori probability of failure of the PMT (the "weak link"), resulting in the failure of the optical unit, as well as the probability of failure of only one element (any), while maintaining the failure-free operation of all other elements.
The dependence in Fig. 2, taking into account the conversion to percentages, is well approximated by a parabola of the form:
P (%) = 0.553 + 0.066? -1.591 • 10-512. (5)
Here t is the time of continuous operation in hours. The dependence determination coefficient exceeds 0.99, which indicates a high quality of the approximation. At short time intervals, the dependence is close to linear.
Fig. 3 presents the dependence of the probability of PMT failure as a "weak link" of the optical unit on the uptime, as well as the probability of failure of only one element in terms of failure of the unit. The logic of the last random event is simplified, because there is no duplication of elements: the failure of one element is accompanied by the failure-free operation of the remaining elements, and the corresponding terms that make up the total event "failure of one element" turn out to be incompatible.
Fig. 3. Probabilities of failure of (1) PMT, (2) only one element in terms of failure of the optical unit
Both dependencies have a character close to linearly decreasing. The considered time intervals are significantly less than the mean time of the first failure of the "weak link" (PMT) and multiply less than the mean time of the first failure of the remaining elements of the unit.
Even at very short uptime intervals, the concept of a "weak link" is rather conventional, since in 30-40%
of cases, the failure of the unit is associated with the failure of not the "weak link", but other elements.
CALCULATION OF PROBABILITY OF INCORRECT ANALYSIS RESULT
In Part 1 of the article, as the only reason for incorrect analysis, the failure of elements (units) is considered, causing either the impossibility of performing RT-PCR, or the failure to fix anomalous conditions for the analysis, which include the incorrect placement of the sample cartridge and the lack of information about it, as well as the impossibility of manually completing the analysis by the operator decision.
Aspects related to inefficient and incorrect PCR itself (unit 9), as well as the human factor, will be analyzed in the next part of the article.
The method for calculating the probability of device failure is focused on formula (4), which expresses the probability of the opposite event — the probability of failure-free operation. The dynamics of the conditional probability of failure of the optical unit as a "weak link" of the device as a whole are illustrated in Fig. 4.
Fig. 4. Conditional probability of failure of the optical unit as part of device failure
Fig. 5 shows the dependence of the probability of failure of at least one of the device units, resulting in the failure of the device as a whole and, of course, an incorrect result of the analysis.
Fig. 5. Probabilities of failure of at least one of the device units
The conditional probability of failure of the optical unit in particular varies according to a pattern close to linear and in a very small range of values (80-87%). Thus, the factor of the optical unit as a "weak link" of the device (a unit, not an individual element) is confirmed. The graph in Fig. 5 indicates that under conditions of relatively short uptimes (about a month, i.e., approximately 700 hrs), the failure probabilities can exceed 40%.
FAULT FUNCTION TABLE
The table of fault functions (TFF) is a recognized, fairly universal mathematical model of the object of diagnosis and belongs to the class of explicit models. Its construction is an important step in the synthesis of
a device testing algorithm, aimed at developing schemes for identifying a faulty element based on the formation of a sample of test signals and their analysis. The methodology for the formation of TFF is described, for example, in [11-17].
The process of building a logical model consists of the following steps [11]:
1. Separate functional elements are distinguished in the system, and their inputs and outputs are available for measurement.
2. For each element, the ranges of permissible input and output actions are set.
3. Make up a functional diagram containing the chosen elements and the links between them.
4. Identify possible states of the system.
5. Compose TFF.
In the overwhelming majority of cases, the TFF is built on the basis of the hypothesis that only one element fails (malfunction, incorrect operation). In other cases, the construction of TFF is complicated many times over. As the estimates in the previous section show, the proportion of cases when more than a individual element or unit fails is quite large (up to 3040%).
CONCLUSION
All presented estimates of the characteristic probabilities of incorrect operation of the optical unit and the device as a whole and the calculation methodology are practically independent from the distribution parameter k in formula (1). Quantitative estimates were based on only one version of the Weibull distribution with parameter 1 (exponential).
The patterns identified earlier testify to the relative conventionality of the concept of "weak link": the probability of failure of this element or unit is only 60-70% the cause of the failure of the device as a whole; the one element failure hypothesis is also not always valid, especially for uptimes greater than the mean time to the first failure by 20%. These regularities will most likely manifest themselves when using other probabilistic failure models from the class of Weibull distributions.
Simultaneously, the quantitative values of the failure probabilities will decrease with an increase in the parameter k, illustrated by the graph in Fig. 6.
Fig. 6. Device failure probabilities depending on the parameter of the Weibull distribution
The relative (dimensionless) time is normalized to the mean time to the first failure. Accordingly, the Weibull distribution parameter is chosen. It is known
that model (1) for k = 1 corresponds to an exponential distribution; for distributions corresponding to parameters 1.5 and 2, an increase in the probability of failure of elements over time is characteristic. In particular, as applied to PMT with a mean time to the first failure of 2000 hrs, uptime of 1 month, or about 700 hrs corresponds to a relative time of about 0.3. It can be seen that for a probabilistic model with k = 2, the failure probability has decreased by about half compared to the exponential distribution with k = 1. However, the probability distribution density (1) with the parameter k = 2 and long uptime periods is significantly greater than for dependences with k = 1 even matching the parameter X, based on the equality of the mathematical expectations of the time periods to failure (2).
Determining the value of the parameter k that best corresponds to the failure patterns of the elements of real devices requires a special examination of a representative sample of commercially produced devices of a sufficiently large volume, since the sensitivity of probabilistic estimates to changes in the parameter k is rather small.
Therefore, the revealed patterns in changing the failure probabilities of elements and units of devices for short uptimes, associated with conditional and a posteriori probabilities, can be used for various estimates related to the contributions of the so-called. "weak links". In this case, to use absolute estimates of probabilities, verification of probabilistic models (1) will be required, at least associated with an adequate choice of the parameter k.
Aspects related to the incorrect conduct of realtime PCR itself (unit 9), as well as the human factor, are supposed to be considered in the second part of this work.
REFERENСES
1. Druzhinin G.V. Chelovek v modelyakh tekhnologii. Chast' I: Svoistva cheloveka v tekhnologicheskikh siste-makh [The man in the models of technology. Part I: Human Properties in Technological Systems]. Moscow, MIIT Publ., 1996. 124 p. (In Russ.).
2. Konyakhin I.A., Zvereva E.N. Tipovye raschety po opre-deleniyu kharakteristik nadezhnosti optiko-ehlektronnykh priborov [Typical calculations for determination of reliability characteristics of optical-electronic devices]. Saint Petersburg, Universitet ITMO, 2016. 65 p. (In Russ.).
3. Efimov A.V. Nadezhnost' i diagnostika sistem ehlektros-nabzheniya zheleznykh dorog: Uchebnik dlya vuzov zh/d transporta [Reliability and diagnostics of railway power supply systems: Textbook for universities of railway transport]. A.V. Efimov, A.G. Galkin, eds. Moscow, UMK MPS Rossii, 2000. 510 p. (In Russ.).
4. Spravochnik. Nadezhnost' "ERI" [Reference book. Reliability of "ERI"]. 2004. 620 p. URL:
https://areliability.com/wp-content/uploads/2018/08/Intensivnost-otkazov-elektroradioizdelij.pdf (accessed 07.03.2023) (In Russ.).
5. Gurvich I.B., Syrkin P.Eh., Chumak V.I. Ehkspluatat-sionnaya nadezhnost' avtomobil'nykh dvigatelei [Operational reliability of automotive engines]. Moscow, Transport Publ., 1994. 144 p. (In Russ.).
6. Ishanin G.G. Istochniki izlucheniya. Uchebnoe posobie [Radiation sources. Tutorial]. G.G. Ishanin, V.V. Kozlov, eds. Saint Petersburg, Universitet ITMO, 2004. 395 p. (In Russ.).
7. Aksenenko M.D. Priemniki opticheskogo izlucheniya: Spravochnik [Optical radiation receivers: Reference book]. M.D. Aksenenko, M.D. Baranochnikov, eds. Moscow, Radio i Svyaz' Publ., 1987. 296 p. (In Russ.).
8. Pribory optoehlektronnye. Izluchateli poluprovodnikovye. Optopary [Optoelectronic devices. Semiconductor emitters. Optopars]. Saint Petersburg, RNII "Ehlektronstan-dart" Publ., 1992. 250 p. (In Russ.).
9. Ishanin G.G. Priemniki izlucheniya [Radiation receivers]. G.G. Ishanin, Eh.D. Pankov, V.P. Chelibanov, eds. Saint Petersburg, Papirus Publ., 2003. 528 p. (In Russ.).
10. DOMA35.RU. Pervyi servis-spravochnik po nastroike komp'yuterov i programmnykh produktov [The first service guide for configuring computers and software products]. URL: https://doma35.ru/computers/srednyaya-
Contacts: Bulyaniza Anton Leonidovich, antbulyan@yandex.ru
narabotka-na-otkaz-kompyutera (accessed 07.03.2023) (In Russ.).
11. Mourad S., Zorian Y. Principles of testing electronic systems. John Wiley&Sons, 2000. 420 p.
12. Agrawal V.D., Bushnell M.L. Essentials of electronic testing for digital, memory and mixed-signal VLSI circuits. Kluwer academic publishers, 2001. 690 p. DOI: 10.1007/b117406
13. Skobtsov V.Yu., Skobtsov Yu.A. Logicheskoe modeliro-vanie i testirovanii tsifrovykh ustroistv [Logical Modeling and Testing of Digital Devices]. Donetsk, IPMM NANU, DonNTU, 2005. 436 p. (In Russ.).
14. Kang S., Lebeltvici Y. CMOS digital integrated circuits Analysis and design. Boston, McGrow-Hill, 1999.
15. Barashko A.S., Skobtsov Yu.A., Speranskii D.V. Modeli-rovanie i testirovanie diskretnykh ustroistv [Simulation and testing of discrete devices]. Kyiv, Naukova dumka, 1992. 288 p. (In Russ.).
16. Yablonskii S.V. Vvedenie v diskretnuyu matematiku [Introduction to Discrete Mathematics]. Moscow, Nauka Publ., 1979. 272 p. (In Russ.).
17. Breuer M.A., Friedman A.D., Abramovici M. Digital System Testing and Testable Design. New York, Computer Science Press, 1990. 652 p.
Article received by the editorial office on 05.04.2023