Научная статья на тему 'Модели надежности многоверсионных отказоустойчивых цифровых устройств на ПЛИС'

Модели надежности многоверсионных отказоустойчивых цифровых устройств на ПЛИС Текст научной статьи по специальности «Механика и машиностроение»

CC BY
320
101
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по механике и машиностроению, автор научной работы — Харченко Вячеслав Сергеевич, Тарасенко Виталий Владимирович

Рассматриваются многоверсионные отказоустойчивые устройства на ПЛИС (ЦУПС). Получены аналитические модели оценки надежности однои многоверсионных (диверсных) структур с учетом дефектов проектирования и физических дефектов ПЛИС. Анализируются результаты исследования ЦУПС с версионной избыточностью, формулируются критерии оценки целесообразности применения многоверсионной технологии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по механике и машиностроению , автор научной работы — Харченко Вячеслав Сергеевич, Тарасенко Виталий Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Reliability models of multiversion fault-tolerant DDLP

Analytic reliability models are proposed for digital devices on programmable logic (DDPL) worked out with use of multiversion technology. There are grounds for output data and time distribution law admissions when DDPL project defects are shown. Biand three — version DDPL reliability comparative researches has been carried out. Their results and propositions about goal use of them are given.

Текст научной работы на тему «Модели надежности многоверсионных отказоустойчивых цифровых устройств на ПЛИС»

маційної завантаженості складових ОУ і їх схожості при вирішенні певного завдання, провести оптимі-зацію їх складу системи керування, зменшити часові ресурси Rt і мінімізувати необхідні людські ресурси R ч .

Література: 1. Парницкий Г. Автоматическая классификация. М.: Финансы и статистика, 1981. 136с.

Надійшла до редколегії 01.07. 2002.

Рецензент: канд. техн. наук, доцент Дробах Г.А.

Орлов Микола Михайлович, канд. військових наук, доцент кафедри Харківського військового університе-

УДК 681.3.06

МОДЕЛИ НАДЕЖНОСТИ МНОГОВЕРСИОННЫХ ОТКАЗОУСТОЙЧИВЫХ ЦИФРОВЫХ УСТРОЙСТВ НА ПЛИС

ХАРЧЕНКОВ.С., ТАРАСЕНКОВ.В.________________

Рассматриваются многоверсионные отказоустойчивые устройства на ПЛИС (ЦУПС). Получены аналитические модели оценки надежности одно- и много-версионных (диверсных) структур с учетом дефектов проектирования и физических дефектов ПЛИС. Анализируются результаты исследования ЦУПС с верси-онной избыточностью, формулируются критерии оценки целесообразности применения многоверсионной технологии.

1. Введение

В [1] предложена классификация и сформулированы принципы построения отказоустойчивых ЦУПС с версионной избыточностью. Среди множества типовых структур в качестве примера разработки ЦУПС с применением многоверсионной технологии (МВТ) рассмотрены две структуры. В своем составе они содержат два корпуса ПЛИС, внутри которых синтезированы внутренние каналы обработки (ВКО), выполненные по разным схемам (версиям), и другие элементы, обеспечивающие сравнение и восстановление обрабатываемой информации.

В [2] предложены аналитические модели надежности одноверсионных ЦУПС без учета дефектов проектирования. Цель данной статьи — разработка моделей надежности структур многоверсионных ЦУПС, описанных в [ 1], сравнительный анализ их надежности, выявление степени влияния безотказности составных частей, а также типов и параметров дефектов проектирования.

2. Аналитические модели надежности ЦУПС с версионной избыточностью

Оценку надежности исследуемых структур произведем с помощью комбинаторно-вероятностного

ту. Наукові інтереси: дослідження складних відкритих систем керування спеціального призначення. Захоплення: історія воєнного мистецтва, публікації про історію Росії та України. Адреса: Україна, 61184, Харків, вул. Родникова, 3 кв.45, тел. 40-41-41 (дод.2-13).

Якобсон Євген Володимирович, канд. військових наук, старший викладач Харківського військового університету. Наукові інтереси: дослідження шляхів покращення основних показників бойового застосування зенітних ракетних систем та комплексів. Захоплення: спорт, туризм. Адреса: Україна, 61025, Харків, вул. Клочківська, 154а, кв.29, тел. 40-41-41 (дод.2-13).

метода, основанного на переборе событий, связанных с отказами элементов и проявлением дефектов проектирования.

При разработке моделей учитывались отказы:

а) внутренней структуры ПЛИС;

б) внекристальных средств контроля и реконфигурации;

в) контактов (паечных соединений) ПЛИС и других элементов ЦУПС;

г) из-за проявления абсолютных и относительных дефектов проектирования.

Также были приняты следующие допущения [3]:

— отказы элементов ЦУПС и отказы, обусловленные дефектами проектирования, носят случайный, независимый характер;

—данные, поступающие на входы элементов сравнения и мажоритарных элементов, синхронны;

— ЦУПС не имеет групповых дефектов проектирования;

— к началу работы ЦУПС полностью исправно.

Следует отметить, что наиболее критичным из принятых является допущение о независимости отказов элементов ЦУПС, а именно его внутренних элементов , поскольку по некоторым источникам [4] их отказы могут носить кластерный характер, что, в свою очередь, в некоторых ситуациях приводит к одновременной потере работоспособности нескольких функциональных узлов устройства. Сохранение корректности допущения о независимости возможно благодаря такому программированию структуры ПЛИС, при котором реализуется принцип “максимальной удаленности” в физическом пространстве кристалла, по крайней мере, элементов резервных каналов (ВКО).

Структура с внутренним и внешним дублированием представляет собой ЦУПС, в котором реализовано внешнее и внутреннее дублирование, т.е. внутри каждой из двух ПЛ ИС (А1, А2) расположены по два ВКО, выходы которых соединены с внутренним решающим органом, осуществляющим межканальное сравнение. В случае несовпадения информации на его входах внешнее средство контроля отключит

РИ, 2002, № 4

71

ПЛИС А1 от выхода ЦУПС и подсоединит к выходу канал ПЛИС А2. В этой структуре каждый ВКО выполнен по своей, отличающейся от других, схеме. Таким образом, данная структура представляет собой четырехверсионное ЦУПС. Вероятность его безотказной работы определяется из выражения:

Р =

1 Г1 р2 р р р2 рЗп+2\2

і - (і - р1.1рВРОРАКРп0Рп )

х РСКР

2п+4 п

РпА,

(1)

где Р11 — вероятность безотказной работы ВКО; РВРО —вероятность безотказной работы внутреннего решающего органа; РАК—вероятность безотказной работы аппарата конфигурации ПЛИС; Рп0 — вероятность того, что к моменту времени t относительные ошибки проектирования не проявятся; Рп — вероятность безотказной работы паечного соединения; РСК — вероятность безотказной работы средств контроля. Считаем, что достоверность контроля DCK =1; Рпа — вероятность того, что к моменту времени t абсолютные дефекты проектирования не проявятся; п — разрядность данных.

Вторая структура представляет собой ЦУПС с внутренним мажоритированием и внешним дублированием. В корпусе каждой ПЛИС А1 и А2 расположены три ВКО, выходы которых соединены со входами мажоритарного элемента, с его выхода сигналы через внутренние коммутаторы поступают на выход ЦУПС. Работоспособность каждого резервного канала (А1 или А2) определяют внутренние средства контроля. В ПЛИС А1 и А2 каждый ВКО выполнен по разной схеме, т.е. рассматриваемая структура представляет собой трех-версионное ЦУПС. Вероятность безотказной работы этого ЦУПС определяется из выражения:

P = [Ррк + (1 - Ррк ) • Ррк ] • PnA . (2)

Здесь Ррк — вероятность безотказной работы одного кристалла ПЛИС, равная:

Р =

рк

(Рі.іРпоРП)3 + 3Рі.іРпо)3 х

X рН - Р п) + 3 Рі.іР по)2 Рпп X (і - РиРпо) + 3Р2.іР поР2п(і - Р п)> х Iі - Рі.іР по)] х

X РСКСскрпРАКРМЭPl2n+1, (3)

где Рк—вероятность безотказной работы коммутатора К; РМЭ — вероятность безотказной работы внутреннего мажоритарного элемента; РССК — вероятность безотказной работы внутреннего средства контроля.

3. Исходные данные для исследования

Исследования надежности ЦУПС с версионной избыточностью, структурные схемы которых приведены в [1] (на рис. 3 и 4), проводились по аналитическим моделям при различных значениях

интенсивностей отказа ПЛИС: Хплис (1Л0-7, 1 • 10-8, 1 • 10-9, 1 • 10-10 1/ч), числе разрядов п (1, 4,

8, 16, 32) и времени работы (1 ч, 10 ч, 1 месяц, 1 год, 5 лет),

^CCK = о,оі • ^ПЛИС , ^МЭ = о,ооо5 • ^ПЛИС ,

^ВРО = 0,0002 • ^ПЛИС , ^K = о,оооі • ^ПЛИС ,

DCK = і, ^AK = о>2 • ^ПЛИС , ^ВКО = о>25' ^ПЛИС

При этом сделано допущение о том, что закон распределения времени до отказа элементов ЦУПС — экспоненциальный. Необходимо заметить, что подтверждение экспоненциальности закона распределения времени до отказа для некоторых современ -ных ПЛИС, в частности, микросхем XC1700E/L, XC3000, XC4000 и других фирм XILINX, приведено в [5] по результатам многомесячных испытаний и эксплуатации в период с декабря 1995 г. по сентябрь 1999 г. Что же касается закона распределения времени до проявления дефекта проектирования, то такие данные отсутствуют. В связи с этим возможен следующий вариант выбора их параметров, базирующийся на методике [6].

Если учесть, что моменты проявления этих дефектов зависят только от исходных данных, закон распределения поступления их различных сегментов является равномерным, а устройство функционирует циклически, отрабатывая по одному алгоритму изменяющиеся входные данные, то можно предположить, что вероятность проявления дефектов с течением времени будет расти (оставаясь при этом постоянной в пределах выполнения одного сегмента). Тогда можно сделать следующее предпо -ложение о том, что вероятность отказа на интервале времени не будет зависеть от его расположения на временной оси, а будет зависеть только от его величины. Из этого следует допущение об экспоненциальности распределения времени до проявления дефектов проектирования. Тогда можно говорить о том, что интенсивности отказов ПЛИС ^плис и интенсивности проявления абсолютных ^дпа и относительных ^дпо дефектов проектирования при функционировании устройства (с учетом их постоянства) связаны следующими зависимостями [3]:

^ДП = ^ДПА + ^ДПО = а^ПЛИС > (4)

^ДПА = Р • ^ДП. (5)

Диапазон изменения значений коэффициентов а и Р определяется с учетом того, что доля абсолютных дефектов может достигать 20-30% от общего числа дефектов проектирования, а они, в свою очередь, могут вызывать от 30 до 70% отказов цифровых программируемых систем [3,7]. В связи с этим оценки выполнялись для а в диапазоне 02 (0; 0,5; 1; 2) и Р в диапазоне 0-0,3 (0; 0,1; 0,2; 0,3).

4. Результаты исследований структур ЦУПС с версионной избыточностью

Анализ полученных значений вероятностей безотказной работы рассмотренных структур ЦУПС подтвердил естественные выводы о том, что:

72

РИ, 2002, № 4

a) с ростом числа разрядов ЦУПС вероятность безотказной работы уменьшается из-за увеличения вероятности отказа паечных соединений выводов ПЛИС и других микросхем;

в) с увеличением количества абсолютных и относительных дефектов в разрабатываемых проектах вероятность безотказной работы структур уменьшается.

б) с увеличением продолжительности работы ЦУПС и интенсивности отказов Хппис вероятность безотказной работы уменьшается;

При сравнении надежности двух структур без учета дефектов проектирования (рис. 1,а, 2,а) видно, что вероятность безотказной работы ЦУПС с внутренним и внешним дублированием ниже, чем с

10 0 10 1 10 2 10 3 10 4 t ч.

а

б

2

Рис. 1. График зависимостей изменения вероятностей безотказной работы ЦУПС с внешним и внутренним дублированием при

ХПЛИС = 1 • 10~7 1/ч, n=16: а - а = 0, в = 0 ; б - в = 0,2 ; в - а = 1

внутренним мажоритированием и внешним дублированием. Это объясняется тем, что при внутреннем дублировании, в случае возникновения ошибок из-за отказов аппаратных средств, ВРО с помощью коммутатора К отключает отказавший канал от выхода, а в ЦУПС с внутренним мажоритированием и внешним дублированием ошибки, возникшие в одном канале, “фильтруются” мажоритарным элементом и не поступают на выход. При учете дефектов проектирования, т.е. при а ^ 0, в ^ 0, этот эффект проявляется с большей силой, так как значения вероятностей, учитывающих относительные дефекты в ЦУПС с внутренним и внешним дублированием согласно выражению (1), возводятся в квадрат, а в ЦУПС с внутренним мажоритированием и внешним дублированием последствия таких дефектов “фильтруются” мажоритарным элементом и на выход не проходят (выражение

(3)).

С увеличением числа дефектов проектирования в ВКО, выполненных по разным версиям, снижается вероятность безотказной работы ЦУПС (рис. 1, б и 2, б). Т акая же закономер -ность наблюдается и при увеличении доли абсолютных дефектов проектирования (графики зависимости P(t) при разных в изображены на рис.1,в и 2,в соответственно). На рис.3 (а,б) и 4 (а, б) показаны графики зависимостей изменения относительного выигрыша 5Q в снижении вероятности отказа при использовании мно-говерсионной структуры (Qm) по сравнению с одноверсионной структурой (Q0) того же типа (по числу каналов и конструкции средств контроля и реконфигурации) от времени работы путем 5Q=(Q0 - Qm)/Q0 •

Из их анализа следует, что ЦУПС с внешним и внутренним дублированием очень чувствительны к количеству относительных дефектов проектирования, а показатель 8Q остается практически неизменным в течение года непрерывной работы.

РИ, 2002, № 4

73

В трехверсионной ЦУПС с внутренним мажорити-рованием и внешним дублированием (рис.4) благодаря наличию на выходе мажоритарного элемента значение 5Q остается практически постоянным до моментов времени ti=1600 ч (при в =0,1) и t2=700 ч (при в =0,3), после которых выигрыш надежности по сравнению с одноверсионной системой начинает уменьшаться. Для трехверсионных ЦУПС при фиксированных значениях параметров Хплис , разрядности n и др. увеличение доли абсолютных дефектов (рост в от 0,1 до 0,3) повышает чувствительность показателя 5Q к значению коэффициента а при меньших значениях t. В двухверсионных ЦУПС с внутренним и внешним дублированием выигрыш в надежности по отношению к одноверсионным структурам зависит только от коэффициентов а и в и практически не зависит от времени. Отметим, что при большем количестве относительных дефектов проектирования (рост а при фиксированном в ) наблюдается больший выигрыш надежности независимо от структуры ЦУПС.

Следует подчеркнуть, что в приведенных расчетах не учитывается усложнение схем сравнения и мажори-тирования при использовании нескольких версий, связанное с принципиально асинхронным характером работы каналов и необходимостью введения дополнительных средств фиксации выходных данных по специальным логическим меткам, идентифицирующим состояния разных версий, эквивалентных с точки зрения результатов функционирования. При увеличении коэффициента в , т.е. с ростом доли абсолютных дефектов, может оказаться, что эффект, получаемый от версионной избыточности, компенсируется потерями из-за снижения безотказности вследствие введения таких дополнительных средств.

5. Выводы. Направления дальнейших исследований

1. Для систем управления реального времени с повышенными требованиями к надежности и безопасности функционирования использование диверсности процессов разработки и реализации резервных каналов цифровых устройств на ПЛИС является одним из важных (а на этапе применения для необслуживаемых систем, пожалуй, единственным) методов снижения рисков, обусловленных на-

личием невыявленных при тестировании и отладке дефектов проектирования [8]. Особенности современных ПЛИС фирм Altera, Xilinx и др. и инструментальных средств, поддерживающих их разработки, таковы, что внесение версионной избыточности является для них естественным процессом вследствие разнообразия стандартных языков и моделей ввода проектов в кристалл, а также разно-

10

10

10

10

10 '

t, ч

Рис. 2. График зависимостей изменения вероятностей безотказной работы ЦУПС с внутренним мажоритированием и внешним дублированием при 7ПЛИС = 1 • 10~71/ч, n=16 : а — а = 0, в = 0 ; б — в = 0,2;

в - а = 1

а

74

РИ, 2002, № 4

Рис. 3. График зависимостей относительного выигрыша надежности ЦУПС с внешним и внутренним дублированием при \ПШС = 1 • 10~71/ч, n=16: а - р = 0,1; б - в = 0,3

образия возможных способов и приемов тестирования.

2. В представленной многоверсионной технологии разработки ЦУПС [1] используются указанные виды диверсности моделей ввода и способов тестирования проекта. Необходимо подчеркнуть, что:

во-первых, применение элементов МВТ только на этапе разработки и тестирования однозначно повышает надежность проекта (даже при одноверсион-ной реализации ЦУПС), поскольку снижает число необнаруженных дефектов проектирования из-за их “перекрестного” выявления в разных моделях и при использовании разных тестов. Окончательное решение о целесообразности применения МВТ на данном этапе принимается с учетом возможных ограничений на стоимость проекта. При этом следует учитывать возможность частичной компенсации дополнительных затрат на разработку различных моделей проекта интенсификацией процесса параллельного выявления дефектов проектирования на завершающих стадиях тестирования;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

во-вторых, вывод о целесообразности распространения МВТ на этап эксплуатации ЦУПС должен

базироваться на тщательных срав-нительних оценках надежности одно - и многоверсионных структур с учетом особенностей их реализации, показанных на примере дублированных и мажоритарных схем резервирования. Возможны также дополнительные затраты (по сравнению с одноверсионными ЦУПС), связанные с удорожанием сопровождения системы.

3. Исследования, проведенные с помощью аналитических моделей, позволили оценить степень влияния на надежность структур числа разрядов, времени работы, интенсивности отказов ПЛИС, наличия паечных соединений, уровня относительных и абсолютных дефектов проектирования. Для повышения точности оценок необходимо провести дополнительные исследования, направленные на моделирование процесса проявления различных типов дефектов проектирования ЦУПС и идентификации законов распреде -ления случайных величин и их параметров.

4. Уменьшить количество и влияние относительных дефектов проектирования можно двумя способами:

а) увеличением времени и качества тестирования в целях полного выявления и устранения таких дефектов;

б) введением многоверсионности. Расширить спектр видов диверсности возможно с помощью различных

языков создания проектов (AHDL, VHDL, Verilog и др.) и проектировочных команд. Кроме того, при определенных условиях может быть применена диверсность спецификаций проекта.

Уменьшить количество абсолютных дефектов проектирования возможно, применяя различные инструментальные средства получения конфигурационных файлов, а также выполняя резервные каналы на ПЛИС разных фирм-изготовителей.

5. Выбор варианта структуры из множества типовых одно- и многоверсионных отказоустойчивых структур, приведенных в данной работе, а также описанных в [6,8], для конкретного приложения зависит от требуемой надежности, конкретных условий эксплуатации, ограничений, накладываемых массо-габаритными показателями, энергопотреблением^ времени, отведенного на разработку и тестирование, и стоимости. Применение многоверсионности в ЦУПС увеличивает его надежность при одновременном существенном росте затрат на проектирование.

6. Некоторые из выводов данной работы, касающиеся особенностей реализации, объема и границ целесообразного применения многоверсионной тех-

РИ, 2002, № 4

75

ЦУПС с внутренним мажоритированием и внешним дублированием при ХПЛИС = 1 • 10~7 1/ч, n=16: а - р = 0,1; б - р = 0,3

нологии создания ЦУПС, получили экспериментальное подтверждение при создании бортовой аппаратуры систем управления реального времени. Дальнейшая экспериментальная отработка МВТ должна быть связана с:

— тщательным сбором и анализом статистики дефектов, выявляемых при тестировании различных версий проекта;

— детальной классификацией причин дефектов и разработкой методов и средств их устранения при проектировании и тестировании ЦУПС;

— идентификацией законов распределения случайных величин, описывающих процесс проявления обнаруженных при тестировании ЦУПС, и их использованием по назначению;

—разработкой модели стоимости мно-говерсионных проектов и методик выбора оптимальных технологий создания и структур ЦУПС по критерию “надежность/стоимость” с учетом других ограничений.

Таким образом, необходима постановка и решение комплексной задачи разработки (выбора) оптимального проекта, объединяющего “процесс” - создание цифровой системы на ПЛИС и “продукт” — собственно ЦУПС.

Литература: 1.Харченко В.С., Тарасенко

B. В. Технология разработки отказоустойчивых цифровых устройств на ПЛИС с использованием диверсных моделей ввода и тестирования проектов // Радиоэлектроника и информатика. 2002. №3.

C. 71-74. 2. Kharchenko VS., Tarasenko V.V. Multiversion Design Technologies of On-board Fault-tolerant FPGA Devices // Proceedings of MAPLD Conference, 13-15 September, 2001, Maryland, USA, http: // klabc.org. 3. Харченко В. С. Модели и свойства многоальтернативных отказоустойчивых систем // Автоматика и телемеханика. 1992. №12. С.82 - 91. 4. Бернар Куртуп, Марко Медзалама. Отказоустойчивость в СбИС // ТИИ-ЭР.1986. Т.74, №5. С.4-6. 5. XILINX. Quality Assurance and Reliability, 2000, February 1 (V 3.0), Р.9.1-9.10. 6. Харченко В. С., Скляр В.В. Моделирование и оценка безотказности необслуживаемых компьютерных систем управления с многоверсионными программными средствами // Электронное моделирование. 2001. №4. С.69-81. 7. Харченко В. С. Теоретические основы дефектоустойчивых цифровых систем с версионной избыточностью. Харьков: МО Украины, 1996. 503 с. 8. Kharchenko V. S. Multiversion Information Technologies

and Reliable Projects // Материалы международной НТК “Автоматика - 2001”, 10—14 сентября 2001. Одесса, Т. 2. С.135-136.

Поступила в редколлегию 15.02.2002

Рецензент: д-р техн. наук, проф.Фурман И.А.

Харченко Вячеслав Сергеевич, д-р техн. наук, профессор, заведующий кафедрой компьютерных систем летательных аппаратов Национального Аэрокосмического университета им. Н.Е. Жуковского, заслуженный изобретатель Украины. Научные интересы: надежность, живучесть и безопасность критических компьютерных систем и технологий. Адрес: Украина, 61070, Харьков, ул. Чкалова, 17, тел (0572) 44-25-14, 44-23-56.

Тарасенко Виталий Владимирович, начальник сектора Национального Аэрокосмического университета им. Н.Е. Жуковского. Научные интересы: отказоустойчивые цифровые устройства на ПЛИС. Адрес: Украина, 61070, Харьков-70, ул. Рудика,1, тел. (0572) 44-78-64.

76

РИ, 2002, № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.