Научная статья на тему 'Анализ показателей надежности и сложности реализации различных вариантов структур автомата с памятью при потоке мягких отказов'

Анализ показателей надежности и сложности реализации различных вариантов структур автомата с памятью при потоке мягких отказов Текст научной статьи по специальности «Математика»

CC BY
147
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
АВТОМАТ С ПАМЯТЬЮ / КОМБИНАЦИОННАЯ СХЕМА / АНАЛИЗ НАДЕЖНОСТИ / RELIABILITY ANALYSIS / ОЦЕНКА СЛОЖНОСТИ АППАРАТНОЙ РЕАЛИЗАЦИИ / HARDWARE COMPLEXITY ESTIMATION / СИНХРОНИЗАЦИЯ / SYNCHRONIZATION / МЯГКИЕ ОТКАЗЫ / SOFT FAILURES / СТРУКТУРНОЕ РЕЗЕРВИРОВАНИЕ / STRUCTURAL REDUNDANCY / ВОССТАНАВЛИВАЕМЫЕ СИСТЕМЫ / ВЕРОЯТНОСТЬ БЕЗОТКАЗНОЙ РАБОТЫ / FINITE STATE MACHINE / COMBINATIONAL CIRCUIT / RECOVERABLE SYSTEM / RELIABILITY FUNCTION

Аннотация научной статьи по математике, автор научной работы — Егоров Игорь Валерьевич, Мелехин Виктор Федорович

Постановка проблемы: снижение проектной нормы в производстве полупроводниковых структур повышает чувствительность вычислительной техники к попаданию частиц высоких энергий (в частности, при работе в условиях радиации). Основное их влияние выражается в возникновении «мягких» отказов искажений информации при сохранении работоспособности аппаратуры. Борьба с мягкими отказами требует разработки новых схемотехнических решений в системах со структурным резервированием, таких как конечные автоматы. Цель: оценка надежности и структурной сложности известных реализаций блоков с аппаратным резервированием при потоке мягких (информационных) отказов. Результаты: анализ различных реализаций блоков типа «автомат Мура» со структурным резервированием при потоке мягких отказов показал, что структурное резервирование памяти состояний автомата и внедрение механизмов самовосстановления данных в памяти позволяет качественно повысить продолжительность безотказной работы без увеличения сложности реализации по сравнению с невосстанавливаемыми структурами. Это объясняется тем, что в случае мягкого отказа элемент памяти остается работоспособным, и корректное состояние системы может быть полностью восстановлено путем перезаписи поврежденного бита по окончании периода восстановления. Невосстанавливаемый отказ происходит только в том случае, если в течение периода восстановления одновременно в нескольких экземплярах резервированного элемента памяти произошло искажение данных. Если при проектировании системы удается обеспечить достаточно малый период восстановления, то возникновение этого события становится крайне маловероятным, что дает возможность многократно увеличить время безотказной работы устройства. Практическая значимость: полученные результаты позволяют определить направление разработки схемотехнических решений для конечного автомата, устойчивого к мягким отказам: блокирование распространения отказа в памяти состояний, периодическое восстановление искаженных бит памяти состояний и внедрение аппаратных средств для регистрации произошедших отказов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of Reliability and Structural Complexity for Various Implementations of a Finite State Machine Resistant to Soft Failures

Introduction: Up-to-date design rules used in computer engineering make hardware unreliable when working under radiation. A hit of a charged particle causes a “soft failure” a situation when hardware elements remain in usable condition but the information transmitted or stored in the memory is corrupted. We need to develop new circuitry solutions which would increase the resistance of hardware (especially finite states machines) to soft failures. Purpose: The estimation of reliability characteristics for various redundant structures of a Moore automaton in case of a flow of soft failures. Results: The comparison between the known Moore automaton prototypes has shown that redundant internal memory and self-recovery of corrupted data in the memory allow us to significantly increase the duration of trouble-free functioning, without making the implementation more sophisticated as compared to non-recoverable structures. In case of a soft failure, a memory bit remains functional, and the valid state of the system can be restored by overwriting the corrupted bit with a valid one when the recovery is over. An unrecoverable failure can occur only if several instances of redundant units of the memory are corrupted simultaneously during a singe recovery period. If we manage to ensure a sufficiently small recovery period in the system, it will dramatically prolong its non-failure operating time. Practical relevance: The obtained results allow you to determine the ways of developing fault-tolerant finite state machines resistant to soft failures: blocking the propagation of a soft failure in the memory, periodic self-recovery of corrupted bits, and introducing additional hardware to detect and register failures.

Текст научной работы на тему «Анализ показателей надежности и сложности реализации различных вариантов структур автомата с памятью при потоке мягких отказов»

ИНФОРМАЦИОННО-УПРАВЛЯЮЩИЕ СИСТЕМЫ ^

УДК 681.3

с1ок10.15217/155п1684-8853.2017.3.34

АНАЛИЗ ПОКАЗАТЕЛЕЙ НАДЕЖНОСТИ И СЛОЖНОСТИ РЕАЛИЗАЦИИ РАЗЛИЧНЫХ ВАРИАНТОВ СТРУКТУР АВТОМАТА С ПАМЯТЬЮ ПРИ ПОТОКЕ МЯГКИХ ОТКАЗОВ

И. В. Егорова, аспирант

В. Ф. Мелехина, доктор техн. наук, профессор

аСанкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, РФ

Постановка проблемы: снижение проектной нормы в производстве полупроводниковых структур повышает чувствительность вычислительной техники к попаданию частиц высоких энергий (в частности, при работе в условиях радиации). Основное их влияние выражается в возникновении «мягких» отказов — искажений информации при сохранении работоспособности аппаратуры. Борьба с мягкими отказами требует разработки новых схемотехнических решений в системах со структурным резервированием, таких как конечные автоматы. Цель: оценка надежности и структурной сложности известных реализаций блоков с аппаратным резервированием при потоке мягких (информационных) отказов. Результаты: анализ различных реализаций блоков типа «автомат Мура» со структурным резервированием при потоке мягких отказов показал, что структурное резервирование памяти состояний автомата и внедрение механизмов самовосстановления данных в памяти позволяет качественно повысить продолжительность безотказной работы без увеличения сложности реализации по сравнению с невосстанавливаемыми структурами. Это объясняется тем, что в случае мягкого отказа элемент памяти остается работоспособным, и корректное состояние системы может быть полностью восстановлено путем перезаписи поврежденного бита по окончании периода восстановления. Невосстанавливаемый отказ происходит только в том случае, если в течение периода восстановления одновременно в нескольких экземплярах резервированного элемента памяти произошло искажение данных. Если при проектировании системы удается обеспечить достаточно малый период восстановления, то возникновение этого события становится крайне маловероятным, что дает возможность многократно увеличить время безотказной работы устройства. Практическая значимость: полученные результаты позволяют определить направление разработки схемотехнических решений для конечного автомата, устойчивого к мягким отказам: блокирование распространения отказа в памяти состояний, периодическое восстановление искаженных бит памяти состояний и внедрение аппаратных средств для регистрации произошедших отказов.

Ключевые слова — автомат с памятью, комбинационная схема, анализ надежности, оценка сложности аппаратной реализации, синхронизация, мягкие отказы, структурное резервирование, восстанавливаемые системы, вероятность безотказной работы.

Введение

Под восстанавливаемыми системами будем понимать системы со структурным резервированием, информационной и временной избыточностью, подверженные потоку мягких отказов, вызванных воздействием радиации на полупроводниковые структуры элементов, в которых параллельно с выполнением программы организованы процессы периодического восстановления информации в экземплярах блоков, в которых возник мягкий отказ.

В работе [1] рассмотрены общие концептуальные представления о восстанавливаемых системах, подверженных потоку мягких отказов, и подходы к функционально-логическому проектированию подобных систем; определен ряд вопросов, требующих отдельного исследования.

Один из таких вопросов — это изучение влияния на надежность блока, соответствующего автомату с памятью, ложных импульсов, возникающих при действии радиации, в комбинационных схемах и в триггерах автомата, а также обоснование требований к функциональной организации таких блоков со структурным резер-

вированием и периодическим восстановлением экземпляров с мягким отказом.

Для обоснования наиболее целесообразного способа введения структурной избыточности проводится анализ распространения ложных сигналов, вызванных воздействием частиц высокой энергии на полупроводниковую структуру транзистора, по схеме автомата с резервированием и мажорированием. В работах [2, 3] рассмотрены процессы возникновения мягких отказов под действием радиации в логических элементах и триггерах. Установлена функциональная связь эффектов в полупроводниковых структурах транзисторов от попадания частиц высокой энергии с возникновением мягких отказов в цифровом устройстве. Рассматриваются полупроводниковые структуры и схемотехника элементов, выполненных по наиболее распространенной в настоящее время технологии КМОП (CMOS Fabrication) [4]. Полученные зависимости [3] являются базой для установления функциональных зависимостей между потоком событий в виде ложных импульсов на выходе вентиля (логического элемента) и характеристиками потока мягких отказов в автомате. Это выполнено в на-

стоящей работе. Полученные зависимости используются для сравнительного анализа вариантов структур автоматов со структурной избыточностью. При этом в качестве определяющих для принятия решения о выборе варианта структуры приняты два показателя: вероятность возникновения мягкого отказа в автомате; сложность реализации автомата.

Наиболее общим представлением устройства типа автомата с памятью является модель абстрактного автомата [4]. По этой модели можно точно определить число триггеров, требуемых для реализации памяти, а также число логических переменных на входе и выходе. Для отдельных триггеров получены [3] точные оценки для вероятности возникновения мягкого отказа и для сложности реализации (число транзисторов). Для комбинационных схем автомата по этой модели получить точные оценки не представляется возможным, но можно использовать известные асимптотические оценки сложности и глубины распространения сигналов [5]. Использование этих оценок и результатов, полученных в работах [2, 3], позволяет проводить сравнительный анализ структур и обосновать предлагаемые в работе решения.

Выбор типа абстрактного конечного автомата и его структурного представления для анализа

Модель абстрактного конечного автомата 5 представляется математической структурой: 5 = <А, В, И, 5, X, Т0>, где:

А — множество состояний входа (входной алфавит);

В — множество состояний выхода (выходной алфавит);

И — множество внутренних состояний;

5 — функция переходов;

X — функция выходов;

г0 е И — начальное состояние, в которое автомат приводится сигналом начальной установки.

В проектировании цифровых устройств используются три типа абстрактных конечных автоматов: автоматы Мили, Мура и Медведева [4]. Все три типа автоматов могут представить любой алгоритм. Для всех трех типов автоматов функция переходов имеет одинаковое теоретико-множественное представление: 5: Ах И^И. Типы автоматов различаются представлением функции выхода X:

— для автомата Мили X: А х И ^ В;

— для автомата Мура X: И ^ В;

— для автомата Медведева X: В = И.

Как средства формализованного представления алгоритма эти модели равномощны: для каждого автомата одного типа можно построить

эквивалентный автомат другого типа. С точки зрения реализации на электронных схемах типы автоматов имеют различия в двух отношениях: по качеству выходных сигналов; по затратам триггеров на память автомата.

Наилучшее качество выходных сигналов имеет автомат Медведева. В этих автоматах значение выходного сигнала устанавливается сразу после переключения триггера синхронно с фронтом либо спадом тактового импульса и сохраняется в течение всего такта. Этот тип автоматов получает распространение в последнее время в связи с применением в СБИС встраиваемых средств тестирования, использующих метод последовательного сканирования и вывода выходных сигналов всех автоматов [4].

В автоматах Мура качество выходных сигналов несколько хуже, так как при их формировании выходные сигналы триггеров подвергаются некоторым функциональным преобразованиям, соответствующим функциям выходов X. Но следует отметить, что глубина распространения сигналов в соответствующей комбинационной схеме невелика, поэтому переходные процессы распространения сигналов быстро завершаются в начале такта после переключения триггеров.

В автоматах Мили качество выходных сигналов хуже, чем в других типах автоматов. Это связано с тем, что при их формировании глубина распространения сигналов по сети элементов наиболее велика. Она включает процессы во внешней схеме, формирующей входные сигналы автомата, переключение триггеров и процессы в схеме, реализующей функции выходов X. Эта схема имеет существенно большую сложность и глубину распространения сигналов в сравнении с автоматом Мура. У функций выхода автомата Мили больше число аргументов, как это видно из приведенного выше теоретико-множественного представления функций X для разных типов автоматов. В связи с этим выходные сигналы в автомате Мили устанавливаются только в конце такта.

По затратам триггеров минимальное число имеет автомат Мили, максимальное — автомат Медведева. Таким образом, с точки зрения рассмотренных показателей автомат Мура дает компромиссное решение. Следует отметить, что автоматы Мура чаще всего и применяются при проектировании цифровой аппаратуры.

Рассмотрим структурную схему автомата Мура (рис. 1) и алгебраическую модель описания его работы. Обычно при разработке алгоритма работы блока, входящего в структуру вычислительной системы, известны входные и выходные переменные блока, представляющие собой векторы двоичных переменных X[m:1] = (х1, х2, ..., хт), Y[n:1] = (уг, у2, ..., уп). Множества состояний входа (А) и выхода (В) соответствуют множеству

СНУ

П

X-

Ds

КС1 D R D1 C TT

s

*>R

\C

TT,

Q

КС2

-v—Y

Рис. 1. Структурная схема автомата Мура

значений этих векторов: A = {X[m:1]}, B = {Y[n:1]}. Множество внутренних состояний R определяется в процессе построения модели абстрактного автомата. Поэтому мощность этого множества RI можно считать известной. Обычно используется двоичное кодирование состояний [4]. Количество разрядов s кода состояний Q[s:1] = (qp q2, ..., qs) (и, соответственно, триггеров в памяти автомата) определяется как s = ]log2 IRI [. Если 2s > IRI, то для «лишних» состояний доопределяется функция переходов безусловными переходами из этих состояний в начальное состояние r0 (Q[s:1] = (0...0)).

Поскольку представление структурной схемы автомата нам требуется для получения оценок сложности реализации блоков (КС1, КС2, П) и их влияния на возникновение мягких отказов, то в структуре на рис. 1 использовано представление входных, выходных и внутренних переменных в виде приведенных выше векторов. Комбинационная схема КС1 реализует функцию переходов 5, КС2 реализует функцию выходов X. Для реализации блока памяти П автомата использованы триггеры типа D, синхронизируемые спадом синхроимпульса C. Это один из наиболее распространенных типов триггера. Именно для него рассмотрены процессы, вызванные воздействием частиц высокой энергии на транзисторы схемы, и получены соответствующие оценки вероятностей отказа [3]. СНУ — сигнал начальной установки. Связи между блоками соответствуют функциям в автомате Мура: 5: {X} х {Q} ^ {Q}; X: {Q} ^ {у}.

В электронных схемах, реализующих блоки автомата, существуют задержки распространения сигналов. Обозначим задержку в КС1 — х1; в КС2 — т2, в П — т. В математической модели конечного автомата приняты допущения: т1 = т2 = 0. Интервал между смежными переключениями памяти х называют тактом. Работа автомата рассматривается в дискретном времени t = t'/x = 0, 1, 2, ... ; t' — непрерывное физическое время.

Разработчик алгоритма разбивает решение задачи на шаги. Для связи между шагами используются причинно-следственные отношения. Говорят, что алгоритмист пользуется логическим временем. Выполнению одного шага алгоритма соответствует такт работы автомата.

Электронная схема, реализующая автомат, работает в реальном физическом времени. В синхронных автоматах для согласования дискретного времени автомата (логического времени алгоритмиста) с физическим временем используется внешний генератор тактовых импульсов С. Предполагается, что выбор длительности такта т производится с условием, что все переходные процессы изменения сигналов при их распространении по цепи элементов завершаются за время, меньшее т. При использовании дискретного времени функции переходов и выходов представляют в алгебраической форме: Qt + 1 = 5(ф4, X4); У1 = ^(Я1), где индекс 4 соответствует текущему такту дискретного времени, а 4 + 1 — следующему такту.

Представим функции, реализуемые комбинационными схемами: — для КС1:

D1 = fl(xl, ..., xm, ...,

Ds = fs(xv ..., хт, qv ..., qs); — для КС2:

yi = 9i(qi> .-> qs);

(1)

yn = (Vn(qv ..., qs).

(2)

Итак, для блока структуры вычислительной системы, представленного абстрактным автоматом Мура, известны:

m, n — число входных и выходных двоичных переменных соответственно;

s — число триггеров в памяти автомата; число функций ф;, реализуемых КС1 и КС2 соответственно, и число аргументов этих функций.

Используя эти параметры, можно получить оценки сложности реализации блоков, глубины распространения сигналов и вероятностей возникновения мягких отказов.

Оценки сложности реализации и вероятностей возникновения мягких отказов в нерезервированной схеме конечного автомата Мура

Будем рассматривать оценки следующих показателей для автомата Мура (см. рис. 1):

— сложности реализации блоков (size complexity): СКС1 — комбинационной схемы КС1; СКС2 — комбинационной схемы КС2; СП — блока памяти (сложность выражена в числе логических элементов, л. э.);

— глубины распространения сигналов (depth complexity): DKC1 — в КС1; DKC2 — в КС2;

q

s

т

s

q

1

s

1

C

— вероятности событий: Р

л.с.КС1

— возникно-

вения ложного сигнала на выходе КС1; Рл с КС2 — ложного сигнала на выходе КС2; Рм.оП — мягкого отказа, связанного с изменением состояния памяти автомата.

Показатели сложности реализации необходимы при сравнительном анализе вариантов структурного резервирования, необходимы они и при расчетах вероятности отказов: чем выше сложность, тем больше транзисторов в схеме, тем больше потенциальных источников ложных сигналов.

Глубина распространения сигналов влияет не только на быстродействие, но и на работоспособность, поскольку вероятность распространения ложного сигнала до выхода схемы зависит от места его возникновения.

Из рис. 1 видно, что ложные сигналы на выходах КС2 не могут повлиять на состояние памяти автомата, а значит, не могут вызвать мягкий отказ. Но следует учесть, что автомат является блоком структуры системы, и выходы КС2 автомата могут быть связаны с входами других автоматов. Поэтому оценки для КС2 также необходимы.

Основной задачей получения оценок приведенных показателей является определение доли влияния памяти и комбинационных схем автомата на возникновение мягких отказов. Наиболее точно и содержательно это можно рассмотреть на конкретном примере, а затем мы обобщим полученные оценки и выводы на общий случай.

В качестве примера рассмотрим конечный автомат Мура средней сложности со следующими параметрами: число входов т = 4, число выходов п = 4, число внутренних состояний |д| = 8 (рис. 2, а). Граф переходов автомата приведен на рис. 2, б. Следует заметить, что хотя число входных переменных т может быть большим, условия перехода из одного состояния в другое зависят не от всех переменных х. Это связано с психологией разработчика алгоритмов. Доказано, что число альтернатив, рассматриваемых на отдельном шаге, не превышает 7+2.

Для реализации приведенного автомата потребуются 3 триггера, а функции КС1 и КС2 имеют следующий вид: = /Д^, q2, #3, х1, х2, х3, х4), 1 = 1, 2, 3; у = ф/д 1, #2, <?зА } = 1, 2, 3, 4.

Оценим для блока памяти сложность реализации СП и вероятность мягкого отказа из-за попадания частицы в транзисторы триггеров Рм.о.П, используя результаты для триггера, полученные в работе [3] (Стр = 10 л. э., Ртр = 5Рпчт, число триггеров в памяти в = 3):

СП ~ Стр :

3 = 30 л. э.;

Рм.о.П _ 3Ртр _ 15Рп.ч.т,

где Рпчт — вероятность попадания частицы в транзистор.

Для получения оценок соответствующих показателей КС1 и КС2 необходимо выполнить их синтез. Учитывая цели, поставленные в данной работе, можно ограничиться синтезом одной из функций в каждой группе, например Б1 и у1.

Выполним экономичное кодирование внутренних состояний автомата, используя один из известных эвристических алгоритмов. При этом, учитывая, что автомат инициальный, начальному состоянию дадим код г0 = (#3, #2, = (0, 0, 0). В это состояние автомат приводится по СНУ. Для остальных состояний в соответствии с алгоритмом получим: г1 = (1, 1, 1), г2 = (1, 1, 0), г3 = (0, 0, 1), Г4 = (1, 0, 1), г5 = (1, 0, 0), г6 = (0, 1, 0), Г7 = (0, 1, 1).

С использованием результатов кодирования и графа переходов на рис. 2, б определим функцию Б1 = /1(#1, #2, #3, х1, х2, х3, х4) в дизъюнктивно-нормальной форме и после минимизации и факторизации представим ее в скобочной форме:

= А(Ч\' #2' #3' х1> х2' х3' х4 ) = х1х2хзЯ.зЯ.2<11 + +х2хзЧзЧ2Ч\ + х4ЯзШ\ + х2хзЧзЧ2Ч\ + х\ЧзЧ2Ч\ = = ?2 (х2хзЧ\ (х1Чз + Чз) + х\ЧзЧ\) + +?2?1 (Х2ХЗЯ.З + х4йЗ )■

СНУ

б)

У2 + У3 У4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

С

Рис. 2. Пример автомата Мура: а — представление в виде черного ящика; б — граф переходов

У

1

1 1

1 г 8

х^ -

«2-х2 х3 «1-«3-«3-

х1

«3Н

Б

Рис. 3. Пример схемы, реализующей функцию Б1

х

4

«

3

х

3

«

3

1

По графу переходов определим функцию выхода

У\ =Ф1(?1' ?2' ?3) = ?3?2?1 +53^251 =?2?1 =?2 1.

Синтезируем схему реализации функции в базисе элементов КМОП: 2И-НЕ, 2ИЛИ-НЕ и НЕ. Воспользуемся результатами анализа влияния на эти элементы частиц высокой энергии [3]. Для синтеза функции, представленной в скобочной форме, на заданном элементном базисе воспользуемся алгоритмом, использующим представление типов функций арифметическими полиномами [7]. Синтезированная схема (рис. 3) содержит 18 логических элементов, включая три инвертора, и имеет глубину распространения сигнала Б = 8.

Реализация функции у1 тривиальна, для получения сигнала на одном выходе КС2 требуется один логический элемент 2ИЛИ-НЕ.

Произведем оценку вероятности Р

л.с.КС1,1

воз-

никновения ложного сигнала на первом выходе комбинационной схемы КС1, приведенной на рис. 3. Вероятность возникновения ложного сигнала на выходе инвертора и двухвходового логического элемента равна вероятности попадания частицы высокой энергии в один транзистор Рп ч т [3]. Вероятность появления ложного сигнала на выходе двухвходового элемента при поступлении ложного сигнала на его вход равна А. Поэтому вероятность Р1 появления на выходе комбинационной схемы ложного сигнала, возникшего из-за попадания в ¿-й элемент частицы высокой энер-

гии, зависит от числа ^ элементов цепи от выхода ¿-го элемента до выхода схемы. Так, для элемента 1 = 1 на рис. 3 k¿ = 5, соответственно, получим Р1 = 2-5Рпчт. Поэтому

18

рл.с.кс1,1 =Х р; = Рп.ч.т (2"5 + 2"5 + 2"3 + 2"7 +

1=1

+2"3 + 2"4 + 2"6 + 2"4 + 2"2 + 2"3 + 2"5 + 2"4 + +2"2 + 2"3 + 2"2 + 2"1 + 2"1 +1) и 3,4 Рп.ч.т- (3)

Полагая примерно одинаковыми по сложности схемы, формирующие сигналы на всех трех выходах КС1, для вероятности возникновения ложного сигнала хотя бы на одном выходе схемы КС1 получим:

— Рл.с.КС1 = 3 х Рл.с.КС1,1 = 10,2 Х Рп.ч.т;

— сложность схемы СКС1 = 3х 18 = 54 л. э.;

— глубина распространения сигналов БКС1 = 8.

Рассмотрим соответствующие показатели для

схемы КС2.

Учитывая, что для реализации функции У\ = #2 + требуется один элемент 2ИЛИ-НЕ, для вероятности возникновения ложного сигнала на первом выходе комбинационной схемы КС2, соответственно, получим:

— Р

= Р •

,1 п.ч.т'

л.с.КС2

— вероятность появления ложного сигнала хотя бы на одном выходе схемы КС2 Рл с КС2 =

= пРл.с.КС2,1 = 4Рп.ч.т;

— сложность СКС2 = 4 л. э.;

— глубина распространения сигналов

DКС2 = 1.

Рассмотрим обобщенные оценки сложности реализации, глубины распространения сигналов и вероятности появления ложных сигналов на выходе комбинационной схемы КС1 рассматриваемого примера по числу п аргументов функции D1 = f1(q1, q2, #3, х1, х2, х3, х4) без выполнения синтеза схемы и сравним их с полученными выше точными оценками.

В работе [5] доказаны теоремы, утверждающие, что для большинства комбинационных схем, реализующих логическую функцию от п переменных в базисе О. = (И-ИЛИ-НЕ), справедливы оценки:

— для сложности реализации 2п 2п

—(1 + е) >Са (/) > — (1 -е) -2га2, при п > 5 спра-п п

ведлива оценка

са (/) —;

п

(4)

— для глубины распространения DQ(f) < п.

Соответственно, для функции D1 получим

27

(.С^) = — = 18,28. Это хорошо согласуется с известным количеством элементов, равным 18.

DQ(D1) = 7. Это тоже хорошо согласуется с точной оценкой D(D1) = 8.

Для вероятности возникновения ложного сигнала на выходе схемы, вызванного попаданием частицы высокой энергии в транзистор, обобщенные оценки отсутствуют. Рассмотрим получение такой оценки, опираясь на те рассуждения, которые использовали выше для примера рис. 3. Было показано, что наибольший вклад в вероятность появления ложного сигнала на выходе у1 вносит последний элемент (корень дерева) и связанные с ним два элемента. Опираясь на приведенные выше рассуждения, рассмотрим два частных случая комбинационных схем, для которых легко получить обобщенную оценку и которые являются предельными случаями возможных реализаций схемы и поэтому позволяют получить верхнюю и нижнюю оценку вероятности в общем случае.

Первый случай соответствует графу «бинарное дерево» (рис. 4).

Оценим величину Рб д, соответствующую вероятности возникновения ложного сигнала на его выходе. Сгруппируем элементы по столбцам, так как у элементов каждого столбца одинаковая глубина распространения сигнала (число элементов ^ в трассе прохождения сигнала с выхода ¿-го элемента до выхода схемы). Вероятность возникновения ложного сигнала в отдельном элементе — Рп ч т. Для элементов каждого столбца опре-

Рис. 4. Комбинационная схема, соответствующая графу «бинарное дерево»

делим вероятность прохождения Рпр1 возникшего ложного сигнала на выход схемы. Для нулевого столбца (корневой вершины дерева, элемента 15) Рпр0 = 1. Для первого столбца (элементы 13 и 14) трасса прохождения ложного импульса содержит

-ь 1

один элемент = 1. Поэтому Рпр1 = 2 1 = —. Но

элементов в 1-м столбце два, поэтому вероятность появления ложного сигнала на выходе схемы из-за попадания частицы в один из элементов 1-го столбца Р1 = 2х йхРпчт=Рпчт. Аналогичный результат получим для 2-го и 3-го столбцов. Особенностью схемы с графом бинарного дерева является то, что каждый столбец вызывает появление ложного сигнала на выходе схемы с вероятностью Рп ч т. Число столбцов совпадает с глубиной распространения сигналов в бинарном дереве

-Об.д. Для рис. 4 имеем Рб.д = ^д х Рп.ч.т = 4Рп.ч.т.

Сложность схемы рис. 4 Сб д = 2^б д -1 и 2^б д.

Реальная схема (см. рис. 3) отличается от бинарного дерева, начиная с 3-го уровня элементов по удаленности от выхода D1. Большинство элементов произвольной схемы примерно такой же сложности удалены от корневой вершины дальше, чем в бинарном дереве.

Вероятность возникновения ложного сигнала на выходе комбинационной схемы, реализующей логическую функцию fn от п переменных, можно представить в виде РКС(^ = &(п)Рпчл,. Примерную верхнюю оценку £в(п) для коэффициента £ в выражении для вероятности РКС(^ можно получить следующим образом.

Будем использовать оценку сложности реализации функции fn (4). Рассмотрим бинарное де-

Рис. 5. Комбинационная схема типа цепи логических элементов

рево такой же сложности Сбд = С(/п). Определим глубину распространения сигналов в эквивалентном бинарном дереве Ббд:

Бб.д = 1о§2Сб.д = !°ё2С(/п) = П - 1о§2П.

Соответственно, для коэффициента &в(п), округляя в меньшую сторону, получим £в(п) = [п -- ^п].

Для получения нижней оценки £н(п) рассмотрим второй предельный случай построения схемы — цепь элементов (рис. 5).

Вероятность возникновения ложного сигнала на выходе схемы в виде цепи из пяти элементов

Рл.с.ц(5) =Рп.ч.т(1 + 1/2 + 1/4 + 1/8 + 1/16) * - 1,94 Рп.ч.т.

Обобщая для цепи, состоящей из п элементов, получим

п 2

k=l'

Таким образом, кн(п) является суммой первых п членов бесконечно убывающей геометрической прогрессии с первым членом, равным 1, и знаменателем, равным 1/2:

1 -

(п) = -

- = 2--

1 -

Обобщенная оценка вероятности возникновения ложного сигнала, вызванного попаданием частицы высокой энергии в транзистор, на выходе схемы, реализующей функцию от n переменных:

[п - log2 ч т > Рл.с (/„) > 2 — 1

Для рассмотренного выше примера комбинационной схемы, реализующей функцию от семи переменных, получена точная оценка: Рл с КС11 = = 3,4Рпчт. Сравним ее с обобщенными верхней

и нижней оценками: &в(7) = [7 - log27] = 4 > 3,4; kH(7) и 2 < 3,4. Результат вполне удовлетворительный.

Анализ влияния радиационных воздействий на элементы конечного автомата

На работу рассматриваемого конечного автомата оказывают влияние ложные сигналы, возникающие при попадании частицы высокой энергии в закрытый транзистор логических элементов, входящих в схему памяти П и комбинационной схемы КС1. Ложные сигналы на выходе комбинационной схемы КС2 на работу данного автомата воздействия не оказывают, поэтому КС2 исключим из рассмотрения. Ложный сигнал, возникающий в схеме памяти автомата, приводит к изменению состояния автомата и поэтому является мягким отказом. Ложный сигнал на выходах КС1 еще не является отказом, но может стать причиной отказа, если вызовет переключение памяти. Рассмотрим связь следующих событий: появление ложного сигнала на одном из выходов КС1; переключение памяти под действием этого сигнала.

Мы рассматриваем синхронные автоматы. В них используются триггеры, синхронизируемые спадом либо фронтом тактового импульса. Эти триггеры имеют два важных параметра: tsu — время предустановки (Set-Up Time) и th — время удержания (Hold Time) [4, 6].

Эти интервалы времени показаны на рис. 6 для триггера типа D, синхронизируемого спадом импульса C. Именно этот тип триггера выбран для реализации памяти рассматриваемого автомата. Закрашенными областями отмечены интервалы времени, когда информационный сигнал D может изменяться. В интервале tsu + th сигнал D должен оставаться неизменным. Значение сигнала D в этом интервале определяет новое состояние триггера в наступающем такте. В современных триггерах tsu + th = 0,2 - 2 нс. Ложный импульс на выходе комбинационной схемы КС1, соединенном с входом D триггера, может изменить состояние триггера и вызвать мягкий отказ, если он присутствует в интервале tsu + th. В противном случае мягкого отказа не возникнет. Учитывая, что поступление ложных сигналов во все моменты времени равновероятны, определим вероятность мягкого отказа автомата из-за попадания частицы в транзистор элементов комбинационной схемы КС1. Пусть ложный импульс имеет длительность tJi и. Тогда вероятность возникновения мягкого отказа по причине попадания частицы в КС1 в течение периода синхронизации Tc равна вероятности пересечения интервала tJi и с интервалом tsu + th (иными словам, вероятности

С

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 —

т

D

1--0

Рис. 6. Тактирование переключений триггеров типа D, синхронизируемых спадом синхроимпульса С

появления ложного импульса менее чем за гл и до наступления интервала гьи + гк):

Рм.о.КС1 = Рл.с.КС1(4л.и + 4ьи + 4й)/Те.

Минимальная длительность такта определяется максимальной задержкой распространения сигнала в КС1 + П + КС2. Учитывая, что глубина распространения сигналов в системе Dсист > 10, а ^ т и 1 нс, можно считать, что (± „ + г,,, + гь)/

л.и ' ' 4 л.и ьи М"

Тс < 0,15, а вероятность мягкого отказа при возникновении ложного сигнала в КС1 определяется соотношением

Рм.о.КС1 < 0,15Рл.с.КС1.

(5)

Следует отметить, что при попадании частицы в транзистор памяти автомата мягкий отказ возникает независимо от момента попадания.

Определим вероятность мягкого отказа автомата

Рм.о.а = Рм.о.П + Рм.о.КС1 = = Ь Х Рп.ч.т + Рл.с.КС1(4л.и + 4ьи + 4ь)/Тс.

С учетом изложенного определим вероятность мягкого отказа приведенного примера автомата (см. рис. 2) и сравним влияние на возникновение мягкого отказа блока памяти и КС1:

Рм.о.а _ Рм.о.П + Рм.о.КС1

= 15Рп.ч.т + 0,15 X 10,2Рп.ч.т

= 15Р + 1,53Р = 16,53 Р .

п.ч.т ' п.ч.т ' п.ч.т

Таким образом, влияние КС1 составляет около 10 %.

Методы уменьшения влияния ложных сигналов на выходах комбинационных схем

Рассмотрим схемотехнические способы уменьшения влияния комбинационной схемы на возникновение мягких отказов.

В работах [8-10] рассматривается влияние коротких сигналов, порожденных воздействием радиации на интегральные схемы, на работу вычислительных устройств; описан способ защиты триггера от воздействия кратковременного ложного сигнала на его информационном входе, связанном с выходом комбинационной схемы (рис. 7).

В цепи, связывающей выход комбинационной схемы и информационный вход триггера, использованы элементы задержки и мажоритарный элемент МЭ. Если длительность ложного импульса не превышает задержку т, то на выходе МЭ он не появится. Однако МЭ может стать источником ложного сигнала на информационном входе триггера. Оценим вероятность такого события и эффективность такого способа.

Схема МЭ (рис. 8) содержит шесть элементов. Используя ту же методику, которую применили выше для анализа комбинационной схемы КС1,

X-,

Комбинационная

-[Ц

МЭ > 2

D тт Q

Рис. 7. Способ уменьшения влияния на работу триггера кратковременных ложных импульсов на выходе комбинационной схемы

0

г

г

т

С

&

аЛ,

&

& 1

с >— с

3 2

& 6

& 1

Рис. 8. Схема мажоритарного элемента

оценим вероятность появления ложного сигнала на выходе МЭ:

гл.с.МЭ

и (л 111111

= > Р: = Рпчт1 1 + - + -+-+-+- 1 =

I П.Ч.Т ^ 2 2 4 4 2) — д_р

Р

Сравнивая полученный результат с оценкой л с КС11 = 3,4Рп ч т, видим, что применение при-

веденного на рис. 7 способа уменьшает вероятность появления ложного сигнала на информационном входе триггера всего на 10 %, т. е. способ не является эффективным.

Сравнительный анализ надежности и сложности реализации вариантов построения структур блоков типа автомата с памятью

Будем сравнивать три типа структур автомата Мура:

— структуру автомата без структурного резервирования (см. рис. 1);

— структуру с троированием автомата, троированием МЭ на его входах (см. рис. 1 в работе [3]) и без периодического восстановления информации (структура, используемая в случаях не-восстанавливаемых отказов элементов);

— структуру с троированием автомата, троированием МЭ на его входах и восстановлением информации в конце каждого цикла реализации алгоритма.

Будем сравнивать два показателя: вероятность возникновения отказа за время решения задачи (вероятность того, что задача не будет решена) и сложность реализации структуры (в числе логических элементов). Считается, что все отказы, возникающие в структурах в ходе решения задачи, являются восстанавливаемыми. Если на выход автомата поступают искаженные данные, то работоспособность автомата считается утраченной.

Поскольку проводимое сравнение имеет целью обоснование подхода к функциональной организации автомата, его удобнее провести на рас-

смотренном выше примере автомата (см. рис. 2), для которого получены точные оценки.

Структура 1: автомат без структурного резервирования (см. рис. 1, 2).

Оценка сложности реализации:

Са1 = Сп + Скс1 + Скс2 = 30 + 54 + 4 = 88 л. э.

Частоту отказа структуры «м о а выразим через частоту попадания заряженных частиц в транзи-

ст°р «п.ч.т:

«м.о.а = «м.о.П + «м.о.КС1 = 16,53 «п.ч.Г

Резервирование в структуре отсутствует, поэтому возникновение мягкого отказа сразу приводит к потере работоспособности.

Полагая, что моменты возникновения отказов подчиняются экспоненциальному закону распределения случайной величины, оценим вероятность Р0 а1 отказа структуры автомата 1 за время решения задачи Тз:

Р 1 _ е-16'53дп.ч.тГ3

Вероятность безотказной работы автомата в течение времени решения задачи Тз вычисляется по формуле

Ро.Ы = 1 - Р0. а1 = е"16'53^.^.

Структура 2: автомат с троированными блоками и троированными входными МЭ без периодического восстановления информации (рис. 9).

Данная структура подробно рассматривается в работе [2]. Каждый автомат (сложности Са1) в ней троирован и по сравнению с базовой структурой дополнительно содержит троированные МЭ (сложности СМЭ) для каждого бита входных данных автомата. В рассматриваемом примере разрядность входного сигнала т = 4, поэтому об-

Т

I [0

13 [0

0Л0..2]

0Я[0..2]

03[0..2]

Рис. 9. Структура 2: 11, 12, 13 — входные данные; У1г У2, V — группы троированных МЭ; А1, А2, А3 — группы троированных блоков типа «конечный автомат с памятью» с периодическим восстановлением (каждая тройка блоков имеет свой собственный период восстановления Т1, Т2, Т3); 01, 02, 03 — выходы троированных блоков

х

1

х

2

У

х

3

щая сложность реализации структуры 2 определяется выражением

Са2 = 3СМЭ X т + 3Са1 = 3x6x4 + 3x88 = = 72 + 264 = 336 л. э.

Рассматривая сложность реализации данной структуры, наряду с ростом количества логических элементов по сравнению со структурой 1, необходимо также отметить троекратное увеличение количества связей между элементами.

При оценке работоспособности требуется учитывать влияние МЭ: так как они подключаются непосредственно ко входам КС1, оно эквивалентно усложнению КС1. Поэтому вклад МЭ в надежность по аналогии с КС1 умножается на рассчитанный в (5) коэффициент 0,15, отражающий вероятность возникновения сбоя в момент перепада синхроимпульса памяти.

Частота возникновения отказов в экземпляре автомата с подключенным МЭ определяется выражением

Ч,

о.э.а2

= Ч

м.о.П

+ Ч

м.о.КС1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ ЧМЭ = 16,98 Чп.ч.т,

где оценка влияния МЭ чмэ = 2,5чп ч т была полу-

л.с.КС1

1 в (3).

чена тем же способом, что и Р

Исходя из предположения об экспоненциальном законе распределения случайных событий, представим вероятностную функцию возникновения отказа в экземпляре автомата:

го.э.а2

= \ _ е~1о.а.а2^

Вероятность отказа данной структуры равна вероятности возникновения отказов в двух экземплярах автомата из трех в течение времени решения задачи. Пусть Ап — событие отсутствия отказа в экземпляре п (п е 1..3) автомата в течение времени Тз, Ап — событие возникновения отказа в течение времени Тз. Тогда к отказу приведут следующие комбинации несовместных

в_совокупности событий: А2 Ад, А2Ад,

Л2 Ад , А2 Ад.

Поскольку все экземпляры автомата идентичны, вероятности возникновения событий Ап и Ап для любого п

Р(Ап) = Ро.э.а2; Р(К ) = 1 - Ро,

э.а2"

По формуле сложения вероятностей несовместных событий вычисляем вероятность возникновения отказа в троированном автомате в течение времени выполнения задачи:

Ро.а2 = Зр02.э.а2 (1" Ро.э.а2) + Ро3.э.а2 = Ро!э.а2 -

-2 Рг

о.э.а2

) = (1 - е-16,98дП.ч.тГз )2а + 2е-16,98дп.ч.тГз ).

Вероятность безотказной работы автомата в течение времени выполнения задачи определяется выражением

Ро.а2 = 1 - -Р0.а2 = = 1 - (1 - е-16,98«п.ч.т?; )2 (1 + 2е-16,98дп.ч.тТв ).

Структура 3: автомат с троированными блоками и троированными входными МЭ и периодическим восстановлением информации.

В отличие от рассмотренной выше структуры 2, данная структура содержит механизм периодического восстановления информации: в конце каждого цикла реализации автомата в алгоритме предусмотрено формирование сигнала сброса Я, принудительно переводящего все три экземпляра автомата в начальное состояние.

Мягкий отказ в одном из экземпляров меняет его состояние на одном из шагов реализации алгоритма. Дальнейшая траектория изменений состояния этого автомата отличается от автоматов без сбоя, поэтому он в момент окончания реализации алгоритма (решения задачи) находится в другом состоянии. Его необходимо переключить в начальное состояние. Для этого необходимо в последнем такте реализации алгоритма дополнительно формировать сигнал Я. Схемотехнически это реализуется просто. Сброс устраняет рассинхронизацию работы экземпляров троированной структуры.

С точки зрения структурной сложности данная реализация не отличается от предыдущей:

Са3 = Са2 = 336 л. э.

Оценка вероятности отказа также производится по аналогии с предыдущей структурой с учетом единственного отличия: к отказу системы приводит одновременный отказ двух экземпляров автомата не в течение времени решения задачи Тз, а в течение цикла работы автомата Тц (цикла реализации алгоритма). Таким образом, если задача включает в себя несколько циклов (или работа блока состоит в непрерывной циклической реализации алгоритма), устойчивость к мягким отказам возрастает:

-Ро.аЗ = (1-е 19, )2 (1

2е- 19,53«п.ч.тГц ).

Поскольку в начале каждого цикла происходит восстановление состояния системы, то вероятность Р0-аз (п) безотказной работы автомата при последовательном выполнении п циклов может быть оценена как произведение вероятностей безотказной работы в течение каждого цикла:

-^о.аЗ («) = (1 - -Ро.аЗ )" =

_ (1 _ (1 _ е 19,53?п.ч.тГц )2 (^

2е-19,53дп.ч.тГц ).

Оценка результатов сравнения

Рассчитанные выше характеристики сложности реализации анализируемых структур перечислены в табл. 1.

Для сравнения показателей надежности приведем графики безотказной работы каждой структуры (рис. 10) при следующих входных параметрах:

— интенсивность попадания заряженных частиц в один транзистор qп^чл = 0,0005;

— общее время, необходимое для полного решения задачи, Тз = 100;

— время реализации одного рабочего цикла автомата Тц = 10;

— время одного такта работы автомата Тс = 1.

Оценка производится на интервале времени

Тз, необходимом для решения автоматом его основной вычислительной задачи.

Ось X обозначает текущее время г решения задачи. По оси У расположена вероятность нахождения автомата в работоспособном состоянии (1 — гарантированно работоспособен, 0 — гарантированно неработоспособен).

Итоговая вероятность нахождения автомата в работоспособном состоянии (значение при г = 100) на момент окончания решения задачи приведена в табл. 2.

Сравнение функций работоспособности структур 1 и 2 (см. рис. 10) позволяет сделать вывод о влиянии резервирования в условиях возникнове-

Таблица1

Структура Сложность реализации, л. э. Избыточность связей между блоками

Структура 1 88 Нет

Структура 2 336 Да

Структура 3 336 Да

р

о.а 1 0,8 0,6 0,4 0,2

1

-2

3

0 8 16 24 32 40 48 56 64 72 80 88 96 г

Рис. 10. Функции работоспособности анализируемых структур 1-3

Таблица 2

Структура Вероятность успешного решения задачи

Структура 1 0,44

Структура 2 0,39

Структура 3 0,84

ния только восстанавливаемых отказов: надежность при применении резервирования без самовосстановления повышается только на начальном участке кривой (при малом времени решения задачи). Если время, необходимое для решения задачи, значительное, то структура 2 (начиная с момента времени 80,0) уступает нерезервированной структуре 1, так как увеличение числа элементов повышает вероятность попадания заряженной частицы (возникновения отказа).

Структура 3 из-за периодического восстановления значительно превосходит структуру 2 с точки зрения надежности, если общая задача состоит из большого числа циклов. При текущих условиях длительность цикла была в 10 раз меньше общего времени задачи, что привело к возрастанию вероятности успешного решения с 39 до 84 %.

Заключение

В ходе исследований произведена оценка влияния потока мягких отказов (к примеру, вызванных радиацией) на работу конечного автомата.

Установлено, что элементы комбинационных схем в значительно меньшей степени по сравнению с элементами памяти влияют на надежность автомата с точки зрения устойчивости к мягким отказам. Это объясняется тем, что ложный импульс, наведенный заряженной частицей, при попадании в комбинационную схему имеет малую длительность (доли наносекунд) и изменяет состояние автомата только в том случае, если его появление совпадает с перепадом синхроимпульса, тактирующего элементы памяти, к которым подключена комбинационная схема.

На основе полученных результатов проанализирована целесообразность применения известных методов повышения надежности конечного автомата, таких как использование структурного резервирования и периодического самовосстановления. Произведенная оценка структурной сложности и надежности различных отказоустойчивых структур показала, что наибольшую защиту от мягких отказов по сравнению с методами структурного резервирования обеспечивают механизмы периодического самовосстановления (чем чаще производится восстановление, тем больше эффективность его использования).

Полученные в ходе работы оценки были рассчитаны для конкретной реализации автомата Мура средней сложности с использованием асимптотических оценок сложности, результаты обобщены для любых автоматов с памятью. Результаты работы имеют большое практическое применение, так как позволяют синтезировать лучшую структуру с точки зрения сложности и надежности на этапе проектирования. В то же время выбор конкретной структуры зависит от условий функционирования синтезируемой системы. Если наряду с мягкими отказами в системе существует вероятность возникновения невосстанавливаемых отказов, совместно с предложенными механизмами самовосстановления целесообразно использовать традиционные методы структурного резервирования.

Литература

1. Егоров И. В., Мелехин В. Ф. Анализ проблемы повышения радиационной стойкости информационно-управляющих систем на этапе функционально-логического проектирования // Информационно-управляющие системы. 2016. № 1. С. 26-31. doi:10.15217/issn1684-8853.2016.1.26

2. Егоров И. В., Мелехин В. Ф. Методы и средства анализа надежности структурных блоков с резервированием и периодическим восстановлением информации на различных этапах проектирования вычислительных систем // Информационно-управляющие системы. 2016. № 2. С. 26-34. doi:10.15217/ issn1684-8853.2016.2.19

3. Егоров И. В., Мелехин В. Ф. Анализ процессов в конечном автомате при воздействии радиации. Оценка вероятности искажения информации // Информационно-управляющие системы. 2016. № 3. С. 24-33. doi:10.15217/issn1684-8853.2016.3.24

4. Kaeslin H. Digital Integrated Circuit Design. From VLSI Architectures to CMOS Fabrication. — Cambridge University Press, 2008. http://www.roletech.net/ books/DigitalIntegratedCircuit.pdf (дата обращения: 10.04.2016).

Полученные результаты позволяют сформулировать требования к расширению функций и поиску новых схемотехнических решений, эффективных при потоке мягких отказов:

1) блокирование распространения мягкого отказа в памяти автомата;

2) повышение эффективности средств для уменьшения влияния ложных сигналов на выходе комбинационной схемы, управляющей переходами памяти;

3) периодическое восстановление состояния отказавшего экземпляра памяти;

4) выявление, регистрация и подсчет числа мягких отказов в автомате.

Реализация вышеперечисленных функций является темой отдельного исследования.

5. Savage J. E. Models of Computation: Exploring the Power of Computing. — Addison Wesley, 1998. — 672 p.

6. Мурога С. Системное проектирование сверхбольших интегральных схем. Кн. 1. — М.: Мир, 1985. — 288 с.

7. Колосов В. Г., Мелехин В. Ф. Проектирование узлов и систем автоматики и вычислительной техники. — Л.: Энергоатомиздат, 1983. — 256 с.

8. Eaton P., Benedetto J., Mavis D., Avery K., Sibley M., Gadlage M., Turflinger T. Single Event Transient Pulsewidth Measurements Using a Variable Temporal Latch Technique // IEEE Transactions on Nuclear Science. Dec. 2004. Vol. 51. N 6. P. 3365-3368.

9. Rollins N., Wirthlin M., Caffrey M., Graham P. Evaluating TMR Techniques in the Presence of Single Event Upsets // Proc. of the 6th Annual Intern. Conf. on Military and Aerospace Programmable Logic Devices (MA-PLD), Washington, D.C. September 2003. http://schol-arsarchive.byu.edu/cgi/viewcontent.cgi?article = 2047&context = facpub (дата обращения: 05.08.2016).

10. She Xiaoxuan, Samudrala P. K. Selective Triple Modular Redundancy for Single Event Upset (SEU) Mitigation // Adaptive Hardware and Systems: NASA/ESA Conf. 2009. P. 344-350.

UDC 681.3

doi:10.15217/issn1684-8853.2017.3.34

Analysis of Reliability and Structural Complexity for Various Implementations of a Finite State Machine Resistant to Soft Failures

Egorov I. V.a, Post-Graduate Student, iegorov@kspt.icc.spbstu.ru Melekhin V. F.a, Dr. Sc., Tech., Professor, melekhin@kspt.ftk.spbstu.ru

aPeter the Great St. Petersburg Polytechnic University, 29, Politekhnicheskaia St., 195251, Saint-Petersburg, Russian Federation

Introduction: Up-to-date design rules used in computer engineering make hardware unreliable when working under radiation. A hit of a charged particle causes a "soft failure" — a situation when hardware elements remain in usable condition but the information transmitted or stored in the memory is corrupted. We need to develop new circuitry solutions which would increase the resistance of

hardware (especially finite states machines) to soft failures. Purpose: The estimation of reliability characteristics for various redundant structures of a Moore automaton in case of a flow of soft failures. Results: The comparison between the known Moore automaton prototypes has shown that redundant internal memory and self-recovery of corrupted data in the memory allow us to significantly increase the duration of trouble-free functioning, without making the implementation more sophisticated as compared to non-recoverable structures. In case of a soft failure, a memory bit remains functional, and the valid state of the system can be restored by overwriting the corrupted bit with a valid one when the recovery is over. An unrecoverable failure can occur only if several instances of redundant units of the memory are corrupted simultaneously during a singe recovery period. If we manage to ensure a sufficiently small recovery period in the system, it will dramatically prolong its non-failure operating time. Practical relevance: The obtained results allow you to determine the ways of developing fault-tolerant finite state machines resistant to soft failures: blocking the propagation of a soft failure in the memory, periodic self-recovery of corrupted bits, and introducing additional hardware to detect and register failures.

Keywords — Finite State Machine, Combinational Circuit, Reliability Analysis, Hardware Complexity Estimation, Synchronization, Soft Failures, Structural Redundancy, Recoverable System, Reliability Function.

References

1. Egorov I. V., Melekhin V. F. Analysis of Radiation Resistance Improvement Issue for Information and Control Systems at the Stage of Functional and Logical Design. Infor-matsionno-upravliaiushchie sistemy [Information and Control Systems], 2016, no. 1, pp. 26-31 (In Russian). doi:10.15217/issn1684-8853.2016.1.26

2. Egorov I. V., Melekhin V. F. Methods and Tools for Structural Block Reliability Analysis with Reservation and Periodic Information Recovery at Various Stages of Computing System Design. Informatsionno-upravliaiushchie sistemy [Information and Control Systems], 2016, no. 2, pp. 26-34 (In Russian). doi:10.15217/issn1684-8853.2016.2.19

3. Egorov I. V., Melekhin V. F. Analysis of Processes in a Finite State Machine under Radiation. Probabilistic Assessment of Information Distortion. Informatsionno-upravliai-ushchie sistemy [Information and Control Systems], 2016, no. 3, pp. 24-33 (In Russian). doi:10.15217/issn1684-8853.2016.3.24

4. Kaeslin H. Digital Integrated Circuit Design. From VLSI Architectures to CMOS Fabrication. Cambridge University Press, 2008. Available at: http://www.roletech.net/books/ DigitalIntegratedCircuit.pdf (accessed 10 April 2016).

5. Savage J. E. Models of Computation: Exploring the Power of Computing. Addison Wesley, 1998. 672 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Muroga S. Sistemnoe proektirovanie sverkhbol'shikh inte-gral'nykh skhem [System Design of Very-large-scale Integrated Circuits]. Moscow, Mir Publ., 1985. Vol. 1. 288 p. (In Russian).

7. Kolosov V. G., Melehin V. F. Proektirovanie uzlov i sistem avtomatiki i vychislitel'noi tekhniki [Design of Units and Systems of Automatic Equipment and Computer Technology] Saint-Petersburg, Energoatomizdat Publ., 1983. 256 p. (In Russian).

8. Eaton P., Benedetto J., Mavis D., Avery K., Sibley M., Gad-lage M., Turf linger T. Single Event Transient Pulsewidth Measurements using a Variable Temporal Latch Technique. IEEE Transactions on Nuclear Science, Dec. 2004, vol. 51, no. 6, pp. 3365-3368.

9. Rollins N., Wirthlin M., Caffrey M., Graham P. Evaluating TMR Techniques in the Presence of Single Event Upset. Proc. of the 6th Annual Intern. Conf. on Military and Aerospace Programmable Logic Devices (MAPLD), Washington, D.C., September 2003. Available at: http://scholarsarchive. byu.edu/cgi/viewcontent.cgi?article = 2047&context = fac-pub (accessed 05 August 2016).

10. She Xiaoxuan, Samudrala P. K. Selective Triple Modular Redundancy for Single Event Upset (SEU) Mitigation. Adaptive Hardware and Systems, NASA/ESA Conf., 2009, pp. 344-350.

УВАЖАЕМЫЕ АВТОРЫ!

Научная электронная библиотека (НЭБ) продолжает работу по реализации проекта SCIENCE INDEX. После того как Вы зарегистрируетесь на сайте НЭБ (http://elibrary.ru/ defaultx.asp), будет создана Ваша личная страничка, содержание которой составят не только Ваши персональные данные, но и перечень всех Ваших печатных трудов, имеющихся в базе данных НЭБ, включая диссертации, патенты и тезисы к конференциям, а также сравнительные индексы цитирования: РИНЦ (Российский индекс научного цитирования), h (индекс Хирша) от Web of Science и h от Scopus. После создания базового варианта Вашей персональной страницы Вы получите код доступа, который позволит Вам редактировать информацию, помогая создавать максимально объективную картину Вашей научной активности и цитирования Ваших трудов.

i Надоели баннеры? Вы всегда можете отключить рекламу.