Научная статья на тему 'Анализ проблемы построения радиационно-стойких информационно-управляющих систем'

Анализ проблемы построения радиационно-стойких информационно-управляющих систем Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
751
217
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННО-УПРАВЛЯЮЩИЕ СИСТЕМЫ / РАДИАЦИОННЫЕ ЭФФЕКТЫ / ПОЛУПРОВОДНИКОВЫЕ СТРУКТУРЫ / ИНТЕГРАЛЬНЫЕ СХЕМЫ / БИБЛИОТЕКА ЭЛЕМЕНТОВ / СБОИ / ОТКАЗЫ / ВОССТАНОВЛЕНИЕ / НАДЕЖНОСТЬ / СТРУКТУРА / ФУНКЦИОНАЛЬНАЯ ОРГАНИЗАЦИЯ / CONTROL SYSTEMS / RADIATION EFFECTS / SEMICONDUCTOR STRUCTURES / INTEGRATED CIRCUIT / ELEMENT LIBRARY / FAULT / SOFT ERROR / RECOVERY / RELIABILITY / STRUCTURE / FUNCTIONAL ORGANIZATION

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Максименко Сергей Леонидович, Мелехин Виктор Федорович, Филиппов Алексей Семенович

Анализируется проблема повышения радиационной стойкости информационно-управляющих систем. Проводится аналитический обзор радиационных эффектов в полупроводниковых структурах цифровых интегральных схем и методов повышения радиационной стойкости на уровне библиотеки элементов. Обосновывается необходимость принятия специальных мер по повышению радиационной стойкости на уровнях функциональной и структурной организации системы, а также на уровне организации вычислительных процессов, ставятся соответствующие задачи по проектированию.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of the Problem of Radiation-Tolerant Information and Control-Systems Implementation

The problem of radiation tolerance of control systems is analyzed. The analytical survey of radiation effects in semiconductor structures of digital integrated circuits and radiation hardening methods at the level of the element library is conducted. The necessity of special design efforts for increasing the radiation tolerance at levels of device functional organization and control system structure as well as computing processes organization is shown; the corresponding engineering tasks are set.

Текст научной работы на тему «Анализ проблемы построения радиационно-стойких информационно-управляющих систем»

ИНФОРМАЦИОННО-УПРАВЛЯЮЩИЕ СИСТЕМЫ X

УДК 681.3

АНАЛИЗ ПРОБЛЕМЫ ПОСТРОЕНИЯ РАДИАЦИОННО -СТОЙКИХ ИНФОРМАЦИОННО -УПРАВЛЯЮЩИХ СИСТЕМ

С. Л. Максименко,

старший преподаватель В. Ф. Мелехин, доктор техн. наук, профессор А. С. Филиппов,

канд. техн. наук, доцент

Санкт-Петербургский государственный политехнический университет

Анализируется проблема повышения радиационной стойкости информационно-управляющих систем. Проводится аналитический обзор радиационных эффектов в полупроводниковых структурах цифровых интегральных схем и методов повышения радиационной стойкости на уровне библиотеки элементов. Обосновывается необходимость принятия специальных мер по повышению радиационной стойкости на уровнях функциональной и структурной организации системы, а также на уровне организации вычислительных процессов, ставятся соответствующие задачи по проектированию.

Ключевые слова — информационно-управляющие системы, радиационные эффекты, полупроводниковые структуры, интегральные схемы, библиотека элементов, сбои, отказы, восстановление, надежность, структура, функциональная организация.

Введение

С развитием микроэлектроники по мере совершенствования технологии производства интегральных схем (ИС) уменьшается основной показатель уровня технологии — проектная норма. Это ведет к увеличению уровня интеграции (количество вентилей в кристалле), повышению быстродействия элементов, уменьшению напряжения питания ИС. Это все — положительные факторы при разработке средств вычислительной техники. Одним из существенных отрицательных факторов, сопутствующих развитию элементной базы, является повышение чувствительности элементов к воздействиям радиации. Поэтому одной из важнейших проблем проектирования на современной элементной базе становится вопрос повышения радиационной стойкости вычислительных систем. Особенно эта задача актуальна для информационно-управляющих систем (ИУС). Она носит системный характер, и для ее успешного решения требуется системный подход, включающий анализ возможностей повышения радиационной стойкости на различных уровнях организации системы — от компонентов (транзисторов) до организации вычисли-

тельных процессов в системе. При этом необходимо учитывать возможности и ограничения, связанные с современным состоянием теории, технологии и инструментальных средств проектирования ИУС.

Анализ радиационных эффектов в полупроводниковых структурах

Радиационные эффекты, приводящие к сбоям и отказам электронной аппаратуры, делятся на две группы:

— эффекты, связанные с изменением свойств материала в связи с накоплением зарядов под воздействием ионизирующего излучения;

— локальные эффекты, связанные с кратковременным возникновением относительно больших зарядов в компактной области, вызванным попаданием частицы с высокой энергией.

Эффекты, связанные с накоплением зарядов под воздействием суммарной дозы облучения (Total Dose Effects), приводят к изменению электрических параметров транзисторов. «Увеличивается ток, протекающий через транзистор в выключенном состоянии. Возрастает потребление питания, рассеивание тепла, и может

произоити термическое разрушение транзистора» [1]. Длительное воздействие на электронную аппаратуру потоков частиц приводит к параметрическим и функциональным отказам аппаратуры [2].

Локальные эффекты в ИС, вызванные воздействием отдельных частиц, получили название Single Event Effects (SEE). Влияние одиночных частиц связано с эффектом ионизации. Эффект от попадания частицы в p-n-переход схематично представлен на рис. 1 [3]. Пусть этот p-n-переход является переходом сток-затвор в структуре МОП-транзистора с каналом типа n. Пусть транзистор под действием входного напряжения на затворе находится в состоянии «закрыт». Прохождение частицы через подзатворную область (на рис. 1, а показано стрелкой) вызывает ионизацию полупроводника: порождение одинакового числа свободных электронов (в приведенном примере неосновных носителей) и дырок. Под действием электрического поля, создаваемого напряжением на стоке, порожденные частицей неосновные носители устремляются к стоку (рис. 1, б) и вызывают появление «ложного» импульса тока в цепи стока. «Площадь» импульса тока равна возникшему заряду неосновных носителей. При этом электрическое равновесие в подзатворной области нарушается. Для его восстановления необходимое число электронов поступает из истока транзистора, и равновесное состояние закрытого транзистора восстанавливается (рис. 1, в). В составе схемы это существенная наведенная помеха, которая может вести к сбою информационных процессов. Таким образом, эффект SEE есть случайное возникновение импульсного сигнала в некотором участке схемы устройства, вызванное попаданием отдельной частицы излучения в транзисторную структуру ИС.

В литературе (например, [4]) выделяют неустранимый отказ (hard error) и устранимый отказ (soft error), т. е. сбой.

В дальнейшем под сбоем будем понимать устранимый отказ, устранение которого может происходить как без вмешательства системы (самоустранение), так и с использованием специальных процедур. Эти различия существенны для уровня управления вычислительными процессами.

Неустранимые отказы связаны с физическим разрушением полупроводниковой структуры. К ним относят разрушение транзистора (Single Event Burnout — SEB) и пробой изолятора (Single Event Gate Rupture). Данные виды отказов в первую очередь относятся к силовым элементам.

В цифровой «слаботочной» аппаратуре наиболее часто возникают устранимые отказы. Устранимые отказы делят на типы в соответствии с их проявлением в работе устройства [4-6]. Для обозначения различных типов отказов, связанных с радиационным воздействием, используют сокращения на английском языке.

Наиболее частыми являются отказы, связанные с кратковременным изменением уровня напряжения на выходе логического элемента («ложным» импульсом). Такое событие в схеме называют кратковременным импульсным сигналом (Single Event Transient — SET).

Пример возникновения импульса SET на выходе инвертора под действием SEE показан на рис. 2. Рассмотрим происходящие при этом события подробнее. На вход инвертора, выполненного по КМОП-технологии, подана логическая «1», чему соответствует ивх = Еп. При этом нижний (усилительный) транзистор VT1 открыт, а верхний (нагрузочный) VT2 — закрыт. На выходе инвертора ивых = 0, что соответствует логическому «0». При попадании частицы с высокой энергией в верхний транзистор (см. рис. 1) за счет ионизации между истоком и стоком появляется заряд неосновных носителей, представляющий проводящий канал в подзатворной области. Через этот

■ Рис. 1. Эффект возникновения заряда неосновных носителей в р-области р-п-перехода при попадании частицы с высокой энергией: а — ионизация полупроводника; б — движение неосновных носителей; в — восстановление равновесия

■ Рис. 2. Возникновение «ложного» импульса на выходе инвертора при попадании частицы в транзистор УТ2

транзистор от источника питания в нагрузку протекает ток, повышающий напряжение на выходе инвертора (0 ^ 1). Поскольку заряд неосновных носителей возник за счет частицы и более не возобновляется, то он с током стока выносится, и транзистор VT2 опять закрывается, так как напряжение между затвором и истоком ниже порога открывания. После этого нагрузочный конденсатор Сн опять разряжается через открытый под действием входного напряжения нижний транзистор VT1. Таким образом, из-за воздействия частицы на выходе инвертора сформирован кратковременный «ложный» импульс: 0 ^ 1 ^ 0. Это и есть эффект, называемый SET.

Длительность импульса при эффекте SET примерно пропорциональна энергии частицы и может составлять от долей до нескольких наносекунд. Импульс может распространяться по цепочке логических элементов. При этом длительность импульса может как сокращаться, так и увеличиваться по мере распространения [7].

Если рассмотренное кратковременное открывание транзистора происходит в составе триггера, то оно вызывает сбой-переключение (Single Event Upset — SEU) — изменение состояния запоминающего элемента при попадании частицы. Изменение состояния запоминающего элемента — это отказ, который не устраняется сам, но который можно устранить путем записи в элемент правильного значения.

Следующий эффект от попадания частиц — одиночный сбой-защелкивание (Single event lat-chup — SEL). Данный вид отказа возникает при активации паразитных тиристорных структур, присутствующих в ИС, построенных по КМОП-технологии. В результате через образовавшийся в паразитной тиристорной структуре канал начинает протекать значительный ток, который может привести к локальному перегреву и разрушению элементов ИС. SEL устраняется снятием питания с ИС. Определить возникновение SEL можно по резкому увеличению энергопотребления ИС.

Анализ влияния радиационных эффектов в полупроводниковых структурах на информационные процессы в цифровых устройствах

Если рассматривать функционирование цифрового устройства на уровне регистровых передач, то информационные отказы определяются потерей запоминающими элементами устройства хранимой информации либо записью в запоминающие элементы некорректной информации в результате сбоя или отказа в комбинаторных элементах или цепях управления.

Информационные отказы могут вызываться как влиянием накопленной дозы радиации, так и одиночными событиями (SEE). Согласно результатам анализа отказов космических аппаратов [8], из 288 отказов лишь 5,4 % были обусловлены накоплением дозы, а большая часть — одиночными событиями. Уменьшение проектной нормы и повышение тактовых частот электронных устройств определяет тот факт, что доля одиночных событий во всей совокупности отказов будет только увеличиваться.

Для проектирования цифровых устройств, устойчивых к радиационным воздействиям, необходимо понимать их влияние на современную элементную базу.

Оценка влияния радиационных эффектов на работу устройств ведется по трем направлениям: математическое моделирование, тестирование реальных устройств и тестирование специально разработанных экспериментальных устройств.

Для моделирования радиационной обстановки в различных условиях эксплуатации созданы установки, позволяющие достаточно точно задавать дозу облучения, энергию частиц. Используется моделирование ионизирующих воздействий при помощи лазера, что позволяет задавать конкретные участки ионизации на кристалле. Одной из основных проблем, затрудняющих исследование влияния одиночных событий на работу реальных устройств, является низкая наблюдаемость последних. Она обусловлена высокой сложностью современных СБИС и значительной латентностью проявления отказа. Наибольшую трудность для тестирования представляют СБИС со сложным поведением, в частности микропроцессоры. Элементы памяти, содержащиеся в микропроцессоре, недоступны для непосредственного считывания извне. Об их состоянии можно судить только по результатам выполнения тестовых программ, само успешное выполнение которых зависит от целостности информации в процессоре. Таким образом, натурные эксперименты дают мало информации о реальных процессах, предшествовавших отказу. Одной из актуальных задач построения СБИС, устойчивых к радиационным эффектам, является построение аппаратных средств для сбора статистики по отказам.

Рассмотрим влияние эффекта от накопления в кристалле ИС дозы радиации. Длительное воздействие потока частиц со сравнительно невысокими энергиями приводит к ионизации материала и смещению параметров элементов. В выключенном состоянии накопление заряда происходит медленнее, так как электрическое поле отсутствует и не препятствует релаксации заряда. Предельная накопленная доза, при которой устрой-

ство продолжает работать, специфична для каждого устройства, зависит от используемых материалов и геометрии элементов.

Согласно результатам тестирования [9], процессоры типа Pentium III во включенном состоянии выдерживают облучение, превышающее 500 крад, не показывая существенных признаков деградации. В то же время микросхемы Flash-памяти перестают функционировать при облучении дозами порядка десятков килорад [10]. Причина большей чувствительности СБИС памяти к радиации в сравнении с процессором связана с отличиями в построении запоминающих элементов. В СБИС DRAM и Flash-памяти запоминающие элементы более чувствительны к воздействию частиц.

Как показывает анализ литературных источников, повышение предельной накопленной дозы достигается за счет совершенствования элементной базы, процессов производства, тренировки ИС и организации их работы в системе (экранирование, холодный резерв). На уровне схемотехнических и архитектурных решений неизвестны общие подходы к защите от данного проявления радиационных воздействий, поэтому далее в работе они не рассматриваются.

Рассмотрим проявление эффекта типа «одиночный сбой-защелкивание» (SEL). Из одиночных сбоев данный тип является самым опасным по тяжести последствий, так как при отсутствии средств защиты приводит к невосста-навливаемым отказам аппаратуры. Однако, как показывают исследования, для возникновения SEL в обычных КМОП-структурах энергия частицы должна быть намного больше, чем для переключения запоминающего элемента. Основное направление работ по уменьшению эффектов SEL связано с технологией формирования полупроводниковых структур. В работе [11] приведены сведения о том, что устройства, построенные на технологии «кремний на изоляторе» (Silicon-on-insulator — SOI), существенно меньше подвержены SEL.

Основным методом борьбы с SEL является снятие питания с устройства. Для срабатывания защиты рекомендуется порог порядка 10-20 % от нормального энергопотребления. Структурные методы борьбы с SEL на уровне кристалла в литературе не рассматриваются.

Эффекты SET приводят к появлению «ложных» импульсов в сети логических элементов, т. е. вызывают события, аналогичные тем, которые вызывают внешние электромагнитные помехи и помехи по цепям питания в схемах на печатных платах. Эти события можно трактовать как риск сбоя. Если, распространяясь по цепи, они приводят к ложным переключениям элементов

памяти (триггеров, регистров, счетчиков и т. п.), то устройство меняет свое состояние. Это означает, что происходит сбой, или восстанавливаемый отказ, по проявлению аналогичный SEU. С ним связан отказ в вычислительном процессе, в котором участвует данное устройство.

Проблема повышения радиационной стойкости ИУС и подход к ее решению

Повышение радиационной стойкости ИУС будем рассматривать как один из аспектов повышения надежности системы. ИУС — сложная система, содержащая большое число разнородных элементов. При организации проектирования и управления функционированием ИУС используется иерархический подход.

В проблеме повышения надежности ИУС следует выделить два аспекта: повышение надежности компонентов за счет совершенствования технологии и повышение надежности системы из ненадежных компонентов за счет использования структурной, информационной и временной избыточности. В соответствии с этим будем рассматривать следующие уровни многоэтапного процесса проектирования:

1) уровень проектирования и изготовления ИС;

2) уровень стандартных элементов, входящих в библиотеку САПР СБИС;

3) уровень функциональной организации СБИС;

4) уровень функциональной и структурной организации системы, в которой используются СБИС как элементы структуры;

5) уровень организации вычислительных процессов в системе, при которой используются аппаратное, программное и информационное обеспечения.

Проектирование ИУС с учетом выделенных уровней выполняют представители различных специальностей. На уровнях 1 и 2 работают специалисты в области микроэлектроники и технологии производства ИС. Совершенствованием технологии производства ИС, формированием библиотеки элементов, разработкой СБИС на уровне логических элементов и топологии электронных схем занимаются физики, технологи, электронщики — специалисты в области разработки и изготовления полупроводниковых структур. Уровни 3-5 — область деятельности схемотехников, системотехников и программистов.

Поэтому проведем аналитический обзор работ в области повышения радиационной стойкости аппаратуры, относящихся к уровням 1 и 2. С учетом этих результатов обоснуем актуальность решения рассматриваемой проблемы на уровнях 3-5. Сформулируем задачи решения проблемы применительно к этим уровням.

Повышение радиационной стойкости компонентов за счет технологии изготовления полупроводниковых транзисторных структур

Выбор используемых материалов в сочетании с геометрией элементов определяют устойчивость устройства к накопленной дозе радиации.

Применение особо чистых материалов дает возможность снизить величину ионизации материала и тем самым в комплексе улучшить радиационную стойкость.

Распространенным способом борьбы с воздействием радиации является использование технологии SOI. Вблизи поверхности подложки имплантируется слой молекул кислорода, из которого нагреванием формируют непрерывный слой оксида толщиной порядка 0,2 мкм. Полученный диэлектрик изолирует сформированный на поверхности кристалла КМОП вентиль от кремниевой подложки. При этом области истока и стока транзисторов вентиля достигают углубленного в кристалл окисла. В такой транзисторной структуре снижаются токи утечки и паразитные емкости, исключается возможность образования паразитных структур типа тиристора. Из-за меньшего слоя кремния, расположенного под затвором, в SOI-транзисторах величина накапливаемого заряда, вызванного длительным воздействием радиации, снижается примерно в 10 раз.

Для устройств, реализованных по технологии SOI, не характерны эффекты типа SEL. Таким образом, на верхние уровни проектирования приходится в основном борьба с эффектами SET и SEU.

Повышение радиационной

стойкости устройств

на уровне библиотеки элементов СБИС

Для уменьшения чувствительности устройств к радиационным эффектам на уровне библиотеки элементов СБИС используются следующие подходы:

— блокирование возникновения SET;

— блокирование распространения SET;

— повышение устойчивости триггеров к SEU и SET.

Блокировать само возникновение SET можно, повысив заряд, необходимый для открывания транзистора и существенного изменения напряжения на выходе вентиля (см. рис. 1 и 2). Этого можно достичь, увеличив размеры транзистора или увеличив электрическую емкость цепи, подключенной к выводу. Таким образом можно повысить энергию частицы, необходимую для переключения элемента. Данный подход не приме-

ним к современным субмикронным и нанотехнологиям, противоречит тенденциям развития технологии производства ИС и не годится для построения быстродействующих устройств.

Полностью блокировать распространение импульса от эффекта SET невозможно. На уровне геометрии элементов, по некоторым сведениям, можно достичь некоторого ухудшения их распространения. Однако о решении, пригодном для широкого применения, неизвестно. Основные известные решения направлены не на подавление SET, а на защиту триггеров от их воздействия. Таким образом, основные идеи и результаты по повышению радиационной стойкости элементов связаны с предложениями по схемотехнике триггеров.

Защита триггеров от SEU

Повышение защиты триггеров от ложного срабатывания при действии радиоактивных частиц может вестись по двум направлениям — временная и структурная избыточность.

Первый подход заключается в следующем: параметры быстродействия триггера специально понижаются, чтобы импульс в элементе запоминающей ячейки не смог активировать ее обратную связь. Достигается это включением резисторов в цепи связей между вентилями (рис. 3). Помимо снижения быстродействия отрицательным фактором такого подхода является увеличение размеров триггера. Данная структура была основой первой реализации триггера, устойчивого к эффектам SEE [12].

Второй подход базируется на использовании структурной избыточности при построении триггера. Наиболее популярным в настоящий момент схемотехническим решением такого типа является ячейка типа DICE (Dual Interlocked Storage Cell) (рис. 4, а), прототипом которой стал обычный триггер на 6 транзисторах (рис. 4, б). Ее производство не требует изменений в стандартном технологическом процессе [13].

■ Рис. 3. Схема триггера с резисторами в цепях связей между вентилями

Обычный триггер содержит 2 КМОП-вентиля (4 транзистора VT1 - VT4) и 2 ключа (VT5 - VT6). Ключи служат для связи триггера с окружающей средой. Сигнал на шине управления ШУ открывает ключи. В режиме записи на выводы D и D подается прямое и инверсное значение записываемого бита от внешнего источника сигнала. В режиме чтения на выводах D и D появляются сигналы, соответствующие состоянию триггера.

Ячейка DICE содержит 4 КМОП-вентиля (8 транзисторов VT1 - VT8) и 4 ключа (VT9 - VT12), связывающих ячейку с окружающей средой. Каждый транзистор схемы может находиться в двух состояниях: открыт (О) и закрыт (З). В режиме хранения информации сигнал на ШУ = 0 и ключи закрыты: (VT9 - VT12) = (ЗЗЗЗ). Анализируя работу ячейки в режиме хранения, нетрудно убедиться, что она имеет 2 устойчивых состояния. Будем рассматривать уровни напряжения в точках A, B, C, D, соотнося их с логическим значением сигнала. В состоянии ABCD = 0101

VT5- VT8

транзисторы находятся в состоянии--------------=

ЗОЗО VT1- VT4

=------, и это состояние устойчиво. Оно соответ-

ОЗОЗ

ствует хранению «0». В состоянии ABCD = 1010

VT5- VT8

транзисторы находятся в состоянии--------------=

VT1- VT4

а)

VT7

VT5

£ A

VT6

С

B

D VT9 VT10 VT11 Г VT12

ШУ

D

б)

D

ПІТ

VT5

ШУ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I—і. VT3 AP

n-3|_|

I VT1 VT2

+ E

VT4

P

B

D VT6

■ Рис. 4. Схемы радиационно-стойкой DICE (а) и ее прототипа, не защищенного от SEU (б)

ОЗОЗ

=-------. Это состояние также устойчиво и соот-

ЗОЗО

ветствует хранению «1». Сигнал на ШУ открывает ключи. В режиме записи на выводы Б и Б подается прямое и инверсное значение записываемого бита от внешнего источника сигнала. В режиме чтения на выводах Б и Б появляются сигналы, соответствующие состоянию триггера.

Рассмотрим процессы в схемах рис. 4, а и б в режиме хранения «0» при возникновении в точке А «ложного» импульса, связанного с попаданием радиоактивной частицы в нагрузочный транзистор первого вентиля.

В схеме рис. 4, б в состоянии хранения «0»:

УТ3 - УТ4

ШУ = 0, (УТ5 - УТ6) = ЗЗ, АВ = 01, =

ЗО УТ1- УТ2

= . При попадании частицы в транзистор УТ3

на выходе первого инвертора в точке А возникает «ложный» импульс: А = 0 ^ 1 ^ 0. Этот импульс воздействует на УТ2 и УТ4: УТ2 = З ^ О, УТ4 = = О ^ З, как следствие В = 1 ^ 0, по цепи обратной связи это приводит к переключению первого вентиля: (УТ1, УТ3) ^ (ЗО). Таким образом, триггер переключился в состояние «1». Произошел сбой.

В схеме рис. 4, а в состоянии хранения «0»: ШУ = 0, ключи (УТ9 - УТ12) = ЗЗЗЗ, транзисто-

УТ5 - УТ8 ЗОЗО

ры------------=-------. Учитывая, что сопротив-

УТ1- УТ4 ОЗОЗ ление открытого транзистора составляет примерно 100 Ом, а закрытого — 1012 Ом, АВСБ = 0101. При попадании частицы в транзистор УТ5 он открывается, и на выходе первого инвертора в точке А возникает «ложный» импульс: А = 0 ^ 1 ^ 0. Этот импульс воздействует на транзисторы УТ6 и УТ4, находящиеся в разных инверторах. Тран-

УТ5- УТ8

зисторы изменят свои состояния: --------------=

ЗОЗО ОЗЗО УТ1 — УТ4

=---------и-----. Рассмотрим изменение состоя-

ОЗОЗ ОЗОО ний соответствующих инверторов: (УТ6, УТ2) =

= ОЗ ^ ЗЗ. При этом паразитная емкость в точке В сохранит значение В = 1 на некоторое время, и воздействие дальше не передается. Под действием утечек напряжение в точке В будет уменьшаться: В = 1 ^ 0. Инвертор (УТ8, УТ4) = ОЗ ^ ОО. Напряжение в точке Б уменьшится, но не до 0. Этот спад напряжения воздействует на УТ3, закрывая его, и на УТ5, пытаясь открыть его. Последнее является положительной обратной связью, воздействие которой складывается с воздействием части-

УТ5 - УТ8

цы. Итак, схема перейдет в состояние

ОЗЗО

VT1- VT4

. За счет паразитных емкостей вентили 2

ОЗЗО

и 3 сохраняют на некоторое время свое состояние, а вентили 1 и 4 находятся в неопределенном

возбужденном состоянии. Все зависит от длительности импульса, вызванного эффектом SEE. Если длительность не велика (меньше времени разряда паразитной емкости на выходе второго инвертора), то схема придет в прежнее устойчивое состояние ABCD = 0101. Это — наиболее вероятный исход. Схемным способом подавлено воздействие эффекта SEE. Если энергия частицы велика, длительность «ложного» импульса превысит разряд паразитной емкости и разовьется регенеративный процесс, начало которого было описано, то схема придет в новое устойчивое состояние: ABCD = 1010. Это — сбой.

В результате проведенного анализа можно заключить, что предложенное в ячейке DICE решение является достаточно эффективным, но не гарантирует полного исключения сбоев SEU. Результаты тестирования показали, что при проектной норме 90 нм надежность триггеров, выполненных по технологии DICE, увеличивается в 10 раз. Также были предложены модификации DICE, имеющие большую избыточность и пониженное быстродействие. Но качественных улучшений они не дают. Поэтому необходимы дополнительные меры на более высоких уровнях организации систем.

Защита триггеров от SET

Все способы защиты отдельных триггеров от SET сводятся к фильтрации «ложных» импульсов на входах, т. е. основаны на временной избыточности.

Принцип подхода, обеспечивающего защиту от SET на входе триггера, показан на рис. 5. Имеется комбинационная схема, реализующая логику формирования сигнала, подаваемого на вход D триггера. В комбинационной схеме может возникнуть «ложный» сигнал из-за эффекта SET, который нужно подавить на пути распространения ко входу D. Для этого цепь передачи выходного сигнала комбинационной схемы разделяется на три ветви, причем во вторую ветвь включена задержка т, в третью ветвь — задержка 2т. Три ветви цепи передачи сигнала поступают на входы мажоритара, выходной сигнал которого равен совпадающим двум или трем сигналам на его входах. Таким образом, если задержка т не меньше,

■ Рис. 5. Защита триггера от «ложных» импульсов SET

чем длительность «ложного» сигнала, этот сигнал будет подавлен. Данный метод чувствителен к сбоям на линии синхронизации С (см. рис. 5) и связан с увеличением площади схемы триггера примерно в 3 раза. Имеется также подход с названием CWSP, использующий те же идеи, отличающийся меньшей избыточностью.

Общий недостаток рассмотренных подходов и решений — ограниченная по времени защита от SET, уязвимость при малых проектных нормах и при множественных эффектах SEE.

Всем решениям на уровне запоминающих элементов свойственен еще один недостаток: они не позволяют зарегистрировать факт сбоя, выявить успешность или неуспешность его устранения. Соответственно, при изменении условий работы устройства или при деградации его параметров они не позволяют решить задачу своевременной реконфигурации до наступления отказа.

Заключение

На основе анализа проблемы повышения радиационной стойкости ИУС и аналитического обзора основных результатов по повышению радиационной стойкости элементов можно сделать следующие выводы.

1. Предложенные решения на уровне элементов дают эффект повышения радиационной стойкости, но не являются достаточными для построения отказоустойчивых систем. Они позволяют уменьшить интенсивность потока сбоев. И при существующих технологиях, особенно по мере дальнейшего уменьшения проектной нормы, актуальность дополнительных мер по обеспечению отказоустойчивости будет возрастать.

2. Интенсивность потока восстанавливаемых отказов при действии частиц высоких энергий во много (сотни) раз больше интенсивности невос-станавливаемых отказов. Поэтому основное внимание при проектировании систем следует уделять процессам восстановления узлов, в которых происходят сбои.

3. Для уменьшения интенсивности потока отказов типа SEL (сбой-защелкивание) следует использовать элементы, выполненные по технологии «кремний на изоляторе». При недоступности этой технологии необходимо на уровне системы предусмотреть средства контроля энергопотребления кристалла и оперативного отключения кристалла от источника питания при возникновении SEL. Для восстановления работоспособности системы необходима поддержка процесса реконфигурации с введением резервного кристалла.

4. При использовании структурного резервирования узлов системы помимо задачи блокиро-

вания распространения отказа в пределах узла и обеспечения непрерывной работоспособности системы необходимо обеспечить возможность восстановления отказавшего экземпляра узла, а также функцию получения информации о потоке отказов и передачи ее на более высокий уровень организации системы.

5. При проектировании отказоустойчивых ИУС для выбора оптимального варианта необходимо оценивать все три общетехнических показателя: стоимость, производительность и надежность. Структурное резервирование можно выполнять на разных уровнях функциональной организации. Это порождает множество вариантов, отличающихся по всем трем показателям. При оценках надежности вариантов необходимо учитывать не только поток отказов, но и поток восстановлений. При организации восстановлений для систем реального времени необходимо учитывать цикличность процессов на уровне регистровых передач, команд, программ. Параметры потока

Литература

1. Юдинцев В. Радиационно-стойкие интегральные схемы, надежность в космосе и на земле // Электроника: НТБ. 2007. № 5. С. 72-77.

2. Гобчанский О., Попов В., Николаев Ю. Повышение радиационной стойкости индустриальных средств автоматики в составе бортовой аппаратуры // Современные технологии автоматизации. 2001. № 4. С.28-34.

3. Baumann R. Soft Errors in Commercial Integration Integrated Circuits // International Journal High Speed Electronics and Systems. 2004. Vol. 14. N 2. P. 299-309.

4. Gaillard R. Single Event Effects: Mechanisms and Classification // Frontiers in Electronic Testing. 2011. Vol. 41. P. 27-54.

5. Чумаков А. И. Прогнозирование локальных радиационных эффектов в ИС при воздействии факторов космического пространства // Микроэлектроника. 2010. Т. 39. № 2. С. 85-90.

6. Fan Wang, Agrawal V. D. Single Event Upset: An Embedded Tutorial // 21st Intern. Conf. on VLSI Design. 2008. P. 429-434.

7. Wirth G. Single Event Transients in Logic Circuits — Load and Propagation Induced Pulse Broadening // IEEE Transactions on Nuclear Science. 2008. Vol. 55. N 6. P. 2928-2935.

восстановления различны для различных циклов, и при проектировании ими можно управлять. При этом приходится учитывать особенности конкретных систем.

6. Следует отметить, что чем выше уровень организации систем и процессов, тем больше сказывается специфика конкретных систем. Поэтому наиболее общие решения по повышению радиационной стойкости возможны на уровне технологии изготовления полупроводниковых структур и на уровне библиотеки элементов. Но это не решает проблему, хотя и вносит ощутимый вклад. Объектом получения общезначимых результатов на более высоких уровнях организации, где сказывается специфика систем, являются методология, методики и инструментальные средства, поддерживающие процесс проектирования и создания отказоустойчивых систем. На кафедре компьютерных систем и программных технологий СПбГПУ ведутся исследования и разработки в этом направлении.

8. Koons H. C. et al. The impact of the space environment on space systems // Technical Report, AD-A376872; TR-99(1670)-1; SMC-TR-00-10 EL Segundo Technical Operations. http://adsabs.harvard.edu/abs/1999STIN ...0069036K (дата обращения: 30.01.2012).

9. James W., Howard Jr. Total Dose and Single Event Effects Testing of the Intel Pentium III (P3) and AMD K7 Microprocessors // IEEE Radiation Effects Data Workshop. 2001. P. 38-47.

10. Nguyen D. N., Scheick L. Z. TID, SEE and Radiation Induced Failures in Advanced Flash Memories // IEEE Radiation Effects Data Workshop. 2003. P. 18-23.

11. Kenneth A. Considerations for a Proton Single Event Effects (SEE) Guideline // NASA/GSFC 6th Spacecraft Charging Technology Conf. 2000. P. 7-11.

12. Weaver H. et al. An SEU Tolerant Memory Cell Derived from Fundamental Studies of SEU Mechanisms in SRAM // IEEE Transactions on Nuclear Science. 1987. Vol. 34. P. 1281-1286.

13. Benedetto J. et al. Heavy ion-induced digital single-event transients in deep submicron Processes // IEEE Transactions on Nuclear Science. 2004. Vol. 51. P. 3480-3485.

i Надоели баннеры? Вы всегда можете отключить рекламу.