Труды МАИ. Выпуск № 87 www.mai.ru/science/trudy/_
УДК 621.391.82
Воздействие космической радиации на цифровые устройства на базе ПЛИС и методы повышения радиационной стойкости данных систем
Муллов К.Д.
Московский авиационный институт (национальный исследовательский университет), МАИ, Волоколамское шоссе, 4, Москва, A-80, ГСП-3, 125993, Россия
e-mail: Kmullov@gmail.com
Аннотация
Основным предметом исследования в данной статье являются эффекты, возникающие в результате воздействия космического ионизирующего излучения на программируемые логические интегральные схемы (ПЛИС), а также методы борьбы с ними. В работе дается как классификация радиационных эффектов, так и классификация различных методов повышения радиационной стойкости цифровой аппаратуры. Также в данной работе рассматриваются принципы работы некоторых из представленных методов. Основным результатом работы является анализ преимуществ и недостатков методов повышения радиационной стойкости цифровой аппаратуры на базе ПЛИС и рекомендации к разработчикам аппаратуры по применению данных методов.
Ключевые слова: ионизирующее излучение, программируемая логическая интегральная схема, цифровая обработка сигналов, радиационная стойкость
Введение
Радиолокационный мониторинг является одним из наиболее эффективных и перспективных видов дистанционного зондирования Земли (ДЗЗ). В настоящее время широкое применение в мировой практике нашли радиолокационные средства ДЗЗ, использующие радиолокаторы с синтезированной апертурой самолетного и космического базирования. Развитие микроэлектроники и в частности использование программируемых логических интегральных схем (ПЛИС), высокоскоростных цифро-аналоговых (ЦАП) и аналого-цифровых преобразователей (АЦП) позволяет все шире применять цифровую обработку сигналов (ЦОС) непосредственно в локаторе, а так же реализовать цифровое формирование луча.
Существенное уменьшение объемов выпуска радиационно-стойкой компонентной базы и сокращение на рынке числа фирм-производителей таковой продукции привело к применению в космических аппаратах ПЛИС уровня качества Industrial. Основная причина заключается в том, что цена данной продукции на 1-2 порядка ниже, чем радиационно-стойкой. Также, из-за несовершенства отечественной элементной базы российские разработчики вынуждены применять ПЛИС иностранного производства [1].
Таким образом, повышение радиационной стойкости цифровой аппаратуры -одна из основных задач, стоящих перед космической промышленностью.
Целью данной работы является анализ воздействия космической радиации на цифровые устройства, а также анализ существующих базовых методов повышения
надежности и работоспособности цифровых систем на базе ПЛИС для космической аппаратуры.
1. Воздействие радиации на микросхемы ПЛИС
Микросхемы ПЛИС чувствительны к воздействию ионизирующей радиации [2]. Радиационные эффекты в ПЛИС, как и в других классах ИС, проявляются как сбои и отказы, которые следует разделять на два вида: параметрические и функциональные.
К параметрическим относятся отказы, связанные с изменением характеристик транзисторов в составе ИС. Параметрические отказы имеют разрушительный характер и приводят к необратимым эффектам в структуре микросхем. При применении цифровых устройств в условиях тяжелой радиационной обстановки используют специальные семейства ПЛИС, имеющие повышенные характеристики защиты от радиации, а также различные конструктивно-технологические методы, например экранирование.
К функциональным сбоям и отказам относят такие события, которые влияют или потенциально могут повлиять на работу отдельного функционального блока или устройства в целом. Во многих случаях именно функциональные отказы определяют уровень радиационной стойкости коммерческих ПЛИС. Это связано с функциональной сложностью микросхем и разнообразием блоков, входящих в ее состав. Эти сбои имеют обратимый характер, т.е. имеется возможность исправления этой ошибки аппаратно-программными методами без отключения питания микросхемы.
Считается, что основная радиационная угроза современным электронным приборам - это единичные события (Single Event Effects, SEE), вызванные воздействием высокоэнергетических частиц [3]. Вносимые в результате единичного события неисправности делятся на устойчивые (hard error) и исправимые (soft error) отказы (рисунок 1).
Рисунок 1 - Виды радиационных воздействий, приводящих к отказам
Существует множество различных методов борьбы с единичными событиями, возникающими в результате воздействия ионизирующего излучения. Классификация этих методов и базовые принципы работы некоторых из них будут рассмотрены далее.
2. Классификация методов повышения радиационной стойкости
микросхем ПЛИС
Различные радиационные тесты доказали необходимость применения методов повышения работоспособности микросхем в условиях воздействия ионизирующего излучения. Все эти методы можно условно классифицировать по принципу их работы, как это показано на рисунке 2:
Рисунок 2 - Классификация методов повышения радиационной стойкости
Основным принципом работы конструктивно-технологических методов является ослабление непосредственного влияния ионизирующего излучения на микросхемы. Этот эффект достигается либо с помощью конструирования различного рода защитных экранов, либо изменением параметров транзисторов, исходя из анализа механизмов воздействия радиации на них [3].
Однако введение различного рода избыточностей в аппаратно-программную часть является более эффективным, нежели разработка и применение специальных
радиационно-стойких микросхем. Поэтому для разработчика цифровых устройств на базе ПЛИС наибольший интерес представляют аппаратно-программные методы повышения работоспособности данных систем в условиях воздействия ионизирующего излучения.
Процесс реконфигурации представляет собой периодическое полное обновление конфигурационной памяти ПЛИС с помощью загрузки эталонной конфигурации из энергонезависимой, надежной, радиационно-стойкой памяти.
Также широко применяются различные способы помехоустойчивого кодирования. Более подробно о них можно узнать в [4].
Резервирование - метод повышения надежности технических устройств или поддержания их на требуемом уровне посредством введения аппаратной избыточности за счет включения запасных (резервных) элементов и связей, дополнительных по сравнению с минимально необходимым для выполнения заданных функций в данных условиях работы. Резервирование позволяет копировать информацию с целью ее сохранения после облучения микросхемы.
Ниже будут рассмотрены принципы работы базовых методов резервирования, их преимущества и недостатки, при этом не стоит забывать, что все эти методы могут быть модифицированы и улучшены различными способами.
3. Базовые аппаратно-программные методы повышения радиационной стойкости цифровых устройств на базе ПЛИС
Повышение стойкости ПЛИС к одиночным сбоям с помощью методов резервирования основано на трех принципах:
- резервное хранение информации за счет наличия ячейки хранения неискаженных после единичного события данных;
- обратная связь ячейки хранения исправных данных может способствовать восстановлению поврежденных данных после удара частицы;
- резервирование производится за счет аппаратных средств самой микросхемы ПЛИС, а не за счет увеличения числа микросхем.
3.1 Модульное резервирование
В данном методе все элементы цифровой вычислительной схемы троируются, а верное значение на выходе определяется по мажоритарной схеме [5]. Базовая идея данного метода и схема мажоритарного элемента изображены на рисунках 3 и 4, соответственно.
Рисунок 3 - Модульное резервирование
Рисунок 4 - Схема мажоритарного элемента для трех входов
Данный метод имеет ряд существенных недостатков. Прежде всего, он не гарантирует исправление всех ошибок, в случае если они возникнут одновременно в двух комбинационных блоках. Также данный метод неэффективен против накапливаемых ошибок. Поэтому чаще всего разработчики вместе с данным методом применяют скраббирование, т.е. периодическую реконфигурацию микросхемы для избавления от накопления ошибок. Скраббирование позволяет системе исправлять одиночные сбои без прерывания вычислительных операций.
Также данная техника приводит к увеличению ресурсов, используемых программой (логических ячеек, модулей памяти, цифровых сигнальных процессоров и т.д.), более чем в 3 раза и к увеличению энергии, потребляемой микросхемой.
3.2 Временное резервирование (Duplication with Comparison, DWC)
В этом методе одновременно используется аппаратная и временная избыточность, как представлено на рисунке 5 [6].
Рисунок 5 - Схема временного резервирования
Два резервных комбинационных блока обозначены CB0 и СB1 соответственно. Если сбой происходит в CB0, то Тс0 и Hcd будут иметь значение '1',
а Тс1 и Нс — '0'. Точно так же, сбой в CB1 может быть обнаружен, когда Тс1 и Hcd принимают значение '1', а Тс0 и Нс - '0'. На основе этих данных конечный автомат выбирает исправный блок. Но в случае, если Tc0 и Нс равны '0', а Тс1 и Hcd '1', нет возможности предсказать какой из блоков является неисправным. По этой причине данный метод не может исправить ошибки «защелкивания» нуля или единицы. Это привело к появлению метода дублирования с параллельным обнаружением ошибок, который модифицирует данную технику и позволяет обнаружить постоянный эффект единичного сбоя.
3.3 Дублирование со сравнением с параллельным обнаружением ошибок (Concurrent Error Detection, CED)
Этот метод использует дублирование вместе с параллельным обнаружением ошибок (CED), чтобы определить местоположение ошибки. Этот метод использует функции кодирования и декодирования (рисунок 6), чтобы повторно вычислить входные операнды. Эти функции выбираются таким образом, что бы на выходе повторно вычисленные операнды, отличались от структуры исходных операндов в случае возникновения ошибки.
A
B
B
A
ST0_
Encode Encode
MUX
MUX
ST1
Encode
Encode
MUX
MUX
dr0
dr1
decode dr0 — clk1
Tc0
decode dr1 — clk0
Hc
Voter
ST0 ST1
Номер работоспособного
модуля
Рисунок 6 - Метод дублирования с параллельным обнаружением ошибок
Схема выбора представлена на рисунке 7. Предположим, ошибка возникает в блоке 0. Тогда, Тс0 и Нс будут иметь значение '1'. Из диаграммы состояний схемы избирателей, представленной в [7], можно видеть, что схема впервые входит в состояние обнаружения ошибок, если Нс принимает значение '1'. Из этого состояния она переходит в безошибочное состояние dr1, если Тс0 равно '1'. Необходимо отметить, что не должно быть сбоев в более чем одном резервном модуле, в том числе в схемах обнаружения и голосования для верного функционирования.
dr0
dr1
dr0 dr1
MUX
Номер работоспособного модуля
MUX
clk0
MUX
MUX
clk1 clk2+d
tr0 tr 1 tr2
MAJ MAJ MAJ
Рисунок 7 - Схема выбора работоспособного блока
В DWC-CED, также как и в методе модульного резервирования, скраббирование исправляет ошибки в пользовательской комбинационной логике, а схема модульного резервирования триггеров конфигурационных логических блоков исправляет сбои в пользовательской логике. Скраббирование должно быть непрерывным, чтобы гарантировать, что произошел только один сбой между двумя периодами реконфигурации. Таким образом, время скраббирования должно быть достаточно коротким, чтобы избежать накопления сбоев в двух различных резервных блоках. Сбои в цепях обнаружения и голосования не мешают беспрерывной работе системы, потому что логика дублируется и случаи «залипания» логики устраняются в каждом тактовом цикле.
Заключение
В данной работе рассматривается воздействие космической ионизирующей радиации на ПЛИС. Дана классификация эффектов, возникающих в результате воздействия радиации.
Также в ходе работы были рассмотрены и проанализированы основные принципы работы базовых программных методов повышения радиационной стойкости ПЛИС. Были выявлены основные преимущества и недостатки каждого из методов, и были сформулированы рекомендации к разработчикам устройств цифровой обработки сигналов космического базирования по применению того или иного метода. На основе работы можно сделать вывод о необходимости разработки методов и моделей для проверки работоспособности цифровых схем в условиях воздействия радиации.
Библиографический список
1.Полесский С.Н., Жаднов В.В., Артюхова М.А., Прохоров В.Ф. Обеспечение радиационной стойкости аппаратуры космических аппаратов при проектировании // Компоненты и технологии. 2010. №9. С. 93-97.
2. M. Ceschia, M. Violante, «Identification and classification of single-event upsets in the configuration memory of SRAM-based FPGAs», IEEE Trans. Nucl. Sci., vol. 50, № 6, pp. 2088-2094, Dec. 2003.
3. Мироненко Л., Юдинцев В. Повышение радиационной стойкости интегральных схем. Конструктивные методы на базе промышленной технологии // Электроника. 2012. №8. С. 74-87.
4. Морелос-Сарагоса Р. Искусство помехоустойчивого кодирования. Методы, алгоритмы, применение - М.: Техносфера, 2006. - 320 с.
5. Баранников Л.Н., Ткачев А.Б., Хромцев А.В. Применение циклических кодов и приема со стиранием для цифровых каналов связи // Труды МАИ, 2005, №18: http: //www. mai .ru/science/trudy/published.php?ID=34194
6. Timmaraju A.S., Anand D. A. Input-Output Logic based Fault-Tolerant Design Technique for SRAM-based FPGA's, arXiv:1311.0602v2, 2013.
7. F. Lima, L. Carro, R. Reis, Single Event Upset Mitigation Techniques for SRAM-based FPGAs, Proceedings of the 4th IEEE Latin American Test Workshop, 2003.
8. F.L. Kastensmidt, G. Neuberger, R.F. Hentschke, L. Carro, R. Reis, Designing Fault-Tolerant Techniques for SRAM-Based FPGAs, IEEE Design & Test of Computers, vol. 21, № 6, pp. 552-562, 2004.