Научная статья на тему 'ВОЗДЕЙСТВИЕ КОСМИЧЕСКОЙ РАДИАЦИИ НА ЦИФРОВЫЕ УСТРОЙСТВА НА БАЗЕ ПЛИС И МЕТОДЫ ПОВЫШЕНИЯ РАДИАЦИОННОЙ СТОЙКОСТИ ДАННЫХ СИСТЕМ'

ВОЗДЕЙСТВИЕ КОСМИЧЕСКОЙ РАДИАЦИИ НА ЦИФРОВЫЕ УСТРОЙСТВА НА БАЗЕ ПЛИС И МЕТОДЫ ПОВЫШЕНИЯ РАДИАЦИОННОЙ СТОЙКОСТИ ДАННЫХ СИСТЕМ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
32
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИОНИЗИРУЮЩЕЕ ИЗЛУЧЕНИЕ / ПРОГРАММИРУЕМАЯ ЛОГИЧЕСКАЯ ИНТЕГРАЛЬНАЯ СХЕМА / ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ / РАДИАЦИОННАЯ СТОЙКОСТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Муллов Константин Дмитриевич

Field Programmable Gate Arrays (FPGAs) are increasingly being used as a key component of digital systems due to their in-field reprogrammability, low non-recurring engineering costs, and relatively short design cycle. These characteristics, combined with high performance and high logic density, prove their feasibility for a number of ground and space level applications. Recently, a great interest aroused in using FPGAs onboard a spacecraft. FPGAs, like all semiconductor devices, are susceptible to radiation exposure. Radiation effects on electronic circuits used in extra-terrestrial applications and radiation prone environments need to be corrected. Since the variety of FPGA manufacturer’s offers, the radiation impact on them need to be studied and robust methods of fault tolerance need to be devised. The main subject of study in this paper is the effects of cosmic ionizing radiation on FPGAs, and some fault-tolerant design strategies. The paper gives a classification of radiation effects and classification of the various methods of increasing radiation resistance of digital equipment. Operation principles of the presented method are also discussed in this paper. The main result of the work is analysis of the advantages and disadvantages of methods allowing increasing the radiation resistance of digital FPGA-based devices and recommendations for hardware developers on the use of these methods. This paper summarizes the radiation effects on FPGAs, and methods to mitigate these effects. It also provides a case study of a successful FPGA system operating in space.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Муллов Константин Дмитриевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SPACE RADIATION IMPACT ON FPGA BASED DIGITAL UNITS AND IRRADIATION STABILITY HARDENING METHODS FOR SUCH SYSTEMS

Field Programmable Gate Arrays (FPGAs) are increasingly being used as a key component of digital systems due to their in-field reprogrammability, low non-recurring engineering costs, and relatively short design cycle. These characteristics, combined with high performance and high logic density, prove their feasibility for a number of ground and space level applications. Recently, a great interest aroused in using FPGAs onboard a spacecraft. FPGAs, like all semiconductor devices, are susceptible to radiation exposure. Radiation effects on electronic circuits used in extra-terrestrial applications and radiation prone environments need to be corrected. Since the variety of FPGA manufacturer’s offers, the radiation impact on them need to be studied and robust methods of fault tolerance need to be devised. The main subject of study in this paper is the effects of cosmic ionizing radiation on FPGAs, and some fault-tolerant design strategies. The paper gives a classification of radiation effects and classification of the various methods of increasing radiation resistance of digital equipment. Operation principles of the presented method are also discussed in this paper. The main result of the work is analysis of the advantages and disadvantages of methods allowing increasing the radiation resistance of digital FPGA-based devices and recommendations for hardware developers on the use of these methods. This paper summarizes the radiation effects on FPGAs, and methods to mitigate these effects. It also provides a case study of a successful FPGA system operating in space.

Текст научной работы на тему «ВОЗДЕЙСТВИЕ КОСМИЧЕСКОЙ РАДИАЦИИ НА ЦИФРОВЫЕ УСТРОЙСТВА НА БАЗЕ ПЛИС И МЕТОДЫ ПОВЫШЕНИЯ РАДИАЦИОННОЙ СТОЙКОСТИ ДАННЫХ СИСТЕМ»

Труды МАИ. Выпуск № 87 www.mai.ru/science/trudy/_

УДК 621.391.82

Воздействие космической радиации на цифровые устройства на базе ПЛИС и методы повышения радиационной стойкости данных систем

Муллов К.Д.

Московский авиационный институт (национальный исследовательский университет), МАИ, Волоколамское шоссе, 4, Москва, A-80, ГСП-3, 125993, Россия

e-mail: Kmullov@gmail.com

Аннотация

Основным предметом исследования в данной статье являются эффекты, возникающие в результате воздействия космического ионизирующего излучения на программируемые логические интегральные схемы (ПЛИС), а также методы борьбы с ними. В работе дается как классификация радиационных эффектов, так и классификация различных методов повышения радиационной стойкости цифровой аппаратуры. Также в данной работе рассматриваются принципы работы некоторых из представленных методов. Основным результатом работы является анализ преимуществ и недостатков методов повышения радиационной стойкости цифровой аппаратуры на базе ПЛИС и рекомендации к разработчикам аппаратуры по применению данных методов.

Ключевые слова: ионизирующее излучение, программируемая логическая интегральная схема, цифровая обработка сигналов, радиационная стойкость

Введение

Радиолокационный мониторинг является одним из наиболее эффективных и перспективных видов дистанционного зондирования Земли (ДЗЗ). В настоящее время широкое применение в мировой практике нашли радиолокационные средства ДЗЗ, использующие радиолокаторы с синтезированной апертурой самолетного и космического базирования. Развитие микроэлектроники и в частности использование программируемых логических интегральных схем (ПЛИС), высокоскоростных цифро-аналоговых (ЦАП) и аналого-цифровых преобразователей (АЦП) позволяет все шире применять цифровую обработку сигналов (ЦОС) непосредственно в локаторе, а так же реализовать цифровое формирование луча.

Существенное уменьшение объемов выпуска радиационно-стойкой компонентной базы и сокращение на рынке числа фирм-производителей таковой продукции привело к применению в космических аппаратах ПЛИС уровня качества Industrial. Основная причина заключается в том, что цена данной продукции на 1-2 порядка ниже, чем радиационно-стойкой. Также, из-за несовершенства отечественной элементной базы российские разработчики вынуждены применять ПЛИС иностранного производства [1].

Таким образом, повышение радиационной стойкости цифровой аппаратуры -одна из основных задач, стоящих перед космической промышленностью.

Целью данной работы является анализ воздействия космической радиации на цифровые устройства, а также анализ существующих базовых методов повышения

надежности и работоспособности цифровых систем на базе ПЛИС для космической аппаратуры.

1. Воздействие радиации на микросхемы ПЛИС

Микросхемы ПЛИС чувствительны к воздействию ионизирующей радиации [2]. Радиационные эффекты в ПЛИС, как и в других классах ИС, проявляются как сбои и отказы, которые следует разделять на два вида: параметрические и функциональные.

К параметрическим относятся отказы, связанные с изменением характеристик транзисторов в составе ИС. Параметрические отказы имеют разрушительный характер и приводят к необратимым эффектам в структуре микросхем. При применении цифровых устройств в условиях тяжелой радиационной обстановки используют специальные семейства ПЛИС, имеющие повышенные характеристики защиты от радиации, а также различные конструктивно-технологические методы, например экранирование.

К функциональным сбоям и отказам относят такие события, которые влияют или потенциально могут повлиять на работу отдельного функционального блока или устройства в целом. Во многих случаях именно функциональные отказы определяют уровень радиационной стойкости коммерческих ПЛИС. Это связано с функциональной сложностью микросхем и разнообразием блоков, входящих в ее состав. Эти сбои имеют обратимый характер, т.е. имеется возможность исправления этой ошибки аппаратно-программными методами без отключения питания микросхемы.

Считается, что основная радиационная угроза современным электронным приборам - это единичные события (Single Event Effects, SEE), вызванные воздействием высокоэнергетических частиц [3]. Вносимые в результате единичного события неисправности делятся на устойчивые (hard error) и исправимые (soft error) отказы (рисунок 1).

Рисунок 1 - Виды радиационных воздействий, приводящих к отказам

Существует множество различных методов борьбы с единичными событиями, возникающими в результате воздействия ионизирующего излучения. Классификация этих методов и базовые принципы работы некоторых из них будут рассмотрены далее.

2. Классификация методов повышения радиационной стойкости

микросхем ПЛИС

Различные радиационные тесты доказали необходимость применения методов повышения работоспособности микросхем в условиях воздействия ионизирующего излучения. Все эти методы можно условно классифицировать по принципу их работы, как это показано на рисунке 2:

Рисунок 2 - Классификация методов повышения радиационной стойкости

Основным принципом работы конструктивно-технологических методов является ослабление непосредственного влияния ионизирующего излучения на микросхемы. Этот эффект достигается либо с помощью конструирования различного рода защитных экранов, либо изменением параметров транзисторов, исходя из анализа механизмов воздействия радиации на них [3].

Однако введение различного рода избыточностей в аппаратно-программную часть является более эффективным, нежели разработка и применение специальных

радиационно-стойких микросхем. Поэтому для разработчика цифровых устройств на базе ПЛИС наибольший интерес представляют аппаратно-программные методы повышения работоспособности данных систем в условиях воздействия ионизирующего излучения.

Процесс реконфигурации представляет собой периодическое полное обновление конфигурационной памяти ПЛИС с помощью загрузки эталонной конфигурации из энергонезависимой, надежной, радиационно-стойкой памяти.

Также широко применяются различные способы помехоустойчивого кодирования. Более подробно о них можно узнать в [4].

Резервирование - метод повышения надежности технических устройств или поддержания их на требуемом уровне посредством введения аппаратной избыточности за счет включения запасных (резервных) элементов и связей, дополнительных по сравнению с минимально необходимым для выполнения заданных функций в данных условиях работы. Резервирование позволяет копировать информацию с целью ее сохранения после облучения микросхемы.

Ниже будут рассмотрены принципы работы базовых методов резервирования, их преимущества и недостатки, при этом не стоит забывать, что все эти методы могут быть модифицированы и улучшены различными способами.

3. Базовые аппаратно-программные методы повышения радиационной стойкости цифровых устройств на базе ПЛИС

Повышение стойкости ПЛИС к одиночным сбоям с помощью методов резервирования основано на трех принципах:

- резервное хранение информации за счет наличия ячейки хранения неискаженных после единичного события данных;

- обратная связь ячейки хранения исправных данных может способствовать восстановлению поврежденных данных после удара частицы;

- резервирование производится за счет аппаратных средств самой микросхемы ПЛИС, а не за счет увеличения числа микросхем.

3.1 Модульное резервирование

В данном методе все элементы цифровой вычислительной схемы троируются, а верное значение на выходе определяется по мажоритарной схеме [5]. Базовая идея данного метода и схема мажоритарного элемента изображены на рисунках 3 и 4, соответственно.

Рисунок 3 - Модульное резервирование

Рисунок 4 - Схема мажоритарного элемента для трех входов

Данный метод имеет ряд существенных недостатков. Прежде всего, он не гарантирует исправление всех ошибок, в случае если они возникнут одновременно в двух комбинационных блоках. Также данный метод неэффективен против накапливаемых ошибок. Поэтому чаще всего разработчики вместе с данным методом применяют скраббирование, т.е. периодическую реконфигурацию микросхемы для избавления от накопления ошибок. Скраббирование позволяет системе исправлять одиночные сбои без прерывания вычислительных операций.

Также данная техника приводит к увеличению ресурсов, используемых программой (логических ячеек, модулей памяти, цифровых сигнальных процессоров и т.д.), более чем в 3 раза и к увеличению энергии, потребляемой микросхемой.

3.2 Временное резервирование (Duplication with Comparison, DWC)

В этом методе одновременно используется аппаратная и временная избыточность, как представлено на рисунке 5 [6].

Рисунок 5 - Схема временного резервирования

Два резервных комбинационных блока обозначены CB0 и СB1 соответственно. Если сбой происходит в CB0, то Тс0 и Hcd будут иметь значение '1',

а Тс1 и Нс — '0'. Точно так же, сбой в CB1 может быть обнаружен, когда Тс1 и Hcd принимают значение '1', а Тс0 и Нс - '0'. На основе этих данных конечный автомат выбирает исправный блок. Но в случае, если Tc0 и Нс равны '0', а Тс1 и Hcd '1', нет возможности предсказать какой из блоков является неисправным. По этой причине данный метод не может исправить ошибки «защелкивания» нуля или единицы. Это привело к появлению метода дублирования с параллельным обнаружением ошибок, который модифицирует данную технику и позволяет обнаружить постоянный эффект единичного сбоя.

3.3 Дублирование со сравнением с параллельным обнаружением ошибок (Concurrent Error Detection, CED)

Этот метод использует дублирование вместе с параллельным обнаружением ошибок (CED), чтобы определить местоположение ошибки. Этот метод использует функции кодирования и декодирования (рисунок 6), чтобы повторно вычислить входные операнды. Эти функции выбираются таким образом, что бы на выходе повторно вычисленные операнды, отличались от структуры исходных операндов в случае возникновения ошибки.

A

B

B

A

ST0_

Encode Encode

MUX

MUX

ST1

Encode

Encode

MUX

MUX

dr0

dr1

decode dr0 — clk1

Tc0

decode dr1 — clk0

Hc

Voter

ST0 ST1

Номер работоспособного

модуля

Рисунок 6 - Метод дублирования с параллельным обнаружением ошибок

Схема выбора представлена на рисунке 7. Предположим, ошибка возникает в блоке 0. Тогда, Тс0 и Нс будут иметь значение '1'. Из диаграммы состояний схемы избирателей, представленной в [7], можно видеть, что схема впервые входит в состояние обнаружения ошибок, если Нс принимает значение '1'. Из этого состояния она переходит в безошибочное состояние dr1, если Тс0 равно '1'. Необходимо отметить, что не должно быть сбоев в более чем одном резервном модуле, в том числе в схемах обнаружения и голосования для верного функционирования.

dr0

dr1

dr0 dr1

MUX

Номер работоспособного модуля

MUX

clk0

MUX

MUX

clk1 clk2+d

tr0 tr 1 tr2

MAJ MAJ MAJ

Рисунок 7 - Схема выбора работоспособного блока

В DWC-CED, также как и в методе модульного резервирования, скраббирование исправляет ошибки в пользовательской комбинационной логике, а схема модульного резервирования триггеров конфигурационных логических блоков исправляет сбои в пользовательской логике. Скраббирование должно быть непрерывным, чтобы гарантировать, что произошел только один сбой между двумя периодами реконфигурации. Таким образом, время скраббирования должно быть достаточно коротким, чтобы избежать накопления сбоев в двух различных резервных блоках. Сбои в цепях обнаружения и голосования не мешают беспрерывной работе системы, потому что логика дублируется и случаи «залипания» логики устраняются в каждом тактовом цикле.

Заключение

В данной работе рассматривается воздействие космической ионизирующей радиации на ПЛИС. Дана классификация эффектов, возникающих в результате воздействия радиации.

Также в ходе работы были рассмотрены и проанализированы основные принципы работы базовых программных методов повышения радиационной стойкости ПЛИС. Были выявлены основные преимущества и недостатки каждого из методов, и были сформулированы рекомендации к разработчикам устройств цифровой обработки сигналов космического базирования по применению того или иного метода. На основе работы можно сделать вывод о необходимости разработки методов и моделей для проверки работоспособности цифровых схем в условиях воздействия радиации.

Библиографический список

1.Полесский С.Н., Жаднов В.В., Артюхова М.А., Прохоров В.Ф. Обеспечение радиационной стойкости аппаратуры космических аппаратов при проектировании // Компоненты и технологии. 2010. №9. С. 93-97.

2. M. Ceschia, M. Violante, «Identification and classification of single-event upsets in the configuration memory of SRAM-based FPGAs», IEEE Trans. Nucl. Sci., vol. 50, № 6, pp. 2088-2094, Dec. 2003.

3. Мироненко Л., Юдинцев В. Повышение радиационной стойкости интегральных схем. Конструктивные методы на базе промышленной технологии // Электроника. 2012. №8. С. 74-87.

4. Морелос-Сарагоса Р. Искусство помехоустойчивого кодирования. Методы, алгоритмы, применение - М.: Техносфера, 2006. - 320 с.

5. Баранников Л.Н., Ткачев А.Б., Хромцев А.В. Применение циклических кодов и приема со стиранием для цифровых каналов связи // Труды МАИ, 2005, №18: http: //www. mai .ru/science/trudy/published.php?ID=34194

6. Timmaraju A.S., Anand D. A. Input-Output Logic based Fault-Tolerant Design Technique for SRAM-based FPGA's, arXiv:1311.0602v2, 2013.

7. F. Lima, L. Carro, R. Reis, Single Event Upset Mitigation Techniques for SRAM-based FPGAs, Proceedings of the 4th IEEE Latin American Test Workshop, 2003.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. F.L. Kastensmidt, G. Neuberger, R.F. Hentschke, L. Carro, R. Reis, Designing Fault-Tolerant Techniques for SRAM-Based FPGAs, IEEE Design & Test of Computers, vol. 21, № 6, pp. 552-562, 2004.

i Надоели баннеры? Вы всегда можете отключить рекламу.