Нетрадиционный взгляд на рабочее диагностирование вычислительных устройств

Дрозд Александр Валентинович

УДК 681.325 А. В. ДРОЗД

НЕТРАДИЦИОННЫЙ ВЗГЛЯД НА РАБОЧЕЕ ДИАГНОСТИРОВАНИЕ ВЫЧИСЛИТЕЛЬНЫХ УСТРОЙСТВ

Рассматриваются вопросы рабочего диагностирования вычислительных устройств. Показывается, что его развитие проходило под действием модели точных данных, которая определила цель, основное требование к методам, оценку их эффективности только для частного случая обработки точных данных. Рассматриваются особенности приближенных вычислений, которые указывают на необходимость пересмотра основных положений рабочего диагностирования. Анализ настоящей цели рабочего диагностирования выявил низкую достоверность традиционных методов при их использовании в условиях роста значимости обработки приближенных данных.

Введение

Одним из наиболее устойчивых ранних стереотипов, добротно закрепляемых школьным образованием, является негативное отношение к ошибке. Нас не только приучают к мысли, что ошибки следует исключать. Создается устойчивое убеждение, что это возможно.

Вместе с тем, ошибка является одной из основ нашего мира, вне которой этот мир просто не существует, не развивается и не познается.

Ошибка - это разница между абсолютной и относительной истинами, т. е. мир познается посредством ошибки, путем ее бесконечного преодоления.

Методом проб и ошибок происходит развитие мира. Например, в живой природе такой ошибкой является мутация, которая при определенных условиях закрепляется в ходе естественного отбора как основной путь дальнейшей эволюции. И нет другого способа развития мира, нежели путем искажения, т.е. ошибки.

Однако все это следует из невозможности самого существования вне ошибки.

Изготовление любого изделия предполагает соблюдение всех его характеристик в определенных пределах - допусках. Если изделие выполнено в пределах допусков, то оно имеет право на существование, а иначе отбраковывается. Все в этом мире существует в пределах допусков.

Право на ошибку - это право на существование в пределах допусков, которые составляют жизненное пространство существования. Если температура тела человека была бы задана в одной точке 36,6°С без права на какие-либо отклонения, то право человека на существование было бы сведено на нет. Таким образом, мир не существует вне ошибки.

Количественные оценки сущего - это числа с допуском, т.е. имеющие жизненное пространство, они являются приближенными данными - результатами измерений и их обработки. Таким образом, наш мир является миром приближенных данных, и все, что в нем находится, структурируется под его реалии. Поэтому доля обработки приближенных данных, т.е. данных «от Бога», постоянно растет и будет только возрастать. Это можно проследить на примере развития персональных компьютеров в части аппаратной поддержки арифметики с плавающей точкой, используемой для приближенных вычислений: от сопроцессоров необязательной поставки (Intel8087/287/387) до встроенных конвейеров FPU с плавающей точкой в составе Intel486, Pentium и т.д. [1].

Следует отметить, что человек живет в своем мире чисел, которые сводятся к точным данным.

Точные данные - целые по своей природе. К ним относятся только номера элементов множеств, которые естественно описывать порядковыми числительными.

Приближенные данные из Мира подменяются номерами. Например, 36,6 - это 366-е по значимости числовое значение из диапазона 0 - 999.

Компьютерная техника поддерживает такое восприятие данных, поскольку представление информации двоичными или другими кодами, т.е. кодирование данных, является нумерацией.

Все, что можно записать в разрядную сетку компьютера, - точные данные, поскольку их значения можно поставить в соответствие порядковым номерам, т.е. пронумеровать. Например, в 3-битовой разрядной сетке могут быть записаны двоичные коды, значения которых 0, 1, ..., 7 могут быть отождествлены с их номерами: от нулевого до седьмого. Это распространяется и на представление в компьютере приближенных данных в форматах с плавающей точкой, поскольку мантисса записывается в определенную разрядную сетку, и все ее значения могут быть пронумерованы.

Так, компьютерной техникой была закреплена сложившаяся к этому времени модель точных данных, которая состоит в том, что все числа, независимо от их настоящей природы, рассматриваются как точные данные.

Многие представления, в первую очередь связанные с компьютером, находятся в плену модели точных данных. Никто не объявлял эту модель, однако она ограничила развитие компьютера. Можно утверждать, что проектирование, диагностика и эксплуатация компьютера складывались и развиваются в настоящее время в рамках модели точных данных, иными словами, все или почти все в этих и других областях сделано только для случая точных данных, т.е. данных «не от Мира сего». Для снятия этого ограничения, как минимум, необходимо его осознать и признать.

Сегодня задачи, решаемые с использованием компьютерной техники, за редким исключением, не выявляют противоречия между моделью точных данных и приближенным характером обрабатываемых данных. Однако противоречие есть, и с нарастанием значимости обработки приближенных данных оно усиливается. Не преодолевая его, невозможно подняться над уровнем сегодняшних задач.

Насколько серьезны заблуждения, порождаемые моделью точных данных, можно проследить на примере развития рабочего диагностирования (РД) вычислительных устройств (ВУ). По сей день находятся вне обсуждения исторически сложившиеся ошибочно сформулированные основные понятия, включая цель РД, ряд «неоспоримых» догм, оценки эффективности методов, оставляющие РД в рамках действия модели точных данных.

1. Из истории рабочего диагностирования

Рабочее диагностирование ВУ имеет много названий, и принято считать, что оно заключается в контроле правильности работы ВУ (его цифровой схемы) на рабочих воздействиях, т.е. в процессе использования по назначению [2]. Такой контроль осуществляет обнаружение ошибок одновременно с работой ВУ (concurrent checking [3], concurrent error detection [4]), дает оперативную оценку его технического состояния и потому называется также оперативным (on-line testing) [5]. Условия его выполнения подразумевают аппаратную реализацию и неразрывную связь с контролируемым ВУ, за что данный контроль называют также аппаратурным [6], аппаратным или оперативным аппаратным [7] в отличие от программного и встроенным в противоположность выносному контролю. По отношению к тестовому диагностированию основным отличительным признаком РД является характер входных воздействий: РД осуществляется на рабочих входных воздействиях, а для тестового диагностирования на вход ВУ поступают тесты. Рабочее диагностирование называют также функциональным, подчеркивая, что оно выполняется в процессе функционирования ВУ, т.е. на фактических данных [8].

Изначально РД заимствовало методы и средства из теории и практики связи для передачи сообщений на расстояния. В условиях помех эфира сообщения необходимо кодировать, используя избыточные коды (обнаруживающие ошибки в сообщении и корректирующие для восстановления искаженного сообщения). Передатчик сообщений включает в себя функции кодирующего устройства - кодера, а приемник - декодирующего устройства, т. е. декодера.

Пусть, например, передаваемые сообщения используют алфавит из 8 букв (8,а не 33 взято для упрощения примера). Пронумеруем буквы двоичными кодами от 0002 до 1112. Для их избыточного описания используем групповой код [9], порождающая матрица которого имеет вид, показанный в табл. 1.

Групповой код (табл. 2) содержит нулевое слово 0, слова порождающей матрицы 1, 2 и 4, а также слова 3, 5, 6 и 7, которые получаются при выполнении операции сложения по модулю 2 над словами порождающей матрицы. Так, слово 3 получается суммой по модулю 2 слов 1 и 2. Слово содержит информационные и проверочные разряды. Информационные

разряды 1, 2 и 3 описывают букву сообщения. Проверочные разряды 4, 5 и 6 делают код буквы избыточным. Если в принятом сообщении все слова принадлежат групповому коду, то это сообщение считается правильным.

Принадлежность слова групповому коду может быть проверена с помощью уравнения линейного синдрома. Такие уравнения составляются для каждого проверочного разряда путем его определения в виде суммы по модулю 2 информационных разрядов порождающей матрицы. Для рассматриваемого группового кода уравнения имеют следующий вид:

4 = 2 0 3;

5 = 1 0 3;

6 = 1 0 2.

Слово принадлежит групповому коду, т.е. является кодовым, если справедливы все уравнения линейного синдрома. В противном случае обнаруживается ошибка.

По уравнениям строится декодер - схема контроля (СК), выполненная на сумматорах по модулю 2, элементе ИЛИ и формирующая сигнал контроля Е (рис. 1).

Таблица 1 Порождающая матрица

Разряды

№ 1 2 3 4 5 6

1 0 0 1 1 1 0

2 0 1 0 1 0 1

4 1 0 0 0 1 1

Таблица 2 Групповой код

Разряды

№ 1 2 3 4 5 6

0 0 0 0 0 0 0

1 0 0 1 1 1 0

2 0 1 0 1 0 1

3 0 1 1 0 1 1

4 1 0 0 0 1 1

5 1 0 1 1 0 1

6 1 1 0 1 1 0

7 1 1 1 0 0 0

Кодер и декодер рассматривались абсолютно надежными во время передачи сообщения и проверялись только тестами в паузах работы. Это положение было наследовано РД, для которого СК не проверялась в процессе работы.

В 1968 г. на конгрессе в Эдинбурге Картер и Шнайдер впервые обратили внимание на необходимость проверки СК в рабочем режиме [10]. С этой целью они предложили строить самопроверяемые схемы, что стало важным шагом в развитии РД, впервые распространенным на СК. В основу теории самопроверяемых схем легли следующие определения [11].

Схема является защищенной для множества неисправностей Б, если для каждой из них на выходе схемы не вычисляются неправильные кодовые слова для входных кодовых слов.

Схема является самотестируемой для множества неисправностей Б, если для каждой из них на выходе схемы вычисляется некодовое слово хотя бы для одного входного кодового слова.

Схема является полностью самопроверяемой, если защищена и самотестируема.

Пусть пары кодовых слов отличаются на кодовое расстояние ^ т.е. в d разрядах.

Если неисправность вызывает ошибку в 1 разрядах и 1;^, то схема является защищенной, поскольку вычисляет на выходе некодовое слово. Кодовое расстояние d обеспечивается введением проверочных разрядов. Поэтому защищенность схемы определяет информационную избыточность, необходимую для обнаружения одной неисправности по первой ошибке.

Самотестируемость схемы направлена на создание условия для обнаружения первой неисправности до возникновения второй. Условие предполагает, что в интервале времени между этими неисправностями появятся все входные кодовые слова. Это возможно при редком появлении неисправностей и работе схемы на высокой частоте, т. е. при высокой надежности и производительности ВУ, что уже было достигнуто к концу 60-х годов.

Схема на рис. 1 не является самотестируемой для множества одиночных константных неисправностей.

Действительно, неисправность «0» на выходе схемы определяет нулевое слово Е = 0 для всех входных кодовых слов. Неисправность «0» на входах элемента ИЛИ также делает схему несамотестируемой и несамопроверяемой.

Для получения самопроверяемой схемы (рис. 2) разряды 4, 5 и 6 дополняются инверсными разрядами'4,'5 и'6. Вводятся также узлы Картера (иС), преобразующие две пары разрядов Х1 = Х2 и У1 = У2 в одну такую пару

= Б 2 . На выходе СК вычисляет двухразрядный код Е{1, 2}. В случае обнаружения ошибки

Е{1} = Е{2}, а иначе Е{1} = Е{2}.

В следующих десятилетиях и по настоящее время основное развитие РД шло по пути разработки самопроверяемых схем.

Используя контроль по паритету, по модулю и другие методы, самопроверяемые схемы были разработаны для комбинационных схем [12], синхронных и асинхронных автоматов [13], а также сумматоров, умножителей, делителей, АЛУ и т.д. [14].

Теория самопроверяемых схем сыграла важную роль, определив понятия РД, по которым

Рис. 2. Самопроверяемая схема

1 2 3 4 3< ©

1 Е

©

Рис. 1. Схема контроля

1 2 3 4 5 6

©>5

Х1 ис

Х2

У1

У2 Б2

-Х1 ис

Х2 У1

У2

Б2

Е{1}

Е{2}

4

5

6

происходит его развитие по сей день. Были сформулированы цель РД, основное требование к его методам и др., что, однако, пришло время обсудить.

2. Догмы рабочего диагностирования

Определения самопроверяемых схем зафиксировали ряд сложившихся к этому времени догм, которые кажутся неоспоримыми по сей день:

- Цель РД - оценка исправности схемы путем обнаружения ее неисправностей.

- Основное требование, предъявляемое к методам РД, - обнаружение неисправности схемы по первой ошибке.

- Исправная схема вычисляет только достоверные результаты, а недостоверные результаты вычисляются только неисправной схемой.

Вместе с тем, объявленная цель, которая должна достигаться в процессе вычислений:

- противоречит здравому смыслу;

- опровергается практикой;

- недостижима для самопроверяемых схем.

Действительно, уподобим вычислительный процесс полету самолета. Поиск неисправностей в процессе полета немало удивил бы пассажиров. Уж если задаться целью обнаружить неисправность, то для этого лучший способ - создание критических условий! Например, фигуры высшего пилотажа, а для схемы - колебания питания, вибрация и т.п. Конечно же, цель состоит в другом - долететь, дорешать вычислительную задачу, которая состоит в выполнении определенного объема вычислений за заданное время с получением достоверных результатов. При ограниченной надежности средств решения задачи часть результатов может быть недостоверна. Для их выявления и необходимо РД. А обнаруживать неисправности следует до начала работы методами тестового диагностирования.

Неисправную схему можно представить минным полем.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Неисправность - мина.

Тесты - саперы, которые выявляют мину до начала вычислений.

Фактические данные - хлебопашцы, ради которых «разминируется» схема. Поиск неисправностей на фактических данных противоречит здравому смыслу, также как поиск мин в процессе земледелия.

Ошибки вызываются сбоями и отказами.

Сбой возникает намного чаще, чем отказ. Поэтому, как правило, первая обнаруживаемая ошибка вызывается сбоем. Сбой действует короткий период времени, после чего схема снова исправна. Поэтому обнаружение сбоя далее не подтверждается. Из этого следует, что, на практике, первая ошибка обнаруживается не в целях оценки исправности схемы, а для ответа на вопрос: «Можно ли использовать вычисленный результат или он недостоверен и требует пересчета?».

Более того, по первой ошибке нельзя судить о неисправности самопроверяемой схемы и в случае отказа, поскольку его невозможно идентифицировать по одной ошибке (то ли одиночной в случае сбоя, то ли первой из серии ошибок, генерируемых отказом).

Настоящая цель РД - оценка достоверности вычисляемого результата.

Следует отметить, что, согласно объявленной цели, напротив, оценка результата служит для определения исправности самопроверяемой схемы, т. е. цель и средства поменяны местами.

Когда у РД оказываются две цели, возникают естественные вопросы:

1) Почему объявлена ненастоящая цель? Кто виноват?

2) В какой степени различаются объявленная и настоящая цели?

Виновником заблуждений является модель точных данных. Никто не объявлял эту модель, но она определила:

- логику, положенную в основу теории самопроверяемых схем;

- цель РД;

- основное требование к методам РД;

- развитие РД.

Логика, на которой основывается теория самопроверяемых схем, состоит в том, чтобы вычислять достоверные результаты только на исправной схеме. Это следует из догмы о получении достоверных результатов на исправной схеме, а недостоверных - на неисправ-

ной. Однако эта догма, как это будет показано ниже, справедлива только для точных данных.

Точное данное становится недостоверным при любом его искажении. Поэтому обнаруженная ошибка одновременно указывает и на неисправность схемы, и на недостоверность точного результата. Это отождествляет объявленную и настоящую цели для случая точных данных, где поиск неисправностей позволяет оценивать достоверность результата.

Основное требование к методам РД - обнаруживать первую ошибку - исходит из того, что каждая ошибка делает результат недостоверным, что справедливо только для точных данных.

Таким образом, можно утверждать, что РД разработано только для частного случая обработки точных данных.

3. Особенности обработки приближенных данных

Как влияет на РД приближенный характер обрабатываемых данных? Для ответа на этот вопрос необходимо рассмотреть особенности обработки приближенных данных.

Первой особенностью является использование операции умножения в записи приближенного данного в наиболее распространенной нормальной форме, например, в форматах с плавающей точкой число записывается в виде произведения т Ч д р, где т - мантисса, q -основание системы счисления, р - показатель степени [15]. Произведение двух операндов удваивает длину результата двуместной операции. Согласно теории ошибок, количество верных разрядов результата не превышает количество верных разрядов операнда. Поэтому наиболее распространены форматы одинарной точности, для которых младшая половина вычисленного результата отбрасывается.

Второй особенностью обработки приближенных данных является нарушение ассоциативного закона. Рассмотрим сложение миллиона с миллионом единиц, используя двуместные операции и разрядную сетку длиной п < 20. Сумма миллиона и единицы равна миллиону, поскольку единица теряется при выравнивании порядков. Миллион таких операций также определяет результат, равный первому числу, т. е. одному миллиону. Правильный результат - два миллиона - можно получить, изменив порядок вычислений. Сначала следует сложить пары единиц, затем полученные двойки и так продолжать до вычисления миллиона, который далее складывается с первым числом.

Вычисление одного миллиона вместо двух показывает несостоятельность догмы, утверждающей, что исправная схема вычисляет достоверный результат.

Третьей особенностью является выравнивание порядков, которое выполняется в наиболее часто используемых операциях сложения.

Приближенный результат содержит старшие верные и младшие неверные разряды [16].

Определение. Ошибка, вызванная неисправностью вычислительной схемы, является существенной, если снижает количество верных разрядов результата, и несущественной в противном случае.

Особенности обработки приближенных данных определяют факторы, снижающие долю существенных ошибок.

Первая особенность приводит к исключению несущественных ошибок, возникающих в отбрасываемой половине вычисляемого результата. Первый фактор определяет долю оставляемых ошибок по формуле К1 = п / пс, где п и пс - количество оставляемых и вычисляемых разрядов результата. К1 = 0,5 для пс = 2 п, т.е. половина всех ошибок относится к несущественным.

Для восстановления действия ассоциативного закона используются расширенные форматы, удлиненные за счет младших неверных разрядов, что приводит к увеличению доли несущественных ошибок. Второй фактор определяет долю существенных ошибок в расширенном формате по формуле К2 = пЕ / п, где пЕ и п - количества разрядов мантиссы в базовом и расширенном форматах. В форматах с плавающей точкой разрядность мантисс увеличивается в 2,7 раза с 24 бит в одинарном формате до 64 бит в двойном расширенном формате [15], что определяет К2 = 0,37.

При выравнивании порядков мантисса числа с меньшим порядком сдвигается вправо с потерей младших разрядов. При этом исключаются из вычислений младшие разряды результатов всех предшествующих операций. Ошибки в этих разрядах, перешедших из

верных в неверные, становятся несущественными. Третий фактор К3 можно оценить по формуле К3 = 1 - 0,25 ОС / ОО, где ОС - количество оборудования узлов ВУ, предшествующих сдвигу мантиссы; ОО - общее количество оборудования ВУ [17].

В случае нескольких операций К3 определяется как произведение факторов каждой из них.

Перечисленные факторы можно рассматривать как действующие независимо. Поэтому вероятность того, что ошибка является существенной, можно оценить долей существенных ошибок в общем количестве ошибок по формуле РС = К1 К2 К3, которая показывает, что РС << 1, и существенные ошибки значительно менее вероятны, чем несущественные [17].

4. Достоверность методов рабочего диагностирования

Различие объявленной и настоящей цели можно проследить по тому, как они определяют достоверность методов РД. Для этого рассмотрим квадрат с единичной длиной сторон и, соответственно, единичной площадью (рис. 3).

Рг

Рн=1-Рс

Рс

о Р

0 Р

1

Р

Рос=Ро Рс 1 РоН=Ро Рн 2

3 РпС=Рп Рс 4 РпН=Рп Рн

о Р

с Рч

Рис. 3. Вероятности обнаружения и пропуска ошибок Рис. 4. Случай точных данных

На горизонтальной стороне квадрата откладываются вероятности Рс и Рн = 1 - Рс того, что возникшая ошибка является существенной и несущественной, а на вертикальной стороне - вероятности Р0 и РП = 1 - Р0 ее обнаружения и пропуска. При этом квадрат разбивается на четыре части, определяющие вероятности РОС и РОН обнаружения существенных и несущественных ошибок, а также вероятности РПС и РПН их пропуска, для которых выполняется соотношение

РОС + РОН + РПС + РПН = 1

где Рос = Ро Рс; Рон = Ро Рн = Ро (1 - Рс); Рпс = Рп Рс = (1 - Ро) Рс; Рпн = Рп Рн = (1 - Ро) (1 - Рс).

Согласно объявленной цели, метод РД является достоверным, если обнаруживается неисправность, независимо от того, является ли вызванная ею ошибка существенной или нет. Это определяет показатель достоверности метода РД как сумму частей 1 и 2 квадрата по следующей формуле:

Оо = РОС + Рон.

Согласно настоящей цели, метод РД является достоверным, если правильно оценивает вычисляемый результат: достоверный результат определяет достоверным, а недостоверный результат - недостоверным. Оценка достоверности результата производится путем обнаружения или пропуска ошибки, а действительным признаком достоверного или недостоверного результата является отсутствие или наличие существенной ошибки.

В части 1 квадрата метод РД обнаруживает существенную ошибку, справедливо определяя результат недостоверным. В части 2 квадрата обнаруживается несущественная ошибка, что приводит к отбраковке достоверного результата - метод РД дает ошибочную оценку результата. Часть 3 квадрата также указывает на ошибку метода РД, поскольку пропущена существенная ошибка, и недостоверный результат не выявлен. В части 4 квадрата метод РД игнорирует несущественную ошибку, справедливо подтверждая достоверность вычисляемого результата. Поэтому показатель достоверности метода РД складывается из частей 1 и 4 квадрата и определяется по следующей формуле:

0 = РОС + РПН.

Объявленная и настоящая цели различаются в оценке достоверности метода РД: показатели достоверности БО и Б отличаются друг от друга на части 2 и 4 квадрата.

Каковы размеры различающих частей квадрата?

Для ответа на этот вопрос следует принять во внимание высокую вероятность обнаружения ошибок, достигнутую в современных методах РД, т.е. Р0 >> РП.

В случае точных данных вероятность РС = 1, поскольку все ошибки являются существенными. Из этого следует, что РОН = Р0 (1 - Рс) = 0 и РПН = (1 - Р0) (1 - Рс) = 0. Иными словами, для случая точных данных части 2 и 4 исключаются из квадрата, как это показано на рис. 4, а показатели достоверности БО и Б, описываемые частью 1 квадрата, совпадают и являются высокими. Это еще раз свидетельствует о том, что РД разработано для частного случая обработки точных данных и в этих рамках обеспечивает высокую эффективность.

Для общего случая необходимо учесть соотношение РС << РН, присущее обработке приближенных данных.

На рис. 5 показана реальная картина разбиения квадрата на части. Размеры части 1 квадрата значительно сокращаются вследствие малого значения вероятности РС, а часть 2, напротив, увеличивает свои размеры и становится основной частью квадрата, описывая совершенно новое качество методов РД отбраковывать достоверные результаты при обнаружении несущественных ошибок.

Рс Рн

Рос Рсн 2

Рпс Рпн

Рис. 5. Реальная оценка обнаружения и пропуска ошибок

Ранее, т. е. в рамках действия модели точных данных, достоверные результаты вычислений могли быть отбракованы только при условии, что ошибка находится в контрольных кодах и вызвана неисправностью средств контроля (ошибка второго рода). Сам метод РД не мог отбраковать достоверный результат по причине отсутствия несущественных ошибок в результате обработки точных данных.

Реальная оценка вероятностей обнаружения и пропуска существенных и несущественных ошибок позволяет сделать следующие выводы:

- объявленная и настоящая цели РД различаются на самую большую часть 2 квадрата, которая практически совпадает с самим квадратом, т. е. для приближенных данных цели становятся диаметрально противоположными;

- показатель достоверности методов РД является высоким в рамках объявленной цели и низким для настоящей цели.

Анализируя квадрат, можно предложить три пути повышения достоверности Б методов

РД [18]:

- увеличить часть 1 квадрата, повышая вероятность РС (рис. 6);

- увеличить часть 4 квадрата, снижая вероятность РО (рис. 7);

- увеличить части 1 и 4 квадрата, делая вероятность РО различной для обнаружения существенных (РО _ С) и несущественных ошибок (РО _ Н), РО _ С > РО _ Н (рис. 8).

РС

Рн

РС

Рн

о

Рос Рон п

1

Рпс Рпн

ос

Р

пс

Р,

он

РП

Рис. 6. Первый путь повышения Б

Рис. 7. Второй путь повышения Б

Рс

Р

н

Рон

Рос

Рпн

1 4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рпс

Рис. 8. Третий путь повышения £>

Заключение

В табл. 3 взгляд на РД, сложившийся под действием модели точных данных, сравнивается с реальностью.

Таблица 3 Различные взгляды на РД

4

Под влиянием модели Реальность

Рабочее диагностирование (РД) разработано для всех типов данных Рабочее диагностирование разработано только для случая точных данных

Цель РД - оценка исправности схемы Цель РД - оценка достоверности результата

Все обрабатываемые числа рассматриваются как точные данные В большинстве случаев обрабатываемые числа -приближенные данные

Все ошибки являются существенными Большинство ошибок относится к несущественным

Традиционные методы РД имеют высокую достоверность, обнаруживая почти все ошибки и неисправности Традиционные методы РД имеют низкую достоверность контроля результата, в основном обнаруживая несущественные ошибки

Осталось выяснить последнюю серию вопросов: «Почему наши заблуждения нам прощаются, и как долго это будет происходить?».

Человечество уже вступило в эру принятия ответственных решений, и от способности просчитывать их последствия зависит, насколько долго она продлится. Защищенность общества определяется умением решать задачи на пределе возможностей, что требует создания своей теории и реализаций на практике.

Методы РД демонстрируют достоверность контроля результатов на уже происшедшей ошибке, поэтому влияние достоверности на решение вычислительных задач зависит от вероятности появления ошибок.

Сегодняшние вычислительные задачи решаются в условиях низкой вероятности появления ошибок, поэтому показанная в работе низкая достоверность традиционных методов РД, отбраковка достоверных результатов, выполняемая почти по каждой ошибке, остается незамеченной.

При решении вычислительной задачи на пределе возможностей ограничением степени распараллеливания вычислений является сложность средств решения задачи, а ограничением сложности - их надежность. Таким образом, решение сложных задач происходит в условиях плотного потока неисправностей, что приводит к значительной доле результатов, посчитанных с ошибками. Пересчет ошибочных результатов может существенно удлинить время решения задачи, исключая саму возможность ее решения в реальном масштабе времени.

Несущественные ошибки и обеспечение высокой вероятности их пропуска составляют важную предпосылку для решения сложной задачи, поскольку большинство результатов, посчитанных под действием проявившихся в виде ошибки неисправностей, являются достоверными. Однако для реализации этой предпосылки необходимо высвободить методы РД из «плена» модели точных данных. Следует разрабатывать методы РД, которые признают за числом его право на существование в пределах допусков, т. е. право оставать-

ся достоверным при возникновении несущественных ошибок. Методы РД должны уметь различать существенные и несущественные ошибки результатов обработки приближенных данных.

Если без ошибок существование невозможно, то ошибку необходимо сделать союзником, и использовать жизненное пространство, предоставляемое ею числу, для расширения возможностей решать сложные задачи.

Список литературы: 1. ГукМ. Процессоры Intel: от 8086 до Pentium II. СПб: Питер, 1997. 224 с. 2. Гуляев В. А., Макаров С. М., Новиков В. С. Диагностика вычислительных машин. К.: Техника, 1981. 167 с. 3. Metra C., Favalli M. and Ricco B. Concurrent Checking of clock signal correctness // IEEE Design & Test October 1998. P. 42 - 48. 4. Touba N. A. andMcCluskey E. J. Logic synthesis techniques for reduced area implementation of multilevel circuits with concurrent error detection // Proc. IEEE Inf. Conf. on Computer Aided Design. 1994. P. 651 - 654. 5. Metra C., Schiano L., Favalli M and Ricco B. Self-checking scheme for the on-line testing of power supply noise // Proc. Design, Automation and Test in Europe Conf. Paris (France). 2002. P. 832 - 836. 6. NicolaidisM. and Zorian Y. On-line testing for VLSI - a compendium of approaches // Electronic Testing: Theory and Application (JETTA). 1998. V. 12. P. 7 - 20. 7.Журавлев Ю. П., Котелюк Л. А., Циклинский Н. И. Надежность и контроль ЭВМ. М.: Сов. радио, 1978. 416 c. 8. Основы технической диагностики / В. В. Карибский, П. П. Пархоменко, Е. С. Согомонян, В. Ф. Халчев. М.: Энергия, 1976. 464 c. 9. Кузьмин И.В., Кедрус В.А. Основы теории информации и кодирования. 2-е изд. Киев: Вища шк., 1986. 238 с. 10. Carter W., Schneider P. Design of Dynamically Checked Computers // Proc. IFIP Congress 68. Edinburgh (Scotland). 1968. P. 878 - 883. 11. Anderson D. A., Metze G. Design oftotally self-checking check circuits for m-out-of-n codes // IEEE Trans. Comput. 1977. V. C - 22, N 3. P. 263 - 269.12. Smith J. E. and Metze G. The design of totally self-checking combinational circuits // in Proc. Int. Symposium on Fault Tolerant Computing Dig. - Los Angeles (USA). 1977. P. 130 - 134. 13. Ozguner F. Design oftotally self-checking asynchronous and synchronous sequential machines // in Proc. Int. Symposium on Fault Tolerant Computing Dig. Los Angeles, USA. 1977. P. 124 - 129. 14. NicolaidisM., Bedder H. Efficient Implementation of Self-checking Multiply and Divide Arrays // in Proc. 1994 European Design and Test Conf. - Paris, France. 1994. P. 134 - 137. 15. ANSI/IEEE Std 754-1985. IEEE Standard for Binary Floating-Point Arithmetic. IEEE, New York, USA, 1985. 18 р. 16. ДемидовичБ.П., МаронИ.А. Основы вычислительной математики. М.: Физматгиз, 1966. 664 с. 17. DrozdA. On-line Testing of Computing Circuits at Approximate Data Processing // Radioelectronics & Informatics. 2003. № 3. P. 113 - 116. 18. Drozd A.,Lobachev M., Drozd J. The problem of on-line testing methods in approximate data processing // Proc. 12th IEEE International On-Line Testing Symposium, Como, Italy. 2006. P. 251 - 256.

Поступила в редколлегию 07.06.2009

Дрозд Александр Валентинович, д-р. техн. наук, профессор Одесского национального политехнического университета. Научные интересы: техническая диагностика, отказоустойчивые вычислительные устройства проектирования. Адрес: Украина, 65044, Одесса, пр. Шевченко, 1.

Нетрадиционный взгляд на рабочее диагностирование вычислительных устройств Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Дрозд Александр Валентинович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Дрозд Александр Валентинович

Increase in reliability of on-line testing methods using natural time redundancy

Текст научной работы на тему «Нетрадиционный взгляд на рабочее диагностирование вычислительных устройств»