Научная статья на тему 'СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ВЫЧИСЛЕНИЙ В ПОЗИЦИОННОЙ СИСТЕМЕ СЧИСЛЕНИЯ И СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ'

СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ВЫЧИСЛЕНИЙ В ПОЗИЦИОННОЙ СИСТЕМЕ СЧИСЛЕНИЯ И СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
44
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЗИЦИОННАЯ СИСТЕМА СЧИСЛЕНИЯ / СИСТЕМА ОСТАТОЧНЫХ КЛАССОВ / ДОСТАТОЧНАЯ СТАТИСТИКА ОБНАРУЖЕНИЯ / ПРОПУСКНАЯ СПОСОБНОСТЬ / ТОЧНОСТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кивалов Александр Николаевич, Шаталова Валентина Александровна

На примере расчета достаточной статистики обнаружения вычислительными средствами, реализующими вычисления в позиционной системе счисления (ПСС) и системе остаточных классов (СОК), выполнен сравнительный анализ быстродействия и точности обработки. Представлены результаты для следующих случаев: 1. Обработки в ПСС без применения усечения и округления результатов умножения; 2. Обработки в ПСС с использованием операций усечения и округления до X +1 разрядов; 3. Обработки в СОК в случае применения одномодульной и многомодульной арифметики вычетов. Показано, что СОК позволяет упростить архитектуру вычислительных электронных устройств, за счет чего повышается не только скорость, но и энергетическая эффективность вычислительных средств.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE ANALYSIS OF THE RESULTS OF CALCULATIONS IN POSITIONAL NUMBER SYSTEM AND IN A SYSTEM OF RESIDUAL CLASSES

On an example of sufficient statistics of detecting by calculation facilities, which implement calculations in a positional number system and in a system of residual classes comparative analyses of computing speed and accuracy ofprocessing is done. Several cases are submitted for the following results: 1) treatment in a positional number system without using truncating and rounding of multiplication results; 2) treatment in a positional number system using truncating and rounding to % +1 digits; 3) treatment in a system of residual classes in case of using single-module and multi-module residue arithmetic. There presented, that the system of residual classes allows to simplify the architecture of computing electronic devices, due to that increases speed and energetic affectivity of calculating facilities.

Текст научной работы на тему «СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ВЫЧИСЛЕНИЙ В ПОЗИЦИОННОЙ СИСТЕМЕ СЧИСЛЕНИЯ И СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ»

УДК 511; 519.6

DOI: 10.24412/2071-6168-2022-12-235-244

СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ ВЫЧИСЛЕНИЙ В ПОЗИЦИОННОЙ СИСТЕМЕ СЧИСЛЕНИЯ И СИСТЕМЕ ОСТАТОЧНЫХ КЛАССОВ

А.Н. Кивалов, В.А. Шаталова

На примере расчета достаточной статистики обнаружения вычислительными средствами, реализующими вычисления в позиционной системе счисления (ПСС) и системе остаточных классов (СОК), выполнен сравнительный анализ быстродействия и точности обработки. Представлены результаты для следующих случаев: 1. Обработки в ПСС без применения усечения и округления результатов умножения; 2. Обработки в ПСС с использованием операций усечения и округления до X +1 разрядов; 3. Обработки в СОК в случае применения одномодульной и многомодульной арифметики вычетов. Показано, что СОК позволяет упростить архитектуру вычислительных электронных устройств, за счет чего повышается не только скорость, но и энергетическая эффективность вычислительных средств.

Ключевые слова: позиционная система счисления, система остаточных классов, достаточная статистика обнаружения, пропускная способность, точность.

Одними из наиболее важных характеристик вычислительных средств (ВС), используемых в различных приложениях, являются их производительность (определяемая количеством вычислительной работы за единицу времени) и точность вычислений.

На производительность ВС в первую очередь влияют такие факторы, как: тактовая частота работы процессора ВС, число команд программы (задачи, алгоритма) и число тактов для выполнения одной команды (среднее время выполнения одной команды). Количественно производительность ВС зависит от тактовой частоты работы процессора и от времени реализации арифметических и других операций, входящих в состав команды программы.

Решение вычислительных задач на базе позиционной системы счисления (ПСС) сопровождается значительными временными затратами при установленной точности вычисления.

Применение системы остаточных классов (СОК) позволяет решить эту проблему за счет перехода к обработке малоразрядных данных, что дает возможность организовать параллельные вычисления на уровне элементарных арифметических операций и при этом повысить быстродействие и точность решения многих прикладных задач [1]. Многими специалистами отмечается, что отличительной особенностью модулярной арифметики является отсутствие переносов между соседними цифрами чисел, что не только повышает быстродействие, но и позволяет эффективно распределять и векторизовать вычисления, поскольку нет зависимости по данным. Одновременно с этим модулярная арифметика обеспечивает высокую устойчивость к ошибкам округления [1-3].

Целью работы является практическое подтверждение эффективности применения СОК для повышения производительности и точности ВС при цифровой обработке данных.

1. Анализ результатов вычислений достаточной статистики обнаружения в ПСС и СОК по сложности, быстродействию

Проанализируем результаты вычислений достаточной статистики (ДС) обнаружения в ПСС и СОК для случаев:

1. Цифровой обработки сигналов (ЦОС) в ПСС без ограничений разрядной сетки;

2. ЦОС в ПСС с использованием операций усечения и округления до X +1 разрядов;

3. ЦОС в СОК в случае одномодульной и многомодульной арифметики вычетов.

Затем выполним их сравнительный анализ для двух вариантов сложности алгоритмов.

1. Цифровая обработка сигналов (ЦОС) в ПСС без ограничений разрядной сетки

1.1. Вычисление ДС обнаружения сигнала s на фоне белого гауссовского шума (БГШ) в радиолокации и радиосвязи и определяется выражением [3]:

1р = ?Т • т • §р = ?Т • пр, (1)

где: Т = (%1,..., % N ) - матрица выборок входного усеченного гауссовского векторного случайного процесса размера р х N, %Т = (,..., йр ) - вектор выборок входного СПр в ' - ом пространственном канале обработки размера 1 х р, N - число пространственных каналов, ^р = (^ р^,..., gрN ) - вектор весовых коэффициентов ФАР размера 1хN, р- угловая координата цели, ^Т = (/},...,/р) - вектор выборок

- --Т

ожидаемого сигнала 8 размера 1х р, р - число выборок на интервале наблюдения Т\, Т2 , символ -

означает операцию транспонирования.

Будем считать, что каждый из детерминированных элементов gр^ вектора ^р в двоичном коде может быть представлен конечным числом % +1 членов ряда, соответствующим разрядности кода, определяемой динамическим диапазоном АЦП

% к —Т —

gрi = Ер 2 = •е

к=0

где

0р = {ррцо,---,6рц%) - вектор двоичных чисел, равных 0или 1 Вектор ^р с учетом формулы (2) равен

i = 1, N,

еТ =(20,...,2%).

(2)

Г пТ е 1 Г пТ 1

0р1 •е пр1

пТ е пТ

пPN •е

• е = 0

(3)

рч

где 0 р - матрица размера N х (% +1).

Каждый из детерминированных элементов I. вектора f в двоичном коде также может быть

представлен в виде конечного числа членов ряда, аналогично (2)

% к Т I. = I Р.к2 = ф. ^ к=0

. = l, Р.

Вектор Г с учетом формулы (4) равен

f =

Г — Т— 1 Г—Т1

Ф1 е Ф1

— Т

ф ре ф р

(4)

(5)

•е = Ф е,

где Ф - матрица размера р х (% +1).

Матрицы 0, Ф и параметр р в дальнейшем считаются известными.

Аналогично (2) и (4) каждый из элементов случайного вектора |Т = (р1,...,рр) определим следующим образом

Р. = % Ьук 2к = ьТе, к=0

i = 1, N,

. = l, Р,

(6)

где ьТ - вектор случайных величин (СВ) ь.к размера 1х(% +1), % +1- количество разрядов в представлении каждого элемента Р.. выборки ¥ двоичным кодом.

•'Ч

С учетом формулы (6) матрицу ¥ можно записать в виде

¥ = (1,...,— N )

где В - матрица СВ ь.к размера р х N%, I - единичная матрица размера N х N, ® - означает прямое произведение соответствующих векторов или векторов, которое позволяет записать

(1 0 ... 0 ^ (е 0 ... 0 ч\

0 1 ... 0 _ — 0 е ...

■ ьТ . ь 1 (7)

= •(I ® е) = В (I ® е),

ь[рё . ь —Т . ь щ

I ® е =

® е =

, 0 0 ... 1) 1 0 0 ... е

V / V /

Тогда на основании выражений (3), (5) и (7) ДС 1р определим соотношением

¡1Р= ГТ • ¥ • §р= еТ • ФТ

•[(В (I ® е))(0 • е )] = tr[(I ® е )• 0 • (е • еТ )• ФТ • в], где 1г[] - означает операцию вычисления следа матрицы, расположенной в квадратных скобках.

:(2°,...,2%)

(8)

Рассмотрим элементарную матрицу Е = (е • еТ ), используя еТ = (20

( 20 ' ■ 20 20 20 • 21 ... 20 2%" ■ 20 21 . . 2% " (9)

Е = (ё-ёТ )= (20 21 ... 2%) 21 = 21 20 21 • 21 ... 21 2% = 21 22 . . 2%+1

12%) 2% • 20 2% • 21 ... 2% • 2%. 2% 2%+1 . . 22%

Определим связь между величинами N, р и числом бит представления, обеспечивающими вычисление ¡^р в ПСС при выполнении предположений (2) - (9) в случае 1.

Выражение (1) соответствует случаю разделяющейся обработки и моделям узкополосных сигналов, принимаемых от медленно или быстро флуктуирующих целей.

Цифровая обработка принимаемой информации вида (1) включает вычисление двух сверток: 1.

Пространственной Пр = ¥ • §р и 2. Временной 1р = рТ •цр. Расчеты по алгоритму (1) потребуют выполнения Np операций умножения и ( — 1)р сложения для вычисления пространственной свертки. Для расчета временной свертки потребуется выполнить р операций умножения и (р — 1) сложения.

В соответствии с выражением Пр = [(в • (1 ® е))• (© • е)] для расчета каждого элемента ^р^ пространственной свертки в ПСС необходимо выполнить N операций умножения % +1 разрядных двоичных чисел, (осуществляемых последовательно в одном умножителе или параллельно в N умножителях) и затем суммирование N — 1 полученных произведений. Аналогичные вычисления следует повторить р — 1 для формирования вектора выборок Пр .

Следует учесть, что вследствие переполнения разрядной сетки, результаты умножения могут достигать 2(% +1) разрядов, а результаты суммирования зависят от числа слагаемых N. Таким образом, максимально возможное число разрядов может достигать 2(% +1) + N — 1.

Вычисление ДС 1р потребует дополнительного выполнения р операций умножения, каждая

из которых предполагает перемножение % +1 разрядного числа на 2% +1) + N — 1 разрядное число, что

требует наличия 3(% +1) + N — 1 разрядов для запоминания результата. Последней операцией служит

выполнение р — 1 суммирования полученных чисел. В итоге получим конечный результат в виде

3(% + 1) + N + р — 2 разрядного числа.

1.2. Вычисление достаточной статистики (ДС) обнаружения сигнала8 на фоне небелого гаус-совского шума определяется выражением [3]:

¡2р = • ¥ • Q • 1р = РТ • ¥ • 1р2 = РТ • Пр2, (10)

где Q - матрица размера N х N, обратная ковариационной матрице совокупности помех и шума к и связанная с ней соотношением KQ = QK = I. Остальные величины были определены ранее в процессе описания обработки (1). Справедливыми остаются выражения (2) - (4) и отличия возникают лишь в векторах ^р и ^2р = Q • ^р . Полагаем { , Q, ^р известными.

Для вычисления ¡2р в соответствии с (10) необходимо выполнить следующие операции:

1. Рассчитать вектор Цр2 можно с помощью N умножений и

N ^ — 1) сложений, учитывая, что каждый элемент вектора %р2 находится по формуле

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N N XX ¡ а N Т Т Т , ч - (11)

8р2/ =2 Ч& •ёрк = 2 2 2 Чм • ёры- 21 • 2а= 2 Я* • е • еТ • 1рк = ^ •(х ® E)• 8р, I = 1, N, (11)

к=1 к=1 г=оа=о к=1

где Ч1к1 - цифры двоичной системы счисления элементов матрицы Q (когда она известна),

АТк = (О,-.Чгк%), йТрк = (,...,ёрк%) ЧТ = (СЛ) ^=(4,...,р), 1 - единичная матрица

размера N х N.

Вектор ^р2 определяется выражением

ёр2 = Ql (х ® Е)- 1р, (12)

- матрица размера N х N(% +1), а матрица (х ® Е) - N(% +1) х N(% +1).

где

Ql =

-Т 41

-Т 4 N

При этом число разрядов после умножения может удваиваться, а результат суммирования определяется числом 2(% +1) + N — 1 разрядов.

2. Для формирования компонент Г}р21 вектора Пр2 = ¥ • §р2 необходимо дополнительно N раз умножить 2(% +1) + N — 1 разрядное число на (% +1) разрядное, что увеличивает число разрядов произведения до величины 3(% +1) + N — 1. Суммирование N — 1 подобных чисел приводит к величине

3(2 +1)+ 2( — 1) разрядов по каждой из р компонент г)р2у вектора Пр2> определяемого аналогично формулам (11) и (12)

N N

~~Т Т ~~ Т / \ —

Лр2у = Т4ук • ёр2к = 2 ь ук • е• е • 1Р2к = ьу (1 ®е>§Р2= 3 = р,

к=1 к=1

(13)

где

3. Вычисление скалярного произведения векторов /^ = РТ • Пд2 потребует р умножений 3(2 +1) + 2(У — 1) разрядного числа на (2 +1) разрядное. Результат каждого из произведений отображается 4(х +1) + 2(У — 1) разрядным числом. Для получения ДС необходимо сложить р — 1 таких чисел. Итогом выполнения указанной операции будет число, содержащее 4(2 +1) + 2(У — 1) + р — 1 разрядов.

По результатам рассмотрения вычисления ДС и необходимо сделать ряд замечаний.

Замечание 1. Число разрядов представления результатов вычислений ДС зависит от сложности алгоритма обработки. Сложность алгоритмов обычно оценивают по времени выполнения или по используемой памяти. В обоих случаях сложность зависит от размеров входных данных: массив из 100 элементов будет обработан быстрее, чем аналогичный из 1000. При этом точное время мало кого интересует: оно зависит от процессора, типа данных, языка программирования и множества других параметров. Важна лишь асимптотическая сложность, т. е. сложность при стремлении размера входных данных к бесконечности.

Замечание 2. Представление векторов и матриц рТ, Q, ^ двоичным кодом отличается от рассмотренного выше числом бит. Например, для описания компонентов векторов V и можно использовать меньше бит, а матрицу д описывать большим числом бит и т.д. Этот случай имеет место при параметрической априорной неопределенности статистических характеристик выборок входного СПр ¥, когда они априорно неизвестны и заменяются оценками максимального правдоподобия. Дополнительные операции, связанные с формированием указанных оценок, существенно увеличивают сложность алгоритма и в данной работе не рассматриваются.

Замечание 3. В случае выполнения обработки по выборке ¥ конечной длины и конечным динамическим диапазоном обрабатываемого СПр приходится иметь дело с так называемым усеченным распределением вероятностей. Это может быть, например, равномерное, гауссовское, вейбулловское распределение и т.д. В данном случае будем считать его многомерным усеченным гауссовским распределением с числовыми характеристиками м[¥] = 0, М[¥Т¥], гдем[•] - означает операцию вычисления математического ожидания от выражения в квадратных скобках.

Поскольку усеченное многомерное гауссовское распределение вероятностей относится к устойчивым распределениям, то и на всех этапах обработки при полностью известных числовых характеристиках ее результат будет подчиняться усеченному многомерному гауссовскому распределению вероятностей, но с другими числовыми характеристиками.

В случае параметрической априорной неопределенности статистических характеристик выборок входного СПр ¥ выборочные оценки ковариационной матрицы будут подчиняться распределению Уишарта, что и необходимо учитывать в процессе анализа адаптивного алгоритма. Изменяется также и распределение выборочной матрицы, обратной выборочной ковариационной матрице м [¥Т ¥], а также вид и числовые характеристики самого распределения.

2. ЦОС в ПСС с использованием операций усечения и округления до 2 +1 разрядов

2.1. Обработка в ПСС с использованием операций округления до 2 +1 разрядов. Ранее уже отмечалось, что при точном умножении двух чисел в ПСС количество значащих цифр произведения превышает количество значащих цифр сомножителей, в пределе доходя до двойного количества значащих цифр. Пропадание младших разрядов сказывается лишь на точности вычислений и может быть допущено, тем более, что правила приближенных вычислений рекомендуют оставлять в произведении столько же значащих цифр, сколько их содержится в наименее точном из сомножителей. Это позволяет существенно улучшить массогабаритные характеристики вычислительного устройства и уменьшить время выполнения операций умножения ценой некоторого ухудшения точностных характеристик за счет усечения и округления результатов выполнения арифметических операций. Однако при любом представлении непрерывных переменных в результат умножения вносится ошибка в, для которой при любом из способов представления мантиссы будет справедливо следующее неравенство:

— 2—(2+1)<£< 2—(2+1). (14)

Все неравенства, относящиеся к ошибкам округления и усечения, удобно представить с помощью вероятности ошибок. Предполагается, что все возможные значения ошибки равновероятны,

т.е. ошибки распределены равномерно. При этом математическое ожидание ошибки округления определяется как т =

0,5 (— 2—(2+1) + 2—(2+1)) = 0, а дисперсия а2 = 12"1(2"(2+1) + 2-(2+1)2 = 12"12"2(2+1)+2 = 3—1 • 2—2(2+1).

Исходя из представления (14) замечаем, что дисперсия суммы N независимых СВ при вычислении пространственной свертки равна

ВП = 3-1 • 2-2(%+1)(N -1). (15)

Дисперсия ДС шума квантования равна

D¡ = 3-22-4(^+1)(N -1)(p -1). (16)

Аналогичные результаты имеют место и в случае вычисления временной свертки, когда умножаются и суммируются p независимых СВ с другими значениями % +1.

2.2. Использование округления до % +1 разрядов при вычислении ДС по (1) и (8). Поскольку при вычислении ДС по формулам (1) и (8) значения N и p априори известны, то величины з(% +1) + N + p - 2 и 4(% +1) + 2(N -1)+ p -1 можно рассчитать заранее и использовать при округлении ДС до величины % +1 разрядов (например, учесть при установке порога обнаружения). Тогда округленные значения ДС будут равны

11р = 2з(%+1) - 2%+1 = 2%+1(22(%+1) -1), (17)

¡2p = 24(%+1) - 2%+1 = 2%+1(2з(%+1) -1). (18) А максимальная ошибка, возникающая за счет округления, равна соответственно

Д/1р = 22(%+1)-1, (19)

М2р = 2з(%+1)-1. (20)

На основании выражений (14) - (16) можно получить статистические оценки вероятностей ошибок на каждом этапе вычислений, выполняемых ВС.

На основании приведенных аргументов можно утверждать, что сложность вычислений ¡2„

Zp

оказывается существенно выше, чем для ¡^p даже при полностью известных статистических характеристиках ошибок и числовых характеристик вероятностных распределений.

Замечание 4. Если округление выполняется после каждой операции умножения, то, как нетрудно заметить, ошибка округления такого рекуррентного алгоритма будет еще больше.

3. ЦОС в СОК в случае одномодульной и многомодульной арифметики вычетов Пусть а и M - два произвольных числа, причем M- положительное число. Тогда в результате деления числа а на число M получают частное r и остаток 5, удовлетворяющие одновременно равенству [4]

а = Mr + 5 (21)

и неравенству

0 < 5 < M. (22)

Основная теорема арифметики утверждает, что любое число может быть представлено в виде произведения

тг аг (23)

а = П p¡', i

где pi - i-ое простое число, а. - целочисленный показатель степени. Причем такое представление является единственным.

Если в (21) и (22) число M - целое и фиксировано, то оно называется модулем. Тогда для бесконечного числа вариантов выбора а можно получить один и тот же остаток 5 . В таких случаях говорят, что все эти числа сравнимы по модулю M . Остаток называется также вычетом по модулю M , или просто вычетом. Например, если M = 6, то а = 16, а = 28, а = -2, все дают один и тот же остаток, так что

16,28, - 2 сравнимы по модулю 6. Символ = принято использовать для обозначения сравнения. Таким

образом:

а1 = а2 modM (24)

означает то же самое, что

M^ - а2 ). (25)

Само собой разумеется, что если

а = OmodM, (26)

M| а. (27)

Кратко рассмотрим результаты сравнительного анализа вычислений в ПСС и СОК по быстродействию и точности, а также упрощению аппаратной части.

3.1. Сравнительный анализ быстродействия в ПСС и СОК.

Вариант 1. Применение СОК в одномодульной арифметике вычетов.

На первый взгляд не понятно, какое преимущество может дать такая система, однако существует 2 свойства, которые позволяют эффективно использовать модулярную арифметику в некоторых областях микроэлектроники:

1. Отсутствие переноса разрядов в сложении и умножении. Пусть нам дано два числа Х1 и Х2, представленные в виде системы остатков (Хц, х^,..., х\п) и (Х21, Х22,..., Х2„) по системе взаимно-простых чисел (м1,М2,...,Мп).В этом случае:

Хэ = Х1 + X 2 =( + Х21 )1^мь (х12 + х22 )modM2,..., (х1п + Х2п ) modMn ), (28)

Х4 = Х1 • Х2 = ((11 • Х21 )modMl,(х12 • Х22)modM2,...,(х1п • х2п)modMn), (29)

где а = Х M¿ - операция взятия остатка 5 от целочисленного деления X на м¿.

То есть, чтобы сложить или умножить два числа, достаточно сложить или умножить соответствующие элементы вектора, что для микроэлектроники означает, что это можно сделать параллельно и из-за малых размерностей (1^2,...^п) сделать очень быстро.

2. Ошибка в одной позиции вектора не влияет на расчеты в других позициях вектора. В отличие от ПСС все элементы вектора равнозначны и ошибка в одном из них ведет всего лишь к сокращению динамического диапазона. Этот факт позволяет проектировать устройства с повышенной отказоустойчивостью и коррекцией ошибок.

На рис. 1 пояснено, в чем заключаются отличия операций умножения в ПСС и СОК.

ПППОППОО □□□□□□["!□

□ □□□□□□□ □□□□ " □□□□ □□□□ □□□□ □ □□□□□□□ -V

□□□□□□□□

□ □□□□□□□ ог асу

□□□□о□□□

□□□□□□□□

ппопппоп □□□□□□□□

нас

. □□□□ "Е^г. □□□□

. □□□□ □□□□

□ □□□ 1 □□□□

□□□□ □□□□

□ □□□□□□□__□□□'□□□□'

□ □□□□□□□ □□□□□□□ у/

□□□□□□□о

а) 6)

Рис. 1. Отличия операций в ПСС и СОК: а - обычное умножение ПСС; б - модулярное умножение СОК

При этом следует всегда помнить, что в СОК следующие операции (называемые «немодульными») выполняются сложнее, чем в ПСС: сравнение чисел, контроль переполнения, деление, квадратный корень и.т.д.

Первый шаг в случае применения СОК состоит в выборе модуля преобразования, определяющего динамический диапазон без переполнения. Например, если взять число Ферма, равное М = = 65537, то можно работать с 16 разрядной сеткой. При этом максимальная длина последовательности равна = 65536.

Если работа выполняется с 32 разрядной или 64 разрядной сеткой можно применять числа Мерсенна M = 31 или M = 61.

При этом нет необходимости учета эффекта конечной разрядности чисел, возникающего за счет округления и усечения разрядной сетки, так как вычисления в СОК выполняются абсолютно точно. За счет использования секционирования удается максимально распараллелить обработку и обеспечить вычисление достаточно длинных последовательностей и, тем самым, снять ограничения.

Вариант 2. Применение СОК в многомодульной арифметике вычетов является гораздо более экономичным с точки зрения распараллеливания обработки (см. табл. 1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Достоинствами реализации в СОК является возможность существенного расширения динамического диапазона, повышения скорости и точности вычислений.

В рассматриваемом примере можно увеличить динамический диапазон, например, до (2210-1) в случае применения параллельной обработки в 4 каналах по 4 простым числам Мерсенна 2,3,5,7 и применения китайской теоремы об остатках (КТО). При этом время обработки не увеличивается. Упрощается аппаратная часть, так как будет использоваться память на 4, 8 бит. Она компактнее, имеет меньшие габариты, вес и стоимость. В целом, можно получить и другие значения % + 1 в пределах произведения 2-х, 3-х и т.д. чисел.

Аналогичные результаты будут получены в случае применения других модулей.

Выполнение операций умножения при использовании аппаратных способов вычисления ДС по формулам (1) и (8) занимают до 80% расчетного времени. Поскольку быстродействие и пропускная способность вычислителя напрямую зависят от числа производимых операций умножения и их длительности, основное внимание уделим минимизации времени выполнения именно операций умножения.

Рассмотрим особенности выполнения операций умножения в ПСС, приведенные в левой части

таблицы.

Способы ускорения операции умножения, выполняемых в ПСС, принято делить на аппаратные и логические. Как те, так и другие требуют дополнительных затрат оборудования.

Под аппаратными понимают такие способы, которые требуют для своей реализации введения дополнительного оборудования в основные арифметические цепи.

Под логическими понимают способы ускорения, при реализации которых сохраняется без каких-либо изменений основная структура устройства умножения, а ускорение достигается за счет усложнения схемы управления.

Далее рассматриваются аппаратные способы ускорения и варианты выполнения оптимальной обработки, реализуемые на основе ПСС и СОК.

3.2. Основные аппаратные способы ускорения операции умножения в ПСС:

1. Использование в стандартной структуре устройства умножения специализированного сумматора с запоминанием переносов между разрядами. Это позволяет существенно сократить время реализации одного цикла.

2. Матричный умножитель. Представляет собой специализированный многовходовой сумматор, позволяющий одновременно суммировать все частичные произведения.

3. Запоминание таблицы умножения в ПЗУ. Необходимость пояснения этого момента объясняется следующим:

Сравнивать обработку умножителей и других устройств необходимо в одинаковых условиях. По этой причине отпадает возможность применения аппаратных умножителей типа 1518ВЖ1, сочетающих в себе два первых способа ускорения операций умножения, так как для этого требуется затратить tyMH = 2(% +1— 1)is1 разр условных временных интервала (различных для различных применяемых

ВС), где tE1 разр - время одного цикла, необходимое для получения результата на выходах специализированного сумматора с запоминанием переносов между разрядами. Очевидно, число tE1 разр = 2(% +1). Поэтому, чем выше динамический диапазон D = 22(х+1) выходного сигнала умножителя, а, следовательно, и точность представления результата умножения, тем больше должно быть tE1 разр . Если умножение в СОК

будет выполняется за время tCOK = 1, то быстродействие ВС будет в tE1 pa3pjtCOK = 2(% +1) раз больше.

Поэтому остается надеяться, что предварительное запоминание таблицы умножения в ПЗУ для получения tE1 разр = 1 (табличный метод) является единственным методом, который позволяет сравнивать

различные системы с ПСС и СОК в равных условиях. Следует учитывать, что в ПСС, даже при применении табличного метода, архитектура вычислителя меняется, если требуется использовать, например, двойную точность вычислений.

Для расчета ДС по алгоритму (1) в ПСС при последовательном выполнении операций максимальное время выполнения операции умножения равно

^ умн(%+1) = X ' \ E1 разр + tC№ ) = X tсум (30)

тактов, где tE1 рззр - время суммирования одного разряда, tC^B - время сдвига на один разряд), tyM - максимальное время, необходимое для вычисления суммы двух % +1 разрядных чисел

1'сум = (tE1 разр + ^СДВ ) (31)

Подсчитаем время выполнения пространственной свертки. Время выполнения N операций умножения для расчета одного элемента вектора П(^) равно

tyMuE = N • tyMu = N '%• (tE1 „ + tC№ ) = N • tумн(Z+l). (32)

Для определения времени расчета всех элементов вектора П(^) дополнительно необходимо просуммировать результаты N — 1 умножения по формуле (11), затем увеличить его в p раз

tnp = Р • tv = p[N • tyмH(%+1) + (N — 1) tсум J (33)

При этом число разрядов каждого из полученных отсчетов увеличится до значения (x +1)1 = 2(% +1)+ log2(N — 1), а время выполнения операции умножения возрастает в (% +1)(% +1) раз за счет увеличения числа разрядов на величину log 2 (N — 1).

Для расчета ДС l1 = (fT • П(^)) необходимо выполнить p операций умножения и (p — 1) суммирования. В результате растет время выполнения операции умножения

tyMHE = X + 1) * tyмнl1 = (X + 1) * ((X + 1)1 — 1) • (tE1 разр + tcm ) = (% + 1) ^ ((% + 1)1 — 1) ^ tyMH(%+1). (34)

Время выполнения операции суммирования остается прежним.

В реальных условиях для аппаратной реализации ¡2р по алгоритму (10) в ПСС максимальное время выполнения операции умножения существенно возрастает за счет оценивания выборочной ковариационной матрицы Q и вычисления вектора ^' 0' &(Р) [3].

Для получения оценки матрицы помех и шумов и её обращения можно воспользоваться одним из известных методов вычислительной математики, что потребует выполнения « N3 операций умножения. Число сложений при этом будет приблизительно таким же.

Таким образом, реализация ДС по алгоритму (10) будет определяться суммой двух слагаемых. Первое из них - соответствует выражению (34), второе равно N3 (1умнЪ + 1сум).

В остальном для вычисления ¡2р необходимы указанные в подразделе 1.2 операции, выполняемые аналогично (10) - (13).

4. Повышение точности вычислений за счет СОК. В настоящее время активно развиваются методы и программные средства, обеспечивающие достоверность и воспроизводимость результатов вычислений на параллельных системах.

Они основываются на алгоритмах обработки машинных чисел, позволяющих компенсировать погрешность округления. Однако возникает все больше различных задач, особенно в компьютерном моделировании, корректное решение которых может быть получено только посредством использования арифметики многократной точности, позволяющей оперировать числами произвольной разрядности. Уже сейчас арифметика многократной точности востребована во многих областях, которые включают решение плохо обусловленных систем, продолжительное и/или крупномасштабное моделирование, исследование мелкомасштабных явлений, вычисление рядов, численное интегрирование и пр.

С ростом производительности суперкомпьютеров и масштабов вычислений число приложений высокоточной арифметики существенно возрастает, и имеются основания полагать, что в будущем эта тенденция будет лишь усиливаться.

5. Точность вычислительных операций. Мантиссы чисел в МБ-формате могут принимать значения в диапазоне [0,М-1]. В общем случае для предотвращения переполнения производится их округление до [V М -1 ] [4, 5].

Таким образом, можно дать грубую априорную оценку точностир вычислений (в битах):

р = [^2 [л/М-Т ]] (35)

Например, если М = 2479 , то р = 239.

График зависимости р от М представлен на рис. 2.

Используемая схема округления позволяет производить округление лишь при необходимости, для предотвращения переполнения, что обеспечивает в ряде случаев получение результата удвоенной точности. Например, если анализ интервально - позиционных характеристик показал, что мантиссы исходных операндов не превышают |уМ -1 ], то при их умножении округления не будет, следовательно, будет получен точный результат (относительная ошибка равна нулю, если исходные операнды являются точными).

р(М)

^ м ,4.096x10^

Рис. 2. Зависимость точности вычислений от величины М

Заключение. Сравнительный анализ результатов выполнения оптимальной обработки в ПСС и СОК показал, что:

1. Согласованная фильтрация сигналов (чисто пространственная, временная или совместная пространственно-временная), реализуемая в ПСС и СОК, имеет сложность порядка O(N) и может быть осуществлена различными способами;

1.1. В случае оптимальной обработки при обнаружении сигнала во временной области число р достигает величины более 200000, а величина % +1 = 16. Поэтому % +1 играет незначительную роль по сравнению с N.

Аналогичный вывод можно сделать и относительно пространственной корреляционной обработки. Число пространственных каналов в данном случае может быть равным N = 10000 элементов, а число разрядов составляет все те же % +1 = 16.

В случае обработки сверхширокополосных сигналов без несущей, указанное соотношение может быть существенно больше из-за необходимости выполнения неразделяющейся пространственно-временной обработки [6].

1.2. При выполнении обработки с малым N = 5 (в следящей системе) % +1 играет существенно большую роль.

2. Если обработка включает также адаптацию по пространственным координатам и времени, то сложность системы резко возрастает до значений O N2 ) и выше. Тогда приходится обращаться к проблемам сложной арифметики. Большой размер задач, необходимость их быстрого решения и особенности современных архитектур (такие, как вложенный параллелизм) определяют новые требования к высокоточному программному обеспечению. К ним относятся, в первую очередь, высокая скорость, потоковая безопасность и, что важно, возможность распараллеливания многоразрядных операций. Однако классические методы длинной арифметики, которые лежат в основе большинства известных пакетов (GMP, MPFR, ARPREC, QD, NTL и пр.), приводят к довольно медленным и неэффективным реализациям. Основная причина этого - возникновение цепочек переносов, из-за которых алгоритмы обработки многоразрядных мантисс становятся вычислительно сложными и не распараллеливаются. В результате высокоточные расчеты сопровождаются большими затратами времени и неэффективным использованием вычислительных ресурсов [7].

3. Применение многомодульной арифметики вычетов позволяет осуществлять параллельные вычисления дискретной свертки одновременно в q параллельных каналах по каждому модулю M.. независимо, а результаты вычисления объединять с помощью китайской теоремы об остатках одним из предложенных способов в соответствии с (10) - (16). Это позволяет увеличить быстродействие аппаратуры и избежать неудобств и ограничений, связанных с применением современной элементной базы. При этом число арифметических операций, необходимых для вычисления свертки возрастает в q раз, но поскольку каждая операция выполняется во много раз проще, реализация обработки в многомодульной арифметике вычетов оказывается легче, а быстродействие выше.

4. Наряду с алгоритмом (1), выполняемым в пространственно-временной области, в ПСС широко применяется обработка в частотной области, осуществляемая на основе дискретного преобразования Фурье (ДПФ) с использованием алгоритма быстрого преобразования Фурье (БПФ), призванная упростить обработку в вычислительных системах, использующих ПСС. При этом применение модулей Ферма и Мерсенна позволяет в ДПФ-подобных алгоритмах осуществлять обработку без операций умножения.

5. Применение модулярной арифметики, в частности СОК, позволяет решить проблемы длинной сложной арифметики [8, 9].

Список литературы

1. Акушский И.Я., Юдицкий Д.И. Машинная арифметика в остаточных классах. М.: Сов. радио, 1968. 440 с.

2. Ван Трис Г. Теория обнаружения, оценок и модуляции. Т. 3. Обработка сигналов в радио и гидролокации и прием случайных гауссовых сигналов на фоне помех. Пер с англ./ Под ред.

B.Т.Горяинова. М.: Сов. радио, 1977. 664 с.

3. Обработка сигналов в многоканальных РЛС / А.П.Лукошкин, С.С.Каринский, А.А.Шаталов и др.; Под ред. А.П.Лукошкина. М.: Радио и связь, 1983. 328 с.

4. Макклеллан Дж Г., Рейдер Ч.М. Применение теории чисел в цифровой обработке сигналов: пер. с англ. М.: Радио и связь, 1983. 264 с.

5. Шаталов А.А. Алгоритмы вычисления дискретной свертки с помощью теоретико-числовых преобразований в одномодульной и многомодульной арифметике вычетов. Радиотехника, N 4, 1993. С. 38.

6. Варакин Л.Е. Теория сложных сигналов. М.: Советское радио, 1970. 370 с.

7. Brent R., Zimmermann P. Modern Computer Arithmetic, Cambridge University Press, New York, NY, USA, 2010. 236 p.

8. Шаталов А.А., Ястребков А.Б. Алгоритмы цифровой фильтрации сигналов на больших временных интервалах. Радиотехника, N 9, 1992. C.33-39.

9. Кузнецов М.Ю., Шаталов А.А., Шаталова В.А. Адаптивный алгоритм распознавания сигналов на фоне помех в многочастотной РЛС // Вестник НовГУ. Сер.: Технические науки. 2021. №2(123).

C.71-75.

Кивалов Александр Николаевич, д-р техн. наук, профессор, ведущий инженер, ankiv@yandex. ru, Россия, Санкт-Петербург, ПАО НПО «Алмаз»,

Шаталова Валентина Александровна, канд. техн. наук, доцент, gonta-gv@yandex.ru, Россия, Санкт-Петербург, Военно-космическая академия имени А. Ф. Можайского

COMPARATIVE ANALYSIS OF THE RESULTS OF CALCULATIONS IN POSITIONAL NUMBER SYSTEM

AND IN A SYSTEM OF RESIDUAL CLASSES

A.N. Kivalov, V.A. Shatalova

On an example of sufficient statistics of detecting by calculation facilities, which implement calculations in a positional number system and in a system of residual classes comparative analyses of computing speed and accuracy ofprocessing is done. Several cases are submitted for the following results: 1) treatment in a positional number system without using truncating and rounding of multiplication results; 2) treatment in a positional number system using truncating and rounding to X +1 digits; 3) treatment in a system of residual classes in case of using single-module and multi-module residue arithmetic. There presented, that the system of residual classes allows to simplify the architecture of computing electronic devices, due to that increases speed and energetic affectivity of calculating facilities.

Key words: a positional number system, a system of residual classes, sufficient statistics of detecting, throughput capacity, accuracy.

Kivalov Alexander Nikolaevich, doctor of technical sciences, professor, leading engineer, an-kiv@yandex.ru, Russia, St. Petersburg, PJSC NPO Almaz,

Shatalova Valentina Aleksandrovna, candidate of technical sciences, docent, gonta-gv@yandex. ru, Russia, St. Petersburg, Military Space Academy named after A.F. Mozhaisky

УДК 620.192.46

DOI: 10.24412/2071-6168-2022-12-244-246

МЕТОД ВИЗУАЛИЗАЦИИ ТЕМПЕРАТУРНОГО РАСПРЕДЕЛЕНИЯ ПО ТЕРМОГРАММАМ КЛЕЕВЫХ ШВОВ ФАРФОРОВЫХ ИЗОЛЯТОРОВ ИВВ500

И.В. Зайчиков

Описан метод визуализации температурного распределения в тепловизионных изображениях клеевого шва фарфорового изолятора ИВВ500.

Ключевые слова: тепловизионный, изображение, палитра, цвет, полутон.

Для визуального анализа тепловизионных изображений клеевых швов фарфоровых изоляторов ИВВ500, одно из которых представленное на рис.3. в статье [1] с использованием палитры, созданной средствами IRPreview. было выполнено создание и применение ряда палитр, которые существенно лучше отображают температурное распределения на термограммах клеевых швов.

Тепловизионное изображение, представленное на рис.1. с использованием разработанной первой цветной контрастной палитры, существенно лучше поддаётся анализу для выявления скорости изменения и ускорения изменения температур в области шва.

НЯ 4-21 Я +и>.01

Рис. 1. Термограмма в представлении первой цветной контрастной палитры

При этом диапазон температур в области шва составил 10.01 градусов, что с коэффициентом приблизительно 100 хорошо переходит в 1024 цвета палитры

Рис. 2. Распределение цветов в цветной контрастной палитре для 1024 температурных отсчётов

Первая цветная контрастная палитра на рис.2 состоит из цветовых переходов, которые формируются следующим образом:

C11=(R11,G11,B11)=($FF-(i AND $FF),$FF-(i AND $FF),$FF-(i AND $FF)), i=0-255; C11=(R11,G11,B11)=((i AND $FF),(i AND $FF),0), i=256-511; C1i=(R1i,G1i,B1i)=($FF,$FF-(i AND $FF),(i AND $FF)), i=512-767; C1i=(R1i,G1i,B1i)=($FF,0,$FF-(i AND $FF)), i=768-1023.

i Надоели баннеры? Вы всегда можете отключить рекламу.