Научная статья на тему 'Многомерное гиперкомплексное ДПФ: параллельный подход'

Многомерное гиперкомплексное ДПФ: параллельный подход Текст научной статьи по специальности «Математика»

CC BY
145
75
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук

Аннотация научной статьи по математике, автор научной работы — Алиев М. В., Чичева М. А.

В работе предложен способ параллельной реализации вычислений с гиперкомплексными числами в многомерном пространстве. В частности, предложен параллельный алгоритм вычисления многомерного дискретного гиперкомплексного преобразования Фурье (ГДПФ).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Многомерное гиперкомплексное ДПФ: параллельный подход»

МНОГОМЕРНОЕ ГИПЕРКОМПЛЕКС НОЕ ДПФ: ПАРАЛЛЕЛЬНЫЙ ПОДХОД

Алиев М.В.1, Чичева М.А. 2

1 Адыгейский государственный университет,

2 Институт систем обработки изображений РАН

Аннотация

В работе предложен способ параллельной реализации вычислений с гиперкомплексными числами в многомерном пространстве. В частности, предложен параллельный алгоритм вычисления многомерного дискретного гиперкомплексного преобразования Фурье (Г ДПФ).

Введение

В работе [1] было дано определение многомерного ГДПФ вещественного сигнала:

N-1

^(,...,ша )= X /(«1,...,^ )<т п> ,

Щ,...,П4 = 0

у <т,п >=П, к=1

(1)

предложены и исследованы алгоритмы параллельного вычисления этого преобразования в двумерном случае. Однако, во-первых, существует интерес к вычислению ГДПФ больших размерностей [2], [3], [4], а, во-вторых, проблема эффективных вычислений с гиперкомплексными числами не ограничивается быстрой реализацией ГДПФ [5, 6, 7, 8].

Таким образом, в статье рассматривается многомерная гиперкомплексная алгебра и способ параллельной реализации вычислений с элементами этой алгебры, основанный на ее структуре. Затем предлагается параллельный алгоритм многомерного ГДПФ, использующий разработанный способ вычислений.

Многомерная гиперкомплексная алгебра

Ниже приводятся некоторые сведения о структуре рассматриваемой многомерной гиперкомплекс-ной алгебры (см., например, [9]).

Определение. Коммутативно-ассоциативной ги-перкомплексной алгеброй Ба будем называть

2а -мерную К -алгебру с базисом:

л = |п^, а є(0,1};1Ч1---а} |,

где є0 = 1, є1 = . Закон умножения базисных

элементов алгебры индуцирован следующим правилом преобразования произведений базисных элементов пространства V:

єіє] = єієі, є2 = Рі, ^ І Є 1, Рі = ±1.

Произвольный элемент g є записывается в виде:

g = ^0Ео + - + І2а -1Е2л-1 = £^Е , (2)

ієТ

где Е{ =Пє“г , і = Хаг2і-1 Є т ={о,1,..,2а-і!.

ІЄІ ІЄІ

В этой гиперкомплексной алгебре операция сложения выполняется покомпонентно. Умножение определяется правилами умножения базисных элементов:

ЕіЕ^ = '¥(і, т) ЕіФт, Vt, т є Т , где Ф - поразрядное сложение по модулю 2,

т) = ПР?М , Ьі (t,т) = аіа^,

ієІ

і-1

т = Еаг'2

ієІ

Доказательство приведенных соотношений может быть найдено, например, в [9]. Ниже мы будем рассматривать 2а -мерную гиперкомплексную алгебру Ба = С+С + ... + С ,

2а-1

которая может быть представлена в виде прямой суммы комплексных алгебр.

В этом случае существует, по крайней мере, один элемент аі, которому соответствует рі =-1. Далее, без потери общности, будем считать, что Р1 = -1 и Р;- = 1 для остальных значений і є І.

Как показано в [9], такая структура обеспечивает наименьшее количество вещественных операций необходимых для выполнения умножения и сложения элементов алгебры Ба . Кроме того, в этом случае существует возможность синтеза эффективного алгоритма распараллеливания арифметических операций над элементами алгебры.

Параллельные вычисления в алгебре Ба

В работе [1] предложен алгоритм вычислений в четырехмерной гиперкомплексной алгебре В2 с распараллеливанием операции умножения на 2 ветви.

Пусть произвольный элемент g є Ба определяется соотношением (2). Разобьем множество {Еі}іЄт на две части: і є Т', если Е{ не содержит

сомножителя Є1, и і є Т” в противном случае. При выбранном способе нумерации элементов первое подмножество будет содержать Е{ для четных і, а второе - для нечетных. Введем замену переменных:

(3)

где

Ео = {Е }ієт-, Е1 = {Е}

і>ієТ ’’

И =

«0

«1

«2“-1 V 2 У

А =

Г1 1 1

1 1 1

1 1 -1

1 -1 1

-1

1

-1

(4)

Каждая строка и каждый столбец матрицы А содержат ровно 2“-2 отрицательных чисел из 2“-1 значений.

Правило умножения новых базисных элементов записывается в виде:

Гр«], if } < р,

«У ='

-р« 2“-1 if } > Р,

I Р«к, ««Ч0

if к = ] + р, otherwise,

-1

где р = 2“ 1. Заметим, что многие произведения равны нулю. Это позволяет нам представить произведение двух произвольных элементов алгебры В“ следующим образом:

8 •5 =^^1Е1 ' X Ет = X а« • X Ьт«т =

/еГ теГ /еГ теГ

= X + а/+рИ/+р)(« + Ъ1+р«+р)

/еГ'

так как остальные слагаемые будут включать произведение «^к = 0 .

Таким образом, произведение двух произвольных элементов алгебры В“ сводится к р независимым произведениям, каждое из которых требует трех вещественных умножений и трех вещественных сложений (по аналогии с умножением комплексных чисел).

В таком представлении вычисления могут быть распараллелены на р независимых ветвей, не требующих обмена данными. Так как замена переменных линейна, сложение остается покомпонентным.

Можно показать, что для произвольного 8 е В“

переход к новому представлению требует 4“-1 вещественных сложений. Однако для вещественных и комплексных чисел не требуется выполнения каких-либо нетривиальных арифметических операций. Обратный переход к исходному представлению так

же требует 4“-1 вещественных сложений.

Пример 1: “=2. См. [1].

Пример 2: “=3. Произвольный элемент восьмимерной гиперкомплексной алгебры В3 имеет вид:

2 = §0 + §181 + §282 + §38182 + §483 + §58183 + §6 8283 + §7 8182 83

2 2 2 где 81 = -1, 82 =83 = 1. Замена переменных выглядит следующим образом:

«0 = 1+ 82 +83 +8283 ,

«1 = 1+ 82 -83 -8283 ,

«2 = 1-82 +83 -8283 ,

«3 = 1-82 -83 +8283 ,

«4 =8^ +8^82 +8^83 +8^8283 ,

«5 =81 +8^82 -8^83 -8^8283 ,

«6 =81 -8182 +8183 818283 ,

«7 =8^ -8^82 -8^83 +8^8283 .

тогда

2 = 4((§0 +§2 +§4 +§6 )«0 +(0 +§2 -§4 -§6К

+(0 -§2 +§4 -§6)«2 + (0 -§2 -§4 +§6)«3

+(1 +§3 +§5 +§7)«4 + (1 +§3 -§5 -§7)«5

+(1 -§3 +§5 -§7)«6 +(1 -§3 -§5 +§7)«7).

Правила умножения новых базисных элементов приведены в Таблице 1.

Таблица 1. Правило умножения базисных элементов (“ =3)

«0 «1 «2 «3 «4 «5 «6 «7

«0 4«0 0 0 0 4«4 0 0 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

«1 0 4«1 0 0 0 4«5 0 0

«2 0 0 4«2 0 0 0 4«6 0

«3 0 0 0 4«3 0 0 0 4«7

«4 4 а 4 0 0 0 -4«0 0 0 0

«5 0 4«5 0 0 0 -4«1 0 0

«6 0 0 4«6 0 0 0 -4«2 0

«7 0 0 0 4«7 0 0 0 -4«3

Вместо вычисления произведения 7 7

X х]«] X Ук«к ]=0 к=0

достаточно независимо вычислить четыре произведения:

(Х0«0 + х4щ ) (У0«0 + У4«4 ) ,

(х« + х5«5 ) (у« + У5«5 ) ,

(х2«2 + х6«6 ) (У2«2 + У6«6 ) ,

(х3«3 + х7«7 ) (у3«3 + у7«7 ) .

Главным достоинством предложенного способа распараллеливания вычислений является существенное снижение вычислительной сложности арифметических операций в алгебре В“ по сравнению с оценками работы [9]:

- сложения гиперкомплексных чисел в 2“-1 раз;

- умножения - в 2“-1 (2“ +1)3 раз.

Таким образом, представленный способ позволяет нам распараллелить любой линейный алгоритм обработки многомерных сигналов с небольшим количеством дополнительных операций и высокой эффективностью.

Параллельный алгоритм ГДПФ

Рассмотрим преобразование (1). Известно, что алгоритмы быстрого преобразования Фурье, построенные по аналогии с многомерно схемой Кули-Тьюки, требуют только операций сложения и умножения. В данном случае нам необходимо оперировать с гиперкомплексными числами. Структура быстрого алгоритма ГДПФ [9] такова, что позволяет нам полностью разделить вычисления на 2“-1 независимых ветвей с использованием представления (3)-(4). В этом случае алгоритм ГДПФ будет состоять из следующих основных шагов.

Шаг 1. Переход от исходного представления (2) к представлению (3)-(4) (тривиально, так как входные данные вещественные, а корни ^ - комплексные). Шаг 2. Распределение данных по 2“-1 процессорам. Шаг 3. Вычисление преобразования (1) на каждом процессоре с использованием алгоритмов типа Ку-ли-Тьюки [9].

Шаг 4. Реконструкция гиперкомплексного спектра.

Одним из достоинств такого алгоритма (в дополнение к указанным в предыдущей части) является сохранение важнейшего качества последовательного алгоритма - использования свойств симметрии гиперком-плексного спектра вещественного сигнала (см., например, [9]). Однако использование симметрии требует обмена данными между процессорами, что несколько снижает общую эффективность распараллеливания.

Дополнительные возможности для снижения времени вычисления преобразования, по-

прежнему, могут быть найдены во внутреннем параллелизме многомерной схемы Кули-Тьюки. На шаге 3 описанного алгоритма может быть выполнено дополнительное распараллеливание каждой ветви на 2“ процессоров. Однако, как показывают исследования, этот способ обладает низкой эффективностью [1], и применять его следует только в том случае, если снижение времени вычисления более актуально, чем эффективность использования вычислительных мощностей.

В работе [1] нами было показано, что в случае “=2 эффективность распараллеливания ГДПФ за счет структуры алгебры составляет около 90%, а эффективность дополнительного распараллеливания в рамках схемы Кули-Тьюки составляет 60-75%. Для сравнения отметим, что эффективность параллельных алгоритмов классического дискретного преобразования Фурье составляет от 20% до 60% (см., например, [10], [11]).

Заключение

В статье рассмотрен метод распараллеливания вычислений в многомерной гиперкомплексной алгебре достаточно общего вида.

Метод основан на особенностях структуры алгебры, а именно, на ее изоморфности прямой сумме комплексных алгебр. Главное достоинство - существенное снижение времени выполнения арифметических операций над элементами алгебры.

Предложенный подход использован для построения высокоэффективного параллельного алгоритма гиперкомплексного дискретного преобразования Фурье. Кроме того, предложенный способ вычислений может быть использован для решения других задач многомерной обработки сигналов.

Благодарности

Работа выполнена при поддержке российско-американской программы «Фундаментальные исследования и высшее образование» (BRHE); и Российского фонда фундаментальных исследований (РФФИ), проекты №№ 03-01-00736, 05-0196501.

Литература

1. Алиев М.В., Белов А.М., Ершов А.В., Чичева М.А. Алгоритмы двумерного гиперкомплексного дискретного преобразования Фурье // Компьютерная оптика, 2004. № 26. С. 101-104

2. Фурман Я.А., Кревецкий А.В., Передреев .К. Введение в контурный анализ; приложения к обработке изображений и сигналов // Под ред. Фурмана Я. А. М.: ФИЗ-МАТЛИТ, 2002.

3. Geometric Computing with Clifford Algebra // Sommer G.

(Ed.). Berlin: Springer-Verlag, Springer Series in

Information Sciences, 2001.

4. Vanwormhoudt M.C. Rings of hypercomplex numbers for NT Fourier transforms // Signal Processing, 1998. Vol. 67. P. 189-198.

5. Bulow T., Sommer G Hypercomplex signals - A novel extension of the analytic signal to the multidimensional case // IEEE Transactions on Signal Processing, IEEE Signal Processing Society, 2001. Vol. 49. No. 11. P. 28442852.

6. Chaitelin F., Meskauskas T. Computation with hypercomplex numbers // Nonlinear analysis, 2001. No. 47. P. 33913400.

7. Labunets E.V., Labunets V.G., Egiazarian K., Astola J. Hypercomplex moments application in invariant image recognition // Int. Conf. On Image Processing 98, 1998. P.256-261.

8. Sommer G. A geometric algebra approach to some problems of robot vision // Computational Noncommunicative Algebra and Applications, Kluwer Academic Publishers, J. Byrnes ed., NATO Science Series, 2004. No. 136. P. 309-338.

9. Алиев М.В. Быстрые алгоритмы d-мерного ДПФ вещественного сигнала в коммутативноассоциативных алгебрах 2d размерности над полем действительных чисел // Компьютерная оптика, 2002. №24. C. 130-136.

10. Gupta A., Kumar V. The scalability of FFT on Parallel Computers // IEEE Transactions on Parallel and distributed systems, IEEE Computer Society, 1993. Vol. 4. No. 8. P. 922-932.

11. Inda M.A., Bisseling R.H. A simple and efficient parallel FFT algorithm using the BSP model // Parallel Computing, 2001. Vol. 27. No. 14. P. 1847-1878.

i Надоели баннеры? Вы всегда можете отключить рекламу.