Научная статья на тему 'Алгоритмы двумерного гиперкомплексного дискретного преобразования Фурье'

Алгоритмы двумерного гиперкомплексного дискретного преобразования Фурье Текст научной статьи по специальности «Математика»

CC BY
353
102
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук

Аннотация научной статьи по математике, автор научной работы — Алиев М. В., Белов А. М., Ершов А. В., Чичева М. А.

Рассматриваются способы параллельного вычисления многомерного гиперкомплексного дискретного преобразования Фурье. Основная идея заключается в использовании свойств гиперкомплексной алгебры, в которой выполняется данное преобразование. Дополнительные возможности для повышения эффективности алгоритма предоставляет естественный параллелизм многомерной схемы Кули-Тьюки.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритмы двумерного гиперкомплексного дискретного преобразования Фурье»

АЛГОРИТМЫ ДВУМЕРНОГО ГИПЕРКОМПЛЕКСНОГО ДИСКРЕТНОГО ПРЕОБРАЗОВАНИЯ ФУРЬЕ

Алиев М.В. 1, Белов А.М. 2, Ершов А.В. 3, Чичева М.А. 4 1 Адыгейский государственный университет 2 Самарский государственный аэрокосмический университет 3 Самарский государственный университет 4 Институт систем обработки изображений РАН

Аннотация

Рассматриваются способы параллельного вычисления многомерного гиперкомплексного дискретного преобразования Фурье. Основная идея заключается в использовании свойств гиперкомплексной алгебры, в которой выполняется данное преобразование. Дополнительные возможности для повышения эффективности алгоритма предоставляет естественный параллелизм многомерной схемы Кули-Тьюки.

Введение

Многомерное гиперкомплексное дискретное преобразования Фурье (ГДПФ) [1] вещественного сигнала:

N-1

^ ((,..., шЛ ) = X I («1,-, "й ) <т,п > ,

W <mn> =П

w

mknk N 1

k k , Wk = 1 .

(1)

k=1

привлекает все больше внимания специалистов в области обработки изображений и многомерных сигналов. Его приложениям посвящен целый ряд работ российских и зарубежных ученых (см., например, [3, 4, 5]).

Особенностью преобразования (1) является то, что корни м!к N-ой степени из единицы лежат в различных подалгебрах, изоморфных алгебре комплексных чисел С, некоторой 2й -мерной коммутативной алгебры Вй. Соответственно и значения спектра

^ ((,..., шй) лежат в алгебре Вй . В двумерном случае (й=2) преобразование (1) принимает вид:

N-1 N-1

^ (Ш1, Ш2 )=Х X I (, «2 К'"' <2"2, (2) «1 =0 «2 =0

0< ш1, ш2 < N-1, где м^ = ехр {2^/N1, м2 = ехр {2ле2/N1, е1, е2 (=6^ =-1) - образующие элементы некоторой

четырехмерной гиперкомплексной алгебры, произвольный элемент которой имеет вид:

г=а+Ре1 +уе2 +5е1е2 . (3)

Заметим, что классическое многомерное дискретное преобразование Фурье является частным случаем преобразования (1) при е1 =...=ей = /еС . Это позволяет утверждать, что, кроме целого ряда специальных приложений, рассмотренных в [3], [4], [5], преобразование (1) позволяет эффективно решать весь круг задач цифровой обработки сигналов, для решения которых используется дискретное преобразование

Фурье (быстрое вычисление дискретной свертки, фильтрация, компрессия сигналов и т.д.).

Как отмечено в [1], принципиальным свойством, определяющим эффективность применения ГДПФ в прикладных задачах, является не конкретная структура гиперкомплексной алгебры Вй, а только существование в ней достаточного количества изоморфных копий комплексной алгебры. В работе [1] доказано, что минимальное количество вещественных операций, необходимых для сложения/умножения элементов Вй , достигается при:

Бл = C©C© ...©C.

(4)

Кроме того, в [1], [2] построена система автоморфизмов, разработан алгоритм быстрого умножения элементов алгебры Вй , синтезированы «последовательные» алгоритмы ГДПФ.

Параллельный алгоритм ГДПФ, основанный на структуре гиперкомплексной алгебры

Основная проблема при реализации многомерного преобразования - это увеличение объема вычислений с ростом размерности. Одним из наиболее естественных путей решения этой проблемы является параллельная реализация преобразования (1). Очевидно, что в представлении (4) заложена принципиальная возможность такой реализации. Кроме того, дополнительные возможности для повышения степени распараллеливания и эффективности алгоритма предоставляет внутренний параллелизм многомерной схемы Кули-Тьюки, аналог которой используется для формирования гиперкомплексного спектра.

Рассмотрим принципы формирования такого параллельного алгоритма на примере двумерного преобразования. Пусть произвольный элемент г четырехмерной алгебры В2 определен соотношением (3).

Введем замену переменных: и0 =1+е1е2, и1 =1-е1е2, и —£1 ^ , и —£1 + £о .

d-1

2

Тогда гиперкомплексное число г запишется в виде:

х=2 ((а+5) +(а-5) +(Р-у) +(Р+у)). (5)

Очевидно, что для произвольного хеБ2 переход к представлению (5) потребует четырех вещественных сложений. Однако для вещественных (входной сигнал) и комплексных (корни ) чисел этот переход не потребует выполнения нетривиальных арифметических операций.

Обратный переход к исходному представлению так же требует четырех вещественных сложений на отсчет гиперкомплексного спектра.

Правило умножения новых базисных элементов представлено в таблице 1.

Таблица 1. Правило умножения базисных элементов

и0 и1 и2 и3

и0 2и0 0 2и2 0

и1 0 2и1 0 2и3

Щ 2и2 0 -2и0 0

и3 0 2и3 0 -2и1

Необходимо отметить, что в таком представлении произведения элементов и0 и и2 с элементами и1 и и3 равны нулю. Это означает, что вычисление произведения двух произвольных гиперкомплексных чисел состоит в таком представлении из двух совершенно независимых частей. Вместо произведения:

(хи0 + уи1 + хи2 + уи3) (аи0 +Ри1 +уи2 +5и3) достаточно независимо вычислить два произведения:

(хи0 + хи2 ) (аи0 +уи2 )= =2((ха-ху)и0 +(ху+ха)и2 )

(( + уи3) ((Зи1 +5и3 )=

=2 (-у5) +(5+ур)и3).

Таким образом, наиболее трудоемкая операция алгоритма - вычисление произведения гиперкомплексных чисел может быть распараллелена на две независимые ветви, не требующие обмена данными.

Структура последовательного быстрого алгоритма ГДПФ [1] такова, что при использовании представления (5) возможно полное разделение вычислений по тому же принципу. В результате, мы приходим к следующему параллельному алгоритму двумерного ГДПФ:

- переход от исходного представления (3) к представлению (5);

- распределение данных по двум процессорам;

- расчет преобразования (2) с использованием алгоритмов типа Кули-Тьюки [2];

- реконструкция гиперкомплексного спектра. Загрузка процессоров проиллюстрирована на

рис. 1.

К достоинствам такого метода распараллеливания двумерного гиперкомплексного ДПФ можно отнести:

- снижение сложности операций сложения гиперкомплексных чисел и умножения комплексного корня на гиперкомплексное число в 2 раза;

- снижение сложности умножения двух произвольных гиперкомплексных чисел более чем в 3 раза;

- сохранение возможности учета симметрий гиперкомплексного спектра вещественного сигнала [1, 2].

Номер процессора

I ...... . ..... .

II ............~ ..................

Время

■ ■ ■ ■ Передача данных

- Работа процессора

...... Простой

Рис.1. Иллюстрация загрузки процессоров при распараллеливании за счет структуры алгебры

Однако для учета симметрий потребуется дополнительный обмен данными, что несколько снизит общую эффективность распараллеливания.

Распараллеливание за счет структуры декомпозиции

Описанный выше подход уже позволяет синтезировать параллельный алгоритм й-мерного ГДПФ с

распараллеливанием на 2й-1 процессоров. Соответственно и ускорение алгоритма не превысит величины 2й-1. При наличии большего числа процессоров целесообразно провести дополнительное распараллеливание за счет структуры многомерной декомпозиции Кули-Тьюки. Принцип распределения данных и вычислений показан ниже на примере двумерного преобразования.

Основное соотношение декомпозиции ГДПФ (2) «по основанию 2» [2] имеет вид:

1

Р ( т2 ) = Е РаЪ ((, т2 ) ^Г1 ^Г2 , (6)

а,Ъ=0

где

РаЪ (тЪ т2 ) =

%-1

^ ~ I 2 \тЛ ( 2 \т2П2

Е / ( + а,2«2 + ъ ))2 ) (2 ) .

«1,«2 =0

Ключевой операцией в таком алгоритме является реконструкция (6) полного спектра Р (т1, т2) по известным (найденным) значениям частичных спектров 1^аЪ (т1, т2). Предположим, что каждый частичный спектр рассчитан на отдельном процессоре, причем время работы процессоров будет примерно одинаковым (так как одинаковы размеры массивов вычисляемых спектров и алгоритм их вычисления). Далее, на каждом процессоре выполняется умножение элементов частичного спектра на степени кор-

ней w1, w2. Затем полученные значения пересылаются на один из процессоров, где окончательно формируется гиперкомплексный спектр.

Ясно, что таким способом процесс может быть распараллелен на любое число процессоров кратное четырем за счет нескольких шагов декомпозиции типа (6). Предполагаемое время вычисления гиперкомплексного спектра обратно пропорционально числу процессоров, так как основные вычислительные затраты приходятся на расчет набора ГДПФ уменьшенного размера. В случае размерности данных d>2 может быть применена аналогичная схема с распараллеливанием на каждом шаге на 2d процессов.

Иллюстрация загрузки процессоров при реализации описанного подхода для двумерного случая приведена на рис. 2.

Номер процессора

II I.................................

I V..............................

Время

---- Передача данных

—— Работа процессора

...... Простой

Рис. 2. Иллюстрация загрузки процессоров при

распараллеливании за счет структуры декомпозиции

Достоинством такого подхода является уменьшенный объем пересылаемых данных за счет учета симметрий гиперкомплексного спектра вещественного сигнала (свойства гиперкомплексного спектра вещественного сигнала описаны, например, в [1, 2]).

Экспериментальное исследование

К настоящему времени реализован и исследован параллельный алгоритм двумерного гиперкомплексного дискретного преобразования Фурье на основе использования структуры алгебры, схемы декомпозиции, а также комбинированный алгоритм, использующий оба подхода одновременно.

В соответствии с этим ниже приведены результаты распараллеливания алгоритма преобразования для ситуаций, перечисленных в таблице 2 (p - количество процессоров).

Таблица 2. Исследованные случаи

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Исследования проводились на кластере научно-исследовательского вычислительного центра МГУ (НИВЦ МГУ), который состоит из 16 двухпроцес-

сорных узлов с процессорами Pentium III, соединенных высокоскоростной сетью SCI.

На рис.3 приведено время Tp (в секундах) выполнения программы в зависимости от N, где N*N -размер двумерного ГДПФ.

В таблицах 3 и 4 приведены значения ускорения алгоритма U =TxjTp и эффективности E=TxjpTp ,

полученные по экспериментальным данным.

Рис.3. Время вычисления N*N- ГДПФ

Таблица 3. Ускорение алгоритма

N р=2 p II p=8 р=16

128 1,805 2,261 4,082 6,545

256 1,802 2,795 5,035 6,444

512 1,790 2,372 4,246 6,382

1024 1,803 2,925 5,274 6,577

2048 1,791 2,725 4,881 7,243

Таблица 4. Эффективность алгоритма

N Р=2 p II Р=8 р=16

128 0,903 0,565 0,510 0,409

256 0,901 0,699 0,629 0,403

512 0,895 0,593 0,531 0,399

1024 0,902 0,731 0,659 0,411

2048 0,896 0,681 0,610 0,453

Заключение В статье рассмотрены принципы синтеза параллельных алгоритмов двумерного гиперкомплексного дискретного преобразования Фурье. Предложены два способа распараллеливания преобразования. Наилучшая эффективность достигнута при использовании алгоритма, основанного на структурных свойствах алгебры (около 90%). Эффективность использования для распараллеливания свойств многомерной схемы Кули-Тьюки и комбинированного алгоритма составляет 40-73%. Снижение эффектив-

Р Алгоритм

1 Последовательный алгоритм

2 Использование структуры алгебры

4 Использование структуры декомпозиции (1 шаг)

8 Комбинированный алгоритм

16 Использование структуры декомпозиции (2 шага)

ности с ростом числа процессоров связано с тем, что снижается доля одновременного вычисления частичных спектров, за счет которого и достигается основной эффект. Полученные результаты позволяют сделать вывод о том, что с ростом размерности преобразования при ограниченном числе процессоров, предпочтение должно отдаваться подходу, использующему структуру многомерной гиперкомплексной алгебры.

Благодарности Работа выполнена при поддержке Министерства образования РФ, Администрации Самарской области и Американского фонда гражданских исследований и развития (CRDF Project SA-014-02) в рамках российско-американской программы «Фундаментальные исследования и высшее образование» (BRHE); а также при поддержке Российского фонда фундаментальных исследований (РФФИ), проекты №№ 03-01-00736, 05-01-96501.

Литература

1. Алиев М.В. Быстрые алгоритмы d-мерного ДПФ вещественного сигнала в коммутативно-ассоциативных алгебрах 2d размерности над полем действительных чисел // Компьютерная оптика, 2QQ2. № 24. C. 13Q-136

2. Алиев М. В., Чичева М.А. Алгоритмы двумерного ДПФ с представлением данных в алгебре гиперкомплексных чисел //Алгебра и линейная оптимизация: Труды международного семинара, посвященного 9Q-летию со дня рождения С.Н.Черникова. Екатеринбург: УрО РАН, 2QQ2. C. 18-26

3. Фурман Я.А., Кревецкий А.В., Передреев .К. Введение в контурный анализ; приложения к обработке изображений и сигналов // Под ред. Фурмана Я.А. М.: ФИЗМАТЛИТ, 2QQ2. 592с.

4. Geometric Computing with Clifford Algebra // Sommer G. (Ed.). Berlin: Springer-Verlag, Springer Series in Information Sciences, 2QQ1.

5. Labunets E.V., Labunets V.G., Egiazarian K., Astola J. Hypercomplex moments application in invariant image recognition // Int. Conf. On Image Processing 98, 1998. P. 256-261.

i Надоели баннеры? Вы всегда можете отключить рекламу.