Научная статья на тему 'Эксперименты с параллельным алгоритмом вычисления присоединённой матрицы и параллельным умножением файловых матриц'

Эксперименты с параллельным алгоритмом вычисления присоединённой матрицы и параллельным умножением файловых матриц Текст научной статьи по специальности «Математика»

CC BY
113
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЫЧИСЛЕНИЕ ПРИСОЕДИНЁННОЙ МАТРИЦЫ / ПАРАЛЛЕЛЬНЫЙ АЛГОРИТМ / КЛАСТЕР / ФАЙЛОВЫЕ МАТРИЦЫ / ПРОИЗВЕДЕНИЕ МАТРИЦ / CALCULATION OF AN ADJOINT MATRIX / PARALLEL ALGORITHM / FILE MATRIX

Аннотация научной статьи по математике, автор научной работы — Бетин Андрей Андреевич

Приводятся и обсуждаются результаты с параллельным алгоритмом вычисления присоединённой матрицы и параллельным умножением файловых матриц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Experiments with a parallel algorithm for calculation of adjoint matrix and with a parallel algorithm for multiplication of file matrices

Results of experiments with a parallel algorithm for calculation of adjoint matrix and with a parallel algorithm for multiplication of file matrices are stated.

Текст научной работы на тему «Эксперименты с параллельным алгоритмом вычисления присоединённой матрицы и параллельным умножением файловых матриц»

2. Malaschonok N.A. An Algorithm for Symbolic Solving of Differential Equations and Estimation of Accuracy. Computer Algebra in Scientific Computing. LNCS 5743. Springer, Berlin, 2009, 213-225.

3. Малашонок Г.И. О проекте параллельной компьютерной алгебры. Вестник Тамбовского университета. Сер. Естественные и технические науки. Том 14, вып. 4, 2009. С.744-748.

Ribakov М.A. Solving systems of linear differential equations with a piecewise continuous right-hand parts by means transformation Laplace. An algorithm for solving systems of linear differential equations with a piecewise continuous right-hand parts by means transformation Laplace is considered. Examples for solving such systems are received.

Key words: algorithm solution systems of differential equations, systems of differential equations, Laplace transform.

Поступила в редакцию 20 ноября 2009г.

УДК 004.421

ЭКСПЕРИМЕНТЫ С ПАРАЛЛЕЛЬНЫМ АЛГОРИТМОМ ВЫЧИСЛЕНИЯ ПРИСОЕДИНЁННОЙ МАТРИЦЫ И ПАРАЛЛЕЛЬНЫМ УМНОЖЕНИЕМ ФАЙЛОВЫХ МАТРИЦ1 © А. А. Бетин

Ключевые слова: вычисление присоединённой матрицы, параллельный алгоритм, кластер, файловые матрицы, произведение матриц.

Приводятся и обсуждаются результаты с параллельным алгоритмом вычисления присоединённой матрицы и параллельным умножением файловых матриц.

1 Эксперименты с параллельным алгоритмом вычисления присоединённой матрицы

В работе [1] был рассмотрен параллельный алгоритм вычисления присоединённой матрицы. Рассмотренный алгоритм был программно реализован для многопроцессорных вычислительных систем. Эксперименты с параллельным алгоритмом проводились на вычислительном кластере МВС-100К в МСЦ РАН.

1 Работа выполнена при поддержке программы «Развитие потенциала высшей школы» (проект 2.1.1/1853) и Темплана 1.12.09.

В экспериментах использовались матрицы размеров 512x512, 1024x1024, 2048x2048 и 4096 х 4096. Присоединенная матрица вычислялась в конечном поле Ър, где р < 232. Результаты экспериментов приведены в табл. 1 и 2 и на рис. 1 и 2. За ускорение вычислений на к процессорах по сравнению с вычислением на п процессорах примем число

■ч* = Ф - 1)К-п -1).

Ч п

Для вычисления ускорения в процентах будем умножать ап * на 100%. Отметим, что при

I к

¿п — ¿к ускорение равно 0, а при — = — ускорение равно 100%.

£к 'П

На рис. 1 и 2 кроме графиков ускорения изображены еще две прямые, которые показывают 50% и 100% ускорение.

В табл. 1 и на рис. 1 представлены результаты экспериментов, в которых использовались плотные матрицы.

Таблица 1

Время в секундах и ускорение вычислений присоединённой матрицы для плотной матрицы в зависимости от ее размера и количества процессоров

Количество процессоров 2 4 8 16 «2,4 ®4,8 «8,16

Размер матрицы

512x512 11.463 11.571 12.521 13.512 -0.9% -7.6% -7.9%

1024x1024 71.332 58.945 67.312 71.478 21.4% -12.4% -5.8%

2048x2048 741.269 390.46 348.921 338.832 84.9% 11.9% 2.9%

4096x4096 5635.616 2919.601 2392.472 2201.979 93.0% 22.4% 8.7%

Рис. 1. Ускорение вычислений присоединённой матрицы для плотной матрицы в зависимости от количества процессоров ргос по отношению к 2 процессорам

В табл. 2 и на рис. 2 представлены результаты экспериментов, в которых использовались матрицы с плотностью 1%.

Таблица 2

Время в секундах и ускорение вычислений присоединённой матрицы для матрицы плотностью 1% в зависимости от ее размера и количества процессоров

Количество процессоров 2 4 8 16 «2,4 «4,8 а8,16

Размер матрицы

512x512 3.737 4.572 5.098 5.500 -18.3% -10.2% -7.4%

1024x1024 40.014 31.512 27.919 28.478 27.0% 12.8% -2.4%

2048x2048 470.877 346.985 258.497 264.100 35.8% 34.0% -2.2%

4096x4096 3855.991 1929.697 1339.389 1241.251 100% 43.9% 7.7%

Рис. 2. Ускорение вычислений присоединённой матрицы для матрицы с плотностью 1% в зависимости от количества процессоров ргос по отношению к 2 процессорам

Из табл. 1 и 2 видно, что вычисление присоединённой матрицы для матрицы размера 512x512 неэффективно делать параллельно, т. к. при увеличении числа процессоров время вычисления не уменьшается. Для матриц размера 1024x1024 и более ускорение наблюдается при увеличении числа процессоров с 2 до 16. При дальнейшем увеличении количества процессоров ускорение вычислений становится равным 0. Это связано с тем, что дальнейшее распараллеливание не выгодно, т. к. пересылаемые блоки становятся на столько малыми, что время пересылки приближается к времени вычислений.

Эксперименты показали, что с увеличением размера матриц параллельное вычисление становится более эффективным. Но с ростом размера матриц возникает проблема нехватки оперативной памяти. Для решения данной проблемы можно хранить матрицы не в оперативной памяти, а в виде файлов на жёстком диске, считывая только необходимые блоки матрицы. Размер максимального блока выбирается с учетом доступной оперативной памяти узла.

2 Эксперименты с параллельным умножением файловых матриц

В табл. 3 приведено время (время указано в секундах) вычисления произведения файловых матриц. Элементы матриц числа типа Е%Ме§ег 10 бит, плотность 100%.

Таблица 3

Время вычисления произведения файловых матриц

Количество процессоров 2 4 8 16

Размер

2048x2048 970.827 475.192 266.895 142.546

4096x4096 13350.297 6286.368 3245.467 2622.430

На рис. 3 представлена зависимость ускорения вычислений с ростом количества процессоров по отношению к 2 процессорам для матриц размера 2048x2048 и 4096x4096 соответственно.

Рис. 3. Ускорение вычислений произведения файловых матриц в зависимости от количества процессоров ргос по отношению к 2 процессорам

На обоих графиках кривая зависимости ускорения находится между прямыми, показывающими 50% и 100% ускорение, что говорит об эффективном распараллеливании.

ЛИТЕРАТУРА

1. Бетин А. А. Параллельное вычисление присоединённой матрицы. International conference Polynomial Computer Algebra. St.Petersburg, PDMI RAS, 2009, C. 123-128.

2. Малашонок Г.И. О вычислении ядра оператора, действующего в модуле. Вестник Тамбовского университета. Сер. Естественные и технические науки. Том 13, вып. 1, 2008. С. 129-131.

Betin A.A. Experiments with a parallel algorithm for calculation of adjoint matrix and with a parallel algorithm for multiplication of file matrices. Results of experiments with a parallel algorithm

for calculation of adjoint matrix and with a parallel algorithm for multiplication of file matrices are stated.

Key words: calculation of an adjoint matrix, parallel algorithm, file matrix.

Поступила в редакцию 20 ноября 2009г.

УДК 004.421

РЕАЛИЗАЦИЯ МЕТОДА ФУЖЕРА ВЫЧИСЛЕНИЯ БАЗИСА ПОЛИНОМИАЛЬНЫХ ИДЕАЛОВ1 © М. В. Старов

Ключевые слова: вычисление базиса Гребнера, параллельный алгоритм, кластер, метод Фужера, алгоритм Р4.

Приводятся и обсуждаются результаты с параллельным алгоритмом вычисления базиса полиномиальных идеалов.

В работе [11 был рассмотрен параллельный алгоритм вычисления базиса Гребнера, основанный на методе гомоморфных образов в кольце полиномов с целочисленными коэффициентами.

В основе параллельного алгоритма лежит метод Г4 [2], предложенный французским математиком Ж.-Ш. Фужером. Параллелизм основан на методе гомоморфных образов в кольце полиномов с целочисленными коэффициентами. На основе приведённого алгоритма были разработаны программы для параллельного вычисления базиса Гребнера полиномиальных идеалов, с которыми были проведены эксперименты на кластере ТГУ им. Г.Р. Державина.

В экспериментах использовались разреженные полиномы от пяти переменных.

Таблица 1

Время вычисления в секундах базиса Гребнера с использованием параллельного алгоритма

Количество процессоров к 2 4 8

Время tk, с 259.5 134 77.5

h/h 1.9 3.34

1Работа выполнена при поддержке программы «Развитие потенциала высшей школы» (проект 2.1.1/1853)

i Надоели баннеры? Вы всегда можете отключить рекламу.