Научная статья на тему 'СРАВНЕНИЕ УСКОРЕНИЯ ПАРАЛЛЕЛЬНОЙ ВЕРСИИ АЛГОРИТМА БИТОННОЙ СОРТИРОВКИ НА АРХИТЕКТУРЕ CUDA И СТАНДАРТЕ MPI'

СРАВНЕНИЕ УСКОРЕНИЯ ПАРАЛЛЕЛЬНОЙ ВЕРСИИ АЛГОРИТМА БИТОННОЙ СОРТИРОВКИ НА АРХИТЕКТУРЕ CUDA И СТАНДАРТЕ MPI Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
16
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЛГОРИТМ / БИТОННАЯ СОРТИРОВКА / ПАРАЛЛЕЛЬНОЕ ВЫПОЛНЕНИЕ / АЛГОРИТМ СОРТИРОВКИ / cuda / gpu / mpi / algorithm / bitonic sort / parallel execution / sorting algorithm

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кадыров П.А.

В статье рассматриваются две реализации параллельного алгоритма битонной сортировки на технологии CUDA и стандарте MPI. Проводятся опыты для каждой реализации и сравниваются результаты времени работы для выявления наилучшей реализации алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF ACCELERATION THE PARALLEL VERSION OF THE BITONIC SORT ALGORITHM ON THE CUDA ARCHITECTURE AND MPI STANDARD

This article discusses two implementations of the bitonic sort algorithm in parallel on the CUDA technology and MPI standard. Experiments are conducted for each implementation and compares the results of the work time for identifying best implementation of the algorithm.

Текст научной работы на тему «СРАВНЕНИЕ УСКОРЕНИЯ ПАРАЛЛЕЛЬНОЙ ВЕРСИИ АЛГОРИТМА БИТОННОЙ СОРТИРОВКИ НА АРХИТЕКТУРЕ CUDA И СТАНДАРТЕ MPI»

2. Совпадение положительных температурных аномалий и отрицательных локальных гравитационных и магнитных аномалий может служить поисковым критерием для выделения ловушек углеводородов.

3. Зависимость продуктивности скважин от состава пород не выявлена. По генезису коллекторы являются вторичными, они сформировались при сочетании эрозионных, деформационных и гидротермальных процессов [5].

Использованные источники:

1.Гаврилов В.П., Гулев В.Л., Карнаухов С.М., Леонова Е.А. Геологическое строение и нефтегазоносность северного шельфа Вьетнама (Шонгхонгский прогиб): в 2 частях. Часть 2. -М.: ООО «Издательский дом Недра», 2014. -167 с.: ил.

2.Ванисов А.М., Шелихов А.П., Куликов Д.П., Тренин Ю.А. Строение и прогноз нефтегазоносности доюрского основания Рогожниковско-Ляминской зоны (8 поисковых и лицензионных участков) по гравимагнитным и сейсморазведочным данным. Труды ЗАО «ЗапСибЮг». -Тюмень: ЗапСибЮг, 2009. - Вып. 66. - с. 46 - 48.

3.Сусанина О.М. Прогнозирование нефтеперспективных зон в палеозойских отложениях Западной Сибири по комплексу геофизических данных. Материалы X конференции ЗАО «Пангея» «Формула успеха в разведке и разработке месторождений нефти и газа», Москва, 2011.

4.Предтеческая Е.А., Фомичев А.С. Влияние разрывных нарушений на температурный режим и катагенетические преобразования мезозойских отложений Западно-Сибирской плиты. Нефтегазовая геология. Теория и практика. - 2011.- Т.6. -№1.

5.Кирюхин А.В., Шадрина С.В., Пузанков М.Ю. Моделирование термогидрогеохимических условий формирования продуктивных резервуаров в вулканогенных породах. Вулканология и сейсмология, 2013, № 2, с. 90-104.

УДК 004.032.24

Кадыров П.А. студент магистратуры 1 курс, "Прикладная математика и информатика " Пензенский государственный университет

Россия, г. Пенза СРАВНЕНИЕ УСКОРЕНИЯ ПАРАЛЛЕЛЬНОЙ ВЕРСИИ АЛГОРИТМА БИТОННОЙ СОРТИРОВКИ НА АРХИТЕКТУРЕ

CUDA И СТАНДАРТЕ MPI Аннотация: В статье рассматриваются две реализации параллельного алгоритма битонной сортировки на технологии CUDA и стандарте MPI. Проводятся опыты для каждой реализации и сравниваются результаты времени работы для выявления наилучшей реализации алгоритма.

Ключевые слова: cuda, gpu, mpi, алгоритм, битонная сортировка, параллельное выполнение, алгоритм сортировки.

Kadyrov P.A. graduate student, 1 course, "Applied mathematics and informatics "

Penza state University Russia, Penza city

COMPARISON OF ACCELERATION THE PARALLEL VERSION OF THE BITONIC SORT ALGORITHM ON THE CUDA ARCHITECTURE AND MPI STANDARD

Annotation: This article discusses two implementations of the bitonic sort algorithm in parallel on the CUDA technology and MPI standard. Experiments are conducted for each implementation and compares the results of the work time for identifying best implementation of the algorithm.

Keywords: cuda, gpu, mpi, algorithm, bitonic sort, parallel execution, sorting algorithm.

Алгоритм битонной сортировки был разработан американским информатиком Кеннетом Батчером в 1968 году и предназначен для параллельной сортировки данных [1]. Алгоритм основан на сортировке битонных последовательностях. Битонной последовательностью называют последовательность, которая сначала не монотонно убывает, а затем монотонно не возрастает.

Худшее, среднее и лучшее время сортировки данным алгоритмом

л

составляет O(log(n)).

В настоящее время рост производительности центральных процессоров основан за счёт увеличения ядер на одном процессоре, так как увеличение частоты приводит к большим энергозатратам и увеличению тепловыделения, а в связи с этим будет требоваться больше охлаждения, чтобы не допустить, перегрев процессора. Однако для вычислений общего назначения кроме центральных процессоров используются и графические процессоры.

Для определения наилучшего варианта параллельной версии алгоритма битонной сортировки, были написаны две программы.

Первая программа написана с использованием стандарта MPI и выполняется исключительно на центральном процессоре [3]. Данные считываются с текстового файла. Результатом работы программы был отсортированный массив целых чисел, записанный в файл.

Вторая программа была разработана для выполнения на архитектуре CUDA и запускалась на центральном процессоре [2]. В ходе выполнения, задача сортировки полностью передаётся на графический процессор. После выполнения сортировки графическим процессором, отсортированный массив целых чисел копировался с оперативной памяти графической карты, в оперативную память, установленную на материнской плате. Затем отсортированный массив записывался в текстовый файл.

Все опыты проводились на машине со следующими параметрами:

• CPU — AMD FX-8350 с 8-ью ядрами до 4.2 ГГц

• ОЗУ — 16GB

• GPU — GeForce GTX 760 2GB

• ОС: Ubuntu 17.04 x64 разрядная

Для опытов был создан текстовый файл с 8388608 строк, по одному целому числу на каждую строку. Программы написаны на языке С++11 [4].

Программа, написанная со стандартом MPI, была запущена 8 раз с разным количеством создаваемых процессов. Результат опытов приведен в таблице 1.

_Таблица 1. Результат работы программы на стандарте MPI.

№ опыта Количество создаваемых Время выполнения сортировки /

процессов мс

1 1 18280

2 2 15715

3 3 16583

4 4 14999

5 5 18013

6 6 19526

7 7 20169

8 8 20612

Программа, разработанная для архитектуры СиОЛ, запускалась также 8 раз, но без изменения параметров создаваемых нитей, так как алгоритм был написан с расчётом на то, что каждая нить графического процессора будет обрабатывать свою часть сортировки. Результат опытов приведен в таблице 2.

Таблица 2. Результат работы программы на архитектуре CUDA.

№ опыта Время выполнения сортировки / мс

1 193.179

2 197.74

3 193.66

4 192.02

5 192.49

6 191.30

7 195.44

8 196.04

Результаты опытов показывают нам, что реализация алгоритма битонной сортировки написанная на технологии СиОЛ и исполняемая на

графическом процессоре, выполняется в 77 раз быстрее, чем реализация алгоритма на стандарте MPI.

На основе полученных результатов мы можем сделать вывод, что сортировка большого объёма данных алгоритмом битонной сортировки, целесообразно проводить на графических процессорах, нежели на центральных процессорах.

Использованные источники:

1.Википедия [Электронный ресурс] 2017г. [Дата обращения: 25.05.17] https: //en.wikipedia. org/wiki/Bitonic_sorter

2.Сандерс Дж., Кэндрот Э. Технология CUDA в примерах. Введение в программирование графических процессоров - Изд. ДМК Пресс, 2013

3.MPI для начинающих [Электронный ресурс] 2017г. [Дата обращения: 26.05.2017] http://www.opennet.ru/docs/RUS/MPI_intro/

4.Прата С. Язык программирования C++. Лекции и упражнения. - Изд. Вильямс, 2012.

Мамаев А. В., кандидат технических наук, доцент

ОАО «НПОЛЭМЗ» Москва, Россия НОВАЯ АЛЬТЕРНАТИВА СТАРОЙ РЕЛЯТИВИСТСКОЙ

ПАРАДИГМЕ

Аннотация: Показана внутренняя противоречивость специальной теории относительности Эйнштейна, предложена новая релятивистская теория пространства-времени, основанная на одном лишь принципе относительности, без запрета сверхсветовых скоростей, без отставания движущихся часов от покоящихся (без замедления времени) и с зависимостью заряда частицы от скорости её движения. Показано, что эксперименты на ускорителях не противоречат новой теории, если известный эксперимент Андерсона и Неддермейера 1938 года, считающийся экспериментальным подтверждением существования мезонов, толковать в пользу экспериментального обнаружения зависимости заряда от скорости и сверхсветовых скоростей.

Ключевые слова: специальная теория относительности, внутренняя противоречивость, новая релятивистская теория пространства-времени, преобразования координат и времени, зависимость заряда частицы от скорости её движения, единица измерения времени световых часов, сверхсветовые скорости движения частиц.

Mamaev A. V., Candidate of Engineering Sciences, Docent

JSC "LEMZ R&P Corp." Moscow, Russia

A NEW ALTERNATIVE TO OLD RELATIVISTIC PARADIGM

Abstract . A self-contradictoriness of Einstein's Special Relativity Theory is shown, a new relativistic space-time theory is offered based upon the only

i Надоели баннеры? Вы всегда можете отключить рекламу.