Научная статья на тему 'Применение графических сопроцессоров на суперкомпьютере МВС-Экспресс для расчета задач аэрогазодинамики'

Применение графических сопроцессоров на суперкомпьютере МВС-Экспресс для расчета задач аэрогазодинамики Текст научной статьи по специальности «Математика»

CC BY
176
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АЭРОГАЗОДИНАМИКА / AEROGASDYNAMICS / ГРАФИЧЕСКИЙ СОПРОЦЕССОР / GRAPHIC CO-PROCESSOR

Аннотация научной статьи по математике, автор научной работы — Давыдов Александр Александрович

Использование графических сопроцессоров для вычислений общего назначения испытывает значительный подъем благодаря появлению новых средств программирования. Однако параллельные вычисления на графических процессорах на сегодняшний день встречаются достаточно редко. На примере макетного суперкомпьютера МВС-ЭКСПРЕСС показывается перспективность данного направления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Давыдов Александр Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GRAPHIC ACCELERATORS IN SUPERCOMPUTER MVS-EXPRESS FOR AEROGASDYNAMICS TASKS

There is a significant grow in graphic co-processors utilization during last years because of new programming tools emerging. However it's still a rare case when using it for parallel computing. The article discusses perspectives of this new research field on the example of MVS-EXPRESS supercomputer prototype built with graphic accelerators.

Текст научной работы на тему «Применение графических сопроцессоров на суперкомпьютере МВС-Экспресс для расчета задач аэрогазодинамики»

12. Dinda P., O'Hallaron DR. Realistic CPU Workloads through Host Load Trace Playback // Selected Papers from the 5th International Workshop on Languages, Compilers, and Run-Time Systems for Scalable Computers. May 25-27, 2000. - Р. 246-259.

13. Osogami T., Kato S. Optimizing system configurations quickly by guessing at the performance // Proceedings of the 2007 ACM SIGMETRICS international conference on Measurement and modeling of computer systems. June 12-16, 2007. San Diego, California, USA. - Vol. 35.- Issue 1 (June 2007). - Р. 145-156.

14. Топорков В.В. Модели распределенных вычислений. - М.: ФМЛ, 2004. - 320 с.

15. Carlson G. How to save money with computer monitoring // Proceedings of the ACM annual conference. August 01-01, 1972. Boston, Massachusetts, United States. - Р. 1018-1023.

16. Miller M., et al. The Paradyne Parallel Performance Measurement Tools // IEEE Computer. - 1995. - Vol. 28. - № 11. - Р. 37-46.

Семенов Александр Владимирович - Санкт-Петербургский государственный универ-

ситет информационных технологий, механики и оптики, аспирант, [email protected]

Бухановский Александр Валерьевич - Санкт-Петербургский государственный универ-

ситет информационных технологий, механики и оптики, д.т.н., профессор, [email protected]

УДК 533.6.011

ПРИМЕНЕНИЕ ГРАФИЧЕСКИХ СОПРОЦЕССОРОВ НА СУПЕРКОМПЬЮТЕРЕ МВС-ЭКСПРЕСС ДЛЯ РАСЧЕТА ЗАДАЧ АЭРОГАЗОДИНАМИКИ

А.А. Давыдов

Использование графических сопроцессоров для вычислений общего назначения испытывает значительный подъем благодаря появлению новых средств программирования. Однако параллельные вычисления на графических процессорах на сегодняшний день встречаются достаточно редко. На примере макетного суперкомпьютера МВС-ЭКСПРЕСС показывается перспективность данного направления. Ключевые слова: аэрогазодинамика, графический сопроцессор.

Введение

Применение видеокарт NVidia GeForce 8800 GTX [1] для расчета задач газовой динамики позволяет ускорить расчет в 10-15 раз по сравнению с серверными процессорами, входящими в состав типичных кластерных установок. Однако относительно небольшой объем оперативной памяти таких устройств (до 1 ГБ) создает ощутимые ограничения на размер решаемых задач. Параллельное использование графических процессоров накладывает очень жесткие требования на коммуникационную среду, выполнение которых не под силу большинству современных кластерных установок. В ИПМ им. М.В. Келдыша РАН построен и передан в опытную эксплуатацию макет гибридного суперкомпьютера из 6 узлов, объединенных каналами PCI-Express, с пиковой производительностью около полутора терафлопс. В состав каждого узла данного макета, помимо четырех универсальных процессоров (ядер), входит один графический сопроцессор GeForce 8800 GTX (рис. 1). В работе проводится исследование эффективности параллельного использования графических сопроцессоров для расчета задач газовой динамики.

Скорость до 700 МБ/с латентность ~1,2 мкс время выдачи слова -70 не время чтения слова -2,5 мкс

- Ядро )-

2x2 opteron 2.8 GHz 4 GB RAM

GeForce 8800 GTX; 16 Multiprocessors 765 MB DDR3 RAM 16 KB Shared memory per Multiprocessor

Рис. 1. Схема установки МВС-ЭКСПРЕСС Графические сопроцессоры и параллельные вычисления

При организации работы параллельной программы приходится не только постоянно пересылать данные с графического устройства в память процессора, но и обмениваться данными между узлами. Скорость типичной для современных кластерных установок коммуникационной среды настолько мала, что делает малоэффективным использование графических сопроцессоров в составе узла кластерной установки. Эту проблему удается решить, лишь используя новые высокоскоростные интерфейсы, такие как PCI-Express.

МВС-Экспресс

Установка МВС-ЭКСПРЕСС представляет собой 6 узлов, объединенных каналами PCI-Express через шину PCI-Express. Каждый узел снабжен двумя двуядерными процессорами Opteron с тактовой частотой 2,8 ГГц, оперативной памятью 4 ГБ и графической картой NVidia GeForce 8800 GTX (рис. 1). Для связи узлов друг с другом применяются коммутаторы взаимного прямого доступа в память с очень низкими показателями задержки при обращении к сети.

В рамках опытной эксплуатации системы МВС-ЭКСПРЕСС написан многопроцессорный программный комплекс для расчета двумерных плоских и осесимметричных течений идеального газа на многоблочных регулярных сетках по явной разностной схеме С. К. Годунова [2]. Комплекс позволяет проводить расчет как на универсальных процессорах, входящих в состав узла, так и на графических сопроцессорах. В табл. 1 приведено сравнение времени расчета на трех процессорах Opteron (2,8 MHz) и трех графических картах NVidia GeForce 8800 GTX соответственно.

Таблица 1. Сравнение времени расчета 5000 шагов на сетке из 7 блоков

Время расчета, с Ускорение

3xOpteron 2,8 MHz 60 1

3xGeForce 8800 GTX 8,6 6,9

Заключение

Коммуникационная среда, примененная на установке МВС-ЭКСПРЕСС, позволяет эффективно использовать графические ускорители NVidia GeForce 8800 GTX для

параллельных вычислений, что представлялось невозможным на типичных на сегодняшний день кластерных установках. Учитывая, что в задачах газовой динамики характерное время расчета на многопроцессорной установке составляет сотни и даже тысячи часов, такой подход представляется вполне оправданным, тем более, что стоимость такого графического ускорителя сравнима со стоимостью серверного процессора. Стоит также отметить, что задачи газовой динамики отнюдь не являются единственным полем для применения такого рода систем.

Литература

1. NVIDIA Corporation. - Режим доступа: http://nvidia.com, свободный.

2. Годунов С.К., Забродин А.В., Иванов М.Я., Крайко А.Н., Прокопов Г.П. Численное решение многомерных задач газовой динамики. - М.: Наука, 1976.

Давыдов Александр Александрович - ИПМ им. М. В. Келдыша РАН, м.н.с.,

[email protected]

УДК 004.074

АНАЛИЗ БЫСТРОДЕЙСТВИЯ ОЗУ И ПОСТРОЕНИЕ МОДЕЛИ ПРОИЗВОДИТЕЛЬНОСТИ ЭВМ

К.С. Солнушкин

В работе исследовано быстродействие ОЗУ отдельно взятой ЭВМ как функция от параметров подсистемы памяти - частоты шины и режима работы контроллера памяти. Предложена и экспериментально подтверждена модель производительности, устанавливающая линейную зависимость производительности от быстродействия ОЗУ.

Ключевые слова: модели производительности, быстродействие ОЗУ

Сфера использования высокопроизводительных вычислений сегодня постоянно расширяется. Однако анализ производительности ЭВМ до сих пор остается сложной задачей, далекой от окончательного решения. К факторам, оказывающим значительное влияние на производительность ЭВМ, относится быстродействие оперативного запоминающего устройства (ОЗУ). Несовершенство ОЗУ либо несбалансированность его скоростных характеристик с аналогичными характеристиками центрального процессора приводит к низкой производительности ЭВМ.

В [1] введены понятия производительность и быстродействие в применении к ЭВМ. Там же введены понятия номинального и эффективного быстродействия. Эффективным быстродействием ОЗУ мы будем называть быстродействие (в операциях в единицу времени), наблюдаемое с помощью программ-тестов. В различных тестах измерения организованы по-разному, и понятие операции с ОЗУ размывается. Распространенным вариантом операции является чтение (запись) крупных блоков данных с измерением затраченного времени. Количество байт, перемещенных из ОЗУ в регистры центрального процессора (ЦП) или обратно за единицу времени, будем называть эффективной пропускной способностью.

Для исследования эффективной пропускной способности ОЗУ применим тест STREAM [2]. Тест обладает понятными правилами измерения быстродействия, простой интерпретацией результатов. Накоплена значительная статистика по разным типам ЭВМ. Будем исследовать ЭВМ класса IBM PC на основе ЦП AMD Athlon XP 2600+. В данной ЭВМ набор микросхем (так называемый «чипсет») модели nForce2 обеспечивает для контроллера ОЗУ два канала доступа к памяти, которые могут функционировать

i Надоели баннеры? Вы всегда можете отключить рекламу.