Научная статья на тему 'Параллельная реализация на GPU инкрементального алгоритма Рамалингама для динамической обработки потоковых графов с одним источником'

Параллельная реализация на GPU инкрементального алгоритма Рамалингама для динамической обработки потоковых графов с одним источником Текст научной статьи по специальности «Математика»

CC BY
28
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Т. В. Снытникова, А. Ш. Непомнящая

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Параллельная реализация на GPU инкрементального алгоритма Рамалингама для динамической обработки потоковых графов с одним источником»

Суперкомпьютерные вычисления 111

Список литературы

1. Подвальный С.Л. Моделирование промышленных процессов полимеризации / С. Л. Подвальный. М.: Химия, 1979.

2. Слинько М.Г. Моделирование гетерогенных каталитических процессов // Теоретические основы химической технологии. 1998. Т.32, № 4. С. 433-440.

3. Слинько М.Г. Актуальные проблемы моделирования химических процессов и реакторов // Химическая промышленность. 1994. № 10. С. 651-655.

4. Оленев Н.Н. Основы параллельного программирования в системе MPI. М.: ВЦ РАН, 2005.

Анализ параллельного ускорения алгоритма идентификации источников на основе ансамблей решений сопряженных уравнений

А. В. Пененко1,2 А. В. Гочаков3

'Институт вычислительной математики и математической геофизики СО РАН 2Новосибирский государственный университет

3Сибирский региональный научно-исследовательский гидрометеорологический институт

Email: aleks@ommgp.sscc.ru

DOI: 10.24411/9999-017A-2020-30354

Нелинейные обратные задачи, в том числе задачи идентификации источников [1, 2] и коэффициентов [3] моделей адвекции-диффузии-реакции могут быть сведены посредством ансамблей решений сопряженных уравнении к квазилинейным операторным уравнениям. Различным типам данных измерений соответствуют различные конструкции ансамбля. Так как при построении оператора чувствительности сопряжённые уравнения решаются независимо, и это является самой продолжительной по времени выполнения частью алгоритма, то теоретически алгоритм допускает эффективное распараллеливание. В работе на примере сценария идентификации источников по данным мониторинга в городской атмосфере осуществляется экспериментальная оценка ускорений.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (код проекта 19-07-01135) в части алгоритмов для решения коэффициентных обратных задач с данными контактных измерений, (код проекта 20-01-00560) в части алгоритмов для решения задач продолжения, Российского фонда фундаментальных исследований и правительства Новосибирской области (код проекта 19-47-540011) в части приложений к условиям города Новосибирска.

Список литературы

1. Penenko A. Convergence analysis of the adjoint ensemble method in inverse source problems for advection-diffusion-reaction models with image-type measurements // Inverse Problems & Imaging, American Institute of Mathematical Sciences (AIMS), 2020, 14, 757-782.

2. Penenko, A.; Zubairova, U.; Mukatova, Z. & Nikolaev, S. Numerical algorithm for morphogen synthesis region identification with indirect image-type measurement data // Journal of Bioinformatics and Computational Biology, World Scientific Pub Co Pte Lt, 2019, V. 17, P. 1940002.

3. Пененко, А. В.; Николаев, С. В.; Голушко, С. К.; Ромащенко, А. В. & Кирилова, И. А. Численные алгоритмы идентификации коэффициента диффузии в задачах тканевой инженерии // Мат. биол. и биоинф., Institute of Mathematical Problems of Biology of RAS (IMPB RAS), 2016, 11, 426-444.

Параллельная реализация на GPU инкрементального алгоритма Рамалингама для динамической обработки потоковых графов с одним источником

Т. В. Снытникова, А. Ш. Непомнящая

Институт вычислительной математики и математической геофизики СО РАН

Email: snytnikovat@ssd.sscc.ru

DOI: 10.24411/9999-017A-2020-10186

В работе строится ассоциативная версия алгоритма Рамалингама для решения динамической проблемы достижимости в потоковых графах с одним источником при добавлении новой дуги. Эта задача возникает в таких приложениях, как компиляторы, системы верификации, а также анализ и синтез информации в геоинформационных системах. С ростом объемов обрабатываемых данных возрастает необходимость разработки динамических алгоритмов, которые выполняются быстрее, чем самые быстрые статические алгоритмы.

112

Секция 7

Для построения параллельной реализации алгоритма Рамалингама используется STAR-машина, которая моделирует работу ассоциативных параллельных процессоров с вертикальной обработкой данных. Эта модель реализована на графических ускорителях в работе [1].

Параллельная реализация упомянутого алгоритма на STAR-машине представлена в виде процедуры InsertEdgeReachability, корректность которой доказана. К основным достоинствам ассоциативной версии относятся простая структура данных и параллельная обработка графа по вершинам. Последнее приводит к существенному уменьшению числа итераций. Тестирование ассоциативного алгоритма проводится на графическом ускорителе.

Список литературы

1. Снытникова Т. В., Непомнящая А. Ш. Решение задач на графах с помощью STAR-машины, реализуемой на графических ускорителях. Прикладная дискретная математика. 2016. №3(33). С. 98-115.

Построение параллельного метода численного решения уравнений переноса для мезомасштабной метеорологической модели TSUNM3

А. В. Старченко1,2, Е. А. Данилкин1,2, Д. В. Лещинский1,2, Е. В. Семенов1-2, С. А. Проханов1

1Томский государственный университет

2Институт оптики атмосферы им. В. Е. Зуева СО РАН

Email: starch@math.tsu.ru

DOI: 10.24411/9999-017A-2020-10187

В работе рассматриваются алгоритмы численного решения обобщенного трехмерного дифференциального уравнения конвективно-диффузионного переноса для мезомасштабной метеорологической модели TSUNM3 [1]. Для построения численного алгоритма используются структурированные сетки с равномерным шагом по всем направлениям. При аппроксимации дифференциальной постановки задачи используется метод конечного объема со вторым порядком аппроксимации по времени и пространственным переменным.

Гибридный алгоритм построен как комбинация двух технологий параллельного программирования MPI и OpenMP. Библиотека передачи сообщений MPI используется для взаимодействия между вычислительными узлами кластера, а распараллеливание внутри одного вычислительного узла выполнено с использованием библиотеки для работы с общей памятью OpenMP.

Работа выполнена при финансовой поддержке Российского научного фонда (код проекта 19-71-20042). Список литературы

1. Starchenko A. V., Bart A. A., Bogoslovskiy N. N., Danilkin E. A., Terenteva M. A. Mathematical modelling of atmospheric processes above an industrial centre // Proceedings of SPIE 9292, 2014, V. 9292. P. 929249-1-929249-30.

Globalizer - a parallel software system for solving computationally time consuming multi-criteria global optimization problems

A. Sysoyev, V. Gergel, E. Kozinov Lobachevsky State University of Nizhni Novgorod Email: alexander. sysoyev@itmm.unn.ru DOI: 10.24411/9999-017A-2020-10185

В работе представлена программная система Globalizer, предназначенная для параллельного решения вычислительно трудоемких задач многомерной многоэкстремальной многокритериальной глобальной оптимизации. Globalizer реализует подход, основанный на редукции многокритериальных задач к задачам нелинейного программирования, используя различные свертки частных критериев, редукции многомерных задач к одномерным на основе кривых Пеано и применении эффективных информационно-статистических методов одномерной оптимизации. Реализованный подход позволяет выполнять распараллеливание как для кластеров, так и для вычислительных систем на общей памяти.

Работа поддержана Российским фондом фундаментальных исследований, проект № 19-07-00242 "Высокоэффективные параллельные методы глобальной оптимизации для задач суперкомпьютерного моделирования".

i Надоели баннеры? Вы всегда можете отключить рекламу.