Научная статья на тему 'Алгоритмы с двоичными деревьями поиска'

Алгоритмы с двоичными деревьями поиска Текст научной статьи по специальности «Математика»

CC BY
34
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Алгоритмы с двоичными деревьями поиска»

94 Суперкомпьютерные вычисления и программирование

Экономичные численные расчеты распространения цунами с применением FPGA

М. М. Лаврентьев1, Ан. Г. Марчук2, К. К. Облаухов1 1Институт автоматики и электрометрии СО РАН

2Институт вычислительной математики и математической геофизики СО РАН Email: mmlavrentiev@gmail.com DOI: 10.24412/cl-35065-2022-1-01-28

В исследованиях проблемы цунами имеются, как минимум, две задачи, требующие значительного количества численных расчетов распространения волны цунами от модельных источников. Первая задача - это определение цунамиопасности побережий методом сценарных расчетов, требующих сотен (а может быть и тысяч) вычислительных экспериментов по генерации и распространению цунами от модельных или реалистичных очагов с различным начальным смещением и местоположением. Вторая задача - это формирование базы синтетических мареограмм в точках расположения глубоководных регистраторов цунами от так называемых базисных источников, линейной комбинацией из которых впоследствии представляется реальный очаг. Обычно один расчет требует 2-3 час. процессорного времени на ПК или кластере, что требует энергетических затрат порядка 1-2 Квтч. Применение современных компьютерных архитектур, таких как программируемые пользователем матрицы FPGA (Field Programmable Gates Array) или графические процессоры GPU (Graphic Processing Unit), позволяет сократить время каждого расчета в 100-200 раз. В работе реализован вычислительный конвейер на FPGA плате, использующий разностную схему Мак-Кормака для решения нелинейной системы дифференциальных уравнений мелкой воды. Достигнутая производительность позволяет за 1 мин. получать распределение максимумов волны вдоль побережья, что позволяет существенно экономить время и потребление электроэнергии.

Производительность вычислений в системе IMDAF

А. В. Пененко, Е. В. Русин

Институт вычислительной математики и математической геофизики СО РАН

Email: rev@ooi.sscc.ru

DOI: 10.24412/cl-35065-2022-1-01-29

Рассматриваются вопросы производительности системы обратного моделирования IMDAF (Inverse Modeling and Data Assimilation Framework) [1] на различных уровнях: оптимизация логики вычислений, векторизация, оптимизация использования памяти, многопоточное и распределенное исполнение, исполнение на спецпроцессорах.

Работа выполнена в рамках гранта № 075-15-2020-787 Министерства науки и высшего образования РФ на выполнение крупного научного проекта по приоритетным направлениям научно-технологического развития (проект "Фундаментальные основы, методы и технологии цифрового мониторинга и прогнозирования экологической обстановки Байкальской природной территории").

Список литературы

1. Penenko A., Penenko V., Tsvetova E., Gochakov A., Pyanova E., Konopleva V. Sensitivity Operator Framework for Analyzing Heterogeneous Air Quality Monitoring Systems // Atmosphere. 2021. 12(12):1697.

Алгоритмы с двоичными деревьями поиска

П. С. Рузанкин

Институт математики им. С. Л. Соболева СО РАН

Email: ruzankin@math.nsc.ru

DOI: 10.24412/cl-35065-2022-1-01-30

1. Мы рассмотрим новый быстрый алгоритм построения двоичного дерева поиска для заданного набора чисел. Алгоритм имеет линейную временную сложность, если этот набор чисел упорядочен.

Секция 5 95

Алгоритм строит двоичное дерево поиска минимально возможной высоты, причем это дерево является полным в том смысле, что все уровни, кроме, возможно, самого нижнего, полностью заполнены. Алгоритм не использует рекурсивных вызовов функций и допускает простую эффективную параллелизацию. При сравнении производительности реализаций на языке R, в рассмотренных примерах новый алгоритм оказался более чем в 10 раз быстрее классического алгоритма Вирта (рекурсивно строящего левое и правое поддерево).

2. Мы рассмотрим алгоритм случайного выбора m объектов из n без возвращения. Алгоритм использует двоичное дерево поиска и имеет среднюю временную сложность O(m log m).

ЭГИДА-ТЕСТ-GPU. Адаптация прикладной методической программы ЭГИДА-ТЕСТ к счету на GPU

Е. А. Сизов, А. М. Ерофеев, И. Ю. Турутина, И. Н. Чистякова

Российский федеральный ядерный центр - Всероссийский научно-исследовательский институт

экспериментальной физики

DOI: 10.24412/cl-35065-2022-1-02-40

В докладе представлены результаты работ по адаптации к счету на графических ускорителях (GPU) прикладной методической программы ЭГИДА-ТЕСТ, включенной в систему тестов РФЯЦ-ВНИИЭФ для исследования параметров высокопроизводительных систем [1].

При помощи кода ЭГИДА-ТЕСТ моделируются процессы газовой динамики, используя ALE-подход, при котором аппроксимация уравнений происходит в два шага. На первом решаются уравнения газодинамики в лагранжевых переменных, а на втором производится аппроксимация конвективных членов уравнений. При этом активно используется программа "типовой схемы", определяющая и организующая порядок расчета ячеек и обмен данными между ячейками разных MPI-процессов [2]. В ЭГИДА-ТЕСТ введена возможность ведения счета на адаптивно-встраиваемой дробной сетке, что вносит элемент нерегулярности как в расчетную сетку, так и в структуры данных.

В докладе представлены описание и решение проблем, встреченных в процессе создания адаптированных к счету на GPU программ расчета лагранжева и эйлерова этапов газовой динамики, этапа создания и удаления дробных ячеек. Приведены пути решения проблемы использования нескольких GPU и проблемы задействования для расчета простаивающих ядер центрального процессора (схема счета MPIxCUDA + MPIxOMP). Продемонстрирована единая "типовая схема" для CPU и GPU, а также пример ее использования для прямых пересылок данных между устройствами GPU. В результате выполненной адаптации программ на тестовых задачах получено ускорение от использования GPU до 6 раз при эффективности не ниже 80 %.

Список литературы

1. Алексеев А. В., Беляев С. П., Бочков А. И., Быков А. Н., Ветчинников М. В., Залялов А. Н., Нуждин А. А., Огнев С. П., Самсонова Н. С., Чистякова И. Н., Янилкин Ю. В. Методические прикладные тесты РФЯЦ-ВНИИЭФ для численного исследования параметров высокопроизводительных систем // Вопросы атомной науки и техники. Сер.: Методики и программы численного решения задач математической физики. 2020. № 2. С. 86-100.

2. Колобянин В. Ю., Фёдоров А. А., Антипина Н. Р. Двухуровневое распараллеливание явных разностных схем методики ЭГАК // Вопросы атомной науки и техники. Сер.: Методики и программы численного решения задач математической физики. 2017. № 3. С. 62-69.

i Надоели баннеры? Вы всегда можете отключить рекламу.