Научная статья на тему 'Эффективность распараллеливания задач по моделированию процесса линейной сварки трением в инженерных пакетах ANSYS Mechanical и Simulia Abaqus'

Эффективность распараллеливания задач по моделированию процесса линейной сварки трением в инженерных пакетах ANSYS Mechanical и Simulia Abaqus Текст научной статьи по специальности «Физика»

CC BY
489
242
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЛИНЕЙНАЯ СВАРКА ТРЕНИЕМ / КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ / МНОГОПРОЦЕССОРНЫЕ СИСТЕМЫ / ГРАФИЧЕСКИЕ УСКОРИТЕЛИ / ANSYS MECHANICAL / SIMULIA ABAQUS / LINEAR FRICTION WELDING / COMPUTER SIMULATION / MULTIPROCESSOR SYSTEMS / GRAPHICS ACCELERATORS

Аннотация научной статьи по физике, автор научной работы — Ямилева Альфия Маратовна, Юлдашев Артур Владимирович, Насибуллаев Ильдар Шамилевич, Газизов Рафаил Кавыевич

Процесс линейной сварки трением (ЛСТ) сопровождается нестационарными нелинейными физическими явлениями, приводящими к высоким градиентам напряжений и температуры. При построении адекватной ресурсоэффективной компьютерной модели необходимо проводить множество параллельных расчетов для различных наборов параметров модели. В данной работе проводится сравнение эффективности распараллеливания статических и динамических термопрочностных задач в пакетах SIMULIA Abaqus и ANSYS Mechanical.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по физике , автор научной работы — Ямилева Альфия Маратовна, Юлдашев Артур Владимирович, Насибуллаев Ильдар Шамилевич, Газизов Рафаил Кавыевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Parallelization efficiency of problems on modeling of linear friction welding in engineering packages ANSYS mechanical and SIMULIA ABAQUS

The linear friction welding (LFW) process is characterized by transient nonlinear physical phenomena which result in high stress and temperature gradients in metal objects. To develop an adequate resource efficient numerical model it is necessary to be able to solved with parallel computation for different sets of model parameters. In this paper the parallelization efficiency of transient and static thermo-structural problems simulated in SIMULIA Abaqus and ANSYS Mechanical is analyzed.

Текст научной работы на тему «Эффективность распараллеливания задач по моделированию процесса линейной сварки трением в инженерных пакетах ANSYS Mechanical и Simulia Abaqus»

МАШИНОСТРОЕНИЕ

УДК 621.791.14:004

А. М. Ямилева, А. В. Юлдашев, И. Ш. Насибуллаев, Р. К. Газизов

ЭФФЕКТИВНОСТЬ РАСПАРАЛЛЕЛИВАНИЯ ЗАДАЧ ПО МОДЕЛИРОВАНИЮ ПРОЦЕССА ЛИНЕЙНОЙ СВАРКИ ТРЕНИЕМ В ИНЖЕНЕРНЫХ ПАКЕТАХ ANSYS MECHANICAL И SIMULIA ABAQUS

Процесс линейной сварки трением (ЛСТ) сопровождается нестационарными нелинейными физическими явлениями, приводящими к высоким градиентам напряжений и температуры. При построении адекватной ресурсоэффективной компьютерной модели необходимо проводить множество параллельных расчетов для различных наборов параметров модели. В данной работе проводится сравнение эффективности распараллеливания статических и динамических термопрочностных задач в пакетах SIMULIA Abaqus и ANSYS Mechanical. Линейная сварка трением; компьютерное моделирование; многопроцессорные системы; графические ускорители; ANSYS Mechanical; SIMULIA Abaqus

Линейная сварка трением (ЛСТ) [1, 2] - это разновидность сварки давлением, при которой нагрев осуществляется трением, вызванным возвратно-поступательным движением друг относительно друга соединяемых частей свариваемого изделия, с частотой порядка 50 Гц и амплитудой до 3 мм. Линейная сварка трением успешно применяется в авиастроении при производстве газотурбинных двигателей для «наращивания» деталей вместо их обработки из заготовки, а также в ремонтном производстве.

Моделирование процесса линейной сварки трением характеризуется рядом особенностей. Во-первых, рассматривается нестационарная задача, процесс быстротечен, его длительность в зависимости от параметров может составлять до 5 с. Во-вторых, в узкой приконтактной зоне происходит нагрев на величину до 1000 °С, вследствие чего возникают значительные градиенты температуры и напряжений. Это порождает необходимость моделирования термонапряженного состояния свариваемых образцов, для чего строится конечно-элементная модель с плотным шагом как пространственной, так и временной сетки. Значительно замедляет рас-

Контактная информация: телефон Работа выполнена в рамках проекта «Создание технологий и промышленного производства узлов и лопаток ГТД с облегченными высокопрочными конструкциями для авиационных двигателей новых поколений» (шифр 2010-218-01-133) в рамках реализации Постановления № 218 правительства РФ от 9,04.2010 г. «О мерах государственной поддержки развития кооперации российских высших учебных заведений и организаций, реализующих комплексные проекты по созданию высокотехнологичного производства».

чет задачи наличие нелинейности. При проведении многочисленных расчетов для различных параметров модели возникает необходимость в использовании многопроцессорных систем и определении наиболее оптимального количества параллельных потоков.

Ранее проводилось исследование эффективности распараллеливания решателей ANSYS Mechanical при моделировании ЛСТ [3], где было показано, что наиболее эффективными являются решатели PCG и JCG для симметричной матрицы [4]. Однако более полная модель ЛСТ не позволяет использовать данный решатель, так как в силу высокой нелинейности модели для улучшения сходимости используется несимметричная матрица, что ограничивает выбор методов решения. Следовательно, актуальной является задача исследования эффективности распараллеливания доступных решателей с помощью изменения параметров элементов и конечно-элементной сетки.

В данной работе рассматривается эффективность распараллеливания термопрочностных задач при моделировании процессов ЛСТ в инженерных пакетах SIMULIA Abaqus и ANSYS Mechanical. Все расчеты проводились на суперкомпьютере УГАТУ [5].

1. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ

Для исследования эффективности распараллеливания термопрочностных задач в пакетах SIMULIA Abaqus и ANSYS Mechanical были использованы две компьютерные модели. В первой проводится моделирование упругой стадии процесса ЛСТ и определяются распределения температурного поля и поля напряжений

в области контакта (динамическая задача). Во второй модели рассматривается статический зажим и определяется начальное распределение напряжений в образце перед сваркой (статическая задача).

Эти модели позволяют оценить эффективность распараллеливания рассматриваемых инженерных пакетов для динамических и статических задач.

1.1. Модель упругой стадии ЛСТ

В данной модели исследуются термоупругие деформации при трении образцов размерами 26 х 35 х 13 мм. Геометрическая модель состоит из двух образцов прямоугольной формы, стоящих один на другом. Так как область нагрева располагается в тонком слое вблизи контакта, то рассматривается слой меньшей толщины: высота для верхнего образца 10 мм (для учета зажима), нижнего - 5 мм (рис. 1).

Верхний образец скользит по поверхности нижнего образца вдоль длинной стороны по закону х = а 8Іп(2л/?) с амплитудой а, возрастающей по линейному закону от 0 до 3,8 мм за 0,1 с и частотой /= 30 Гц. Периодическое колебание верхнего бруска осуществляется с помощью задания граничных условий на условную область зажима - часть боковых поверхностей, выделенную на рис. 1 темным цветом. Нижний образец фиксируется своей нижней гранью.

Рис. 1. Г еометрия задачи

На верхнюю грань верхнего образца задано давление, соответствующее прижимному усилию ^, возрастающему от 15 кН до 40 кН со скоростью 100 кН/с. Начальная температура образцов 20 °С. Так как длительность рассматриваемого процесса составляет доли секунды, процесс можно считать адиабатическим. В модели материала используются параметры титанового сплава ВТ6 [6, 7]. Коэффициент трения задан в виде линейной функции от температуры:

1(Т) = 0,3 + 5 10-4(Т - 293).

Используется правильная гексаэдрическая равномерная конечно-элементная сетка, средний размер элемента d варьируется от 0,7 до 0,55 мм (рис. 2).

Следует отметить, что, несмотря на относительно небольшой размер системы уравнений (порядка 100-200 тысяч), расчет занимает значительное время (до 84,5 ч на 8 ядрах суперкомпьютера УГАТУ [5] при 400 временных шагах в пакете ANSYS Mechanical). Это объясняется особенностями задачи:

• физическая нелинейность - учитывается зависимость свойств материала, коэффициента трения, от температуры;

• конструктивная нелинейность - граничные условия (перемещение, давление) меняются с течением времени.

В результате моделирования процесса ЛСТ в инженерных пакетах SIMULIA Abaqus и ANSYS Mechanical были получены поля температур и напряжений. Результаты моделирования упругой стадии процесса ЛСТ в различных пакетах согласуются между собой по распределению напряжений (в пределах 20 %) и по температурным зависимостям (в пределах 10 %).

Следует отметить неравномерность температурного поля в контактной плоскости. Область максимального нагрева расположена в контактной плоскости в 3-4 мм от боковых граней (рис. 2, а). Глубина прогрева образца через 0,1 с после начала движения около 2 мм. Максимальные напряжения возникают в области закреплений (рис. 2, б), но вследствие значительного нагрева течение материала начинается в зоне контакта, где напряжения достигают 900 МПа.

б

Рис. 2. Поле температур (а, °С) и напряжений (б, Па). Верхний образец показан на %

Таблица 1

Параметры тестируемых моделей и время расчета на 1 ядре

Задача Кол. элементов: объем.+ конт. Кол. узлов: объем. + конт. Количество уравнений Время расчета на 1 ядре (ч)

Abaqus ANSYS Abaqus ANSYS Abaqus ANSYS Abaqus ANSYS

d = 0,7 мм, лин. эл. 14763 + 2812 14763 + 1406 17480 + 8436 17480 + 0 69920 67320 3,65 7,55

d = 0,6 мм, лин. эл. 22704 + 3784 22704 + 1992 26312 + 11352 26312 + 0 105248 101798 9,38 13,87

d = 0,55 мм, лин. эл. 30456 + 4512 30456 + 2256 34800 + 13536 34800 + 0 139200 135100 18,92 19,65

d = 0,7 мм, квадр. эл. 14763 + 5624 9120 + 760 67066 + 16872 42458 + 0 218678 162706 21,57 21,35

1.2. Модель статического зажима образца

Рассматривается статическая термопрочностная задача. В данной задаче помимо образцов, представленных в предыдущей задаче, моделируется зажим верхнего образца. Геометрия зажима представляет собой две прямоугольные скобы со сквозными отверстиями для болтов, сжимающих образцы, и кольцевидными выступами, имитирующими головки болтов (рис. 3). Общий размер зажима 45 х 42,5 х 30 мм.

Рис. 3. Поле напряжений (Па)

На поверхности выступов на гранях зажима действует давление 450 МПа. Помимо этого, давление 100 МПа задано на верхнюю грань верхнего образца, нижняя грань нижнего образца закреплена по вертикали. Как для зажима, так и для образцов задавались те же параметры материала, как и ранее.

Для образцов построена гексаэдрическая, для зажима - тетраэдрическая конечно-элементная сетка.

На рис. 3 изображено полученное поле напряжений. Максимальные напряжения возникают на креплениях зажима и в области углов верхнего образца.

2. ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ

Для решения данных задач нами использовались инженерные пакеты ANSYS Mechanical 13.0 и 14.0 (далее ANSYS) и SIMULIA Abaqus 6.11 (далее Abaqus).

Для ANSYS Mechanical, имеется 25 лицензий на запуск задач, позволяющих проводить расчет на 4 ядрах, и 64 «параллельных лицензии» т. е. максимально мы можем запустить задачу на 68 ядрах.

Для Abaqus у нас имеется возможность задействовать до 32 ядер при распараллеливании расчета.

2.1. Эффективность распараллеливания динамической термопрочностной задачи

ANSYS предоставляет возможность выбора решателя линейной системы уравнений. В данной работе используется прямой решатель SPARSE [4] как наиболее быстрый среди решателей, применяемых для систем уравнений с несимметричной матрицей. Данный решатель требователен к объему оперативной памяти. Для задач большой размерности, когда задача не помещается в оперативную память, пакет использует память жесткого диска, что ведет к значительному падению скорости расчета. В этом случае можно использовать другие доступные решатели, более эффективно использующие ОЗУ (например, решатель JCG использует на порядок меньше ОЗУ при относительно малом времени расчета). По изложенной выше причине в данной работе в основном рассматриваются задачи небольшой размерности, при расчете которой достаточно оперативной памяти одного узла. Помимо этого, в большинстве задач используется MPI версия распараллеливания, как более эффективная по сравнению с SMP версией [3].

В Abaqus имеется возможность выбора явной или неявной схемы решения (Abaqus Explicit или Abaqus Standart). В основной массе расчетов используется явная схема решения. Здесь также используется MPI версия пакета.

2.1.1. Влияние порядка элементов и размерности сетки на ускорение

Проводится анализ ускорения динамической термопрочностной задачи для следующих параметров модели: порядок конечных элементов, размерность сетки. Расчеты проводятся с использованием до 6 узлов суперкомпьютера: 2x Intel Xeon 5300 2.33GHz (всего 8 ядер), RAM 864 GB, DDRII 667 MHz.

Рассмотрено четыре варианта модели, отличающихся параметрами конечно-элементной сетки: с линейными элементами со средним размером d = 0,7 мм, d = 0,6 мм, d = 0,55 мм и квадратичными элементами со средним размером d = 0,7 мм. Параметры моделей приведены в табл. 1.

При более подробном рассмотрении видно, что вследствие особенностей создания контакта в данных пакетах (большее число контактных элементов в Abaqus, отсутствие контактных узлов в ANSYS) при одинаковых параметрах сетки строятся системы с различным числом уравнений. Отличие составляет порядка 3-4 %. При последовательном расчете для всех задач Abaqus показывает лучшее время расчета, при увеличении числа уравнений разница во времени сокращается.

При распараллеливании данных задач Abaqus также показывает лучшие результаты. Как показывают графики (рис. 4), выход на на-

сыщение для моделей в АЬадш произошел только в одной задаче. В случае АЬадш для массивных задач (рис. 4, в, г) ускорение в значительной степени ограничено числом лицензий. Использование большего числа узлов при одинаковом суммарном числе ядер позволяет достичь большего ускорения.

АК8У8 показывает меньшее максимальное ускорение, чем АЬадш (табл. 2). Для всех задач в А№У8 достигается насыщение по распараллеливанию для фиксированного числа узлов, наиболее оптимальным является использование 4 из 8 ядер каждого узла.

Увеличение числа уравнений для обоих пакетов позволяет получить большее ускорение. Отдельно следует рассмотреть задачу с квадратичными элементами (табл. 1, случай 4). Вследствие большой размерности данной задачи в пакете А№У8 рассматривалась модель

с симметрией относительно вертикальной плоскости вдоль направления движения. Средний размер элемента здесь немного меньше, чем в пакете АЬадш, где соответствующая задача рассматривалась без симметрии. Как следствие, при близких по значению временах расчета задачи имеют различную сложность, что показывает АЬадш с лучшей стороны.

Расчет на квадратичных элементах требует значительно больше времени и ресурсов, чем на линейных элементах, при одинаковых прочих параметрах сетки. Но для получения необходимой точности дискретизации при использовании линейных элементов требуется сетка с большей плотностью, чем при использовании квадратичных.

Таблица 2

Время выполнения и объем используемой памяти для динамической термопрочностной задачи для различных вариантов расчета (полужирным шрифтом выделен лучший результат для расчета

конкретной задачи в рассматриваемых пакетах)

Задача Время (1 ядро), ч. Мин. время, ч. (N x CPN) Объем используемой памяти (1x1), МБ Макс. объем на 1 ядро для мин. времени, МБ

Abaqus ANSYS Abaqus ANSYS Abaqus ANSYS Abaqus ANSYS

d = 0,7 мм, лин. эл. 3,65 7,55 0,41 (6x4) 0,95 (6x6) 1405 1432 471 597

d = 0,6 мм, лин. эл. 9,38 13,86 0,86 (6x4) 1,79 (6x4) 2411 2505 784 657

d = 0,55 мм, лин. эл. 18,92 19,65 1,60 (4x8) 2,06 (6x4) 3479 3621 1356 699

d = 0,7 мм, квадр. эл. 21,57 21,35 1,62 (4x8) 2,18 (6x6) 8277 5539 3196 732

*Ы - число задействованных узлов суперкомпьютера, СРК - количество задействованных ядер на каждом узле

Ускорение Ускорение Ускорение Ускорение

Число

узлов

—1

—А—2

—■— 3 4

—А—5 6

е

и

н

е

р

о

к

Суммарное число ядер

Суммарное число ядер

Суммарное число ядер

Число

узлов

б

Число узлов —1 —л—2

—■— 3 4

—А—5 6

О 4 8 12 16 20 24 28

Суммарное число ядер

32 36

Суммарное число ядер

О 4 8 12 16 20 24 28 32 36 40

Суммарное число ядер

Суммарное число ядер

Суммарное число ядер

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 4. Ускорение относительно времени расчета tab и tan на 1 ядре в Abaqus (слева) и ANSYS (справа) соответственно: а - на сетке с линейными элементами, d = 0,7 мм, tab = 3,65 ч, tm = 7,55 ч; б - на сетке с линейными элементами, d = 0,6 мм, tab = 9,38 ч, tm = 13,87 ч; в - на сетке с линейными элементами, d = 0,55 мм, tab = 18,92 ч, tan = 19,65 ч; г - на сетке с квадратичными элементами, d = 0,7 мм, tab = 21,57 ч, tm = 21,35 ч

а

в

г

Наибольший выигрыш от использования квадратичных элементов получается при расчете теплового поля, так как порядок элемента влияет, прежде всего, на степени свободы. Для расчета данных из элементов, в частности, полей напряжений, использование элементов более высокого порядка оказывает существенное влияние только при значительных деформациях. Следовательно, для данного типа задач использование квадратичной сетки нецелесообразно.

В табл. 2 приведена статистика расчетов, выполненных в рамках данного исследования, динамической термопрочностной задачи в МР1-версиях пакетов с использованием до 6 узлов кластера. В большинстве случаев в пакете Abaqus расчеты выполняются быстрее, чем в АК8У8. Если оценивать объем используемой памяти, то на небольших задачах использование оперативной памяти на 1 ядре приблизительно одинаково, но при распределенном расчете АК8У8 использует меньше памяти, чем Abaqus. Наиболее ощутима разница на задачах с большим числом уравнений.

2.1.2. Влияние схемы решателя

В пакете Abaqus также была рассмотрена первая задача (конечно-элементная сетка с линейными элементами со средним размером й = 0,7 мм) с неявной схемой решения (Abaqus 81аМаЛ). В этом случае расчет на одном ядре составляет 1,99 часа, т. е. использование неявного решателя уменьшает продолжительность расчета почти в 2 раза по сравнению с использовавшимся в п. 2.1.1 явным решателем.

Эффективность распараллеливания в целом незначительно ниже, чем для явной схемы (рис. 5), характер кривых ускорения для обеих схем одинаков.

Число

узлов

0 4 8 12 16 20 24 28 32 36

Суммарное число ядер

Рис. 5. Ускорение относительно расчета на 1 ядре (1,99 ч) для неявного решателя в Abaqus

2.1.3. Ускорение на GPU

В последнее время в ряде инженерных программных пакетов конечно-элементного анализа появилась поддержка использования профессиональных графических процессоров (GPU) Tesla компании NVIDIA в качестве массивнопараллельных сопроцессоров для ускорения процесса вычислений. Среди прочих вычисления на GPU поддерживают рассматриваемые в данной работе программные модули ANSYS Mechanical и SIMULIA Abaqus. В версиях пакетов, использованных в рамках данной работы, возможно использование не более одного GPU в параллельных версиях для вычислительных систем с общей памятью (SMP). Однако в последующих версиях пакетов планируется поддержать расчеты на нескольких GPU, а также ввести поддержку GPU при вычислениях на многопроцессорных системах с распределенной памятью.

Приведем результаты исследования возможности сокращения времени решения некоторых термопрочностных задач в ANSYS Mechanical на гибридном вычислительном узле IBM iDataPlex dx360M3, установленном при суперкомпьютере УГАТУ. Данный сервер оборудован двумя 6-ядерными процессорами Intel Xeon 5670, а также двумя графическими процессорами NVIDIA Tesla M2050. Объем оперативной памяти на узле составляет 48 ГБ, объем памяти на каждом из GPU - по 3 GB. Так как расчет на GPU не поддерживался в MPI-версиях пакетов, в рамках исследования производились запуски SMP-версий на различном числе ядер центрального процессора (CPU) с использованием одного GPU в качестве сопроцессора и без.

Сетка 1:

сри

Сетка 1: CPU+GPU Сетка 2:

сри

Сетка 2: CPU+GPU Сетка 3:

сри

Сетка 3: CPU+GPU

Число ядер CPU

Рис. 6. Ускорение при использовании ОРИ относительно расчета / на 1 ядре СРИ в АЖУ8: сетка 1 - с линейными элементами, й = 0,6 мм (/ = 0,56 ч), сетка 2 -с линейными элементами, й = 0,55 мм (/ = = 0,87 ч), сетка 3 - с квадратичными элементами, й = 0,7 мм (/ = 1,06 ч)

В пакете А№У8 рассматривались три задачи с размером матрицы более 100000 уравнений: с линейными элементами, й = 0,6 мм и й = = 0,55 мм и с квадратичными элементами, й = 0,7 мм. Для проведения тестирования в краткие сроки длительность моделируемого процесса была уменьшена в 10 раз.

Время расчета 8МР-версии при подключении к расчету ОРИ наиболее существенно снижается при расчете на одном ядре СРИ: в 1,52,5 раза. При загрузке большего числа ядер СРИ выигрыш от использования ОРИ снижается (рис. 6). Наиболее эффективно ОРИ используется на задачах с большим числом уравнений (рис. 6, сетка 3).

Таким образом, с учетом особенностей лицензирования текущей академической версии А№У8, подключение к расчету на 4 ядрах СРИ одного ОРИ в качестве сопроцессора позволяет сократить время решения рассмотренных термопрочностных задач до 1,3 раз без использования параллельных лицензий.

В пакете АЬадш рассматривалась задача с линейными элементами, й = 0,7. Так как для несимметричного решателя использование ОРИ в АЬадш версии 6.11 не допускается, решатель был заменен на симметричный.

Следует отметить, что расчет на одном ядре СРИ нового узла суперкомпьютера УГАТУ сравним по времени с расчетом на всех 8 ядрах стандартных узлов предыдущего поколения. Время расчета 8МР-версии при подключении к расчету ОРИ снижается в 1,3 раза при использовании одного ядра СРИ, при использовании нескольких ядер СРИ (от 2 до 8) значительного ускорения на ОРИ не наблюдается (рис. 7), что, скорее всего, связано с относительно небольшой размерностью решаемой задачи для массивнопараллельной архитектуры ОРИ.

СРи

CPU+GPU

2,0 1,8

Ф 1,6

ш 1,4

а

о 12

и

> 1,0 0,8 0,6

0123456789 Число ядер CPU

Рис. 7. Ускорение при использовании ОРИ относительно расчета на 1 ядре СРИ (0,58 ч) в Abaqus

2.2. Эффективность распараллеливания статической термопрочностной задачи

В случае статической задачи зажима образца в рассматриваемых пакетах использованы схожие конечно-элементные сетки: размер элемента на зажиме составляет в среднем 3,8 мм, на брусках - в среднем 1,4 мм.

В пакете Abaqus сетка содержит 33661 элемент, в том числе 25477 объемных и 8184 контактных, и 40402 узлов, из которых 15850 в объемной модели и 24552 в контактных элементах. Решается система 63400 уравнений. Длительность расчета на одном ядре составляет 0,58 ч.

В пакете А№У8 аналогичная сетка содержит 25859 элементов, в том числе 24083 объемных и 2356 контактных, и 15198 узлов в объемной модели. Решается система 60572 уравнений, что приблизительно на 4,5 % меньше, чем в Abaqus. При этом расчет на одном ядре длится дольше - 0,98 часов. Тем не менее, распараллеливание здесь значительно эффективнее (рис. 8). В частности, это связано с тем, что в статическом расчете нет перестройки матрицы, и время на работу с внешней памятью сокращается.

Т аблица 3

Время выполнения и объем используемой памяти для статической прочностной задачи для различных вариантов расчета (полужирным шрифтом выделен лучший результат для расчета

конкретной задачи в рассматриваемых пакетах)

Пакет Время Минимальное Объем Максимальный объем на 1 ядро

(1 ядро), с. время, с., (К х СРК)* используемой памяти (1 ядро), МБ для минимального времени, МБ

Abaqus 2099 413 (5х4) 872 327

АШУ8 3542 397 (5х4) 964 622

- число задействованных узлов суперкомпьютера, СРК - количество задействованных ядер на каждом узле

е

и

н

е

р

о

ж

Суммарное число ядер

Суммарное число ядер

б

Рис. 8. Ускорение относительно времени расчета t на 1 ядре для статической задачи в Abaqus (а, t = 0,58 ч) и ANSYS (б, t = 0,98 ч)

Как показывают результаты расчетов в Abaqus, на 6 узлах уже не наблюдается увеличения ускорения по сравнению с меньшим числом узлов. При изменении числа ядер на узле наблюдается насыщение: различие в ускорении на 6 и 8 ядрах при одинаковом числе узлов практически отсутствует.

В табл. 3 приведена статистика по расчетам статической прочностной задачи в пакетах Abaqus и ANSYS. В отличие от динамической задачи ANSYS здесь использует больше памяти, чем Abaqus, при распределенном запуске - почти в 2 раза.

ЗАКЛЮЧЕНИЕ

Исследована эффективность распараллеливания решателей пакетов SIMULIA Abaqus и ANSYS Mechanical для двух типовых задач, связанных с моделированием процесса линейной сварки трением. Показано, что для динамических задач наиболее эффективное распараллеливание выполняется в пакете SIMULIA Abaqus. На статической задаче более эффективным оказался пакет ANSYS Mechanical.

Исследование возможности ускорения расчетов на GPU, которая появилась в последних

версиях пакетов ANSYS и Abaqus, показало, что использование GPU в качестве сопроцессора позволяет получить существенное ускорение относительно времени расчета на одном ядре CPU. Однако при сравнении со временем параллельного расчета на нескольких ядрах CPU заметное ускорение достигается только на больших рассмотренных сетках.

СПИСОК ЛИТЕРАТУРЫ

1. Вилль В. И. Сварка металлов трением. Л.: Машиностроение, 197G. 176 c.

2. Vairis A., Frost M. On the extrusion stage of linear friction welding of Ti6Al4V // Material Science and Engineering. 1999. A 271. P. 477-4S4.

3. Анализ эффективности распараллеливания решателей пакета ANSYS Multiphysics при моделировании процесса линейной сварки трением / А. Т. Бикмеев [и др.] // Вестник Южно-Уральского государственного университета. 2G11. № 25(242). С. 64-75.

4. ANSYS Mechanical APDL Basic Analysis Guide // Release 13.G. ANSYS, Inc., November 2G1G.

5. Суперкомпьютер УГАТУ, высокопроизводительные вычисления // Управление Информационных Технологий УГАТУ.

6. http://www.ufa-rb.ru/index.php?option=com_con-tent&view=article&id=70&Itemid=83 (дата обращения: 2G.1G.2G12).

7. ГОСТ 19SG7-91: Титановый сплав ВТ6

S. Характеристика материала ВТ6 // Марочник стали и сплавов.

9. http://www.splav.kharkov.com/mat_start.php? name_id=129S (дата обращения: 2G.1G.2G12).

ОБ АВТОРАХ

Ямилева Альфия Маратовна, асп. каф. высокопроиз-водительн. вычислительн. технологий и систем. Дипл. инженер-математик (УГАТУ, 2G1G). Иссл. в обл. моделирования твердотельных процессов.

Юлдашев Артур Владимирович, ст. преп. той же каф. Дипл. инженер-математик (УГАТУ, 2GG6). Иссл. в обл. суперкомпьютерных технологий.

Насибуллаев Ильдар Шамилевич, ст. преп. той же каф. Дипл. спец. по теор. и вычислительн. физике (БГУ, 2GGG). Канд. физ.-мат. наук по физике конденсированного состояния (Ин-т физики молекул и кристаллов УНЦ РАН, 2GG5). Иссл. в обл. гидродинамики изотропных и анизотропных жидкостей

Газизов Рафаил Кавыевич, проф., проректор по учеб.-мет. работе, зав. той же каф. Дипл. математик (БГУ, 19S3). Д-р физ.-мат. наук по диф. уравнениям (ИММ Уральск. отд. РАН, 1999). Иссл. в обл. группового анализа диф. уравнений, матем. моделирования и суперкомпьютерных технологий.

а

i Надоели баннеры? Вы всегда можете отключить рекламу.