Научная статья на тему 'Применение высокопроизводительных вычислений для решения задачи Коши с дробным уравнением Риккати по нелокальной неявной конечно-разностной схеме'

Применение высокопроизводительных вычислений для решения задачи Коши с дробным уравнением Риккати по нелокальной неявной конечно-разностной схеме Текст научной статьи по специальности «Математика»

CC BY
2
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
параллельные вычисления / OpenMP / неявные конечно-разностные схемы / метод Ньютона / дробные производные / эффект памяти / нелокальность / нелинейность / parallel computing / OpenMP / implicit finite difference schemes / Newton’s method / fractional derivatives / memory effect / non-locality / non-linearity

Аннотация научной статьи по математике, автор научной работы — Твёрдый Дмитрий Александрович, Паровик Роман Иванович

В статье представлено исследование вычислительной эффективности параллельной версии численного алгоритма для решения уравнения Риккати с производной дробного перменного порядка типа Герасимова-Капуто. Численный алгоритм представляет собой нелокальную неявную конечно-разностную схему, которая сводится к системе нелинейных алгебраических уравнений и решается с помощью модифицированного метода Ньютона. Нелокальность численной схемы создает высокую вычислительную нагрузку на вычислительные ресурсы, из-за чего возникает необходимость в реализации эффективных параллельных алгоритмов их решения. Исследуемый на эффективность численный алгоритм реализован на языке C из-за его универсальности при работе с памятью. Распаралеливание проводилось с помощью технологии OpenMP. Проводится серия вычислительных экспериментов на вычислительном сервере NVIDIA DGX STATION (Институт математики имени В.И. Романовского, г. Ташкент, Узбекистан) и ноутбуке HP Pavilion Gaming Laptop Z270X, где решалась задача Коши для дробного уравнения Риккати с непостоянными коэффициентами. На основе среднего времени вычисления вычисляются: ускорение, эффективность и стоимость алгоритма. Из анализа данных видно, что OpenMP параллельная программная реализация нелокальной неявной конечно-разностной схемы показывает ускорение работы от 9-12 раз в зависимости от количества задействованных ядер CPU.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Твёрдый Дмитрий Александрович, Паровик Роман Иванович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of High-Performance Computing to Solve the Cauchy problem with the Fractional Riccati Equation Using an Nonlocal Implicit Finite-Difference Scheme

The article presents a study of the computational efficiency of a parallel version of a numerical algorithm for solving the Riccati equation with a fractional variable order derivative of the GerasimovCaputo type. The numerical algorithm is a nonlocal implicit finite-difference scheme, which reduces to a system of nonlinear algebraic equations and is solved using a modified Newton method. The nonlocality of the numerical scheme creates a high computational load on computing resources, which creates the need to implement efficient parallel algorithms for solving them. The numerical algorithm studied for efficiency is implemented in the C language due to its versatility when working with memory. Parallelization was carried out using OpenMP technology. A series of computational experiments are being carried out on the NVIDIA DGX STATION computing server (Institute of Mathematics named after V.I. Romanovsky, Tashkent, Uzbekistan) and the HP Pavilion Gaming Laptop Z270X, where the Cauchy problem for the fractional Riccati equation with non-constant coefficients was solved. Based on the average computation time, the speedup, efficiency and cost of the algorithm are calculated. From the data analysis it is clear that the OpenMP parallel software implementation of the non-local implicit finite-difference scheme shows an acceleration of 9-12 times, depending on the number of CPU cores involved.

Текст научной работы на тему «Применение высокопроизводительных вычислений для решения задачи Коши с дробным уравнением Риккати по нелокальной неявной конечно-разностной схеме»

Вестник КРАУНЦ. Физ.-мат. науки. 2024. Т. 46. №1. C. 103-117. ISSN 2079-6641

ИНФОРМАЦИОННЫЕ И ВЫЧИСЛИТЕЛЬНЫЕ ТЕХНОЛОГИИ d https://doi.org/10.26117/2079-6641-2024-46-1-103-117 Научная статья

Полный текст на русском языке УДК 519.642.2, 519.687.1

Применение высокопроизводительных вычислений для решения задачи Коши с дробным уравнением Риккати по нелокальной неявной конечно-разностной схеме

Д. А. Твёрдый, Р. И. Паровик*

Институт космофизических исследований и распространения радиоволн ДВО РАН, 684034, c. Паратунка, ул. Мирная, д. 7., Россия

Аннотация. В статье представлено исследование вычислительной эффективности параллельной версии численного алгоритма для решения уравнения Риккати с производной дробного перменного порядка типа Герасимова-Капуто. Численный алгоритм представляет собой нелокальную неявную конечно-разностную схему, которая сводится к системе нелинейных алгебраических уравнений и решается с помощью модифицированного метода Ньютона. Нелокальность численной схемы создает высокую вычислительную нагрузку на вычислительные ресурсы, из-за чего возникает необходимость в реализации эффективных параллельных алгоритмов их решения. Исследуемый на эффективность численный алгоритм реализован на языке C из-за его универсальности при работе с памятью. Распаралеливание проводилось с помощью технологии OpenMP. Проводится серия вычислительных экспериментов на вычислительном сервере NVIDIA DGX STATION (Институт математики имени В.И. Романовского, г. Ташкент, Узбекистан) и ноутбуке HP Pavilion Gaming Laptop Z270X, где решалась задача Коши для дробного уравнения Риккати с непостоянными коэффициентами. На основе среднего времени вычисления вычисляются: ускорение, эффективность и стоимость алгоритма. Из анализа данных видно, что OpenMP параллельная программная реализация нелокальной неявной конечно-разностной схемы показывает ускорение работы от 9-12 раз в зависимости от количества задействованных ядер CPU.

Ключевые слова: параллельные вычисления, OpenMP, неявные конечно-разностные схемы, метод Ньютона, дробные производные, эффект памяти, нелокальность, нелинейность

Получение: 18.01.2024; Исправление: 18.02.2024; Принятие: 07.03.2024; Публикация онлайн: 07.03.2024

Для цитирования. Твёрдый Д. А., Паровик Р. И. Применение высокопроизводительных вычислений для решения задачи Коши с дробным уравнением Риккати по нелокальной неявной конечно-разностной схеме // Вестник КРАУНЦ. Физ.-мат. науки. 2024. Т. 46. № 1. C. 103-117. EDN: GNJWJM. https://doi.org/10.26117/2079-6641-2024-46-1-103-117.

Финансирование. Исследования выполнены в рамках гранта РНФ № 22-11-00064 по теме «Моделирование динамических процессов в геосферах с учетом наследственности»(https://rscf.ru/project/22-11-00064/). Конкурирующие интересы. Конфликтов интересов в отношении авторства и публикации нет. Авторский вклад и ответственность. Авторы участвовали в написании статьи и полностью несут ответственность за предоставление окончательной версии статьи в печать.

* Корреспонденция: А E-mail: romanparovik@gmail.com ф

Контент публикуется на условиях Creative Commons Attribution 4.0 International License © Твёрдый Д. А., Паровик Р. И., 2024

© ИКИР ДВО РАН, 2024 (оригинал-макет, дизайн, составление)

Vestnik KRAUNC. Fiz.-Mat. nauki. 2024. vol. 46. no. 1. P. 103-117. ISSN 2079-6641

INFORMATION AND COMPUTATION TECHNOLOGIES " https://doi.org/10.26117/2079-6641-2024-46-1-103-117 Research Article Full text in Russian MSC 34A08, 65Y05, 65M06

Application of High-Performance Computing to Solve the Cauchy problem with the Fractional Riccati Equation Using an Nonlocal Implicit Finite-Difference Scheme

D. A. Tverdyi, R.I. Parovik*

Institute for Cosmophysical Research and Radio Wave Propagation FEB RAS, 684034, Paratunka, Mirnaya st., 7, Russia

Abstract. The article presents a study of the computational efficiency of a parallel version of a numerical algorithm for solving the Riccati equation with a fractional variable order derivative of the Gerasimov-Caputo type. The numerical algorithm is a nonlocal implicit finite-difference scheme, which reduces to a system of nonlinear algebraic equations and is solved using a modified Newton method. The nonlocality of the numerical scheme creates a high computational load on computing resources, which creates the need to implement efficient parallel algorithms for solving them. The numerical algorithm studied for efficiency is implemented in the C language due to its versatility when working with memory. Parallelization was carried out using OpenMP technology. A series of computational experiments are being carried out on the NVIDIA DGX STATION computing server (Institute of Mathematics named after V.I. Romanovsky, Tashkent, Uzbekistan) and the HP Pavilion Gaming Laptop Z270X, where the Cauchy problem for the fractional Riccati equation with non-constant coefficients was solved. Based on the average computation time, the speedup, efficiency and cost of the algorithm are calculated. From the data analysis it is clear that the OpenMP parallel software implementation of the non-local implicit finite-difference scheme shows an acceleration of 9-12 times, depending on the number of CPU cores involved.

Keywords: parallel computing, OpenMP, implicit finite difference schemes, Newton's method, fractional derivatives, memory effect, non-locality, non-linearity

Received: 18.01.2024; Revised: 18.02.2024; Accepted: 07.03.2024; First online: 07.03.2024

For citation. Tverdyi D. A., Parovik R. I. Application of high-performance computing to solve the Cauchy problem with the fractional Riccati equation using an nonlocal implicit finite-difference scheme. Vestnik KRAUNC. Fiz.-mat. nauki. 2024, 46: 1,103-117. EDN: GNJWJM. https://doi.org/10.26117/2079-6641-2024-46-1-103-117.

Funding. The research was carried out within the framework of the RSF grant № 22-11-00064 on the topic "Modelling of dynamic processes in geospheres taking into account heredity"(https://rscf.ru/project/22-11-00064/). Competing interests. There are no conflicts of interest regarding authorship and publication.

Contribution and Responsibility. All authors contributed to this article. Authors are solely responsible for providing the final version of the article in print. The final version of the manuscript was approved by all authors.

* Correspondence: A E-mail: romanparovik@gmail.com ^jj

The content is published under the terms of the Creative Commons Attribution 4-0 International License © Tverdyi D. A., Parovik R. I., 2024

© Institute of Cosmophysical Research and Radio Wave Propagation, 2024 (original layout, design, compilation)

Введение

Численное решение уравнений при математическом моделировании динамических процессов может создавать высокую вычислительную нагрузку на узлы ЭВМ. В частности при решении задач возникающих в дробной динамике может возникать нелокальность и даже переменная нелокальность т.е. зависимостью текущего значения решения от конечного числа предыдущих на временном отрезке. Данное явление называют эффектом памяти [1-3]. Что будет серьезно замедлять вычисления, так как для его корректного обсчета в алгоритме могут возникать строго последовательные участки, которые нельзя распараллелить. Определение и математическое описание эффекта памяти, также эквиваленитное понятиям: эредитарности, запаздывания, наследственности, было дано В. Вольтерра в 1912 г. [4]. Память с точки зрения математики, может описываться с помощью дробной производной. На сегодняшний день существуют самые разные определения понятия оператора дробного дифференцирования: Лиувилля, Римана-Лиувилля, Вейля, Грюнвальда-Летникова и многие другие. Причём для некоторых из них существуют ещё большие обобщения на случай VO (variable order) порядка [5, 6], что в свою очередь приводит к переменной нелокальности. Обобщение известных и разработка новых математических моделей с учетом эредитарности позволяет заметно уточнить известные результаты [7,8]. На сегодняшний день уже во многих областях науки и техники успешно применяются производные и интегралы нецелых порядков [9,10].

Так например, в данном исследовании рассматривается прямая задача Коши для нелинейного дробного уравнения Риккати с непостоянными коэффициентами, которая разрешается численно с помощью методов конечно-разностных схем [11]. Память описывается с помощью оператора дробной производной типа Герасимова-Капуто переменного порядка по времени. Такие модели еще называют нелокальными по времени [12]. Одним из способов решения является нелокальная явная конечно-разностная схема (EFDS). И с помощью технологий OpenMP удалось уменьшить в 3-5 раз время вычисления по EFDS [13]. Другой способ заключается в использовании неявных конечно-разностно схем (IFDS) и методов их решения [11].

В данной работе представлен анализ эффективности параллельной программной реализации решения IFDS методом Ньютона, с использованием программно-аппаратной архитектуры OpenMP - открытого стандарта программного интерфейса для параллельных систем с общей памятью [15]. OpenMP является набором директив для компиляторов, библиотек функций и переменных окружения, и реализует параллельные вычисления с помощью идеи многопоточности - нескольких параллельно выполняемых задач CPU потоках. В качестве основного языка программирования использован язык высокого уровня С, из-за его универсальности, широкими возможностями по работе с памятью и официальной поддержке работы с OpenMP [16]. Анализ проводится на основе данных полученных в результате серии вычислительных экспериментов с использованием разработанного программного кода. Вычисления проводились

на вычислительном сервере NVIDIA DGX STATION, расположенном в институте математики имени В.И. Романовского АН РУз, а также персональном ноутбуке.

План исследования статьи следующий: Сначала представляется математическое описание задачи. Дается определение дробной производной типа Герасимова-Капуто переменного порядка и приводится задача Коши для дробного уравнения Риккати; Далее описывается нелокальная неявная конечно-разностная схема (IFDS), на примере дробного уравнения Риккати. Приводится метод Ньютона для решения IFDS и критерий сходимости метода; Даются определения понятий необходимых для анализа. Приводятся в графиках и таблицах результаты анализа эффективности параллельной OpenMP реализации IFDS на основе данных серии вычислений, в сравнении с лучшей последовательной реализацией IFDS.

Постановка задачи

Вопросами о возможности обобщения операций интегрирования и взятия производной нецелого порядка задавались ещё Г. Лейбниц, Г. Лопиталь и Я. Бернули в конце 17 века. В частности, их интересовал вопрос о смысле и значении теоремы о дифференцировании произведения двух функций сР^х)^хр, при нецелом р значении. Тема активно развивается, с тех пор и по наши дни. К настоящему моменту, существует не один десяток определений дробного дифференцирования, имеющих тот или иной смысл, и находящих свое примирение. Например, Лиувилля, Римана-Лиувилля, Вейля, Грюнвальда-Летникова и многие другие. Причем для некоторых из них существуют обобщения на случай УО (переменного) порядка [5, 6]. Можно отметить труд Самко С., Килбаса А., Маричева О. от 1987 года «Интегралы и производные дробного порядка и некоторые их приложения» [17], который подводит итоги исследования данного направления математики за последние 300 лет, и позволяет ознакомится с историей возникновения дробно-дифференциального исчисления.

В этом разделе мы рассмотрим постановку задачи Коши, численные способы решения которой, были ранее подробно изучены автором в работах [11, 18, 19]. Отметим, что дробное исчисление тесно взаимосвязано с понятием наследственности или памяти, рассматриваемой системы, когда текущее ее состояние зависит от конечного числа предыдущих состояний.

Определение 1. Дробной производной типа Герасимова-Капуто [11] где 0 < а("Ь) < 1 - переменный порядок дробной производной, а функция и("Ь) € С[0, Т] будем называть дробную производную вида:

a&(t) г \ 1

9ot U(a) = Г(1 - a(t)) J

(1)

о (t - a)a(t)

где производная и("Ь) = ^и, а " € [0, Т] - текущее время моделирования, Т > 0 общее время моделирования, а Г(.) - гамма-функция Эйлера.

t

Данное обобщение (1) на случай сс("Ь) известной дробной производной Герасимова-Капуто [21,22] проведено авторами в работе [11]. Согласно [3] можно обобщить (1) на случай п < сс("Ь) < п + 1.

Рассмотрим задачу Коши [11] для квадратично нелинейного уравнения Риккати с дробной производной переменного порядка [23]:

Э^Ма) - ВДиЩ = -аМиМ2 + е("), и(0) = ио, (2)

где 301(1)и(а) - оператор УО вида (1); Т > 0 - время моделирования; " е [0, Т] - текущее время моделирования; и("Ь) е С2[0,Т] - неизвестная функция решения; а("Ь), Ъ("Ь), е("Ь) е С[0,Т] - заданные функции, определяющие значения коэффициентов в каждый момент времени.

Замечание 1. В работе [11] рассмотрено уравнение (2) с более общей правой частью — а("Ь)и("Ь)2+е("Ь) = ^и("Ь),"Ь). Такая задача уже не обязательно представляет уравнение Риккати, и может описывать широкий класс динамических процессов с переменной памятью в насыщенных средах [3]. Это результат использовался нами в работах [19,24,25] при математическом моделировании процессов объёмной активности радона (КУЛ), где каждый член (2) будет иметь конкретный физический смысл.

Схема численного решения

Решение задачи (2) будет будет даваться с помощью теории конечно-разностных схем [11, 18, 20]. Самое сложное в переходе от дробного уравнения в (2) к его дискретному представлению. В работе [11, p.7] нами предложен несколько вариантов такого перехода для VO Герасимова-Капуто (1) при t е ["U,ti+i], в том числе для случая, когда в (1) подразумевается, что интегрирование производится слева.

Определение 2. Нелокальная неявная конечно-разностная схема (IFDS) (от англ. Implicite Finite-Difference Sheme) примет вид:

i-1

Ai У w- (ui-j - ui-j-i) + щи2 - biUi - Ci = 0, j=0

h-«i (3)

Ai = Wh-V, wi = (j + 1 )1-ai - j1-ai,

г(2 - ai) j

i = 1,..., N, и = C,

где u0 = C - начальное условие задачи Коши (2); C - известная константа; h = T/N

- шаг дискретизации равномерной сетки; N - число узлов сетки; i = 2, ...,N - 1

- номер узла вычислительной сетки; ai, bi, ci - сеточные аналоги функций коэффициентов задачи Коши.

Достоверность вычислений с применением (3) обоснована использованием теории дробного исчисления, методов вычислительной математики, функционального анализа, а также строгостью математических рассуждений.

Отметим, что в работе (см. [11, p.7-10]) сформулированы и доказаны ряд ключевые теоремы о сходимости и устойчивости численной схемы IFDS, но в более общем случае при —a(t)u(t)2 + c(t) = f(u(t),t).

IFDS (3) представляет собой систему нелинейных алгебраических уравнений, которую будем решать модифицированным методом Ньютона (MNM) (от англ. Modification Newton Method). Метод начинается с представления схемы (3) как итерационной функции:

i—1

F(ui) = Ai W (ui—j — Ui—j—i ) + aiu2 — biUi — Ci, (4)

j=0

для которой составляется итерационный процесс:

F (Um)

Um+1 = Um — , (5)

J (Um)' v '

где

• m - номер (или шаг) итерационного процесса;

• Um = (um, ...,um)T - вектор значений функции решения во всех узлах сетки i = 1..N известного на итерационном m (текущем) шаге;

• F (Um) = (f1 (um) ,...,fN (um )) - значения вычисляемые по (4) с учетом значений Um решения на m шаге;

• U0 - начальное приближение на самом первом шаге m = 0, вектор необходимый для старта (5) процесса. Некое предполагаемое решение (3) на первом шаге;

• J (Um) = (Jij) ,i = 1,..., N, j = 1,...,N - якобиан представляет собой нижнетреугольную матрицу вида:

[ 0,j > i + 1,

Jij = \ Ai — bi + 2aiui, j = i, (6)

Ai j — j—1) ,j < i — 1.

на каждой m итерации цикла.

Замечание 2. Итерационный процесс (5) не сработает, если будет иметь место сингулярность в нуле (точка, где функция не определёна или нестабильна) для итерационной функции (4).

Что касается сходимости, то стоит отметить что:

IJ (U0) I =Ц (Ai^ï - bi + 2aiu°) = 0.

i=1

т.е. определитель у матрицы Якоби (6) должен быть отличен от нуля, потому что только тогда для якобиана | (Ц0) существует обратная матрица | (Ц0) , т.е.

матрица Якоби (6) - невырожденная. И только в таком случае итерационный процесс (5) будет локально сходится порядком O(h).

В качестве начального приближения U0, в самом простом случае, можно взять вектор составленный из значений u0 - начального условия задачи Коши (3). Однако лучше будет использовать последнее значение uN—1 вычисленное, например, другим методом (схемой EFDS ) [13,14], как на рисунке 1, при условии её сходимости [11]. Это немного ускорит сходимость MNM, а также решит вопрос с сингулярностью, т.к. функция в точке uN-i будет определена, и сама по себе является некоторым возмущением.

Определение 3. Итерационный процесс (5) продолжается до тех пор пока не будет достигнута заданная точность решения, характеризуемая е. Критерием выхода из цикла будет G наименьшая ошибка, полученного решения, такая что G < е.

Анализ вычислительной эффективности

Отметим, что в рамках анализа вычислительной эффективноси использовались следующие вычислительные системы. Вычислительный сервер NVIDIA DGX STATION с характеристиками: CPU: Intel(R) Xeon(R) CPU E5-2698 v4 @ 2.20GHz(~1.20GHz) (20 CPUs, 40 Threads); RAM: 263855 Mb. Вычислительный сервер находится в Институте математики имени В.И. Романовского АН Уз, (г. Ташкент, Узбекистан). Также в экспериментах использовался ноутбук HP Pavilion Gaming Laptop Z270X 15-dk0xxx с характеристиками: CPU: Intel(R) Core(TM) i5-9300H CPU @ 2.40GHz (4 CPUs, 8 Threads); RAM: 8192 Mb.

Анализ вычислительной эффективности будем проводить на основе данных по замерам времени вычисления, полученным при множестве запусков исследуемых на эффективность алгоритмов. Из леммы Брента [15, 26, 27] следует что любой алгоритм реализованный для выполнения в системах типа PRAM можно модифицировать таким образом, что его можно выполнить в системах PRAM с меньшим числом потоков. Здесь PRAM - параллельная машина с произвольным доступом к памяти, объединяющая c потоков (ядер или CPU), общую память и устройство управления. Это одна из самых распространенных моделей вычислительных систем [15]. Из данной леммы следует, что мы можем сравнивать время вычисления (5) на системах с: одним ядром CPU (последовательный алгоритм) и разным количеством ядер (параллельный алгоритм).

Для замеров времени вычисления рассмотрим тестовый пример, на основе модели (2) со следующими параметрами: a(t) = 0.9 — ^; a(t) = cosT(t) ; b(t) = 1 — 0Tt; c(t) = sin2(t) ; N = 2000; T = 20. Результат вычисления по которому представлен на рисунке 1 ниже:

Исследуем, насколько быстрее выполняются алгоритмы реализующие итерационный процесс (5), для чего обратимся к таким понятиям как среднее время работы, ускорение, эффективность и стоимость алгоритма.

EFDS (OpenMP (CPU 6 - threads)) (N = 2000, h = 0.010000) -

IFDS Ordinary NM (Sequential (N = 2000, h = 0.010000) _IFDS Ordinary NM (OpenMP (CPU 6 - threads)) (M = 2000, h = 0.010000) -

Рис. 1. Результат вычисления итерационной процедуры MNM (5) для IFDS

различными алгоритмами [Figure 1. Calculation result of iterative procedure MNM (5) for IFDS by different algorithms ]

В силу того, что мы будем получать немного различные Тс при каждом новом численном эксперименте, а количество экспериментов конечно, то Тс можно считать случайной величиной с некоторой функцией распределения. Тогда для вычисления Тт^) и Тс^) прибегнем к понятию математического ожидания (среднее значение) [28] для дискретной случайной величины:

E(Tc(N))= ^

i=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

TC(N) L :

где i - индекс эксперимента; L - объем выборки.

(7)

NM IFDS

1UU — Notebook-(OpenMP) .-. SuperPC-(OpenMP) .-.

60

20 0 —

п П п

17 28

с - (Threadrs )

39

Рис. 2. Среднее E (■) время расчёта в секундах, при разном c - числе потоков CPU [Figure 2. Average E (■) calculation time in seconds for different c - number of CPU threads ]

Далее в таблице представим данные по E (■) среднее (7) из выборки в L = 10 значений при разном количестве задействованных c потоков CPU, где:

• пусть N = 2000 - число узлов расчётной сетки для (3), характеризует сложность алгоритма;

• T1(N) - время вычислений по задаче сложностью N последовательным (Sequential) алгоритмом;

• TC(N) - время вычислений по задаче сложностью N параллельным OpenMP алгоритмом, на машине c > 1 потоками CPU;

Таблица 1

Затраченные время T (сек.) и память RAM (Mb) для расчёта итерационной процедуры MNM (5) для IFDS (3) алгоритмом на основе OpenMP [Time spent T (sec.) and RAM memory (Mb) for calculating the iterative procedure MNM (5) for IFDS (3) by an algorithm based on

OpenMP.]

IFDS Notebook Super PC

i Ti(N) T6(N) Ti(N) T6(N) Ti/(N) T28(N) T39(N)

1 96.74 30.06 98.2 21.32 7,86 11.06 8.3

2 88.58 30.28 97.24 21.26 8.0 10.86 8.3

3 94.07 29.09 98.02 21.37 7.86 10.78 7.46

4 97.04 30.67 97.71 21.2 7.9 11.02 8.37

5 91.13 30.25 97.38 20.86 8.19 10.93 8.35

6 95.19 30.74 99.20 20.94 7.96 10.86 8.49

7 93.50 30.74 96.96 21.0 7.99 10.91 8.5

8 93.73 30.91 97.1 21.04 7.87 10.78 8.39

9 92.35 29.89 97.5 21.84 8.05 10.88 8.3

10 93.00 30.71 98.54 20.81 7.93 10.83 8.4

E(T ) 93.53 30.34 97.78 21.16 7.961 10.89 8.286

RAM 24.08

Теперь с использованием данных о времени потраченного на выполнение кода мы можем исследовать эффективность параллельного алгоритма. Под эффективностью понимается оптимальное соотношение в координатах: ускорение вычислений - объём занимаемой RAM памяти, по сравнению с последовательной версией алгоритма. Ускорение определяется формулой:

A(N) = E (T1(N)) (8) Ac(N) = E (Tc(N)), (8)

На основе которой можно определить эффективность от распараллеливания:

VC(N)= E (T1(N)) = AiiNl (9)

Vc(N) c ■ E (Tc(N)) c . (9)

Результаты вычисления по формулам (8) и (9) представлены на рис. 3 и рис. 4 соответственно:

Стоимостно-оптимальный показатель COC(N) на рис. 5, можно определить как произведение количества используемых потоков и TC(N) времени

MM IFDS

— 14 с

° 12 (5

fc 10

£ s

0

1 б

~ 4 Z

2

< 0

Nolebook-(OpenMP) .- SuperPC-(OpenMP) .-

— 1

17

с - (Threadrs )

28

39

Рис. 3. Ускорение AC(N) при разном c - числе потоков CPU [Figure 3. Acceleration Ac(N) at different c - number of CPU threads ]

NM IFDS

1

& 0.8 с

(U

£ 0.6 Ё

T 0.4

~ 0.2 >

0

Nolebook-(OpenMP) .-. SuperPC-(OpenMP) i-1

i—

— ■............................

17

с - (Threadrs )

Рис. 4. Эффективность Vc(N) при разном c - числе потоков CPU [Figure 4. Efficiency Vc(N) at different c - number of CPU threads ]

решения параллельном алгоритмом, пропорциональной сложности наилучшего последовательного алгоритма. Данный показатель определяется формулой:

COc(N) =

E (Tc(N)) ■ c E (Ti(N)) •

Рис. 5. Стоимостно-оптимальный показатель COc(N) при разном c - числе потоков CPU

[Figure 5. Cost-optimal COc(N) for different c - number of CPU threads ]

Заключение

Из результатов анализа эффективности параллельного OpenMP алгоритма IFDS видно, что имеет место существенный прирост скорости вычисления, но при увеличении числа потоков для параллельной обработки, их эффективность заметно снижается. При одинаковых параметрах численного эксперимента обе вычислительные системы выдают искомый результат за приблизительно равное время вычисления. Однако наибольшая эффективность достигается при использовании 10-15 потоков. Из анализа данных видно, что OpenMP параллельная программная реализация IFDS показывает ускорение работы от 9 - 12 раз в зависимости от количества задействованных ядер CPU.

Благодарности

Авторы выражают особую благодарность д.ф.-м.н., проф., Хайотову Абдулло Рахмоновичу за оказанную помощь при организации стажировки в Институте математики им. В.И. Романовского Академии наук Республики Узбекистан.

Авторы выражают особую благодарность к.ф.-м.н., Болтаеву Азизу Кузиевичу за оказанную помощь при организации работ на вычислительном сервере NVIDIA DGX STATION в Институте математики им. В.И. Романовского Академии наук Республики Узбекистан.

Аббревиатуры

CPU Central Processing Unit

OpenMP Open Multi-Processing

GPU Graphics Processing Unit

CUDA Compute Unified Device Architecture

EFDS Explicit Finite-difference Method

IFDS Implicit Finite-difference Method

RVA Radon Volumetric Activity

NM Newton Method

RAM Random Access Memory

PC Personal Computer

PRAM Parallel Random Access Machine

Список литературы

1. Uchaikin V. V. Fractional Derivatives for Physicists and Engineers. Vol. I. Background and Theory. Berlin: Springer, 2013.373 pp. ISBN 978-3-642-33911-0 DOI: 10.1007/978-3-642-33911-0.

2. Нахушев А. М. Дробное исчисление и его применение. Москва: Физматлит, 2003. 272 с. ISBN 5-9221-0440-3.

3. Parovik R. I. Mathematical models of oscillators with memory, Oscillators-Recent Developments, 2019, pp. 3-21 DOI: 10.5772/intechopen.81858.

4. Volterra V. Sur les équations intégro-différentielles et leurs applications, Acta Mathematica, 1912. vol. 35, no. 1, pp. 295-356 DOI: 10.1007/BF02418820.

5. Patnaik S., Hollkamp J. P., Semperlotti F. Applications of variable-order fractional operators: a review, Proceedings of the Royal Society A, 2020. vol.476, no. 2234, pp. 20190498 DOI: 10.1098/rspa.2019.0498.

6. Ortigueira M.D., Valerio D., Machado J. T. Variable order fractional systems, Communications in Nonlinear Science and Numerical Simulation, 2019. vol.71, pp. 231-243 DOI: 10.1016/j.cnsns.2018.12.003.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Petras I. Fractional-order nonlinear systems: modeling, analysis and simulation. Berlin, Germany: Beijing and Springer-Verlag, 2011. 218 pp. ISBN 9783642181009.

8. Sun H., Chang A., Zhang Y., Chen W. A review on variable-order fractional differential equations: mathematical foundations, physical models, numerical methods and applications, Fractional Calculus and Applied Analysis, 2019. vol.22, no. 1, pp. 27-59 DOI: 10.1515/fca-2019-0003.

9. Rossikhin Y.A., Shitikova M. V. Application of fractional calculus for dynamic problems of solid mechanics: novel trends and recent results, Applied Mechanics Reviews, 2010. vol. 63, no. 1, pp. 1-5 DOI: 10.1115/1.4000563.

10. Mainardi F. Fractional Calculus and Waves in Linear Viscoelastisity: An Introduction to Mathematical Models. 2nd edition. Singapore: World Scientific Publishing Company, 2022. 625 pp. ISBN 1783263989 DOI: 10.1142/p926.

11. Tverdyi D.A., Parovik R. I. Investigation of Finite-Difference Schemes for the Numerical Solution of a Fractional Nonlinear Equation, Fractal and Fractional, 2022. vol.6, no. 1:23, pp. 1-27 DOI: 10.3390/fractalfract6010023.

12. Volterra V. Theory of functionals and of integral and integro-differential equations. New York: Dover publications, 1959. 226 pp.

13. Tverdyi D. A., Parovik R. I., Hayotov A. R., Boltaev A. K. Parallelization of a Numerical Algorithm for Solving the Cauchy Problem for a Nonlinear Differential Equation of Fractional Variable Order Using OpenMP Technology, Bulletin KRASEC. Physical and Mathematical Sciences, 2023. vol. 43, no. 2, pp. 87-110 DOI: 10.26117/2079-6641-2023-43-2-87-11.

14. Tverdyi D.A., Parovik R.I. Hybrid GPU-CPU efficient implementation of a parallel numerical algorithm for solving the Cauchy problem for a nonlinear differential Riccati equation of fractional variable order, Mathematics, 2023. vol.11, no. 15:3358, pp. 1-21 DOI: 10.3390/math11153358.

15. Борзунов С. В., Кургалин С. Д., Флегель А. В. Практикум по параллельному программированию: учебное пособие. Санкт-Петербург: БХВ, 2017.236 с. ISBN 978-59909805-0-1.

16. Калиткин Н.Н. Численные методы. 2-е изд.. Санкт-Петербург: БХВ, 2011.592 с. ISBN 9785-9775-0500-0.

17. Самко С. Г., Килбас А. А., Маричев О. И. Интегралы и производные дробного порядка и некоторые их приложения. Минск: Наука и техника, 1987. 688 с.

18. Parovik R. I. Tverdyi D. A. Some Aspects of Numerical Analysis for a Model Nonlinear Fractional Variable Order Equation, Mathematical and Computational Applications, 2021. vol. 26, no. 3, pp. 55 DOI: 10.3390/mca26030055.

19. Tverdyi D. A., Parovik R. I. Application of the Fractional Riccati Equation for Mathematical Modeling of Dynamic Processes with Saturation and Memory Effect, Fractal and Fractional, 2022. vol. 6, no. 3:163, pp. 1-35 DOI: 10.3390/fractalfract6030163.

20. Parovik, R. I. On a Finite-Difference Scheme for an Hereditary Oscillatory Equation, Journal of Mathematical Sciences, 2021. vol.253, no. 4, pp. 547-557 DOI: 10.1007/s10958-021-05252-2.

21. Gerasimov A. N. Generalization of linear deformation laws and their application to internal friction problems, Applied Mathematics and Mechanics, 1948. vol. 12, pp. 529-539.

22. Caputo M. Linear models of dissipation whose Q is almost frequency independent - II, Geophysical Journal International, 1967. vol. 13, no. 5, pp. 529-539 DOI: 10.1111/j.1365-246X.1967.tb02303.x.

23. Jeng S., Kilicman A. Fractional Riccati Equation and Its Applications to Rough Heston Model Using Numerical Methods, Symmetry, 2020. vol. 12, pp. 1-20 DOI: 10.3390/sym12060959.

24. Tverdyi D.A., Parovik R. I., Makarov E. O., Firstov P. P. Research of the process of radon accumulation in the accumulating chamber taking into account the nonlinearity of its entrance, E3S Web Conference, 2020. vol.196, no. 02027, pp. 1-6 DOI: 10.1051/e3sconf/202019602027.

25. Tverdyi D. A., Makarov E. O., Parovik R. I. Hereditary Mathematical Model of the Dynamics of Radon Accumulation in the Accumulation Chamber, Mathematics, 2023. vol.11, no. 4:850, pp. 1-20 DOI: 10.3390/math11040850.

26. Brent R. P. The parallel evaluation of general arithmetic expressions, Journal of the Association for Computing Machinery,1974. vol.21, no. 2, pp. 201-206 DOI: 10.1145/321812.321815.

27. Corman T.H., Leiserson C.E., Rivet R. L., Stein C. Introduction to Algorithms, 3rd Edition. Cambridge: The MIT Press, 2009.1292 pp. ISBN 978-0262033848.

28. Shao J. Mathematical Statistics. 2-ed. New York: Springer, 2003. 592 pp. ISBN 978-0-387-95382-3.

Информация об авторах

Твёрдый Дмитрий АлександровичЛ - кандидат физико-математических наук, научный сотрудник лаборатории элетромагнитных излучений, Институт космофизических исследований ираспространения радиоволн ДВО РАН, с. Паратунка, Россия, ОЯСГО 0000-0001-6983-5258.

Паровик Роман Иванович А - доктор физико-математических наук, доцент, ведущий научный сотрудник лаборатории моделировании физических процессов, Институт космофизических исследований и распространения радиоволн ДВО РАН, с. Паратунка, Россия, О СЖСГО 0000-0002-1576-1860.

References

[1] Uchaikin V. V. Fractional Derivatives for Physicists and Engineers. Vol. I. Background and Theory. Berlin, Springer, 2013, 373 pp., isbn: 978-3-642-33911-0. DOI: 10.1007/978-3-64233911-0.

[2] Nahushev A. M. Drobnoe ischislenie i ego primenenie [Fractional calculus and its application]. Moscow, Fizmatlit, 2003, 272 pp., isbn: 5-9221-0440-3 (In Russian)

[3] Parovik R.I. Mathematical models of oscillators with memory, Oscillators-Recent Developments, 2019, pp. 3-21. DOI: 10.5772/intechopen.81858.

[4] Volterra V. Sur les equations integro-differentielles et leurs applications, Acta Mathematica, 1912, vol. 35, no. 1, pp. 295-356. DOI: 10.1007/BF02418820.

[5] Patnaik S., Hollkamp J. P., Semperlotti F. Applications of variable-order fractional operators: a review, Proceedings of the Royal Society A, 2020, vol. 476, no. 2234, pp. 20190498. DOI: 10.1098/rspa.2019.0498.

[6] Ortigueira M. D., Valerio D., Machado J. T. Variable order fractional systems, Communications in Nonlinear Science and Numerical Simulation, 2019, vol. 71, pp. 231243. DOI: 10.1016/j.cnsns.2018.12.003.

[7] Petras I. Fractional-order nonlinear systems: modeling, analysis and simulation. Berlin, Germany, Beijing and Springer-Verlag, 2011, 218 pp., isbn: 9783642181009.

[8] Sun H., Chang A., Zhang Y., Chen W. A review on variable-order fractional differential equations: mathematical foundations, physical models, numerical methods and applications, Fractional Calculus and Applied Analysis, 2019, vol. 22, no. 1, pp. 27-59. DOI: 10.1515/fca-2019-0003.

[9] Rossikhin Y. A., Shitikova M. V., Application of fractional calculus for dynamic problems of solid mechanics: novel trends and recent results, Applied Mechanics Reviews, 2010, vol. 63, no. 1, pp. 1-5. DOI: 10.1115/1.4000563.

[10] Mainardi F. Fractional Calculus and Waves in Linear Viscoelastisity: An Introduction to Mathematical Models. 2nd edition. Singapore, World Scientific Publishing Company, 2022, 625 pp., isbn: 1783263989. DOI: 10.1142/p926.

[11] Tverdyi D. A., Parovik R.I. Investigation of Finite-Difference Schemes for the Numerical Solution of a Fractional Nonlinear Equation, Fractal and Fractional, 2022, vol. 6, no. 1:23, pp. 1-27. DOI: 10.3390/fractalfract6010023.

[12] Volterra V. Theory of functionals and of integral and integro-differential equations: [Unabridged republication of the first English translation]. New York, Dover publications, 1959, 226 pp.

[13] Tverdyi D.A., Parovik R. I., Hayotov A. R., Boltaev A.K. Parallelization of a Numerical Algorithm for Solving the Cauchy Problem for a Nonlinear Differential Equation of Fractional Variable Order Using OpenMP Technology, Bulletin KRASEC. Physical and Mathematical Sciences, 2023, vol. 43, no. 2, pp. 87-110. DOI: 10.26117/2079-6641-2023-432-87-11.

[14] Tverdyi D.A., Parovik R.I. Hybrid GPU-CPU efficient implementation of a parallel numerical algorithm for solving the Cauchy problem for a nonlinear differential Riccati equation of fractional variable order, Mathematics, 2023, vol. 11, no. 15:3358, pp. 1-21. DOI: 10.3390/math11153358.

[15] Borzunov S.V., Kurgalin S.D., Flegel A.V. Praktikum po parallel'nomu programmirovaniyu: uchebnoe posobie [Workshop on Parallel Programming: A Study Guide]. Saint Petersburg: BVH, 2017, 236 pp., isbn: 978-5-9909805-0-1 (In Russian)

[16] Kalitkin N. N. Chislennye metody. 2-e izd. [Numerical methods. 2nd ed.]. Saint Petersburg: BVH, 2011, 592 pp., isbn: 978-5-9775-0500-0 (In Russian)

[17] Samko S.G., Kilbas A.A., Marichev O.I. Integraly i proizvodnye drobnogo poryadka i nekotorye ih prilozheniya [Fractional integrals and derivatives and some of their applications]. Science and tech: Minsk, 1987, 688 pp.,(In Russian)

[18] Parovik R. I. Tverdyi D. A. Some Aspects of Numerical Analysis for a Model Nonlinear Fractional Variable Order Equation, Mathematical and Computational Applications, 2021, vol. 26, no. 3, pp. 55. DOI: 10.3390/mca26030055.

[19] Tverdyi D. A., Parovik R. I. Application of the Fractional Riccati Equation for Mathematical Modeling of Dynamic Processes with Saturation and Memory Effect, Fractal and Fractional, 2022, vol. 6, no. 3:163, pp. 1-35. DOI: 10.3390/fractalfract6030163.

[20] Parovik R. I. On a Finite-Difference Scheme for an Hereditary Oscillatory Equation. Journal of Mathematical Sciences. 2021. vol. 253. no. 4. p. 547-557 https://doi.org/10.1007/s10958-021-05252-2DOI:10.1007/s10958-021-05252-2.

[21] Gerasimov A. N. Generalization of linear deformation laws and their application to internal friction problems. Applied Mathematics and Mechanics. 1948. vol 12. pp. 529-539(In Russian)

[22] Caputo M. Linear models of dissipation whose Q is almost frequency independent - II, Geophysical Journal International, 1946, vol. 13, no. 5, pp. 529-539. DOI: 10.1111/j.1365-246X.1967.tb02303.x3.

[23] Jeng S., Kilicman A. Fractional Riccati Equation and Its Applications to Rough Heston Model Using Numerical Methods, Symmetry, 2020, vol. 12, pp. 1-20. DOI: 10.3390/sym12060959.

[24] Tverdyi D.A., Parovik R.I., Makarov E.O., Firstov P.P. Research of the process of radon accumulation in the accumulating chamber taking into account the nonlinearity of its entrance, E3S Web Conference, 2020, vol. 196, no. 02027, pp. 1-6. DOI: 10.1051/e3sconf/2020196020278.

[25] Tverdyi D.A., Makarov E.O., Parovik R.I. Hereditary Mathematical Model of the Dynamics of Radon Accumulation in the Accumulation Chamber, Mathematics, 2023, vol. 11, no. 4:850, pp. 1-20. DOI: 10.3390/math11040850.

[26] Brent R. P. The parallel evaluation of general arithmetic expressions, Journal of the Association for Computing Machinery, 1974, vol. 21, no. 2, pp. 201-206. DOI: 10.1145/321812.321815.

[27] Corman T.H., Leiserson C.E., Rivet R. L., Stein C. Introduction to Algorithms, 3rd Edition. Cambridge, The MIT Press, 2009, 1292 pp., isbn: 978-0262033848.

[28] Shao J. Mathematical Statistics. 2-ed. New York, Springer, 2003, 592 pp., isbn: 978-0-387-

Information about authors

Tverdyi Dmitrii Alexsandrovichfa - Ph. D. (Phys. & Math.), Researcher, Laboratory of Electromagnetic Radiation, Institute of Cosmophysical Research and Radio Wave Propagation, FEB RAS, Paratunka, Russia, O ORCID 0000-0001-6983-5258.

Parovik Roman Ivanovichfa - D. Sci. (Phys. & Math.), Associate Professor, Leading Researcher at the Laboratory for Modeling Physical Processes, Institute of Cosmophysical Research and Radio Wave Propagation, FEB RAS, Paratunka, Russia, O ORCID 0000-0002-1576-1860.

95382-3.

i Надоели баннеры? Вы всегда можете отключить рекламу.