Научная статья на тему 'Параллельный алгоритм решения трехмерного нестационарного уравнения теплопроводности с использованием явной разностной схемы'

Параллельный алгоритм решения трехмерного нестационарного уравнения теплопроводности с использованием явной разностной схемы Текст научной статьи по специальности «Математика»

CC BY
415
47
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
DIE DREIDIMENSIONALE NICHTSTATIONäRE WäRMELEITUNGSGLEICHUNG / АНАЛИЗ УСКОРЕНИЯ И ЭФФЕКТИВНОСТИ / ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ / ТРЕХМЕРНОЕ НЕСТАЦИОНАРНОЕ УРАВНЕНИЕ ТЕПЛОПРОВОДНОСТИ / ЯВНАЯ РАЗНОСТНАЯ СХЕМА / DIE ANALYSE DER BESCHLEUNIGUNG UND DER EFFIZIENZ / DAS EXPLIZITE DIFFERENZENVERFAHREN / DIE PARALLELE BERECHNUNGEN / ANALYSIS OF ACCELERATION AND EFFICIENCY / EXPLICIT DIFFERENCE SCHEME / PARALLEL COMPUTATIONS / THREE-DIMENSIONAL NON-STATIONARY EQUATION OF HEAT CONDUCTIVITY

Аннотация научной статьи по математике, автор научной работы — Борисенко Андрей Борисович, Карпушкин Сергей Викторович, Глебов Алексей Олегович

Приводится анализ ускорения и эффективности параллельной программы решения трехмерного нестационарного уравнения теплопроводности с граничными условиями первого рода на основе явной конечно-разностной аппроксимации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Es ist die Analyse der Beschleunigung und der Effizienz des parallelen Programms der Lösung der dreidimensionalen nichtstationären Wärmeleitungsgleichung mit den Randbedingungen der ersten Art auf der Grundlage der expliziten Finite-Differenzen-Approximation vorgestellt.Est citée lanalyse de laccélération et de lefficacité du programme parallèle de la solution de léquation à trois dimensions non stationnaire de la conductibilité thermique avec les conditions marginales du premier ordre à la base de lapproximation finale différentielle évidente.The paper presents the analysis of acceleration and efficiency of the parallel program of solution to the three-dimensional non-stationary equation of heat conductivity with the boundary conditions of the first type on the basis of explicit difference approximation.

Текст научной работы на тему «Параллельный алгоритм решения трехмерного нестационарного уравнения теплопроводности с использованием явной разностной схемы»

PARALLELER BERECHNUN GSAL GORITHMUS DER DREIDIMENSIONALEN NICHTSTATIONAREN WARMELEITUNGSGLEICHUNG AUF GRUND DER EXPLIZITEN DIFFERENZENVERFAHREN

A.B. Borisenko, S.V. Karpushkin, A.O. Glebov

Lehrstuhl «Die rechnergestutzte Projektierung der technologischen Anlagen», TSTU; andrey@mail.gaps.tstu.ru

Vorgelegt vom Mitglied des Redaktionskollegiums Professor W.I. Konowalow

Schlusselworter und Phrasen: die Analyse der Beschleunigung und der Effizienz; die dreidimensionale nichtstationare Warmeleitungsgleichung; das explizite Differenzenverfahren; die Parallele Berechnungen;

Zusammenfassung: Es ist die Analyse der Beschleunigung und der Effizienz des parallelen Programms der Losung der dreidimensionalen nichtstationaren Warmeleitungsgleichung mit den Randbedingungen der ersten Art auf der Grundlage der expliziten Finite-Differenzen-Approximation vorgestellt.

Als Hauptcharakteristik der modernen Computer verwenden meistens solche Kennwerte wie die Rechenkapazitat - die GroBe, die zeigt die Anzahl der arithmetischen Operationen pro Zeiteinheit. Die Operationsgeschwindigkeit der Rechentechnik wuchs durch die Steigerung der Geschwindigkeit der Bauelementebasis und der maximal breit Parallelisierung der Datenverarbeitung. Dabei kann der Parallelismus oder durch eine unmittelbare Parallele Verarbeitung, oder durch die Pipeline-Datenverarbeitung erreicht werden. Es ist notwendig zu bemerken, dass mit dem heutigen Tag die weitere Erhohung der Taktfrequenz der Prozessoren wegen der prinzipiellen fundamentalen physikalischen Beschrankungen schwierig ist. Deshalb wird der Parallelismus fur die Erhohung der Rechenkapazitat, nicht nur in den spezialisierten Rechenclustern, sondern auch in den Personalcomputern aktiv verwendet: Multithreading, Hyper-Threading, Multiprozessoren und Multikerne. Die Prozessoren - z. B. Intel Core Duo oder AMD Athlon 64 X2 - enthalten zwei (Dual Core) oder vier (Quad Core) Kerne[1].

Nach der bekannten Klassifikation der Rechnerarchitekturen, die von Flynn vorgeschlagen wurden [2] (sog. Taxonomie nach Flynn) und die sich auf der Instruktionssequenzen und auf der Sequenzen der Datenverarbeitung grunden, kann man alle Computersysteme auf vier Typen teilen:

1) SISD (Single instruction, single data stream): einfacher Befehls- und einfacher Datenstrom);

2) MISD (Multiple instruction, single data stream): multipler Befehls- und einfacher Datenstrom;

3) SIMD (Single instruction, multiple data streams): einfacher Befehls- und multipler Datenstrom);

4) MIMD (Multiple instruction, multiple data streams): multipler Befehls- und multipler Datenstrom).

Zu der MIMD-Gruppe gehoren die symmetrischen parallelen Rechnersysteme, die Workstations mit mehreren Prozessoren, sowie die Cluster. Zu dieser Klasse der Rechnersysteme verhalt sich auch der Cluster der Staatlichen Technischen Universitat Tambow [3]. Der Cluster umfasst acht Rechnern (Knoten) auf dem Intel Pentium 4 3,0 GHz und 2 GB RAM, einen von denen (HeadNode) ist Server, der auf Intel Pentium 4 3,2 GHz und 4 GB RAM basiert. Alle Computer des Clusters sind in ein lokales Netz Fast-Ethernet verbunden.

Die Analyse der Beschleunigung und der Effizienz des parallelen Programms auf dem Cluster von Staatlichen Technischen Universitat Tambow wurde auf dem Beispiel der Losung der dreidimensionalen nichtstationaren Warmeleitungsgleichung durchgefuhrt. Dabei wurde die Aufgabe auf folgende Weise formuliert.

Der feste Korper in Form eines Quaders, der gleichmaBig bis zur Temperatur 100 °С erhitzt wurde, wurde dann in die mehr kaltere Umgebungen platziert. Dabei die Temperatur auf einer Flache 1 °С und auf anderen Flachen 10 °С aufrechterhalten wird. Man muss das Temperaturfeld innerhalb des Korpers nach Ablauf von einiger Zeit nach dem Anfang des Experiments bestimmen.

Die Evolution des Temperaturfeldes im Korper wird durch der Losung der folgenden Gleichung bestimmt

3T_

дt

f д 2t

д 2T

дос2 ду2

д 2T Л дz 2

wo T(t, x, y, z) - die Temperaturverteilung, а - die Temperaturleitfahigkeit. Die Losung dieser Angleichung wird auf dem Bereich verwirklicht, der vom Quader H = [0, Lx ]x[0, Ly ]x[0, Lz ] begrenzt ist. Die Anfangsverteilung wird wie

T (0, x, y, z) = 100 °С bestimmt.

Die Grenzbedingungen:

T (t, x, y,0) = 1 °С;

T (t,0, y, z) = T (t, Lx, y, z) = T (t, x,0, z) = T (t, x, Ly, z) = T (t, x, y, Lz) = 10 °С.

Fur die numerische Berechnung der Aufgabe muss man auf dem untersuchten Gebiet das gleichmaBige Netz mit der identischen Zahl der Knotenpunkte (n + 2) in jeder Koordinatenrichtung bestimmen

Lx yk = k—+~;, zj = j-L^, i, j, k = 0,n +1}

x, yk, zj

n +1

n +1

n +1

Das Finite-Differenzen Analogon der Warmeleitungsgleichung mit der Nutzung der expliziten Differenzenverfahren:

l +1 l Ti,k, j - Ti,k,j

^T^l OT’l і T’l T’l OT’l і T’l

Ti+1,k, j - 2Ti,k, j + Ti-1,k, j + Ti,k+1, j - 2Ti,k, j + Ti,k-1, j +

h2

h

y

rpl OT’l і T’l

Ti,k, j-1 - 2Ti,k, j + Ti,k, j-1

i = 1, n, j = 1, n, k = 1, n; l = 0,1,

0,5

f f 1 1 1AV + ----------+

2a

v h2 hi h2 ,

v x y z J

+

- a

x

h

X =

Die Entwicklung des parallelen Algorithmus verwirklichte sich laut dem methodologischen Herangehen von Foster [5] mit der Nutzung des Prinzips der Datenzerlegung. Verschiedene Fragmente des Datenfeldes werden auf verschiedenen Verarbeitungselementen (VE) des parallelen Rechners bearbeitet. Es wird die eindimensionale Datenzerlegung der Aufgabe verwendet, die auf der Zeichnung 1 vorgestellt ist. Auf jedem VE (auf Bild gibt es zwei - VE1 und VE2) werden mehrere Scliichten des Netzes fur den laufenden Moment der Zeit verarbeitet, Zeichnung 1. Die eindimensionale

dann geschieht der Austausch von den Datenzerlegung der Aufgabe

Randschichten dazwischen VE und es

verwirklicht sich der Schritt nach der Zeit. Die Losung der dreidimensionalen nichtstationaren Warmeleitungsgleichung stellt die Gesamtheit der Temperaturwerte in allen inneren Schichten des Netzes jeder VE dar.

Fur die Entwicklung der parallelen Programme verwendet man wie die spezialisierten Programmiersprachen (z.B., C*, MPP Fortran, High Performance Fortran (HPF)), als auch die spezialisierten Programmbibliothek fur die traditionellen Programmiersprachen (z.B., Parallel Virtual Machines (PVM)). Weit verbreitet ist die Programmbibliothek Message Passing Interface (MPI) [6]. Diese Technologie der Programmerzeugung der parallelen Programme grundet sich auf der Ubertragung von Nachrichten zwischen Prozessen (die Prozesse konnen wie auf der einen, als auch auf den verschiedenen Rechenknoten durchgefuhrt werden). Zu der Mittel der Programmierung kann man auch die hochproduktiven optimierenden Compiler fur den Sprachen C/C++/Fortran (Intel Compiler) [7] zurechnen, die Branchensoftware - die Softwarepaket fur die wissenschaftlichen und technische Berechnungen Fluent und ANSYS, die Systeme fur die Forschungen des Wetters und des Klimas MM5 und WRF, die Systeme fur die Losung der Aufgaben des Umweltschutzes CAMx h CMAQ, die Programmbibliotheken fur die Durchfuhrung der parallelen Berechnungen Portable, Extensible Toolkit for Scientific Computation (PETSc) [8], Intel Math Kernel Library [9].

Die Autoren haben das parallele Programm mit der Nutzung der spezialisierten Programmbibliothek MPI auf der Programmiersprache C++ entwickelt.

Die Beschleunigung Sp bestimmt wie die Verhaltnis der Prozessorzeit T1, die fur die Ausfuhrung des sequentiell Programms auf einem Prozessor gefordert wird, zur Zeit Tp der Ausfuhrung der Berechnungen vom parallelen Programm auf dem p Prozessoren. Fur den Idealfall soll die Losung der Aufgabe auf der p Prozessoren in p Mal schneller durchgefuhrt werden. Jedoch wird in der Praxis solche Beschleunigung tatsachlich niemals erreicht (die Ursache dafur wird vom Amdahls Gesetz [10] gut illustriert).

Die Effizienz der Nutzung der Prozessoren Ep bestimmt wie die Verhaltnis der bekommenen Beschleunigung Sp zur Anzahl von Prozessoren p.

In der Tabelle 1 werden die Werte der Beschleunigung und der Effizienz der Nutzung der Prozessoren angefuhrt, die bei der Losung der oben genannten Probleme auf dem Rechencluster TSTU bekommen wurde.

Es ist ersichtlich, dass der Wert der Ausnutzungskoeffizient mit der Vergrofierung der Anzahl der VE reduziert wird, obwohl die absolute Zeit der Losung des Problems verringert wird. Das kann dadurch geschehen, dass sich der Gewinn von der Nutzung der mehrerer Anzahlen der Prozessoren infolge der Vergrofierung der Anzahl der Datenkommunikation dazwischen verliert. Auch, es ist offenbar, die negative Rolle spielt die Nutzung als Kommunikationsmedium des Fast-Ethernetnetzes, deren Bandbreite um eine Grofienordnung kleiner als in der modernen Supercomputern

Die Werte der Beschleunigung und der Effizienz der Nutzung der Prozessoren

Anzahl von Prozessoren Zeit, s Beschleunigung Effizienz

1 250,843 1 1

2 135,850 1,846 0,923

3 92,952 2,698 0,899

4 70,508 3,557 0,889

6 48,574 5,164 0,860

Zusammenschaltung, solcher, z.B., wie InfiniBand, ist. Auch die Anwendung der zweidimensionalen und dreidimensionalen Datenzerlegung wird zur wesentlichen Vergrofierung der Datenkommunikation dazwischen VE bringen. Nichtsdestoweniger, die Anwendung des Rechenclusters lasst beim richtigen Herangehen an die Entwicklung des parallelen Algorithmus die wesentliche Reduzierung der Losungszeit zu bekommen.

Die Veroffentlichung ist in den Rahmen des Projektes, die Zulassungsnummer 2.2.2.3/9065, nach dem analytischen amtlichen Zielprogramm «Die Entwicklung des wissenschaftlichen Potentials der Hochschule (2009-2010 Jahre)» im Jahr 2010 erfullt.

Literatur

1. HPCWire: Core Economics. - URL : http://www.hpcwire.com/features/ 17908534.html.

2. Flynn, M.J. Parallel architectures / M.J. Flynn , K.W. Rudd // ACM Computing Surveys. - 1996. - Vol. 28, No. і. - P. 67-70.

3. Веб-сайт вычислительного кластера Тамбовского государственного технического университета. - URL : http://cluster.tstu.ru.

4. Самарский, А.А. Теория разностных схем / А.А. Самарский . - М. : Наука, 1989. - 614 с.

5. Ian Foster. Designing and Building Parallel Programs (Online). - URL : http://www-unix.mcs.anl.gov/dbpp/.

6. Message Passing Interface Forum. Official MPI (Message Passing Interface) standards documents, errata. - URL : http://www.mpi-forum.org/.

7. Intel Compilers. - URL : http://software.intel.com/en-us/intel-compilers/.

8. Portable, Extensible Toolkit for Scientific Computation - URL : http://www.mcs.anl.gov/petsc/petsc-2/.

9. Intel Math Kernel Library - http://software.intel.com/en-us/intel-mkl/.

10. Amdahl, G. Validity of the single-processor approach to achieving large- scale computing capabilities / G. Amdahl // Proc. 1967 AFIpS Conf., AFIPS Press. - 1967. -Vol. 30. - P. 483.

Параллельный алгоритм решения трехмерного нестационарного уравнения теплопроводности с использованием явной разностной схемы

А.Б. Борисенко, С.В. Карпушкин, А. О. Глебов

Кафедра «Автоматизированное проектирование технологического оборудования», ГОУ ВПО «ТГТУ»; andrey@mail.gaps.tstu.ru

Ключевые слова и фразы: анализ ускорения и эффективности; параллельные вычисления; трехмерное нестационарное уравнение теплопроводности; явная разностная схема.

Аннотация: Приводится анализ ускорения и эффективности параллельной программы решения трехмерного нестационарного уравнения теплопроводности с граничными условиями первого рода на основе явной конечно-разностной аппроксимации.

Parallel Algorithm of Solving Three Dimensional Non-Stationary Equation of Heat Conductivity Using Explicit Difference Scheme

A.B. Borisenko, S.V. Karpushkin, A.O. Glebov

Department “Automated Designing of Technological Equipment”, TSTU; andrey@mail.gaps.tstu.ru

Key words and phrases: analysis of acceleration and efficiency; explicit difference scheme; parallel computations; three-dimensional non-stationary equation of heat conductivity.

Abstract: The paper presents the analysis of acceleration and efficiency of the parallel program of solution to the three-dimensional non-stationary equation of heat conductivity with the boundary conditions of the first type on the basis of explicit difference approximation.

Algorithme parallele de la solution de l’equation a trois dimensions non stationnaire de la conductibilite thermique avec l’emploi d’un schema differentiel evident

Resume: Est citee l’analyse de l’acceleration et de l’efficacite du programme parallele de la solution de l’equation a trois dimensions non stationnaire de la conductibilite thermique avec les conditions marginales du premier ordre a la base de l’approximation finale differentielle evidente.

Авторы: Борисенко Андрей Борисович - кандидат технических наук, доцент кафедры «Автоматизированное проектирование технологического оборудования»; Карпушкин Сергей Викторович - доктор технических наук, профессор кафедры «Автоматизированное проектирование технологического оборудования»; Глебов Алексей Олегович - магистрант группы МТ-53 кафедры «Автоматизированное проектирование технологического оборудования», ГОУ ВПО «ТГТУ».

Рецензент: Гатапова Наталия Цибиковна - доктор технических наук, профессор, заведующая кафедрой «Химическая инженерия», ГОУ ВПО «ТГТУ».

i Надоели баннеры? Вы всегда можете отключить рекламу.