Научная статья на тему 'Анализ эффективности применения графического процессора видеокарты для решения задач конвективного теплопереноса'

Анализ эффективности применения графического процессора видеокарты для решения задач конвективного теплопереноса Текст научной статьи по специальности «Математика»

CC BY
332
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ГРАФИЧЕСКИЕ ПРОЦЕССОРЫ / ПАРАЛЛЕЛЬНЫЕ ВЫЧИСЛЕНИЯ / СЛАУ / ИТЕРАЦИОННЫЕ МЕТОДЫ

Аннотация научной статьи по математике, автор научной работы — Цивинская Ю. С., Попов В. Н.

Рассмотрены возможности параллельных вычислений на персональном компьютере с видеокартой NVIDIA для решения систем линейных алгебраических уравнений, полученных при неявной аппроксимации нестационарной двухмерной задачи конвективного теплопереноса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Цивинская Ю. С., Попов В. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ эффективности применения графического процессора видеокарты для решения задач конвективного теплопереноса»

МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070

Эта производная обращается в нуль при

(15)

Используя это выражение, из уравнения (13) найдем

Заменив здесь х на I и полагая, что Н = Н (14), т.е. высота столба жидкости максимальна, получим

Фигурная скобка этого выражения равна 0,533, поэтому

Как видно, I > 0, если ширина пластинки 2Ь удовлетворяет требованию

(16)

Если ширина пластинки 2Ь меньше правой части (16), то боковые поверхности сомкнутся и столб жидкости распадется раньше, чем высота столба достигнет максимального значения Н (14).

В заключение вычислим максимальную силу, которую нужно приложить к пластинке весом Q, чтобы достичь максимально высокого подъема жидкости. Очевидно, что по мере подъема пластинки эта сила возрастает, потому что возрастает перепад давлений на ее внешнюю и внутреннюю поверхности. Обозначив символом Е максимальное значение силы, приходящееся на единицу длины пластинки, найдем:

Список использованной литературы:

1. Сборник задач по общему курсу физики. Часть II. Под редакцией Д. В. Сивухина. М.: ГИФМЛ, 1960, 366 с.

2. Сивухин Д.В. Общий курс физики. Термодинамика и молекулярная физика. М.: Наука, 1979, 551 с.

© Емельянов А.В., Кудряшова Е.С., Тимошенко А.А., 2017

УДК 519.6

Ю.С. Цивинская

к.ф.-м.н.

ФГБУН Институт теоретической и прикладной механики им. С.А. Христиановича СО РАН

В.Н. Попов д.ф.-м.н., с.н.с.

ФГБУН Институт теоретической и прикладной механики им. С.А. Христиановича СО РАН

г. Новосибирск, Российская Федерация

АНАЛИЗ ЭФФЕКТИВНОСТИ ПРИМЕНЕНИЯ ГРАФИЧЕСКОГО ПРОЦЕССОРА ВИДЕОКАРТЫ ДЛЯ РЕШЕНИЯ ЗАДАЧ КОНВЕКТИВНОГО ТЕПЛОПЕРЕНОСА

Аннотация

Рассмотрены возможности параллельных вычислений на персональном компьютере с видеокартой NVIDIA для решения систем линейных алгебраических уравнений, полученных при неявной

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070_

аппроксимации нестационарной двухмерной задачи конвективного теплопереноса.

Ключевые слова

Графические процессоры, параллельные вычисления, СЛАУ, итерационные методы.

Введение. При решении нестационарных задач тепломассопереноса необходимы значительные ресурсы персонального компьютера, однако, в настоящее время при проведении вычислительных экспериментов возможно использование графических процессорных устройств (GPU - graphics processing units) с организацией параллельных вычислений. В связи с этим, актуальной является разработка алгоритмов, позволяющих параллельно проводить схожие операции при решении систем линейных алгебраических уравнений (СЛАУ), так как доля таких расчетов значительно преобладает при решении нестационарных задач распределения тепла [1]. В последнее время ведутся работы по разработке алгоритмов решения итерационными методами разреженных СЛАУ [2, 3]. Общая тенденция развития в этой области, сформулированная в [3], заключается в том, что ввиду отсутствия единого метода, подходящего для любого класса задач (один и тот же алгоритм может сходиться или не сходиться к решению в зависимости от типа матрицы), необходимо иметь библиотеку программ с реализацией различных итерационных методов.

В настоящей работе оценивалась эффективность параллельных вычислений для решения СЛАУ, полученных при неявной аппроксимации нестационарной двухмерной тестовой задачи конвективного теплопереноса методом конечных разностей. При расчетах использовался ПК, оснащенный дополнительной видеокартой NVIDIA GeForce GTX 285, являющейся 240-ядерным процессором GPU. При численной реализации исходной задачи при решении систем уравнений различными итерационными методами сравнивалось использование CPU и CPU+GPU для оценки общего затраченного времени. Вычисления проводились с одинарной точностью.

Модельная задача и алгоритм реализации. Рассматривается следующая задача

dT dT dT írT1 _ . ГА1П

— + u— + V— = aAT + f, t, x, y e[0,1J, (1)

dt dx dy

, de de de dв dв

где f (t, x, y) =--+ u--+ V--a—- - a—-,

dt dx dy dx dy

e(t, x, y) = exp {at [sin (2nx ) + sin (2ny)]}, u(x,y) = 8(x4 - 2x3 + x2)•(-16y3 + 30y2 -12y), v(x,y) = -8(4x3 - 6x2 + 2x)• (- 4y4 +10y3 - 6y2), max{u|,|v|}= 1.

Начальные и граничные условия:

T

dx

= 2atne, —

x=0,1 ^

= 2агп6. (2)

у=0,1

Т=_0 =6(0, у). (3)

Для решения задачи (1)-(3) применялся конечно-разностный алгоритм. В расчетной области использовалась равномерная пространственная сетка, шаг по времени Т был принят постоянным. Распределение температуры на «-ом временном шаге в момент времени 1п в расчетной области

описывалось в узлах сетки значениями Т".. Разностные уравнения строились аппроксимацией (1) и граничных условий (3). Так как для конвективных членов используется противопоточная схема, то погрешность аппроксимации задачи имеет порядок 0(т, кх, к ) . Разностное уравнение для узла (у) при

I = Iп записывается в виде

е. Tn. - a T\ - b Tn.. - с T" - d T" = fn.,

1 ,j i,j i,j 1-1,j i,j 1 ,j-1 i,j 1+1,j i,j i,j+1 Ji,j>

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070_

где au = 0, c/y = 0, j =1,...,J; bu = 0, dtJ = 0, i = 1,...,I.

Полученную систему линейных алгебраических уравнений можно представить в виде AT = f, (4)

где матрица A является пятидиагональной, монотонной, обладает строгим диагональным преобладанием (e > a . + b + С + d ), а T = {T".}, f = {f"} - вектора. Таким образом, при

численной реализации задачи на каждом временном шаге необходимо находить решение системы (4), что осуществлялось различными итерационными методами [4] до получения на 5-ой итерации результата с

<8 , 8= 10 6.

заданной точностью max

i, 1

rji n,S

', J ', J

Результаты расчётов. Расчёты проводились на ПК, оснащенном CPU 2.67 ГГц и дополнительной видеокартой NVIDIA GeForce GTX 285. Использовались пространственные сетки с различным

количеством узлов при постоянном временном шаге Т = 10 3. Время решения на CPU сравнивалось c временем решения задачи на CPU+GPU. В таблицах приведены полученные результаты при a = 0.001. В скобках указано количество итераций, затрачиваемых на временном шаге для достижения требуемой точности. Наряду с этим определялась погрешность решения задачи сравниванием рассчитанных результатов с точными значениями при t„=l. Метод Якоби:

T * = D _1( LTk —1 + UTk—1 + f).

Здесь A = — L + D — U, D = {e. } - диагональная матрица, L = {a. b } , U = {c. , d -

неотрицательные нижняя и верхняя треугольные матрицы, k - номер итерации. Результаты вычислений представлены в табл. 1.

Таблица 1

IxJ 51 х 51 | 101 х 101 | 201 х 201 | 401 х 401

Время расчетов в сек. (Кол-во итераций) (Погрешность)

CPU 1.0 (4) (9.57-10-2) 4.0 (5) (4.92-10-2) 18.0 (7) (2.49-10-2 ) 96.0 (13) (1.2510-2 )

CPU+GPU 0.7 (4) (9.5810-2 ) 1.0 (5) (4.92-10-2 ) 2.8 (7) (2.47-10-2 ) 15.9 (13) (1.2310-2 )

Метод наискорейшего спуска:

(r k—1 r k—1)

rk = f — AT*, т. = ( ~ ~~ , Tk = Tk—1 rk—1. ' k (Ark—1, rk—1)' k

Результаты использования метода представлены в табл. 2.

Таблица 2

IxJ 51 х 51 101х101 201х201 401х401

Время расчетов в сек. (Кол-во итераций) (Погрешность)

CPU 1.0 (3) 3.7 (3) 13.9 (4) 57.1 (5)

(9.57-10-2) (4.92-10-2) (2.48-10-2 ) (1.22-10-2 )

CPU+GPU 1.0 (3) 1.0 (3) 16 (4) 3.1 (5)

(9.5810-2 ) (4.91-10-2 ) (2.46-10-2 ) (1.2010-2 )

Метод сопряженных градиентов:

(rk, rk)

r0 = f — AT0, p0 = r0, Tk = Tk—1 — ak_ppk—1, ak =

k—W ' ^k /

(pk, Apk)

rk = rk—1 — ak—1 Apk—1, pk = rk—1 + ßk_ppk—1, ßk =

(rk—1, rk—1)

МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070_

Полученные результаты представлены в табл. 3.

Таблица 3

IxJ 51 х 51 101х101 201х201 401х401

Время расчетов в сек. (Кол-во итераций) (Погрешность)

CPU 1.0 (3) 3.8 (3) 14.0 (3) 63.9 (4)

(9.57-10"2 ) (4.92-10"2) (2.48-10"2 ) (1.22-10-2 )

CPU+GPU 1.2 (3) 1.2 (3) 1.6 (3) 3.7 (4)

(9.5810-2 ) (4.91-10-2 ) (2.46-10"2 ) (1.2010-2 )

Из представленных результатов следует, что в случаях небольшого количества узлов пространственной сетки (51x51) выигрыш при использовании параллельных расчетов фактически отсутствует. Эффективность применения GPU проявляется и растёт с увеличением количества неизвестных. В ходе численных экспериментов при использовании стандартной видеокарты NVIDIA GeForce было получено ускорение расчетов до 18 раз в зависимости от метода и количества точек аппроксимации, что позволяет значительно повысить производительность расчетов.

Надо отметить, что с увеличением количества узлов пространственной сетки выявлено расхождение в точности получаемых результатов (не превышающее 3%) при расчетах на CPU и при использовании видеокарты. Предпринимались попытки уменьшить эти расхождения либо уменьшением временного шага, либо повышением точности реализации итерационного процесса. Однако было определено, что такое изменение условий расчётов не приводит к улучшению решения, и, скорее всего, объясняется тем, что CUDA-совместимые устройства не полностью реализуют стандарт IEEE-754 представления чисел с десятичной точкой.

Заключение. Различными итерационными методами получены решения разреженных СЛАУ на ПК с графическим процессором NVIDIA. Определено, что такой подход при реализации задач теплопереноса позволяет повысить производительность расчетов при относительно невысоких затратах, а эффективность применения графического процессора растёт с увеличением размерности СЛАУ. Список использованной литературы:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Максимов Д.Ю., Кудряшов И.Ю., Марченко Н.А. Суперускорение гидродинамических расчетов с помощью применения графических процессоров NVIDIA и технологий программирования CUDA // Вестник ЦКР Роснедра. 2010. № 1. С. 67-69.

2. Кривов М.А., Казеннов А.М. Сравнение вычислительных возможностей графических ускорителей при решении различных классов задач // Труды Всероссийской научно-практической конференции "Применение гибридных высокопроизводительных вычислительных систем для решения научных и инженерных задач". Н.Н., 2011. С. 18-24.

3. Губайдуллин Д.А., Никифоров А.И., Садовников Р.В. Использование графических процессоров для решения разреженных СЛАУ итерационными методами подпространств Крылова с предобусловливанием на примере задач теории фильтрации // Вестник Нижегородского университета им. Н.И. Лобачевского. 2011. № 1. С. 205-212.

4. Самарский A.A., Николаев T.C. Методы решений сеточных уравнений. - М.: Наука, 1978. 592 c.

© Цивинская Ю.С., Попов В.Н., 2017

_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №02-2/2017 ISSN 2410-6070_

БИОЛОГИЧЕСКИЕ НАУКИ

УДК 636.2:612.621

Т.И. Кузьмина, д.б.н., профессор Т.И. Станиславович, к. с.-х. н.

ФГБНУ ВНИИГРЖ г. Санкт-Петербург - Пушкин, Российская Федерация И.Я. Шахтамиров, д.б.н., профессор Х.М. Мутиева, к. с.-х. н., доцент ФГБОУ ВО «Чеченский государственный университет» г. Грозный, Чеченская Республика

КОМПЕТЕНТНОСТЬ К РАЗИТИЮ ЗАВЕРШИВШИХ ФАЗУ РОСТА IN VIVO ИЛИ IN VITRO ООЦИТОВ SUS SCROFA DOMESTICUS ИЗ ЯИЧНИКОВ НА РАЗНЫХ СТАДИЯХ ОВАРИАЛЬНОГО ЦИКЛА

Аннотация

Сравнительный анализ показателей оплодотворяемости исходной популяции донорских ооцитов свиней выявил высокие потенции к развитию ооцитов, завершивших фазу роста in vivo, выделенных из яичников в фолликулярную фазу овариального цикла. Доля раздробившихся клеток составила 56%, а выход бластоцист - 38%. Напротив, растущие ооциты, аспирированные из яичников в лютеиновую или фолликулярную фазу, имели низкие показатели оплодотворяемости (% дробления - 26% и 31%, выход бластоцист - 9% и 11%).

Ключевые слова

Яичники, ооциты, оплодотворение in vitro, Sus Scrofa. Domesticus.

T.I. Kuzmina

Dr. of Biological Sciences, Professor T.I. Stanislavovich The candidate of agricultural Sciences All-Russian Research Institute for Farm Animal Genetics & Breeding

St. Petersburg - Pushkin, Russian Federation

I.Y. Shakhtamirov Dr. of Biological Sciences, Professor H. M. Mutieva The candidate of agricultural Sciences, docent the Chechen State University Grozny, the Chechen Republic

DEVELOPMENT COMPETENCE OF PORCINE OOCYTES THAT HAVE FINISHED THE GROWTH PHASE IN VIVO OR IN VITRO FROM THE OVARIES AT DIFFERENT

STAGES OF THE OVARIAN CYCLE

Abstract

Comparative analysis of fertility of donor's porcine oocytes has showed high development competence of the oocytes that have finished growth phase in vivo and isolated from the ovaries in follicular phase of the ovarian cycle. Percentage of cleavage was 56%, and the yield of blastocysts - 38%. On the contrary, the growing oocytes, have aspirated from the ovaries in the luteal phase or in follicular phase had low rates of fertility (percentage of cleavage - 26% and 31%, yield of blastocysts - 9% and 11%).

i Надоели баннеры? Вы всегда можете отключить рекламу.