УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА
УДК 519.6:551.551.6
А. В. Старченко, Е. А. Панасенко
ПАРАЛЛЕЛЬНЫЕ АЛГОРИТМЫ ДЛЯ РЕШЕНИЯ ОБРАТНЫХ ЗАДАЧ ПЕРЕНОСА ПРИМЕСИ
При решении обратных задач переноса примеси используются сопряженные уравнения и двойственное представление функционала концентрации примеси. Параллельная реализация строится на основе следующих подходов: геометрическая декомпозиция, функциональная декомпозиция, комбинация функциональной и геометрической декомпозиций. Обратные задачи; параллельная реализация; задачи переноса примеси; геометрическая декомпозиция; функциональная декомпозиция
В настоящее время проблема охраны окружающей среды и ее восстановления становится одной из важных задач науки, развитие которой стимулируется всевозрастающими темпами технического прогресса во всех странах мира. Ухудшение качества атмосферного воздуха, накопление в нем газообразных компонентов происходит вследствие выбросов в атмосферу отходов промышленных предприятий и выхлопных газов автотранспорта, что приводит к ухудшению здоровья населения, а в глобальном масштабе - к изменению климата на планете. При этом наиболее значительный вклад в загрязнение воздуха вносит автотранспорт. Особенность автотранспорта заключается в том, что он является подвижным источником загрязнения, что проявляется в низком его расположении и непосредственной близости к зонам жилой застройки. Все это приводит к тому, что автотранспорт создает в городах обширные зоны, в пределах которых предельно-допустимая концентрация загрязняющих субстанций в атмосферном воздухе превышена в несколько раз.
Поступления загрязняющих веществ в атмосферу избежать невозможно, но разумное использование природных ресурсов и постоянный контроль качества атмосферного воздуха позволят обеспечить безопасный уровень воздействия на атмосферу и избежать глобально негативных последствий.
Одним из способов оценки и прогноза уровня загрязнения воздуха является контроль интенсивности выбросов вредных веществ, который производится с помощью постов наземных наблюдений. Но даже разветвленная сеть таких пунктов наблюдения не всегда может предоставить достоверную информацию для природоохранных служб. Большую помощь здесь может
Контактная информация: (347) 273-36-22 Статья рекомендована к публикации программным комитетом международной научной конференции "Параллельные вычислительные технологии 2010"
оказать применение методов математического моделирования и особенно технологии численного решения обратных задач по определению характеристик источников загрязнения атмосферного воздуха по данным измерений концентрации вредных веществ. Но сложность и взаимосвязанность процессов распространения и переноса загрязняющих субстанций, происходящих в атмосферном воздухе, делают модели оценки и прогнозирования качества воздуха громоздкими в математической записи и весьма требовательными к вычислительным ресурсам. Перспективным способом решения этих проблем является использование современных высокопроизводительных многопроцессорных вычислительных систем, которые обеспечивают существенное ускорение получения результатов расчетов и повышение качества численного прогноза.
Целью данной работы является создание новых вычислительных алгоритмов для решения обратных задач переноса примеси на суперкомпьютерах с параллельной архитектурой.
1. ФИЗИЧЕСКАЯ ПОСТАНОВКА ОСНОВНОЙ ЗАДАЧИ ПЕРЕНОСА ПРИМЕСИ
Распространение примеси в приземном слое атмосферы над промышленным центром и его окрестностями исследуется при следующих условиях. Рассматривается ограниченный в прямоугольнике участок территории, на котором в течение времени исследования происходит выброс от различных источников. Мощность источников зависит от времени. Распределение по области исследования поступающей примеси определяется метеорологическими условиями. Кроме того, сделано предположение, что примесь не вступает в химические реакции с другими веществами и скорость ее переноса совпадает со скоростью движения окружающего воздуха (рис. 1).
Рис. 1. Распределение поступающей примеси по области исследования
2. МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ОСНОВНОЙ ЗАДАЧИ ПЕРЕНОСА ПРИМЕСИ
С учетом принятой физической постановки задачи, адвективно-диффузионное уравнение, моделирующее перенос газообразной примеси в заданном потоке, представляется в следующем виде:
дС ттдС тгдС Т1ГдС _
— + и— + V — + Ж—+ оС = дt дх ду дг
= д_ дх д
+------
дг
г
ЪС_
дх
+ -
д_
дУ
г
ддс_
дУ
+
(1)
к.
дС
дх
+ б,
где С - концентрация примеси; и, V, Ж - компоненты соленоидального вектора скорости атмосферного воздуха; Г, К - коэффициенты турбулентной диффузии; б - интенсивность поступления примеси от источников.
Начальные и граничные условия имеют следующий вид:
і = 0: С (0, х, у, г) = С 0( х, у, г);
X = 0:дС = 0; х = Т :дС = 0;
дх х дх
У
0: —:
дУ
0; У
т : эс
' Т : •
у ду
0;
(2)
п г дС а „ т дС
г = 0: К — = аС - к; г = т : — = 0. г дг г дг
3. ФИЗИЧЕСКАЯ ПОСТАНОВКА ОБРАТНОЙ ЗАДАЧИ ПЕРЕНОСА ПРИМЕСИ
Требуется по известным метеорологическим параметрам атмосферы и результатам измерений концентрации примеси в N точках, проводимых в течение некоторого периода времени Т, определить параметры (мощность, координаты и время срабатывания) источников примеси (рис. 2).
Рис. 2. Определение местонахождения источника выброса
4. МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ОБРАТНОЙ ЗАДАЧИ
В данной работе для решения обратных задач привлекается подход Г. И. Марчука [1], который основан на решении уравнения, сопряженного с полуэмпирическим уравнением турбулентной диффузии (1), и двойственным представлением функционала от концентрации примеси.
Математическая постановка обратной задачи переноса примеси включает несколько однотипных сопряженных уравнений (их количество совпадает с количеством измерений концентрации) и поиск минимума некоторого функционала в процессе решения сопряженных уравнений.
Сопряженная к (1) и (2) задача получается следующим образом: уравнение (1) умножается * *
на функции Ск = Ск ^, х, у, г) и интегрируется по времени и пространству. Тогда, используя интегрирование по частям, приходим к сопряженным постановкам:
эck эuck эvck эwck
Эt
Эx
эУ
* э
+ sC - — Эx
гэc;
Эx
_Э_
эУ
Эz
r_sc;
+
эУ
(3)
Эz
z Эz
Pk, k = 1,..., N;
с соответствующими начальными и граничными условиями:
C* (T, x, y, z) = 0;
x = 0: UC* +г
ЭC *
x = L : UC Г +г
Эx
эc *
= 0;
x
Эx
0;
у = 0: VC* +г
ac;
ЭУ
0;
(4)
эc *
у = L : VC* + гЭ^ = 0;
' у k Эу
aC*; z = L
ЭC *
0,
дг к г дг
где Рк = д(х - х)ё(у - ук Жг - )5(і - ік);
N - количество точек наблюдения с координатами (хк, ук, 2кУ;
ік - момент времени измерения концентрации, и двойственному представлению функционала [2]:
Т ТхТуТ
J (С) = 1111 СРкёгёуёхЛ = Ск =
G G G G
Л ^x У
= 1111C*kQdzdydxdt
+
(5)
G G G G T Lx Ly
III C* Rdydxdt, k = 1,..., N.
0 0 0
При этом нахождение решения систем уравнений (3)-(4) и (5) позволит установить параметры (мощность, координаты и время срабатывания) источника загрязнения атмосферного воздуха.
5. ЧИСЛЕННОЕ РЕШЕНИЕ СОПРЯЖЕННОЙ ЗАДАЧИ
Для численной реализации задачи (3)-(4) использовались метод конечного объема и явные разностные схемы, для аппроксимации ад-
вективных членов применялась схема MLU Ван Лира [3].
При построении разностного аналога дифференциальной задачи сначала строилась сетка. Для этого выбирались шаги hx, hy, hz > 0 и на прямоугольной области Lx х Ly х Lz задавалась сетка:
Vhx,hyA = К = ihx, Yj = jhy , Z = lK ,
i = 0,\...,NX, j = 0,\,...,N y,l = 0,1,...,NZ}.
Построенная сетка используется при определении векторов скорости и концентрации.
6. ПАРАЛЛЕЛЬНАЯ РЕАЛИЗАЦИЯ СОПРЯЖЕННОЙ ЗАДАЧИ
При численном решении задач переноса примеси выделяют два основных способа параллельной реализации: распараллеливание по физическим процессам (функциональная декомпозиция) и геометрическая декомпозиция расчетной области. При первом способе реализации вычислительные процессы выполняются параллельно и при этом каждый из них занят выполнением принципиально различных задач.
При использовании же декомпозиции расчетной области область исследования делится на подобласти, число которых равно числу процессов, и каждый процесс ведет расчеты в своей подобласти независимо от других. При таком подходе объемы вычислений, которые осуществляет каждый процесс, очень близки между собой [4].
При решении обратной задачи определения характеристик источников на каждом шаге по времени решается не одна, а N независимых сопряженных задач, следовательно, они могут решаться параллельно.
Такие условия проведения численного моделирования позволяют привлекать высокопроизводительную вычислительную технику, в частности, вычислительный кластер ТГУ СКИФ Cyberia.
6.1. ФУНКЦИОНАЛЬНАЯ ДЕКОМПОЗИЦИЯ
Распараллеливание по физическим процессам метода численного решения задачи по определению параметров точечных мгновенных источников производилось с использованием принципа «master-slave» (рис. 3). В этом случае управляющий master-процесс с частотой ю передает каждому slave-процессу значения метеорологических параметров, необходимые для решения сопряженных задач. Подчиненные slave-процессы, получив данные, в свою оче-
редь, ведут расчеты независимо друг от друга и найденные на каждом шаге по времени приближенные решения своей сопряженной задачи (3)-(4) возвращают управляющему процессу, который ищет глобальный минимум функционала
N (Т ЬхЬуЬ2
Ф(С) = 2 /1 и С^сЬс/ус/хсИ +
к=1 10 0 0 0 (6)
Т ^х ^у
+ Ш С*| КёуёхЖ- Ск )2,
000
что в итоге позволит определить параметры источников загрязнения.
Рис. 3. Схема параллельной реализации
Заметим, что при таком способе организации параллельных вычислений при запуске параллельной программы на р + 1 процессах большую долю вычислительной работы обычно выполняют р подчиненных 81ауе-процессов. Один управляющий ша81ег-процесс координирует работу остальных (подготавливает и рассылает 81ауе-процессам данные для расчета, собирает результаты их расчетов и осуществляет дополнительную обработку этих результатов), причем каждый 81ауе-процесс в данный текущий момент целиком занят выполнением одной задачи.
В работе на основе теоретических оценок и в результате вычислительных экспериментов исследовано ускорение и эффективность данного параллельного алгоритма для задачи идентификации параметров мгновенного источника. Теоретические выкладки приводят
к следующим результатам:
Ф1
Р -1
5х • ю
т
ЕФ1 =» 1 -17 Р
(7)
1 +
5х • ю
т
здесь р - число используемых процессов;
т - число арифметических операций для вычисления одного значения сеточной функции;
X - отношение времени межпроцессорной передачи одного числа к времени арифметической операции;
Ф1 - первый вариант функциональной декомпозиции.
Из (7) видно, что при таком способе организации параллельных вычислений не удается достичь идеального параллелизма, поскольку нет хорошей балансировки загрузки используемых в расчетах р процессоров. Это связано с тем, что ша81ег-процесс не участвует в проведении массовых вычислений (не решает отдельную сопряженную задачу). Поэтому с целью повышения эффективности алгоритма рассматривается другой подход, в котором ша81ег-процесс дополнительно к своей работе также решает одну из N сопряженных задач (3)-(4). В этом случае теоретическая оценка ускорения и эффективности может быть записана следующим образом:
5
Ф 2
1 +
5Х •ю’
т
(8)
Е
Ф2
1 +
5Х •ю
т
и разработанная параллельная программа будет иметь более высокие показатели по времени выполнения (Ф2 - второй вариант функциональной декомпозиции).
Для подтверждения полученных оценок ускорения параллельного алгоритма был проведен ряд расчетов на кластере ТГУ СКИФ СуЬейа. Результаты представлены в табл. 1.
Из таблицы видно, что оба рассматриваемых варианта имеют высокие показатели масштабируемости, что выражается в слабом изменении времени счета при добавлении процессорных элементов в связи с увеличением объема вычислений (К). Однако первый вариант функциональной декомпозиции алгоритма решения обратной задачи (3)-(5) имеет небольшое преимущество во времени выполнения параллель-
1
ной программы, что обусловлено появлением дополнительных возможностей совмещения работы активных процессов, количество которых для одних и тех же условий на единицу больше, чем во втором варианте.
Таблица 1 Время счета (с) параллельной программы для рассматриваемых вариантов функциональной декомпозиции
Количество Число исполь- Число исполь-
измерений, зуемых процес- зуемых процес-
N сов/время счета сов/время счета
для варианта Ф1 для варианта Ф2
5 6/312 5/323
10 11/316 10/337
20 21/322 20/354
В то же время соотношение эффективности рассматриваемых параллельных программ
Е Ф1
< 1 показывает лучшую масштаби-
еФ =
_ р
Е
Ф 2
руемость второго варианта декомпозиции, что хорошо согласуется с теоретическими оценками
р
(7)-(8), согласно которым (еФ )теор
р +1
6.2. ГЕОМЕТРИЧЕСКАЯ ДЕКОМПОЗИЦИЯ
При решении каждой сопряженной задачи (3)-(4) в данной работе также использовалась одномерная (вдоль оси ОУ, рис. 4) геометрическая декомпозиция сеточной области. Этот способ распараллеливания численного алгоритма решения нестационарного адвективно-диффузионного уравнения показал высокую эффективность.
Рассмотрим параллельную реализацию алгоритма решения обратной задачи переноса примеси при использовании принципа геометрической декомпозиции сеточной области. В этом случае вычисления осуществляются следующим образом: N сопряженных задач (3)-(4) последовательно одна за другой решаются численно в подобласти вычислительной сетки, распределенной каждому процессу. Вычисления в течение промежутка времени [0, Т] проводятся каждым процессом одновременно, но для корректного расчета сеточных значений функции
Ск* вблизи границ подобласти (рис. 4) требуются некоторые сеточные значения с соседних по расположению подобластей. Это может быть
обеспечено лишь путем межпроцессорной передачи данных с использованием, например, стандарта МР1 [5, 6].
Рис. 4. Расчетная сетка в плоскости хОу с указанием распределения подобластей по четырем процессорам. На приграничной сеточной линии приведен разностный шаблон. Открытые кружки указывают на сеточные значения, которые необходимо получить с соседнего процессора
Теоретическая оценка ускорения и эффективности данного алгоритма имеет следующий вид:
р
Г
1 +
т
5ш 4 р
N + Кх
1
\
(9)
1+
т
5ш 4 р
N+N
где N - размер вычислительной сетки по оси Ох; N - количество решаемых сопряженных задач.
Поскольку в полученной оценке эффективности рассматриваемого способа распараллеливания вклад межпроцессорной передачи данных во временные затраты более значительный, стоит ожидать, что применение геометрической декомпозиции при решении обратных задач переноса примеси, в которых на каждом шаге по времени требуется передача данных шаБ1ег-процессу, менее перспективно, чем использование функциональной декомпозиции.
Для подтверждения сделанных выводов были проведены вычислительные эксперименты, результаты которых представлены в табл. 2.
Сопоставляя результаты, приведенные в табл. 1 и 2 , приходим к выводу, что применение геометрической декомпозиции для рассматриваемой задачи идентификации параметров внезапного выброса в атмосферу по данным из-
X
X
мерений существенно (более чем в два раза) уступает по быстродействию функциональной декомпозиции. Причиной этого являются коммуникационные затраты на межпроцессорную передачу данных, необходимую для корректного решения сопряженных задач (3)-(4) на всей сеточной области, разделенной между активными процессами [2].
Т аблица 2 Время счета параллельной программы для геометрической декомпозиции
Количество Число В р е мя,
измерений, используемых с.
N процессов, р
5 5 627
10 10 643
20 20 743
Число процессов
Число процессов
Рис. 5. Время счета (слева) и ускорение (справа) параллельной программы решения обратной задачи переноса примеси, базирующейся на принципе одномерной декомпозиции расчетной области
Данные, представленные на рис. 5, показывают, что при увеличении числа активных процессов время счета уменьшается, причем пропорционально, для различного N. В целом, этот способ распараллеливания алгоритма решения обратной задачи для рассмотренных здесь условий обеспечивает 50% эффективность параллельной программы для числа процессов р = 2, 4, 10, 20, что свидетельствует о неплохой масштабируемости параллельной реализации для р < 20.
6.3. КОМБИНИРОВАННЫЙ СПОСОБ РАСПАРАЛЛЕЛИВАНИЯ
Рассмотренные выше подходы создания параллельных версий алгоритмов решения обратной задачи переноса примеси показали неплохие результаты по эффективности, однако количество используемых активных процессов в них
ограничено: в случае функциональной декомпозиции числом проведенных измерений N, а при одномерной геометрической декомпозиции размером сетки Nx и выбранным сеточным шаблоном. При использовании комбинированного подхода параллельной реализации предлагается для увеличения в расчетах количества используемых активных процессов совместить применение функциональной и геометрической декомпозиции. Все р активных процессов делятся на N групп (по числу измерений), каждая из которых решает численно одну сопряженную задачу (3), (4), используя одномерную геометрическую декомпозицию. Для получения приближенного решения процессы отдельной группы обмениваются между собой рассчитанными значениями сеточной функции вблизи границ подобластей. Поиск минимума функционала выполняет один из р процессов, которому остальные передают результаты промежуточных расчетов.
Теоретические оценки такого способа параллельной реализации записываются в следующем виде:
(
1 +
т
комб
5ю +
4 р
V
N • N.
хУ 1
1+
т
5ю + -
4р
N • N
х У
р = 1,2,3,...
N
Сравнивая оценки параллельных реализаций (9) и (10), можно отметить, что эффективность комбинированного подхода не хуже, чем при геометрической декомпозиции, однако количество используемых активных процессов можно увеличить на порядок, что при имеющей место масштабируемости параллельной версии алгоритма должно привести к значительному сокращению времени счета.
Результаты вычислительных экспериментов для задачи идентификации характеристик мгновенного источника подтвердили предварительные теоретические оценки (табл. 3).
Стоит отметить, что результаты численных расчетов при использовании комбинированного подхода показывают снижение времени счета с уменьшением вычислительной трудоемкости задачи, замедление ускорения параллельной программы с ростом числа используемых процессов и при сокращении количества сопряженных задач N (рис. 6).
X
X
Таблица 3 Время счета параллельной программы для комбинации функциональной и геометрической декомпозиции
Количест- Время счета Число используе-
во последова- мых процессов/
измере- тельной Время счета для
ний, N программы, комбинированного
с подхода, с
З 1626 100/33
10 3922 200/42
20 7799 400/59
Комбинированный подход действительно на порядок позволяет увеличить число используемых процессов, при этом эффективность параллельной программы остается на уровне не менее 50 %, что является неплохим для задач такого класса показателем. Однако в целом, функциональная декомпозиция имеет существенное преимущество, судя по (8), (9) и (10).
Число процессов Число процессов
Рис. 6. Время счета (слева) и ускорение (справа) параллельной программы решения обратной задачи переноса примеси (комбинированный способ распараллеливания)
ВЫВОДЫ
В работе с единых позиций сформулированы математические постановки для решения обратных задач по определению параметров источника загрязнения атмосферного воздуха по измеренным значениям концентрации примеси. Математические постановки опираются на аппарат сопряженных уравнений и двойственное представление функционала от концентрации примеси. Для численного решения сопряженных задач используются конечноразностные методы, явные разностные схемы, метод конечного объема. Для ускорения численного решения задачи обоснованы и применены следующие способы параллельной реализации задач переноса примеси: функциональная декомпозиция, геометрическая декомпозиция и комбинированный способ. Проведены оценки
ускорения и эффективности всех трех подходов параллельной реализации. По произведенным оценкам ускорения и эффективности способов параллельной реализации получено, что в целом функциональная декомпозиция имеет существенное преимущество по сравнению с остальными подходами.
СПИСОК ЛИТЕРАТУРЫ
1. Марчук Г. И. Математическое моделирование в проблеме окружающей среды. М.: Наука, 1982. 31З с.
2. Панасенко Е. А., Старченко А. В. Определение городских районов-загрязнителей атмосферного воздуха по данным наблюдений // Оптика атмосферы и океана. 2009. Т. 22, № 3. С. 279-283.
3. Van Leer B. Towards the ultimate conservative difference scheme. II. Monotonicity and conservation combined in a second order scheme // J. Comput. Phys. 1974. V. 14. P. 361-370.
4. Воеводин В. В., Воеводин Вл. В. Параллельные вычисления. СПБ: БХВ-Петербург, 2002. 608 с.
З. Message Passing Interface Forum. MPI: A message - Passing Interface Standart // International Journal of Super Computer Applications. 1994. V. 8 (314). P. 16З-414.
6. Малышкин В. Э., Корнеев В. Д. Параллельное программирование мультикомпьютеров. Новосибирск: изд-во НГТУ, 2006. 296 с.
7. Старченко А. В. Параллельные вычисления в задачах охраны окружающей среды // Вторая Сибирская школа-семинар по параллельным вычислениям: сб. науч. тр. / ТГУ; нод ред. А. В. Старченко. Томск: изд-во Томск. ун-та, 2004. С. 17-22.
ОБ АВТОРАХ
Старченко Александр Васильевич, проф. Д-р физ.-мат. наук (механика жидкости, газа и плазмы, 1998, Ин-т теплофизики СО РАН).
Панасенко Елена Александровна, ст. преп. Дипл. спец. по математике (ТГУ, 2005). Канд. физ.-мат. наук по матем. моде-лир-ю, числ. методам и комплексам программ (Томск. гос. ун-т, 2010).
Л