Серия История. Политология. Экономика. Информатика. 2014. №1 (172). Выпуск 29/1
УДК 004.272.43
ОБОБЩЕННАЯ МОДЕЛЬ НАЗНАЧЕНИЯ ЗАДАЧ ДЛЯ МРР СИСТЕМ
Харьковский национальный университет им. В. Н. Каразина, г. Харьков
Белгородский государственный национальный исследовательский университет, г. Белгород.
Г.А. ПОЛЯКОВ1 Е.Г. ТОЛСТОЛУЖСКАЯ2 Д.А. ТОЛСТОЛУЖСКИЙ2
Представлена обобщенная модель назначения задач для МРР систем, отличительной особенностью которой является полная формализация задачи назначения на основе применения аппарата пространственно-временной дискретной математики, обеспечивающая учет: особенностей задач
различных прикладных областей; особенностей конкретных статических и временных архитектур и конфигураций МРР систем; состава показателей эффективности и требований и ограничений пользователей.
Ключевые слова: Назначение задач, семантико-числовая спецификация, кластеры фрагментов, времяпараме-тризованные параллельные модели, МРР системы.
Анализ литературы.
Основными этапами синтеза параллельных программ для МРР систем в настоящее время являются: декомпозиция (локальная фрагментация) данных и работ задачи, формирование множеств связей между фрагментами, укрупнение фрагментов в интересах уменьшения количества связей между фрагментами (глобальная фрагментация), «погружение» множества фрагментов и их связей в архитектуру МРР системы (назначение фрагментов на процессоры, назначение их связей на элементы коммуникационной среды).
Для МРР систем в литературе рассматриваются следующие алгоритмы назначения
1. Алгоритм случайного назначения (на любой свободный процессор).
2. Назначение на первый освободившийся процессор. В этом случае, при назначении, из свободных процессоров выбирается тот, который освободился и простаивает дольше других. Такой подход позволяет сбалансировать загрузку всех процессоров системы.
3. Алгоритм назначения с учетом приоритетов процессоров (по связности). Данный алгоритм используется для назначения вычислительных работ первого яруса графа задачи. Однако он может быть использован и для всех вычислительных работ графа задачи.
4. Алгоритмы «соседнего» назначения без пересылок «с упреждением». В данном случае используется коммуникационная модель, когда только после формирования всех данных начинается пересылка для любой вычислительной работы.
5. Алгоритм соседнего назначения «с упреждающими» пересылками. В данном случае используется, как и в аналогичном алгоритме для SMP систем, коммуникационная модель, когда данные передаются асинхронно сразу после их формирования.
6. Алгоритм соседнего назначения с использованием моделирования для определения начального времени выполнения вычислительных работ.
7. Алгоритм оптимизированного «соседнего» назначения, в котором учитываются все процессоры независимо от их состояния в момент назначения (занят или свободен).
Недостатками данных алгоритмов являются отсутствие учета характеристик процессоров MPP системы и невозможность использования формата семантико-числовых спецификаций задачи.
Постановка задачи.
Введем некоторые определения и понятия.
Определим парную сложность p5j psj двух фрагментов FR5 и FRj с номерами 5 и j, как суммарное количество сопряженных и внешних связей между этими фрагментами. В
[1,2]:
паре фрагментов «ведущий» фрагмент - фрагмент с максимальной сложностью, а второй фрагмент - «ведомый».
Исходные данные:
- множество локальных фрагментов FR={FR^}, ц = i..kfr и количество kfr фрагментов FR^;
- оптимальный состав операторов Pj каждого фрагмента FR^ (^=1..kfr) FR^={Pj^};
- множество локальных структур СЧС BF^, CF^, TF^, ^=i..kfr множества фрагментов времяпараметризованной параллельной модели задачи Z;
- класс ВУ - с распределенной памятью и обменом сообщениями (МРР);
- семантико-числовая спецификация топологии МРР;
- временные характеристики топологии МРР:
- типы, количество и характеристики процессоров NM (длительности выполнения процессорных операций в тактах/ тактовая частота; количество портов приема-передачи данных Kport );
- длительности выполнения операций «короткого» обмена сообщениями;
- множество маршрутов между различными парами процессоров топологии МРР и их временная длина.
В результате решения задачи назначения необходимо: синтезировать вариант (варианты) взаимно - однозначного соответствия между множеством номеров глобальных фрагментов («кластеров фрагментов») CFR={CFRP}, р=1..с& задачи и множеством номеров pr процессоров PR конкретной конфигурации MPP ЭВМ, обеспечивающих минимизацию процесса обмена сообщениями по заданному показателю эффективности (например, по минимуму суммарного времени обмена сообщениями между процессорами MPP ЭВМ); синтезировать вариант (варианты) взаимно -однозначного соответствия между множеством внешних связей каждого «кластерного фрагмента» и соответствующим множеством элементов коммуникационной среды.
Результаты исследования.
Уменьшение времени обмена сообщениями между фрагментами задачи при назначении на процессоры обеспечивается за счет:
а) разделение множества фрагментов FR={FR^}, ^=i..kfr задачи, на множество, обеспечивающее максимальное сокращение суммарного количества связей между «кластерами FR» за счет перевода части внешних связей между фрагментами во внутренние связи кластеров фрагментов;
б) синтеза для каждого кластера фрагментов «выделенного кластера процессоров» MPP CPR={CPRp}, р=1..с&, обеспечивающего минимум суммарного времени внутрикластерного обмена;
в) синтеза временной параллельной/последовательной модели решения задачи, обеспечивающей максимизацию количества одновременно (параллельно) выполняемых обменов.
На рисунке представлена обобщенная модель синтеза параллельных МРР-процессов.
Поясним содержание основных этапов обобщенной модели синтеза параллельных МРР - процессов.
Этап 1 (символ 2 рисунка). Содержанием этапа является кластеризация фрагментов {FR } «• {CFRp}, ^=1..kfr, p=1..cfr в интересах минимизации суммарного
времени обмена сообщениями.
На этапе 2 (символ 3 рисунка) производится оценка «текущего» состояния ресурса процессоров и линий связи (5i,j=0/1, ly=1/0j, которая заключается в определении состава свободного в текущий момент времени х ресурса (с учетом возможности выполнения ранее начатых задач на части ресурса):
- количества и множества SFPRX (set of free processors) номеров свободных в текущий момент времени х процессоров, имеющих признак занятости 5у=0;
1 Исходные данные
-мн-во фрагментов FR={ FR и }, ¡и =1.. к/Г;
- состав операторов Р] каждого фрагмента FR и ( и =1..к/г) FR и ={Р] и} и количество к/г фрагментов FR и;
- мн-во локальных структур СЧС BF и, CF и, и =1..к/г множества фрагментов;
- кол-во пт процессоров, классы процессоров и их технические и временные характеристики
- УЫШ, суперскаляр, одноядерные;- СЧС топологии МРР;
- временные характеристики топологии МРР;
- требования и ограничения пользователя.
Кластеризация фрагментов
{т^}»{еж,,}, и = 1..Иг, р = 1..е&
г3 -
Оценка «текущего» состояния ресурса процессоров и линий связи
_____________5..І = 0/1. 1ц=1/0__________
Г 4--------------------1----------------------
Установление взаимно однозначного соответствия (назначение) между кластерами фрагментов СРИВ и процессорами РШ, 1=1..пш, обеспечивающее минимизацию суммарной «длины» меж'процессорных связей
г 8
Синтез множества времяпараметризованных параллельных моделей кластеров фрагментов СБИр, Р=1..с1т для УЫШ-процессоров
9----------------------------------------
Синтез множества времяпараметризованных параллельных моделей кластеров фрагментов СБИр, р=1..с1т для суперскалярых процессоров
■7 -
Синтез множества времяпараметризованных параллельных моделей кластеров фрагментов СБИр, р=1..с1т для последовательных процессоров
Г 14
Оценка максимально возможных топологических временных затрат на межпроцессорный обмен сообщениями при полносвязной топологии
13
Оценка максимально возможных топологических временных затрат на межпроцессорный обмен сообщениями топологии МРР решетка-тор
Оценка максимально возможных топологических временных затрат на межпроцессорный обмен сообщениями топологии МРР гиперкуб
15
Синтез времяпараметризованной параллельной макрофрагментной модели процесса реализации задачи МРР ЭВМ
г 16
Оценка показателей эффективности времяпараметризованной параллельной макрофрагментной модели процесса реализации задачи МРР ЭВМ
17---------------
Выходные результаты:
- распределение работ и данных (кластеров) по процессорам МРР ВС;
- структуры СЧС ВПП модели;
- оценки показателей эффективности.
Да
Рис. Обобщенная модель назначения задач для МРР систем
2
- количества и множества SFL (set of free lines) номеров свободных линий связи, имеющих признак lij=0.
Этап 3 (символ 4 рисунка). Устанавливается взаимно однозначное соответствие между кластерами фрагментов CFRß, ß=i..cfr и подмножеством свободных в текущий момент времени процессоров МРР ВС, сопоставляющее каждому кластеру фрагментов «выделенный» процессор PR eSFPRx и обеспечивающее минимизацию суммарной
«длины» межпроцессорных связей SFPRX.
Этап 4 (символ 5 рисунка). Вид и характеристики параллельных процессов в любой параллельной вычислительной системе, в том числе и МРР, существенным образом зависят от двух макрофакторов: класса процессоров и их характеристик; топологий связей. На четвертом этапе осуществляется проверка типов процессоров МРР ВС. В системах с распределенной памятью наиболее часто применяются суперскалярные или VLIW процессоры (в самом простом случае - процессоры с последовательной обработкой).
На этапе 5 (символ 6 рисунка) синтезируется множество времяпараметризованных параллельных (ВПП) моделей кластеров фрагментов CFRß, ß=i..cfr.
Различным факторам и различным требованиям и ограничениям соответствуют различные времяпараметризованные параллельные модели. Методы синтеза ВПП моделей представлены в [3-6]. Исходной информацией для синтеза ВПП моделей является:
- программа решаемой задачи, например на языке C++;
- класс параллельной ЭВМ МРР (с массивно параллельной обработкой и распределенной памятью);
- количество ВУ (NU) и количество NM процессоров PR в ВУ - произвольные конечные;
- рассматривается однородная (гомогенная) архитектура МРР ЭВМ, поддерживаемые при синтезе времяпараметризованных параллельных моделей процессов типы процессоров: скалярные, суперскалярные, с длинной командной строкой VLIW;
- значения t0(typ) длительностей выполнения различных типов «typ» арифметических, логических операций и операций обращения к индивидуальной памяти процессора МРР ЭВМ (в тактах);
- количество портов приема/передачи данных произвольного процессора k_port > 1 ;
- конструкция (состав полей) «сообщений» обмена данными между процессорами;
- время t0c обмена одним сообщением между смежными (соседними по топологии) процессорами;
- топология коммуникационных межпроцессорных связей - произвольная заданная (например, полный граф, гиперкуб, решетка-тор);
- средства синхронизации - известные библиотечные средства событийной синхронизации (в том числе средства MPI, PVM );
- поддерживаемый метод параллельной обработки данных - совмещение независимых инструкций/функций задач.
Этап 6 (символ 9 рисунка). Производится оценка конкретной топологии для заданной МРР ВС. Для параллельных вычислительных систем используются ряд топологий, наиболее часто применимыми из которых являются: полный граф, гиперкуб, решетка-тор. Особенности этих топологий учитываются в обобщенной модели синтеза параллельных МРР - процессов.
Этап 7 (символ 7 рисунка). На седьмом этапе осуществляется оценка максимальных временных затрат на обмен сообщениями. Временные затраты на выполнение параллельного времяпараметризованного процесса в МРР ВС определяются величиной затрат процессорного времени и величиной затрат на межпроцессорный обмен сообщениями.
Серия История. Политология. Экономика. Информатика. 2014. №1 (172). Выпуск 29/1
Этап 8 (символ 8 рисунка). Обеспечивает синтез ВПП макрофрагментной модели процесса решения задачи МРР ВС. Реальные временные затраты на параллельное выполнение задачи определяются возможностями временного совмещения выполнения различных процессорных операций и операций обмена сообщениями. Такая оценка требует решения задачи синтеза параллельных МРР - процессов с учетом: количества ВУ (NU) и количества NM процессоров PR; значения t0(typ) длительностей выполнения различных типов «typ» арифметических, логических операций и операций обращения к индивидуальной памяти процессора МРР ЭВМ (в тактах); количества портов приема/передачи данных произвольного процессора k_port > 1; топологии
коммуникационной межузловой среды; поддерживаемых методов параллельной обработки данных.
На этапе 9 (символ 10 рисунка) проводится оценка показателей эффективности времяпараметризованной параллельной макрофрагментной (кластерной) и операторной модели процесса реализации задачи МРР ВС: временные затраты на последовательное и параллельное выполнение задачи, выигрыш во времени, показатель эффективности распараллеливания, коэффициент загрузки оборудования.
Выходные данные:
1. распределение работ и данных (кластеров) по процессорам МРР ВС;
2. структуры СЧС ВПП макрофрагментной модели МРР процесса;
3. структуры СЧС ВПП модели параллельного МРР процесса на операторном уровне;
4. оценки показателей эффективности времяпараметризованной параллельной макрофрагментной модели процесса реализации задачи МРР ВС.
1. Центральной проблемой параллельных ВС различных классов, в том числе с массовым параллелизмом (МРР систем), является повышение их эффективности. Возможности повышения эффективности МРР систем существенным образом зависят от оптимальности решения задачи назначения.
2. Недостатками известных алгоритмов назначения являются: отсутствие учета фактора реального времени, как одного из параметров влияющих на эффективность параллельных программ; отсутствие формализованных конструктивных методов решения задачи назначения.
3. В статье представлена обобщенная модель назначения задач для МРР систем.
Отличительной особенностью модели является полная формализация задачи
назначения на основе применения аппарата пространственно-временной дискретной математики, обеспечивающая учет: особенностей задач различных прикладных областей; особенностей конкретных статических и временных архитектур и конфигураций МРР систем; состава показателей эффективности и требований и ограничений пользователей.
1. Гергель В.П. Теория и практика параллельных вычислений [Электронный ресурс] / Интернет университет информационных технологий ИНТУИТ.Р, 2009. - Режим доступа: http://www.intuit.ru/department/calculate/paralltp/ свободный. — Загл. с экрана.
2. Воеводин В. В. Параллельные вычисления / В. В. Воеводин, Вл. В. Воеводин. - СПб. : БХВ-Петербург, 2002. - 608 с.
3. Поляков Г. А. Метод формального архитектурно-ориентированного проектирования временных параллельных программ для ЭВМ с симметричной мультипроцессорной обработкой данных / Г. А. Поляков, Е. Г. Толстолужская // Зб. наук. праць Харківськ. Універс. Повітряних Сил. - Х. : ХУ ПС ім. І. Кожедуба, 2008. - Вип. 3(18). - С. 118-121.
4. Поляков Г. А. Технология проектирования времяпараметризованных мультипараллельных программ как стратегия развития систем параллельного проектирования / Г. А. Поляков, Е. Г. Толстолужская // Радіоелектронні і комп’ютерні системи. - 2009. - № 6(40). -С. 166-171.
5. Поляков Г.А. Синтез и анализ параллельных процессов в адаптивных времяпараметризованных вычислительных системах / Г.А. Поляков, С.И. Шматков,
Выводы
Список литературы
Е.Г. Толстолужская, Д.А. Толстолужский: монография. - Х. : ХНУ имени В.Н. Каразина, 2012. -С. 434 - 575.
6.Артюх Ю. А. Обобщенная модель синтеза параллельных времяпараметризованных процессов для кластерных ВС / Ю. А. Артюх, Г. А. Поляков, Е. Г.Толстолужская // Научные ведомости - Б.: Белгородский государственный университет, 2013 г. № 1(144) 2013 - Вып. 25/1 -С. 90-94.
UNIFIED MODEL OF TASK ASSIGNMENT FOR MPP SYSTEMS
1) Belgorod National Research University, Belgorod
G.A. POLYAKOV1 E.G. mSTOLUZKA2 D.A. mSTOLUZKY2
Unified model of task assignment for MPP systems which distinctive feature is complete formalization of task assignment based on the space-time discrete mathematics unit providing record of particular problems in different application areas, specific static and temporal architectures and MPP configurations features, efficiency indexes structure and users requirements and restrictions is presented.
2) Kharkov National University nm. Karazin, Kharkov.
Keywords: task assignment; semantic numerical specification; fragments clusters; timeparameterized parallel models; MPP systems.