Научная статья на тему 'Оценка целесообразности распараллеливания информационно-зависимых задач в вычислительных системах'

Оценка целесообразности распараллеливания информационно-зависимых задач в вычислительных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
93
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Акиншин Руслан Николаевич

Предложена методика оценки целесообразности распараллеливания информационно - зависимых задач по уз-лам вычислительной сети, позволяющая сократить время на проектирование программного и информационного обеспечения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Акиншин Руслан Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE EVALUATION OF EXPEDIENSE - DEPENDENT PROBLEMS UNPARALLELING IN COMPUTER SUSTEMS

The technigue of expedience evaluation of information dependent problems unparallel over computer network units, allowing to reduce the time for designing of software and information securing is proposed.

Текст научной работы на тему «Оценка целесообразности распараллеливания информационно-зависимых задач в вычислительных системах»

2007

НАУЧНЫЙ ВЕСТНИК МГТУ ГА серия Радиофизика и радиотехника

№126

УДК 623.61:621.391

ОЦЕНКА ЦЕЛЕСООБРАЗНОСТИ РАСПАРАЛЛЕЛИВАНИЯ ИНФОРМАЦИОННО-ЗАВИСИМЫХ ЗАДАЧ В ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

Р.Н. АКИНШИН

Статья представлена профессором, доктором физико-математических наук Козловым А.И.

Предложена методика оценки целесообразности распараллеливания информационно - зависимых задач по узлам вычислительной сети, позволяющая сократить время на проектирование программного и информационного обеспечения.

1. Введение

Реализация формализованных моделей и методов размещения модулей программного обеспечения (ПО) и информационного обеспечения (ИО) информационно - зависимых задач (ИЗЗ) по узлам вычислительной сети (ВС) вызывает значительные вычислительные трудности. Это объясняется необходимостью одновременного учета технических характеристик ВС, параметров системного ПО и характеристик распараллеливаемых ИЗЗ. Поэтому предварительная оценка целесообразности распараллеливания ИЗЗ в ВС позволяет сократить время на проектирование ПО и ИО ИЗЗ, а анализ соотношений количественных характеристик ВС и ИЗЗ позволяет определить наиболее простые и адекватные им методы проектирования ПО и ИО ИЗЗ [1-4].

2. Метод оценки целесообразности распараллеливания информационнозависимых задач в ВС

Для определения оценки целесообразности распараллеливания ИЗЗ в ВС в качестве исходных данных используются следующие характеристики ее канонической структуры. Вектор

длин информационных элементов Р = {рг}, где рі - объем в байтах 1-го информационного элемента; вектор трудоемкости выполнения процедур V = {®г}, где V - число элементарных команд, необходимых для выполнения г-й процедуры. Для описания взаимосвязей между процедурами и информационными элементами в канонической структуре применяется матрицы

Ж(а0)а = I\и/(а)\, где

ао(а)

и :

1, если 1-й информационный элемент является входным (выходным) для г-й процедуры

0, в противно м случае

Характеристики ВС удобно представить в виде следующих величин <г = {о'т} - вектора производительности узлов ВС, где сгт - среднее время выполнения элементарной команды в т-м узле ВС с учетом времени ожидания начала обслуживания и считывания из внешней памяти в оперативную память ЭВМ, М - числа узлов ВС, С - средней пропускной способности каналов связи ВС, ti^. - среднего времени ожидания в очереди к каналу связи, t6 - среднего времени обслуживания одного взаимодействия между узлами ВС.

Для определения эффективности распараллеливания ИЗЗ используется величина ускорения времени решения [2].

Пусть у = Тт / Тд (М) - ускорение времени решения ИЗЗ в ВС, где От - время решения ИЗЗ в т-м узле ВС; Од (М) - время решения ИЗЗ в М узлах ВС;

ат = Т / От - распараллеливание, где О( - максимальные относительные затраты на распараллеливание ИЗЗ;

М

Рт = Та°т /Мат - относительная производительность т-го узла ВС.

т=1

Для оценки целесообразности распараллеливания ИЗЗ в ВС необходимо установить ряд соотношений. Максимальные затраты на распараллеливания можно представить следующим образом: Тз=tn+tс, где ^ - максимальное время, затрачиваемое на передачу данных между узлами ВС, tс - максимальное суммарное время ожидания очереди к каналу связи и работы системных программ для обслуживания взаимодействий между узлами ВС.

Время tп не может превышать время передачи всех промежуточных информационных элементов, которые рассчитываются по формуле

1 к к ь

1п = ~ Е Е Е ККРг.

п 1 =1 г2 =1 Ь=1

Время tc соответствует максимальному числу взаимодействий между узлами ВС и определяется как tc=к(tф+tочк), где К - максимальное число взаимодействий между узлами ВС.

Величина К грубо может рассчитываться по формуле: К=М(М-1) (N-1), где М - число узлов ВС, N - число ярусов канонической структуры комплекса ИЗЗ.

Для более точной оценки К необходимо учитывать структурные характеристики процедурно - ориентированного графа ИЗЗ. Одной из таких характеристик является показатель активности информации [3]. Активность информации можно выразить через коэффициент связности графа ИЗЗ:

я2 - Е я»

п

п-1

где Яп - число процедур п-го яруса; Я - общее число процедур ИЗЗ; Ь - общее число информационных элементов задачи.

Коэффициент 5 показывает число связей между процедурами графа относительно максимально возможного числа связей графа ИЗЗ.

Очевидно, 5 < 1. Тогда выражение для максимального суммарного времени ожидания в очереди к каналам связи и работы системных программ для обслуживания взаимодействий между

узлами ВС примет следующий вид: їс =]К[(ї6 + ї..), где ]Ё [ - ближайшее большее К целое число,

К = 5 к = 5М (М-1) (N-1).

Утверждение.

Неравенство т>1 справедливо при равномерной загрузке узлов ВС и соблюдении условия

ат <1 - М рт . (1)

Доказательство.

Т

При равномерной загрузке узлов ВС справедливо следующее выражение Ор (М) = ~^~+О(

К М

1 к м

ГДе Опд = Т,ат ■

I

г=1 т=1

1

Так как по условию ат <1 ~^Рт, то

1

О <От \ 1---------В

д р 1 М т

ТР (М ) = ^ 2®г !°т + Т

г =1 т =1

I к М

тр (М X м2 1* ^+Т;(1 - м В)

[Тр (М )<Трт [г>1]

Следствие.

В случае, когда производительности всех узлов ВС равны между собой (Ьт = 1), условие 1 примет следующий вид: Од {^—1О6, где О6 - время решения ИЗЗ в одном узле ВС.

Например, для М=2 затраты времени на распараллеливание должны быть более, чем в 2 раза меньше, чем затраты времени на решение ИЗЗ в одном узле ВС.

В качестве показателя целесообразности распараллеливания ИЗЗ в ВС можно использовать ускорение времени решения ИЗЗ в М узлах сети по отношению ко времени решения в гипотетическом узле средней производительности:

О

7 =

пд

Од (1 у

Таким образом, распараллеливание ИЗЗ в ВС эффективно с точки зрения времени решения (7>1) при условии

Од < іІ=і О„.

Зависимость между максимально возможными относительными затратами на распараллеливание, ускорением решения и числом узлов ВС преДставлена графически на рис. 1.

Тз/Тср

1

0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0

0

12

4 5

Рис. 1. График зависимости между максимально возможными относительными затратами на распараллеливание, ускорением решения и числом узлов ВС

3

6

7

8

Из графика видно, что относительные затраты на распараллеливание ИЗЗ в ВС являются возрастающей функцией от числа узлов при различных 7:

Од = I -7 Опд 1 7 '

Например, для у = 1,43 (когда Тр(М) составляет 70% от Тср) при М=2, максимально допустимые затраты на распараллеливание могут составлять- 20% от Тср; при М=3 - максимально допустимые затраты на распараллеливание могут составлять 37% от Тср. Допустимая область относительных затрат на распараллеливание ИЗЗ показана на графике штриховкой.

В случаях, когда у£1, задача проектирования ПО и ИО ИЗЗ по критерию минимального времени решения может быть сведена к более простой задаче с критерием минимальной информационной связности синтезируемых модулей. Такая задача относится к крупноблочному распараллеливанию, когда время выполнения синтезируемых модулей (крупных блоков) занимает значительную часть времени решения исходной задачи [2,3].

Необходимо отметить, что при значительном увеличении количества узлов М для достижения у > 1 величина затрат времени на распараллеливание может приближаться ко времени решения задачи в одном узле ВС.

Действительно,

ііш а = ііш

1.

Данное утверждение полностью подтверждает теорему Хорошевского о прямой зависимости производительности параллельных систем от числа процессоров при большом количестве последних [3,4].

Если т>1, то возникает необходимость в решении вопросов оптимального уровня распараллеливания и оптимальной степени распараллеливания, которое связано с созданием формализованных моделей и методов проектирования ПО и ИО ИЗЗ в ВС.

3. Математическая модель синтеза оптимальной логической структуры комплекса информационно-зависимых задач

Проектирование оптимальной логической структуры комплекса ИЗЗ осуществляется на основе структурного подхода, предполагающего комплексную процедуру «подгонки» технологии решения ИЗЗ к архитектуре конкретной или гипотетической ВС [4]. Основой структурного подхода является методология проектирования компонентов логического уровня ПО и ИО ИЗЗ, основывающаяся на использовании совокупности процедур последовательного преобразования матричных и графовых моделей канонической структуры комплекса ИЗЗ в логическую структуру комплекса ИЗЗ.

Такой подход позволяет формализовать, алгоритмизировать и автоматизировать задачу проектирования оптимальной логической структуры [1,4].

Пусть Ф=$и;И = 1,Н } - множество комплекса ИЗЗ обработки данных в ВС: Ь-й комплекс ИЗЗ из Ф считается реализуемым на ЭВМ, если существует, либо может быть синтезировано преобразование множества значений вектора хк входных переменных комплекса ИЗЗ в множество значений вектораук выходных переменных: ук = Р (хк), где хк = (хк], хк2 ... хки хкі) - вектор входных переменных И-го комплекса ИЗЗ;

У = (ук1, ук2 ••• укр ук) - вектор выходных переменных к-го комплекса ИЗЗ.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При этом необходимо отметить, что распределенная обработка информации имеет смысл только в том случае, если преобразование Р, реализованное на ЭВМ, не удовлетворяет ряду требований технического задания.

Область определения Вн и область изменения Ен преобразования Р определяются следую-

щим образом:

Бк

=Вк1 ■Пк2

Би, ■БкІ, Ек =Ек1 ■Ек2

Ек

■ Е\ ,

где Вкі - область определения переменной хкі вектора хк ;

кк

Еиі - область изменения значений переменной ук]- вектора ук хкі.

к

е Пк; ук} е Екк], I = 1,1, ] = 1,3.

Преобразованию Р можно поставить в соответствие мультиграф Г=(А,Д), представляющий собой интегрированный структурный граф и обеспечивающий получение вектора выходных

переменных ук. Вершинами А={аг; г=1, К} мультиграфа являются процедуры обработки данных, а ребрами - переменные, являющиеся общими для соответствующих процедур. Необходимо отметить, что любая процедура агеА обеспечивает преобразование уг =аг(хг), при котором:

к

БГ =ЕТі ■ Бг2 ■ Вг, ■ и і => Ег=Егі ■ Ег2 ■ Е, ■ Е

з,

Г г Г Г

где х = {х 1, х 2

Г Г і

х і, ...х і} - вектор входных переменных процедур аГ;

Г Г Г Г Г Г 1

у = {у і, у 2 ••• у і, . у і} - вектор выходных переменных процедур а/;

ПГ, - область определения входной переменной хГі процедуры аГ;

ЕГ - область изменения значений выходной переменной у Г процедуры аГ;

X є БГ, уГ ~ ~ ~

є ЕГ; і= 1, I, і= 1,3, Г= 1, К Любая процедура аГ является преобразованием множества входных либо промежуточных переменных комплекса ИЗЗ в множество промежуточных, либо выходных переменных комплекса ИЗЗ. Объединение по множеству процедур совокупности входных и выходных переменных определяет множество Д входных, промежуточных и выходных переменных комплекса

ИЗЗ, т.е. Д'= УХ }.

Пусть 0(А)={д№- а= 1, (2Г -1)} - множество подмножеств множества А, где Оа={а‘а}■

Пусть Ql(A) - некоторое подмножество множества Q(A), элементы Qa которого удовлетворяют условию

и ^ =А где Qaе Q1(А) . (2)

а

В некоторых случаях может дополнительно накладываться ограничение на отсутствие дублирования элементов (процедур), т.е. Qa(^Qa: = 0, аФ а.

Подмножеству Ql(A) можно поставить в соответствие агрегированный граф 0=(Га£), вершинами которого являются подграфы Г^^аПс), QaeQl(A), Па - множество дуг, инцидентных вершинам {ааг}; а дугами £еД - множество переменных, связывающих процедуры раз-

личных подграфов Гамежду собой.

Подграфы Гаможно разместить в матрице Е размерностью Ы*М для а=1, N *М :

Е=

Г 11 Г 12 ... Г 1т . Г1М

Г21 Г22 . Г2т . Г2М

Гы1 ГN2 ■■■ Гыт ...Г,Г

Гт

■ ГМ

Пусть при этом элементы матрицы представляют собой подграфы Г„т=^„т,Впт), образующие граф С=(Г„т,$>), в котором множество дуг £ представляет собой:

N-1 М

п=1 т=1

М

У Б

т=1

п+1,т

Г

и выполняется условие:

їй іП В,,1 = 0. ^ (3)

т=1 ^ тФт

где N - максимальное количество этапов интегрированного структурного графа задачи. а М - максимальное количество параллельных ветвей обработки данных.

Каждое подмножество Ql(A) и соответствующий ему граф О определяют конкретную реализацию преобразования Р вектора входных переменных X к вектору выходных переменных У1 .

Подграфы Гпт=^пт, Бпт) соответствуют преобразованиям векторов входных переменных Хпт к векторам выходных переменных Упт графа обработки данных Г. Если преобразование УИ=Р(Х1) представимо в виде графа О=(Гпт,8)=(^пт,Впт),8). то Гпт=^пт, Ппт) называются операционными модулями (ОМ) графа Г=(А,Д) задачи. соответствующего преобразованию Р; п-м этапом графа обработки данных называется множество

Э„-и А'„т. „ =

т

В этом случае преобразование Р обладает свойством распараллеливаемости по М параллельным ветвям. В соответствии с определением внешним интерфейсом интегрированного структурного графа задачи является X и уИ

Множество дуг £ графа О называется межоперационным информационным интерфейсом системы ОМ графа обработки данных. Множества Ппт определяют внутренний интерфейс ОМ.

Пусть У - множество подмножеств Q1(A). удовлетворяющих условию (2). Тогда в общем случае задача синтеза логической структуры ПО и ИО ВС может быть записана в виде:

ЄХЇГ / [й(А)].

й( А)<=У л <=У

где /^^А)] - функция. определенная на множестве У, Уд - множество допустимых разбиений графа Г.

В зависимости от вида и свойств функции. и ограничений. определяющих множество Уд. могут быть поставлены и решены различные задачи синтеза оптимальной логической структуры комплекса ИЗЗ.

Логическая структура комплекса ИЗЗ в общем случае может быть представлена в виде "последовательно-параллельной временной сетки" и представлена на рис. 2.

Рис. 2. Логическая структура ПО и ИО ИЗЗ

ЛИТЕРАТУРА

1. Сизов В. А. Проектирование программного и информационного обеспечения комплекса связанных задач в сети ЭВМ // Автоматика и телемеханика, №5, 1995.

2. Головкин Б. А. Расчет характеристик и планирование параллельных вычислительных процессов. - М.: Наука, 1983.

3. Хорошевский В. Г. Инженерный анализ функционирования вычислительных машин и систем. - М.: Радио и связь, 1987.

4. Акиншин Р.Н., Бирюков А.А. Методика оценки целесообразности распараллеливания информационнозависимых задач в перспективных АСУ. Известия Тульского ГУ, выпуск 6, часть 1,. Тула, 2003. С. 261-265.

THE EVALUATION OF EXPEDIENSE - DEPENDENT PROBLEMS UNPARALLELING

IN COMPUTER SUSTEMS

Akinshin R. N.

The technigue of expedience evaluation of information - dependent problems unparallel over computer network units, allowing to reduce the time for designing of software and information securing is proposed.

Сведения об авторе

Акиншин Руслан Николаевич, 1980 г.р.. окончил Тульский артиллерийский инженерный институт (2002). член СИП при Президиуме РАН. кандидат технических наук. автор 80 научных работ. область научных интересов - радиоэлектроника. защита информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.