Научная статья на тему 'Оценка целесообразности распараллеливания информационно-зависимых задач в вычислительных системах'

Оценка целесообразности распараллеливания информационно-зависимых задач в вычислительных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
104
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Акиншин Руслан Николаевич

Предложена методика оценки целесообразности распараллеливания информационно - зависимых задач по узлам вычислительной сети, позволяющая сократить время на проектирование программного и информационного обеспечения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Акиншин Руслан Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE EVALUATION OF EXPEDIENSE - DEPENDENT PROBLEMS UNPARALLELING IN COM PUTER SUSTEMS

The technique of expedience evaluation of information dependent problems unparallel over computer network units, allowing to reduce the time for designing of software and information securing is proposed.

Текст научной работы на тему «Оценка целесообразности распараллеливания информационно-зависимых задач в вычислительных системах»

НАУЧНЫЙ ВЕСТНИК МГТУ ГА серия Радиофизика и радиотехника

УДК 623.61:621.391

ОЦЕНКА ЦЕЛЕСООБРАЗНОСТИ РАСПАРАЛЛЕЛИВАНИЯ ИНФОРМАЦИОННО-ЗАВИСИМЫХ ЗАДАЧ В ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ

Р.Н. АКИНШИН

Статья представлена доктором физико-математических наук, профессором Козловым А.И.

Предложена методика оценки целесообразности распараллеливания информационно - зависимых задач по узлам вычислительной сети, позволяющая сократить время на проектирование программного и информационного обеспечения.

Введение

Реализация формализованных моделей и методов размещения модулей программного обеспечения (ПО) и информационного обеспечения (ИО) информационно - зависимых задач (ИЗЗ) по узлам вычислительной сети (ВС) вызывает значительные вычислительные трудности. Это объясняется необходимостью одновременного учета технических характеристик ВС, параметров системного программного обеспечения и характеристик распараллеливаемых ИЗЗ. Поэтому предварительная оценка целесообразности распараллеливания ИЗЗ в ВС позволяет сократить время на проектирование ПО и ИО ИЗЗ, а анализ соотношений количественных характеристик ВС и ИЗЗ позволяет определить наиболее простые и адекватные им методы проектирования ПО и ИО ИЗЗ [1-4].

Метод оценки целесообразности распараллеливания информационно-зависимых задач в ВС

Для определения оценки целесообразности распараллеливания ИЗЗ в ВС в качестве исходных данных используются следующие характеристики ее канонической структуры. Вектор

длин информационных элементов Р = { р1}, где рі - объем в байтах 1-го информационного элемента; вектор трудоемкости выполнения процедур V = {®г} , где Иг - число элементарных команд, необходимых для выполнения г-й процедуры. Для описания взаимосвязей между процедурами и информационными элементами в канонической структуре применяются матрицы

Ж(«*)в =|«(«)||, где

1, апёе 1-е еіоїбі аоеї і ійе уеаі аі о уаеуаопу аоїаійі (айоїаійі ) аёу г-е Їбїоааобй,

ао(а)

=4

0, а Їбїоеаіїі пёб^-аа.

Характеристики ВС удобно представить в виде следующих величин & = {о’іп} - вектора производительности узлов ВС, где (Ут - среднее время выполнения элементарной команды в т-м узле ВС с учетом времени ожидания начала обслуживания и считывания из внешней памяти в оперативную память ЭВМ, М - числа узлов ВС, с - средней пропускной способности каналов связи ВС, їочк - среднего времени ожидания в очереди к каналу связи, їф - среднего времени обслуживания одного взаимодействия между узлами ВС.

Для определения эффективности распараллеливания ИЗЗ используется величина ускорения времени решения [2].

Пусть у= Г; / Тр (М) - ускорение времени решения ИЗЗ в ВС,

где ТрШ - время решения ИЗЗ в т-м узле ВС; Т (М) - время решения ИЗЗ в М узлах

ВС; аш = Тз / ТрШ - распараллеливание, где Тз - максимальные относительные затраты на рас-

М

параллеливание ИЗЗ; /3Ш = /Мар - относительная производительность т-го узла ВС.

Ш=1

Для оценки целесообразности распараллеливания ИЗЗ в ВС необходимо установить ряд соотношений. Максимальные затраты на распараллеливания можно представить следующим образом: Тз=1п+1с, где 1п - максимальное время, затрачиваемое на передачу данных между узлами ВС, 1;с - максимальное суммарное время ожидания очереди к каналу связи и работы системных программ для обслуживания взаимодействий между узлами ВС.

Время 1;п не может превышать время передачи всех промежуточных информационных элементов, которые рассчитываются по формуле

1 я я ь

=-ЕЕЕ ■

V"1 ...В,..Вх ,

с г =1 г2 =1 _ .

Время 1с соответствует максимальному числу взаимодействий между узлами ВС и определяется как 1с=к(1ф+1очк), где к-максимальное число взаимодействий между узлами ВС.

Величина К грубо может рассчитываться по формуле К=М(М-1) (N-1),

где М - число узлов ВС; N - число ярусов канонической структуры комплекса ИЗЗ.

Для более точной оценки К необходимо учитывать структурные характеристики процедурно - ориентированного графа ИЗЗ. Одной из таких характеристик является показатель активности информации [3]. Активность информации можно выразить через коэффициент связности графа ИЗЗ:

2 Ь

N

2

П

п—1

где Яп - число процедур п-го яруса; Я - общее число процедур ИЗЗ, Ь - общее число информационных элементов задачи.

Коэффициент Б показывает число связей между процедурами графа относительно максимально возможного числа связей графа ИЗЗ.

Очевидно, Б < 1. Тогда выражение для максимального суммарного времени ожидания в очереди к каналам связи и работы системных программ для обслуживания взаимодействий между узлами ВС примет следующий вид

=]к [( <ф+с.) ■ где ]К[ - ближайшее большее К целое число, К = 8 к = 8М (М-1) (N-1).

Утверждение.

Неравенство т>1 справедливо при равномерной загрузке узлов ВС и соблюдении условия

ат <1 — М Ь . (1)

Доказательство.

тс

При равномерной загрузке узлов ВС справедливо следующее выражение Т (М) = — + Т

р М ,

1 я М

где Тср = М ЕШг .

М г=1 т=1

Так как по условию

т

1 3\Т р

“т {1 - М Рт

,то

т

1

'Ті Ьт

Мт

1

М

Тр (М ) = 772 XV Х°т + Т

1

Тр (М )<-Ч- Еш

р м '

Е

(1—ММ ь)

»[Т, (М )<Трт ]»[у>1].

1 ), условие 1

М2 ^ М

1 ^ Г=1 Ш=1 L Г=1 Ш=1

Следствие.

В случае, когда производительности всех узлов ВС равны между собой (¡5Ш

примет следующий вид: Т {М—1Т , где Т - время решения ИЗЗ в одном узле ВС.

М

Например, для М = 2 затраты времени на распараллеливание должны быть более, чем в 2 раза меньше, чем затраты времени на решение ИЗЗ в одном узле ВС.

В качестве показателя целесообразности распараллеливания ИЗЗ в ВС можно использовать ускорение времени решения ИЗЗ в М узлах сети по отношению ко времени решения в гипотетическом узле средней производительности:

Т„

Г-

тр (М)'

Таким образом, распараллеливание ИЗЗ в ВС эффективно с точки зрения времени решения (Г > 1) при условии

Т(М—1 Т Л М ср

Зависимость между максимально возможными относительными затратами на распараллеливание, ускорением решения и числом узлов ВС представлена графически на рис.1.

Из графика видно, что относительные затраты на распараллеливание ИЗЗ в ВС являются возрастающей функцией от числа узлов при различных у:

Т3_ = М — у Тср Му •

Например, для у = 1,43 (когда Тр(М) составляет 70% от Тср) при М=2, максимально допустимые затраты на распараллеливание могут составлять- 20% от Тср; при М=3 - максимально допустимые затраты на распараллеливание могут составлять 37% от Тср. Допустимая область относительных затрат на распараллеливание ИЗЗ показана на графике штриховкой.

В случаях, когда у £ 1 задача проектирования ПО и ИО ИЗЗ по критерию минимального времени решения может быть сведена к более простой задаче с критерием минимальной информационной связности синтезируемых модулей. Такая задача относится к крупноблочному распараллеливанию, когда время выполнения синтезируемых модулей (крупных блоков) занимает значительную часть времени решения исходной задачи [2,3].

Необходимо отметить, что при значительном увеличении количества узлов М для достижения у > 1 величина затрат времени на распараллеливание может приближаться ко времени решения задачи в одном узле ВС.

Действительно,

ііш ат = ііш

М т М

1

м Ьт

= 1.

Данное утверждение полностью подтверждает теорему Хорошевского о прямой зависимости производительности параллельных систем от числа процессоров при большом количестве последних [3,4].

Т /Т

з ср

Рис. 1. График зависимости между максимально возможными относительными затратами на распараллеливание, ускорением решения и числом узлов ВС

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

чУзлы Ю Этапы

1

М

N

Рис. 2. Логическая структура программного и информационного обеспечения ИЗЗ

1

2

2

Если у > 1, то возникает необходимость в решении вопросов оптимального уровня распараллеливания и оптимальной степени распараллеливания, которое связано с созданием формализованных моделей и методов проектирования ПО и ИО ИЗЗ в ВС.

Математическая модель синтеза оптимальной логической структуры комплекса информационно-зависимых задач

Проектирование оптимальной логической структуры комплекса ИЗЗ осуществляется на основе структурного подхода, предполагающего комплексную процедуру «подгонки» технологии решения ИЗЗ к архитектуре конкретной или гипотетической ВС [4]. Основой структурного подхода является методология проектирования компонентов логического уровня ПО и ИО ИЗЗ, основывающаяся на использовании совокупности процедур последовательного преобразования матричных и графовых моделей канонической структуры комплекса ИЗЗ в логическую структуру комплекса ИЗЗ.

Такой подход позволяет формализовать, алгоритмизировать и автоматизировать задачу проектирования оптимальной логической структуры [1,4].

Пусть Ф = (4 ; И = 1, Н } - множество комплекса ИЗЗ обработки данных в АСУ: Ь-й комплекс ИЗЗ из Ф считается реализуемым на ЭВМ, если существует, либо может быть синтезировано преобразование множества значений вектора х1 входных переменных комплекса ИЗЗ в множество значений вектора у1 выходных переменных: у1 = Р (х1); где:

х1 = (хЬі, хИ2 ... х\ х\) - вектор входных переменных И - го комплекса ИЗЗ, у1 = (у\, уИ2 ... у\ у^) - вектор выходных переменных И - го комплекса ИЗЗ.

При этом необходимо отметить, что распределенная обработка информации имеет смысл только в том случае, если преобразование Р1, реализованное на ЭВМ, не удовлетворяет ряду требований технического задания.

Область определения Б1 и область изменения Е1 преобразования Р1 определяется следующим образом:

Б1 =Б\ • Би2 • Б1і • Б1І, Е1 =Е\ • Еь2 • Е11 • Еь; ,

где Б11; - область определения переменной хЬ; вектора х1 , ЕЬ| - область изменения значений переменной у11] вектора у1 х1;; х1 є Б1;; у1] є Е1 , і = 1,1, 7 = 1,3.

Преобразованию я1 можно поставить в соответствие мультиграф Г= (А, Д), представляющий собой интегрированный структурный граф и обеспечивающий получение вектора выходных переменных у1. Вершинами А = {аг ; г = 1, Я } мультиграфа являются процедуры обработки данных, а ребрами - переменные, являющиеся общими для соответствующих процедур. Необходимо отметить, что любая процедура аг є А обеспечивает преобразование уг =аг(хг), при котором:

Бг =Бг1 • Бг2 • Бг; • Бгі ^ Ег=Ег1 • Ег2 • Ег • Ег; , где хг = {хг1, хг2 ... хг;, .. .х^} - вектор входных переменных процедур аг; уг = {уг1, уг2 ... уг;, .. .у^} - вектор выходных переменных процедур аг; Бг; - область определения входной переменной хг; процедур аг; Ег, - область изменения значений выходной переменной у [ процедуры аг;

X і є Б і, у і є Е і; і=1, /,]=1,3, г=1, Я .

Любая процедура аг является преобразованием множества входных либо промежуточных переменных комплекса ИЗЗ в множество промежуточных, либо выходных переменных комплекса ИЗЗ. Объединение по множеству процедур совокупности входных и выходных переменных определяет множество Д входных, промежуточных и выходных переменных комплекса

ИЗЗ, т.е. д'’= и< Xі: и У}.

Пусть Q(A)={Qa; а=1,(2г -1) } — множество подмножеств множества А, где Оа=(а аг }.

Пусть Q1(A) — некоторое подмножество множества Q(A), элементы Qa которого удовлетворяют условию

и Qa =^ где Qa е ^(А). (2)

а

В некоторых случаях может дополнительно накладываться ограничение на отсутствие дублирования элементов (процедур), т.е. 0а’ = 0, а^ а.

Подмножеству Q1(A) можно поставить в соответствие агрегированный граф О = (Га, Б), вершинами которого являются подграфы Га = ^а, Ба), Qaе Q1(A), Ба - множество дуг, инцидентных вершинам {аа }; а дугами БеД - множество переменных, связывающих процедуры различных подграфов Га между собой.

Подграфы Га можно разместить в матрице Б размерностью К* М для а= 1, N *М :

Г11 Г12 . Г1т • • -Г1М

Р= Г21 Г22 . Г2т .Г2М

Гщ Гк2 . Гкт .ГкМ

Пусть при этом элементы матрицы представляют собой подграфы Гпт=^пт, Бпт), образующие граф О= (Гпт, Б), в котором множество дуг Б представляет собой:

п=1 т=1

и А

т=1

п+1,т

и выполняется условие:

и К П = 0. "«• " = !•м■

(3)

т =1

Г

где N - максимальное количество этапов интегрированного структурного графа задачи;

M - максимальное количество параллельных ветвей обработки данных.

Каждое подмножество Q1(A) и соответствующий ему граф G определяют конкретную реализацию преобразования p вектора входных переменных Xh вектора выходных переменных Yh .

Подграфы rnm=(Qnm, Dnm) соответствуют преобразованиям векторов входных переменных Xnm, векторы выходных переменных Ynm графу обработки данных Г. Если преобразование Yh=ph(Xh) представимо в виде графа G= (Гщп, S) = ((Qnm, Dnm), S), то Гnm=(Qnm, Dnm) называются операционными модулями (ОМ) графа Г=(А, Д) задачи, соответствующего преобразованию ph; n-м этапом графа обработки данных называется множество Эп = U Гm, П = 1, N.

m

В этом случае преобразование Р обладает свойством распараллеливаемости по M параллельным ветвям. В соответствии с определением внешним интерфейсом интегрированного структурного графа задачи является Xh U Yh.

Множество дуг S графа G называется межоперационным информационным интерфейсом системы ОМ графа обработки данных. Множества Dnm определяют внутренний интерфейс ОМ.

Пусть Y - множество подмножеств Q1(A) удовлетворяющих условию (2). Тогда в общем случае задача синтеза логической структуры программного и информационного обеспечения АСУВ, функционирующих на базе ЛВС, может быть записана в виде:

extr f [â(A)],

Qi( A)çY д =Y

где f[Q1(A)] - функция, определенная на множестве Y; Yд - множество допустимых разбиений графа Г. В зависимости от вида и свойств функции, и ограничений, определяющих множество Yд, могут быть поставлены и решены различные задачи синтеза оптимальной логической структуры комплекса ИЗЗ.

Логическая структура комплекса ИЗЗ в общем случае может быть представлена в виде "последовательно-параллельной временной сетки" (рис. 2).

ЛИТЕРАТУРА

1. Сизов В. А. Проектирование программного и информационного обеспечения комплекса связанных задач в сети ЭВМ. // Автоматика и телемеханика, №5, 1995.

2. Головкин Б. А. Расчет характеристик и планирование параллельных вычислительных процессов. - М.: Наука, 1983.

3. Хорошевский В. Г. Инженерный анализ функционирования вычислительных машин и систем. - М.: Радио и связь, 1987.

4. Акиншин Р.Н., Бирюков А.А. Методика оценки целесообразности распараллелирования информационно -зависимых задач в перспективных АСУ. // Известия Тульского ГУ, вып. 6, ч. 1, 2003.

THE EVALUATION OF EXPEDIENSE - DEPENDENT PROBLEMS UNPARALLELING IN COMPUTER SUSTEMS

Akinshin R.N.

The technique of expedience évaluation of information - dépendent problems unparallel over computer network units, allowing to reduce the time for designing of software and information securing is proposed.

Сведения об авторе

Акиншин Руслан Николаевич 1980 г.р., окончил Тульский артиллерийский инженерный институт (2002), кандидат технических наук, член СПП при Президиуме РАН, автор 80 научных работ, область научных интересов - радиоэлектроника, защита информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.