Научная статья на тему 'Оптимизация распределения заданий в grid – системе'

Оптимизация распределения заданий в grid – системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
73
15
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Листровой С. В., Тимошенко Е. В.

Проведён анализ процесса распределения заданий в вычислительной среде реального времени. Обоснован выбор критериев эффективности функционирования отказоустойчивой GRID – системы. Предложена модель распределения заданий в GRID.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Листровой С. В., Тимошенко Е. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Оптимізація розподілу завдань в GRID – системі

Проведено аналіз процесу розподілу завдань в обчислювальному середовищі реального часу. Обґрунтований вибір критеріїв ефективності функціонування стійкої до відмов GRІD – системи. Запропонована модель розподілення завдань в GRІD.

Текст научной работы на тему «Оптимизация распределения заданий в grid – системе»

АВТОМАТИКА, ТЕЛЕМЕХАН1КА, ЗВ'ЯЗОК

УДК 621.396

Листровой С.В., д.т.н., професор (УкрДАЗТ) Тимошенко Е.В., аспирант (УкрДАЗТ)

ОПТИМИЗАЦИЯ РАСПРЕДЕЛЕНИЯ ЗАДАНИЙ В GRID - СИСТЕМЕ

Вступление. Одной из важных проблем при создании GRID - систем является задача оптимального распределения ресурсов. Планирование многопроцессорных заданий в GRID сопряжено с рядом специфических проблем. Причина их возникновения - это гетерогенность, аппаратной и программной платформ, глобально распределенных вычислительных узлов. В таких условиях, для каждого задания из очереди, нужно обеспечить наилучшее назначение ресурса, по заданному пользователем критерию оптимальности. При этом важно синхронизировать доставку текущей и прогнозной информации о ресурсе, а также обеспечить отказоустойчивое функционирование распределенной вычислительной среды.

Анализ математической модели распределения заданий в РВС.

Сложность процесса управления распределенной вычислительной системой (РВС) реального времени характеризуется полиморфизмом её параметров и динамичностью изменения их значений. Однако, общим свойством для таких РВС, как GRID является наличие взаимодействия заданий и вычислительных ресурсов системы. Основной характеристикой, определяющей количественное состояние управляемого процесса, является зависимость числа распределяемых задач от времени, отводимого на их решение. При организации работы GRID - системы производится закрепление её вычислительных ресурсов (ВР) за соответствующими задачами. В процессе функционирования, когда одни ВР уже освобождаются, другие еще заняты, третьи - хотя и закреплены за некоторыми задачами, но пока не приступили к их обслуживанию. Таким

образом, формируется определённая динамика занятости и освобождения. Изменяясь с течением времени, она требует корректировки стратегии распределения и закрепления заданий за ВР, которая выполняется с учетом имеющихся ограничений.

Существует обширный класс РВС с достаточно похожими задачами. Это, прежде всего, РВС с изменяющимся в процессе работы количеством задач, которые пребывают в системе ограниченное время и обслуживаются ВР в динамическом режиме. Этот процесс сопряжен с расходом ограниченного ресурса. Поэтому в таких РВС оптимизация процессов включает в себя следующие задачи:

- определение оптимального количества ресурса расходуемого на решение GRID - системой задачи;

- нахождение минимального числа ВР, необходимого для выполнения заданий находящихся в системе;

- закрепление ВР за заданиями;

- планирование расписаний для реализации процесса взаимодействия заданий и ВР;

- восстановление системы после отказа некоторых её функциональных элементов.

Рассмотрим обобщенную формулировку задачи управления в РВС реального времени. Решения РВС по оптимизации управляемого процесса вырабатываются на основании принятых показателей эффективности (качества управления). Действия РВС должны обеспечить оптимальное управление процессом, мерой эффективности которого станут функции, заданные на множестве его допустимых состояний. Эти показатели определяются целями и задачами, стоящими перед такой РВС, как GRID. Основополагающими функциями, характеризующими показатели качества управления, являются число выполненных задач, время окончания обслуживания заданий, снижение эффективности управляемого процесса, из-за неоптимальности управления (функции ущерба), и т. д.

Показатели эффективности функционирования GRID -системы. Показателем эффективности W(u) операции, является степень соответствия полученного результата требуемому (u eQv выбранная стратегия из множества допустимых). В GRID - системе, под операцией понимается процесс закрепления ВР заданиями. При выборе показателя эффективности обязательно его соответствие цели операции, характеризующейся требуемым результатом Yp. Поэтому, для описания соответствия реального результата Y операции требуемому, вводится числовая функция соответствия

р = p(Y(u), Ymp), ueQv (1)

В случае описания детерминированных процессов [1] функция соответствия служит показателем эффективности

W(u) = (Y(u), Ymp). (2)

Результат операции Y(u) ставят в зависимость от основных результирующих факторов: полезного эффекта Е, затраченных ресурсов С и времени Т [1]. В общем случае, Y(u) может быть представлен в виде результирующей степенной функции

Y (u) = а0 Eai Ca2 T"3, (3)

где а0, а1, а2, а3 - параметры функции результата.

Если принять а0=а1=1 и а2=а3=0, то результат операции описывается лишь результирующим фактором Е (У(у) = Е), а остальные результирующие факторы будут ограничены.

При построении отказоустойчивой РВС, результирующий фактор Е характеризуется коэффициентом сохранения эффективности ксэ, который равен отношению показателя эффективности использования системы (за определенное время эксплуатации) к номинальному значению этого показателя (за тот же период времени безотказной работы) [1]. То есть, коэффициент сохранения эффективности характеризует степень влияния отказов на эффективность применения РВС по назначению

кэ = ПТ , (4)

ном

где Потк - значение показателя эффективности РВС при отказах;

Пном - номинальное значение показателя эффективности

системы.

Для оценки возможностей РВС используются различные показатели эффективности, которые можно разделить на две группы [2, 3]:

1. {<рк} - показатели, оценивающие функциональные возможности РВС. Например, функциональная мощность Ервс, определяемая множеством задач, которые способна решать РВС за данный интервал времени.

2. {вт} - показатели, оценивающие время или скорость выполнения системой ее функций. Это показатели производительности и пропускной способности, такие как среднее время решения текущей задачи, оперативность решения задач управления в РВС и т.п.

В отказоустойчивых РВС, обладающих способностью к перезакреплению вычислительных ресурсов (ВР) за задачами при отказах ее функциональных элементов, возможна деградация двух видов [2]:

1. Функциональная деградация, которая выражается в снижении значений показателей группы {<рк }. Она приводит к функциональному отказу (р - отказу), состоящему в наступлении события ^ф = { рР< р*}, где р, р* - текущее и предельно допустимое значение некоторого показателя р, принятого для оценки РВС.

2. Деградация по производительности или оперативности, т.е. снижение показателей группы {вт }, приводящее к отказу по производительности или оперативности (вотказу), под которым понимается наступление события А0 = {0 <в}, где 0,0 - текущее и предельно допустимое значение некоторого показателя 0, используемого для оценки РВС.

В [3] рассматриваются два типа состояний РВС: х - состояние, определяемое парой значений принятых показателей р и 0, 5* - состояние, определяемое как 5У=71,..,7„ , где (¡е{0,1}, (71=1 для о-ПМ и 7 = 0 для р-ПМ. При этом X = { р0,0} - начальное х-состояние, р, 0- номинальные значения показателей р и 0,

я0=00...0 - начальное 5 - состояние.

Номинальные значения р0,00 и предельно допустимые значения р*, 0 принятых показателей качества функционирования определяют область работоспособности РВС (Р - область), как подмножество Хг={х^} таких х-состояний, для которых р > рм > р и в > вм > в (рисунок 1).

В каждой GR/D-системе должно быть реализовано то или иное отображение р: Х8^Х№ множества Х8 = {8У} всех ^-состояний в множество Х№={хи} всех х-состояний. При этом должно быть обеспечено отображение в Р-область Хг (где кгеХХ) такого подмножества чтобы выполнялись

требования, предъявляемые к отказоустойчивости РВС. Это можно выполнить путем надлежащего закрепления ВР за соответствующими заданиями для каждого из состояний 5уеХ3.

л

V

V

Область в-отказа

V

Р-область

Область ^-отказа

в

в?

вр в0

Рисунок 1 - Область работоспособности GRZD-системы

В этом случае, результат операции определяется полезным эффектом Е, который оценивается суммарной весовой характеристикой множества выполняемых задач в данном £ ^-состоянии и называется функциональной мощностью РВС

Пу _

Еу (ф ) = 2 2 в*, м = (1, т), (5)

¿=1 ф еОГ

где п V, - общее число ВР GRZD-системы в состоянии £ ^ вм - вес р-го задания для /-го ВР, характеризующий его важность (приоритет) в РВС;

- общее число заданий в системе. ф ] - множество ресурсов, которые способен задействовать /-й

ВР в состоянии £ ^

Следовательно, основным и наиболее полно отражающем цели операции, показателем Ж(и) эффективности GRZD-системы является скаляр (5), называемый показателем среднего результата [1],

Ж(ы) = М[У(ы)] = Е V. (6)

Ev относится к группе {фк}~-показателей, к которой также относится и результирующий фактор затраты любого (кроме временного) запаса ВР в состоянии Sv. Естественно, что на каждую операцию налагаются и ограничения временных результирующих факторов, которые относятся к группе {вт}~ показателей.

Выбор критерия эффективности функционирования отказоустойчивой РВС подчинён концепции оптимизации [1], согласно которой рациональными считаются те стратегии и eQv , что обеспечивают максимальный эффект в операции

W (и *) = max W (u). (7)

Причем, решение задачи не исключает возможности существования нескольких равноценных стратегий и e£2v .

Согласно функции соответствия р, в рамках концепции оптимизации, эффективность операции будет характеризоваться критерием наибольшего результата [1]. Оптимальная стратегия выбирается из условия

и *: max Ev(u) . (8)

ueQv

Таким образом, для достижения операцией максимально полезного эффекта Ев и повышения коэффициента сохранения эффективности ксэ, в каждый задаваемый циклом управления момент v, необходимо осуществлять анализ вектора ^-состояния и при возникновении ^-отказа совершать поиск оптимальной стратегии и* (8) операции.

Математическая модель распределения задач в GRID - системе. Оперативность динамического управления в РВС количественно оценивается вероятностью решения рассмотренного комплекса задач управления за время не превышающее Тобн

T

1 обн

P(T) = 1 - e T _ (9)

Поскольку GRID - системы реализуются на основе вычислительных сетей, время обновления информации определяется его циклом и обладает периодом 30 ^ 60 секунд. Например в РВС реального времени, которые

используются для управления авиалиниями, обобщенным показателем оперативности решения задач управления является вероятность решения системой задач управления за интервал времени Л(1)

T -T

кр ^цу

P[A(t)] = Kr e То (10)

где A(t) = ТКр - Тцу;

Ткр - критическое время по истечении, которого цель управления не может быть достигнута;

Тцу - время цикла управления РВС;

Кг - коэффициент готовности системы;

То - среднее время наработки системы на один отказ.

В GRID - системе, для оценки эффективности управления процессом распределения ВР между заданиями, целесообразно использовать следующие показатели качества.

1. Коэффициент функциональной мощности GRID. В соответствии с (10) его можно записать в виде

nv mi

Ev) = EZв, i, (11)

i=1 ,=1

где n v - общее число ВР системы, находящихся в состоянии S v;

mi - общее число задач, которые способен обслужить i-й ВР в состоянии S ;

в, - весовой показатель ,-го задания i-го ВР, характеризующий степень его приоритетности для GRID - системы.

2. Суммарное время доступа ВР к запасам, обусловленное структурой GRID

m n

T = ZZ Tjxj,

i=1 j=1

(12)

[ 1, если j - задание обслуживается i - м ВР 1 iJ [0, в противном случае J '

где Tij - среднее время доступа i-го ВР к запасам расходуемым на обслуживание j-го задания.

Пусть, для обработки заданий, имеется некоторое количество ВР^ i = (1, n). Если события, приводящие к возникновению в них отказов и вызывающие неработоспособность GRID, считать взаимонезависимыми, то под состоянием s(t) в момент времени t понимается набор состояний всех ВР в этот момент s(t) = <,..., <, где <е{0,1} и

Г 1, если ВР. - неработоспособный;

< = 1

[ 0, если ВР. работоспособный .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Начальное состояние системы s(t=0) = s0= 00...0. Пусть Лп-множество всех состояний системы; D = {ВР1, ...,ВРп}-множество всех ВР системы; Q = {U1,.,UL}--множество всех {(} возникших в РВС в

состоянии Sv; = {(,...,(/,...,( }-подмножество заданий, которое работоспособный ВР! способен обслужить, когда система находится в состоянии Sv. Для состояния s0 задано множество Q={3j} и начальное распределение задач между всеми ВР, т.е. подмножества = {(,...,(/,...,(}.

Пусть Dv={BP}v, Dr у={ВР}-множества соответственно отказавших и работоспособных ВР, соответствующие состоянию Sv; ^-множество всех собственных задач отказавших ВР для состояния Sv; Аг=^°\А/1-множество

всех собственных задач для работоспособного ВР в состоянии S .

Каждая {((/} (( gQi) характеризуется степенью важности,

определяющей цели функционирования РВС, и задается весовым коэффициентом {Ри}. Тогда результат перераспределения определяется полезным эффектом Е, оцениваемым суммарной весовой характеристикой множества задач в данном S - состоянии (13) и называемом функциональной мощностью РВС (Е^. Кроме того, каждая {(} имеет ряд других параметров. Например, среднее время обслуживания, которое задается матрицей 11 АТи\\, и = (1, ml; i = 1, nv); объемом ресурсов потребляемых при обслуживании соответствующих задач и т.д. Тогда формальная модель задачи перераспределения примет следующий вид. Необходимо обеспечить максимальный полезный эффект перераспределения

E ^ max , (13)

i\=1 /=1

n„ m

при ограничениях

П т1

-<доп

ЦАтмгхмг *АТдоп; (14)

г=1 ¡и=\

П т1

доп

ИГ„,хм< * клт; (15)

V

г=1 ¡и=1

П т1

доп

* т:оп, (16)

г=1 м=1

I Х Мг * 1 ,

(17)

м

М=1

11, если м — е задание обслуживается в г — м ВР;

Хмг = 1 А

1 0, в противном случае;

а т доп т г доп т доп

где АТ х/ , Vх/ , Т х/ - предельно допустимые значения, соответственно, суммарного среднего времени обслуживания заданий г-м ВР, объема ресурса, требуемого для обслуживания заданий г-м ВР и времени доступа к ресурсам для перераспределения заданий по ВР во всей ОШО - системе в целом. Ограничение (17) определяет, что задача может быть назначена для обслуживания только на один ВР.

Выводы. Таким образом, планирование распределения заданий можно рассматривать, как процесс функционирования отказоустойчивой системы с номинальным значением показателя эффективности ЕН. При возникновении отказов система деградирует на величину Ед. Далее, путём решения рассмотренной выше задачи оптимального планирования, осуществляется перераспределение ресурса. В результате этого, система восстанавливает свою эффективность до величины АЕ. По мере восстановления функциональной эффективности системы, показатель эффективности её функционирования возвращается к номинального уровню ЕН, рисунок 2.

Е

Е

Н

t

Рисунок 2 - Диаграмма функционирования системы

Следовательно, поочерёдно решая ряд задач планирования и варьируя процесс перераспределения ресурса, за несколько циклов управления ТцУ устраняется влияние на систему возникших ранее в ней отказов.

Учитывая всё это, становится очевидным, что задача перераспределения (13-17) сводится к многократному решению задачи ЦЛП с БП в условиях деградации функциональных элементов GRID, которую необходимо решать в масштабе реального времени.

Список литературы

1. Надежность и эффективность в технике // Справочник в 10 томах. Под ред. В.Ф. Уткина. - М: Машиностроение, 1988. - Т. 3: Эффективность технических систем. 328 с.

2. Турута Е.Н., Ковалев В.Ш. Об одном методе повышения живучести локальных сетей ЭВМ. - АВТ, 1983, №5, - с.42-44.

3. Турута Е.Н. Обеспечение отказоустойчивости управляющих много микропроцессорных систем путем перераспределения задач отказавших модулей. - В кн.: Системы управления информационных сетей. М.: Наука, 1983, - с. 187-198.

i Надоели баннеры? Вы всегда можете отключить рекламу.