Научная статья на тему 'Использование открытых стохастических сетей для анализа производительности и масштабируемости систем'

Использование открытых стохастических сетей для анализа производительности и масштабируемости систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
176
35
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Берсенев Г. Б., Малинин Д. И.

Рассматриваются вопросы анализа производительности и масштабируемости программных систем. Предлагается нелинейное приближение нагрузочной характеристики для открытых сетей многоканальных систем массового обслуживания второго порядка. Приводится пример использования приближений в методике анализа масштабируемости программной системы посредством устранения узких мест.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование открытых стохастических сетей для анализа производительности и масштабируемости систем»

пертинентности, что, безусловно, несёт в себе большой научный и практический интерес.

Библиографический список

1. С.ААйвазян, и др. Прикладная статистика. Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 608 с.

2. П.И.Браславский Распознавание стилей речи применительно к информационному поиску: постановка задачи / П.И.Браславский // Математические структуры и моделирование: сб. научн. тр.- Вып. 3. / под ред. А.К.Гуца. - Омск: Омский гос. ун-т, 1999. - С. 134-140.

3. С. Оссовский. Нейронные сети для обработки информации /

С. Оссовский. - М., Финансы и статистика, 2002.

4. Д.Э.Розенталь. Практическая стилистика русского языка /Д.Э .Розенталь — М., 1974.

5. Ермаков А.Е. Компьютерная морфологи в контексте анализа связного текста. Компьютерна лингвистика и интеллектуаьные технологи / А.Е.Ермаков, В.ВЛлешко // Труды Международной конференции «Диаог’2004» - М.: Наука, 2004.

Получено 24.10.08

УДК 681.3

Г.Б. Берсенев (Тула, ТулГУ),

Д.И. Маинин (Тула, ЗАО «Тульские Ай-Ти Лаборатории»)

ИСПОЛЬЗОВАНИЕ ОТКРЫТЫХ СТОХАСТИЧЕСКИХ СЕТЕЙ ДЛЯ АНАЛИЗА ПРОИЗВОДИТЕЛЬНОСТИ И МАСШТАБИРУЕМОСТИ СИСТЕМ

Рассматриваются вопросы анализа производительности и масштабируемости программных систем. Предлагается нллинейнол приближенил нагрузочной характеристики для открытых сетей многоканальных систем массового обслуживания второго порядка. Приводится пример использования приближений в методике анализа масштабируемости программной ссстемы рсубдств ом устранения узких мест.

Масштабирование компьютерных систем обработки данных является наиболее современным и экономически обоснованным способом ж раветия, позволяющим адаптивно изменять аппаратно-программную конфетурацию систем и настраиваться под изменившуюся нагрузку. Этому способствуют быстрое удешевление аппаратных компонентов и обычно имеющаяся возможность создания пулов программных и аппаратных ре-

сурсов (процессов, потоков, серверов и т.п.). Особенно это актуально для web-cистeм, где нагрузка может возрастать на несколько порядков.

Решению задачи анаиза производительности и масштабируемости программных систем посвящено большое число работ, в которых разработан ряд эффективных методик, воплощенных в коммерческих инсттумен-таьных системах [1 - 4]. Вместе с тем потребность в разработке новых подходов и методов по-прежнему высока.

В качестве моделей работы программной системы могут использоваться стохастические сети Петри, алгебра процессов и сети систем массового обслуживания (СеМО). Сравнительный анаиз этих модельных парадетм показал, что модели в виде СеМО позволяют провести наиболее адекватный анализ производительности и оценить масштабируемость создаваемого программного обеспечения (ПО) [5, 6]. СеМО позволяет проанализировать возможные изменения системы обработки данных: изменения рабочей нагрузки и ПО, модернизации оборудования, а также различные комбинации этих вариантов. В качестве рабочей нагрузки могут задаваться частота поступлений заданий в систему (для открытых СеМО) или количество пользователей и время обдумывания (для закрытых СеМО).

В работе предлагается нелинейное приближение нагрузочной характеристики для открытых сетей многоканальных систем массового обслуживания второго порядка, позволяющее повысить вычислительную эффективность анаиза производительности и масштабируемости программных систем.

Под нагрузочной характеристикой БШ(Х) открытой СеМО (рис. 1)

будем рассматривать зависимость среднего времени пребывания в сети (среднего времени ответа) от интенсивности входного потока завок.

Рис. 1. Нагрузочная характеристика дня открытой СеМО

Пусть к, I = 1, М - коэффициенты передачи входного потока (среднее число посещений узлов завками входного потока), сс, , ! =1, М - число каналов в узлах и интенсивность обслуживания в

каждом канае узла. Если ^о - интенсивность входного потока, то условие

эргодичности для открытой СеМО имеет следующий вид:

^0 <тт С;ц / к. Таким образом, криа нагрузочной характеристики с

асимптотически приближается к ординате Хт = тт С;Ц; / к;.

;

Нагрузочную характеристику можно построеть по точкам с определенным шагом, но при большой размерности СеМО, когда ее анаиз становится достаточно трудоемким, более ращюнаьным решением будет применение соответствующего нелинейного приближения. Приближение для нагрузочной характеристики будем искать в виде функции

Б *(х) = Ах —— +Б, (1)

1 -Сх

которая является разновидностью использованного ранее авторами приближения для времен ответа в замкнутой СеМО [7].

Утверждение. Если известны точки (Х1, ^1) и (Х2, Б2), где Б; = БШ (х;), то нагрузочна характеристика БШ(Х) аппроксимируется

функцией

^ 1_ Вх

Б (х) = Ах------------+БЫ(0), (2)

1 х / ^ т

х1(Б2 -БШ(0))(Хт _х2) -х2(Б1 -Б?и(0))(^т -х1)

где В

х2(Б2 -Бги(Щ)(кт -х2) -х|(Бх -БЫ(0))(К -1)

А = (Б-Б^и(0))(1 -х 2/Кт ) , БШ(0) = .

х 2(1 -ВХ2) і =іШ

Доказательство утверждения следует из решения следующей системы уравнений относительно А и В:

Б = Ах,1 - Вх1 + Йи(0);

1 х1 / Кт

Б 2 = АХ2,1 - ВХ2 + Беи (0),

1 х2/Кт

которая получается в результате подстановки координат точек (Х1, Б1) и (Х2, Б2) в уравнение (2).

Естественно, что удачный выбор опорных точек (Х1, Б1) и (Х2, Б2) может повысить точность аппроксимации. Хорошие результаты показали точки, имеющие следующие значения координаты х:

Х1 = 0,3Кт; х2 =0,95Кт.

При анаизе масштабируемости системы методом устранения узких мест необходимо заново строить нагрузочную характеристику после устранения очередного узкого места. Предлагается использовать приближе-

ние (2) совместно с приближенным методом расчета открытых СеМО второго порядка с многоканальными узлами [8], где анализ открытой СеМО с узлами 01Ю/с сводится к решению линейной системы уравнений размерности М относительно квадрата коэффициента вариации са (г) потока

завок, входящего в I -й узел, I = 1,М . Другими словами, данный метод будет использоваться только для определения параметров А и В, а все последующие обращения к модели для определения времени ответа в зависимости от нагрузки будут заменены на обращения к приближению (2).

Рассмотрим использование предлагаемого подхода к анаизу производительности и масштабируемости на конкретном примере. Пусть са(0), Сь (/), I = 1,М - коэффициенты вариации интервалов входного потока в СеМО и длительностей обслуживания в узлах. Обозначим через с; (I = 1, М) количество каналов в узлах СеМО, а через 0 - матрицу вероятностей переходов заявок между узлами.

Исследуема открыта СеМО (рис. 2) имеет следующие параметры: г 0 0,2 0,7 0,1л

М =3, 0 =

0,2

0,5

0

0

0,5

0,5

0,6

0

0,5

0,2

0

0

Сі = 2, ш = 4, і = 1,М

Отметим, что СеМО, приеденная на рис. 2, изображена с помощью офисной программы МБ Уібіо, встроенной в интегрированную инструмен-таьную систему для анаиза производительности и масштабируемости программных систем [9].

[1]

Рис. 2. Исследуемая открытая СеМО

Для создания изображения СеМО и задания параметров ее дуг и узлов в Ушо используется специально разработанный набор элементов

Построим нагрузочные характеристики для трех случаев, в каждом из которых будут использоваться одинаковые коэффициенты вариации интервалов входного потока и длительностей обслуживания в узлах СеМО.

Проведенный анаиз рассматриваемой СеМО позволил построить нагрузочные характеристики, представленные на рис. 3.

Рис. 3. Нагрузочные характеристики для открытой СеМО:

1)са(°) =СЪ(0 = 2,1 = и; 2) са(0) =еъ{1) = 1,/ = 1,3;

са (0) =СЪ 0') = 0,1,1 =1,3

Полученные характеристики наглядно покаывают, что использование экспоненциаБных СеМО (см. рис. 3, крива 2) вместо неэкспонен-циаьных может привести к недопустимо большим погрешностям определения среднего времени ответа.

Построим каждую из нагрузочных характеристик с использованием приближения (2). Возьмем следующие опорные точки: Х1 =1,6 и Х2 =4,4. Расчетные значения: Хт = 5,17647, ЕШ(0) = 0,75227. В таблице представлены значения коэффициентов А и В, входящих в приближение (2).

Результаты расчета коэффициентов приближения (2)

Модель са (0Х СЪ (0 А В

1 0,1 0,001706 -0,69111

2 1 0,004711 -1,16522

3 2 0,004487 -5,47522

Исследуем возможность масштабирования системы, модель которой представлена открытой СеМО, изображенной на рис. 2. Предположим,

что устранение узких мест достигается только за счет увеличения числа каналов в узлах.

Пусть прогнозируется увеличение интенсивности входного потока до 10. Узким местом является 2-й узел, так как именно он определяет ограничение Хт =5,17647. В данном узле увеличиваем количество каналов

до 3, при этом узким местом становится 1-й узел, определяющий Хт =7,04. Выполняем даьнейшее масштабирование. Увеличиваем количество канаов в 1-м узле до 3, при этом узким местом становится 2-й узел, параметры которого определяют Хт = 7,7647 . Продолжаем масштабирование, увеличива количество каналов во 2-м узле до 4, при этом узким местом остается 2-й узел, определяющий Хт = 10,3529. На рис. 4 покааны приближения нагрузочных характеристик, полученные для каждого этапа масштабир ования.

В результате исследования масштабируемости системы, моделируемой посредством открытой СеМО, получили конфигурацию С1 =3, с2 =4, сз =2, для которой среднее время ответа при ^о =10 равно 18,26.

Ет 80

60

40

20

4 б 8 10 Хо

Рис. 4. Приближения нагрузочных характеристик открытой СеМО при увеличении числа каналов в узах

Были проведены многочисленные исследования точности приближения (2) для нагрузочных характеристик, полученных как с использованием приближенного метода [7], так и с использованием имитационной модели [9]. Результаты исследований показали, что приближение (2) имеет точность, достаточную для выполнения инженерных расчетов.

Биб лиографический список

1. Гома Х. UML. Проектирование систем реального времени, параллельных и распределенных приложений: пер. с англ. / Х. Гома - М.: ДМКПресс, 2002. - 704 с.

2. Смит К. У. Эффективные решения: практическое руководство по созданию гибкого и масштабируемого программного обеспечения / К. У. Смит, Л. Дж. Уильямс. - М.: Издательский дом "Вильямс", 2003. - 448 с.

3. Williams L.G. Web Application Scalability: A Model-Based Approach / L.G. Williams, C.U. Smith // Proceedings of the Computer Measurement Group. - Las Vegas. -2004.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Smith C. “Performance model interchange format (PMIF 2.0): XML definition and implementation” / C. Smith, C. Llado // Proc. of the First International Conference on the Quantitative Evaluation of Systems, September 2004. -P. 38-47.

5. Cortellessa V. Comparing Performance Models from a Software Designer Perspective [Электронный ресурс]/ V. Cortellessa, A. Di Marco, P. In-verardi -TR SAH/042, Universita di L’Aquila, Italy. -2003. - Режим доступа : http://sahara.di.univaq.it/tech.php7id tech=42.

6. Petriu D.B. Scenario-Based Performance Engineering with UCMNav /

D.B. Petriu, D. Amyot, M. Woodside // 11th SDL Forum (SDL'03), Stuttgart. -Germany, 2003. - P. 18-35.

7. Берсенев Г.Б. Приближенный аналитический метод для замкнутых неоднородных стохастических сетей / Г.Б. Берсенев, Д.И. Малинин // Изв. ТулГУ. Сер. Проблемы управления электротехническими объектами. Вып. 3: труды Третьей Всероссийской научно-практической конференции "Системы управления электротехническими объектами" - Тула, 2005. -С. 187 - 189.

8. Берсенев Г.Б. Алгоритмы приближенного анализа открытых сетей массового обслуживания с многоканальными узлами / Г.Б. Берсенев, Д.И. Малинин //Изв. ТулГУ. Сер. Вычислительная техника. Информационные технологии. Системы управления. Вып 1. Вычислительна техника. - Тула, 2005.- С. 69 -75.

9. Берсенев Г.Б. Использование MS Visio в инструментальной среде для анализа производительности масштабируемых программных систем / Г.Б. Берсенев, Д.И. Малинин // XLIV Всероссийская конференция по проблемам математики, информатики, физики и химии: тезисы докладов. Секции математики и информатики. - М.: РУДН, 2008. - С. 92.

Получено 24.10.08

i Надоели баннеры? Вы всегда можете отключить рекламу.