Научная статья на тему 'Оценка эффективности реструктуризации распределенных баз данных'

Оценка эффективности реструктуризации распределенных баз данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
112
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННАЯ БАЗА ДАННЫХ / ЭФФЕКТИВНОСТЬ / ПОКАЗАТЕЛЬ ЭФФЕКТИВНОСТИ / РЕСТРУКТУРИЗАЦИЯ / МОДЕЛЬ / DISTRIBUTED DATABASE / EFFECTIVENESS / EFFECTIVENESS INDICATOR / RESTRUCTURING / MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванов А. Ю.

Приведены результаты оценки эффективности реструктуризации распределенных баз данных. Исследовано влияние различных факторов на эффективность реструктуризации. Сформулированы рекомендации по реструктуризации распределенных баз данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов А. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EFFECTIVENESS VALUATION OF DISTRIBUTED DATABASES RESTRUCTURING

The article describes the effectiveness valuation results of distributed databases restructuring. Different factors influence on effectiveness restructuring is investigated. Some recommendation about distributed databases restructuring are formulated.

Текст научной работы на тему «Оценка эффективности реструктуризации распределенных баз данных»

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ, КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В ТЕОРИИ УПРАВЛЕНИЯ СЛОЖНЫХ ПРОЦЕССОВ

ОЦЕНКА ЭФФЕКТИВНОСТИ РЕСТРУКТУРИЗАЦИИ РАСПРЕДЕЛЕННЫХ БАЗ ДАННЫХ

А. Ю. Иванов, кандидат технических наук, доцент. Санкт-Петербургский университет ГПС МЧС России

Приведены результаты оценки эффективности реструктуризации распределенных баз данных. Исследовано влияние различных факторов на эффективность реструктуризации. Сформулированы рекомендации по реструктуризации распределенных баз данных.

Ключевые слова: распределенная база данных, эффективность, показатель эффективности, реструктуризация, модель

EFFECTIVENESS VALUATION OF DISTRIBUTED DATABASES RESTRUCTURING

A.Y. Ivanov. Saint-Petersburg university of State fire service of EMERCOM of Russia

The article describes the effectiveness valuation results of distributed databases restructuring. Different factors influence on effectiveness restructuring is investigated. Some recommendation about distributed databases restructuring are formulated.

Key words: distributed database, effectiveness, effectiveness indicator, restructuring, model

Эффективность - одно из фундаментальных свойств большинства искусственных систем, характеризующее результативность их применения. Цель оценки эффективности реструктуризации распределенных баз данных (РБД) состоит в создании научно-обоснованных рекомендаций, подтвержденных количественными характеристиками, для выработки организационно-технических решений на построение базы данных и управление ее структурой при функционировании.

Проведение оценки эффективности реструктуризации возможно на основе внешнего или внутреннего подходов.

При внешнем подходе РБД рассматривается как элемент автоматизированных информационно-управляющих систем (АИУС), а ее эффективность оценивается через эффективность последней. С позиций внутреннего подхода РБД рассматривается как самостоятельная система, а к её выходу (процессу выполнения запросов) со стороны АИУС предъявлены требования, удовлетворение которых является целью функционирования базы данных. Использование внутреннего подхода не предполагает нарушения принципа системности, лежащего в основе оценки эффективности, и изоляции РБД, так как требования к ней формируются со стороны АИУС и их выполнение не может не приводить к повышению эффективности последней.

Сущность реализации внутреннего подхода состоит в следующем. Выделяются существенные свойства РБД и по этим свойствам оцениваются результаты процесса

выполнения запросов при реализации различных вариантов управления структурой базы данных или одного варианта при различных значениях параметров. Количественной мерой оценки соответствия результатов требованиям по каждому свойству является показатель эффективности. Проведение оценки относительно полного вектора показателей сопряжено со значительной трудоемкостью, поэтому на практике нередко ограничиваются получением значений показателей эффективности по доминирующему свойству.

Поскольку АИУС разрабатывается и внедряется с целью повышения оперативности и обоснованности управленческих решений, в качестве доминирующего свойства РБД следует признать ее реактивность, определяемую средним временем отклика базы данных на запросы пользователей. Показано, что реактивность РБД оказывает непосредственное влияние на оперативность АИУС и своевременность информационного процесса в системе управления [1].

Начальный период жизненного цикла АИУС не позволяет провести натурный эксперимент непосредственно на системе, поэтому оценка эффективности РБД проведена на модели, структурная схема которой изображена на рис. 1.

Генеральная цель исследования - показать возможности разработанной системы управления реструктуризацией на основе подхода, названного динамическим управлением [2]. Эта система предполагает модификацию физической структуры РБД без прерывания процесса обработки запросов. В основе работы системы управления реструктуризацией лежат следующие методы и алгоритмы.

1. Метод и алгоритм динамического планирования локального представления структуры РБД.

2. Метод и алгоритм децентрализованного управления размещением фрагментов данных на серверах базы данных.

3. Метод и алгоритм определения моментов реструктуризации РБД.

В качестве показателя эффективности использовано среднее время отклика базы

данных на запросы пользователей - t .

Исследовалась распределенная база данных, размещаемая в сети, содержащая не более 10 узлов, в которых размещаются серверы базы данных.

Модель диспетчеризации заявок

г

1-

Модель коммутационного устройства

Модель канала передачи данных

Рис. 1. Схема модели обработки запросов к РБД

Первая серия экспериментов нацелена на выяснение характера зависимости названного показателя от скорости каналов передачи данных. Сравнению подвергались

варианты функционирования РБД с использованием реструктуризации и без таковой.

Вид обобщенных зависимостей приведен на рис. 2.

t,C)

50 40 30 20 10

4,8 32 64 128 ЧКбит/с

Рис. 2. Зависимость среднего времени выполнения запросов от скорости каналов передачи данных

Приведенная зависимость демонстрирует преимущество использования системы управления реструктуризацией РБД по отношению к традиционному управлению РБД. Разница в значениях показателей при фиксированной скорости колеблется в пределах 12-30 %. Сравнение показателей позволяет сделать предварительный вывод о предпочтительности использования предлагаемого управления структурой РБД при скоростях от 1,2 до 64 Кбит/с. Однако снижение разницы между показателями на скоростях, превышающих 128 Кбит/с, объясняется тем, что пропускной способности каналов достаточно для передачи всего потока данных между серверами с минимальными задержками.

Кроме того, наблюдение за значениями среднего времени отклика на запрос при различных скоростях каналов передачи данных позволяет судить и о достигаемом экономическом эффекте от использования системы управления реструктуризацией. Попарно сравнивались значения оцениваемого показателя при скоростях 1,2-2,4 Кбит/с; 2,4-4,8 Кбит/с; 4,8-9,6 Кбит/с; 32-64 Кбит/с; 64-128 Кбит/с. Как правило, расхождение в значениях показателей в этих точках незначительно. Следовательно, применение системы управления реструктуризацией позволяет более экономно использовать пропускную способность каналов и при меньшей скорости обеспечивать практически то же самое значение показателя оперативности обработки запросов. Тогда процесс решения задач в АИУС потребует меньших затрат ресурсов без снижения оперативности.

Было обнаружено, что на эффективность реструктуризации существенное влияние оказывает объем передаваемых фрагментов данных. С его увеличением возрастает среднее время отклика на запросы. При превышении некоторого значения объема фрагментов данных реактивность РБД при использовании системы управления реструктуризацией становится ниже, чем у базы данных без такой системы (традиционное управление). Это обстоятельство объясняется тем, что существенно увеличиваются транспортные потоки в сети передачи данных и неизбежно растет время отклика на запросы.

Вторая серия экспериментов позволяет определить характер зависимости среднего времени отклика базы данных от объема фрагментов передаваемых данных. Результаты представлены на рис. 3.

Осуществление перераспределения фрагментов данных требует затрат на

непосредственную передачу фрагментов по каналам передачи данных. При этом, чем больше размер фрагмента, тем менее вероятно изменение его местоположения, поскольку сложнее выполнить условие по времени перемещения фрагмента.

Очевидно, что для достижения большей эффективности от реструктуризации РБД для принятого набора исходных данных целесообразно иметь размеры фрагментов данных, не превышающие 1-2 Мбайт. Большой размер фрагментов данных (10 Мбайт и более) приводит к существенному снижению эффективности реструктуризации.

Рис. 3. Зависимость среднего времени выполнения запросов от объема фрагментов данных

Третья серия экспериментов направлена на определение характера зависимости среднего времени выполнения запросов от числа копий фрагмента данных в сети. Поскольку установить такую зависимость в абсолютном выражении не представляется возможным, использовалось относительное представление «множественности» как отношение числа копий фрагмента к числу серверов базы данных в АИУС. Вид зависимости приведен на рис. 4.

Рис. 4. Зависимость среднего времени выполнения запросов от отношения числа копий фрагмента данных N к числу серверов баз данных $

Разнонаправленный характер зависимостей для запросов на чтение и модификацию данных определяется следующим. Увеличение числа копий фрагмента данных в сети повышает степень локализации ссылок, то есть возрастает вероятность того, что запрашиваемые данные находятся на сервере, ближайшем к источнику запроса. С другой стороны, рост числа копий фрагмента в сети приводит к увеличению времени актуализации многочисленных копий. Это имеет следствием возрастание объема сетевого трафика и удлинение периода блокировки данных.

В качестве требуемого времени выполнения запросов принято значение 30 с. Для этого значения оценены границы диапазона относительного числа копий фрагментов данных. Интервал \а^ а2] соответствует варианту РБД с системой управления реструктуризацией, а интервал \Ь\, Ь2] - варианту с традиционным управлением.

Поскольку интервал \а^ а2] превышает интервал \Ь\, Ь2], то требования по оперативности обработки запросов для первого варианта будут выполняться в более широком диапазоне избыточности числа копий.

Цели четвертой серии экспериментов: сравнение показателей реактивности РБД

(среднее время обработки запросов - / ) при различных вариантах реструктуризации; определение чувствительности показателей реактивности к количеству последовательно проводимых изменений структуры РБД.

Обобщенный алгоритм проведения модельных исследований на этом этапе представлен на рис. 5.

Исследованию подвергалось три варианта реструктуризации (блок 5):

1) с использованием системы управления структурой РБД;

2) на основе известного частотного алгоритма размещения фрагментов \3].

3) без реструктуризации.

Результаты моделирования приведены на рис. 6.

Начало )

Синтез начальной структуры МРБД

Реализация набора заявок

Анализ результатов обработки заявок

(

Рис. 5. Алгоритм модельных исследований

при использовании системы управления реструктуризацией

13 5 7

Рис. 6. Зависимость среднего времени выполнения запросов t от числа проводимых реструктуризаций Я

Анализ результатов позволяет сделать следующие выводы.

1. Экспериментально показано преимущество системы управления реструктуризацией. Ее применение приводит к уменьшению времени отклика базы данных.

2. Определено, что при увеличении числа проводимых реструктуризаций наблюдается снижение эффективности функционирования РБД (увеличивается время отклика базы данных).

Последнее обстоятельство объясняется тем, что алгоритмы, лежащие в основе работы системы управления реструктуризацией, позволяют строить квазиоптимальную структуру РБД. Поэтапное применение этих алгоритмов увеличивает несоответствие между оптимальной структурой, формируемой при использовании точных методов решения задачи синтеза и реальной структурой, получаемой при работе системы управления реструктуризацией.

Общее осмысление результатов модельных исследований позволяет сформулировать следующие научно-методические рекомендации по реструктуризации

РБД.

1. В условиях дефицита времени на принятие и исполнение решений по реструктуризации РБД целесообразно применение динамической системы управления реструктуризацией для изменения структуры базы данных параллельно с процессом обработки пользовательских запросов.

2. После некоторого числа подобных структурных изменений необходимо блокировать базу данных относительно пользовательских запросов и провести перестроение ее структуры при помощи точных методов и алгоритмов.

3. Рекомендуемый объем фрагментов данных, участвующих в реструктуризации, находится в пределах 1-2 Мбайт.

4. Реструктуризация дает наибольший эффект при использовании низкоскоростных каналов передачи данных, обеспечивающих скорость не выше 128 Кбит/с. При возможности применения высокоскоростных каналов требуется сравнить затраты на построение сети передачи данных, с одной стороны, и внедрение системы управления реструктуризацией, с другой стороны.

Литература

1. Иванов А. Ю. Обеспечение выполнения требований к информационным системам МЧС России на основе структурной адаптации распределенных баз данных // Вестник Санкт-Петербургского института ГПС МЧС России. - 2005. - № 3 (10). - С. 4146.

2. Иванов А. Ю., Хорошенький А. Н. Общий подход к разработке методики динамического управления структурой распределенной базы данных. // Модели и методы исследования информационных сетей: сб. науч. тр. - Вып. 3. - СПб.: Тема, 1999.- С. 133136.

3. Ярошевич М. Е. Адаптивное управление размещением копий элементов распределенной базы данных. - Минск, 1989.

i Надоели баннеры? Вы всегда можете отключить рекламу.