Научная статья на тему 'Моделирование репликации данных в корпоративной информационной системе'

Моделирование репликации данных в корпоративной информационной системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
143
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кухарев В. Н.

Кухарев В.Н. Моделирование репликации данных в корпоративной информационной системе // Изв. вузов. Сев.-Кавк. регион. Техн. науки. 2006. № 4. С. 8-12. Рассматривается модель репликации баз данных в корпоративной информационной системе с учетом особенностей ее топологии. Концептуальная модель позволяет смоделировать процесс работы пользователей с репликами базы данных в среде GPSS и получить информацию о степени загрузки ключевых серверов и времени распространения обновлений реплик данных. Представляет интерес для исследователей, ведущих работы в области имитационного моделирования. Ил. 8. Табл. 1. Библиогр. 19 назв.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Koukharev V.N. Simulation of Database Replication in the Corporate Information System // Higher School News. The North-Caucasian Region. Technical Sciences. 2006. № 4. Рp. 8-12. The model of database replication in a corporate information system is considered with provision for the features of its topology. The idea is to simulate a complex portioned corporate system, which fragments are located in a significant distance from each other that requires the account of parameters of a switching package. The conceptual model allows to analyze the process of the users' operation of a remark database in GPSS ambience. As a result of functioning the program the information on a degree of loading the key servers and the time of spreading the renovations of the remarks data was received. Considering the given results, it is possible to mind the urgency of the considered themes and the originality of the models and programs designed. The idea may be of interest for the researchers, carrying out works in the field of simulation modeling. 8 Figures. 1 Table. 19 References.

Текст научной работы на тему «Моделирование репликации данных в корпоративной информационной системе»

рассматриваемой как имеющей свойства автомодель-ности и сильного последействия, отличаются от известных на величину вводимых поправочных коэффициентов. В условиях трендовых составляющих, вносимых в рассматриваемые процессы, свойства сильного последействия у случайных процессов не утрачиваются.

Литература

1. Бутакова М.А., Гуда А.Н. Методы сбора и обработки эмпирических данных в телекоммуникационных сетях на транспорте // Телекоммуникационные и информационные технологии на транспорте России: Анн. докл. IV Междунар. науч-прак. конф. «ТелекомТранс-2006». Ростов н/Д., 2006. С. 41-42.

2. Ширяев А.Н. Вероятность. Т. 1.М., 2004.

3. Hurst H.E. Long-term storage capacity of reservoirs // Trans. Amer. Soc. Of Civil Engineers. 1951. № 116. P. 770-799.

4. Cox D.R. Long-range dependence: A review. In Statistics: An Apprasial / Ed. H.A. David, H.T. David Iowa, 1984. P. 55-74.

5. Ширяев А.Н. Основы стохастической финансовой математики. Т. 1. Факты. Модели. М., 1998.

6. Beran J. Statistics For Long-Memory Processes. Chapman and Hall, 1994.

7. Taqqu M.S. Weak convergence to fractional Brownian motion and to the Rozenblatt process // Wahrscheinlichkeitstheorie und Verw. 1975. Gebiete. № 31. S. 287-302.

8. Dobrushin R.L., Major P. Non-central limit theorems for nonlinear functionals of Gaussian fields // Wahrscheinlichkeitstheorie und Verw. 1979. Gebiete. № 50, S. 27-52.

9. Samorodnitsky G., Taqqu M.S. Stable Non-Gaussian Random Processes: Stohastic Models with Infinite Variance. Chapman and Hall; New York, 1994.

10. Whitt W. Stochastic process limits. New York, 2002.

11. Lamperti J.W. Semi-stable stochastic processes // Trans. Amer. Math. Soc. 1962. № 104. P. 62-78.

12. Duffield N. G., Massey W. A., Whitt W. A Nonstationary Offered-Load Model for Packet Networks // Sel. Proc. of the 4th INFORMS Telecomm. Conf., 1999.

Ростовский государственный университет путей сообщения 5 июля 2006 г.

УДК 004.45

МОДЕЛИРОВАНИЕ РЕПЛИКАЦИИ ДАННЫХ В КОРПОРАТИВНОМ ИНФОРМАЦИОННОЙ СИСТЕМЕ

© 2006 г. В.Н. Кухарев

Введение

При моделировании и проектировании современных информационных систем представляется актуальной задача создания оптимальной репликационной схемы базы данных. Новейшими разработками в данной области являются работы М. Дидонета, Дж. Стен-тона, С. Туту, М. Весмана, А. Шипера, М. Франка, А. Червенак, М. Кай, И. Фостера, М. Рипеани и многих других [1-19], в которых рассматриваются различные модели репликаций - адаптивные, централизованные, асинхронные и реального времени, с общей и частичной передачей реплик данных.

В данных моделях также рассматриваются различные варианты архитектур репликационных сетей, и влияние числа связей между узлами с репликами данных и числа самих узлов на скорость обработки запросов, при постоянном времени распространения обновлений (рис. 1).

Однако общим недостатком данных подходов является расчет времени распространения обновлений как постоянной величины, хотя в реальности она зависит:

1) от точки, в которой произошло обновление данных;

2) от топологии информационной системы (ИС), соответственно от числа промежуточных коммутаторов на линии связи.

Клиент С

Клиент С6

Клиент С7

Клиент С8

Рис. 1. Модель репликации баз данных

Так, например, для представленной топологии (рис. 2, 3) время распространения обновлений для узла, находящегося в центре цепи, будет минимальным (поскольку информация об обновлениях пойдет одновременно в обе стороны), а для узла, находящегося на периферии, - максимальным.

Рис. 2. Репликация для топологии шина-звезда

Рис. 3. Информационная система с топологией шина-звезда

При этом следует определить различные виды копий фрагментов БД - первичную (доступна коррекция в единственном узле), вторичную (может загружаться только для чтения) и мульти-мастерная копия фрагмента БД (первичная копия на множестве узлов).

В общем случае данное время распространения обновлений необходимо задавать некоторой функцией Е (Т, I), зависящей от топологии Т и индекса узла I, в котором произошла модификация данных.

Моделирование системы. Каждый сервер Si содержит полную копию базы данных В, включая локальный менеджер транзакций, располагающий полномочиями по коррекции базы данных. При этом гарантируется целостность локальной базы данных.

Установленный протокол репликации данных выполняется на всех серверах. Критерием целостности служит синхронизация всех копий БД в каждый момент времени. В модели также учитывается множество клиентов, индивидуально распределенное по серверам С ^ = {с!,..., с^};...;С 5п = {сг.....сШЗп } (для

выбранной схемы тиражирования учитывается един-

ство первичного и делегирующего сервера). Непосредственные механизмы разрешения конфликтов, возникающих при репликации данных, в данной статье не рассматриваются.

Модель активной репликации при учете топологии информационной системы. Данный тип репликации [16, 18] характеризуется пакетированием набора транзакций в единое сообщение и передачей его всем серверам (при этом обычно тонкий клиент контролирует процесс передачи, а сама передача на все сервера происходит с делегирующего сервера).

Рассматривая схему активной репликации (рис. 4), можно проанализировать процесс репликации: некоторый делегирующий сервер получает транзакцию от клиента, после чего транслирует ее на все сервера. Обработка транзакций происходит строго детерминированным образом, если один из серверов прервет выполнение транзакции, то и все сервера ее прервут. Альтернативным вариантом является рассылка полных транзакций по всем серверам для всех операций чтения-записи, но это существенно повышает загрузку сети для операций чтения.

I I

Ti T2 T

Рис. 4. Модель активной репликации

Учитывая топологию сети, можно выделить отрезки: [Т^Т2 ] - время передачи сообщения от пользователя к ближайшему серверу репликаций, находящемуся в местной сети (в общем случае это время менее 1 мс, из-за чего им можно пренебречь); [Т2;Т3 ] -время передачи сообщения между 1 и 2 сервером; [T3;T4] - временная разница в задержке из-за особенностей топологии ИС; [Т4;Те„а ] - время передачи уведомлений между 3 и 1 сервером; [Т1;Те„а] - полное время совершения репликации.

«Ленивая» репликация при учете топологии информационной системы. Данная схема тиражирования с акцентированием времени приведена на рис. 5. Она может нарушать глобальную целостность данных, поэтому требует дополнительной процедуры синхронизации. Транзакция, достигнув сервера с локальной базой данных, выполняется сразу, и только после этого коррекция передается на другие сервера. Преимуществом данного подхода является минимальное время синхронизации (но без учета времени на разрешение конфликтов). В данной схеме отрезки времени соответствуют передачи пакетов транзакций между отдельными узлами системы.

Для данной модели время совершения транзакции [Т1;Тепа ] будет меньше, чем для предыдущей модели, интервалы [Т3;Т4 ] и [Т3;Т5 ] будут также зависеть от топологии сети.

Параметры моделирования. Моделирование проводилось в среде ОР88. Основные параметры приведены в таблице. Моделировалась система, состоящая из множества клиентов и 3 серверов, географически удаленных друг от друга.

Время обслуживания каждого из запросов на сервере составляло 8±4 мс, время обновлений 3±2 мс. Множество клиентов генерирует запросы каждые 10±2 с. Линии связи имеют пропускную способность 100 Мб/с (при этом скорость распространения сигнала принималась равной 2/3 скорости света). Длина сообщений, отсылаемых на другие сервера, составляет 100 килобайт.

Проведем оценку задержки при передаче данных в сетях с коммутацией пакетов. Расстояние между серверами примем равным 100 км. Отсюда получаем время передачи данных по сети с коммутацией каналов, равное времени распространения сигнала (для расстояния в 100 км - 0,5 мс) плюс время передачи сообщения (8,2 мс при пропускной способности 100 Мбит/с и длине сообщения 100 Кбайт) равно 8,7мс.

Далее рассмотрим продолжение расчета для сети с коммутацией пакетов - необходимо дополнительно к указанному времени учесть задержки в промежуточных узлах. Сообщения от пользователя после обработки на местном сервере репликаций передается на другой сервер через 5 коммутаторов. Исходное сообщение разбивается на 100 пакетов по 1 килобайту.

Пусть доля служебной информации, размещенной в заголовках пакетов, по отношению к общему объему сообщения составляет 10 %, тогда дополнительная задержка, связанная с передачей заголовков пакетов, составляет 0,8 мс. Рассматривая интервал между отправкой пакетов равным 1мс, можно учесть дополнительные потери за счет интервалов в 100 мс.

Клиент С

Рис. 5. Модель «ленивой» репликации

Теперь пакетирование сообщений при передаче привело к дополнительной задержке в 100,8 мс. Также существует задержка коммутации, которую можно принять равной 15 мс, и задержка буферизации пакета, которая при пакете в 1 Кбайт и пропускной способности линии в 100 Мбит/с равна 0,08 мс.

Таким образом, общая задержка коммутаторов составит около 75,4 мс, а задержка всей сети с коммутацией пакетов составит 176,22 мс.

В качестве исходных данных по скорости обработки данных на серверах и генерации запросов к ним взяты стандартные характеристики современных процессоров [1, 2].

T

епа

4

?! ¿2 ¿3 ¿4 15 ?б ?8

Рис. 6. Модель распространения транзакции Таблица

¿](

Время

Параметры моделирования

Переменная Значение

Число серверов 3

Число клиентов 5

Время выполнения запроса на сервере (чтения или записи) 8 ± 4 мс

Пропускная способность линии связи между серверами 100 Мбит/с

Задержка на коммутаторе 15 мс

Запросы клиентов 10 ± 2 с

400

350-

300-

§ 250-

§ 200-

Oi 150

щ

100

50-

0-

При этом общая модель взаимодействия между отдельными клиентами и множеством серверов после формирования транзакции будет также учитывать особенности топологии информационной системы (рис. 6).

По результатам моделирования были сформированы зависимости загрузки серверов от конкретной точки системы, в которой произошла коррекция данных (рис. 7). Также было проанализировано время распространения обновлений в зависимости от точки коррекции данных (рис. 8).

S 0>4

п ^

е °>2 8

I 0,1

О

m

о «

1 сервер 2 сервер 3 сервер

Точка модификации БД

Рис. 7. Загрузка серверов в зависимости от местоположения точки модификации БД

! сервер 2 сервер 3 сервер

Точка модификации БД

Рис. 8. Время распространения обновлений в зависимости от точки коррекции данных

Анализируя данную диаграмму, можно отметить повышенное время на центральном узле, что связано с пересечением информационных потоков от крайних узлов. Также заметна незначительная разница в загрузке на крайних серверах для данной топологии.

Выводы. Исследован процесс конструирования оптимальной схемы репликационной сети ИС с учетом особенностей ее топологии. Результаты экспериментов показывают, что это позволяет более точно оценить потребность в установке репликационных серверов.

Важным фактором является скорость передачи информации и расстояние между серверами. Причем модель рассчитана на системы, в которых сервера находятся на значительном расстоянии друг от друга. Также следует учесть, что время выполнения индивидуальных методов синхронизации данных тоже будет зависеть от характеристик линий связи.

Таким образом, в статье приведены различные конфигурации репликационных схем, что влияет на время выполнения запросов. Кроме того, для устоявшейся шинной топологии ИС важно повышение про-

пускной способности линий связи между отдельными узлами, и высокое быстродействие устройств коммутации (в первую очередь для ускорения синхронизации в ИС со значительным числом узлов).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Agrawal R., Carey M.J., Livny M. Concurency Control

Performance Modeling: Alternatives and Implications // ACM Trans. Database Systems. 1987. Vol. 12. № 4. Р. 609-654.

2. Agrawal D., Abbadi A.E., Holliday J. The Performance of Database Replication With Group Multicast // Proc. Int'l Symp. Fault Tolerant Computing (FTCS 29). 1999. P. 158-165.

3. Amir Y., Danilov C., Miskin-Amir M, Stanton J., Tutu C. Practical Wide-Area Database Replication / Technical Report CNDS-2002-1 Johns Hopkins University. http : //www. cnds .j hu.edu/publications.

4. Amir Y., Danilov C., Miskin-Amir M., Stanton J., Tutu C. On

the Performance of Wide-Area Synchronous Database Replication / Technical Report CNDS-2002-4. November 18, 2002. http://www.cnds.jhu.edu.

5. Cai M., Chervenak A., Frank M. A Peer-to-Peer Replica Location Service Based on A Distributed Hash Table // Proceedings of the SC2004 Conference (SC2004), November 2004.

6. Chervenak A.L., Palavalli N., Bharathi S., Kesselman C., Schwartzkopf R. Performance and Scalability of a Replica Location Service // Proceedings of the International IEEE Symposium on High Performance Distributed Computing (HPDC-13), June 2004.

7. Daudjee K., Salem K. Lazy Database Replication with Freshness Guarantees // Technical Reports CS-2002-31 / University of Waterloo, Ontario, Canada, November 2002. http://www. cs.uwaterloo. ca/ research/tr/2002.

8. Didonet M. Stage report "Adaptive Replication Models" / Université de Nice Sophia Antipolis. July,1st 2003. 45p.

9. Foster I., Iamnitchi A., Ripeanu M, Chervenak A., Deelman E., Kesselman C., Hoschek W., Kunszt P., Stockinger H., Stockinger K., Tierney B. A Framework for Constructing Scalable Replica Location Services.

10. Kemme B. Database Replication for Clusters of Workstations. PhD dissertation, Swiss Federal Inst. of Technology. Zurich, Switzerland, 2000.

11. Lasaro C., Pedone F., Schmidt R. A Primary-Backup Protocol for In-Memory Database Replication // 5th IEEE International Symposium on Network Computing and Applications (NCA06). Cambridge, MA, USA, July 2006.

12. Norvag K., Sandsta O., Bratbergsengen K. Concurrency Control in Distributed Object-Oriented Database Systems // Proc. Advances in Databases and Information Systems Conf. 1997. P. 9-17.

13. Pitoura E. A Replication Schema to Support Weak Connectivity in Mobile Information Systems // 7th International Conference on Database and Expert Systems. Applications (DEXA), September 1996.

14. Preguija N, Shapiro M, Martins J.L. Automating semantics-based reconciliation for mobile databases // RENPAR'15/SympaAAA'2003.

15. Ripeanu M., Foster I. A Decentralized, Adaptive, Replica Location Service // 11th IEEE International Symposium on High Performance Distributed Computing (HPDC-11). Edinburgh, 2002. July 24-16.

16. Soundararajan G., Amza C., Goel A. Database Replication Policies for Dynamic Content Applications // EuroSys . 2006. P. 89-102.

17. Schneider F.B. Implementing Fault-Tolerant Services Using the State Machine Approach: A Tutorial // ACM Computing Surveys. 1990. Vol. 22. № 4. Р. 299-319.

18. Valduriez P., Pacitti E., Coulon C. Large-scale Experimentation with Preventive Replication in a Database Cluster // VLDB Workshop on Design, Implementation, and Deployment of Database Replication (DIDDR'05). Trondheim. 2005.

19. Wiesmann M., Schiper A. Comparison of Database Replication Techniques Based on Total Order Broadcast // IEEE Transactions on Knowledge and Data Engineering. 2005. Vol. 17. № 4, April.

Южно-Российский государственный технический университет

(Новочеркасский политехнический институт) 4 июля 2006 г.

УДК 004.9

ЛОКАЛЬНЫЕ ВЫЧИСЛИТЕЛЬНЫЕ СЕТИ НА ОСНОВЕ БЕСПРОВОДНЫХ ТЕХНОЛОГИЙ

© 2006 г. Б.П. Борисов, А.А. Палиенко, Т.Н. Шарыпова

В последнее время все большую актуальность приобретает использование беспроводных локальных вычислительных сетей - ЛВС (ШЬАЩ. Отсутствие материальной среды передачи сигнала является огромным преимуществом ШЬАЫ, так как не требует фиксированного положения узлов ЛВС, однако и создает определенные проблемы, связанные с качеством передачи, помехами и защищенностью от проникновения.

В 1997 г. был утвержден первый стандарт для WLANIEEE 802.11, который предусматривал работу в полосе 2,4 - 2,483 ГГц и два метода передачи радиосигнала с расширением спектра: метод прямой последовательности (Direct Sequence Spread Spectrum-DSSS) и метод скачущего переключения частот (Frequency Hopping Spread Spectrum—FHSS). При использовании FHSS передатчик и приемник переключаются на узкополосные несущие разной

i Надоели баннеры? Вы всегда можете отключить рекламу.