Научная статья на тему 'Технологии репликации распреленных баз данных'

Технологии репликации распреленных баз данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
104
60
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жерносекова Н.В., Вдовенко В.В.

Предлагается технологическое решение для независимой передачи данных между серверами в гетерогенных распределенных базах данных. Приведен анализ текущих основных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Технологии репликации распреленных баз данных»

Актуальные проблемы авиации и космонавтики. Информационные технологии

бы стать реализация технологии удалённой загрузки ОС, позволяющая администраторам полностью контролировать используемое на рабочем месте ПО. При этой технологии появляется возможность полностью использовать вычислительные ресурсы рабочей станции, как для центрального процессора, так и для графической подсистемы. Ввиду полного контроля ПО можно реализовать меры защиты передаваемого по сети трафика и аутентификации доступа.

Для управления такой системой необходимо создать административный модуль, который будет реа-лизовывать управление функциональными возможностями продукта. С помощью модуля пользователи, обладающие определенными правами, должны организовывать корректную работу «Сетевого университета», следить за правильностью ввода паролей, за целостностью данных пользователей и за сохранностью программного обеспечения.

Чтобы решить поставленные задачи, были спроектированы иМЬ-диаграмма прецендентов, отражающая все основные функции модуля, такие как на-

стройка безопасности системы, администрирование клиентского программного обеспечения, администрирование ресурсов пользователя, администрирование конфигураций программно-аппаратного обеспечения серверов. Так же разработана UML-диаграмма активности, которая отражает схему работы с модулем пользователя с правами «администратор». В качестве протокола контроля аутентификации был выбран OpenLDAP. Сервором баз данных будет выступать PostgreSQL. Главным преимуществом этой СУБД является то, что она является абсолютно бесплатной и может использоваться в различных ОС, как в Windows, так, к примеру, и в Linux. Язык, на котором будет разрабатываться модуль, будет PHP.

В дальнейшем планируется расширение числа пользователей с различными правами, а так же внедрение модуля в уже разрабатывающийся проект «Сетевой университет».

© Говорухина О. С., Горошкин А. Н., 2011

УДК 669.713.7

Н. В. Жерносекова Научный руководитель - В. В. Вдовенко Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ТЕХНОЛОГИИ РЕПЛИКАЦИИ РАСПРЕЛЕННЫХ БАЗ ДАННЫХ

Предлагается технологическое решение для независимой передачи данных между серверами в гетерогенных распределенных базах данных. Приведен анализ текущих основных технологий.

В гомогенной распределенной базе данных репликация может быть осуществлена штатными средствами СУБД при помощи драйверов и стандартных интерфейсов. Но если возникает необходимость связать разнородные базы данных, обойтись стандартным методом становится затруднительно. Необходима технология, позволяющая передавать данные между серверами независимо от того, какая именно СУБД установлена, какой сценарий репликации требуется использовать и на какой платформе работают СУБД.

Несмотря на разнообразие типов репликации, для решения поставленной задачи наиболее подходящими методами являются репликация на уровне сети хранения данных (SAN) и на уровне дискового пространства.

Репликация на уровне сети хранения данных базируется на новейшей технологии виртуализации доступа к данным по основному каналу (in-band) и предполагает размещение на пути между серверами и системой хранения данных посредника - специализированного устройства виртуализации. Обычно такой способ репликации не зависит от производителей систем хранения данных и ОС и не использует ресурсов серверов. К его недостаткам можно отнести невысокую пропускную способность самого устройства виртуализации и снижение общей надежности системы за счет добавления новой точки потенциального отказа.

Репликация на уровне сети хранения данных является практически идеальным вариантом для распределенных БД или кластеров active-active. На базе данного метода разработаны следующие технологические решения: серверы управления данными с ПО IPStor Enterprise, концентраторы компании StoneFly, HP CASA, IBM SAN Volume Controller.

Репликация на уровне дискового массива наиболее универсальное, производительное и надежное решение. Функции репликации на уровне дисковых массивов встроены в контроллеры дискового массива, при этом использование ресурсов серверов не предполагается. Основные ее преимущества заключаются в том, что репликация осуществляется на самом низком уровне, где реально записываются данные. Основные технологии, основанные на подобном типе репликации: технологии EMC SRDF и TimeFinder (для Symmetrix), синхронный и асинхронный MirrorView и SnapView (для CLARiiON), технологии IBMPPRC (для ESS), Remote Volume Mirror (для FAStT) и FlashCopy (для ESS и FAStT) [1].

Репликация на уровне сети хранения данных является новой технологией и предполагает наряду с приобретением системы хранения данных покупку дополнительного устройства и затраты на обучение персонала. Репликация на уровне дискового массива «привязывает» к одному производителю, тем не ме-

Секция ««Информатика и вычислительная техника»

нее, данную технологию следует использовать в Библиографическая ссылка

крупных, структурно сложных организациях. 1. Выбор технологии репликации данных. URL:

http://itc.ua/articles/vybor_tehnologii_replikacii_dannyh_ 16619 - 01.04.2011.

© Жерносекова Н. В., Вдовенко В. В., 2011

УДК 004.043

С. Н. Зинин Научный руководитель - М. Н. Фаворская Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

ИСПОЛЬЗОВАНИЕ МЕТАПРОГРАММИРОВАНИЯ ДЛЯ ЗАДАЧ КЛАССИФИКАЦИИ

ОБЪЕКТОВ ГРАФИЧЕСКОЙ СЦЕНЫ

Рассматривается подход к использованию возможностей генерации кода в задачах классификации объектов на изображении с последующим его сохранением для повторного использования.

Практически любой из подходов к распознанию образов опирается на метаданные, полученные в процессе обучения. Такие наборы данных обычно представляют собой множества чисел. В случае с нейронными сетями это весовые коэффициенты, в случае использования алгоритмов баггинга или бустинга это числа, описывающие важность голоса классификатора на полученном примере.

Любой из наборов данных о данных во внутреннем представлении играет роль величины, позволяющей найти некий минимум ошибки, который дает возможность утверждать, что одно из полученных решений с той или иной степенью вероятности является верным.

У всех вышеперечисленных подходов имеется ряд недостатков:

- невозможно оценить ошибку в значении каждого из коэффициентов;

- классификатор опирается только на свои веса;

- невозможно позволить программе подстраивать логику классификатора в лучшую сторону;

- представляется возможным только жесткое описание классифицирующей функции.

Предложенный подход с использованием технологий метакодов заключается в том, чтобы описывать классифицирующие функции по ходу исполнения процесса обучения.

Каждый из описанных классификаторов может сохранить свое тело в базе данных. Таким образом, появляется возможность создания приложения, которое экономит свою память и увеличивает свои потребно-

сти по мере необходимости. В случае постоянного использования одного и того же классификатора включается система кэширования. Классификатор можно подменить, переписать прямо по ходу выполнения программы. Появляется возможность увидеть ошибки в логике алгоритма классификации.

Настройка классификатора под параметры модели при обучении может происходить адаптивно. Например, отношение высоты человека к длине его ног практически всегда будет находиться в пределах одного интервала. Замечая статистику при обучении, программа добавляет условие на отношение в код и записывает его в базу данных.

Для увеличения скорости выполнения интерпретируемого языка предполагается использовать собственную минимальную сборку языка Ruby [1]. В целях увеличения скорости выборки, сериализации данных и их синхронизации в распределенных системах предлагается использование документно-ориентированной СУБД, сохраняющей объекты в BSON-формате (в формате бинарной сериализации) [2].

Библиографические ссылки

1. Дмитриев В. Г. Использование языка руби в повседневной жизни. М. : Физматлит, 2008.

2. Браславский Д. А., Логунов С. С. Трансляция кода С в интерпретируемых программах. 2-е изд., перераб. и доп. М. : Букинист, 2005.

© Зинин С. Н., Фаворская М. Н., 2011

i Надоели баннеры? Вы всегда можете отключить рекламу.