Научная статья на тему 'Особенности обеспечения отказоустойчивости, сохранности и доступности данных'

Особенности обеспечения отказоустойчивости, сохранности и доступности данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
442
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЗЕРВНОЕ КОПИРОВАНИЕ / RAID / КЛАСТЕРИЗАЦИЯ / РАЗГРАНИЧЕНИЕ ДОСТУПА / ХРАНИЛИЩА ДАННЫХ / BACKUP / CLUSTERING / ACCESS CONTROL / DATA STORAGE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Савин Илья Вадимович

Рассматриваются способы обеспечения отказоустойчивой работы системы, обеспечивающей сохранность и доступность данных. Предлагается использовать комплекс мер, включающих в себя организацию RAID-массива, кластеризацию, разграничение доступа и регулярное резервное копирование.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FEATURES OF ENSURING THE RELIABILITY OF STABILITY, PRESERVATION AND AVAILABILITY OF DATA

We consider wavs to ensure fault-tolerant svstem operation, ensuring the safetv and availability of data. It is proposed to use a set of measures, including the organization of a RAID arrav, clustering, access restriction and regular backups.

Текст научной работы на тему «Особенности обеспечения отказоустойчивости, сохранности и доступности данных»

УДК 004.05

ОСОБЕННОСТИ ОБЕСПЕЧЕНИЯ ОТКАЗОУСТОЙЧИВОСТИ, СОХРАННОСТИ И ДОСТУПНОСТИ ДАННЫХ

ИВ. Савин

Рассматриваются способы обеспечения отказоустойчивой работы системы, обеспечивающей сохранность и доступность данных. Предлагается использовать комплекс мер, включающих в себя организацию RAID-массива, кластеризацию, разграничение доступа и регулярное резервное копирование.

Ключевые слова: резервное копирование, RAID, кластеризация, разграничение доступа, хранилища данных.

Обеспечение сохранности и доступности данных в их неизменном виде является приоритетной задачей многих организаций в настоящее время. Объёмы информации растут ежеминутно и в дальнейшем такие проблемы будут рассматриваться ещё более серьёзно. Многие компании, сталкиваясь с проблемами утери, модификации и недоступности данных, несут значительный ущерб. Практика показывает, что подобные инциденты оцениваются не только в денежном эквиваленте. Утеря некоторых сведений может привести к прекращению деятельности организации.

Для снижения риска утраты информации до минимально возможного, обеспечения её надёжного хранения и доступности, необходимо подходить к проблеме комплексно. Комплексный подход в таких вопросах заключается в том, чтобы не только восстановить данные в случае их утраты или несанкционированной модификации, но значительно уменьшить риск воздействия на хранимую информацию, учитывая в том числе человеческий фактор и проблемы отказа оборудования.

На рис. представлена общая схема обеспечения надёжного функционирования системы хранения данных.

Схема функционирования надёжной системы хранения данных

Как видно, система с наивысшей надёжностью хранения и доступа к данным для защиты от сбоев должна предполагать:

- наличие RAID-массива;

- объединение серверов в отказоустойчивый кластер;

- организацию системы резервного копирования.

RAID-массив представляет собой массив из нескольких физических дисков, объединённых в один логический, что позволяет обеспечить избыточность, за счёт которой становится возможным повысить надёжность системы [1]. Существует несколько уровней RAID и их комбинаций, часть из них обеспечивает наибольшую производительность, другая часть - повышает надёжность, которую позволяют обеспечить следующие уровни:

- RAID 1 функционирует по принципу полного зеркалирования одного из дисков. Позволяет обеспечить быструю запись и высокую надёжность. Если один из дисков выйдет из строя, система продолжит функционировать. Однако в таком случае необходимо принимать меры для восстановления массива. Для создания массива необходима минимум пара дисков;

- RAID 5 представляет собой отказоустойчивый массив, который использует распределённое хранение данных и кодов чётности для восстановления информации в случае сбоев. Показатели надёжности ниже, чем у RAID 1, однако RAID 5 наиболее гибок и экономичен. За счёт этого он широко применяется во многих системах. В отличие от RAID 1, где объём доступного пространства равен половине объёма жёстких дисков массива, в RAID 5 избыточность обеспечивается всего лишь одним из дисков, что обеспечивает наибольшее количество доступного места по сравнению с RAID 1, а также высокую надёжность хранения данных. Для создания такого массива требуется минимум три диска. Рекомендуется использовать не менее четырёх;

- RAID 6 позволяет обеспечить большую надёжность по сравнению с RAID 5, используя для работы три диска для данных и два диска для контроля чётности. Такой уровень используется редко, во многом из-за низкой по сравнению с RAID 5 производительности и более затратным развёртыванием системы;

- RAID 10 предоставляет производительность RAID 0 и надёжность RAID 1. Архитектурно представляет собой несколько RAID 1, объединённых в один общий RAID 0. Надёжность достигается за счёт того, что массив RAID 0 выходит из строя только в случае, если выйдут из строя все накопители в массиве RAID 1. Производительность достигается за счёт возможности RAID 0 одновременно записывать и считывать данные. Для реализации такого уровня необходимо минимум четыре диска.

Чтобы не прерывать работу системы в случае выхода одного или нескольких дисков в одном из RAID-массивов, рекомендуется использовать диски горячего резерва. Они позволяют автоматически или вручную монтировать резервный диск в систему вместо вышедшего из строя, за счёт этого предоставляется возможность обслуживания системы без видимого для конечных пользователей вмешательства в её работу.

Для создания RAID необходимо наличие RAID-контроллера, который управляет работой массива. Он может быть внешним и внутренним, в зависимости от подключения: к внутренним подключаются накопители сервера, к внешним - внешние дисковые хранилища.

Наиболее важная характеристика RAID-контроллеров - их реализация. Они делятся на нескольких типов:

- программный;

- аппаратный;

- интегрированный.

Программный RAID-контроллер - представляет собой решение, позволяющее объединить несколько физических дисков в один логический при помощи программного обеспечения. Достоинство программного RAID-контроллера заключается в простоте организации при минимальных затратах. Однако в таком случае вся нагрузка по управлению RAID-массивом ложится на процессор машины, на которой функционирует RAID, что может сказаться на производительности. Кроме этого, такой способ является самым ненадёжным и не является отказоустойчивым.

Аппаратный RAID представляет собой плату расширения, которая имеет собственный процессор и кэш-память для выполнения вычислений. Аппаратные контроллеры дороже программных, но производительнее и надёжнее. Все вычисления проводятся на встроенном процессоре и встроенной кэш-памяти, что позволяет получать доступ к данным быстро. Такие контроллеры могут иметь резервное питание в виде дополнительного аккумулятора, батарейки или конденсатора, что позволяет в случае сбоев с питанием не потерять находящуюся в кэше информацию.

119

Интегрированные контроллеры распаяны на материнской плате и могут иметь встроенную кэш-память. Они быстрее, надёжнее и стабильнее программных, поддерживают больше уровней RAID, но по всем качественным параметрам уступают аппаратным. Отсутствие процессора в интегрированных RAID-контроллерах может снизить производительность системы. Интегрированные RAID-контроллеры не рекомендуется использовать в системах с 6-8 и более дисками, следует применять аппаратные решения.

Технология RAID позволяет снизить риск утраты информации и простоя системы в следствие сбоя оборудования, однако полностью от этого не защищает и в случае, если система откажет, её простой может нанести ущерб в виде потери прибыли и убытков.

При использовании кластеризации простой системы исключается практически полностью. Кластер возможно настроить таким образом, чтобы в случае выхода из строя основного сервера, нагрузка распределилась в автоматическом режиме и за считанные секунды равномерно по остальным серверам. Это не только дополнительная защита от сбоев, но и хороший инструмент для проведения профилактических работ. Что самое важное, для конечных пользователей процесс остаётся незамеченным - они по-прежнему могут обращаться к ресурсам отключаемого сервера без прерывания своей работы.

Кластеры подразделяются на несколько видов, но для обеспечения беспрерывной работы системы необходимо организовывать кластеры высокой доступности. Существует 3 основных типа кластеров высокой доступности:

- холодный резерв;

- горячий резерв;

- модульная избыточность.

Кластеры с холодным резервом функционируют следующим образом: основной узел работает с запросами пользователей, а резервный ожидает его отказа и, когда это станет необходимо, включается вместо основного в работу.

В случае с кластером с горячим резервом, все узлы работают с запросами пользователей и в случае отказа одного из них, нагрузка перераспределяется по остальным узлам. Большинство существующих кластерных технологий работают по принципу горячего резервирования.

Связка узлов в кластере с модульной избыточностью выполняет один и тот же запрос на всех входящих в неё системах, результат возвращается с любого узла. Кластер с модульной избыточностью нелегок в развёртывании, потому что главное условие его функционирования заключается в необходимости гарантировать одинаковость результатов всех узлов.

Кластеризация не обязательно подразумевает объединение физических узлов. Существует возможность программной реализации, которая позволяет организовать кластер быстрее, с наименьшими затратами и наиболее гибко им управлять. Достаточно на одной физической машине, например сервере, связать в кластер несколько виртуальных машин - система будет готова к настройке и дальнейшей работе.

Кластеризация является эффективным инструментом при обеспечении отказоустойчивости. Однако не всегда сбои происходят в следствие неисправностей оборудования. Большинство инцидентов связано с человеческим фактором. Удаление или модификация важных файлов, а также ознакомление с данными ограниченного доступа влечёт за собой большую ответственность.

Снизить риск человеческого фактора в данном случае поможет система разграничения доступа и регулярное резервное копирование. Благодаря наличию разграничения доступа к данным, те пользователи, для которых информация не предназначена, не получат к ней доступ. В зависимости от обрабатываемых данных, не всегда обязательно использовать стороннее ПО. Встроенных возможностей Microsoft Windows Server зачастую достаточно, чтобы гибко ограничивать доступ к информации. Использование системы разграничения доступа значительно снижает риск несанкционированных действий с файлами.

Не стоит исключать случаи, когда по ряду причин хранимые данные искажаются или безвозвратно исчезают. При таких обстоятельствах необходима эффективная система резервного копирования, задача которой восстановить все данные в случае их утраты [2]. Не всегда достаточно обычного копирования файлов на сторонний носитель. Во-первых, теряются настроенные права доступа. Во-вторых, такое способ резервирования ненадёжен.

Специалисты рекомендуют использовать резервное копирование по схеме 3-21. Три резервные копии, которые хранятся в двух местах, одно из которых должно располагаться за пределами здания. Использование такого подхода позволит восстановить информацию даже в случае пожара, затопления или разрушения одного из носителей резервных копий.

Схем резервного копирования множество, но основными являются следующие:

- полное;

- дифференциальное;

- инкрементальное.

В случае полного резервного копирования каждый раз создаётся полная копия данных. За ключевым преимуществом в виде создания копии всех файлов, каталогов и их атрибутов, скрываются главные недостатки. Во-первых, чтобы скопировать большой массив данных необходимо большое количество времени и ресурсов. Создание больших копий нагружает ресурсы системы и занимает значительное пространство.

При дифференциальном резервном копировании после создания первой полной копии каждый файл, изменённый с момента создания последней копии, копируется заново [3]. Каждая следующая копия содержит в себе предыдущую. В таком случае создание копии и восстановление из неё происходит быстро, экономятся ресурсы для создания копии, а также пространство.

Инкрементное резервное копирование с момента создания полной копии в дальнейшем позволяет копировать только те файлы, которые подвергались изменениям с момента создания предыдущей копии [4]. Это значительно ускоряет процесс резервного копирования, копии занимают меньше места. Главный недостаток способа - в случае утери одной из инкрементных копий, восстановить все файлы будет практически невозможно.

Рекомендуется использовать дифференциальный метод резервного копирования по следующим причинам: такие копии занимают меньше пространства относительно полного резервного копирования; в случае утраты одной из дифференциальных копий возможно полное восстановление информации из следующей сделанной копии, что невозможно при инкрементом копировании; низкое влияние на производительность.

Итак, система хранения данных должна подразумевать наличие комплекса мер, обеспечивающих надёжность, отказоустойчивость и восстановление данных в случае возникновения инцидентов. В такой комплекс необходимо включение использования технологий RAID и кластеризации, а также регулярное резервное копирование и разграничение доступа.

Построение RAID-массива необходимо для обеспечения бесперебойной работы системы в случае выхода одного или нескольких дисков. Объединение серверов в кластер позволит в случае выхода одного из них из строя перераспределить нагрузку на остальные и продолжить функционирование системы в штатном режиме без необходимости приостановления работы системы. Разграничение прав доступа снизит вероятность человеческих ошибок в процессе работы с файлами, кроме того, позволит ограничить работу с информацией лицам, для которых она не предназначена. Резервное копирование позволит, когда работа остальных систем будет нарушена, восстановить всю искаженную и утраченную информацию.

Предложенные меры не являются абсолютной гарантией от непоправимых инцидентов, однако позволяют значительно снизить риск утраты или модификации информации в системах хранения данных.

Список литературы

1. Савин И.В., Михальченко С.Н. Особенности применения технологии RAID при создании файловых хранилищ // Известия тульского государственного университета. Технические науки, 2018. Вып. 11. С. 538-542.

2. Савин И.В. Пять основных составляющих надёжности файловых хранилищ данных // Наука, техника и образование, 2018. №11 (52). С. 64-67.

3. Савин И.В. Дифференциальное резервное копирование. Преимущества и недостатки // Современные инновации, 2018. №5 (27). С. 14-16.

4. Савин И.В. Инкрементальное резервное копирование. Преимущества и недостатки // Современные инновации, 2018. №5 (27). С. 13-14.

Савин Илья Вадимович, магистрант, ne@ilyasavin.ru, Россия, Тула, Тульский государственный университет

FEATURES OF ENSURING THE RELIABILITY OF STABILITY, PRESERVATION

AND A VAILABILITY OF DA TA

I.V. Savin

We consider ways to ensure fault-tolerant system operation, ensuring the safety and availability of data. It is proposed to use a set of measures, including the organization of a RAID array, clustering, access restriction and regular backups.

Key words: backup, RAID, clustering, access control, data storage.

Savin Ilya Vadimovich, master, ne@ilyasavin. ru, Russia, Tula, Tula State University

УДК 623.54

ВЫБОР МЕТОДА АППРОКСИМАЦИИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

А.А.Испулов, Е.В.Сунцов, С.Л.Иванов, А.Ю.Трущинский

Предлагается методика выбораметода аппроксимации аэродинамических характеристик управляемого объекта с помощью программной среды численного моделирования газо- и гидродинамики ANSYSCFX. Суть методики заключается в формировании базы данных объектов исследования с помощью среды 3D-моделирования SolidWorks и проведении сравнительного анализа некоторыхметодов аппроксимации. По результатам сравнительного анализанейросетевой алгоритм является оптимальным по критерию минимального среднеквадратического отклонения и максимального коэффициента корреляции.

Ключевые слова: среда численного моделирования, сплайн-интерполяция, метод наименьших квадратов, нейронная сеть, среднеквадратическое отклонение, коэффициент корреляции

Точность решения задачи наведения управляемого объекта в намеченную область (точку) обусловлена необходимостью наличия полной информации о его аэродинамических характеристиках (АДХ), их изменениях в полете и функциональной связи их с другими параметрами [1, 2, 3]. Удовлетворение этих требований возможно за счет совершенствования научно-методического аппарата баллистического обеспечения.

122

i Надоели баннеры? Вы всегда можете отключить рекламу.