Научная статья на тему 'Анализ надежности технологии храненния данных raid'

Анализ надежности технологии храненния данных raid Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
563
90
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
RAID / НАДЕЖНОСТЬ / ХРАНЕНИЕ ДАННЫХ / ОТКАЗОУСТОЙЧИВОСТЬ / УВЕЛИЧЕНИЕ СКОРОСТИ / RELIABILITY / DATA STORAGE / FAULT TOLERANCE / SPEED INCREASE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Исалёв А. С.

Проведен анализ надежности технологии хранения данных массивов RAID, выявлены наиболее распространённые виды, типы RAID технологии, а также их достоинства и недостатки. Рассмотрены основные параметры типов массивов RAID.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF RELIABILITY TECHNOLOGY RAID storage

The analysis of the reliability of the storage array RAID technology is given,the most common types of RAID technology are observed, as well as their advantages and disadvantages are described. The basic parameters of the RAID types are revealed.

Текст научной работы на тему «Анализ надежности технологии храненния данных raid»

УДК 004.08

АНАЛИЗ НАДЕЖНОСТИ ТЕХНОЛОГИИ ХРАНЕННИЯ ДАННЫХ RAID

А. С. Исалёв Научный руководитель - Е. Н. Бельская

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева

Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-mail: [email protected]

Проведен анализ надежности технологии хранения данных массивов RAID, выявлены наиболее распространённые виды, типы RAID технологии, а также их достоинства и недостатки. Рассмотрены основные параметры типов массивов RAID.

Ключевые слова: RAID, надежность, хранение данных, отказоустойчивость, увеличение скорости.

ANALYSIS OF RELIABILITY TECHNOLOGY RAID STORAGE

A. S. Isalev Scientific Supervisor - E. N. Belskaya

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail:[email protected]

The analysis of the reliability of the storage array RAID technology is given,the most common types of RAID technology are observed, as well as their advantages and disadvantages are described. The basic parameters of the RAID types are revealed.

Keywords: RAID, reliability, data storage, fault tolerance, speed increase.

Тема надежности хранения данных не теряет своей актуальности для различных направлений повседневной деятельности человека. В производственной сфере и сфере бизнеса проблемы обеспечения высокого уровня надежности хранения данных и быстрого их доступа имеют первостепенное значение. На сегодняшний день основные и часто востребованные данные хранятся в цифровом виде, основным носителем цифровых данных является жесткий диск или Hard Disk Drive (HDD).

Однако, HDD не обладает требуемым уровнем надежности и прогноз выхода их строя данного устройства является сложной, зачастую практически невыполнимой задачей. Согласно статистике компании «Backblaze» [1], из 13 тысяч жестких дисков за 3 года отказывают примерно от 3,1 % до 26,5 %. С целью предотвращения потери данных необходимо использовать технологии для повышения надежности систем хранения данных (СХД). Основной и наиболее используемой технологией СХД является технология RAID.

В работе проведен сравнительный анализ сведений о типах и характеристиках массивов RAID.

RAID - аббревиатура, расшифровываемая как RedundantArrayofIndependentDisks - «отказоустойчивый массив из независимых дисков». Концепция структуры, состоящей из нескольких дисков, объединенных в группу [2].

RAID-массивы увеличивают скорость или повышают безопасность данных, в зависимости от выбора конфигурации. Разные типы этих конфигураций отмечаются разными номерами: 0, 1, 2, 3, 4,5, 6, 10, и др., и, соответственно, выполняют разные функции [3].

RAID 0 (striping - «чередование») - дисковый массив из двух или более жёстких дисков без резервирования. Информация разбивается на блоки данных (Ai) фиксированной длины и записывается на оба/несколько дисков поочередно. Данный уровень обладает малой надежностью, однако производительность увеличивается почти вдвое.

Актуальные проблемы авиации и космонавтики - 2016. Том 1

RAID 1 (mirroring - «зеркалирование») - массив из двух (или более) дисков, являющихся полными копиями друг друга. Массив имеет высокую степень надежности, однако только половина ёмкости массива отводится под данные и максимальный объем массива имеет меньшее значение, по сравнению с другими уровнями.

RAID 2 - массивы данного типа основаны на использовании кода Хемминга. Диски делятся на две группы: для данных и для кодов коррекции ошибок. При данной конфигурации повышается степень надежности и скорость дисковых операций, по сравнению с производительностью одного диска, однако минимальное количество дисков при котором использование массива рентабельно равно 7.

RAID 3 - в этом массиве данные разбиваются на куски размером меньше сектора и распределяются по дискам. Ещё один диск используется для хранения блоков чётности. Данный уровень отличается от RAID 2 тем, что отсутствует возможность коррекции ошибок на лету, так же минимальное количество дисков в массиве равно трем, что в свою очередь повышает его рентабельность, по сравнению с предыдущим уровнем.

RAID 4 - похож на RAID 3, но отличается от него тем, что данные разбиваются на блоки, а не на байты. Таким образом, удалось отчасти «победить» проблему низкой скорости передачи данных небольшого объёма. Запись же производится медленно, из-за того, что чётность для блока генерируется при записи и записывается на единственный диск.

RAID 5 - Основным недостатком уровней от RAID 2 до RAID 4 является невозможность производить параллельные операции записи, так как для хранения информации о чётности используется отдельный контрольный диск. RAID 5 не имеет этого недостатка. Блоки данных и контрольные суммы циклически записываются на все диски массива, нет асимметричности конфигурации дисков.

RAID 6 - похож на RAID 5, но имеет более высокую степень надёжности - три диска данных и два диска контроля чётности. Основан на кодах Рида-Соломона и обеспечивает работоспособность после одновременного выхода из строя любых двух дисков. В виду более сложного алгоритма расчета контрольных сумм, а также необходимости читать и записывать большее количество дисковых блоков, при записи каждого блока падает производительность дисковой группы по сравнению с RAID 5 примерно на 10-15 %.

Помимо базовых уровней от RAID 0 до RAID 6, описанных в стандарте «Common RAID Disk Drive Format (DEF) standard», существуют комбинированные уровни.

Одним из наиболее популярных и востребованных массивов RAID является RAID 1+0 или RAID 10.

RAID 10 - зеркалированный массив, данные в котором записываются последовательно на несколько дисков, как в RAID 0. Эта архитектура представляет собой массив типа RAID 0, сегментами которого вместо отдельных дисков являются массивы RAID 1. Таким образом, данный массив объединяет в себе высокую отказоустойчивость и производительность, однако минимальное количество дисков в данном массиве равно 4 [4].

Принцип работы представленных массивов проиллюстрирован на рисунке.

Так же стоит отметить, что с повышением надежности, емкости и производительности повышается и стоимость RAID-массива, в основном из-за увеличения количества дисков, используемых в массиве. Сравнительные характеристики типов RAID приведены в таблице [4].

Таблица 1

Сравнительная таблица характеристик популярных типов RAID

Тип Использование емкости дисков, % Производительность Надежность Минимальное количество дисков Максимальное количество дисков

чтения записи

RAID 0 100 Высокая Высокая Низкая 2 16

RAID 1 50 Высокая Хорошая Высокая 2 2

RAID 10 50 Высокая Высокая Высокая 4 16

RAID 5 67-94 Высокая Средняя Хорошая 3 16

КАГО-массивы способны снизить процент потери данных практически до нуля или повысить производительность, в зависимости от используемого типа массива.

RAIDO RAIDI RAID 3 RAID 4 RAIDS

Основные типы конфигураций RAID

Таким образом, в результате проведенного анализа, были выяснены основные причины потери цифровых данных, рассмотрены типы массивов RAID и выяснены их достоинства и недостатки, рассмотрены основные характеристики и конфигурации популярных типов данных массивов. В зависимости от поставленной задачи и использованной конфигурации массива, RAID могут обеспечивать прирост производительности, повышение уровня надежности или же увеличение ёмкости хранилища данных, а также удовлетворять некоторым пропорциональным зависимостям параметров и характеристик, требуемых от хранилища данных.

Библиографические ссылки

1. Статистика Backblaze по 27134 накопителям за 4 года работы [Электронный ресурс]. URL: https://habrahabr.ru/post/209894/ (дата обращения: 05.03.2016).

2. RAID [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/RAID (дата обраще-ния:05.03.2016).

3. Что такое RAID-массивы и зачем они нужны? [Электронный ресурс]. URL: http://sonikelf.ru/chto-takoe-raid-massivy-i-zachem-oni-nuzhny/ (дата обращения: 05.03.2016).

4. Надежность превыше всего. Использование RAID-массивов [Электронный ресурс]. URL: http://lki.ru/text.php?id=4784 (дата обращения: 05.03.2016).

© Исалёв А. С., 2016

i Надоели баннеры? Вы всегда можете отключить рекламу.