УДК 004.3
Гладков М.В.
студент 2 курса магистратуры по направлению «Управление корпоративными информационными процессами» Тольяттинский государственный университет (г. Тольятти, Россия)
АНАЛИЗ СОВРЕМЕННЫХ ТЕНДЕНЦИЙ ПОВЫШЕНИЯ НАДЁЖНОСТИ И ПРОИЗВОДИТЕЛЬНОСТИ СИСТЕМ ХРАНЕНИЯ ДАННЫХ
Аннотация: в работе произведен анализ современных тенденций развития информационных технологий в части построения отказоустойчивых систем хранения и обработки данных. Проанализированы преимущества и недостатки различных RAID массивов. Представлен сравнительный анализ наиболее используемых уровней RAID.
Ключевые слова: хранение данных, производительность, дисковый массив.
В настоящее время постоянно возрастают объемы хранимых и обрабатываемых данных в организациях различных масштабов. Прогрессируют технологии хранения. На смену привычным Н(жесткий диск) пришли SSD (твердотельный накопитель) накопители различных формфакторов.
Внедрение новых технологических решений позволило значительно повысить скорости чтения и записи данных. Вместе с тем возросли требования информационных систем к надежности и производительности систем хранения данных (СХД). С целью обеспечения надежности данных и повышения производительности СХД используется технология RAID.
Аббревиатура RAID расшифровывается как «Redundant Array of Independent Disks», т. е. «избыточный массив независимых дисков». Впервые RAID был представлен миру в далеком 1987 году, когда на свет вышла статья,
описывающая технологию объединения нескольких обычных дисков в массив для получения более быстрого и надежного накопителя [2].
Наиболее распространенные уровни RAID:
RAID 0 (striping — «чередование») — дисковый массив из двух или более жёстких дисков без резервирования. Информация разбивается на блоки данных фиксированной длины и записывается на оба/несколько дисков поочередно, то есть один блок на первый диск, а второй блок на второй диск соответственно^]. Данная реализация дискового массива является наиболее производительной в плане скорости чтения/записи, при этом наиболее уязвимой с точки зрения рисков потери данных. В СХД данный уровень применяется крайне редко из-за рисков потери всех данных при выходе из строя любого из дисков массива. При использовании данного массива отсутствуют потери дискового пространства на обеспечение резервирования данных.
RAID 1 (mirroring — «зеркалирование») — массив из двух или более дисков, являющихся полными копиями друг друга[1]. Дисковый массив имеет высокую скорость чтения и скорость записи, равную скорости записи на диск без использования массива. Зачастую применяется для обеспечения полного резервирования критичных данных в серверах. В СХД применяется редко из-за высоких затрат на реализацию. Массив обеспечивает высокую защиту данных от потерь, однако при его использовании потери дискового пространства составляют половину от общего объема.
RAID 2 - массив, основанный на использовании кода Хэмминга. Дисковый массив обеспечивает производительность выше, чем использование одного диска. Данный массив обеспечивает высокую защиту от потери данных. Его организация является целесообразной при использовании 7 и более дисков. Немногие СХД поддерживают реализацию RAID 2.
RAID 3 - массив, в котором один диск используется для контроля четности, остальные диски используются для хранения мелких блоков данных. Обеспечивает высокую скорость работы с большими файлами. Минимальное количество дисков, необходимых для организации массива, равно 3. Ввиду
необходимости хранения разрозненной информации, массив данного типа редко используется в СХД.
RAID 4 - массив похож на RAID 3, но данные разбиваются на блоки большего объема, ввиду чего увеличилась скорость работы с маленькими файлами. В системах СХД встречается редко. Наиболее известная реализация в устройствах производителя NetAPP, где массив используется совместно с внутренней файловой системой WAFL[1].
RAID 5 — массив с чередованием блоков данных и контролем чётности [1]. Массив обеспечивает высокую производительность операций чтения, при этом снижена производительность на операциях «random write». Массив достаточно экономичен в плане потери дискового пространства на обеспечение резервирования данных, однако требует пристального внимания за состоянием дисков, т.к. потеря одного диска с последующей заменой приводит к длительному восстановлению работы массива. Данный тип дискового массива получил широкое распространение в СХД и используется в системах с синхронизацией данных между несколькими СХД.
RAID 6 — массив из четырёх или более дисков с проверкой чётности, разработанный для защиты от потери данных при выходе из строя сразу двух жёстких дисков в массиве. Надежность достигается за счет снижения производительности и уменьшения емкости[1]. Реализован в большинстве СХД, применяется в системах с высокими требованиями к сохранности данных и низкими требованиями к производительности.
Для устранения недостатков производительности и сохранности данных получили распространение RAID массивы смешанного типа, которые строятся путем объединения массивов разных типов. Так популярностью пользуются RAID 10 (RAID 0 с сегментами массивов RAID 1[3]), RAID 50 (Массив RAID 0 из массивов RAID 5), RAID 60 (Массив RAID 0 из массивов RAID [3]) и др.
Сравнение основных характеристик наиболее используемых RAID массивов приведено в таблице 1 [3]
Таблица 1. Сравнение уровней RAID.
Уровень Количество дисков Эффективная емкость Допустимое количество вышедших из строя дисков Надежность Скорость чтения Скорость записи
RAID 0 от 2 S * N 0 очень низкая высокая высокая
RAID 1 от 2 S N-1 очень высокая средняя средняя
RAID 10 от 4, чётное SxN/2 от 1 до N/2 Высокая высокая высокая
RAID 5 от 3 Sx(N-1) 1 средняя высокая средняя
RAID 50 от 6, чётное Sx(N-2) от 1 до 2 средняя высокая высокая
RAID 6 от 4 Sx(N-2) 2 высокая высокая низкая или средняя
RAID 60 от 8, чётное Sx(N-4) от 2 до 4 средняя высокая средняя
N - количество дисков в массиве, S - объём наименьшего диска.
Использование RAID массивов позволяет повысить надежность хранения данных, скорость чтения/записи с минимизацией использования дополнительных дисков в массиве. При выборе типа массива следует учитывать тип хранимых данных, требования к производительности и надежности хранения.
СПИСОК ЛИТЕРАТУРЫ:
1. RAID [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/RAID;
2. Надежность превыше всего. Использование RAID-массивов [Электронный ресурс]. URL: http://lki.ru/text.php?id=4784;
3. Чеботарев В.А. СРАВНЕНИЕ УРОВНЕЙ RAID//Материалы XIII Международной студенческой научной конференции «Студенческий научный форум» URL: https://scienceforum.ru/2021/article/2018025366
Gladkov M.V.
Tolyatti State University (Tolyatti, Russia)
ANALYSIS OF CURRENT TRENDS IN IMPROVING RELIABILITY AND PERFORMANCE OF DATA STORAGE SYSTEMS
Abstract: paper analyzes current trends in the development of information technologies in terms of building fault-tolerant data storage and processing systems. The advantages and disadvantages of various RAID arrays are analyzed. A comparative analysis of the most used RAID levels is presented.
Keywords: data storage, performance, disk array.