Педагогика
УДК 378.2
кандидат педагогических наук, доцент Газизов Андрей Равильевич
Федеральное государственное бюджетное образовательное учреждение высшего образования «Донской государственный технический университет» (г. Ростов-на-Дону); магистрант Селютин Виталий Викторович
Федеральное государственное бюджетное образовательное учреждение высшего образования «Донской государственный технический университет» (г. Ростов-на-Дону)
ПРОБЛЕМАТИКА ПРИМЕНЕНИЯ МЕТОДА РЕЗЕРВНОГО КОПИРОВАНИЯ ДЛЯ ЗАШИТЫ
ИНФОРМАЦИОННЫХ РЕСУРСОВ ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ ВЫСШЕГО ОБРАЗОВАНИЯ
Аннотация. В статье рассматривается проблематика применения метода резервного копирования для зашиты информационных ресурсов образовательного учреждения высшего образования Предлагаемые методы и способы резервного копирования позволят решить задачи обеспечения защиты информационных ресурсов образовательного учреждения высшего образования от утраты при нарушении целостности ресурсов в эксплуатируемой информационной системы (ИС). В том числе - позволяют обеспечить оперативную миграцию пользователей средств информационных и коммуникационных технологий (ИКТ) от одного автоматизированного рабочего места к другому при выходе из строя средств ИКТ или сегмента ИС, т.е. аварии Имеющиеся методы и способы резервного копирования, можно разделить на три вида: блочное резервное копирование, резервное копирование данных на уровне приложений, файловое резервное копирование. Средства резервного копирования являются программными и аппаратными. Показателями эффективности резервного копирования являются: окно резервного копирования, точка отката, время восстановления, актуальное время восстановления и безопасность данных. К носителям данных относят: стримеры и ленточные библиотеки, виртуальные ленты, жесткие диски, RAID-массивы.
Ключевые слова: архивирование данных, время восстановления, информационная система, информационный ресурс, методы резервного копирования, образовательное учреждение высшего образования, резервная копия, средства информационных и коммуникационных технологий, средства резервного копирования, типы носителей данных.
Annotation. The article discusses the problems of using the backup method to protect the information resources of an educational institution of higher education. The proposed methods and methods of backup will solve the problems of ensuring the protection of information resources of an educational institution of higher education from loss in case of violation of the integrity of resources in the operated information system (IS). In particular, they allow for the rapid migration of users of information and communication technologies (ICT) from one automated workplace to another in case of failure of ICT tools or an IP segment, i.e. accidents, the available backup methods and methods can be divided into three types: block backup, data backup at the application level, file backup. The backup tools are software and hardware. Backup performance indicators are: backup window, rollback point, recovery time, current recovery time and data security. Data carriers include: streamers and tape libraries, virtual tapes, hard drives, RAID arrays.
Key words: data archiving, recovery time, information system, information resource, backup methods, educational institution of higher education, backup copy, information and communication technologies, backup tools, types of data carriers.
Введение. Резервная копия (англ. Backup copy) - данные, представляющие собой частичную или полную копию исходных данных информационно системы (ИС), хранимая на отличном от ИС носителе информации и позволяющая в случае потери или разрушения основного носителя восстановить данные [1].
Резервное копирование (англ. Backup) - процесс непосредственного создания резервных копий данных, файлов, ИС и пр.
Изложение основного материала статьи. Имеющиеся методы и способы резервного копирования, применяемые для зашиты информационных ресурсов образовательного учреждения высшего образования, можно разделить на три вида: блочное резервное копирование, резервное копирование данных на уровне приложений, файловое резервное копирование [1, 2].
Методы резервного копирования:
Метод блочного резервного копирования (англ. Block-level backup) - метод, работающий непосредственно с носителем данных напрямую. То есть он функционирует, игнорируя структуру данных, особенности операционной системы, настройки и прочее. Основным плюсом данного метода является высокая скорость обработки данных и работы в целом. Однако для того, чтобы резервная копия была целостной, на время ее создания необходимо приостановить работу всех приложений. Также к недостаткам данного метода относится то, что из подобной целостной копии будет восстанавливать частные файлы [3-6].
Метод резервного копирования на уровне приложений (англ. App-level backup) также является весьма распространенным. Использование данного метода сопряжено с применением специально предусмотренного в резервируемом приложении API (от англ. Application Programming Interface - программный интерфейс приложения). В данном случае резервная копия будет представлять собой набор файлов, определяемый приложением и отражающий состояние приложения на момент создания резервной копии [3-6].
Негативным фактором при использовании данного подхода может стать несовместимость резервных копий с различными версиями приложения.
Метод файлового резервного копирования. В случае исполнения операций, связанных с резервным копированием на уровне файлов, применяется файловая система и восстановление; при этом, резервирование отдельных файлов становится достаточно простой и быстро выполнимой задачей. Однако, с масштабированием операций резервного копирования растет и их сложность, а соответственно нагрузка на систему [3-6].
Средства резервного копирования:
В настоящее время системы, осуществляющие операции резервного копирования, могут работать как программно, так и аппаратно.
Применение программных средств является более бюджетным и гибким подходом. Программные средства способны эффективно выполнять задачи резервного копирования, если информационная система соответствует требованиям к использованию приложений относительно аппаратных средств.
Рассматривая аппаратные средства для резервного копирования, следует отметить, что главной их особенностью является независимость и обособленность от основных серверных мощностей образовательного учреждения высшего образования. Применение аппаратных способов резервного копирования, а также иных аппаратных методов обеспечения
безотказной работы информационной инфраструктуры (кластеризация, горячая замена дисков) могут предъявлять особые требования к применяемому программно-аппаратному комплексу копирование [3-6].
Архивирование данных:
Учитывая специфику такого процесса, как архивирование, следует ввести корректное определение процесса архивирования данных и архива в целом; для исключения разночтения относительно архивирования и копирования информации.
Архив представляет собой файл, включающий в себя совокупность данных и служащий для упаковки данных в целях сокращения потребления дискового пространства. Если принимать архивирование (процесс создания архивов), как часть процесса резервного копирования, то возможно применение понятия - сборник данных, собираемый для долгосрочного хранения, без необходимости частого обращения. Таким образом, архивирование не является резервным копированием, но в определенных ситуациях может выступать как часть плана его реализации [7].
Архивы могут иметь разные форматы, применять различные методы сжатия данных, а также включать в себя шифрование, метаданные, контрольные суммы данных и другие свойства; при этом, в контексте резервного копирования, архивы следует разделять на активные и не активные [3-6].
Активные архивы, называемые также «горячие», представляют собой программно-аппаратный комплекс, выполняющий функции системы хранения данных в архивированном виде; архитектура которого, предполагает частое к нему обращение, а также - получение доступа к хранимой в нем информации в короткие сроки.
В свою очередь не активные архивы, называемые также «холодные», включают в себя совокупность данных, обращение к которым происходит достаточно редко. Таким образом, требования к процессу доступа к ним снижаются; также снижаются затраты на содержание данных копирование [7].
Показатели эффективности процесса резервного копирования:
Рассматривая резервное копирования с точки зрения производительности процесса, следует отметить, что существуют количественные показатели, которые отражают производительность. В список таких показателей входят: окно резервного копирования, точка отката, время восстановления, актуальное время восстановления и безопасность данных (Рисунок 1).
Окно резервного копирования - представляет собой числовую величину, отражающую количество времени, затрачиваемого системой на операцию восстановления данных из имеющийся резервной копии. Оно варьируется в зависимости от производительности системы, а также масштабов операции восстановления [5].
Рисунок 1. Показатели эффективности процесса резервного копирования
Точка отката - отражает момент времени, к которому может возвратиться система. Данная величина может зависеть от частоты создания резервной копии (каждый день, каждую неделю и пр.), а также определяется количеством хранимых резервных копий [5].
Время восстановления - величина, показывающая время, в течении которого система будет восстановлена. Подсчет ведется с момента обнаружения сбоя или иной причины, в следствие которой возникает необходимость проводить восстановление системы, до момента восстановления; учитывая при этом время, затрачиваемое на доступ к резервной копии. Таким образом, локальные резервные копии будут уменьшать время восстановления; в отличии от резервных копий, хранимых на удаленных серверах [5].
Актуальное время восстановления - эмпирический показатель, применяемый в совокупности с понятием «время восстановления», который является теоретическим. Он определяет реальное время, затрачиваемое на восстановление, и получается при проведении соответствующих тестов [5].
Data Security (от англ. безопасность данных) - условный показатель, отражающий уровень конфиденциальности и целостности резервируемой информации; предполагающий - шифрование данных, защиту от физического доступа к системам хранения и пр. [5].
Типы носителей данных:
Рассматривая аппаратную составляющую при реализации системы резервного копирования в образовательном учреждении высшего образования, следует обратить особое внимание на выбор носителей данных, которые непосредственно влияют на основные характеристики процессов, связанных с резервированием данных. В процессе развития средств информационных и коммуникационных технологий (ИКТ) - программных, программно-аппаратных и технических средства и устройств, функционирующих на базе микропроцессорной, вычислительной техники, а также современных средств и систем транслирования информации, информационного обмена, обеспечивающих операции по сбору, продуцированию, накоплению, хранению, обработке, передаче информации и возможность доступа к информационным ресурсам локальных и глобальных компьютерных сетей; появлялось множество носителей информации; при этом, цена за единицу объема информации неуклонно снижалась.
Рисунок 2. Типы носителей данных
Вместе с тем, при выборе накопителя для систем резервного копирования, важно учитывать особенности и недостатки конкретных накопителей информации, а также - выбирать технологии с оптимальными техническими характеристиками и минимальными эксплуатационными расходами.
На сегодняшний день для резервного копирования применяются следующие виды накопителей информации: ленточные библиотеки, виртуальные ленточные библиотеки, жесткие диск и RAID массивы (Рисунок 2).
Стримеры и ленточные библиотеки. Накопители на магнитной ленте; сегодняшний день - стримеры представляют собой отдельный тип носителей данных, которые принципиально отличаются от современных жестких дисков. Принцип их работы заключается в использовании технологии магнитной записи, главная особенность которых это последовательный доступ к данным хранимых на таком виде накопителях [6].
Следует отметить, что сама по себе магнитная лента и технология записи на нее - один из старейших подходов хранения информации, применяемых в ЭВМ. На сегодняшний день в основном применяется для долгосрочного хранения больших объемов данных.
Таким образом следует отметить основные преимущества использования накопителей информации на магнитной ленте:
- низкая стоимость хранения данных;
- способность хранить большие объёмы данных;
- высокая стабильность работы;
- надёжность, неприхотливость к условиям хранения носителей;
- невысокое потребление энергии.
К недостаткам стоит отнести низкую скорость доступа к произвольным данным и высокую стоимость накопителей.
Несмотря на давнее появление этой технологий, на сегодняшний день она продолжает эффективно развиваться. В основе таких технологий стоит стандарт Linear Tape-Open (LTO), разработанный в конце 20 века. При создании этого стандарта упор делался на производительность записи данных, так как запись данных на стримеры того времени могла быть очень продолжительной. С тех пор стандарт претерпел множество изменений, в ходе которых были увеличены как скорости чтения и записи данных, так и объем данных, который можно разместить на одном картридже. Первое поколение стримеров LTO было представлено в 2000 году и обладало на тот момент прорывными характеристиками, относительно других стримеров. Физическая емкость составляла 100 Гб, а максимальная скорость записи данных была до 15 Мб/с. Последним поколение LTO является стример седьмого поколения, который был официально выпущен в декабре 2017 года. Седьмое поколение позволяет записывать данные объемом до 6 Тб (и до 12 Тб при использовании технологий сжатия данных), а скорость записи может подниматься до 300 Мб/с [6].
Для записи данных в стримеры нужно помещать сами накопители данных - картриджи. Официально производить и выпускать такие картриджи могут лишь производители, подтвержденные консорциумом LTO. Картриджи бывают трех типов: чистящие картриджи (которые применяются в процессе обслуживания стримеров), перезаписываемые (RW -Rewritable) картриджи, а также картриджи типа WORM (от англ. Write One, Read Multiple) - тип картриджей, которые допускают однократную запись, но обладают высокой надежностью и отказоустойчивостью в процессе многократного чтения записанных данных. Таким образом они являются чрезвычайно полезными при возникновении необходимости долгосрочного хранения резервных копий и архивов.
Срок службы картриджей RW, при записи одной полной ленты в месяц может составлять до 20 лет, в то же время картриджи типа WORM могут служить до 30 лет.
Из-за особенностей технологии записи на магнитную ленту, срок службы перезаписываемых картриджей можно увеличить путем ограничения заполнения накопителя до 50%. Таким образом это станет эффективным решением при необходимости частого использования операций записи.
На базе стримеров строятся так называемые ленточные библиотеки. Системы такого рода могут включать в себя сотни, а иногда тысячи картриджей, которые в автоматическом режиме загружаются в устройства чтения/записи с помощью специальных устройств - автозагрузчиков. Все картриджи входящие в ленточную библиотеку имеют собственный идентификационный номер, по которым их может определять автозагрузчик. Ленточные библиотеки позволяют обеспечивать наилучшее соотношение цены и получаемого дискового пространства [6].
Виртуальные ленты. Виртуальные ленточные библиотеки (от англ. Virtual Tape Library - VTL) являются продуктом виртуализации. Они эмулируются другими накопителями данных (в основном жесткими дисками) и представляются для программного обеспечения резервного копирования в виде традиционной магнитной ленты. Главная особенность использования виртуальной ленты заключается в том, что отсутствует необходимость применения дополнительных модулей, конфигураций или обеспечения совместимости унаследования программного обеспечения.
В сравнении с традиционными физическими лентами, их виртуальная вариация обладает рядом преимуществ, в числе которых повышенная производительность однопоточных операций, а также произвольный доступ к данным на диске. Выполняемые операции резервного копирования и восстановления данных из резервных копий в свою очередь и используют характеристики произвольного доступа к диску, а в случае использования такого подхода для обеспечения работы облачных хранилищ дает ускорение проведения таких операций. Помимо этого, следует отметить, что виртуальные
ленты не требуют тех мер обслуживания, которые включают в себя традиционные физические ленточные накопители, к примеру, периодическая калибровка и очистка привода.
С программной точки зрения виртуальная ленточная библиотека включает в себя те же части и компоненты, что и физическая ленточная библиотека. Для программного обеспечения не имеет значения физическое представление того или иного устройства, важно именно программное представление. В качестве среды хранения данных могут использоваться обычные жесткие диски, и в таком случае программная эмуляция будет включать в себя базу данных со списком внутренних лент, в которой каждая лента имеет свой LUN (от англ. Logical Unit Number - это адрес дискового устройства в сетях хранения). Если возникает необходимость, то имеется возможность объединять несколько логических устройств в одну виртуальную ленту.
Автозагрузчики, которые являются обязательным элементом классических ленточных библиотек, также программно эмулируются в виртуальных ленточных библиотеках. Однако в случае с физической ленточной библиотекой, где работа этого устройства сопряжена с некоторыми задержками, в виртуальной вариации все операции производятся практически мгновенно. Вышеперечисленные преимущества позволяют ускорять процесс резервного копирования и восстановления данных.
Рассматривая использование с точки зрения установки такой системы, следует отметить, что внедрение и дальнейшее использование отличается особой простотой по сравнению с физическими ленточными библиотеками. Виртуальные ленточные библиотеки подключаются в существующую аппаратную инфраструктуру (как правило SCSI или FC, а в некоторых продуктах поддерживается и iSCSI), и после этого она в автоматическом режиме определяется сервером как одна или несколько физических ленточных библиотек с установленным количеством приводов и наборами картриджей.
Использование виртуальных ленточных библиотек дает возможность реплицировать данные на удаленную площадку, что несомненно является важным достоинством для организации, имеющей множество филиалов, так как это дает возможность организовать централизованное хранение резервных копий и данных в целом.
Также следует отметить, что большинство систем виртуальных ленточных библиотек позволяют дедуплицировать записываемые данные. Таким образом требования к объему VTL могут быть значительно снижены и как следствие будет снижена стоимость итоговой системы и ее энергопотребление.
Жесткие диски. Жесткие диски, с момента своего появления начали захватывать рынок накопителей информации. Изначально их стоимость была высока, но с тех пор и по сегодняшний день стоимость одного гигабайта информации, записанного на жесткий диск, уменьшается. Таким образом появляется возможность, и финансовая эффективность применять жесткие диски и создавать массивы из них для хранения больших объемов информации и резервных копий данных в том числе. На основе данных со статистического портала Statista с 2020 года наблюдается стремительный рост применения жестких дисков, в качестве основных накопителей данных, применяемых в корпоративном секторе, относительно традиционных ленточных библиотек. Несмотря на менее высокий срок службы жестких дисков и массивов жестких дисков, скорость их работы значительно превышает скорость работы ленточных библиотек, что и становится основным фактором роста. Помимо повышенной производительности понижаются также затраты на приобретение, обслуживание и амортизацию систем накопления данных, основанных на жестких дисках [7].
RAID-массивы. С каждым годом производительность компонентов компьютера растет с высокими темпами. Процессоры строятся на меньшем техническом процессе, увеличивается частота, количество ядер и потоков. Видеокарты оснащаются более производительными чипами. Однако основной тип накопителя - жесткий диск застыл на одной отметке в 7200 об/мин. Даже попытки производителей жестких дисков увеличить размер кэша и буфера не дает должный прирост производительности, а использование твердотельных накопителей чревато высокими затратами на приобретение таких устройств. Помимо этого, SSD-накопители обладают меньшим ресурсом, чем жесткие диски. Возможным решением этой проблемы может стать применение RAID (от англ. Redundant Array of Independent Disks - избыточный массив независимых дисков) массивов, технология которых была представлена в Калифорнийском университете в 1987 году. Там же и были определены стандартные уровни от 0 до 6.
Выводы. Предлагаемые методы и способы резервного копирования позволят решить задачи обеспечения защиты информационных ресурсов образовательного учреждения высшего образования от утраты при нарушении целостности ресурсов в эксплуатируемой ИС; а также обеспечить оперативную миграцию пользователей средств ИКТ от одного автоматизированного рабочего места к другому при выходе из строя средств ИКТ или сегмента ИС, т.е. аварии.
Литература:
1. EMC Corporation. Резервное копирование и архивирование: сайт. - 2012. - URL: http://aad.tpu.ru/practice/EMC/Module%2010-adapt.pdf (дата обращения: 20.06.2022).
2. Microsoft Docs. Выполнение дедупликации данных: сайт. - 2010. - URL: https://docs.microsoft.com/ru-ru/windows-server/storage/data-deduplication/run (дата обращения: 20.06.2022).
3. Администрирование серверов и техническая поддержка сайтов: сайт. - 2015. - URL: https://itfb.com.ua/backup/ (дата обращения: 20.06.2022).
4. Алиев, А.А. Алгоритм создания полного резервного копирования в облачных вычислениях / А.А. Алиев, Р.Б. Самедов // Вестник Бакинского Университета. Технические науки. - 2013. - С. 138-144.
5. Казаков, В.Г. Технологии и алгоритмы резервного копирования / В.Г. Казаков, С.А. Федосин. - Москва: Изд-во МГУ, 2016 (Тип. Изд-ва). - 40 с.
6. Савин, И.В. Инкрементальное резервное копирование. Преимущества и недостатки / И.В. Савин. - Иваново: Изд-во Олимп, 2018. - 80 с.
7. Таранин, С.М. Резервное копирование с хранением в базе данных. Моделирование и анализ информационных систем / С.М. Таранин. - Ярославль.: Изд-во Ярославский государственный университет, 2016. - 507 с.
8. Хабр. Описание основ криптопреобразования: сайт. - 2019. - URL: https:// habr.com/ru/post/497672/ (дата обращения: 20.06.2022).
9. Шарапов, Р.В. Аппаратные средства хранения больших объёмов данных / Р.В. Шарапов // Инженерный вестник Дона. - 2012. - № 1. - С. 90-95.