Научная статья на тему 'Сервис информационных систем при аварийном планировании'

Сервис информационных систем при аварийном планировании Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
416
149
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
информационный сервис / передача данных / резервная копия / Information service / Data transmission / backup copy

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Аббасова Татьяна Сергеевна, Артюшенко Владимир Михайлович

Проведен анализ требований к сервисным работам, выполняемым для территориально-распределенных информационных систем, в соответствии с требованиями снижения уровней питающих напряжений и сигналов для оборудования информационных систем. Предложены мероприятия по контролю помех, аварийному планированию и обеспечению информационной безопасности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The analysis of requirements to the service works which are carried out for territorially distributed information systems is carried out; according to requirements of decrease in levels of feeding pressure and signals for the equipment of information systems, actions for the control of hindrances, emergency planning and maintenance of information safety are offered.

Текст научной работы на тему «Сервис информационных систем при аварийном планировании»

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

УДК 621.38

I СЕРВИС ИНФОРМАЦИОННЫХ СИСТЕМ ПРИ АВАРИЙНОМ I ПЛАНИРОВАНИИ

Аббасова Татьяна Сергеевна, кандидат технических наук, доцент, [email protected], Артюшенко Владимир Михайлович, доктор технических наук, профессор, [email protected] ФГОУВПО «Российский государственный университет туризма и сервиса», г. Москва

The analysis of requirements to the service works which are carried out for territorially distributed information systems is carried out; according to requirements of decrease in levels of feeding pressure and signals for the equipment of information systems, actions for the control of hindrances, emergency planning and maintenance of information safety are offered.

Проведен анализ требований к сервисным работам, выполняемым для территориально-распределенных информационных систем, в соответствии с требованиями снижения уровней питающих напряжений и сигналов для оборудования информационных систем. Предложены мероприятия по контролю помех, аварийному планированию и обеспечению информационной безопасности.

Key words: information service, data transmission, backup copy

Ключевые слова: информационный сервис, передача данных, резервная копия

С усложнением общественных отношений, глобализации систем, все чаще возникают непредвиденные случаи, имеющие катастрофический характер. Предвидеть эти случаи почти невозможно, поэтому актуальна задача разработки действий при их наступлении.

Развитие элементной базы оборудования информационных систем происходит в направлении снижения уровня питающих напряжений и информационных сигналов. Информационные сигналы могут переносить собственно информационные данные, данные аварийной сигнализации, данные, полученные в результате сбора статистики о состоянии сетевого оборудования. Может возникнуть опасность ложного срабатывания аппаратуры под воздействием различного рода помех, уровень которых соизмерим с уровнем информационного сигнала.

Исследования угроз безопасности информационных систем показали, что их можно разделить как технологические и организационные, физические и программные, преднамеренные и непреднамеренные. Однако вероятность их наступления и последствия могут сильно различаться для предприятий, работающих в разных отраслях, регионах, странах.

Статистические данные об угрозах информационной безопасности [1] свидетельствуют о том, что около 60% малых и средних предприятий по всему миру были вынуждены приостановить свой бизнес на период от 1 до 24 ч; 43% пострадавших компаний не смогли открыться вновь, а еще 29% были закрыты в течение двух следующих лет. Только 28% предприятий продолжили дальнейшую работу. Глобальный характер имели последствия после нарушения информационной безопасности и полной утраты здания с оборудованием 11 сентября 2001 года в WTC Нью-Йорка.

Для улучшения информационной безопасности предлагается совместно используемая инфраструктура центров обработки данных (ЦОД), которая обычно служит для предоставления информационных сервисов предприятиям не очень большого масштаба, которым легче арендовать вычислительные мощности у более крупной организации, чем оплачивать расходы на электропотребление и управление вычислительным оборудованием (концепция Cloud Computing). Экономическая эффективность ЦОД достигается за счет консолидации данных из разных приложений на серверном оборудовании; воз-

68 научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

Сервис информационных систем при аварийном планировании

можности вертикально или горизонтально масштабировать вычислительные ресурсы.

В настоящее время фирмами-производи-телями, в основном, предлагаются ЦОД с централизованными вычислениями [1]. Для повышения надежности эксплуатации предлагается резервировать функции основного ЦОД с помощью резервного вычислительного оборудования.

Сформулируем цель ^следования на основании [2]: разработать концепцию процесса резервирования данных и оборудования в территориально-распределенных информационных системах с применением Cloud Computing, которая в настоящее время используется только для организации совместно используемой вычислительной архитектуры.

Для современных информационных систем характерна многоуровневая архитектура (рис. 1). Эта архитектура разделяет пользовательские сервисы, прикладные сервисы и сервисы данных. Программные модули обработки данных могут выполняться на одном или нескольких отдельных серверах, они осуществляют функции сервера для интерфейсов доступа к данным (ИДД) с пользователями и функции клиента — для серверов баз данных (БД). Брокер данных служит для выдачи наиболее часто запрашиваемых с сервера данных (чтобы уменьшить трафик каналов связи между WEB-сервером, сервером безопасности и сервером БД). Между серверами приложений также может быть осуществлена взаимосвязь для того, чтобы более детально разделить системы на функциональные блоки. Преимущества системы: адаптация к Web, поскольку проще разработать html-формы для доступа пользователей к определенным функциям базы данных, чем ко всем данным; умень-

шение трафика между сервером и клиентом; упрощенная клиентская часть (универсальный браузер).

По существу, брокер данных выполняет функции резервирования сервера БД, однако его емкость существенно ниже емкости сервера БД, а при возникновении аварийной ситуации на сервере БД может потребоваться доступ к данным, которые не часто запрашиваются, и, соответственно, не размещены в брокере данных. Этим обусловлен недостаток многоуровневой архитектуры «клиент-сервер» с точки зрения аварийного планирования.

Централизованная архитектура специальных хранилищ данных ЦОД также уязвима с точки зрения аварийного планирования. Переход к децентрализованной архитектуре не решает все проблемы, потому что существует проблема обеспечения требуемого времени восстановления работы ИС после аварийных ситуаций.

Предлагаемое решение для ЦОД — балансировка вычислительных ресурсов с учетом объединения разнородных вычислительных систем в общую гетерогенную среду. Балансировка должна обеспечивать уменьшение времени восстановления после аварийных ситуаций уровня данных путем предоставления возможности быстрого переключения на дополнительную копию данных.

На современном этапе развития средств вычислительной техники требования к системе быстрого восстановления данных не более 1 часа. Новизна постановки вопроса в том, что раньше такие требования не предъявлялись [1]. В данном случае технологии метакомпьютинга будут использоваться не только для программируемых распределенных вычислений в математически однородном поле

Рис. 1. Многоуровневая архитектура

69

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

компьютерной информации, но и для передачи обслуживания в момент наступления аварийного события и вогетановления ключевых сервисов за время не более 1 часа (особо важных ключевых сервисов — 0,5 часа).

Структурная схема организации основного и резервного ЦОД представлена на рис. 2.

На рис. 2 приняты следующие обозначения: СБЭ — система бесперебойного электроснабжения; СВК — система вентиляции и кондиционирования; СОП — система обнаружения пожара; КСБ — комплексная система безопасности; СКС — структурированная кабельная сеть. Web-узел отображает информацию о компании после аварии, в том числе при наихудшем варианте сценария — утрате здания основного офиса и оборудования. Если информационная система основного ЦОД работает нормально, то с помощью вычислительных мощностей резервного ЦОД осуществляется удаленная диагностика оборудования

основного ЦОД и магистральных каналов связи между центрами. Основные и резервные каналы целесообразно выполнить с помощью волоконно-оптических линий связи (ВОЛС), так как на современном этапе развития средств вычислительной техники они являются наиболее высокоскоростной средой передачи.

С помощью распределенной системы ме-такомптинга осуществляется балансировка вычислительной нагрузки, которая перераспределяет потоки информации с учетом аварийных узлов (каналов) в сети.

Теоретические исследования в этом направлении были проведены в ЗАО «Вест Колл» (Москва) и «SCS» (Франкфурт на Майне) под руководством автора. Были оформлены соответствующие акты о внедрении.

Предложены следующие рекомендации для разработки концепции резервирования ЦОД. В общем случае может быть несколько основных и резервных ЦОД. Возможны следу-

резервныеканалы

Рис. 2. Принцип построения основного и резервного центров обработки данных

70 научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

Сервис информационных систем при аварийном планировании

ющие схемы взаимодействия между основным и резервным ЦОД. Резервный ЦОД может обслуживать несколько основных ЦОД, наиболее важные функции основного ЦОД могут быть продублированы в нескольких резервных ЦОД. Вычислительные мощности резервного центра (резервных центров) могут принадлежать распределенной метакомпьютерной системе. Очевидно, что емкость резервного ЦОД для хранения приложений и данных ограничена экономическими соображениями и скоростью доступа к файлам данных. Для хранения реже используемых частей приложений и файлов данных, не помещающихся в резервном ЦОД, а также для передачи всех операций по обработке данных в момент наступления аварийного события предназначена распределенная метакомпьютерная система. Она по мере необходимости перемещает данные в ЦОД (для их использования приложениями) и обратно (для освобождения места для новых данных).

Рассмотрим действия при наступлении аварийных ситуаций. При организации аварийного планирования в ЦОД [3] должны учитываться одиночные, постепенные, внезапные отказы оборудования внутри ИС, а также выход из строя всего комплекса оборудования, размещенного на основной площадке. С учетом повышения требований безопасности к функционированию телекоммуникационного оборудования при разработке аварийного генерального плана следует ориентироваться на наихудший сценарий — полную утрату здания с оборудованием в результате любой из чрезвычайных ситуаций. В настоящее время план должен предусматривать услуги DRS (от англ. Disaster Recovery Services — услуги по восстановлению критически важных бизнес-процессов клиента в случае катастрофы) под управлением специального центра DRC (от англ. Disaster Recovery Center — центр восстановления критически важных бизнес-процессов клиента в случае катастрофы), оснащенного самыми современными средствами обеспечения физической и информационной безопасности. Оцениваются следующие параметры [1, 3]:

• RTO (от англ. Recovery Time Objectives) — требования к срокам восстановления деятельности;

• MOR (от англ. Minimum Operating Requirements) — минимальные операционные требования для восстановления деятельности;

• RPO (от англ. Recovery Point Objective) — требования к объемам восстановленных данных.

Эти параметры задаются в соответствии с требованиями к системе быстрого восстановления данных и работоспособности ключевых сервисов работоспособности информационных систем:

• время восстановления работоспособности информационных систем на современном этапе развития средств вычислительной техники не более 1 часа с минимальными потерями данных или без потерь;

• соответствие минимальных операционных требований для резервного копирования и тиражирования баз данных MS SQL, файловых серверов, почтовых сервисов и специализированного финансового ПО (программного обеспечения);

• объем тиражируемых приложений достигает сотен гигабайт и терабайт (типичный размер избыточной резервной копии доходит до 1 терабайта);

• система должна быть сертифицирована по стандарту ISO 9001.

Резервирование данных (в электронном виде) — это доставка в центр, хранение, постоянное обновление, восстановление на территории DRC корпоративных данных клиента и незамедлительное предоставление доступа к ним в момент наступления аварийного события. Услуги DRS подразумевают создание резервного ЦОД (его также часто называют «резервный офис»).

План реагирования на катастрофы различной степени сложности (входящего в аварийное планирование), должен составляться с учетом данных табл. 1 [3]. По времени простоя принято классифицировать информационные системы в европейских странах.

Способы по устранению последствий чрезвычайных ситуаций в информационных системах:

1) стратегия резервного копирования данных;

2) резервирование источника бесперебойного питания (ИБП) и оборудования;

3) мониторинг (установка приборов и программ оповещения о состоянии сетевых элементов);

4) подробные списки (оборудования, приложений, поставщиков, заказчиков);

5) схема сети;

6) связь с удаленным резервным офисом при аварии;

71

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

Классификация уровней аварийных ситуаций

Таблица 1

Номер уровня Время простоя, час Типичные причины Доступность территории предприятия Последствия для предприятия

1 j Отказ одной или нескольких рабочих станций Да Включение для работы части вычислительных мощностей удаленного резервного офиса

2 j Неполадки сервера, сетевого оборудования и структурированной кабельной системы, кратковременное отключение электроэнергии, атака хакеров Да Сбои, самопроизвольное отключение или перезапуск устройств, выход из строя устройств, включение для работы части вычислительных мощностей удаленного резервного офиса

3 j Авария производственного масштаба (затопление, длительное отключение энергии) Нет Эвакуация части сотрудников и оборудования во временный офис, включение для работы части вычислительных мощностей удаленного резервного офиса. Замена части оборудования после удаления последствий аварии.

4 > 72 Террористический акт или стихийное бедствие (пожар, наводнение, цунами, землетрясение, война) Нет Эвакуация всех сотрудников и оборудования во временный офис, включение для работы удаленного резервного офиса. Замена оборудования.

7) назначение координатора по послеаварийному восстановлению, распределение сотрудников по группам восстановления;

8) построение Web-узла для отображения информации о компании после катастрофы;

9) обеспечение электромагнитной совместимости каналов связи.

Стратегия резервного копирования данных позволяет сделать полные резервные копии всех важных серверов и данных.

С помощью мониторинга системы осуществляется наблюдение дисковых систем, процессоров, оперативной памяти. Для мониторинга используются утилиты Performance Monitor, информация собирается ежедневно и объединяется в еженедельные отчеты. Оповещение о критических событиях (остановка и перезапуск сервисов, угроза исчерпания дискового пространства, переполнение очереди памяти и т. д.) происходит в режиме реального времени. По итогам мониторинга осуществляется разработка технических решений для реконфигурации сетевого оборудования или сжатия данных, что позволит повысить пропускную способность отдельных каналов связи, снизить объем трафика, сократить сбои драйверов.

Подробные списки подразумевают документирование оборудования, структуры сети, приложений, технических и деловых процедур. При построении схемы общей сети необходимо разработать детальные диаграммы

сетей в организации (физическая разводка сети). Необходимо наличие удаленного резервного офиса не только на случай аварии, но и для проведения диагностических работ основного офиса с помощью средств удаленного мониторинга, находящихся в резервном офисе (в ряде стран Европы это решение принято на правительственном уровне).

Зеркальная копия Web-узла должна находиться в удаленном резервном офисе. Необходимо также тестирование плана восстановления не реже одного раза в год.

В связи с требованиями к увеличению пропускной способности ЦОД до 10 Гбит/с [3...6] и, соответственно, повышением частоты передачи от 250 МГц и выше (до 1000 МГц) необходимо обеспечить электромагнитную совместимость (ЭМС) оборудования и каналов связи. До настоящего времени для обеспечения заданной пропускной способности в каналах связи горизонтальных кабельных подсистем предлагались решения на основе оптических кабелей. Но поскольку можно ограничить длину каналов связи горизонтальной подсистемы уже на архитектурной фазе проектирования (до 100 и до 55 метров), то предлагается использовать оптимизированные с точки зрения электромагнитных помех конструкции электрического кабеля «витая пара». Несмотря на навязчивую рекламу ведущих фирм-производителей оптоволоконных решений, которые, кроме большой стоимости, требуют

72

научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

Сервис информационных систем при аварийном планировании

Кат. 6UTP Кат. 6AUTP Кат. 6AFTP Кат. 7STP

Рис. 3. Ослабление внешних электромагнитных полей кабелями различных категорий

специальных мер по технике безопасности при монтаже, мы пойдем другим путем.

Наиболее простой и эффективный метод уменьшения в электрических кабелях межкабельных переходных наводок, оказывающих основное воздействие в диапазоне частот 300...1000 МГц, — использование экранированных кабельных систем. Они не только уменьшают уровень межкабельных переходных наводок (помех), но и значительно улучшают ЭМС любой кабельной линии. В Германии и Франции так и сделали. США не спешит переходить к экранированным системам из-за необходимости менять не только кабели, но и согласующее оборудование (коннекторы, разъемы и т. п.).

Экспериментальные данные, представленные на рис. 3, получены в «SCS» (Франкфурт-

на-Майне). Работы проводились под руководством одного из авторов статьи. Из представленных на рис. 3 диаграмм видно, что экранирование витых пар значительно снижает уровень шумов в кабельных линиях [4, 5]. Способность лучших образцов экранированных FTP (от англ. Foiled Twisted Pair — витая пара, заключенная в общий экран из фольги и неэкранированных) и неэкранированных UTP (от англ. Unshielded Twisted Pair — неэкранированная витая пара) кабельных линий, заявленных на рынке как соответствующие спецификациям линии Class EA (500 МГц), ослаблять наводки из соседних кабелей PSANEXT (от англ. Power Sum Alien Near End Crosstalk — суммарные межкомпонентные перекрестные наводки на ближнем конце) иллюстрируют графики, представленные на рис. 4 [6].

а — экранированной кабельной FTP-системой;

73

ИНФОРМАЦИОННЫЕ СИСТЕМЫ В СЕРВИСЕ

б — неэкранированной кабельной UTP-системой

Из представленных на рис. 4 графиков видно, что неэкранированная кабельная линия почти не имеет запаса по параметру PSANEXT, а на верхних частотах вообще превышает предельно допустимый уровень (на рис. 4 б граничное значение параметра PSANEXT обозначено верхней линией). Экранированная кабельная линия, в отличие от неэкранированной, практически во всем диапазоне частот имеет запас по параметру PSANEXT превышающий 20 дБ. Однако в полосе частот 250...400 МГц можно использовать менее дорогие неэкранированные конструкции кабеля «витая пара» категории 6а (поскольку она в соответствии с результатами экспериментальных исследований (рис. 3) ослабляет внешние электромагнитные

Литература

поля на 8 дБ больше, чем неэкранированные конструкции кабеля «витая пара» категории 6).

Таким образом, при разработке мероприятий по сервису информационных систем необходимо в первую очередь предусмотреть обеспечение электромагнитной совместимости оборудования для снижения риска сбоя аппаратуры и программного обеспечения, нештатных ситуаций, аварий. Разработана структурная схема концепции основного и резервного офиса с учетом требований к срокам восстановления данных. Описан перечень мероприятий по устранению последствий чрезвычайных ситуаций в информационных системах в зависимости от классификации аварийных ситуаций, разработанной автором.

1. Артюшенко В. М., Аббасова Т. С. Катастрофоустойчивость телекоммуникационных систем // Материалы 8-ой Межвузовской научн.-техн. конф. «Современные средства управления бытовой техникой». М.: МГУС, 2007. С. 111-114.

2. Симонов В. П. Моделирование и оценка качества научно-исследовательской работы в образовательных системах. Учебно-методическое пособие для системы высшего и профессионального образования. М.: УЦ «Перспектива», 2010, 92 с.

3. Аббасова Т. СНикифоров А. Г. Аварийное планирование при обработке данных в электротехнических системах (статья) // Электротехнические и информационные комплексы и системы. 2007. № 2. Т. 3. С. 23-27.

4. Артюшенко В. М. Анализ взаимного влияния кабельных линий в электротехнических системах // Электротехнические и информационные комплексы и системы. 2006. № 2. Т. 2. С. 8-11.

5. Воловодов А.А. Европейская директива электромагнитной совместимости // Сети и системы связи. 1997. № 10. С. 30; № 12. С. 48.

6. Енютин К. А. Защита мультимедийных кабельных систем от внешних электромагнитных воздействий // Электротехнические и информационные комплексы и системы. 2006. № 2, Т. 2. С. 8-11.

7. Аббасова Т. С., Артюшенко В. М. Методы инсталляции и проектирования электрических кабельных линий в 10-гигабитных системах связи // Электротехнические и информационные комплексы и системы. 2009. № 2. Т. 5, 2009. С. 8-16.

74 научный журнал ВЕСТНИК АССОЦИАЦИИ ВУЗОВ ТУРИЗМА И СЕРВИСА 2010 / № 4

i Надоели баннеры? Вы всегда можете отключить рекламу.