Научная статья на тему 'Оценка способов повышения надежности отказоустойчивого кластера'

Оценка способов повышения надежности отказоустойчивого кластера Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
652
123
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРИЗАЦИЯ / НАДЕЖНОСТЬ / ОТКАЗОУСТОЙЧИВОСТЬ / РЕЗЕРВИРОВАНИЕ / CLUSTERING / RELIABILITY / FAILOVER / BACKUP

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Харченко Александр Сергеевич, Ручкин Владиимир Николаевич

Рассматривается вопрос построения кластеризованных систем высокой доступности а также производится сравнение способов повышения отказоустойчивости. Проведено сравнение различных способов обеспечения высокой степени отказоустойчивости. Показана целесообразность использования избыточного раздельного резервирования при построении кластеризованных систем высокой надежности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Харченко Александр Сергеевич, Ручкин Владиимир Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF THE FAILOVER CLUSTER RELIABILITY IMPROVEMENT METHODS

In this article we deal with arrangement of high availability cluster systems as well as comparison of the methods of fault-tolerance improvement. We compared several methods of providing the highest degree of fault-tolerance. We also proved the expediency of excessive separate backup during the formation of highly reliable cluster systems.

Текст научной работы на тему «Оценка способов повышения надежности отказоустойчивого кластера»

Алишер Зарифжонович Холматов, магистрант, alisher. holmatov@yandex. ru, Россия, Тула, Тульский государственный универститет

ADAPTIVE CONTROL ALGORITHM OF ELECTRIC DRIVE CONTROL

PIPELINE VALVES

V.A. Mozzhechkov, A.Z. Holmatov

An algorithm for motor control stop valves, to improve the accuracy to achieve a predeterminedforce closing the valve. Algorithm parameters are automatically adapted to the specific fixture in the process of setting up and operation of the drive. The algorithm is developed using presented in this paper the mathematical description of the drive mechanism with screw torque measurement.

Key words: electric, valves, worm gear, control algorithm, adaptive control.

Mozzhechkov Vladimir А natolevich, doctor of technical science, main engineer, vam@tula.net, Russia, Tula,JSC "ETCPrivod",

Holmatov Alisher Zarithgonovich, master, alisher. holmatov@yandex. ru, Russia, Tula, Tula State University

УДК 004.02

ОЦЕНКА СПОСОБОВ ПОВЫШЕНИЯ НАДЕЖНОСТИ ОТКАЗОУСТОЙЧИВОГО КЛАСТЕРА

А.С. Харченко, В.Н. Ручкин

Рассматривается вопрос построения кластеризованных систем высокой доступности а также производится сравнение способов повышения отказоустойчивости. Проведено сравнение различных способов обеспечения высокой степени отказоустойчивости. Показана целесообразность использования избыточного раздельного резервирования при построении кластеризованных систем высокой надежности.

Ключевые слова: кластеризация, надежность, отказоустойчивость, резервирование.

В настоящее время стремление к повышению функциональности устройств значительно опережает темпы развития и усовершенствования существующих методов повышения надежности. В такой ситуации одним из наиболее эффективных средств защиты от сбоев в работе является построение отказоустойчивых систем (fault-tolerant system). Поскольку одни-

127

ми из наиболее приоритетных направлений в развитии единого информационно-образовательного пространства (ЕИОП) являются использование современных технологий, баз и банков данных, а также резкое увеличение количества областей применения дистанционного образования[1], можно сделать вывод, что внедрение и эксплуатация отказоустойчивых кластеризованных систем, необходимых, в частности, для обеспечения работы электронных образовательных средств, является первоочередной задачей для персонала информационно-технических подразделений, обеспечивающий деятельность ЕИОП.

Исходя из сложности решаемой задач, следует указать, что для её решения необходима сложная архитектурная организация, предусматривающая сочетание централизованного управления с автономностью функциональных элементов и подсистем.

Принимая во внимание, что одной из основных характеристик информационной инфраструктуры ЕИОП является её бесперебойная работа, а также учитывая, что один из наиболее рациональных вариантов её организации - использование технологии виртуализации и, как следствие, вир-туализованных кластеров, можно прийти к выводу, что первоочередной задачей при интеграции данных технологий в единое информационно-образовательное пространство университета является обеспечение высокого уровня отказоустойчивости и организация работы в режиме высокой доступности. [2]

Теоретические исследования. Кластеризация - это реализация объединения машин, представляющаяся единым целым для операционной системы, системного программного обеспечения, прикладных программ и пользователей. Системы, организованные подобным образом имеют разделение ресурсов, высокую готовность, высокую пропускную способность, удобство обслуживания системы и масштабируемость. [3]

Методы кластеризации - это методы, решающие задачи разбиения выборок на классы эквивалентности, которая базируется на мерах сходства. В данной работе под термином «кластер» будем понимать множество близких объектов, полученное как результат решения задачи кластерного анализа.

Единое информационно-образовательное пространство (ЕИОП) -информационная структура, объединяющая информационные, информационно-вычислительные телекоммуникационные системы, сети, базы и банки данных и обеспечивающая доступ, передачу, обработку и предоставление образовательной информации широким слоям населения

Известно [4-6], что надежность - способность вычислительной аппаратуры функционировать с определенным качеством в заданный промежуток времени в реальных условиях эксплуатации при наличии технических отказов, сохраняя эксплуатационные показатели в пределах, установленных в техническом задании или технических условиях. Исходя из

данного определения, можно сделать вывод, что оценка эксплуатационной надежности ТКС должна сводиться к выяснению последствий влияния технических отказов и их маскируемости на качество ее функционирования.

Надежность аппаратуры характеризуется понятиями ремонтопригодности и отказоустойчивости.

Эксплуатация кластеров может предполагать длительную работу в режиме реального времени. При этом допускается многократное включение в работу и выключение. Возможные случаи нарушения работоспособности сопровождаются восстановлением рабочего состояния. Исходя из этого, ремонтопригодность является важным критерием надежности аппаратуры.

Ремонтопригодность характеризуется способностью кластеризованной системы к предупреждению, обнаружению и устранению отказов и неисправностей при проведении технического обслуживания и восстановительных работ.

Показателем ремонтопригодности аппаратуры узла кластера является вероятность восстановления аппаратуры за заданное время рв (г) как вероятность того, что время восстановления гъ восстановление не превзойдет заданного для этих целей времени V. рв (г) = Р{в <= г}.

Из определения видно, что она может представлять функцию распределения времени выполнения операций по восстановлению аппаратуры КС.

При разработке и последующей эксплуатации систем с повышенным значением надежности необходимо наличие решений, повышающих вероятность того, что система в момент времени X будет находиться в работоспособном состоянии. Такая вероятность называется доступностью системы.[6]

Отказоустойчивость — это свойство технической системы сохранять свою работоспособность после отказа одного или нескольких составных компонентов. Отказоустойчивость определяется количеством любых последовательных единичных отказов компонентов, после которых сохраняется работоспособность системы в целом.

Отказоустойчивость связана со следующими техническими характеристиками систем.

коэффициент готовности, который показывает, какую долю времени от общего времени службы система находится в рабочем состоянии;

надёжность системы, которая определяется, например, как вероятность отказа в единицу времени.

Показателем отказоустойчивости является абсолютная или относительная вероятность простоя. Абсолютная вероятность отражает время за год, в течение которое система будет недоступна, относительная - показы-

вает вероятность доступности в процентах.

В многокомпонентной системе повышении отказоустойчивости каждого её элемента достигается за счет улучшения каждой перечисленной характеристики.

Существуют два подхода, с помощью которых можно добиться требуемого результата. Первый — повышение надежности самих компонентов. В данном случае, отказ одного компонента не приведет к отказу всей системы. Данный вариант построения кластерной системы называют последовательным. Если все элементы в последовательном соединении работают независимо, то вероятность безотказной работы схемы кластерной системы из N элементов за промежуток времени t находится по формуле

N

P(t) = pi(t) p2(t )...Pi (t )...Pn (t) = П Pi (t) . (1)

i=l

Второй вариант — избыточное резервирование: все, или особо критичные компоненты дублируются, и при выходе из строя одного компонента - сервер продолжает использовать для работы другой, причем на работе системы в целом это никак не отражается. Данный способ характеризуется последовательным соединением узлов кластера, в котором к отказу всей системы приведет лишь отказ всех компонентов.

В данном соединении из k элементов наряду с основным элементом имеется (k-1) резервных элементов, каждый из которых может быть включен в работу или отключен при отказе. Вероятность отказа параллельного соединения

Q(t) = Я(t)q(t)...q(t)...qk(t) = П[1-q(t)], (2)

i=l

где я, (t)- вероятность отказа i-го элемента параллельного соединения.

Тогда вероятность безотказной работы параллельного соединения кластера равна

P(t)=1 -п [1 - Яi (t)]. (3)

i=1

Эта формула (3) показывает, что с увеличением числа резервных элементов надежность всей КС увеличивается.

Выделяют три способа резервирования:

общее резервирование, при котором резервируется в целом аппаратура или ее часть;

раздельное резервирование, при котором аппаратура (или ее часть) резервируется по отдельным участкам, узлам, или элементам;

скользящее резервирование, при котором резервный элемент может быть включен вместо любого из элементов, которые он предназначен резервировать.

Данные методы не являются взаимодополняющими. Любое повышение надежности автоматически приводит к удорожанию всей системы, и

поэтому главной задачей становится найти баланс между стоимостью и эффективностью. В первую очередь, необходимо оценить, к какому ущербу в денежном эквиваленте может привести отказ системы, и повышать.

При необходимости, кроме отдельных компонентов, резервирование может осуществляться на уровне целых серверов.

Для исследования наиболее рационального способа повышения надежности рассмотрим следующие соотношения. Пусть КС состоит из N последовательно соединенных элементов и с целью повышения надежности резервируется т резервными элементами. Отношение количества резервных цепей к числу основных называется кратностью резервирования.

Резервные цепи до момента их включения в работу могут быть в состоянии:

ненагруженного резерва (резервные элементы в нерабочем состоя-

нии);

нии);

нагруженного резерва (резервные элементы в рабочем состоянии); облегченного резерва (резервные элементы в облегченном состоя-

Вероятность безотказной работы при общем резервировании (резерв нагруженный) находится из условия, что отказ всей системы, включающей один основной и т резервных элементы, произойдет после независимого отказа всех (т+1) параллельных элементов. Тогда вероятность отказа Qобщ (г) системы равна:

т+1

Qобщ (г) = а,а «)..ая (г) = П Q] (О

1=1

а вероятность безотказной работы Робщ (г) системы составляет:

" общ

т+1 т+1

Робщ (г)=1 - аобщ (г)=1 - П (<)=1 - П

1=1 1=1

1 -П * (')

г=1

(4)

где (г)— вероятность отказа за время ^-го компонента резервного элемента; рг (г)— вероятность безотказной работы за время г -го компонента основного или резервного элемента.

При условии, что все (т+1) элементы в параллельном соединении обладают одинаковой надежностью, то вероятность безотказной работы равна

Робщ (г) = 1 -

1 -П * (г)

г=1

(5)

Вероятность безотказной работы при раздельном резервировании (резерв нагруженный) определяется из условия, что КС состоит из N последовательно соединенных звеньев, а каждое звено из (т+1) параллельно соединенных элементов, причем отказы звеньев элементов в звене — события независимые и поэтому вероятность определяется:

N N N

Рразд С) =П Рв, С) =П [! - ^зв, С) ] =П 1=1 ,=1 ,=1

1 -П % С)

1=1

N I т+1 I

■П]' -П [1=% (' )]г • (6)

,=1 ^ 1=1

где р1зв (г), %зв (г) — вероятность безотказной работы и отказа 1-го звена соединения соответственно; а рг] (г), ql (г)— вероятность безотказной работы

и отказа в 1-м звене _]-го элемента (основного или резервного) соответственно.

Если все (т +1) элементов в звене обладают одинаковой надежностью, то вероятность раздельного резервирования равна:

N

Рразд (О =П {1 -[1 - Р ОГ} . (7)

1=1

Сравнение формул (5) и (7) позволяет установить, что для всех значений р, (г), N и т (исключая тривиальный случай, когда р, ^) = 0 и N = 1)

величины Робщ Ц) < Рразд (<).

На основании расчетов, проведенных по указанным формулам при предположении, что надежность всех компонентов основных резервных элементов одинакова, вероятность безотказной работы системы с раздельным резервированием выше, чем вероятность безотказной работы системы с общим резервированием.

Заключение. Таким образом, в случае, когда бесперебойная работа кластеризованной информационной структуры является наиважнейшим элементом, наиболее рациональным вариантом повышения уровня её отказоустойчивости и, как следствие, надежности и доступности будет избыточное раздельное резервирование, так как отказ одного из элементов системы вызывает необходимость включения лишь одного элемента, что приводит к повышению восстанавливаемости кластерной системы.

Работа выполнена в рамках государственного задания на проведение научно-исследовательских работ Министерства образования и науки Российской Федерации на 2014-2020 годы и гранта РФФИ № 14-07-00261.

Список литературы

1. Ручкин В.Н., Фулин В.А.. Архитектура компьютерных сетей. М.: Диалог-МИФИ, 2008. 240 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Ивутин А.Н., Терехин И.С. Повышение надежности и производительности баз данных при помощи репликации // Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ, 2013. Вып. 9. Ч. 2. С. 140-144.

3. Григоренко Д.В., Ручкин В.Н. Повышение восстанавливаемости кластерных нейропроцессорных систем обработки данных // Цифровая обработка сигналов. 2013. № 1. С. 67 - 72.

4. Ларкин Е.В., Ивутин А.Н., Костомаров Д.С. Иетодика формирования сети Петри-Маркова для моделирования когнитивных технологий //

Известия ТулГУ. Технические науки. Тула: Изд-во ТулГУ, 2013. Вып. 9. Ч. 1. С. 303-311.

5. Нечипоренко В.И. Структурный анализ и методы построения надежных систем. М.: Советское Радио, 1968. 256 с.

6. Архитектура компьютерных систем и сетей: учеб.пособие / Т.П. Барановская [и др.]; под. ред. В.И. Лойко. М.: Финансы и статистика, 2003. 256 с.

7. Отказоустойчивые IT-системы // Отказоустойчивые IT-системы. 2013. URL: http://www.dacom.ru/it/20.html (дата обращения 26.08.2014).

Харченко Александр Сергеевич, асп., a.harchenkoarsu. edu.ru, Россия, Рязань, Рязанский государственный университет им. С.А. Есенина,

Ручкин Владиимир Николаевич, д-р техн. наук, проф., v.ruchkinarsu.edu.ru, Россия, Рязань, Рязанский государственный университет им. С.А. Есенина

ANALYSIS OF THE FAILOVER CLUSTER RELIABILITY IMPROVEMENT METHODS

A.S. Kharchenko, V.N. Ruchkin

In this article we deal with arrangement of high availability cluster systems as well as comparison of the methods of fault-tolerance improvement. We compared several methods of providing the highest degree of fault-tolerance. We also proved the expediency of excessive separate backup during the formation of highly reliable cluster systems.

Key words: clustering, reliability, failover, backup.

Kharchenko Alexander Sergeevich, postgraduate, a. harchenko@rsu. edu. ru, Russia, Ryazan, Ryazan State University namedfor S. Yesenin,

Ruchkin Vladimir Nikolaevich, doctor of technical science, professor, v. ruchkin@rsu. edu. ru, Russia, Ryazan, Ryazan State University namedfor S. Yesenin

i Надоели баннеры? Вы всегда можете отключить рекламу.