Научная статья на тему 'Оценка надежности компьютерных систем с учетом поэтапного восстановления аппаратуры и информации'

Оценка надежности компьютерных систем с учетом поэтапного восстановления аппаратуры и информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
452
107
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕР / ГОТОВНОСТЬ / ОТКАЗЫ / ВОССТАНОВЛЕНИЕ АППАРАТУРЫ / ВОССТАНОВЛЕНИЕ ИНФОРМАЦИИ / COMPUTER / PREPAREDNESS / FAILURE / RECOVERY EQUIPMENT / DATA RECOVERY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Богатырев В. А., Богатырев С. В.

Предложены модели надежности, отражающие одноэтапную процедуру восстановления процессорного оборудования и двухэтапную процедуру восстановления подсистемы памяти: аппаратуры, а затем информации (программ и данных). При восстановлении аппаратуры включенного компьютера отказы исключаются. Восстановление программного обеспечения и данных (с занесением соответствующей информации в восстановленную память) реализуется под управлением процессора, а поэтому может сопровождаться отказами аппаратуры как процессора так и памяти.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Богатырев В. А., Богатырев С. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Assessing the reliability of computer system with the account for phased recovery of the equipment and information

Models of computer system use for the system reliability assessment are proposed. The models account for a single-stage procedure of processor equipment recovery and a two-stage reconstruction procedure of memory subsystem: first the hardware and then codes and data. The restoration of software and data, followed by entering relevant information in recovered memory, is realized under control of the processor and therefore may be accompanied by equipment failures, the CPU as well as the memory; during the equipment recovering held at the idle computer, any failures are excluded.

Текст научной работы на тему «Оценка надежности компьютерных систем с учетом поэтапного восстановления аппаратуры и информации»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ

УДК 004.6

DOI: 10.17586/0021-3454-2016-59-12-975-979

ОЦЕНКА НАДЕЖНОСТИ КОМПЬЮТЕРНЫХ СИСТЕМ С УЧЕТОМ ПОЭТАПНОГО ВОССТАНОВЛЕНИЯ АППАРАТУРЫ И ИНФОРМАЦИИ

В. А. Богатырев1, С. В. Богатырев2

1Университет ИТМО, 197101, Санкт-Петербург, Россия E-mail: Vladimir.bogatyrev@gmail. com 2Компания „ Самсунг электронике ", Сеул, Корея

Предложены модели надежности, отражающие одноэтапную процедуру восстановления процессорного оборудования и двухэтапную процедуру восстановления подсистемы памяти: аппаратуры, а затем информации (программ и данных). При восстановлении аппаратуры включенного компьютера отказы исключаются. Восстановление программного обеспечения и данных (с занесением соответствующей информации в восстановленную память) реализуется под управлением процессора, а поэтому может сопровождаться отказами аппаратуры как процессора так и памяти.

Ключевые слова: компьютер, готовность, отказы, восстановление аппаратуры, восстановление информации

К компьютерным системам различного прикладного назначения предъявляются высокие требования по надежности, готовности (доступности), отказоустойчивости [1, 2], безопасности [3, 4] и производительности [5—7]. Возможность обеспечения этих требований во многом определяется организацией восстановления структуры и вычислительного процесса после отказов [1].

При обслуживании компьютерной системы следует учитывать особенности возлагаемых на нее прикладных задач [8—10] и взаимосвязи узлов системы [11, 12].

При построении моделей надежности компьютерных систем требуется учитывать особенности восстановления узлов, зависящие от реализуемых ими функций хранения или обработки информации (программ или данных). Так, при отказе процессора достаточно заменить соответствующий аппаратный модуль, а при отказе подсистемы памяти следует восстановить как аппаратуру, так и информацию (загрузка программ, их инсталляция, загрузка баз данных и др.). При построении моделей надежности следует учитывать, что восстановление сначала подсистемы памяти, а затем программного обеспечения и данных реализуется под управлением процессора, а поэтому может сопровождаться отказами как процессора, так и памяти.

Рассмотрим компьютерную систему, включающую процессорный модуль и модуль памяти. Во время простоев, связанных с восстановлением аппаратуры, отказов не происходит, а во время загрузки информации в память под управлением процессора могут отказать и процессор и модуль памяти.

Диаграмма состояний и переходов, используемая для оценки надежности компьютера, представлена на рис. 1. Случай, когда возможно раздельное восстановление модулей памяти

и процессора, соответствует рис. 1 а, а случай, когда плата, содержащая процессор и память, восстанавливается целиком, — рис. 1 б.

ч' 0 ] <-и; Ь ]

А1

Рис. 1

На рис. 1, а обозначены следующие состояния: (1,1) — исправность модуля памяти и процессора; (0,1) — отказ процессора при исправной памяти (восстановление процессора); (1,0) — отказ памяти при работоспособности процессора (восстановление аппаратуры памяти); (1,Ь) — процессор исправен, аппаратура модуля памяти восстановлена, восстанавливается информация в памяти (при участии процессора); (0,Ь) — процессор отказал, оборудование памяти работоспособно, но информация, необходимая для функционирования системы, не занесена, — происходит восстановление процессора. Интенсивность отказов процессора и модуля памяти равна и Х2, интенсивность восстановления их аппаратуры — соответственно и ц2, информации (программ и данных) — |!3.

Для случая, когда содержащая процессор и память плата восстанавливается целиком (рис. 1, б), обозначены следующие состояния: (1) — работоспособность всей платы, (0) — неработоспособность платы (процессор или модуль памяти отказали), (Ь) — оборудование платы целиком восстановлено, но информация, необходимая для реализации требуемых функций, в память не загружена. Интенсивность восстановления всей платы целиком будем считать равной ц.

Используя аппарат символьных вычислений системы МаШСаё-15, решив систему уравнений, соответствующую рис. 1, а, получим искомый коэффициент готовности компьютера:

к = Р1,1 = Ц 2^з/(А 2 + А 2 Ц 2 + Ц 2^3 + А1А2 Ц 2 + А1Ц 2Ц3К (1)

к =Р1,1, где Р11 — вероятность достижения состояния (1,1).

Заметим, что коэффициент готовности исследуемой системы с учетом этапа восстановления информации в памяти (после восстановления соответствующей аппаратуры) приближенно можно получить без использования аппарата марковских цепей:

к — кркт —

Р /И Л Л

А1А

1^2 !

1 1

V

Ц1

—+—+—

Ао Ц2 Цз

(2)

где коэффициенты готовности процессора и памяти вычисляются как

кр = АТ

1

— + ■

1 Ц1

1 1 1

-+-+ —

А2 ц2 ц3 )

В выражении (2) не учитывается возможность отказов модуля памяти и процессора во время восстановления информации, производимого под управлением процессора.

Для случая, когда содержащая процессор и память плата восстанавливается целиком, составив систему алгебраических уравнений рис. 1, б, с помощью МаШСаё-15, при К —"1 + "2 получаем коэффициент готовности системы

к2 = р.Цзу/(ь2 + + ((3 + 1.

Результаты расчетов коэффициента готовности системы по формулам (1), (2) при К1—0,00001 ч-1 и — ц2— цз—1 ч-1 приведены на рис. 2, а (кривые 1 и 2 соответственно). Расчеты позволяют судить о погрешности приближенных расчетов.

а)

к

0,99995 0,9999 0,99985 0,9998 0,99975

2

ч

ч. \

0

; Х1х10

й?х 10 9 к

-2 0,99995

-4 0,9999

-6 0,99985

-8 0,9998

-10 -5 -1 0,99975

2 /3

*

й?х10-4

3

8 Х1х10-5, ч-1

Рис. 2

Оценим надежность системы, состоящей из п компьютеров, каждый из которых выполняет функции (последовательное соединение элементов), необходимые для некоторого приложения, т.е. отказы любого компьютера недопустимы (рис. 1, в).

Решив систему уравнений, соответствующую рис. 1, в, с помощью системы МаШсаё-15, получим искомый коэффициент готовности:

к = Р\,1 = ((1(2(з)/((1(2(3 + п^2(1 + п^2(2 + пЬ2(1(2 + п^1(з(2 + пЬ2^1^3) . (3)

При приближенных расчетах можно воспользоваться моделью, учитывающей рассмотренные особенности восстановления модулей памяти (см. рис. 1, а) для одного компьютера, найти коэффициент готовности одного компьютерного узла к —Р1,1, а затем вычислить коэффициент готовности всей системы из п компьютеров:

к = ((2(3/(^2 + Ь2(2 + (2(3 + Ь1Ь2(2 + Ь1(2(3))П . (4)

Следует заметить, что расчет по выражению (4) дает нижнее приближение коэффициента готовности (а поэтому может использоваться при оценке надежности). Допускается возможность отказа узла компьютеров во время восстановления одного из них, это не происходит, когда отключено питание не функционирующих компьютеров.

Коэффициент готовности исследуемой системы можно получить без использования аппарата марковских цепей:

к = (кркш )

1 (1 у

V

2

( 2

2. Т

(3 у.

(5)

Неточность этой оценки обусловлена тем, что в формуле (5) не учитывается возможность отказов модуля памяти и процессора во время восстановления информации (это влияет на завышение результата оценки надежности). Помимо того, согласно (5), во время восстановления одного из компьютеров возможны отказы узлов других компьютеров, что в анализируемой системе не происходит (это влияет на занижение результата оценки надежности).

Рассмотрим теперь задачу оценки надежности системы из п компьютеров, выполняющих одинаковые функции (параллельное соединение элементов), когда система работоспособна при одном функционирующем компьютере. Рассматриваемый случай применим для анализа готовности компьютерных систем кластерной архитектуры [13—15], в том числе при

7

2

1

0

0

2

4

6

перераспределении запросов в кластерах и между кластерами [16—21] в распределенных ин-фокоммуникационных системах.

В отсутствие очередей на обслуживание (неограниченное обслуживание каждого компьютера) коэффициент готовности системы из n параллельно соединенных компьютеров оценим как

k = 1 - (1 - ki )п = 1 -[1 - Ц2^3 /(:+ Ь2^2 + ^2^3 + ЧЬ2^2 + ^2^3 )f .

Результаты расчетов коэффициента готовности системы, содержащей n=5 последовательно соединенных элементов, при Х1=0,00001 ч-1 и = ц2= цз=1 ч-1 приведены на рис. 2, б (кривая 1 рассчитана по формуле (3), 2 и 3 — погрешность d оценки по формулам (4) и (5), определяемым по разнице с расчетом по формуле (3)). Расчеты позволяют сделать вывод о допустимом уровне погрешности приближенных расчетов.

Предложены модели надежности программно-аппаратных комплексов, учитывающие одноэтапное восстановление процессорного оборудования и двухэтапное восстановление памяти, которое включает первоначальное восстановление аппаратуры, а затем информации (программ и данных). Предложенные модели учитывают, что при восстановлении программного обеспечения и данных под управлением процессора возможны отказы процессора и модуля памяти.

список литературы

1. Черкесов Г. Н. Надежность аппаратно-программных комплексов. СПб: Питер, 2005. 479 с.

2. Шубинский И. Б. Функциональная надежность информационных систем: методы анализа. М., 2012. 296 с.

3. Гатчин Ю. А., Жаринов И. О., Коробейников А. Г. Математические модели оценки инфраструктуры системы защиты информации на предприятии // Науч.-техн. вестн. ИТМО. 2012. № 2(78). С. 92—95.

4. Богатырев В. А. Богатырев А. В. Модель резервированного обслуживания запросов реального времени в компьютерном кластере // Информационные технологии. 2016. Т. 22, № 5. С. 348—355.

5. Богатырев В. А., Богатырев А . В. Надежность функционирования кластерных систем реального времени с фрагментацией и резервированным обслуживанием запросов // Информационные технологии. 2016. Т. 22, № 6. С. 409—416.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Tatarnikova T., Kolbanev M. Statement of a task corporate information networks interface centers structural synthesis // IEEE EUR0C0N-2009. St. Petersburg, 2009. Р. 1883—1887.

7. Алиев Т. И., Муравьева-Витковская Л. А. Приоритетные стратегии управления трафиком в мультисервисных компьютерных сетях // Изв. вузов. Приборостроение. 2011. Т. 54, № 6. С. 44—48.

8. Головкин Ю. Б., Ярцев Р. А., Газетдинова С. Г. Моделирование процессов инструментальной подготовки сервисного обслуживания на основе экспертных оценок // Изв. вузов. Приборостроение. 2014. Т. 57, № 9. С. 27—32.

9. Ojiganov A. A. The use of hamming codes in digital angle converters based on pseudo-random code scales // Measurement Techniques. 2015. Vol. 58, N 5. P. 512—519.

10. Bogatyrev V. A. An interval signal method of dynamic interrupt handling with load balancing // Automatic Control and Computer Sciences. 2000. Vol. 34, N 6. P. 51—57.

11. Bogatyrev V. A. Protocols for dynamic distribution of requests through a bus with variable logic ring for reception authority transfer // Automatic Control and Computer Sciences. 1999. Vol. 33, N 1. P. 57—63.

12. Богатырев В. А. Информационные системы и технологии. Теория надежности. М.: Изд-во „Юрайт", 2016. 318 с.

13. Богатырев В. А. Оценка надежности и оптимальное резервирование кластерных компьютерных систем // Приборы и системы. Управление, контроль, диагностика. 2006. № 10. С. 18—21.

14. Богатырев В. А. К распределению функциональных ресурсов в отказоустойчивых многомашинных вычислительных системах // Приборы и системы. Управление, контроль, диагностика. 2001. № 12. С. 1—5.

15. Богатырев В. А., Богатырев С. В. Резервированная передача данных через агрегированные каналы в сети реального времени // Изв. вузов. Приборостроение. 2016. Т. 59, № 9. С. 735—740.

16. Богатырев В. А., Богатырев А. В., Богатырев С. В. Оптимизация перераспределения нагрузки в кластерах при изменяющейся активности источников запросов // Изв. вузов. Приборостроение. 2014. Т. 57, № 4. С. 41—45.

17. Богатырев В. А. Мультипроцессорные системы с динамическим перераспределением запросов через общую магистраль // Изв. вузов. Приборостроение. 1985. № 3. С. 33—38.

18. Богатырев В. А. Надежность многоуровневой дублированной отказоустойчивой коммуникационной подсистемы // Вестн. компьютерных и информационных технологий. 2008. № 4. С. 24—32.

19. Богатырев В. А., Паршутина С. А. Модели многопутевой отказоустойчивой маршрутизации при распределении запросов через сеть // Вестн. компьютерных и информационных технологий. 2015. № 12. С. 23—28.

20. Bogatyrev V. A., Parshutina S. A. Redundant Distribution of Requests Through the Network by Transferring Them Over Multiple Paths // Communications in Computer and Information Science. 2016. Vol. 601. P. 199—207.

21. Богатырев В. А., Богатырев А. В. Оптимизация периодичности контроля защищенности компьютерных систем // Науч.-техн. вестн. информационных технологий, механики и оптики. 2015. Т. 15, № 2(96). С. 300—304.

Сведения об авторах

Владимир Анатольевич Богатырев — д-р техн. наук, профессор; Университет ИТМО; кафедра вычислительной техники; E-mail: [email protected]

Станислав Владимирович Богатырев — Компания „Самсунг", Сеул; старший инженер;

E-mail: [email protected]

Рекомендована кафедрой Поступила в редакцию

вычислительной техники 19.04.16 г.

Ссылка для цитирования: Богатырев В. А., Богатырев С. В. Оценка надежности компьютерных систем с учетом поэтапного восстановления аппаратуры и информации // Изв. вузов. Приборостроение. 2016. Т. 59, № 12. С.

975—979.

ASSESSING THE RELIABILITY OF COMPUTER SYSTEM WITH THE ACCOUNT FOR PHASED RECOVERY OF THE EQUIPMENT AND INFORMATION

V. A. Bogatyrev1, S. V. Bogatyrev2

1ITMO University, 197101, St. Petersburg, Russia E-mail: [email protected]

2 Samsung Electronics Co. Ltd., Seoul, Korea

Models of computer system use for the system reliability assessment are proposed. The models account for a single-stage procedure of processor equipment recovery and a two-stage reconstruction procedure of memory subsystem: first the hardware and then codes and data. The restoration of software and data, followed by entering relevant information in recovered memory, is realized under control of the processor and therefore may be accompanied by equipment failures, the CPU as well as the memory; during the equipment recovering held at the idle computer, any failures are excluded.

Keywords: computer, preparedness, failure, recovery equipment, data recovery

Data on authors

Vladimir A. Bogatyrev — Dr. Sci., Professor; ITMO University, Department of Computation Technologies; E-mail: [email protected] Stanislav V. Bogatyrev — Samsung Electronics Co. Ltd., Seoul; Senior Engineer;

E-mail: [email protected]

For citation: Bogatyrev V. A., Bogatyrev S. V. Assessing the reliability of computer system with the account for phased recovery of the equipment and information // Izv. vuzov. Priborostroenie. 2016. Vol. 59, N 12. P. 975—979 (in Russian).

DOI: 10.17586/0021-3454-2016-59-12-975-979

i Надоели баннеры? Вы всегда можете отключить рекламу.