Методы оптимального управления ресурсом при проведении работ по повышению надежности ведомственной информационной инфраструктуры
Е.Г. Царъкова
Научно-исследовательский институт Федеральной службы исполнения наказаний,
Москва
Аннотация: В работе рассматривается процесс проведения работ по ремонту и обслуживанию серверного оборудования, используемого для формирования ведомственной информационной инфраструктуры. Процесс осуществления ремонтных работ множества серверов описан с применением теории массового обслуживания. Сформулирована задача оптимального управления надежностью серверного оборудования с учетом наличия ограничений на используемые ресурсы. Получены необходимые условия оптимальности в поставленной задаче в форме принципа максимума Понтрягина. Приведена краевая задача принципа максимума. В целях получения алгоритма построения приближенного решения градиентными методами задача сведена к дискретной задаче оптимального управления, для решения которой доступен широкий спектр численных методов.
Ключевые слова: информационная инфраструктура, серверное оборудование, надежность, оптимальное управление, необходимые условия оптимальности, принцип максимума.
В современных условиях роста уровня криминогенных и террористических угроз увеличивается роль работы правоохранительных органов в их предотвращении. В силу повсеместного внедрения информационно-телекоммуникационных технологий в деятельность уголовно-исполнительной системы Российской Федерации, исправность серверного оборудования становится важным фактором своевременного реагирования на инциденты безопасности, обеспечивающим возможность их своевременного устранения [1]. Проведение мероприятий по обеспечению бесперебойной работы серверов служит своевременному устранению возникающих технических неполадок, а также продлению срока службы серверного оборудования. При этом ключевую роль играет выполнение работ по ремонту оборудования, тогда, когда сервер не может работать в штатном режиме [2]. Для проведения ремонтных работ в таких случаях возможна
трехэтапная схема: отключение и замена неисправного оборудования выполняется оперативно-выездной бригадой, далее диагностика неисправности и восстановительные работы проводятся сервисной службой. В условиях необходимости обеспечения высокого уровня работоспособности серверного оборудования в составе ведомственной информационной инфраструктуры, с одной стороны, и ограниченностью ресурсов, которые могут быть направлены на проведение ремонтных работ, с другой стороны, возникает задача по выработке стратегии управления, обеспечивающей сохранение высокого уровня надежности серверного оборудования в рамках имеющихся ресурсов [3]. Разработка эффективных методов решения указанной задачи является актуальным и практически значимым направлением исследований.
Схема управления надежностью серверного оборудования может быть описана многофазной системой массового обслуживания (СМО) с тремя фазами: отключение, диагностика, ремонт (рис. 1).
{
Обслуживающая система
Входной
поток
V
Фаза
Фаза 2
Фаза 3
Выходной
поток
У
Рис. 1. - Схема проведения работ при возникновении неисправности сервера
Для описания состояния фаз рассматриваемой СМО в каждый момент времени может быть использована следующая совокупность состояний: «готовность к обработке заявки» (для обозначения вводится символ 0), «обработка текущей заявки» (для обозначения используется символ 1), «фаза заблокирована» (обозначается символом Ь) [4, 5]. Обозначим состояние первой фазы через индекс /, для описания второй фазы используем индекс у, состояние третьей фазы обозначим индексом к. Приходим к множеству всех состояний трехфазной СМО, описываемому соотношением (1):
и
^г'ь " |(и,0),(ь,1,0),(1, ь,1),(ь, ь,1),(ь,1,1),(0, ъ,1) у
Полагаем, что осуществляется работа по обслуживанию входного потока требований, имеющего пуассоновское распределение, обслуживание заявок в каждой фазе имеет экспоненциальный закон распределения.
Обозначим через (г) значение вероятности нахождения
рассматриваемой СМО в состоянии (г, у, к) в момент времени I. С
использованием системы уравнений Колмогорова для марковских процессов с непрерывным временем и дискретным множеством состояний получаем следующую модель, описывающую динамику процесса работы рассматриваемой СМО в течение заданного периода времени [0, т ]:
Ф000(')_ « , „„ аРю0(г)
= -ЛР000(г) + НР00! (г), —-— = ЛР000 (г) - ирш (г) + ИР101 (г),
аг
= ИР100 (г) - (Л + Я) Р010 (г) + ИР011(г) ,
аг аг
аР010(г )
аг
^^) = ИР010 (г) - (Л + и) Р001(г) + ИР0Ы (г)
(2)
аР101(г )
аг
аР011(г ) аг
= АР001(г) - 2ИРш(г) + ИР110 (г) + ИРш(г):
= ¿Р101(г) - (Л + 2и)Р011(г) + ИРью(г) + ИРьы(г),
= ^Р0П(г) - 3иРш(г), ^^^ = ^^010 (г) + иРш(г) - 2иР„0(г), аг аг
аРьт(г) = (г) - 10 (г) + ИРъ 11 (г), аРт(г) = АРш (г) - 2ИР»1 (г) + 1 (г), аг аг
аРьь1(г) „ аРьи(г)
= ИРш(0 - ИРьь1(г) + НРьп(г), —1- = ИР111(г) - 2ИРьи(г) :
аг
= ИР011(г) -(Л + и) Р0ь1(г), г е [0, т].
аг аг
аР0Ы(г )
аг
В системе (2) величина X обозначает значение интенсивности поступления заявок, л - значение интенсивности обслуживания заявок в каждой из фаз, [0, Т ] - рассматриваемый временной интервал.
В работе [6] рассматриваются управляемые системы массового обслуживания, в которых управление СМО может быть реализовано, в том числе, за счет контроля и изменения дисциплины обслуживания заявок в фазах обслуживающей системы, при этом, соответственно, увеличение интенсивности обслуживания требований приводит к росту привлекаемых ресурсов. Рассмотрение системы управления ремонтами в качестве управляемой СМО, работающей в условиях ограниченности ресурсов, приводит к постановке Парето-оптимальной задачи управления, решение которой служит поддержанию заданного уровня надежности серверного оборудования с учетом объема имеющихся ресурсов. Учитываем в качестве управляющего параметра величину интенсивности обслуживания заявок в каждой фазе, равную л, полагая, что л может изменяться на временном отрезке [0,Т ], в том числе, за счет использования дополнительных ресурсов [7, 8]. Вводим обозначение: и(г) = ¡(7),г е [0,Т]. Обозначим далее:
Х1() = Р000(г) , Х2() = Р100(г) , Х3() = Р010(г) , Х4() = Р001(г) , Х5() = Рш ^) , Х6() = Ро11() , Х7() = Рш(0 , Х8 (г) = Рш(0 , Х9 (г) = Ръ10() , Х10() = Р1Ь1(г) , Х11() = РъЫ(г) , Х12() = Ръ11(г) ,
Хз(г) = Р0Ъ1(г),г е[0,Т].
Получим следующую систему уравнений для описания динамики
работы рассматриваемой СМО:
• •
Х (г) = —Хх1 (г) + и(г) х4 (г), х2 (г) = Лх1 (г)—и(г) ( х2 (г)—х5 (г)), • •
х3 (г) = и(г) х2 (г) —(Х + и(г)) х3 (г) + и(г) х6 (г), х4 (г) = и(г) х3 (г)—(Х + и(г)) х4 (г) + и(г) х13 (г),
Х5 (г) = Хх4 (г)—и(г) (2x5 (г)—Х8 (г)—хш (г)), (3)
и
x6 (t ) = Ах5 (t ) — (Л + 2u(t ) ) x6 (t ) + u(t ) ( x (t ) + xn (t ) ), • •
x1 (t) = Âx6 (t) — 3u(t)x7 (t) , x (t) = Лx (t) + u(t) (x1 (t) — 2xH (t)), • •
x9 (t) = u(t) (x8 (t) — x9 (t) + x12 (t)) , x10 (t) = Л (x7 (t) + x13 (t)) — 2u(t)x10 (t) , • •
x11(t) = u(t) (x10 (t) — x11(t) + x12 (t)) , xi2 (t) = u(t) (x7 (t) - 2x12 (t)) ,
x13 (t) = u(t)x6 (t) — (Л + u(t)) x13 (t), t g [0, T] . В силу ограниченности ресурса вводится условие: 0 < u(t) < U, t g [0,T].
Начальные условия имеют вид: х(0) = 1, хк(0) = 0,к = 2,13.
Целью управления является снижение расходов на проведение мероприятий по ремонту серверного оборудования с сохранением показателей его надежности на уровне, не ниже предельно установленного
(х1 ^) > а) [9]. Вводим переменные а, I = 2,13, выражающие затраты на проведение работ в каждой из фаз системы в единицу времени, и дисконтирующий множитель 5> 0. Для учета условия х (1) > а, вводим квадратичную функцию внешнего штрафа со штрафным коэффициентом М > 0. Тогда целевой функционал запишется в форме: Г ( " л
I(и) = [i (1) +Мmax2{a-х(1);0} Лг.
0 v ¿=2 у
Получаем задачу оптимального управления в следующей постановке. Требуется минимизировать функционал:
T i 13 2 л
Ii У atx. (t) +M max2{a — x(t);0} dt -— min
0 v i=2 J
(4)
при динамических ограничениях: • •
X (1) = — Лх1 (1) + и(1)х4 (I) , х2 (I) = Лх1 (1) — и(1) (х (I) — х5 (1)), х (I) = и(1) х (1) — (Л + и(1) ) х (1) + и(1) х6 (I),
(5)
и
x4 (t) = u(t) x3 (t) - (1 + u(t) ) x4 (t) + u(t) x13 (t) , x5 (t) = 1x4 (t) - u(t) ( 2*5 (t) - x8 (t) - x10 (t) ) ,
x6 (t) = 1x5 (t) - (1 + 2u(t) ) x6 (t) + u(t) ( x (t) + xn (t) ), • •
x7 (t) = 1x6 (t) - 3u(t)x7 (t) , x8 (t) = (t) + u(t) (x7 (t) - 2* (t)), • •
x9(t) = u(t)(x8(t) -x9(t) + x12(t)), x10(t) = 1(x7(t) + x13(t))-2u(t)x10(t) , • •
*11(t) = u(t) (*10 (t) - *11 (t) + *12 (t)) , *12 (t) = u(t) (xi (t) - 2*12 (t)) ,
*13 (t) = u(t) (t) - (1 + u(t) ) *13 (t), t e [0, T ], начальных условиях:
x(0) = 1, (0) = 0, к = 2,13, (6)
ограничениях на управление:
0 < u(t) < U, t e[0, T]. (7)
Сформулируем необходимые условия оптимальности для (4)-(7) с применением принципа максимума Понтрягина.
Обозначим через p(t) набор сопряженных вектор-функций:
P(t) = (Р1 (t) Р2 (t), Рз (t) Р4 (t), P5 (t) Рб (tX Pl (tX P8 (tX P9 (t), P10 (t), P11(t), P12 (t), P13 (t) ) .
Функция Понтрягина задачи (4)-(7) имеет вид:
í 13
H (1, t, x, x,, x3, x4, x5, x6, u, P(t)) = -10 ^jaixi +M max2{a - * ;0} 1+ Pj (t) (-1x1 + ux4) +
v i =2 y
+P2 (t) (lx - u (x - x )) + Рз (t) (ux2 - (1 + u) x + ux6) + P4 (t) (ux - (1 + u) x + ых1Ъ) + +P5 (t) (1x4 - u (2x5 - x - x10 )) + P6 (t) (1x5 - (1 + 2u) x6 + u (x + xn )) + + P7 (t) (1x6 - 3ux7) + p8 (t) (1x3 + u (x7 - 2x8)) + p9 (t)u (x8 - x + x12 ) +
+ P10 (t) (1 (xi + x13 ) - 2ux10 ) + P11 (t)u (x10 - x11 + x12 ) + P12 (t)u(t) (xi - 2x12 ) +
+ P13(t) (ux6 -(1 + u) x13 ) .
и
Согласно принципу максимума Понтрягина оптимальное управление u = u(t) удовлетворяет условиям максимума:
H,t,x,p(t),u) = = maxH,t,x,pit),u) .
V ' 0<u <U
Пусть ([x, uJ) - оптимальный процесс в задаче (4)-(7), введена функция переключения:
(P(t) = Pl(t) X4 ~Pl(t) (Х2 - Х5 ) + P3(t) (X2 " X3 + X6 ) +P4(t) (X3 " X4 + X13 )-~Ps (t) ( 2x5 - X8 " X10 ) + P6 (t) (X9 + X11 " 2X6 ) " 3Pl (t) X7 + P8 (t) (X7 - 2X8 ) + P9 (t) (X8 - X9 + X12 ) -
~2X10Pl0 (t) + P11(t) (X10 - X11 + X12 ) + P12 (t) (X7 - 2X12 ) + P13 (t) (X6 - X13 ) .
Тогда оптимальное управление удовлетворяет условию:
0, если (р(1) > 0, и(1) = ! и, если () < 0,
[0,и], если () = 0,
сопряженные функции удовлетворяют системе [4]:
(8)
• дИ — (9)
Р, (1) = -дИ (Ъ1 £[0, Т], ' = 1,13, ( )
дх
и условиям трансверсальности:
р (Т) = 0,' = Цэ. (10)
Сложность аналитического решения краевой задачи принципа максимума приводит к необходимости применения вычислительных методов для построения приближенного решения задачи [10].
Применим схему дискретной аппроксимации (шаг дискретизации
А =Т/, q - число точек разбиения отрезка [0„Т ]). Обозначим:
/ ч
1 = 'А1, х - (¿') = х ', и (¿') = и', ' = 0, ч, у = 1,13. Приближаем производные
х'+1 - х'
разностными выражениями по схеме Эйлера (хДО~ —-/ = = 1,13).
Аппроксимируем интеграл с помощью правила левых прямоугольников.
и
Получаем дискретную задачу оптимального управления, аппроксимирующую исходную с точностью 0(Лг):
<7-1
1=0
Л
I(и) = ^ ^ х ' + М шах2(а - х/; 0} лг шип,
о=2 у
(11)
X+1 = х/ + Л? (-Лх/ + игх4г), х2г+1 = х2г + Д (Лх/ - иг (х^ - х5г)), х3г+1 = х3г + Лг (игх2г - (Л + и') х3' + игх6г) , х4г+1 = х4г + Лг (и'х3' - (Л + иг) х4г + и'х13 ), х5г+1 = х5' + Л? (Лх4' - и' (2х5' - х^ - х10')), х6'+1 = х6' + Лг (Лх5' - (Л + 2и') хб' + и' (х9' + х/ )), х7'+1 = х7г + Лг (Лх6г - 3игх7'), х8'+1 = х8г + Лг (Лх3г + иг (хп' - 2х8')), х9г+1 = х9' + Лг (и' (х8' - х9' + х12')), х10'+1 = х10' + Лг (Л (х7г + х13г) - 2и'х10г),
41 ли
х,г+1 = х,г + Лг (и' (х10' - х^ + Хг )), х12 +1 = + Лг (и' (х7г - 2х12г)) , х13'+1 = Хз + Л (и'х6' - (л + и') х13'), ' = 0,7 -1,
х0 = 1,х" = 0,у = 2,13,и° = ии, 0 <и' <и, = 0,< .
Для решения дискретной задачи оптимального управления (11) доступен широкий спектр численных методов оптимального управления и нелинейного программирования, в частности, градиентные методы оптимизации, где ограничения на управления могут быть учены с помощью проекции градиента. Применение вычислительных алгоритмов позволяет построить приближенное решение поставленной задачи с допустимой точностью.
Предложенный метод решения задачи оптимального управления надежностью серверного оборудования может быть использован для создания автоматизированных систем поддержки принятия решений, используемых при построении и эксплуатации ведомственной информационной инфраструктуры.
Литература
1. Бахтинова Ч.О., Чунаева М.Э. Автоматизация системы контроля качества при организации строительства особо опасных и технически сложных объектов в России // Инженерный вестник Дона, 2022, № 3.
URL: ivdon.ru/ru/magazine/archive/n3y2022/7511.
2. Душкин А.В., Цветков В.В. Вопросы моделирования состояний инженерно-технических средств охраны и надзора // Вестник Воронежского института ФСИН России, 2014, №3, с. 28-31.
3. Сумин В.И., Чураков Д.Ю., Царькова Е.Г. Разработка моделей и алгоритмов информационных структур и процессов объектов особой важности // Промышленные АСУ и контроллеры, 2019, № 4. С. 30-39.
4. Каяшев А.И., Рахман П.А., Шарипов М.И. Анализ показателей надежности локальных компьютерных сетей // Вестник УГАТУ. 2013. №5, с. 140-149.
5. Омельченко В.В. Информационное обеспечение системы государственного управления национальными ресурсами: риск-ориентированный подход // Правовая информатика, 2019, № 1. С. 4-17.
6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Technical Diagnostics of Equipment Using Data Mining Technologies // Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. Pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.
7. Игнатьева О.В. Архитектурные приемы при разработке программного обеспечения, зависимого от интерфейса пользователя // Инженерный вестник Дона, 2022, №2. URL: ivdon.ru/ru/magazine/archive/n2y2022/7478.
8. Вентцель Е.С. Исследование операций. М.: Советское радио, 1972.
55 с.
9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. An improved method for predicting the evolution of the characteristic parameters of an information system // Journal of Physics: Conference Series, Vol. 973, 2018, №1. P. 012031. URL: iopscience.iop.org/article/10.1088/1742-6596/973/1/012031/pdf.
10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, 2021, № 1. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.
References
1. Bahtinova CH.O., CHunaeva M.E. Inzhenernyj vestnik Dona, 2022, №3. URL: ivdon.ru/ru/magazine/archive/n3y2022/7511.
2. Dushkin A.V., Cvetkov V.V. Vestnik Voronezhskogo instituta FSIN Rossii, 2014, №3, pp.28-31.
3. Sumin V.I., CHurakov D.YU., Car'kova E.G. Promyshlennye ASU i kontrollery, 2019, № 4. pp. 30-39.
4. Kayashev A. I., Rahman P. A., SHaripov M. I. Vestnik UGATU, 2013, №5, pp. 140-149.
5. Omel'chenko V.V. Pravovaya informatika, 2019, № 1. pp. 4-17. URL: ivdon.ru/uploads/article/pdf/IVD_86_Akolzin.pdf_2394.pdf.
6. Tsarkova E., Belyaev A., Lagutin Y., Matveev Y., Andreeva E. Safety in Aviation and Space Technologies: Select Proceedings of the 9th World Congress «Aviation in the XXI Century». Cham: Springer, 2022. pp. 345-356. URL: link.springer.com/chapter/10.1007/978-3-030-85057-9_30.
7. Ignat'eva O.V. Inzhenemyj vestnik Dona, 2022, №2.URL: i vdon.ru/ru/magazine/archive/n2y2022/7478.
8. Ventcel' E.S. Issledovanie operacij [Operations research]. M.: Sovetskoe radio, 1972. 55 p.
9. Dushkin A.V., Kasatkina T.I., Novoseltsev V.I., Ivanov S.V. Journal of Physics: Conference Series. 2018, P. 012031. URL: iopscience.iop. org/article/10.1088/1742-6596/973/1/012031/pdf.
10. Dubrovin A.S., Ogorodnikova O.V., Tsarkova E.G., Andreeva E.A., Kulikova T.N. Analysis and visualization in graph database management systems // Journal of Physics: Conference Series: Current Problems. Voronezh, V.1902, 2021, № 1. P. 012059. URL: iopscience.iop.org/article/10.1088/1742-6596/1902/1/012059.