Научная статья на тему 'АЛГОРИТМ БАЛАНСИРОВКИ СЕРВЕРОВ В ЦЕНТРАХ ОБРАБОТКИ ДАННЫХ, ОСНОВАННЫЙ НА ИДЕНТИФИКАЦИИ СЕРВИСОВ В ВИРТУАЛЬНЫХ МАШИНАХ'

АЛГОРИТМ БАЛАНСИРОВКИ СЕРВЕРОВ В ЦЕНТРАХ ОБРАБОТКИ ДАННЫХ, ОСНОВАННЫЙ НА ИДЕНТИФИКАЦИИ СЕРВИСОВ В ВИРТУАЛЬНЫХ МАШИНАХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
116
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦЕНТР ОБРАБОТКИ ДАННЫХ / АЛГОРИТМ БАЛАНСИРОВКА НАГРУЗКИ / ИДЕНТИФИКАЦИЯ ИНФОРМАЦИОННОГО СЕРВИСА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Воробьев Андрей Анатольевич, Преображенский Роман Александрович, Андросов Алексей Юрьевич

В статье рассматривается модифицированный алгоритм балансировки серверов, реализованного в облачной платформе OpenNebula с моделью обслуживания «инфраструктура как услуга» и основанного на идентификации информационных сервисов в виртуальных машинах путем выявления особенностей в использовании ими вычислительных ресурсов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM OF SERVER BALANCING IN DATA CENTERS BASED ON IDENTIFICATION OF SERVICES IN VIRTUAL MACHINES

The article discusses a modified algorithm for balancing servers implemented in the OpenNebula cloud platform with the service model "infrastructure as a service" and based on the identification of information services in virtual machines by identifying features in their use of computing resources.

Текст научной работы на тему «АЛГОРИТМ БАЛАНСИРОВКИ СЕРВЕРОВ В ЦЕНТРАХ ОБРАБОТКИ ДАННЫХ, ОСНОВАННЫЙ НА ИДЕНТИФИКАЦИИ СЕРВИСОВ В ВИРТУАЛЬНЫХ МАШИНАХ»

Нгуен Ван Шон, канд. техн. наук, исследователь отдела автоматизации и управления, van-son. nguyen. mwi@gmail. com, Республика Вьетнам, Ханой 100000, Институт вооружений,

Акименко Татьяна Алексеевна, канд. техн. наук, доцент, tan tan 72@mail. ru, Россия, Тула, Тульский государственный университет

MANIPULATOR POSITION STABILIZATION USING A VIDEO-DATA V.S. Nguyen, T.A. Akimenko

The manipulator mounted rigidly on a platform, placed on a movable base, is investigated. The mathematical model of working body oscillations, arising from its position change control, has been developed. It is shown that the feedback closure on angles of rotation of the manipulator links, relative to each other, leads to unacceptably large positioning errors during transients. It is proposed to close the feedback on the position of the working body itself relative to the target, determined by the video-data generated by the vision system. It is shown that such a technical solution improves the positioning accuracy.

Key words: sprung-up platform, manipulator, working body, positioning, feedback, vision system.

Nguyen Van Son, candidate of technical science, researcher of department of automation and control, vanson.nguyen.mwi@gmail.com, Vietnam Republic, Hanoi, Military Weapon Institute,

Akimenko Tatiana Alekseevna, candidate of technical science, docent, tantan72@mail.ru, Russia, Tula, Tula State University

УДК 004.75

DOI: 10.24412/2071-6168-2023-2-19-24

АЛГОРИТМ БАЛАНСИРОВКИ СЕРВЕРОВ В ЦЕНТРАХ ОБРАБОТКИ ДАННЫХ, ОСНОВАННЫЙ НА ИДЕНТИФИКАЦИИ СЕРВИСОВ В ВИРТУАЛЬНЫХ МАШИНАХ

А.А. Воробьев, Р.А. Преображенский, А.Ю. Андросов

В статье рассматривается модифицированный алгоритм балансировки серверов, реализованного в облачной платформе OpenNebula с моделью обслуживания «инфраструктура как услуга» и основанного на идентификации информационных сервисов в виртуальных машинах путем выявления особенностей в использовании ими вычислительных ресурсов.

Ключевые слова: центр обработки данных, алгоритм балансировка нагрузки, идентификация информационного сервиса.

Известно, что при функционировании информационной инфраструктуры центров обработки данных (ЦОД) может периодически возникать проблема с неравномерной загрузкой вычислительных ресурсов серверов, проявляющееся в снижении производительности виртуальных машин (ВМ) [1]. Причинами вызывающих эту проблему могут быть: выход из строя серверного и соединяющего их сетевого оборудования или использование настроек «по умолчанию» алгоритмов балансировки нагрузки [2], например, реализованных в балансировщике нагрузки VMware NSX [3], применяемого в настоящее время в большинстве организаций, эксплуатирующих ЦОД.

Однако, на сегодняшний день становится актуальным [4] использование отечественных информационных технологий, например, программного комплекса средств виртуализации (ПК СВ) «Брест» АО «НПО РусБИТех» [5], программно-аппаратного комплекса виртуализации и защиты виртуальных систем "Горизонт-ВС" АО «НППКТ» [6], защищенной облачной платформы «Глобус» компании «Лаборатория 50» [7] и других. Эти средства позволяют также, как и облачные технологии, предлагаемые иностранными компаниями, например, VMware, Microsoft, Goggle создавать и размещать виртуальные машины на серверах в ЦОД, управлять вычислительными ресурсами выделяемых для их работы, а также обеспечивать их безопасность и надежность.

Далее в работе будет рассматриваться ПК СВ «Брест», анализ функциональных возможностей которого показал, что средство в отличие от технологий VMware не обладает собственным балансировщиком нагрузки, а может использовать решение HAProxy или сервисы OpenNebula [8]. Так, например, в OpenNebula встроены следующие алгоритмы балансировки нагрузки серверов: «ручной», «распределение по ресурсам» и «распределение по ресурсам с приоритетами».

19

«Ручной» алгоритм балансировки нагрузки - это алгоритм балансировки, который позволяет администратору ЦОД самостоятельно «вручную» управлять вычислительными ресурсами, выделяемых для каждой ВМ, т.е. обладать полным контролем над всеми ресурсами и управлять ими в режиме реального времени. Алгоритм балансировки «распределение по ресурсам» разделяет нагрузку между серверами в зависимости от доступности вычислительных ресурсов. Для этого используется информация о состоянии серверов с функционирующими на них ВМ для принятия решения о местах размещения новых ВМ. Таким образом, алгоритм может адаптироваться к возникающим изменениям ресурсов и обеспечивать балансировку нагрузки без участия администратора. Алгоритм «распределение по ресурсам с приоритетами» позволяет администратору ЦОД установить приоритеты для выделения ресурсов для каждой ВМ. Этот алгоритм обеспечивает более гибкую настройку балансировки нагрузки серверов в ЦОД, позволяющую повысить производительность ВМ. Однако, анализ вышеназванных алгоритмов, показывает, что проблема, выявленная при работе балансировщика VMware NSX и при переходе на отечественное ПО, также решена, не будет. Это связано с тем, что в ЦОД используются следующие наиболее распространённые модели обслуживания облачных вычислений: «Сервис как услуга» (SaaS), «Платформа как услуга» (PaaS) и «Инфраструктура как услуга» (IaaS) [9]. Причем, последняя «Инфраструктура как услуга», при которой потребителям предоставляются информационно-технологические ресурсы - ВМ с заданной вычислительной мощностью, операционной системой и доступом к сети, как раз и не позволяет обеспечить решение проблемы балансировки. Так как обслуживающему персоналу ЦОД будет неизвестно, какие сервисы (в том числе, высоконагруженные) будут разворачиваться в ВМ и это будет накладывать свои особенности на возможности обеспечения эффективного управления вычислительными ресурсами серверов ЦОД.

Таким образом, в работе предложено провести исследование возможности идентификации сервисов в ВМ за счет анализа особенностей использования ими различных вычислительных ресурсов (процессора, памяти, жесткого диска и сети) с учетом того, что в сети передачи данных имеются ограничения, не позволяющие выполнить идентификацию сервисов из-за шифрования трафика. В результате работы балансировщик нагрузки сможет классифицировать ВМ с различными информационными сервисами (ИС), что обеспечит более эффективную балансировку нагрузки, например, за счет размещения высоко нагруженных ВМ на различные серверы.

На первоначальном этапе исследования авторами принято следующее ограничение в работе: идентификация ИС будет выполняться на ВМ только с двумя развернутыми ИС, функционирующих при различных видах нагрузки. Таким образом в работе был поставлен эксперимент, целью которого являлось проверка гипотезы о возможности идентификации ИС с использованием статистической информации о расходе ими вычислительных ресурсов во времени. В ходе экспериментов учитывались первый фактор - тип нагрузки: диапазон изменения нагрузки: низкая (1 запрос в секунду), средняя (10 запросов в секунду) и высокая (20 запросов в секунду) и второй фактор - тип ИС (Web и FTP сервер). С учетом рекомендаций были выбраны допустимые значения вероятности ошибки I и II рода: а < 0,05 и ß < 0,01 и проведена серия экспериментов для каждого уровня факторов с требуемой мощностью. В качестве методики обработки результатов эксперимента использовались критерии согласия и расчет функции плотностей распределения случайной величины.

Для проведения экспериментов по идентификации сервисов был создан экспериментальный стенд (рис.1), состоящий из сервера с операционной системой Astra Linux SE 1.6, на которой были развернуты ПК СВ «Брест» и системный монитор «KSysGuard», а также ПЭВМ с развернутым средством нагрузочного тестирования «Apache Jmeter» [10], выбранного в следствии следующих его преимуществ:

- открытый исходный код, позволяющий самостоятельно конфигурировать средство под разные задачи;

- поддержка множества протоколов: HTTP, FTP, SMTP, TCP и другие, обеспечивающих гибкость различных типов тестирования;

- интуитивный графический интерфейс для создания любых сценариев тестирования;

- масштабируемость для генерации различного количества запросов при нагрузочном тестировании больших и сложных информационных систем.

С помощью ПК СВ «Брест» были созданы и размещены ВМ с операционной системой Astra Linux SE 1.6, в которых были развернуты ИС: Web-сервер и FTP-сервер.

Проведение эксперимента осуществлялось в следующем порядке: 1. Запуск и проверка работоспособности ИС. 2. Запуск системного монитора «KSysGuard», с последующим выводом результатов мониторинга в файл. 3. Запуск «Apache JMeter» с заданной нагрузкой, который генерирует FTP- запросы (FTP-Request) и HTTP-запросы (HTTP-request). Время проведения эксперимента было выбрано равное 20 минутам с фиксацией результатов каждые 2 секунды. Затем на основе анализа данных мониторинга выявлялись метрики, которые существенно изменялись на соответствующий тип запроса.

В результате проведенного эксперимента были получены временные ряды (600 значений), которые отражали характер изменения нагрузки. Затем для группировки временного ряда и визуального анализа закона распределения использовались формулы Стерджесса для расчета количества интервалов (1) и ширины интервала (2) [11].

т = 1 + 3.322 * lg(n), (1)

где ^(п) - десятичный логарифм от количества измерений.

^ _ хтах~ хтт

с хтЬп (2)

т

В результате группировки временных рядов были получены гистограммы, отображающие особенности использования вычислительного ресурса (процессора) двумя разными видами сервисов (рис. 2, 3). На основе их визуального анализа можно сделать предварительный вывод о том, что распределение данных соответствует нормальному закону распределения со смещением (рис.2) и логнормальному закону распределения (рис. 3).

ПЭВМ

1

Jmeter script (FTP-сервер)

Ш

Jmeter script (Web-сервер)

Сервер с Astra Linux SE 1.6 FTP запрос

Облако ВМ -И

Web запрос

- 2

FTP-сервер

• 3

Web-сервер

Выбор метрик KSysGuard

^ файл

Рис. 1. Схема экспериментального стенда для идентификации информационных сервисов

в виртуальных машинах

400 300 200 100 0

с; о

10 20 30 40 50 60 70 80 90 100 0 10 20 30 40 50 60 70 80 90 Интервалы

Рис. 2. Результаты мониторинга процессора, используемого №еЬ-сервисом, в виде гистограммы

..■■II

- ■ ■ -

10 20 30 40 50 60 70 80 90 100

0 10 20 30 40 50 60 70 80 90

200

1 150 а

го 100

I 50 о

h 0

о

Интервалы

Рис. 3. Результаты мониторинга процессора, используемого Пр-сервисом, в виде гистограммы

Для проверки гипотезы о нормальном виде распределения в работе был выбран критерий согласия Колмогорова, а для проверки логнормального распределения применялся тест Шапиро-Уилка. После принятия гипотезы о том, что распределение является нормальным или логнормальным, рассчитывались функции плотности распределения (3):

, (Х-М(х))2

^ = е~ 2*2 , (3) 21

где М(х) - математическое ожидание, а - среднее квадратическое отклонение случайной величины X.

Таким образом, для идентификации ИС требуется выполнить сравнение двух плотностей распределения случайной величины в виде временных рядов, полученных в ходе мониторинга вычислительных ресурсов с функционирующими известным и неизвестным ИС с помощью ДНФ (дизъюнктивная нормальная форма) - классификатора, согласно которому условия выбора задаются ДНФ - формулами, представляющими собой дизъюнкцию нескольких выражений, элементы которых соединены некоторым количеством конъюнкций [12]. При таком рассмотрении ИС будет относиться к классу, если он удовлетворяет следующему условию (4):

{Если (f(x)¡ = f(x)ftp),TO x¿ - FTP сервер

Если (f(x)¡ = f(x)we&),TO x¿ - Web серерс где f(x)¡ - функция плотности распределения неизвестного ИС, f(x)^tp - функция плотности распределения FTP сервера, f(x)we& - функция плотности распределения Web - сервера.

(4)

О

о

о

Нет

К-<

->

-^

--с

I Проверка значений временного ряда

_1 нормальному закону распределения с помощью I критерия согласия Колмогорова

Проверка значений временного ряда логнормальному закону распределения с помощью теста Шапиро-Уилка

Да

Расчёт функции

плотности

распределения

fi(x)

Сравнение эмпирической функции плотности распределения с известными функциями плотности распределения, полученными с помощью экспериментов

Проверка размещена ли на сервере ВМ с таким же ИС

О

Проверка достаточно ли доступных ресурсов для размещения ВМ

Рис. 4. Алгоритм балансировки нагрузки серверов в ЦОД, основанный на идентификации сервисов

в виртуальных машинах

Таким образом, с учетом возможности идентификации сервисов в виртуальных машинах имеется возможность модификации алгоритмов балансировки нагрузки серверов в ЦОД, к примеру в алгоритм «распределение по ресурсам» предлагается добавить функцию распределения ВМ по классам, соответствующим виду информационного сервиса, запущенному в ВМ.

Модифицированный алгоритм балансировки нагрузки серверов, основанный на идентификации сервисов в виртуальных машинах представлен на рис. 4 и включает следующие процедуры:

1. Сбор данных об используемой виртуальной машиной с неизвестным ИС вычислительного ресурса %P (процент использования времени процессора) в течении Тобщ (общее время сбора) с интервалом ДТ для формирования значений временного ряда.

2. Проверка условия 1 (критерий согласия Колмогорова): Если значения временного ряда соответствуют нормальному закону распределения, то переход к процедуре № 4, иначе - переход к процедуре № 3.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Проверка условия 2 (тест Шапиро-Уилка): Если значения временного ряда соответствуют логнормальному закону распределения, то переход к процедуре № 4, иначе переход к процедуре №1.

4. Расчет функции плотности распределения значений временного ряда.

5. Проверка условия 3: Если эмпирическая функция плотности распределения совпадает с известной, полученной и верифицированной в ходе экспериментов, то ИС в ВМ идентифицирован и переход к процедуре № 6, иначе переход к процедуре №1.

6. Запуск цикла со счетчиком j равным количеству серверов в ЦОД с проверкой условия 4: Если j-ом сервере размещена ВМ с таким же ИС, то переход к процедуре № 7, иначе переход к процедуре № 8.

7. Переход к проверке следующего сервера j+1 в ЦОД.

8. Проверка условия 5: Если на выбранном сервере достаточно вычислительных ресурсов для размещения ВМ, то переход к процедуре № 9, иначе переход к процедуре №7.

9. Размещение ВМ на выбранном сервере.

Таким образом, в работе предложен алгоритм балансировки серверов в ЦОД, основанный на идентификации ИС с использованием метрик, характеризующей нагрузку по вычислительному ресурсу (процессор). В дальнейших исследованиях планируется расширить базу метрик по использованию не только процессоров, но и оперативной памяти, а также пропускной способности сети передачи данных для других актуальных информационных сервисов (электронная почта, базы данных, видеоконферен-цсвязь) с целью повышения точности идентификации ИС и усовершенствования на их основе алгоритма балансировки нагрузки серверов в ЦОД.

Список литературы

1. Семь типичных ошибок при сравнении своих серверов с облаком. [Электронный ресурс] URL: https://habr.com/ru/companY/activecloudru/blog/415483 (дата обращения: 29.11.2022).

2. Балансировка нагрузки: основные алгоритмы и методы. [Электронный ресурс] URL: https://selectel.ru/blog/balansirovka-nagruzki-osnovnYe-algoritmY-i-metodY (дата обращения: 29.11.2022).

3. NSX Advanced Load Balancer. [Электронный ресурс] URL: https://www.ВМware.com/products/nsx-advanced-load-balancer.html (дата обращения 29.11.2022).

4. Постановление Правительства Российской Федерации от 22.08.2022 г. № 1478 «Об утверждении требований к программному обеспечению, в том числе в составе программно-аппаратных комплексов, используемому органами государственной власти, заказчиками, осуществляющими закупки в соответствии с Федеральным законом «О закупках товаров, работ, услуг отдельными видами юридических лиц».

5. Система виртуализации Astra Linux. Программный комплекс «Средства виртуализации «БРЕСТ». [Электронный ресурс] URL: https://astralinux.ru/products/pk-brest (дата обращения: 29.11.2022).

6. Горизонт-ВС. [Электронный ресурс] URL: https://gorizont-vs.ru (дата обращения: 29.11.2022).

7. OpenStack для защищённых систем. [Электронный ресурс] URL: https://lab50.net/openstack (дата обращения: 29.11.2022).

8. OpenNebula 6.4 Documentation. [Электронный ресурс] URL: https://docs.opennebula.io/6.4 (дата обращения: 29.11.2022).

9. Telecom & IT. [Электронный ресурс] URL: https://shalaginov.com/2015/05/01/вцод-распределение-облачности-стат (дата обращения: 29.11.2022).

10. Apache JMeter. [Электронный ресурс] URL: https://jmeter.apache.org (дата обращения: 29.11.2022).

11. Группировка. Формула Стерджесса. [Электронный ресурс] URL: https://univer-nn. ru/zadachi-po-statistike-primeri/gruppirovka-formula-sterdzhessa (дата обращения: 13.10.2022).

12. Снарский А.А., Ландэ Д.В. Моделирование сложных сетей: учебное пособие. К.: НТУУ «КПИ», 2014. С.93-94.

Воробьев Андрей Анатольевич, канд. техн. наук, доцент, сотрудник, awa@mail.ru, Россия, Орел, Академия Федеральной службы охраны Российской Федерации,

Преображенский Роман Александрович, сотрудник, pomapr85@gmail.com, Россия, Орел, Академия Федеральной службы охраны Российской Федерации,

Андросов Алексей Юрьевич, канд. техн. наук, сотрудник, saper176@mail.ru, Россия, Орел, Академия Федеральной службы охраны Российской Федерации

ALGORITHM OF SERVER BALANCING IN DATA CENTERS BASED ON IDENTIFICATION OF SERVICES

IN VIRTUAL MACHINES

A.A. Vorobyov, R.A. Preobrazhenskii, A. Y. Androsov

The article discusses a modified algorithm for balancing servers implemented in the OpenNebula cloud platform with the service model "infrastructure as a service" and based on the identification of information services in virtual machines by identifying features in their use of computing resources.

Key words: data center, load balancing algorithm, information service identification.

Vorobyov Andrey Anatolievich, candidate of technical sciences, docent, researcher, awa@mail.ru, Russia, Orel, The Academy of Federal Security Guard Service of the Russian Federation,

Preobrazhenskii Roman Aleksandrovich, researcher, pomapr85@gmail.com, Russia, Orel, The Academy of Federal Security Guard Service of the Russian Federation,

Androsov Aleksei Yurevich, candidate of technical sciences, researcher, saper176@mail.ru, Russia, Orel, The Academy of Federal Security Guard Service of the Russian Federation

УДК 004.85

DOI: 10.24412/2071-6168-2023-2-24-29

МЕТОДИКА ОЦЕНКИ УРОВНЯ СОЦИАЛЬНОЙ НАПРЯЖЁННОСТИ В РЕГИОНЕ С ИСПОЛЬЗОВАНИЕМ ОТКРЫТЫХ ИСТОЧНИКОВ ИНФОРМАЦИИ В СЕТИ ИНТЕРНЕТ

А.А. Воробьев, М.К. Белозёров, Я.А. Кара-Сал, Д.А. Беляев

Исследована проблема снижения достоверности показателя «доверие к власти», уровень которого определяется посредством оценок общественного мнения с помощью социологических опросов и предложено рассмотреть его альтернативу (дополнительный) показатель «социальная напряжённость» формируемый на основе публикаций в сети Интернет и методику его расчета.

Ключевые слова: доверие к власти, социальная напряжённость, средства массовой информации, социальная сеть, методика расчета показателя.

Для оценки эффективности деятельности высших должностных лиц (руководителей высших исполнительных органов государственной власти) субъектов Российской Федерации утверждён перечень показателей [1]. В указанный перечень входят ряд показателей и одним из главных является первый в перечне показатель: «доверие к власти». Этот показатель характеризует отношение населения к органам государственной власти (далее ОГВ) и рассчитывается на основе данных, полученных в ходе социологических опросов. Для расчёта показателя используются ответы респондентов, например на вопрос: Скажите, пожалуйста, Вы доверяете или не доверяете ...? При этом оценка респондентами предлагается в порядковой шкале, например: «безусловно доверяю», «скорее доверяю», «скорее не доверяю», «безусловно не доверяю», «затрудняюсь ответить». Для формирования значения показателя необходимо осуществить его расчет путем вычитания из суммы процентов ответов в двух положительных градациях суммы процентов ответов в отрицательных градациях [8].

В настоящее время наметилась тенденция к падению качества результатов социологических исследований, проводимых на общественно-политические темы методом социологических опросов [2] и в связи с этим для повышения не только точности, но и достоверности рассматриваемого показателя целесообразно использовать дополнительные источники информации, например, осуществлять сбор и анализ публикаций в электронных средствах массовой информации и в социальных сетях (открытые источники в сети Интернет).

i Надоели баннеры? Вы всегда можете отключить рекламу.