Научная статья на тему 'Автоматизация контроля и статистического анализа электропитания серверов (на примере антивирусного сайта ЦЭМИ РАН)'

Автоматизация контроля и статистического анализа электропитания серверов (на примере антивирусного сайта ЦЭМИ РАН) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
105
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ / UPS / APC / СЕРВЕР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Терентьев А.М.

В статье затронуты вопросы использования устройств бесперебойного питания Smart-UPS фирмы APC для автоматического контроля и ведения статистики качества электропитания. Описана программа, позволяющая выдавать необходимые данные в HTML-формате по запросам посетителей сайта. Приведен пример работы программы с выдачей статистики за месяц.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Автоматизация контроля и статистического анализа электропитания серверов (на примере антивирусного сайта ЦЭМИ РАН)»

УДК 004.42

автоматизация контроля

и статистического анализа

электропитания серверов

(на примере антивирусного сайта

цэми ран)

А. м. терентьев, кандидат технических наук, ведущий научный сотрудник E-mail: tam@cedi. rssi. ru Центральный экономико-математический институт РАН

В статье затронуты вопросы использования устройств бесперебойного питания Smart-UPS фирмы APC для автоматического контроля и ведения статистики качества электропитания. Описана программа, позволяющая выдавать необходимые данные в HTML-формате по запросам посетителей сайта. Приведен пример работы программы с выдачей статистики за месяц.

Ключевые слова: информационная безопасность, UPS, APC, сервер.

Качество электропитания локальной сети компьютеров и в особенности серверов является серьезным вопросом информационной безопасности. Для контроля за электропитанием в крупных организациях применяются как локальные измерительные приборы [4], так и комплексные системы мониторинга [1]. Поскольку средняя стоимость локального устройства составляет более 120 тыс. руб., а комплексной системы - еще выше, то в условиях отечественных научных институтов, особенно в структуре РАН, использовать подобные системы, как правило, нет возможности. Между тем приемлемый мониторинг основных показателей качества потребляемой электроэнергии в ряде случаев можно вести на основе уже установленных приборов. В частности, полноценное использование устройств бесперебойного электропитания (далее

UPS, Uninterruptible Power Supply) в соединении с сервером позволяет осуществлять мониторинг электропитания, отмечая все перепады напряжения вне допустимых для компьютерной техники пределов.

Оставляя в стороне административные способы решения проблемы недопустимых отклонений электропитания, попытаемся в данной работе показать возможность создания удобных автоматизированных средств мониторинга электропитания с отображением результатов на веб-сайте с помощью базового комплекта UPS и небольшой программы, созданной автором.

Ранее в обзорной статье [3] автором были освещены вопросы использования различных классов устройств бесперебойного электропитания от некоторых фирм, присутствующих на отечественном рынке. Несмотря на то, что устройства фирмы APC (American Power Consumption), принадлежащие к классу Line-Interactive, не являются в настоящее время наиболее совершенными1, их качество в значительной степени превышает качество изделий других производителей. Особо это относится к работоспособности основных компонентов UPS -батарей: изделия фирмы APC надежны, обладают повышенной энергоемкостью и в большинстве слу-

1 Наиболее совершенными UPS, как указано в [3], являются изделия класса On-Line.

чаев отрабатывают заявленный срок в 5 лет. Эксплуатационные свойства UPS категории Line-Interactive достаточны для поддержки энергопитания как ПК, так и серверов, поэтому уровень продаж изделий этой фирмы держится в России на достаточно высоком уровне.

Технические детали, связанные с особенностями замены отработавших срок батарей, подробно освещены в [3]. Там же приведены некоторые особенности так называемого smart-интерфейса этого класса устройств на примере комплекса сопровождающих программ PowerChute Plus 5.2.1. В настоящей статье будут показаны расширенные возможности этих программ.

Описанные в [3] возможности smart-интерфей-са UPS не исчерпываются оперативным отображением состояния устройства и конфигурационными настройками. В последних можно определить файлы на жестком диске (HDD), куда будет оперативно собираться информация о состоянии UPS в виде кодов, моментов времени и наименований событий. Настройка этих параметров показана на рис. 1.

Можно видеть, что конфигурацией определены 2 различных файла: протокол событий (Event Logging) и протокол данных (Data Logging). В настоящее время нас интересует первый файл. В протокол событий с привязкой к идентифицирующим кодам и моментам времени помещаются все события, характерные для изменения состояний UPS. Доступ к определению действий UPS по наступлении соответствующего события устанавливается в окне Event Actions (рис. 2). Просмотрев этот раздел целиком, можно установить полный перечень 27 событий UPS, отражаемых в протоколе. Отметим, что это обязательно нужно сделать при настройке UPS для задания реакции на важнейшие события.

Для отечественных пользователей, вероятно, будет особо интересна возможность оповещения через электронную почту в случае таких аварийных ситуаций, как необходимость замены бата-

рей, а возможно, и в случае административного завершения работы сервера (пункт Administrative Shutdown выделен на рис. 2). К сожалению, отсылка SMS-сообщений через пункт меню Page Users в России невозможна из-за отсутствия соответствующей технической поддержки у операторов сотовой связи, которые не принимают автоматические, программно сформированные электронные сообщения для отправки через SMS. Впрочем, владельцы смартфонов могут получать электронную почту непосредственно на свои устройства. При формировании отправки сообщений через e-mail следует учесть ограничения программы поддержки UPS: программа запоминает SMTP-сервер и SMTP-аккаунт, но в ней не предусмотрена фиксация пароля.

Формат результирующего протокола виден из его фрагмента, показанного на рис. 3 (для примера представлен фрагмент протокола за май 2013 г.). В каждой строке присутствуют 6-символьные коды ситуации, которые являются неизменными. Тексты сообщений можно править в конфигурационном файле, например для франкоязычных пользователей и др. Русскоязычным пользователям автор предлагает другой вариант, описываемый ниже.

Указанный протокол является вполне информативным для системных администраторов, однако неудобен для обычных пользователей. Во-первых, в нем использованы специальные английские терми-

Рис. 1. Настройка опций формирования логов программы PowerChute

Event Actions

Events

■■

PowerChute plus Started PowerChute plus Hopped UPS On Battery Utility Power Restored Low Battery Condition UPS Battery Is Discharged Return From Low Battery Communication Established Lost Communication With UPS CqmmLnst While Oil Battery

Administrative Shutdown

System Shutdown Starting System Shutdown Complete Shutdown Cancelled UPS Output Overload Overload Condition Solved UPS Enabling SmartBoost

Actions for Selected Eveni Log Event

Г Notify Administrators Optiiongî;3

F" Notify Users Options... Г Run Command File

Fj.'Send F-Mail Ôpfiono.:i

Page Users 17 Shut Down Server

M

шиш

_0pt

ons...

Reset To Default Actions...

OK

Cancel

Рис. 2. Настройка реакции на события (Events) программы PowerChute

200002 03. 05. 2013 17 :48: 42 OPS on battery: Brownout

100300 03. 05. 2013 17 :48: 42 Normal power restored: UPS on line

200002 06. 05. 2013 17 :08: 37 OPS on battery: Brownout

100300 Об. 05. 2013 17 :08: 37 Normal power restored: OPS on line

200200 11. 05. 2013 00 :32: 32 OPS enabling SmartBoost

100300 11. 05. 2013 00 :32: 37 Normal power restored: OPS on line

200002 13. 05. 2013 10 :25: 19 OPS on battery: Brownout

100300 13. 05. 2013 10 :25: 19 Normal power restored: OPS on line

200200 15. 05. 2013 16 :15: 22 OPS enabling SmartBoost

100100 20. 05. 2013 19 :28: 39 *** PowerChute PLOS Version 5. .2.1 stopped ***

100000 20. 05. 2013 19 :30: 18 *** PowerChute PLOS Version 5. ,2.1 started ***

100200 20. 05. 2013 19 :30: 26 Communication established

Рис. 3. Фрагмент протокола Event Log программы PowerChute

ны, а во-вторых, отсутствуют сводные данные. В то же время такой протокол может служить основой для программного отображения статистики отказов электропитания. В ЦЭМИ автором разработана и внедрена программа сбора статистики, работающая на основании протокола событий UPS APC Smart-1500, подключенного к антивирусному серверу.

Указанная программа может функционировать как в варианте консольного приложения с выводом результатов в консольное окно вызова, так и применительно к антивирусному сайту как CGI-прило-жение, выдающее результаты в виде HTML-формы, оперативно отображаемой на сайте. Для вызова программы в консольном варианте используются

параметры командной строки вызова (данный вариант нужен только для тестирования программы).

Для вызова про-граммы через браузер используется HTML-форма, приведенная на рис. 4 и находящаяся в составе раздела «Статистика» антивирусного сайта ЦЭМИ РАН (http://av.cemi.rssi. ru) [2].

Выдача результатов по фрагменту протокола событий UPS, показанному на рис. 3, выполнена по форме, представленной на рис. 4, и содержит результаты, представленные на рис. 5. При необходимости легко проверить соответствие событий, указанных на рис. 3 и 5.

В случаях, когда интервал времени превышает несколько дней или фрагмент протокола за запрошенное время включает много событий, при заполнении формы следует снять флажок «Показать данные». В этом случае в HTML-форму будут выданы только итоговые строки.

При интерпретации выдаваемых результатов следует иметь в виду, что эти данные статистики собираются через работающий сервер, UPS которого допускает не более 20 мин батарейной поддержки электропитания при пропадании напряжения в электросети. Таким образом, максимальное время отключения электропитания, которое может быть достоверно измерено, ограничено 20 мин. При превышении этого интервала появляется событие административного завершения работы сервера, который автоматически восстанавливает свою работу примерно через 10 мин после восстановления элек-

Статистика электропитания Узла "Интернет" ЦЭМИ РАН

Здесь находится статистика электропитания. Выберите интересуемый интервал обзора. Если нужны детальные данные по часам, минутам и секундам, нажмите Показать данные. Для начала показа нажмите Показать

О Сегодня О Текущий месяц ® Прошлый меся и О С начала года О Весь период

0 Показать данные

Показать

Рис. 4. Форма запроса статистики электропитания на антивирусном сайте ЦЭМИ РАН $ VI етЛГРЗ

= av.cemi.rssi.rT3 (ЦЭМИ РАН)= (499)129-13-22

Версия 1.12 от 27.05.2013 = А.Терентьев : = = Выдача сводки об электропитании сервера

! Центральный Экономико-Математический Институт РАН

Meth: {GET}

Установлен текущий каталог {e:\site\av\} Определен каталог вызова {e:\site\av\} Командная строка: {>

Установлен признак работы через браузер Проверка конф.файла

Открыт журнал {D:\!SYS\viewups.гер > Строка параметров: {/INT=CMOM /DAT=Y } Просмотр данных включен : Запрос: 29.05.2013 = 21:07:08 : Период: с 130500000000 по 130531235959

0PS на батареях: проседание Восстановлено нормальное питание 0PS на батареях: проседание Восстановлено нормальное питание HPS включит: автотрансформатор Восстановлено нормальное питание УР5 на батареях: проседание Восстановлено нормальное питание UPS включит автотрансформатор PowerChuce завершен PowerChuee стартовал Соединение с JTK установлено ! Сводная статистика за просмотренный период

# Стартов PowerCbute: 1

# Остановов PowerChute: 1

# Просадок питания: 3

# Отключений питания: 0

# Переключений на батареи по неуст.прич.: 0

# Итого переходов на батареи: 3

# Отключений сервера: 0

# Неопознанных строк: 0

Рис. 5. Вид HTML-выдачи статистики электропитания в ЦЭМИ РАН

тропитания, поэтому в протоколе будут отражены как событие административного завершения, так и последующее включение сервера. Зная о 10-минутном интервале восстановления питания, можно с достаточной достоверностью определять и фиксировать также длительные отключения питания.

Например, из приведенного протокола видно, что 20 мая 2013 г. в 19:28 работа сервера была

+ 93. .05. .2913 » n 1 : 46 : : 42

+ 03. .05. .2013 17: : 48 : : 42

+ 96. .05. ,2913 17 : : 98 : : 37

+ 06. .05. .2013 17: : OB : : 37

+ 11. .03. . 2613 00: : 32: : 32

+ 11. .05. .2013 00: : 32 : : 37

+ 13. .05, .2913 19: : 25 : : 19

+ 13. .05. .2013 10: : 25 : : 19

+ 15. .03. ,2013 16: : 15: : 22

-f 20. .03. . 2013 19: :2ö: : 39

-f 20. .03. . 2613 19: : 30: : 16

-f 20. .03. , 2013 19: : 30: : 26

завершена, причем сообщения о событии Administrative Shutdown не было, а уже в 19:30 работа сервера была вновь восстановлена. По таким признакам можно однознач -но сделать вывод о простой перезагрузке сервера. И действительно, в это время при обслуживания сервера была заказана перезагрузка для установки обновлений операционной системы.

Хотя антивирусный сайт ЦЭМИ РАН является внутренним технологическим ресурсом, большинство его данных открыто в Интернете. В частности, упомянутая статистика доступна любому посетителю сайта [2].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Описанная версия программы использует файл конфигурации и таким образом легко может быть настроена на актуальное место хранения протокола событий в других организациях. Программа самодокументирована - при консольном вызове без параметров выдается файл справки (Help) со всеми необходимыми разъяснениями по эксплуатации программы. В будущем планируется ее регистрация в Федеральной службе по интеллектуальной собственности (ФИПС).

В заключение следует отметить, что граничные значения допустимых отклонений в напряжении, при которых UPS принимает меры, могут быть

изменены через то же конфигурационное меню. С учетом этого приведенный пример объединения стандартных возможностей UPS фирмы APC и относительно небольшой программы автора показывает, что на базовых (как правило, уже имеющихся) средствах обеспечения электропитания серверов можно практически без дополнительных затрат сформировать полноценный мониторинг электропитания с отображением результатов на веб-сайте.

Список литературы 1. Автоматизированная система контроля качества электроэнергии. [Электронный ресурс].

URL: http://fidercom. ru/monitoring-kachestva-elektroenergii.

2. Антивирусный сайт ЦЭМИ РАН. Статистика. [Электронный ресурс]. URL: http://av. cemi. rssi. ru/av.

3. Терентъев А. М. Актуальные проблемы бесперебойного электропитания персональных компьютеров и серверов // Национальные интересы: приоритеты и безопасность. 2013. № 30. С. 46-53.

4. PITE 3561. Анализатор качества электроэнергии. [Электронный ресурс] . URL: http://skom-plekt. com/tovar/1/10/2103653511.

i Надоели баннеры? Вы всегда можете отключить рекламу.