Научная статья на тему 'Применение нейронных сетей в мониторинге вычислительных центров'

Применение нейронных сетей в мониторинге вычислительных центров Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
365
87
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНЫЕ СЕТИ / МОНИТОРИНГ / ВЫЧИСЛИТЕЛЬНЫЕ УЗЛЫ / COMPUTER NETWORKS / MONITORING / COMPUTER NODE LOAD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петраков Владимир Александрович, Богачев Дмитрий Николаевич

Широкое применение компьютерных сетей в различных сферах деятельности человека и высокие требования по обеспечению надежности их работы обусловливают актуальность задачи мониторинга нагрузки вычислительных узлов и эффективного управления ими.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEURAL NETWORKS TO MONITOR COMPUTER CENTERS

The wide application of computer networks in various scopes of human activities and high standards on reliability of these networks' performance make monitoring of the computer node load and efficient management a relevant issue. One offered a solution to this problem through using neural networks to assess the current system status and take decisions on managing the node load on the basis of situation forecasts.

Текст научной работы на тему «Применение нейронных сетей в мониторинге вычислительных центров»

4. Батищев Д.И. Генетические алгоритмы решения экстремальных задач. - Воронеж: Изд. ВГТУ, 1995.

5. Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы. - М: Физматлит, 2006. - 320 с.

7. Goldberg D.E. Genetic algorithms in search, optimization and machine learning. - Addison-Wesley Publishing Company, Inc.1989.

Белевцев Андрей Михайлович

Московский авиационный технологический институт им. К.Э.Циолковского E-mail: Andrey.Belevtsev@cbossgrup.com 119106, Москва, ул. Смоленская, 7-121 Тел.:+7(495)2417457

Балыбердин Валерий Алексеевич

Центральный научно исследовательский институт министерства обороны Российской федерации E-mail: baliberdin@yandex.ru

Иванов Владимир Владимирович

Секция прикладных проблем при Президиуме Российской академии наук E-mail: Andrey.Belevtsev@cbossgrup.com Belevtsev Andrey Mihaiylovich

The Moscow aviation institute of technology of a name K. Tsiolkovsky E-mail: Andrey.Belevtsev@cbossgrup.com 7-121, Smolenskay street, Mockow, 119106, Russia Phone: +7(495)2417457

Baliberdin Valeriy Alekseevich E-mail: baliberdin@yandex.ru Ivanov Vladimir Vladimirovich

Section of applied problems of Russian Academy of Science E-mail: Andrey.Belevtsev@cbossgrup.com

УДК 004.7:004.811

В.А. Петраков, Д.Н.Богачев

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В МОНИТОРИНГЕ ВЫЧИСЛИТЕЛЬНЫХ ЦЕНТРОВ

Широкое применение компьютерных сетей в различных сферах деятельности человека и высокие требования по обеспечению надежности их работы обусловливают актуальность задачи мониторинга нагрузки вычислительных узлов и эффективного управления ими.

Компьютерные сети; мониторинг; вычислительные узлы.

V.A. Petrakov, D.N.Bogachev NEURAL NETWORKS TO MONITOR COMPUTER CENTERS

The wide application of computer networks in various scopes of human activities and high standards on reliability of these networks’ performance make monitoring of the computer node load and efficient management a relevant issue. One offered a solution to this problem through using neural networks to assess the current system status and take decisions on managing the node load on the basis of situation forecasts.

Computer networks; monitoring; computer node load.

Широкое применение компьютерных сетей в различных сферах деятельности человека и высокие требования по обеспечению надежности их работы обусловливают актуальность задачи мониторинга нагрузки вычислительных узлов и эффективного управления ими.

В самом простом случае управление ВС осуществляется следующим образом: администратор проводит опрос серверов системы, определяя текущую загрузку и корректность работы каждого из них; в случае неверного выполнения задач или превышения предельно допустимого уровня загрузки отдельных вычислительных узлов администратор осуществляет мероприятия по устранению возникшей проблемы (отключение отдельных пользователей, определение и снятие некритических задач, перезапуск приложений и т.п.). В случае возникновения аппаратных сбоев администратор должен проверить состояние технических устройств, как правило, это осмотр на месте. Недостатком такого способа является его низкая эффективность: высокие затраты времени, неоптимальные решения, отсутствие целостной актуальной картины состояния ВС. Управление ВС с использованием простейших систем мониторинга (рис. 1) позволяет избежать указанных недостатков.

На данный момент существует множество систем мониторинга этого типа: начиная от самых простых и бесплатных (NAGIOS), заканчивая большими по функционалу, дорогостоящими продуктами (ORACLE Monitoring System). Большинство из них обеспечивает достаточно полное, точное и понятное пользователю представление информации о текущем состоянии ВС, способно работать с широким спектром вычислительных машин, с различными операционными системами, а также с наиболее широко распространенными сервисами.

Рис. 1. Модель управления ВС с системой мониторинга:

X — входной вектор (процессы, сервисы, задачи и т.п.); У г — текущие значения показателей ВС; Б' — отображение системой мониторинга текущих значений показателей модели ВС; У тр — требуемое значение показателей ВС.

Наиболее развитые системы мониторинга способны прогнозировать изменение состояния системы по событийному принципу на одни шаг вперед, т.е., что будет, если случится такое-то событие. Это часто оказывается не совсем удобно и не вполне достаточно для правильного управления вычислительной системой. Допустим, в вычислительной системе несколько серверов, отвечающих за опреде-

ленный сервис. При выходе из строя одного из них нагрузка распределится на оставшиеся, при этом нагрузка на каждом из серверов возрастет. Такой сценарий событий некоторые мониторинговые системы способны предвидеть, но прогнозировать нагрузку (будущее состояние) оставшихся узлов не могут. Еще одним недостатком является то, что в такой ситуации при возрастании нагрузки на других серверах система мониторинга может сообщать о высокой нагрузке на серверах как об ошибке, несмотря на то, что такая нагрузка в этой конкретной ситуации является адекватной. В свою очередь, ложные ошибки могут скрыть действительно важные сбои, что может привести к более тяжелым последствиям как для всей вычислительной системы, так и для определенного сервиса в частности. Из этого можно сделать вывод, что для качественной системы мониторинга крайне желательно иметь гибкую систему оценки работы системы, а также уметь прогнозировать события на несколько шагов вперед.

Целью исследования является разработка системы мониторинга, позволяющей оценивать текущее состояние системы и принимать решения по управлению нагрузкой узлов на основе анализа текущей ситуации и прогноза ее развития.

Для гибкой системы оценки эффективности работы вычислительной системы построена следующая целевая функция:

где ,N21, ... - показатели текущей загрузки процессоров 1,2, ...п; п - количе-

ство процессоров в ВС; Лср1 - средняя текущая загрузка процессоров;

допустимая загрузка процессора; М^, М2, . - показатель текущей загрузки оперативной памяти 1,2, ...т; т - количество вычислительных узлов в ВС;

ная текущая загрузка оперативной памяти; Мтах - максимально допустимая загрузка оперативной памяти; Р - вектор текущего состояния эффективности вычислительной системы, зависящий от Л, М и т.д.

Кроме приведенных могут быть учтены и введены в систему (1) следующие показатели работы системы: количество обращений к жесткому диску, скорость чтения и записи жесткого диска, количество процессов и т.п.

Помимо грамотного представления и оценки текущей ситуации, также следует учитывать причину той или иной аварийной ситуации или сбоя. То есть, наделив систему мониторинга функцией поддержки принятия решений, можно качественно повысить уровень управления вычислительной системы. В общем виде процесс формирования рекомендательного решения можно разделить на 2 этапа:

1) анализ текущего состояния и определение возможной причины неправильной работы;

2) выработка действий, которые необходимо предпринять для устранения проблемы и возвращения работы ВС в нормальное состояние.

єр.ґ’

єр.ґ’

(1)

ЇУ = Ї(Р),

тах

к

} - максимальная текущая загрузка процессоров; Ы,

тах

максимально

- средняя текущая загрузка оперативной памяти; тах{Мка} - максималь-

к

Первый этап наиболее важен для возможности оперативного вмешательства в ход работы ВС в случае отклонения текущих значений показателей от их заданных значений. Причиной одних и тех же отклонений могут быть абсолютно разные события. Например, на одном узле - сервере базы данных - хранятся учетные записи пользователей, которые необходимы для выполнения пользователями программ на другом узле - сервере приложений (рис. 2).

Сервер баз данных

Рис. 2. Схема работы пользователей

В процессе работы возникает ситуация значительного увеличения времени выполнения процесса пользовательским приложением, что может затруднить работу всего сервера приложений. Возможны несколько причин такого поведения системы. Во-первых, на сервере приложений неисправен аппаратный компонент (процессор или оперативная память) и/или не хватает ресурсов этого компонента для работы такого количества пользователей/программ. Во-вторых, неисправен аппаратный компонент или не хватает его ресурсов на сервере базы данных. В-третьих, в дисковом массиве, в котором хранится база данных, вышел из строя один диск, что привело к замедлению чтения, и соответственно увеличило время ответа на запрос сервера базы данных, а это, в свою очередь, привело к увеличению времени ожидания программы пользователей на сервере приложений. Следовательно, для решения подобной проблемы необходимо сначала определить ее первопричину. Поэтому для снижения времени реакции персонала на возникшую проблему в вычислительной системе необходимо минимизировать время выяснения первопричины такого поведения системы.

Результат второго этапа представляет собой набор рекомендованных действий для устранения причины неправильной работы ВС, который должен учитывать текущее состояние ВС.

Существует множество методов для анализа и определения первопричины неправильной работы ВС. В настоящее время широкое распространение получили модели нейронных сетей, обладающие рядом преимуществ, таких как быстрая, параллельная обработка большого объема данных, умение обучаться и т.д. Простая модель нейронной сети, позволяющая проводить идентификацию представленной на рисунке 2 ситуации в ВС, показана на рис. 3.

Рис. 3. Модель нейронной сети для системы мониторинга ВС

На рис. 2 м1,И2 - входные векторы данных серверов базы данных и приложений; у1 ,у2,Уз - результаты обработки первого слоя нейронов; У - выходной вектор.

На вход нейронов подаются входные векторы с текущими значениями показателей работы серверов, после чего нейроны обрабатывают входные параметры согласно своим весовым коэффициентам и выдают результирующий сигнал. Сигналы со всех нейронов первого слоя суммируются, и на выходе получается результирующий вектор.

На рис. 4 представлена схема системы мониторинга, включающая блок поддержки принятия решений, основанный на нейронных сетях. Данная система мониторинга позволяет, помимо визуализации текущего состояния системы, анализировать состояние и выявлять возможные причины неправильной работы ВС. Кроме того, система мониторинга способна подстраиваться под изменения в структуре ВС, обеспечивая гибкую оценку состояния, что позволяет убрать ложные сообщения об ошибках в работе ВС. На основе статистики работы ВС можно прогнозировать поведение системы на несколько шагов вперед в случае возникновения каких-либо сбойных ситуаций.

База данных

Рис. 4. Система мониторинга ВС

На рис. 3 У? - текущие значения показателей ВС; Утр - требуемое значение показателей ВС.

Таким образом, предложен способ качественного улучшения управления вычислительной системой путем внедрения в систему мониторинга блока поддержки принятия решений на основе нейронных сетей.

Петраков Владимир Александрович

Федеральное государственное образовательное учреждения высшего профессионального образования «Южный федеральный университет» e-mail: kaf sau@mail.ru 344090, Ростов-на-Дону, ул. Мельчакова, 10 Тел.: +7(8632)696991

Богачев Дмитрий Николаевич

Федеральное государственное образовательное учреждения высшего профессионального образования «Южный федеральный университет»

E-mail: dennitca@mail.ru

Petrakov Vladimir Aleksandrovich

Federal State-Owned Educational Establishment of Higher Vocational Education

«Southern Federal University»

e-mail: kaf sau@mail.ru

10, Melchikova street, Rostov-on-Don, 344090

Phone: +7(8632)696991

Bogachev Dmitry Nikolaevich

Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University» e-mail: dennitca@mail.ru

УДК 621.345

А.И. Долгов, В.В. Преснухин, Д.В. Шихов МЕТОДИКА АЛГОРИТМИЗАЦИИ ПРИКЛАДНЫХ ЗАДАЧ

Предлагаемая методика представляет собой главным образом систему методов, с использованием которых может быть получен требуемый результат в алгоритмизации прикладных задач и предназначена для широкого круга инженерно-технических работников, не специализирующихся в области компьютерной техники, но привлекаемых к разработке прикладных задач, решаемых на ЭВМ в интересах автоматизации самых различных видов профессиональной деятельности.

Алгоритмизация; компьютерная техника.

A.I. Dolgov, V.V.Presnukhin, D.V.Shikhov TECHNIQUE OF ALGORITHMIZATION OF APPLIED PROBLEMS

The technique is offered for the first time represents mainly system of methods with which use the demanded result in algorithmization of applied problems can be received and is intended for a wide range of the technical officers who are not specialising in area of computer technics, but the applied problems involved in working out solved on the computer in interests of automation of the most various kinds ofprofessional work. Algorithmization; computer technics.

Появление средств автоматизации немыслимо без разработки соответствующего математического обеспечения, важнейшую составную часть которого представляют алгоритмы прикладных задач. Благодаря бурному развитию компьютерной техники и внедрению её в разнообразные области человеческой деятель-

i Надоели баннеры? Вы всегда можете отключить рекламу.