Научная статья на тему 'СИСТЕМА МОНИТОРИНГА "OBSERVIUM"'

СИСТЕМА МОНИТОРИНГА "OBSERVIUM" Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
229
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕЛЕКОММУНИКАЦИЯ / ИНФОКОММУНИКАЦИЯ / СИСТЕМНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ / МОНИТОРИНГ / TELECOMMUNICATION / INFOCOMMUNICATION / SYSTEM SOFTWARE / MONITORING

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Панфилов К.В.

В данной статье проведен анализ системы мониторинга «Observium». Описаны и приведены её основные возможности. Описан случай её практического применения в поиске и устранении неисправности в сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MONITORING SYSTEM "OBSERVIUM"

The paper presents an analysis of monitoring system “Observium”. Description major opportunities of system. An example was provided of a case practical application in troubleshooting.

Текст научной работы на тему «СИСТЕМА МОНИТОРИНГА "OBSERVIUM"»

УДК 004.01

Панфилов К.В. студент 2 курса магистратуры Поволжский государственный университет телекоммуникаций и информатики

Россия, г. Самара СИСТЕМА МОНИТОРИНГА «OBSERVIUM»

Аннотация: В данной статье проведен анализ системы мониторинга «Observium». Описаны и приведены её основные возможности. Описан случай её практического применения в поиске и устранении неисправности в сети.

Ключевые слова: телекоммуникация, инфокоммуникация, системное программное обеспечение, мониторинг.

Panfilov K. V. students of magistracy

Povolzhskiy State University of Telecommunications and Informatics

Russia, Samara MONITORING SYSTEM «OBSERVIUM»

Abstract: The paper presents an analysis of monitoring system "Observium". Description major opportunities of system. An example was provided of a case practical application in troubleshooting.

Keywords: telecommunication, infocommunication, system software, monitoring

«Network monitoring with intuition» (рус. Интуитивная система мониторинга). Именно так характеризуют систему Observium ее разработчики. Основным отличием этой системы является ее простота в установке и управлении одновременно с ее широкими возможностями по наблюдению за сетевыми устройствами.

Система начала своё существование с 2005 года. Свое название «Observium» получила только в 2010 году. До этого система была известна как «Kikker», «Project Observer» и «ObserverNMS».

Установка и настройка системы занимает минимальное количество времени и ресурсов, имеет огромное количество поддерживаемых устройств с основным требованием - поддержка протокола SNMP (Simple Network Management Protocol).

Добавление отслеживаемых устройств можно производить вручную, либо в автоматическом режиме, в котором система самостоятельно определит наличие новых устройств. При добавлении устройства вручную можно использовать его IP адрес или его имя (hostname).

Система имеет простой, но в то же время информативный графический интерфейс. На главной странице (Рис. 1) имеется вся сводная информация об устройствах и их портах (доступных или недоступных), различных датчиков с отслеживаемых устройств (таких, как датчик температуры). Встроенная

карта наглядно отображает все доступное и недоступное оборудование. Если в настройках '^птр-1осайоп" присутствуют географические координаты (широта, долгота), то система автоматически разместит элемент на карте. Так же имеется возможность задать координаты вручную.

Aobservium • - щ Devices " flgl Ports "

Total Up Down Ignored (Dev) Disabled /Shut Ok Fail Delay Suppress Other

Devices 7 7 up Odown 0 ignored 0 disabled | Alerts 1 0 0 0 0

Ports 36 36 up Odown 115 (0) ignored 0 shutdown

Sensors 11 10 ok ldown 0 ignored 0 disabled

Statuses 9 9 ok 0 alert 0 ignored 0 disabled

Rozhdostveno

Leaflet | Map data © OpenStreetMap contributors. © CARTO

Status Warnings and Notifications

localhost

samara-gateway

smr-chem61-sl

smr-chem61-s2

smr-maya52a-sl

Recent Events

I 12m 13s localhost

Observium CE 18.9.9420

Hi localhost Hi samara-gateway smr-chemGl-sl ¿¿j smr-chern61-s2 smr-maya52a-sl

j=| localhost Device rebooted: after 4m 23s (Uptime: 4m 22s, previous: 17s, used: hrSystemUptime)

Uptime 14m 22s Uptime 7h 45m 52s Uptime lOh 31m 51s Uptime 8h 18m 18s Uptime llh 38m 2s

Ф О 0.074s -

Рис. 1 Главная страница Observium Страница обзора устройства (рис. 2) имеет всю сводную информацию, собранную посредством SNMP - модель, имя оборудования, операционная система и т.д. Отображаются все доступные модули, такие как оперативная и физическая память, загрузка процессора т.д.

Aobservium • - щ Devices т Hg Ports * samara-gateway.example.com

Samara [53.200792,50.114946]

Overview ^ Graphs Q Health teg Ports

I Logs • Alerts

RouterOS CCR1009-7G-1C Hardware Operating system System name Location Serial Uptime Last reboot

CCR1009-7G-1C

Mikrotik RouterOS 6.37,4 (Level 6) mikrotik

Samara [53.200792,50.114946] 79AF063EC563 7h 50m 52s 2019-02-1714:24:11

Щ Ports

■ Processors

| Processor

™ Memory

| main memory

□ Storage | system disk

EB Temperature

| Processor | System

V Voltage

| System

ED

Ç 9 S 2 Q 7

com bol, Et Herl, Ether2, Ether3, Ether*», Ethers, EtherS, EtherT, bridgeLocal

«о

□ Alert Log I lh 36m 51s snmp_ping

^ samara-gateway

Checks succeeded

Current

| System

w Power

| System

Mh Frequency

Lsysioe | Processor

28 m 10s lh 41m 21s ^^ 6h 41m 57s 7h 36m 56s | useradmin logged in from 192.168.1.6 via ssh | useradmin logged out from 192.168.1.6 via ssh | useradmin logged out from 192.168.1.6 via ssh | changed snmp settings by admin

Observium CE 18.9.9420 '4' Q 0.124s *

Рис. 2 Информация об устройстве Имеется возможность просмотра графиков доступности оборудования (Рис. 3), времени бесперебойной работы. Страница просмотра всех физически и логических интерфейсов, на котором показаны физические (MAC) адреса, утилизации интерфейсов и текущая скорость портов (10Mbps, 100Mbps и 1000Mbps) (Рис. 4). Также можно просмотреть таблицу ARP и карту физических соединений, построенную на основе протоколов CDP/LLDP (Рис. 5)._

Aobservium • - щ Devices т § Ports т Q Health т smr-kir425-rl.exmple.com

Smr-Kir425 [53.2601430,50.2171060]

4J Overview ^ Graphs щ Health $ Ports S Inventory Я Logs

т

Graphs System Processor Memory Storage DHCP Poller

Device Availability

■ Availability

Device Uptime

Current Historical

Now Avg Max

Now Avg Max

Observium CE 18.9.9420

Ф " 0 0.074s ж

Рис. 3 Сводные графики доступности оборудования

А

Á

smr-kir425-rl.exmple.com

Smr-Kir425 [53.2601430,50.2171060]

/

I Health lïgl Ports

! Inventory m Logs §.' Alerts

Ports Basic Details IPv4addresses ARP/NDP Table FDB Table Neighboi

Graphs """ Mi ni graphs •*■ Quick Filters '

Port

Etherl-wan

Ether2-m aster

± -T

bridge 1-ian

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

192,168.1.1/24

Observium CE 18.9.9420

4

T

Traffic Speed MAC Address

О 911kbps Ethernet 64:dl:54:44:9d:Sa

О 53.1kbps 100Mbps 2019-02-1922:44:43

О 92pps MTU 1500

О 36pps

О 63kbps Ethernet 64:dl:54:443d:8b

О 938kbps lGbps 2019-02-19 22:44:43

О 41pps MTU 1500

О 99pps

Ethernet 64:dl:54:44:9d:Sc

2019-02-1922:44:43

MTU 1500

О 35kbps Ethernet 64:dl:54:44:9d:Sd

О 20.2kbps 100Mbps 2019-02-1922:44:43

09pps MTU 1500

OSpps

Ethernet 64:dl:54:44:9d:8e

2019-02-1922:44:43

MTU 1500

Oôibps IEEES02.1I Radio 64:dl:54:44:9d:8f

О 592bps 50Mbps 2019-02-1922:44:43

Od PPS MTU 1500

О Ipps

О 51.7kbps Transparent bridge 64:dl:54:443d:8b

©908kbps interface 2019-02-19 22:44:43

О 38pps 100Mbps

О 95ppS MTU 1500

0 6C3B6BEA2244onsamara-satenfav.examole.com1ТТГ7Д

bridgeLocal on samara-gateway • ■ System on smr-maya52a-sl^^Q

■ ■ Vlanifl on smr-chern61-s2 ГЛ ff Et_32769 on workstation-1 Щ

■ I* Vianl on smr-chernfil-slЯ5Я 00IE53 AS21B1 oi sl.example.com

• - О о»1

Рис. 4 Информация по портам

sm г ki rt25-rl.exmple.com

Smr Kir425 [53.2601430,50.2171060]

i

4J Overview ^ Graphs Q Health 1*1 Ports S Inventory dB Logs Alerts 1 ■» -

Ports Basic Details IPv4 addresses ARP/NDP Table FDBTable Neighbours Map Graphs * Minigraphs *

smr-kir425-r1 .exmple.com

bndgel-lan

6C 3B SB EA 22 44

C4 OA CB CB C6 8B

00 1E 56 AS 21 B1

samara-gateway.example.com SM R-Chern61 -s1 .switch .example.com smr-maya52a-s1.example.com

Рис. 5 Карта на основе протокола LLDP Observшm поддерживает сбор и хранение журналируемых сообщений Sys1og и их удобный просмотр (Рис. 6) с функцией фильтрации по типу сообщения, времени, имени оборудования и т.д.

Priorities Prograrr▼ Date presets ▼ ÜFrom g|To Q. S

214 Items 12 3 Next #100 ▼

Date Device Priority [Program] [Tags] Message

2019-02-2012:29:17 smr-chernGl- ИЯДШЯМГЯ 1Я1ЯГНГ1 MSTP received BPDU with TC. MSTP process 0 instance 0. port name is EthernetO/O/12. s2

2019-02-2015:29:45 smr-maya52a- 1ДЯДИЯ1ТОЯ ^^Д Topology changed (lnstance:0 port:3) si

2019-02-2012:29:15 smr-chernGl- 1Я?ЯСТИЯГ!!1 MSTP received BPDU with TC, MSTP process 0 instance 0, port name is Ethernet0/0/12. s2

2019-02-2015:29:41 smr-maya52a- ЦИИДНУЕД ^^ Port 3 linkup, 100Mbps FULL duplex si

2019-02-2015:29:39 smr-maya52a- 1ЯЯ?ИЯДТН1 ^^Д Port 3 link down si

2019-02-2015:29:48 smr-kir425-rl ether2-master link up (speed 1G, full duplex)

2019-02-2015:29:41 smr-kir425-rl ggjgggiTBl 1ГТ77?гЭТЧ1Ш1 ether2-master Link down

2019-02-70 1?:?7:9? smr-rhprnfil- J |Щ|| OID: 1.0.flR0?.1.1.?.0.0.1 Neighbor information is changed. (1IripStatKRemTaMpslnsprtsFl,1 MpSt3t4RemTablMDplefps=fl,

s2 LldpStatsRemTablesDrops=0J LldpStatsRemTablesAgeouts=0)

2019-02-2012:27:03 smr-chernGl- IffflfflWffiWBl MSTP received BPDU with TC, MSTP process 0 instance 0, port name is EthernetO/O/12. s2

2019-02-2015:27:31 smr-maya52a- IWffffiCTifflfBl ^^Д Topology changed (Instances port:7) si

2019-02-2012:27:01 smr-chernGl- 1ЯЯДЯЯДГЯ MSTP received BPDU with TC, MSTP process 0 instance 0, port name is Ethernet0/0/12. s2

2019-02-2012:27:01 smr-chernGl- ИВЯЯУЯЯГЯ РЯВТТЕТЯ In MSTP process 0 instance 0. MSTP set port EthemetO/O/12 state as forwarding. s2

2019-02-2015:26:05 smr-chernGl- 1ЯДЯЯ!ВТЕЯ %% 01 ¡C/6/SYS_RESTART(l):System restarted -Huawei Versatile Routing Platform Software.Copyright (c) 2000-2002 by VRP Team Beijing Institute

s2 Huawei Tech, Inc.

2019-02-2015:26:05 smr-chernGl- IffWBICTifflfBl ^^ 01 !C/6/SVS_RESTART(l):System restarted --Huawei Versatile Routing Platform Software.Copyright (c) 2000-2002 by VRP Team Beijing Institute

s2 Huawei Tech, Inc.

2019-02-2015:27:25 smr-maya52a- 1ЯЯДЯЯДТЙ1 ^^ Port 7 link up, 100Mbps FULL duplex si

2019-02-2015:26:06 smr-maya52a- ДЯДЯЯ ^^Д Port 7 link down si

2019-02-2015:26:04 smr-maya52a- IffflffWffiWBl ^^ Port 7 link up, 100Mbps FULL duplex

ObservTumCE 18.9.9420 ф- © 0.077s-

Рис. 6 Syslog в Observium Закладка «Alerts» представляет собой функцию автоматического оповещения администратора через SMS, E-mail и т.д. в случае возникновения изменения в состоянии отслеживаемого объекта. На рисунке ниже (Рис.7) представлен пример оповещения по E-mail о возникновении проблемы (недоступность). Система так же может повторно уведомлять администратора при разрешени проблемы (оборудование стало доступно) (Рис. 8)

| ALERT

Alert

Entity

Conditions

Metrics

Duration

Device

Device

Hardware

Operating System

Location

Uptime

Modify

Device.status samara-gateway

device.status equals 0 (0) device.status = 0 1 day, 10m (2019-02-17 22:25:04)

samara-gateway.example.com

CCR1009-7G-1C

Mikrotik RouterOS 6.37.4 (Level 6) Samara [53.200792,50.114946] Down 1 day, 10m

device_ping

Wed 12:00 Thu 00:00 Thu 12:00 Fri 00:00

Рис.7 E-mail оповещение о недоступности устройства

^ английский ▼ > русский ▼ Перевести сообщение

| RECOVER

Alert

Entity

Metrics

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Duration

Device

Device

Hardware

Operating System

Location

Uptime

Modify

Device.status samara-gateway

device.status = 1 Os (2019-02-2018:25:04)

samara-gateway.example.com

CCR1009-7G-1С

Mikrotik RouterOS 6.37.4 (Level 6) Samara [53.200792,50.114946] 2m 33s

device_ping

Рис. 8 E-mail оповещение о восстановление устройства На практике система помогла выявить множество проблем в сети. Ориентируясь только по графикам, удалось выявить, с чем связано резкая нагрузка процессора (Рис. 9), в этот же временной промежуток в сети был выявлен шторм широковещательных пакетов (Broadcast storm) (Рис. 10), а с графика всех интерфейсов выявили порт-источник широковещательного

трафика (Рис. 11) (на графике входящий трафик выделен фиолетовым цветом).

Рис. 9 График cpu коммутатора

Now Avg Min Max

Rx 729,82m 8.00 603.09m 259.47

Tx 16,84m 43.08m 16.61m 967.82m

□ Multicast Rx 0,00 1.03m 0.00 235.72m

□ Tx 590,23m 632.82m 549.61m 1.26

Рис. 10 График broadcast и multicast трафика

D-Link DES-3028 R2.94 Port 1 J D-Link DES-3028 R2.94 Port 2 D-Link DES-3028 R2.94 Port 3 D-Link DES-3028 R2.94 Port 4 D-Link DES-3028 R2.94 Port 5 D-Link DES-3028 R2.94 Port 6

D-Link DES-3028 R2.94 Port 7 D-Link DES-3028 R2.94 Port 8 D-Link DES-3028 R2.94 Port 9 D-Link DES-3028 R2.94 Port 10 D-Link DES-3028 R2.94 Port 11 D-Link DES-3028 R2.94 Port 12

T 1 '

Рис 11. График broadcast и multicast трафика со всех интерфейсов Подводя итоги можно выделить основные достоинства системы: простота в установке, простой и удобный интерфейс, поддержка огромного количества различного оборудования. Наличие различных дополнительных инструментов (уже встроенных или добавленных) таких, как сбор, хранение и отображения журналируемых сообщений Syslog, конфигурационных файлов отслеживаемого оборудования посредством Rancid, отслеживание протоколов маршрутизации (OSPF, BGP, EIGRP) и т.д.

Использованные источники: 1. Jianguo Ding «Advances in Network Management» Auerbach Publications 2016 360 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.