УДК 004.01
Панфилов К.В. студент 2 курса магистратуры Поволжский государственный университет телекоммуникаций и информатики
Россия, г. Самара СИСТЕМА МОНИТОРИНГА «OBSERVIUM»
Аннотация: В данной статье проведен анализ системы мониторинга «Observium». Описаны и приведены её основные возможности. Описан случай её практического применения в поиске и устранении неисправности в сети.
Ключевые слова: телекоммуникация, инфокоммуникация, системное программное обеспечение, мониторинг.
Panfilov K. V. students of magistracy
Povolzhskiy State University of Telecommunications and Informatics
Russia, Samara MONITORING SYSTEM «OBSERVIUM»
Abstract: The paper presents an analysis of monitoring system "Observium". Description major opportunities of system. An example was provided of a case practical application in troubleshooting.
Keywords: telecommunication, infocommunication, system software, monitoring
«Network monitoring with intuition» (рус. Интуитивная система мониторинга). Именно так характеризуют систему Observium ее разработчики. Основным отличием этой системы является ее простота в установке и управлении одновременно с ее широкими возможностями по наблюдению за сетевыми устройствами.
Система начала своё существование с 2005 года. Свое название «Observium» получила только в 2010 году. До этого система была известна как «Kikker», «Project Observer» и «ObserverNMS».
Установка и настройка системы занимает минимальное количество времени и ресурсов, имеет огромное количество поддерживаемых устройств с основным требованием - поддержка протокола SNMP (Simple Network Management Protocol).
Добавление отслеживаемых устройств можно производить вручную, либо в автоматическом режиме, в котором система самостоятельно определит наличие новых устройств. При добавлении устройства вручную можно использовать его IP адрес или его имя (hostname).
Система имеет простой, но в то же время информативный графический интерфейс. На главной странице (Рис. 1) имеется вся сводная информация об устройствах и их портах (доступных или недоступных), различных датчиков с отслеживаемых устройств (таких, как датчик температуры). Встроенная
карта наглядно отображает все доступное и недоступное оборудование. Если в настройках '^птр-1осайоп" присутствуют географические координаты (широта, долгота), то система автоматически разместит элемент на карте. Так же имеется возможность задать координаты вручную.
Aobservium • - щ Devices " flgl Ports "
Total Up Down Ignored (Dev) Disabled /Shut Ok Fail Delay Suppress Other
Devices 7 7 up Odown 0 ignored 0 disabled | Alerts 1 0 0 0 0
Ports 36 36 up Odown 115 (0) ignored 0 shutdown
Sensors 11 10 ok ldown 0 ignored 0 disabled
Statuses 9 9 ok 0 alert 0 ignored 0 disabled
Rozhdostveno
Leaflet | Map data © OpenStreetMap contributors. © CARTO
Status Warnings and Notifications
localhost
samara-gateway
smr-chem61-sl
smr-chem61-s2
smr-maya52a-sl
Recent Events
I 12m 13s localhost
Observium CE 18.9.9420
Hi localhost Hi samara-gateway smr-chemGl-sl ¿¿j smr-chern61-s2 smr-maya52a-sl
j=| localhost Device rebooted: after 4m 23s (Uptime: 4m 22s, previous: 17s, used: hrSystemUptime)
Uptime 14m 22s Uptime 7h 45m 52s Uptime lOh 31m 51s Uptime 8h 18m 18s Uptime llh 38m 2s
Ф О 0.074s -
Рис. 1 Главная страница Observium Страница обзора устройства (рис. 2) имеет всю сводную информацию, собранную посредством SNMP - модель, имя оборудования, операционная система и т.д. Отображаются все доступные модули, такие как оперативная и физическая память, загрузка процессора т.д.
Aobservium • - щ Devices т Hg Ports * samara-gateway.example.com
Samara [53.200792,50.114946]
Overview ^ Graphs Q Health teg Ports
I Logs • Alerts
■
RouterOS CCR1009-7G-1C Hardware Operating system System name Location Serial Uptime Last reboot
CCR1009-7G-1C
Mikrotik RouterOS 6.37,4 (Level 6) mikrotik
Samara [53.200792,50.114946] 79AF063EC563 7h 50m 52s 2019-02-1714:24:11
Щ Ports
■ Processors
| Processor
™ Memory
| main memory
□ Storage | system disk
EB Temperature
| Processor | System
V Voltage
| System
ED
Ç 9 S 2 Q 7
com bol, Et Herl, Ether2, Ether3, Ether*», Ethers, EtherS, EtherT, bridgeLocal
«о
□ Alert Log I lh 36m 51s snmp_ping
^ samara-gateway
Checks succeeded
Current
| System
w Power
| System
Mh Frequency
Lsysioe | Processor
28 m 10s lh 41m 21s ^^ 6h 41m 57s 7h 36m 56s | useradmin logged in from 192.168.1.6 via ssh | useradmin logged out from 192.168.1.6 via ssh | useradmin logged out from 192.168.1.6 via ssh | changed snmp settings by admin
Observium CE 18.9.9420 '4' Q 0.124s *
Рис. 2 Информация об устройстве Имеется возможность просмотра графиков доступности оборудования (Рис. 3), времени бесперебойной работы. Страница просмотра всех физически и логических интерфейсов, на котором показаны физические (MAC) адреса, утилизации интерфейсов и текущая скорость портов (10Mbps, 100Mbps и 1000Mbps) (Рис. 4). Также можно просмотреть таблицу ARP и карту физических соединений, построенную на основе протоколов CDP/LLDP (Рис. 5)._
Aobservium • - щ Devices т § Ports т Q Health т smr-kir425-rl.exmple.com
Smr-Kir425 [53.2601430,50.2171060]
4J Overview ^ Graphs щ Health $ Ports S Inventory Я Logs
т
Graphs System Processor Memory Storage DHCP Poller
Device Availability
■ Availability
Device Uptime
Current Historical
Now Avg Max
Now Avg Max
Observium CE 18.9.9420
Ф " 0 0.074s ж
Рис. 3 Сводные графики доступности оборудования
А
Á
smr-kir425-rl.exmple.com
Smr-Kir425 [53.2601430,50.2171060]
/
I Health lïgl Ports
! Inventory m Logs §.' Alerts
Ports Basic Details IPv4addresses ARP/NDP Table FDB Table Neighboi
Graphs """ Mi ni graphs •*■ Quick Filters '
Port
Etherl-wan
Ether2-m aster
± -T
bridge 1-ian
192,168.1.1/24
Observium CE 18.9.9420
4
T
Traffic Speed MAC Address
О 911kbps Ethernet 64:dl:54:44:9d:Sa
О 53.1kbps 100Mbps 2019-02-1922:44:43
О 92pps MTU 1500
О 36pps
О 63kbps Ethernet 64:dl:54:443d:8b
О 938kbps lGbps 2019-02-19 22:44:43
О 41pps MTU 1500
О 99pps
Ethernet 64:dl:54:44:9d:Sc
2019-02-1922:44:43
MTU 1500
О 35kbps Ethernet 64:dl:54:44:9d:Sd
О 20.2kbps 100Mbps 2019-02-1922:44:43
09pps MTU 1500
OSpps
Ethernet 64:dl:54:44:9d:8e
2019-02-1922:44:43
MTU 1500
Oôibps IEEES02.1I Radio 64:dl:54:44:9d:8f
О 592bps 50Mbps 2019-02-1922:44:43
Od PPS MTU 1500
О Ipps
О 51.7kbps Transparent bridge 64:dl:54:443d:8b
©908kbps interface 2019-02-19 22:44:43
О 38pps 100Mbps
О 95ppS MTU 1500
0 6C3B6BEA2244onsamara-satenfav.examole.com1ТТГ7Д
bridgeLocal on samara-gateway • ■ System on smr-maya52a-sl^^Q
■ ■ Vlanifl on smr-chern61-s2 ГЛ ff Et_32769 on workstation-1 Щ
■ I* Vianl on smr-chernfil-slЯ5Я 00IE53 AS21B1 oi sl.example.com
• - О о»1
Рис. 4 Информация по портам
sm г ki rt25-rl.exmple.com
Smr Kir425 [53.2601430,50.2171060]
i
4J Overview ^ Graphs Q Health 1*1 Ports S Inventory dB Logs Alerts 1 ■» -
Ports Basic Details IPv4 addresses ARP/NDP Table FDBTable Neighbours Map Graphs * Minigraphs *
smr-kir425-r1 .exmple.com
bndgel-lan
6C 3B SB EA 22 44
C4 OA CB CB C6 8B
00 1E 56 AS 21 B1
samara-gateway.example.com SM R-Chern61 -s1 .switch .example.com smr-maya52a-s1.example.com
Рис. 5 Карта на основе протокола LLDP Observшm поддерживает сбор и хранение журналируемых сообщений Sys1og и их удобный просмотр (Рис. 6) с функцией фильтрации по типу сообщения, времени, имени оборудования и т.д.
Priorities Prograrr▼ Date presets ▼ ÜFrom g|To Q. S
214 Items 12 3 Next #100 ▼
Date Device Priority [Program] [Tags] Message
2019-02-2012:29:17 smr-chernGl- ИЯДШЯМГЯ 1Я1ЯГНГ1 MSTP received BPDU with TC. MSTP process 0 instance 0. port name is EthernetO/O/12. s2
2019-02-2015:29:45 smr-maya52a- 1ДЯДИЯ1ТОЯ ^^Д Topology changed (lnstance:0 port:3) si
2019-02-2012:29:15 smr-chernGl- 1Я?ЯСТИЯГ!!1 MSTP received BPDU with TC, MSTP process 0 instance 0, port name is Ethernet0/0/12. s2
2019-02-2015:29:41 smr-maya52a- ЦИИДНУЕД ^^ Port 3 linkup, 100Mbps FULL duplex si
2019-02-2015:29:39 smr-maya52a- 1ЯЯ?ИЯДТН1 ^^Д Port 3 link down si
2019-02-2015:29:48 smr-kir425-rl ether2-master link up (speed 1G, full duplex)
2019-02-2015:29:41 smr-kir425-rl ggjgggiTBl 1ГТ77?гЭТЧ1Ш1 ether2-master Link down
2019-02-70 1?:?7:9? smr-rhprnfil- J |Щ|| OID: 1.0.flR0?.1.1.?.0.0.1 Neighbor information is changed. (1IripStatKRemTaMpslnsprtsFl,1 MpSt3t4RemTablMDplefps=fl,
s2 LldpStatsRemTablesDrops=0J LldpStatsRemTablesAgeouts=0)
2019-02-2012:27:03 smr-chernGl- IffflfflWffiWBl MSTP received BPDU with TC, MSTP process 0 instance 0, port name is EthernetO/O/12. s2
2019-02-2015:27:31 smr-maya52a- IWffffiCTifflfBl ^^Д Topology changed (Instances port:7) si
2019-02-2012:27:01 smr-chernGl- 1ЯЯДЯЯДГЯ MSTP received BPDU with TC, MSTP process 0 instance 0, port name is Ethernet0/0/12. s2
2019-02-2012:27:01 smr-chernGl- ИВЯЯУЯЯГЯ РЯВТТЕТЯ In MSTP process 0 instance 0. MSTP set port EthemetO/O/12 state as forwarding. s2
2019-02-2015:26:05 smr-chernGl- 1ЯДЯЯ!ВТЕЯ %% 01 ¡C/6/SYS_RESTART(l):System restarted -Huawei Versatile Routing Platform Software.Copyright (c) 2000-2002 by VRP Team Beijing Institute
s2 Huawei Tech, Inc.
2019-02-2015:26:05 smr-chernGl- IffWBICTifflfBl ^^ 01 !C/6/SVS_RESTART(l):System restarted --Huawei Versatile Routing Platform Software.Copyright (c) 2000-2002 by VRP Team Beijing Institute
s2 Huawei Tech, Inc.
2019-02-2015:27:25 smr-maya52a- 1ЯЯДЯЯДТЙ1 ^^ Port 7 link up, 100Mbps FULL duplex si
2019-02-2015:26:06 smr-maya52a- ДЯДЯЯ ^^Д Port 7 link down si
2019-02-2015:26:04 smr-maya52a- IffflffWffiWBl ^^ Port 7 link up, 100Mbps FULL duplex
ObservTumCE 18.9.9420 ф- © 0.077s-
Рис. 6 Syslog в Observium Закладка «Alerts» представляет собой функцию автоматического оповещения администратора через SMS, E-mail и т.д. в случае возникновения изменения в состоянии отслеживаемого объекта. На рисунке ниже (Рис.7) представлен пример оповещения по E-mail о возникновении проблемы (недоступность). Система так же может повторно уведомлять администратора при разрешени проблемы (оборудование стало доступно) (Рис. 8)
| ALERT
Alert
Entity
Conditions
Metrics
Duration
Device
Device
Hardware
Operating System
Location
Uptime
Modify
Device.status samara-gateway
device.status equals 0 (0) device.status = 0 1 day, 10m (2019-02-17 22:25:04)
samara-gateway.example.com
CCR1009-7G-1C
Mikrotik RouterOS 6.37.4 (Level 6) Samara [53.200792,50.114946] Down 1 day, 10m
device_ping
Wed 12:00 Thu 00:00 Thu 12:00 Fri 00:00
Рис.7 E-mail оповещение о недоступности устройства
^ английский ▼ > русский ▼ Перевести сообщение
| RECOVER
Alert
Entity
Metrics
Duration
Device
Device
Hardware
Operating System
Location
Uptime
Modify
Device.status samara-gateway
device.status = 1 Os (2019-02-2018:25:04)
samara-gateway.example.com
CCR1009-7G-1С
Mikrotik RouterOS 6.37.4 (Level 6) Samara [53.200792,50.114946] 2m 33s
device_ping
Рис. 8 E-mail оповещение о восстановление устройства На практике система помогла выявить множество проблем в сети. Ориентируясь только по графикам, удалось выявить, с чем связано резкая нагрузка процессора (Рис. 9), в этот же временной промежуток в сети был выявлен шторм широковещательных пакетов (Broadcast storm) (Рис. 10), а с графика всех интерфейсов выявили порт-источник широковещательного
трафика (Рис. 11) (на графике входящий трафик выделен фиолетовым цветом).
Рис. 9 График cpu коммутатора
Now Avg Min Max
Rx 729,82m 8.00 603.09m 259.47
Tx 16,84m 43.08m 16.61m 967.82m
□ Multicast Rx 0,00 1.03m 0.00 235.72m
□ Tx 590,23m 632.82m 549.61m 1.26
Рис. 10 График broadcast и multicast трафика
D-Link DES-3028 R2.94 Port 1 J D-Link DES-3028 R2.94 Port 2 D-Link DES-3028 R2.94 Port 3 D-Link DES-3028 R2.94 Port 4 D-Link DES-3028 R2.94 Port 5 D-Link DES-3028 R2.94 Port 6
D-Link DES-3028 R2.94 Port 7 D-Link DES-3028 R2.94 Port 8 D-Link DES-3028 R2.94 Port 9 D-Link DES-3028 R2.94 Port 10 D-Link DES-3028 R2.94 Port 11 D-Link DES-3028 R2.94 Port 12
T 1 '
Рис 11. График broadcast и multicast трафика со всех интерфейсов Подводя итоги можно выделить основные достоинства системы: простота в установке, простой и удобный интерфейс, поддержка огромного количества различного оборудования. Наличие различных дополнительных инструментов (уже встроенных или добавленных) таких, как сбор, хранение и отображения журналируемых сообщений Syslog, конфигурационных файлов отслеживаемого оборудования посредством Rancid, отслеживание протоколов маршрутизации (OSPF, BGP, EIGRP) и т.д.
Использованные источники: 1. Jianguo Ding «Advances in Network Management» Auerbach Publications 2016 360 p.