Monitoring počítačové sítě

Version 1.2 by bac0025 on 13.03.2015 09:51

Monitoring počítačové sítě je určen pro monitorování počítačové sítě, systémů a služeb v síti provozovaných. Je určen zejména pro monitoring prvků ve správě CIT, ale je možno jej využít i pro monitoring systémů a služeb provozovaných v počítačové síti VŠB-TU Ostrava. Upozornění o výpadku nebo obnovení provozu služby jsou zasílány prostřednictvím elektronické pošty, popř. prostřednictvím SMS.

Webové rozhraní monitoringu je k dispozici na adrese https://monitoring.vsb.cz. Při přístupu přes toto rozhraní, uvidíte veškeré systémy u nichž jste veden jako jeden z kontaktů.

Bez instalací na straně monitorovaného systému lze monitorovat všechny běžné síťové služby. Tedy například dostupnost web serveru (HTTP, HTTPS vč. virtuálních web serverů), SMTP, FTP, POP3 atd.

Pro monitorování vnitřních stavů systémů (např. volná paměť, obsazenost diskových prostorů, zatížení CPU, počet procesů apod.) je vhodné využít NRPE modul, popř. SNMP server. NRPE modul poskytuje větší možnosti správci monitorovaného systému, větší konfigurovatelnost (např. stanovení kritických hodnot). Při použití SNMP je nutné tyto kritické hodnoty definovat na straně monitorovacího systému. Proto je použití NRPE modulu preferováno. Jeho instalace je poměrně jednoduchá a je dostupná pro Unixové i Windows systémy.

Monitorovací systém má FQDN nss.vsb.cz a používá IPv4 adresu 158.196.149.136 a IPv6 adresu 2001:718:1001:149::136.

Unixové systémy

Serverový NRPE modul je dostupný ve většině Linuxových distribucí. Kromě něj si nainstalujte také pluginy (Nagios plugins), které bude spouštět. Instalace, konfigurace a spuštění NRPE trvá obvykle cca 30 minut.

Balíčky v distribucích obvykle nesou jméno nagios-nrpe-server, nagios-nrpe-plugin a nagios-plugins-basic (Debian GNU/Linux a Ubuntu).

Pokud Vaše distribuce neobsahuje příslušné balíky, můžete si stáhnout zdrojové kódy NRPE i Nagios plugins z Internetu.

Konfigurace souboru nrpe.cfg pak obvykle vypadá např. takto:

server_port=5666
allowed_hosts=158.196.149.136
nrpe_user=nrpe
nrpe_group=nrpe
dont_blame_nrpe=0
debug=0
command_timeout=60
command[check_load]=/usr/local/nrpe/check_load -w 2,3,3 -c 6,6,6
command[check_disk_root]=/usr/local/nrpe/check_disk 80 90 /dev/sda1
command[check_disk_log]=/usr/local/nrpe/check_disk 80 90 /dev/sda2
command[check_zombie_procs]=/usr/local/nrpe/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nrpe/check_procs -w 150 -c 200