Last modified by Petr Havlíček on 03.08.2023 12:57

Show last authors
1 Monitoring počítačové sítě je určen pro sledování stavu počítačové sítě, serverových systémů a služeb. Je určen zejména pro monitoring zařízení ve správě CIT, ale mohou zde být zařazeny i ostatní zařízení a služby v rámci univerzity. Služba zasílá notifikace pomocí elektronické pošty případně se dá nastavit zasílání SMS.
2
3 Webové rozhraní je k dispozici na adrese [[https:~~/~~/monitoring.vsb.cz>>url:https://monitoring.vsb.cz]]. Po přihlášení se zobrazí veškeré zařízení a služby, ke kterým máte práva. Seznam osob, kteří mohou zobrazit patřičný objekt jsou oddělené od seznamu osob, kterým jsou zasílány notifikace. Oba seznamy mohou být stejné, ale nemusí.
4
5 K dispozici jsou vzdálené kontroly síťových služeb (HTTP, HTTPS, HTTPS Certifikát, SFTP, SSH atd.). Po instalaci agenta (NRPE, NSClient++), lze provádět i lokální kontroly (CPU, RAM, DISK atd.).
6
7 Monitorovací server má FQDN nss.vsb.cz a používá IPv4 adresu 158.196.149.136 a IPv6 adresu 2001:718:1001:149::136.
8
9
10 == Práce s oznámeními ==
11
12 Univerzitní instance řešení Icinga 2 a jeho grafického rozhraní Icinga Web 2 je ve výchozím stavu nastavena takto:
13
14 * kontrola každých **5 minut**,
15 * v případě problému se kontrola provádí co **1 minutu**,
16 * po **3 problémových výsledků** kontrol se zasílají notifikace o problémů,
17 * při přetrvajícím problému se notifikace opakuje každých **24 hodin**,
18 * notifikace nechodí při varovných stavech, pouze při **kritických**.
19
20 Časové intervaly a počty kontrol se dají případně upravit podle požadavků.
21
22 Pro objekty typu host se dá definovat závislost. Například pokud je server připojený do přepínač a má nastavenou závislost na tom přepínači, tak v případě výpadku přepínače nebude zasláno další oznámení ohledně nedostupnosti serveru. Nevýhoda ovšem je, že pokud správce serveru nedostává notifikace z daného přepínače, tak nebude informován o nedostupnosti svého serveru.
23
24 === **Základní akce a stavy v rámci webového rozhraní** ===
25
26 * **Manuální kontrola**
27 ** Uživatel si přes tlačítko //Check now// může nechat provést kontrolu co nejdříve je to možné.
28 * **Vypnutí notifikací**
29 ** Uživatel může přepínačem //Notifications// u hosta nebo služby **trvale **vypnout zasílání notifikací.
30 ** (% style="color:#e74c3c" %)Pozor: vypnutí notifikací u hosta nevypíná notifikace pro jeho služby!
31 * **Vypnutí aktivních kontrol**
32 ** Uživatel může přepínačem //Active checks// u hosta nebo služby **trvale **vypnout kontrolu stavu.
33 ** Objekt zůstane v posledním známém stavu a **přestane se jeho stav sledovat**.
34 * **V řešení (//Acknowledge//)**
35 ** Pokud je služba v problémovém stavu, přes tlačítko //Acknowledge// lze označit službu, že je v řešení.
36 ** Tento stav vypne opětovné notifikace, ale sleduje stav.
37 ** (% style="color:#2ecc71" %)Výhoda je, že pokud přejde objekt do stavu OK, tak se opět zapnou notifikace.
38 * (% style="color:null" %)**Plánovaná údržba**
39 ** (% style="color:null" %)Uživatel může přes tlačítko //Downtimes// naplánovat servisní okno.
40 ** (% style="color:null" %)Pokud se nastavuje údržba na **hosta**, tak se ve aplikuje údržba i na **všechny služby**.
41 ** V základu se údržba plánuje na **1 hodinu** od současného času.
42 ** Po dobu údržby se sleduje stav služeb, ale neposílají se notifikace.
43 ** Po ukončení časového okna se notifikace automaticky opět povolí.
44 ** Informace o zahájení a ukončení servisního okna chodí pouze u **hosta** a pouze na **e-mail**.
45
46 (% class="wikigeneratedid" %)
47 Grafické rozhraní umožňuje v prostředním panelu pomocí kláves //SHIFT a CTRL(CMD)// provést více násobný výběr. Pokud chce použít nějakou z výše uvedených akcí na více objektech najednou, tak nejjednodušší je přes vyhledávaní tyto objekty najít a poté je všechny označit a v pravém panelu zavolat požadovanou akci, nad všemi vybranými.
48
49 === ===
50
51 === Nejčastější příklady použití ===
52
53 * **Krátkodobé zásahy na zařízení **(aktualizace, restart atd.)
54 ** Před zahájením prací naplánovat údržbu přes** //Downtimes//**//.//
55 ** Na zvolené období budou vypnuty notifikace **hosta i všech služeb**.
56 ** Všem správcům zařízení dojde oznámení o zahájení a ukončení servisního okna.
57 * **Neplánovaný dlouhodobý problém **(odstávka elektřiny, stěhovaní, malování atd.)
58 ** Po příchodu oznámení o výpadku použít tlačítko **//Acknowledge//** pro vypnutí opakovaných notifikací.
59 ** Je vhodné do komentáře dopsat důvod nedostupnosti ať se dá s odstupem času dohledat proč je objekt nedostupný.