Wiki source code of Monitoring počítačové sítě
Last modified by Petr Havlíček on 03.08.2023 12:57
Show last authors
author | version | line-number | content |
---|---|---|---|
1 | Monitoring počítačové sítě je určen pro sledování stavu počítačové sítě, serverových systémů a služeb. Je určen zejména pro monitoring zařízení ve správě CIT, ale mohou zde být zařazeny i ostatní zařízení a služby v rámci univerzity. Služba zasílá notifikace pomocí elektronické pošty případně se dá nastavit zasílání SMS. | ||
2 | |||
3 | Webové rozhraní je k dispozici na adrese [[https:~~/~~/monitoring.vsb.cz>>url:https://monitoring.vsb.cz]]. Po přihlášení se zobrazí veškeré zařízení a služby, ke kterým máte práva. Seznam osob, kteří mohou zobrazit patřičný objekt jsou oddělené od seznamu osob, kterým jsou zasílány notifikace. Oba seznamy mohou být stejné, ale nemusí. | ||
4 | |||
5 | K dispozici jsou vzdálené kontroly síťových služeb (HTTP, HTTPS, HTTPS Certifikát, SFTP, SSH atd.). Po instalaci agenta (NRPE, NSClient++), lze provádět i lokální kontroly (CPU, RAM, DISK atd.). | ||
6 | |||
7 | Monitorovací server má FQDN nss.vsb.cz a používá IPv4 adresu 158.196.149.136 a IPv6 adresu 2001:718:1001:149::136. | ||
8 | |||
9 | |||
10 | == Práce s oznámeními == | ||
11 | |||
12 | Univerzitní instance řešení Icinga 2 a jeho grafického rozhraní Icinga Web 2 je ve výchozím stavu nastavena takto: | ||
13 | |||
14 | * kontrola každých **5 minut**, | ||
15 | * v případě problému se kontrola provádí co **1 minutu**, | ||
16 | * po **3 problémových výsledků** kontrol se zasílají notifikace o problémů, | ||
17 | * při přetrvajícím problému se notifikace opakuje každých **24 hodin**, | ||
18 | * notifikace nechodí při varovných stavech, pouze při **kritických**. | ||
19 | |||
20 | Časové intervaly a počty kontrol se dají případně upravit podle požadavků. | ||
21 | |||
22 | Pro objekty typu host se dá definovat závislost. Například pokud je server připojený do přepínač a má nastavenou závislost na tom přepínači, tak v případě výpadku přepínače nebude zasláno další oznámení ohledně nedostupnosti serveru. Nevýhoda ovšem je, že pokud správce serveru nedostává notifikace z daného přepínače, tak nebude informován o nedostupnosti svého serveru. | ||
23 | |||
24 | === **Základní akce a stavy v rámci webového rozhraní** === | ||
25 | |||
26 | * **Manuální kontrola** | ||
27 | ** Uživatel si přes tlačítko //Check now// může nechat provést kontrolu co nejdříve je to možné. | ||
28 | * **Vypnutí notifikací** | ||
29 | ** Uživatel může přepínačem //Notifications// u hosta nebo služby **trvale **vypnout zasílání notifikací. | ||
30 | ** (% style="color:#e74c3c" %)Pozor: vypnutí notifikací u hosta nevypíná notifikace pro jeho služby! | ||
31 | * **Vypnutí aktivních kontrol** | ||
32 | ** Uživatel může přepínačem //Active checks// u hosta nebo služby **trvale **vypnout kontrolu stavu. | ||
33 | ** Objekt zůstane v posledním známém stavu a **přestane se jeho stav sledovat**. | ||
34 | * **V řešení (//Acknowledge//)** | ||
35 | ** Pokud je služba v problémovém stavu, přes tlačítko //Acknowledge// lze označit službu, že je v řešení. | ||
36 | ** Tento stav vypne opětovné notifikace, ale sleduje stav. | ||
37 | ** (% style="color:#2ecc71" %)Výhoda je, že pokud přejde objekt do stavu OK, tak se opět zapnou notifikace. | ||
38 | * (% style="color:null" %)**Plánovaná údržba** | ||
39 | ** (% style="color:null" %)Uživatel může přes tlačítko //Downtimes// naplánovat servisní okno. | ||
40 | ** (% style="color:null" %)Pokud se nastavuje údržba na **hosta**, tak se ve aplikuje údržba i na **všechny služby**. | ||
41 | ** V základu se údržba plánuje na **1 hodinu** od současného času. | ||
42 | ** Po dobu údržby se sleduje stav služeb, ale neposílají se notifikace. | ||
43 | ** Po ukončení časového okna se notifikace automaticky opět povolí. | ||
44 | ** Informace o zahájení a ukončení servisního okna chodí pouze u **hosta** a pouze na **e-mail**. | ||
45 | |||
46 | (% class="wikigeneratedid" %) | ||
47 | Grafické rozhraní umožňuje v prostředním panelu pomocí kláves //SHIFT a CTRL(CMD)// provést více násobný výběr. Pokud chce použít nějakou z výše uvedených akcí na více objektech najednou, tak nejjednodušší je přes vyhledávaní tyto objekty najít a poté je všechny označit a v pravém panelu zavolat požadovanou akci, nad všemi vybranými. | ||
48 | |||
49 | === === | ||
50 | |||
51 | === Nejčastější příklady použití === | ||
52 | |||
53 | * **Krátkodobé zásahy na zařízení **(aktualizace, restart atd.) | ||
54 | ** Před zahájením prací naplánovat údržbu přes** //Downtimes//**//.// | ||
55 | ** Na zvolené období budou vypnuty notifikace **hosta i všech služeb**. | ||
56 | ** Všem správcům zařízení dojde oznámení o zahájení a ukončení servisního okna. | ||
57 | * **Neplánovaný dlouhodobý problém **(odstávka elektřiny, stěhovaní, malování atd.) | ||
58 | ** Po příchodu oznámení o výpadku použít tlačítko **//Acknowledge//** pro vypnutí opakovaných notifikací. | ||
59 | ** Je vhodné do komentáře dopsat důvod nedostupnosti ať se dá s odstupem času dohledat proč je objekt nedostupný. |