Wiki source code of Monitoring počítačové sítě
Last modified by Petr Havlíček on 03.08.2023 12:57
Hide last authors
author | version | line-number | content |
---|---|---|---|
![]() |
2.1 | 1 | Monitoring počítačové sítě je určen pro sledování stavu počítačové sítě, serverových systémů a služeb. Je určen zejména pro monitoring zařízení ve správě CIT, ale mohou zde být zařazeny i ostatní zařízení a služby v rámci univerzity. Služba zasílá notifikace pomocí elektronické pošty případně se dá nastavit zasílání SMS. |
![]() |
1.2 | 2 | |
![]() |
2.1 | 3 | Webové rozhraní je k dispozici na adrese [[https:~~/~~/monitoring.vsb.cz>>url:https://monitoring.vsb.cz]]. Po přihlášení se zobrazí veškeré zařízení a služby, ke kterým máte práva. Seznam osob, kteří mohou zobrazit patřičný objekt jsou oddělené od seznamu osob, kterým jsou zasílány notifikace. Oba seznamy mohou být stejné, ale nemusí. |
![]() |
1.2 | 4 | |
![]() |
2.1 | 5 | K dispozici jsou vzdálené kontroly síťových služeb (HTTP, HTTPS, HTTPS Certifikát, SFTP, SSH atd.). Po instalaci agenta (NRPE, NSClient++), lze provádět i lokální kontroly (CPU, RAM, DISK atd.). |
![]() |
1.2 | 6 | |
![]() |
2.1 | 7 | Monitorovací server má FQDN nss.vsb.cz a používá IPv4 adresu 158.196.149.136 a IPv6 adresu 2001:718:1001:149::136. |
8 | |||
![]() |
1.2 | 9 | |
![]() |
2.1 | 10 | == Práce s oznámeními == |
![]() |
1.2 | 11 | |
![]() |
2.1 | 12 | Univerzitní instance řešení Icinga 2 a jeho grafického rozhraní Icinga Web 2 je ve výchozím stavu nastavena takto: |
![]() |
1.2 | 13 | |
![]() |
2.1 | 14 | * kontrola každých **5 minut**, |
15 | * v případě problému se kontrola provádí co **1 minutu**, | ||
16 | * po **3 problémových výsledků** kontrol se zasílají notifikace o problémů, | ||
17 | * při přetrvajícím problému se notifikace opakuje každých **24 hodin**, | ||
18 | * notifikace nechodí při varovných stavech, pouze při **kritických**. | ||
![]() |
1.2 | 19 | |
![]() |
2.1 | 20 | Časové intervaly a počty kontrol se dají případně upravit podle požadavků. |
![]() |
1.2 | 21 | |
![]() |
2.1 | 22 | Pro objekty typu host se dá definovat závislost. Například pokud je server připojený do přepínač a má nastavenou závislost na tom přepínači, tak v případě výpadku přepínače nebude zasláno další oznámení ohledně nedostupnosti serveru. Nevýhoda ovšem je, že pokud správce serveru nedostává notifikace z daného přepínače, tak nebude informován o nedostupnosti svého serveru. |
![]() |
1.2 | 23 | |
![]() |
2.1 | 24 | === **Základní akce a stavy v rámci webového rozhraní** === |
![]() |
1.2 | 25 | |
![]() |
2.1 | 26 | * **Manuální kontrola** |
27 | ** Uživatel si přes tlačítko //Check now// může nechat provést kontrolu co nejdříve je to možné. | ||
28 | * **Vypnutí notifikací** | ||
29 | ** Uživatel může přepínačem //Notifications// u hosta nebo služby **trvale **vypnout zasílání notifikací. | ||
30 | ** (% style="color:#e74c3c" %)Pozor: vypnutí notifikací u hosta nevypíná notifikace pro jeho služby! | ||
31 | * **Vypnutí aktivních kontrol** | ||
32 | ** Uživatel může přepínačem //Active checks// u hosta nebo služby **trvale **vypnout kontrolu stavu. | ||
33 | ** Objekt zůstane v posledním známém stavu a **přestane se jeho stav sledovat**. | ||
34 | * **V řešení (//Acknowledge//)** | ||
35 | ** Pokud je služba v problémovém stavu, přes tlačítko //Acknowledge// lze označit službu, že je v řešení. | ||
36 | ** Tento stav vypne opětovné notifikace, ale sleduje stav. | ||
37 | ** (% style="color:#2ecc71" %)Výhoda je, že pokud přejde objekt do stavu OK, tak se opět zapnou notifikace. | ||
38 | * (% style="color:null" %)**Plánovaná údržba** | ||
39 | ** (% style="color:null" %)Uživatel může přes tlačítko //Downtimes// naplánovat servisní okno. | ||
40 | ** (% style="color:null" %)Pokud se nastavuje údržba na **hosta**, tak se ve aplikuje údržba i na **všechny služby**. | ||
41 | ** V základu se údržba plánuje na **1 hodinu** od současného času. | ||
42 | ** Po dobu údržby se sleduje stav služeb, ale neposílají se notifikace. | ||
43 | ** Po ukončení časového okna se notifikace automaticky opět povolí. | ||
44 | ** Informace o zahájení a ukončení servisního okna chodí pouze u **hosta** a pouze na **e-mail**. | ||
![]() |
1.4 | 45 | |
![]() |
2.1 | 46 | (% class="wikigeneratedid" %) |
47 | Grafické rozhraní umožňuje v prostředním panelu pomocí kláves //SHIFT a CTRL(CMD)// provést více násobný výběr. Pokud chce použít nějakou z výše uvedených akcí na více objektech najednou, tak nejjednodušší je přes vyhledávaní tyto objekty najít a poté je všechny označit a v pravém panelu zavolat požadovanou akci, nad všemi vybranými. | ||
![]() |
1.4 | 48 | |
![]() |
2.1 | 49 | === === |
![]() |
1.4 | 50 | |
![]() |
2.1 | 51 | === Nejčastější příklady použití === |
![]() |
1.4 | 52 | |
![]() |
2.1 | 53 | * **Krátkodobé zásahy na zařízení **(aktualizace, restart atd.) |
54 | ** Před zahájením prací naplánovat údržbu přes** //Downtimes//**//.// | ||
55 | ** Na zvolené období budou vypnuty notifikace **hosta i všech služeb**. | ||
56 | ** Všem správcům zařízení dojde oznámení o zahájení a ukončení servisního okna. | ||
57 | * **Neplánovaný dlouhodobý problém **(odstávka elektřiny, stěhovaní, malování atd.) | ||
58 | ** Po příchodu oznámení o výpadku použít tlačítko **//Acknowledge//** pro vypnutí opakovaných notifikací. | ||
59 | ** Je vhodné do komentáře dopsat důvod nedostupnosti ať se dá s odstupem času dohledat proč je objekt nedostupný. | ||
![]() |
1.4 | 60 |