Wer reagiert nicht gerne vorher, bevor es knallt? Am besten ist es doch, über den Zustand des Netzwerks ständig informiert zu sein. Dazu gehört natürlich auch eine Überwachung aller Prozesse, Hardwareverfügbarkeit und letztendlich auch der Kapazitäten.
Ich mache das seit geraumer Zeit mit Nagios. Scriptbasiert werden alle laufenden Systeme überwacht und so kann ich einen Fehler in der Entstehung erkennen, bevor alles steht. Sehr praktisch. Agieren statt reagieren.
Das ganze ist mit nicht unerheblichem administrativen Aufwand verbunden, erleichtert aber das Leben als Admin.
Prozessorauslastung, Festplattenkapazität, Verfügbarkeit von Diensten, alles jederzeit im Blick. Dazu noch lese ich per SNMP die Hardwareinformationen der einzelnen Hosts unseres VSphere-Clusters aus, um so länger anhaltende Leistungsspitzen zu dokumentieren und auf dem Weg beim Einkauf neue Hardware einzufordern. Klasse, ich liebe Nagios!
😉
_______________________________________________________________________________________________
Kurze Erklärung zur Funktion:
Es läuft ein Server, der als Dienst immer wieder bei den Clients den Status mit sogenannten „checkcommands“ abfragt.
So kann man zum einen den Zustand bestimmter Dienste permanent überwachen, aber auch die Erreichbarkeit der Systeme direkt prüfen. fällt z.B. ein Switch aus, und einige System laufen zwar, sind aber nicht erreichbar, bekomme ich natürlich schlagartig alle möglichen Alarme von Nagios.
Plugins gibt es reichlich, z.B. „check_smb.sh“, womit der Samba-Status eines Servers geprüft wird.
Diese Plugins müssen auf den Zielsystemen laufen, da sie den Status des Services abfragen. Die Nagios-Clients geben diesen Status an den Server weiter.
Hier eine Design-Übersicht.
Hier eine Übersicht der Nagios Plugins.
Clientsoftware gibt es für Linux-Distrubitionen, oft schon über die eingebauten Tools zu beziehen (apt-get) oder als rpm-Files (nrpe-Addon), sowie für Windows (NSClient++).
Weiterhin gibt so kleine, nette Tools zum Überwachen des Nagios-Servers. So sieht man in der Taskleiste des lokalen (Admin)-Windows per Nagstamon jeden Ausfall und Alarm sofort und kann entsprechend reagieren.
Nagios bietet auf dem Server noch jede Menge Alarm-Notifications, z.B. per eMail oder SMS. SMS setzt natürlich die Möglichkeit des Versendens voraus.
Nagios stellt alle Informationen auf einer Webseite bereit:
Per SNMP lassen sich alle Hardware-Geräte im Netzwerk überwachen, so sie dies Unterstützen. So bekommen wir z.B. den tonerstatus aller unserer Drucker im Haus angezeigt, bevor ein User sich bei uns beschweren kann. Die IT tauscht dann schon aus. Papierstaus oder einzelne Portauslastung auf Switches, alles wird rechtzeitig erkannt und angezeigt bzw. Alamiert.