12.07.2011, 04:18 UTC+2

Sie sind nicht angemeldet.

logfile checks und volatile? Verständnisfragen

Steph

Schüler

Beiträge: 81

Anzahl Nagios-Server: 2

Nagios-Version(en): 3.2.0

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: > 500

Anzahl Services: > 20

Betriebssystem(e): Solaris

Plugin-Version(en): ?

NDO-Version: 2

1

30.06.2011, 09:48

logfile checks und volatile? Verständnisfragen

Guten Morgen.

Ich habe ein Verständnisproblem was eine logfile Prüfung und volatile services angeht. Ich meine, mein logfile check müßte volatile sein. Die logdatei wird gelesen und eventuelle Fehler werden gemeldet.

Beim nächsten Lauf wird ab der letzten Position weitergelesen. Wenn bis dahin kein weiterer Fehler aufgetreten ist, wäre der service also direkt wiedre in einem OK Zustand.

Ich sollte also max_check_attempts auf 1 setzen, da ich wohl ansonsten die eine oder andere Fehlersituation nicht mitbekomme, richtig?

Was ich an der Erkärung auf http://www.nagios-wiki.de/nagios/doku3/volatileservices nicht verstehe:

"Diese Ereignisse finden normalerweise nur für Services statt, wenn sie in einem nicht-OK-Zustand sind und gerade ein Hard-Zustandswechsel erfolgte. In anderen Worten, sie passieren nur das erste Mal, wenn ein Service in einen nicht-OK-Zustand geht."

Was ist da der Unterschied zu nicht-volatile Services, außer, daß "Benachrichtigungsintervalle werden bei flüchtigen Services ignoriert."?

bern

Profi

Beiträge: 1 534

Anzahl Nagios-Server: 2-5

Nagios-Version(en): 1-3

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 80-200

Anzahl Services: 1400-2000

Betriebssystem(e): Linux

Plugin-Version(en): Whatever I can download, patch, or cobble together myself :-)

Sonstige Addon's: n2rrd, PNP, livestatus

2

30.06.2011, 11:31

Ich unterstelle 'mal max_check_attempts = 3 (was man hier, wie Du erkannt hast, nicht machen sollte), notification_interval = 4 * check_interval und daß der Service gerade eben den Lemming gemacht hat. Dann passiert im Weiteren folgendes:

Ohne is_volatile:
  • SOFT non-OK (1/3) - wird geloggt, keine Notification, Event Handler läuft (als SOFT)
  • SOFT non-OK (2/3) - wird geloggt, keine Notification, Event Handler läuft (als SOFT)
  • HARD non-OK (3/3) - wird geloggt, Notification #1, Event Handler läuft (als HARD)
  • HARD non-OK - kein Logeintrag, keine Notification, da notification_interval noch nicht 'rum, kein Event Handler
  • HARD non-OK - kein Logeintrag, keine Notification, kein Event Handler
  • HARD non-OK - kein Logeintrag, keine Notification, kein Event Handler
  • HARD non-OK - Notification #2, kein Logeintrag (des Checks - Notification wird schon vermerkt), kein Event Handler
  • etc.
Mit is_volatile:
  • SOFT non-OK (1/3) - wird geloggt, keine Notification, Event Handler läuft (als SOFT)
  • SOFT non-OK (2/3) - wird geloggt, keine Notification, Event Handler läuft (als SOFT)
  • HARD non-OK (3/3) - wird geloggt, Notification #1, Event Handler läuft (als HARD)
  • HARD non-OK - wird geloggt, Notification #2, Event Handler läuft (als HARD)
  • HARD non-OK - wird geloggt, Notification #3, Event Handler läuft (als HARD)
  • etc.

Steph

Schüler

Beiträge: 81

Anzahl Nagios-Server: 2

Nagios-Version(en): 3.2.0

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: > 500

Anzahl Services: > 20

Betriebssystem(e): Solaris

Plugin-Version(en): ?

NDO-Version: 2

3

30.06.2011, 12:27

So hätte ich das auch erwartet, so habe ich die verlinkte Dokumentation aber nicht verstanden.

Aber JETZT ist der Groschen gefallen!

Zitat

Diese Ereignisse finden normalerweise nur für Services statt, wenn sie in einem nicht-OK-Zustand sind und gerade ein Hard-Zustandswechsel erfolgte. In anderen Worten, sie passieren nur das erste Mal, wenn ein Service in einen nicht-OK-Zustand geht. Wenn weitere Prüfungen des Service den gleichen nicht-OK-Zustand ergeben, erfolgt kein harter Zustandswechsel und keines der genannten Ereignisse wird stattfinden.


Bezieht sich gerade auf die non-volatile Services :-( Oh Mann!

Danke!

Ähnliche Themen