30.05.2011, 05:46 UTC+2

Sie sind nicht angemeldet.

Bug Windows Agent?

Lefty

Fortgeschrittener

Beiträge: 555

Geburtstag: 03.02.1966 (45)

Geschlecht: Männlich

Wohnort: Deutschland

Beruf: Tastendrücker und Mausschubser

Anzahl Nagios-Server: 1

Nagios-Version(en): 3.2.3 (omd 0.46)

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 200+

Anzahl Services: 2000+

Betriebssystem(e): Ubuntu Server 10.04

Plugin-Version(en): OMD 0.46

NagVis-Version: OMD 0.46

NDO-Version: OMD 0.46

Sonstige Addon's: NSCLIENT++, alles aus OMD 0.46

1

25.05.2011, 18:16

Bug Windows Agent?

Hallo,

mir ist heute folgendes bei einigen meiner Windows Hosts aufgefallen. Es geht um: OMD 0.48 bzw. den Windows Agent von check_mk v1.1.10p3.

Auf einigen meiner Systeme hat sich der Agent nach gewisser Zeit nicht mehr abfragen lassen. Samt und sonders Windows XP und Server 2003 R2. Der Dienst (check_mk_agent) reagiert nicht mehr, der Dienst läßt sich nicht beenden. Ursache ist windows_multipath.vbs im plugins Verzeichnis. Das funktioniert einfach nicht. Es scheint aber so zu sein, daß dies dazu führt, daß sich auf manchen Hosts ein cscript Prozess aufhängt und der Agent dann auf ewig wartet bis sich dieser Prozess beendet oder zwangsbeendet wird. Auf anderen Hosts funktioniert das Scipt zwar auch nicht, aber es bleibt auch kein cscript Prozess hängen. Abhilfe schafft natürlich einfach das vbs-Script zu löschen.

Alle Hosts mit Windows >= Version 6 (Vista, Win7, SRV2008 (R2) haben damit keine Probleme. Windows XP, 2003 R2 teilweise das oben beschriebene Problem, teilweise unauffällig.

Ob man das nun als Bug im Agent sehen kann will ich gar nicht beurteilen, gebe aber gerne meine Beobachtung weiter.

Nachtrag 26.5.2011: Betrifft doch auch Windows 2008 R2. Hier hängt dann irgendwann WerFault.exe und blockiert den Agenten.

Bereinigtes Script:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
' MPIO_PATH_INFORMATION.vbs
' VBS WMI MPIO
' Author: Torsten Haake
' Date: 2011-02-15
' -----------------------------------------------'
Option Explicit
Dim objWMIService, objItem, colItems, strComputer

' On Error Resume Next
strComputer = "."

' added for check_mk parsing ()
Wscript.Echo "<<>>"

' WMI connection to Root WMI
Set objWMIService = GetObject("winmgmts:\\" & strComputer & "\root\WMI")
Set colItems = objWMIService.ExecQuery("Select * from MPIO_PATH_INFORMATION")

For Each objItem in colItems
        Wscript.Echo objItem.NumberPaths
Next

WSCript.Quit

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »Lefty« (26.05.2011, 11:00)


muecke

Anfänger

Beiträge: 15

Anzahl Nagios-Server: 1

Nagios-Version(en): 3.2.3

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 86

Anzahl Services: 1097

Betriebssystem(e): Centos 5.5

Plugin-Version(en): 1.4

NagVis-Version: 1.5.5

Sonstige Addon's: check_mk 1.1.10p3

2

27.05.2011, 08:13

Das Problem kann ich bestätigen. Tritt bei mir auch auf einem Windows 2003 R2 Server auf. Ein paar Stunden liefert der Agent Daten und dann hängt sich der Agent auf (104) Connection reset by peer.)

LaMi

Geek

Beiträge: 3 511

Geburtstag: 22.09.

Geschlecht: Männlich

Wohnort: München

Beruf: Berater / Entwickler

Anzahl Nagios-Server: x

Nagios-Version(en): 3.2.x

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: x

Anzahl Services: x

Betriebssystem(e): SLES,CentOS,Debian

Plugin-Version(en): x

NagVis-Version: Git

NDO-Version: -

IDO-Version: -

Perfparse-Version: -

Sonstige Addon's: PNP, Check_MK, Livestatus, Multisite

3

27.05.2011, 08:45

Wächst der Speicher des Agenten-Prozesses an? Wenn ja, dann könnte man mal versuchen die Objekte alle wegzuputzen. Einfach folgendes ans Ende hängen:

Source code

1
2
3
Set objItem = Nothing
Set colItems = Nothing
Set objWMIService = Nothing


Wobei das eigentlich nichts ausmachen sollte, denn beim Beenden des Scripts werden die Objekte eh vergessen.

Grüße,
Lars

Lefty

Fortgeschrittener

Beiträge: 555

Geburtstag: 03.02.1966 (45)

Geschlecht: Männlich

Wohnort: Deutschland

Beruf: Tastendrücker und Mausschubser

Anzahl Nagios-Server: 1

Nagios-Version(en): 3.2.3 (omd 0.46)

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 200+

Anzahl Services: 2000+

Betriebssystem(e): Ubuntu Server 10.04

Plugin-Version(en): OMD 0.46

NagVis-Version: OMD 0.46

NDO-Version: OMD 0.46

Sonstige Addon's: NSCLIENT++, alles aus OMD 0.46

4

27.05.2011, 17:21

Nein, der Speicher wächst nicht an. das vbs Script funktioniert schlicht und einfach nicht weil im Original windows_multipath.vbs von 1.1.10p3 zwei Tippfehler sind (Zeile 12 und 17). Cscript oder WerFault hängen dann im Hintergrund und wollen irgendeine Fehlermeldung absetzen. Das blockiert den Agenten, da dieser auf die Beendigung des Scripts wartet. Somit funktioniert dann der ganze Agent nicht mehr.

Eine Batchdatei mit:

Quellcode

1
2
:start
goto start


im Plugins Verzeichnis hat exakt den selben Effekt. :)

Der eigentliche Fehler steckt in der vbs Datei. Ob es gewünscht ist, daß bei Fehlern in Plugins der Agent seine Arbeit einstellt kann ich nicht beurteilen.

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »Lefty« (27.05.2011, 17:26)


Ähnliche Themen