29.06.2011, 02:36 UTC+2

Sie sind nicht angemeldet.

[Solved] Probleme beim übermitteln des Nagios Prüfbefehls + Neustart via SSH an OMD

Tommel

Fortgeschrittener

Beiträge: 171

Geschlecht: Männlich

Anzahl Nagios-Server: 2

Nagios-Version(en): 3.2.0

Verteiltes Monitoring: Ja

Redundantes Monitoring: Ja

Anzahl-Hosts: 1+

Anzahl Services: 1+

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): 1.4.13

NagVis-Version: 1.5

Sonstige Addon's: PNP

1

23.06.2011, 15:52

[Solved] Probleme beim übermitteln des Nagios Prüfbefehls + Neustart via SSH an OMD

Hallo zusammen,

ich habe gerade mal das neue NagiosQL 3.1 Feature Domäne über SSH getestet. Die Verwaltung funktioniert soweit problemlos und auch das schreiben der Configfiles funktioniert.

Allerdings bekomme ich beim drücken auf "Konfigurationsdateien prüfen: Ausführen" diesen Fehler: "Entfernte Ausführung des Nagios Prüfbefehls fehlgeschlagen (SSH Verbindung)". Das ganze geht an eine OMD Installation in der Version 0.48 auf OpenSuSE. Schicke ich das auf eine OMD Installation mit der Version 0.46 auf Ubuntu funktioniert es, obwohl ich meiner Meinung nach nichts anders konfiguriert habe. Ich vermute nicht das es an OpenSuSE direkt liegt, wenn vllt. an irgendeinem Paket. Oder vllt. an OMD Version 0.48 ??? Oder an NagiosQL? Ich weiß es leider nicht!

Desweiteren bekomme ich beim Neustart von Nagios dieses: "Der Neustart Befehl wurde erfolgreich an Nagios übermittelt (Entfernter Zugriff via SSH/SFTP)". Sieht zwar gut aus, aber wenn ich vorher nen Servicenamen geändert habe, wird die Änderung nicht im Webinterface dargestellt, d.h. es wurde nicht neugestartet! restarte ich die Site via "omd restart" wird die Veränderung angezeigt...

Das nagios.log zeigt folgendes beim Neustart:

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
[1308837008] PROGRAM_RESTART event encountered, restarting...
[1308837008] npcdmod: If you don't like me, I will go out! Bye.
[1308837008] Event broker module '/omd/sites/test/lib/npcdmod.o' deinitialized successfully.
[1308837008] livestatus: deinitializing
[1308837008] livestatus: Waiting for main to terminate...
[1308837008] livestatus: Waiting for client threads to terminate...
[1308837008] Event broker module '/omd/sites/test/lib/mk-livestatus/livestatus.o' deinitialized successfully.
[1308837008] Nagios 3.2.3 starting... (PID=17634)
[1308837008] Local time is Thu Jun 23 15:50:08 CEST 2011
[1308837008] LOG VERSION: 2.0
[1308837008] npcdmod: Copyright (c) 2008-2009 Hendrik Baecker () - http://www.pnp4nagios.org
[1308837008] npcdmod: /omd/sites/test/etc/pnp4nagios/npcd.cfg initialized
[1308837008] npcdmod: spool_dir = '/omd/sites/test/var/pnp4nagios/spool/'.
[1308837008] npcdmod: perfdata file '/omd/sites/test/var/pnp4nagios/perfdata.dump'.
[1308837008] npcdmod: Ready to run to have some fun!
[1308837008] Event broker module '/omd/sites/test/lib/npcdmod.o' initialized successfully.
[1308837008] livestatus: Livestatus 1.1.10p3 by Mathias Kettner. Socket: '/omd/sites/test/tmp/run/live'
[1308837008] livestatus: Please visit us at http://mathias-kettner.de/
[1308837008] Event broker module '/omd/sites/test/lib/mk-livestatus/livestatus.o' initialized successfully.
[1308837008] TIMEPERIOD TRANSITION: 24x7;-1;1
[1308837008] TIMEPERIOD TRANSITION: none;-1;0
[1308837008] TIMEPERIOD TRANSITION: workhours;-1;1
[1308837008] livestatus: Socket thread has terminated


Die Domäne habe ich im NagiosQL wie folgt konfiguriert:

Quellcode

1
2
3
4
Nagios Command Datei: /omd/sites/test/tmp/run/nagios.cmd
Nagios Binary Datei: /omd/sites/test/bin/nagios
Nagios Prozess Datei: /omd/sites/test/tmp/lock/nagios.lock
Nagios Konfigurationsdatei: /omd/sites/test/tmp/nagios/nagios.cfg


Ist dort vllt. irgendwo der Fehler?

Vielleicht kann mir ja jemand helfen!

Viele Grüße + Danke
Thomas

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »Tommel« (24.06.2011, 09:28)


Martin

Fortgeschrittener

Beiträge: 249

Wohnort: Schweiz

Beruf: System Engineer

Anzahl Nagios-Server: 1

Hobbys: unzählige :-)

Nagios-Version(en): 3.x

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 1

Anzahl Services: 10

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): -

Sonstige Addon's: NagiosQL

2

24.06.2011, 08:12

Die Funktionalität der beiden Funktionen sieht so aus:

Konfiguration prüfen:
Es wird versucht via SSH der Befehl /omd/sites/test/bin/nagios -v /omd/sites/test/tmp/nagios/nagios.cfg auszuführen. Die Fehlermeldung bedeutet, dass der Verbindungsaufbau via SSH funktioniert, der Befehl aber nicht ausgeführt werden konnte. In den meisten Fällen liegt hier ein Berechtigungsproblem vor (ssh Benutzer darf den Befehl nicht ausführen) oder einer der Pfade ist falsch konfiguriert in den Domäneneinstellungen. Kann der Befehl so auf der Kommandozeile ausgeführt werden? Auch wenn auf den SSH User gewechselt wird?

Restart Befehl:
Es wird versucht, folgenden String in das Commandfile (/omd/sites/test/tmp/run/nagios.cmd) zu schreiben:
[] RESTART_PROGRAM;;
mktime ist ein standardisierter Zeitstamp, z.Bsp. eben 1308837008
NagiosQL kann nur überprüfen, ob das Schreiben des Befehls ins Commandfile einen Fehler zurückgegeben hat oder nicht. (Berechtigungen/Pfad). Es ist nicht möglich zu prüfen, ob der RESTART Befehl von Nagios auch ausgewertet und ausgeführt wird. Der Befehl müsste aber im Logfile ersichtlich sein. Ist er dort zu sehen?

Allenfalls müsste jemand, der sich mit OMD auskennt sagen, ob OMD hier einen vom Standard Nagios Befehl abweichenden Befehl erwartet.
NagiosQL Developer
http://www.nagiosql.org

Tommel

Fortgeschrittener

Beiträge: 171

Geschlecht: Männlich

Anzahl Nagios-Server: 2

Nagios-Version(en): 3.2.0

Verteiltes Monitoring: Ja

Redundantes Monitoring: Ja

Anzahl-Hosts: 1+

Anzahl Services: 1+

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): 1.4.13

NagVis-Version: 1.5

Sonstige Addon's: PNP

3

24.06.2011, 08:26

Eigenartig. Also bzgl. Konfiguration prüfen habe ich die Schritte auch gestern schon genau so wie du sie beschrieben hast per Hand ausgeführt. Hat alles geklappt! Auch genau mit den Pfaden die ich im NagiosQL konfiguriert habe, eben per Copy & Paste. Nur eigenartig, dass es mit OMD 0.46 auf Ubuntu funktioniert...

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
*:~ # ssh test@IP
test@IP's password:
Last login: Thu Jun 23 16:08:29 2011 from *
OMD[test]:~$ /omd/sites/test/bin/nagios -v /omd/sites/test/tmp/nagios/nagios.cfg

Nagios Core 3.2.3
Copyright (c) 2009-2010 Nagios Core Development Team and Community Contributors
Copyright (c) 1999-2009 Ethan Galstad
Last Modified: 10-03-2010
License: GPL

Website: http://www.nagios.org
Reading configuration data...
   Read main config file okay...
Processing object config directory '/omd/sites/test/etc/nagios/conf.d'...
Processing object config file '/omd/sites/test/etc/nagios/conf.d/commands.cfg'...

...

Total Warnings: 0
Total Errors:   0

Things look okay - No serious problems were detected during the pre-flight check
OMD[test]:~$


Das Nagios.log hatte ich ja gepostet, dort taucht "PROGRAM_RESTART event encountered, restarting..." auf und Nagios wird auch neu gestartet. Fehlt da vllt irgendetwas, was bei einem Nagios Neustart auftauchen müsste?

Könnte es vllt. noch sein, dass SSH irgendwie falsch konfiguriert ist, oder das ich bei OpenSuSE etwas anders machen muss als bei Ubuntu? Wie kann ich mir denn unter Ubuntu alle installierten Pakete mit *SSH* anzeigen lassen?

Danke schonmal
Grüße
Thomas

Bastian Kuhn

Fortgeschrittener

Beiträge: 338

Geschlecht: Männlich

Wohnort: München

Anzahl Nagios-Server: 8

Hobbys: Jiu Jitsu, Klettern, MTB, Reisen

Nagios-Version(en): OMD 0.48

Verteiltes Monitoring: Ja

Redundantes Monitoring: Ja

Anzahl-Hosts: >4.000

Anzahl Services: >80.000

Betriebssystem(e): Linux, AIX, Windows

Plugin-Version(en): OMD 0.48

4

24.06.2011, 08:31

Zitat von »Tommel«

Eigenartig. Also bzgl. Konfiguration prüfen habe ich die Schritte auch gestern schon genau so wie du sie beschrieben hast per Hand ausgeführt. Hat alles geklappt! Auch genau mit den Pfaden die ich im NagiosQL konfiguriert habe, eben per Copy & Paste. Nur eigenartig, dass es mit OMD 0.46 auf Ubuntu funktioniert...


Hi Thomas,

stimmt den der User über den die Verbindung aufgebaut wird, bzw. hast du es im Test auch als selbiger probiert?

Grüße Bastian
bastian-kuhn.de Mein Blog (Rund um Monitoring und mit deutschen Anleitungen zu check_mk)

Tommel

Fortgeschrittener

Beiträge: 171

Geschlecht: Männlich

Anzahl Nagios-Server: 2

Nagios-Version(en): 3.2.0

Verteiltes Monitoring: Ja

Redundantes Monitoring: Ja

Anzahl-Hosts: 1+

Anzahl Services: 1+

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): 1.4.13

NagVis-Version: 1.5

Sonstige Addon's: PNP

5

24.06.2011, 08:47

Jep, stimmt haargenau überein. :\

Ich werde wohl gleich nochmal versuchen iwie OMD von 0.48 auf 0.46 downzugraden um das "auszuschließen", dass es daran liegt!

Martin

Fortgeschrittener

Beiträge: 249

Wohnort: Schweiz

Beruf: System Engineer

Anzahl Nagios-Server: 1

Hobbys: unzählige :-)

Nagios-Version(en): 3.x

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 1

Anzahl Services: 10

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): -

Sonstige Addon's: NagiosQL

6

24.06.2011, 08:58

Hast Du mal versucht den Befehl von remote direkt auszuführen:

Quellcode

1
nagiosql-server # ssh nagiosql_user '/omd/sites/test/bin/nagios -v /omd/sites/test/tmp/nagios/nagios.cfg'

Evtl auf dem NagiosQL Server auch gleich ein su - auf den nagiosql_user machen und so versuchen, wegen den Keys etc.

Ein erfolgreicher Restart bei mir (auch via SSH - auch openSuSE) sieht etwa so aus:

Quellcode

1
2
3
4
5
6
7
8
[1308758934] EXTERNAL COMMAND: RESTART_PROGRAM;1308758934
[1308758934] PROGRAM_RESTART event encountered, restarting...
[1308758934] Nagios 3.2.3 starting... (PID=2902)
[1308758934] Local time is Wed Jun 22 18:08:54 CEST 2011
[1308758934] LOG VERSION: 2.0
[1308758934] Warning: Host 'testserver_3' has no services associated with it!
[1308758954] SERVICE ALERT: testserver_1;Root Partition;OK;HARD;4;DISK OK - free space: / 381 MB (19% inode=80%):
[1308758954] SERVICE NOTIFICATION: nagiosadmin;testserver_1;Root Partition;OK;notify-service-by-email;DISK OK - free space: / 381 MB (19% inode=80%):
NagiosQL Developer
http://www.nagiosql.org

Tommel

Fortgeschrittener

Beiträge: 171

Geschlecht: Männlich

Anzahl Nagios-Server: 2

Nagios-Version(en): 3.2.0

Verteiltes Monitoring: Ja

Redundantes Monitoring: Ja

Anzahl-Hosts: 1+

Anzahl Services: 1+

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): 1.4.13

NagVis-Version: 1.5

Sonstige Addon's: PNP

7

24.06.2011, 09:11

Also an der OMD Version liegt es auch nicht, auch der downgrade auf 0.46 hat nichts gebracht!

Quellcode

1
2
3
*:~ # ssh test@* '/omd/sites/test/bin/nagios -v /omd/sites/test/tmp/nagios/nagios.cfg'
test@*'s password:
/omd/sites/test/bin/nagios: error while loading shared libraries: libperl.so: cannot open shared object file: No such file or directory


Den Error bekomme ich wenn ich das ausführe, wenn ich es hintereinander mache, klappt es. ???

EDIT: https://nagios-portal.org/wbb/index.p…6610#post146610 <- dort steht die Lösung. Jetzt klappt alles (auch der Neustart)

DANKE fürs lenken! ;-)

Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »Tommel« (24.06.2011, 09:26)


Martin

Fortgeschrittener

Beiträge: 249

Wohnort: Schweiz

Beruf: System Engineer

Anzahl Nagios-Server: 1

Hobbys: unzählige :-)

Nagios-Version(en): 3.x

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 1

Anzahl Services: 10

Betriebssystem(e): OpenSuSE 11.1

Plugin-Version(en): -

Sonstige Addon's: NagiosQL

8

24.06.2011, 09:26

Kannst mal ein

Quellcode

1
2
ldd /omd/sites/test/bin/nagios
nagiosql-server # ssh nagiosql_user 'ldd /omd/sites/test/bin/nagios'

machen zum vergleichen.

Eventuell mal ein

Quellcode

1
ldconfig

als root auf dem OMD System ausführen.

Seltsam - evtl. darf der remote User das perl library nicht lesen :)
NagiosQL Developer
http://www.nagiosql.org

Ähnliche Themen