10.09.2011, 10:35 UTC+2

Sie sind nicht angemeldet.

check_ipmi_sensor meldet False Critical

MrBubbles

Anfänger

Beiträge: 2

Anzahl Nagios-Server: 1

Nagios-Version(en): Icinga 1.4.2 (vdebian queeze-backports)

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 16

Anzahl Services: 731

Betriebssystem(e): Win2K8

Plugin-Version(en): check_mk 1.1.10p3, pnp4nagios

NDO-Version: 1

1

16.08.2011, 09:54

check_ipmi_sensor meldet False Critical

Hallo ersma,

ich bin Icinga Neuling und fange grad ein unsere FSC Server via IPMI in die Überwachung einzufügen.
Ich hab allerdings das Problem, das das IPMI Plugin zwa keine Probleme hat die BMC Boards von Fujitsu auszulesen, aber immer die gleichen DIMM Slots als Critical meldet, und zwa jene, die garnicht vorhanen sind:

Kan man dem ganzen beibringen, das er bestimmte IPMI Sensoren Ignoriert?

Quellcode

1
2
#> /usr/lib/nagios/plugins/check_ipmi_sensor -H 10.110.15.202 -f /etc/icinga/ipmi.cfg
IPMI Status: Critical [IO Blade = Critical, DIMM-3A = Critical, DIMM-3B = Critical, DIMM-3C = Critical, DIMM-2D = Critical, DIMM-3D = Critical, DIMM-2E = Critical, DIMM-3E = Critical, DIMM-2F = Critical, DIMM-3F = Critical] | 'Ambient'=23.250000 'CPU1'=47.000000 'CPU2'=48.000000 'CPU1 VRD'=34.500000 'CPU2 VRD'=42.500000 'DIMM-1A'=34.000000 'DIMM-2A'=34.000000 'DIMM-1B'=32.000000 'DIMM-2B'=33.000000 'DIMM-1C'=31.000000 'DIMM-1D'=35.000000 'DIMM-1E'=35.000000 'DIMM-1F'=33.000000 'Mezzanine1'=35.500000 'HW Monitor1'=24.000000 'HW Monitor2'=24.000000 'IOH'=54.000000 'BATT 3.0V'=2.995200 'LAN1 1.0V STBY'=0.990000 'LAN2 1.0V STBY'=0.990000 'iRMC 1.2V STBY'=1.200000 'MAIN 1.8V STBY'=1.786000 'MAIN 0.9V STBY'=0.893000 'MAIN 5V STBY'=5.044000 'LAN1 1.8V STBY'=1.795400 'LAN2 1.8V STBY'=1.795400 'MAIN 3.3V AUX'=3.268000 'MAIN 3.3V STBY'=3.388400 'CPU1 VCC'=0.960000 'CPU2 VCC'=0.920000 'CPU1 VTT'=1.110000 'CPU2 VTT'=1.140000 'IOH 1.1V 1'=1.070000 'CPU1 1.8V'=1.780000 'CPU2 1.8V'=1.780000 'IOH 1.1V 2'=1.110000 'RAIL1 12V'=11.876000 'RAIL2 12V'=11.814000 'MAIN 3.3V'=3.250800 'RAIL3 12V'=11.876000 'MAIN 5V'=5.044000 'IOH 1.8V'=1.776600 'ICH 1.05V'=1.064700 'SAS 1.2V'=1.197000 'ICH 1.5V'=1.505400 'Rail 1'=4.400000 'Rail 2'=3.400000 'Rail 3'=3.800000 'Blade Power'=136.000000 'Total Power'=138.000000


Hier ein paar Daten zur Software
Debian Squeeze
Icinga 1.4.2 (aus squeeze-backports)
freeipmi 0.7.17.beta2
check_ipmi_sensor 3.2.20110801

werner-fischer

Anfänger

Beiträge: 3

Anzahl Nagios-Server: 1

Nagios-Version(en): 3

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 5

Anzahl Services: 10

Betriebssystem(e): Linux

Plugin-Version(en): 1

NDO-Version: 1

2

17.08.2011, 09:44

Hallo MrBubbles,

normalerweise sollte ein Server bei dem freie DIMM-Slots vorhanden sind, diese als N/A melden (kein Sensorwert auslesbar) und das sollte wiederum dann zu keiner Fehlermeldung führen.

Wenn das aber vom BMC als Critical gemeldet wird kann man diese Sensoren in der Konfiguration des Plugins deaktivieren (mit der -x Option):

[-x ] exclude sensor matching . Useful for cases when unused sensors cannot be deleted from SDR and are reported in a non-OK state. Option can be specified multiple times. The is a numeric value (sensor names are not used as some servers have multiple sensors with the same name). Use -v 3 option to query the .

Hier ist der vollständige Hilfe-Text:
http://www.thomas-krenn.com/en/oss/ipmi-…sor_-h_v2.x.txt

Die -x Option kann mehrfach angeführt werden, wenn mehrere Sensoren ignoriert werden sollen. Wichtig ist dabei immer die numerische Sensor ID - diese kannst du über den Verbose Level 3 leicht ermitteln:

/usr/lib/nagios/plugins/check_ipmi_sensor -H 10.110.15.202 -f /etc/icinga/ipmi.cfg -v 3

Bei Fragen zum IPMI Plugin gibt es übrigens sonst auch noch die User Mailing Liste - Infos siehe:
http://www.thomas-krenn.com/en/oss/ipmi-plugin/

Schöne Grüße,
Werner
(Autor des IPMI Plugins)

MrBubbles

Anfänger

Beiträge: 2

Anzahl Nagios-Server: 1

Nagios-Version(en): Icinga 1.4.2 (vdebian queeze-backports)

Verteiltes Monitoring: Nein

Redundantes Monitoring: Nein

Anzahl-Hosts: 16

Anzahl Services: 731

Betriebssystem(e): Win2K8

Plugin-Version(en): check_mk 1.1.10p3, pnp4nagios

NDO-Version: 1

3

18.08.2011, 09:32

Hallo Werner,

Ich hab mal die Ausgabe von "check_ipmi_sensor -v 3" angeguckt. Es ist tatsächlich so, das das IRMC Board von Fujitsu einige Objekte als Critical meldet, obwol es richtig bemerkt das diese garnicht vorhanden sind. :huh:

Keine Ahnung ob das nun ein Bug oder ein Feature is, sicher is nur, das alle meine Fujitsu Systeme darunter leiden. Mein Vorschalg für ein Feature Upgrade in einer eventuell neuen version vom check_ipmi_sensors, wäre sowas wie ein "--igone-absent-entity" switch?!

Ansonsten hilft mir das "-x" erstmal weiter. Danke für die Antwort. :thumbsup:

MrBubbles

Quellcode

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
 /usr/lib/nagios/plugins/check_ipmi_sensor -v 3 -f /etc/icinga/ipmi.cfg -H 10.110.15.202
------------- begin of debug output (-v 3 is set): ------------
  script was executed with the following parameters:
        /usr/lib/nagios/plugins/check_ipmi_sensor -v 3 -f /etc/icinga/ipmi.cfg -H 10.110.15.202
  check_ipmi_sensor version:
        check_ipmi_sensor version 2.3 20110801
  ipmimonitoring version:
        ipmimonitoring - 0.8.12
  ipmimonitoring was executed with the following parameters:
        /usr/sbin/ipmimonitoring -h 10.110.15.202 --config-file /etc/icinga/ipmi.cfg --quiet-cache --sdr-cache-recreate
  ipmimonitoring return code: 0
  output of ipmimonitoring:
Record ID | Sensor Name | Sensor Group | Monitoring Status | Sensor Units | Sensor Reading
32 | Ambient | Temperature | Nominal | C | 24.000000
96 | CPU1 | Temperature | Nominal | C | 46.000000
...
6448 | CPU detection | System Event | Nominal | N/A | 'OK'
6496 | Power Level | Entity Presence | Nominal | N/A | 'Entity Present'
6592 | IO Blade | Entity Presence | Critical | N/A | 'Entity Absent'
6640 | Blade Power | Entity Presence | Nominal | N/A | 'Entity Present'
6688 | Total Power | Entity Presence | Nominal | N/A | 'Entity Present'
6736 | DIMM-3A | Entity Presence | Critical | N/A | 'Entity Absent'
6784 | DIMM-3B | Entity Presence | Critical | N/A | 'Entity Absent'
6832 | DIMM-3C | Entity Presence | Critical | N/A | 'Entity Absent'
6880 | DIMM-2D | Entity Presence | Critical | N/A | 'Entity Absent'
6928 | DIMM-3D | Entity Presence | Critical | N/A | 'Entity Absent'
6976 | DIMM-2E | Entity Presence | Critical | N/A | 'Entity Absent'
7024 | DIMM-3E | Entity Presence | Critical | N/A | 'Entity Absent'
7072 | DIMM-2F | Entity Presence | Critical | N/A | 'Entity Absent'
7120 | DIMM-3F | Entity Presence | Critical | N/A | 'Entity Absent'
...
--------------------- end of debug output ---------------------

Ähnliche Themen