Anfänger
Beiträge: 10
Geburtstag: 28.02.
Wohnort: Berlin
Anzahl Nagios-Server: 3
Nagios-Version(en): 3.2.3
Verteiltes Monitoring: Ja
Redundantes Monitoring: Nein
Anzahl-Hosts: ~500
Anzahl Services: ~6k
Betriebssystem(e): Ubuntu 11.04
Plugin-Version(en): x
NDO-Version: 3
1
16.08.2011, 14:33
Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »smue« (16.08.2011, 14:39)
Beiträge: 15 096
Wohnort: Kassel
Beruf: Sysadmin SAP / Linux / AIX
Anzahl Nagios-Server: 2
Hobbys: Motorrad fahren, wenns die Zeit erlaubt :-)
Nagios-Version(en): 3.2.1
Icinga-Version(en): ---
Verteiltes Monitoring: Nein
Redundantes Monitoring: Nein
Anzahl-Hosts: 310
Anzahl Services: 4500
Betriebssystem(e): Debian 5.0 Lenny
Plugin-Version(en): 1.4.x
NagVis-Version: 1.4.1
NDO-Version: ---
IDO-Version: ---
Perfparse-Version: ---
Sonstige Addon's: SNMPTT, NagTrap, NagVis 1.4.5, check_mk, PNP-0.6.x. Thruk
2
16.08.2011, 14:50
Zitat von »smue«
Contacts/contacgroups: check_mk erzeugt nur contactgruppen, wenn diese auch im Host verwendet werden, -> man müsste contactgroups und contacts in "extra_nagios_conf" konfigurieren, was ich unbequem finde
Zitat von »smue«
all_hosts: unbequemerweise muss man die lokal konfigurieren, da ich noch nicht ruasgefunden hab, wie man cmk -I per default dazu bringt nur Hosts mit einem bestimmten tag zu inventarisieren
![]() |
Quellcode |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
OMD[noc]:~$ check_mk -I $(check_mk --list-tag local) cpu.loads 1 new checks cpu.threads 1 new checks df 2 new checks diskstat 2 new checks kernel 3 new checks kernel.util 1 new checks mem.used 1 new checks mem.vmalloc 1 new checks mounts 2 new checks netctr.combined 3 new checks postfix_mailq 1 new checks tcp_conn_stats 1 new checks uptime 1 new checks |
Zitat von »smue«
remote reload: bisher bin ich zu doof (oder istes ein bug?) "cmk -O" remote auszuführen("ssh cmk -O " funktioniert so nicht)
![]() |
Quellcode |
1 2 3 4 5 6 |
ssh '/omd/sites/noc/bin/check_mk -O' 's password: Generating Nagios configuration...OK Validating Nagios configuration...OK Precompiling host checks...OK Reloading Nagios...OK |
Beiträge: 15 096
Wohnort: Kassel
Beruf: Sysadmin SAP / Linux / AIX
Anzahl Nagios-Server: 2
Hobbys: Motorrad fahren, wenns die Zeit erlaubt :-)
Nagios-Version(en): 3.2.1
Icinga-Version(en): ---
Verteiltes Monitoring: Nein
Redundantes Monitoring: Nein
Anzahl-Hosts: 310
Anzahl Services: 4500
Betriebssystem(e): Debian 5.0 Lenny
Plugin-Version(en): 1.4.x
NagVis-Version: 1.4.1
NDO-Version: ---
IDO-Version: ---
Perfparse-Version: ---
Sonstige Addon's: SNMPTT, NagTrap, NagVis 1.4.5, check_mk, PNP-0.6.x. Thruk
3
16.08.2011, 14:57
Zitat von »smue«
templates.special: Benutz ich eigentlich recht gerne und häufig(Anzahl aller Request auf allen Loadbalancer-Backends etc), klappt aber nur wenn entweder man vorher eine pnp Anzeige auf der entsprechenden Site aufruft oder die rrd's auf allen Sites liegen, prinzipiell wäre es ja möglich die rrds auch zu syncen, aber das kann je nach Site-größe schon zu recht viel Traffic führen, da weder unison noch rsync inkrementelle updates vonn rrds machen kann. Hab schon an drbd gedacht, aber das ist mir zu gefährlich, da die WAN Strecken ja auch mal ausfallen können...
Dieser Beitrag wurde bereits 1 mal editiert, zuletzt von »pitchfork« (16.08.2011, 15:02)
Beiträge: 754
Geschlecht: Männlich
Wohnort: München
Anzahl Nagios-Server: viele
Nagios-Version(en): 2.* / 3
Verteiltes Monitoring: Ja
Redundantes Monitoring: Ja
Anzahl-Hosts: viele
Anzahl Services: viele
Betriebssystem(e): viele
Plugin-Version(en): 1.4.11
Sonstige Addon's: Thruk, ModGearman
4
16.08.2011, 14:58
Anfänger
Beiträge: 10
Geburtstag: 28.02.
Wohnort: Berlin
Anzahl Nagios-Server: 3
Nagios-Version(en): 3.2.3
Verteiltes Monitoring: Ja
Redundantes Monitoring: Nein
Anzahl-Hosts: ~500
Anzahl Services: ~6k
Betriebssystem(e): Ubuntu 11.04
Plugin-Version(en): x
NDO-Version: 3
5
16.08.2011, 15:26
![]() |
Quellcode |
1 2 3 4 5 6 7 8 |
all_contacts= { 'test1' : { #contact_name 'email' : ', #optional, wird wenn nicht vorhanden auf contact_name gesetzt 'groups': 'comma,separated', # optional wird wenn nciht vorhanden auf username gesetzt, nicht vorhanden contactgroups werden automatisch erzeugt 'template': 'template_name' # optional wird auch generic-contact gesetzt (TODO) '....' #jedwede normale nagios contact object definition sollte übernommenw erden können (TODO)}, 'contact2':{}, } |
Nun das mit der Redundanz überleg ich mir noch, der Grund fürs verteile Monitoring ist nicht Lastverteilung oder Ausfallsicherheit, sonder Zwang
Zitat von »sni«
Früher hatte ich auch ein ähnlich verteilten Ansatz. Aber das bringt etliche Probleme mit sich.
Neben dem Synchronisieren müsstest du ja auch alle verteilten Sites redundant installieren. Neben
dem Aufwand erzeugt das auch Hardwarekosten (sofern man nicht virtualisiert, dann müsste man aber den
Host redundant auslegen, was aber oft schon der Fall ist)
Bisher hab ich da noch keine Probleme, gibt aber auch nicht soviele Leute die daran rumschrauben, Wichtig war mir eigentlich eher das Die konfigs wirlich überall synchon sind, aber warten wirs ma ab.
Zitat von »sni«
Mit unison hab ich auch eher gemischte Erfahrungen gemacht. Konflikte waren an der Tagesordnung.
Da stimm ich dir zu, nur wie oben schon gesgat, ich muss!, da einige Netze/Server nur von bestimmten IP's aus Monitorbar sind,bzw in privaten Netzen liegen, und die FW Regeln zu den zugehörigen VPNs nicht immer unserer Kontroller unterliegen, weiterhin mag ich auch nich die restlichen (noch einzubauenden) 500 Server via WAN Strecke monitoren, wenn ich das auch aus einem Low-Latency Gbit Netz machen kann
Zitat von »sni«
Letztlich bin ich jetzt wieder bei einem zentralen Ansatz mit einer Site. Monitoring sollte meiner Meinung nach
nicht sonderlich kompliziert und super ausgefallen sein. Je einfacher es ist, desto weniger geht kaputt
oder fällt aus.
Das mit dem Git is ne gute Idee, muss hier sowieso noch Redmine und eine Versionskontrollsystem installieren für einige Projekte, da würde das wohl passen.
Zitat von »sni«
Dann kommt es natürlich auch auf Zuständigkeiten an. Eine Site, an der 10 Leute in verschiedenen
Verzeichnissen basteln geht meist schief. Noch besser, gerade bei größeren Umgebungen wäre eigentlich,
wenn die Monitoring Daten aus einer CMDB oder irgendeiner Art Inventardatenbank kommt und dann
automatisch generiert wird. So kann man sicherstellen dass nichts vergessen wird und es sorgt auch
dafür dass alles möglichst identisch überwacht wird.
Bezüglich Versionskontrolle bietet sich git an. Ein "git init" ist immer das erste nach dem Site anlegen.
Dieser Beitrag wurde bereits 3 mal editiert, zuletzt von »smue« (16.08.2011, 15:35)
Beiträge: 15 096
Wohnort: Kassel
Beruf: Sysadmin SAP / Linux / AIX
Anzahl Nagios-Server: 2
Hobbys: Motorrad fahren, wenns die Zeit erlaubt :-)
Nagios-Version(en): 3.2.1
Icinga-Version(en): ---
Verteiltes Monitoring: Nein
Redundantes Monitoring: Nein
Anzahl-Hosts: 310
Anzahl Services: 4500
Betriebssystem(e): Debian 5.0 Lenny
Plugin-Version(en): 1.4.x
NagVis-Version: 1.4.1
NDO-Version: ---
IDO-Version: ---
Perfparse-Version: ---
Sonstige Addon's: SNMPTT, NagTrap, NagVis 1.4.5, check_mk, PNP-0.6.x. Thruk
6
16.08.2011, 15:59
Zitat von »smue«
Warum das mit dem ssh cmk nicht klappt forsch ich nochmal nach
Beiträge: 15 096
Wohnort: Kassel
Beruf: Sysadmin SAP / Linux / AIX
Anzahl Nagios-Server: 2
Hobbys: Motorrad fahren, wenns die Zeit erlaubt :-)
Nagios-Version(en): 3.2.1
Icinga-Version(en): ---
Verteiltes Monitoring: Nein
Redundantes Monitoring: Nein
Anzahl-Hosts: 310
Anzahl Services: 4500
Betriebssystem(e): Debian 5.0 Lenny
Plugin-Version(en): 1.4.x
NagVis-Version: 1.4.1
NDO-Version: ---
IDO-Version: ---
Perfparse-Version: ---
Sonstige Addon's: SNMPTT, NagTrap, NagVis 1.4.5, check_mk, PNP-0.6.x. Thruk
7
16.08.2011, 16:04
Zitat von »smue«
Das mit dem rrd habichmir gedacht, das es Ärger gibt(deswegen auch noch ganrnicht versucht).
Aber was für andere Möglichkeiten meintest du(die bei denen Man aufpassen muss?) rrdcached als Netzwerkservice
Anfänger
Beiträge: 10
Geburtstag: 28.02.
Wohnort: Berlin
Anzahl Nagios-Server: 3
Nagios-Version(en): 3.2.3
Verteiltes Monitoring: Ja
Redundantes Monitoring: Nein
Anzahl-Hosts: ~500
Anzahl Services: ~6k
Betriebssystem(e): Ubuntu 11.04
Plugin-Version(en): x
NDO-Version: 3