awausf
Goto Top

HP Procure (Aruba) 5400zl Monitoring mit Zabbix

Hallo zusammen,

ich möchte unsere Switche per SNMP und Zabbix überwachen und das ist auch prinzipiell kein Problem. Ich stelle nur besonders an unserem 5412zl fest, das die CPU Auslastung auf 100% geht, sobald Zabbix die Daten abruft. Ich habe die Datenpunkte jetzt schon soweit eingestampft das ich neben den grundlegenden Dingen nur den Duplex Status, Up/Down, In/Out Errors abrufe und habe immer noch um die 30% Dauerlast nur für SNMP.

IST DAS NORMAL? face-smile Ist das SInn der Sache? Mach ich was falsch??? face-smile

Switch hat Firmware K.16.02.0022m und Zabbix ist v5

Ist es evtl. sinnvoller Zabbix beizubringen auf SNMP Traps zu hören und nur ein initiales Discovery durchzuführen?

Der Switch routet ca. 40 Vlans mit 2x 10Gbit Uplink mit einigen aktiven Diensten und hat ohne Monitoring vlt. 2-3% Auslastung, mit Monitoring hängt bei der zyklischen Abfrage schon die Console (100% Auslastung) und vermutl. noch mehr, habe es direkt wieder deaktiviert

Content-Key: 598950

Url: https://administrator.de/contentid/598950

Printed on: April 25, 2024 at 11:04 o'clock

Member: chgorges
chgorges Aug 25, 2020 at 14:39:52 (UTC)
Goto Top
Hi,

zuerst: die Switch-Firmware ist asbachuralt, bitte aktualisieren face-smile

Ansonsten ist die zyklische Abfrage sicherlich nicht die Variante, die man nehmen sollte, man verpasst ggf. das eine oder andere Event. Mach ein initiales Discovery und lass dann die Traps abhören, so machen es auch die anderen Nagios, PRTG, etc.
Member: em-pie
em-pie Aug 25, 2020 at 18:09:50 (UTC)
Goto Top
Zitat von @chgorges:

Hi,

zuerst: die Switch-Firmware ist asbachuralt, bitte aktualisieren face-smile
naja, die 16.02.0026 ist da auch nicht viel jünger, wenngleich die letzte FW für den Switch:
https://h10145.www1.hpe.com/downloads/SoftwareReleases.aspx?ProductNumbe ...
Und die Releasenotes geben auch nicht viel Infos über SNMP-Probleme (wobei auch nicht immer alles genannt wird, was die anpassen)...

Ansonsten ist die zyklische Abfrage sicherlich nicht die Variante, die man nehmen sollte, man verpasst ggf. das eine oder andere Event. Mach ein initiales Discovery und lass dann die Traps abhören, so machen es auch die anderen Nagios, PRTG, etc.
Interessant wäre ja, ob das Problem von Zabbix ausgeht, weil der Switch unnötig oft abgefragt wird oder ob das Problem auf Seiten des Switches liegt.
Ich würde da mal ein anderes Tool zur Gegenprobe nutzen...

Gruß
em-pie
Member: AWausF
AWausF Aug 26, 2020, updated at Aug 27, 2020 at 09:29:17 (UTC)
Goto Top
Der Switch hat halt auch 268 Ports, da kommt einiges zusammen (2981 Items genau), jedoch sollte die Abfrage von Livedaten ihn auch dann nicht in die Knie zwingen! Standardmäßig werden neben dem was man im Anhang sieht noch Temperatur, Uptime, Ping Latenz, Netzteil und Speicherauslastung abgefragt. Link Flapping, Looperkennung, STP und POE Probleme zum Beispiel hätte ich dann eigentlich auch noch gerne, aber das geht am besten über Traps und Trigger... Scheint auch keine großen Ressourcen zu fressen, nur das Abfragen treibt den HTTP Dienst in die Höhe. Warum eigentlich HTTP??? face-smile

Einmal über Templates und Discovery abfragen was der Switch so hat und dann über Traps aktualisieren geht übrigens nicht, die Datenpunkte können nicht zusammengeworfen werden meines Wissens

Hier mal ein Ausschnitt was passiert wenn alle 3m abgefragt wird, das geht garnicht! Dem Switch ist langweilig und nur weil ich wissen will wie es ihm geht bekommt er einen Kollaps. Ich weiß nicht wie die Prioritäten des Switchs gestaltet sind, ssh hängt in dem Moment zumindest und die Ping Responsetime steigt auf über 600ms, switchen und routen usw. wird sicherlich auch beeinträchtigt. Speicherauslastung bewegt sich übrigens konstant um die 50%

Ich versuche es jetzt nochmal mit einem kleineren 5406zl der nur Edge Funktionen aktiv hat...

Und das Thema mit der Firmware, ja die .26 habe ich, aber in den Release Notes steht nichts darüber, einspielen fand ich daher für noch nicht zwingend notwendig.

Letzte Option wäre halt nur das Chassis zu überwachen und über Traps quasi das Log auszuwerten. Dann kann ich es aber auch schon fast wieder ganz lassen und das Log einfach auf einen Syslog Server auflaufen lassen.

Was mich irritiert ist das man im Netz nichts dazu findet?!

Hier die CPU Load Schleife eines Zyklus.

HP-E5412zl-NK1.1(config)# sh cpu

Task usage for last 9 seconds
 % CPU | Description
-------+--------------------------
  99.7 | Idle
   0.3 | Sessions & I/O

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy

HP-E5412zl-NK1.1(config)# repeat delay 3

Task usage for last 2 seconds
 % CPU | Description
-------+--------------------------
  98.8 | Idle
   1.2 | HTTP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 5 seconds
 % CPU | Description
-------+--------------------------
  98.8 | Idle
   0.3 | Sessions & I/O
   0.3 | System Services
   0.6 | HTTP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 8 seconds
 % CPU | Description
-------+--------------------------
  99.1 | Idle
   0.2 | Sessions & I/O
   0.2 | System Services
   0.4 | HTTP
   0.2 | TFTP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 1 seconds
 % CPU | Description
-------+--------------------------
 100.0 | Idle

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 4 seconds
 % CPU | Description
-------+--------------------------
  99.6 | Idle
   0.3 | Sessions & I/O

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 7 seconds
 % CPU | Description
-------+--------------------------
  99.8 | Idle
   0.2 | Sessions & I/O

1 percent busy, from 3 sec ago
1 sec ave: 2 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 0 seconds
 % CPU | Description
-------+--------------------------
  95.8 | Idle
   4.2 | GVRP/GARP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 3 seconds
 % CPU | Description
-------+--------------------------
  99.0 | Idle
   0.5 | Sessions & I/O
   0.5 | GVRP/GARP

0 percent busy, from 3 sec ago
1 sec ave: 2 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 6 seconds
 % CPU | Description
-------+--------------------------
  99.5 | Idle
   0.3 | Sessions & I/O
   0.3 | GVRP/GARP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 1 percent busy


Task usage for last 9 seconds
 % CPU | Description
-------+--------------------------
  99.5 | Idle
   0.3 | Sessions & I/O
   0.2 | GVRP/GARP

78 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 47 percent busy
1 min ave: 4 percent busy


Task usage for last 2 seconds
 % CPU | Description
-------+--------------------------
   1.5 | Idle
  98.5 | HTTP

99 percent busy, from 3 sec ago
1 sec ave: 100 percent busy
5 sec ave: 99 percent busy
1 min ave: 9 percent busy


Task usage for last 5 seconds
 % CPU | Description
-------+--------------------------
   1.5 | Idle
   0.3 | System Services
  98.2 | HTTP

98 percent busy, from 4 sec ago
1 sec ave: 99 percent busy
5 sec ave: 98 percent busy
1 min ave: 15 percent busy


Task usage for last 9 seconds
 % CPU | Description
-------+--------------------------
   1.6 | Idle
   0.2 | Sessions & I/O
   0.2 | Hardware Mgmt
   0.3 | System Services
  97.5 | HTTP
   0.2 | TFTP

99 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 99 percent busy
1 min ave: 20 percent busy


Task usage for last 2 seconds
 % CPU | Description
-------+--------------------------
   1.3 | Idle
   0.6 | System Services
  98.1 | HTTP

97 percent busy, from 4 sec ago
1 sec ave: 99 percent busy
5 sec ave: 97 percent busy
1 min ave: 27 percent busy


Task usage for last 6 seconds
 % CPU | Description
-------+--------------------------
   2.4 | Idle
   0.3 | Sessions & I/O
   0.5 | System Services
  96.8 | HTTP

97 percent busy, from 3 sec ago
1 sec ave: 95 percent busy
5 sec ave: 97 percent busy
1 min ave: 32 percent busy


Task usage for last 9 seconds
 % CPU | Description
-------+--------------------------
   2.7 | Idle
   0.2 | Sessions & I/O
   0.5 | System Services
  96.6 | HTTP

98 percent busy, from 3 sec ago
1 sec ave: 100 percent busy
5 sec ave: 97 percent busy
1 min ave: 36 percent busy


Task usage for last 2 seconds
 % CPU | Description
-------+--------------------------
   2.8 | Idle
  96.6 | HTTP
   0.6 | TFTP

97 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 97 percent busy
1 min ave: 41 percent busy


Task usage for last 5 seconds
 % CPU | Description
-------+--------------------------
   2.8 | Idle
   0.3 | Sessions & I/O
   0.3 | System Services
  96.4 | HTTP
   0.3 | TFTP

99 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 98 percent busy
1 min ave: 46 percent busy


Task usage for last 8 seconds
 % CPU | Description
-------+--------------------------
   2.4 | Idle
   0.4 | Sessions & I/O
   0.2 | System Services
  96.5 | HTTP
   0.6 | TFTP

98 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 98 percent busy
1 min ave: 51 percent busy


Task usage for last 1 seconds
 % CPU | Description
-------+--------------------------
   1.8 | Idle
  98.2 | HTTP

97 percent busy, from 4 sec ago
1 sec ave: 97 percent busy
5 sec ave: 97 percent busy
1 min ave: 58 percent busy


Task usage for last 5 seconds
 % CPU | Description
-------+--------------------------
   2.5 | Idle
   0.3 | Sessions & I/O
  97.2 | HTTP

97 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 97 percent busy
1 min ave: 62 percent busy


Task usage for last 8 seconds
 % CPU | Description
-------+--------------------------
   2.8 | Idle
   0.4 | Sessions & I/O
   0.2 | Hardware Mgmt
  96.6 | HTTP

99 percent busy, from 4 sec ago
1 sec ave: 99 percent busy
5 sec ave: 99 percent busy
1 min ave: 69 percent busy


Task usage for last 2 seconds
 % CPU | Description
-------+--------------------------
   3.2 | Idle
   0.8 | System Services
  96.0 | HTTP

95 percent busy, from 3 sec ago
1 sec ave: 95 percent busy
5 sec ave: 96 percent busy
1 min ave: 74 percent busy


Task usage for last 5 seconds
 % CPU | Description
-------+--------------------------
   3.3 | Idle
   0.3 | System Services
   0.3 | Spanning Tree
  96.1 | HTTP

98 percent busy, from 4 sec ago
1 sec ave: 99 percent busy
5 sec ave: 97 percent busy
1 min ave: 80 percent busy


Task usage for last 9 seconds
 % CPU | Description
-------+--------------------------
   3.0 | Idle
   0.2 | System Services
   0.2 | Spanning Tree
  96.7 | HTTP

98 percent busy, from 4 sec ago
1 sec ave: 94 percent busy
5 sec ave: 98 percent busy
1 min ave: 87 percent busy


Task usage for last 3 seconds
 % CPU | Description
-------+--------------------------
   3.2 | Idle
  96.8 | HTTP

98 percent busy, from 3 sec ago
1 sec ave: 100 percent busy
5 sec ave: 97 percent busy
1 min ave: 92 percent busy


Task usage for last 6 seconds
 % CPU | Description
-------+--------------------------
   2.1 | Idle
   0.5 | System Services
  97.4 | HTTP

99 percent busy, from 4 sec ago
1 sec ave: 100 percent busy
5 sec ave: 99 percent busy
1 min ave: 98 percent busy


Task usage for last 0 seconds
 % CPU | Description
-------+--------------------------
 100.0 | HTTP

98 percent busy, from 3 sec ago
1 sec ave: 95 percent busy
5 sec ave: 98 percent busy
1 min ave: 98 percent busy


Task usage for last 3 seconds
 % CPU | Description
-------+--------------------------
   2.2 | Idle
   0.4 | Sessions & I/O
  96.9 | HTTP
   0.4 | TFTP

98 percent busy, from 4 sec ago
1 sec ave: 97 percent busy
5 sec ave: 97 percent busy
1 min ave: 98 percent busy


Task usage for last 7 seconds
 % CPU | Description
-------+--------------------------
   2.4 | Idle
   0.2 | Sessions & I/O
  96.9 | HTTP
   0.4 | TFTP

98 percent busy, from 4 sec ago
1 sec ave: 99 percent busy
5 sec ave: 98 percent busy
1 min ave: 97 percent busy


Task usage for last 1 seconds
 % CPU | Description
-------+--------------------------
   1.4 | Idle
   1.4 | Sessions & I/O
  97.2 | HTTP

99 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 99 percent busy
1 min ave: 98 percent busy


Task usage for last 4 seconds
 % CPU | Description
-------+--------------------------
   1.8 | Idle
   0.4 | Sessions & I/O
  97.5 | HTTP
   0.4 | TFTP

98 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 98 percent busy
1 min ave: 98 percent busy


Task usage for last 7 seconds
 % CPU | Description
-------+--------------------------
   2.0 | Idle
   0.2 | Sessions & I/O
  97.6 | HTTP
   0.2 | TFTP

98 percent busy, from 4 sec ago
1 sec ave: 97 percent busy
5 sec ave: 98 percent busy
1 min ave: 98 percent busy


Task usage for last 1 seconds
 % CPU | Description
-------+--------------------------
   2.6 | Idle
  97.4 | HTTP

99 percent busy, from 3 sec ago
1 sec ave: 99 percent busy
5 sec ave: 98 percent busy
1 min ave: 98 percent busy


Task usage for last 4 seconds
 % CPU | Description
-------+--------------------------
   2.1 | Idle
   0.7 | System Services
  97.2 | HTTP

98 percent busy, from 3 sec ago
1 sec ave: 100 percent busy
5 sec ave: 98 percent busy
1 min ave: 98 percent busy


Task usage for last 7 seconds
 % CPU | Description
-------+--------------------------
   2.2 | Idle
   0.6 | System Services
  97.1 | HTTP

98 percent busy, from 4 sec ago
1 sec ave: 97 percent busy
5 sec ave: 98 percent busy
1 min ave: 98 percent busy


Task usage for last 1 seconds
 % CPU | Description
-------+--------------------------
   2.9 | Idle
  97.1 | HTTP

97 percent busy, from 3 sec ago
1 sec ave: 97 percent busy
5 sec ave: 97 percent busy
1 min ave: 98 percent busy


Task usage for last 4 seconds
 % CPU | Description
-------+--------------------------
   2.3 | Idle
  97.7 | HTTP

96 percent busy, from 4 sec ago
1 sec ave: 92 percent busy
5 sec ave: 96 percent busy
1 min ave: 98 percent busy


Task usage for last 8 seconds
 % CPU | Description
-------+--------------------------
   3.3 | Idle
   0.2 | Sessions & I/O
  96.4 | HTTP

67 percent busy, from 3 sec ago
1 sec ave: 4 percent busy
5 sec ave: 77 percent busy
1 min ave: 96 percent busy


Task usage for last 1 seconds
 % CPU | Description
-------+--------------------------
  95.0 | Idle
   1.0 | Hardware Mgmt
   4.0 | HTTP

1 percent busy, from 3 sec ago
1 sec ave: 2 percent busy
5 sec ave: 21 percent busy
1 min ave: 91 percent busy


Task usage for last 4 seconds
 % CPU | Description
-------+--------------------------
  97.8 | Idle
   0.3 | Sessions & I/O
   0.3 | Hardware Mgmt
   1.4 | HTTP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 86 percent busy


Task usage for last 7 seconds
 % CPU | Description
-------+--------------------------
  98.5 | Idle
   0.2 | Sessions & I/O
   0.2 | Hardware Mgmt
   0.2 | GVRP/GARP
   0.9 | HTTP

0 percent busy, from 3 sec ago
1 sec ave: 1 percent busy
5 sec ave: 1 percent busy
1 min ave: 82 percent busy


Task usage for last 0 seconds
 % CPU | Description
-------+--------------------------
 100.0 | Idle
anmerkung 2020-08-27 105357
Member: AWausF
AWausF Aug 27, 2020 at 09:47:28 (UTC)
Goto Top
Gerade den anderen Switch eingebunden... Keine Schwankungen in der CPU Last... Nichts... Selber Switch, selbe Firmware, nur die Hälfte der Ports und keine Routing, oder sonstige L3, L4 Funktionen... 🤪