sams15
Goto Top

HP DL380 Gen8 - 1ne SAS im Raid1 degraded

Hallo, habe in einem Raid1 Verbund (Bay) eine SAS Platte die mir als degraded am Server und in Lilo angezeigt wird. Wie ist das normale Vorgehen für den Austausch der SAS Platte?

Was ich bis her getan habe: ich habe via Linux (das auf dem Server als OS installiert ist) ein Backup in meinem Falle von sdb wie folgt gemacht 'dd if=./dev/sdb of=/usbPlatte'. Dann habe ich die als degraded gegenzeichnete Platte durch eine gleichwertige ausgetauscht und das Backup 'dd if=usbPlatte of=/dev/sdb' zurück gespielt. So weit so gut zumindest dachte ich das, aber leider nein die ausgetauschte Platte wird jetzt zwar nicht mehr am Server selbst aber in Lilo als degraded angezeigt.

Jetzt wäre es Sinnvoll zu wissen wie Ihr normalerweise eine degraded Platte wechselt, um evtl. von mir gemachte Fehler abzustellen bzw. das Problem lösen, bedanke mich vorab. Wenn ich das richtig in Erinnerung habe ist das der HP Controller P420i, kann aber bei Bedarf gerne nochmals nachschauen.

Content-Key: 32556905559

Url: https://administrator.de/contentid/32556905559

Printed on: June 2, 2024 at 10:06 o'clock

Member: StefanKittel
StefanKittel May 16, 2024 updated at 15:51:08 (UTC)
Goto Top
Moin,

ähh... wie zurückgespielt?

Was für ein RAID-Controller?

Das normale vorgehene:
- Prüfen ob das Backup vorhanden und aktuell ist uns sonst eines erstellen
- Genau prüfen welche HDD defekt ist
- Defekte HDD rausnehmen und neue HDD reinstecken (im laufenden Betrieb)
- Warten bis das RAID sich wieder synchronisiert hat
Fertig

Es gibt wenige Controller wo man den Vorgang anstoßen muss.

Stefan
Member: sams15
sams15 May 16, 2024 at 16:12:48 (UTC)
Goto Top
ja einfach das Backup mit neuer SAS Restore, dachte ich halt bzw. getan.

Anbei ein Bild von Lilo, hier wird genau an selbiger Stelle die getauschte SAS HDD als degraded an gemeckert.
Mein Controller ist ein: 'Smart Array P420i Controller' von HP
screenshot_20240516_180653
Member: kreuzberger
kreuzberger May 16, 2024 at 16:27:12 (UTC)
Goto Top
Moin @sams15

wenn du da für das Betriebssystem ein RAID1 hast, sind das in der Regel ja (mindestens) zwei identische Platten, von denen nur eine vermutlich einen Defekt hat. So weit, so gut. Das RAID1 soll dich genau davor schützen und du kannst dies Platte ohne Verlust austauschen.

Wir wissen nicht, was für ein RAID Controller da verbaut ist, das gibt sicher die Beschreibung deines Servers her. Aber der Austausch und erneute Spiegelung (RAID1) übernimmt normalerweise ohne weiteres zutun der RAID-Controller (NACHLESEN DER CONTROLLER_ und SERVERBESCHREIBUNG!!!), indem du (Hot-Plug) die defekte Pladde entfernst und die Ersatzpladde rinnschubst.
Das dauert dann ne weile, bis die Spiegelung fertig ist, der Server insgesamt ist derweil lauffähig, aber vermutlich deutlich weniger performant.

Das wars schon

Kreuzberger
Member: radiogugu
radiogugu May 16, 2024 at 17:42:18 (UTC)
Goto Top
Nabend.

Wie die Kollegen schon schrieben, bei einem RAID Verbund muss eine Datensicherung nur dann zurückgespielt werden, wenn der Verbund gänzlich neu aufgebaut wurde.

Fällt ein Datenträger aus und die Toleranzgrenze ist noch nicht überschritten (bei RAID 1 darf eine HDD ausfallen - bei einem RAID 6 beispielsweise, dürfen zwei HDD ausfallen), dann muss nur ein neuer Datenträger mit mindestens gleicher Kapazität eingesetzt werden.

Der Rebuild der Daten sollte automatisch erfolgen. Dein genannter RAID Controller beherrscht das und es braucht etwas Geduld.

Hat sich der Status im iLO inzwischen geändert?

Bei 1TB HDD und einem RAID 1 sollte das recht schnell alles wieder in Ordnung sein.

Gruß
Marc
Member: ukulele-7
ukulele-7 May 17, 2024 at 06:42:30 (UTC)
Goto Top
Die HP Server haben auch Locator LEDs die blau leuchten können um die Platte zu identifizieren. Eventuell kann man das im iLo auslösen oder die leuchtet sogar schon blau weil degraded. Das schlechteste, was man tun kann, ist nämlich die falsche Platte raus zu ziehen...
Member: Hubert.N
Hubert.N May 17, 2024 at 06:59:44 (UTC)
Goto Top
Moin

Zitat von @sams15:
Wie ist das normale Vorgehen für den Austausch der SAS Platte?
Du ziehst die defekte Platte raus und steckst eine neu rein.

Gruß
Member: sams15
sams15 May 17, 2024 at 14:21:32 (UTC)
Goto Top
Hey vielen Dank für die Geduld und Erklärung. Ich denke ich habe es verstanden.

Ich habe die defekte Platte bereits getauscht und die LED an der Platte (die mir anzeigte das da was nicht stimmt) ist mittlerweile erlöschen, aber im Lilo nach wie vor, wie bereits auf dem Bild oben zu sehen, sagt das genau die getauscht Platte degraded sei, das wundert mich doch sehr.

Nun kann ich natürlich nochmals versuchen auch diese Platte zu ersetzten und mich in Geduld üben bis die Spieglung fertig ist. Oder ich ziehe mal für ein zwei Minuten die angeblich degraded bereits getauschte Platte heraus uns setzte Sie wieder ein. Was meint Ihr dazu?
Member: radiogugu
radiogugu May 17, 2024 updated at 18:05:42 (UTC)
Goto Top
Nun kann ich natürlich nochmals versuchen auch diese Platte zu ersetzten und mich in Geduld üben bis die Spieglung fertig ist.

Den Fortschritt muss man in iLO sehen, sodass du mitgeteilt bekommst, dass da eine Spiegelung im Gang ist.

Das sollte bei den logischen Laufwerken in den Klammern zu erkennen sein. Dort sollte neben "Degraded" noch "Rebuilding" stehen.

Gruß
Marc
Member: sams15
sams15 May 17, 2024 updated at 18:22:53 (UTC)
Goto Top
Danke, große Schande über mein Haupt, jetzt verstehe ich auch den oben genanten Satz, bestimme die degraded Platte. Oje, bin doch die ganze Zeit davon ausgegangen das Box1 Bay 1 der untere SAS Schacht am Server ist, verdammt dem ist natürlich nicht so.

Wäre ich da mal früher dahinter gekommen dann hätte dies mir bestimmt viel Arbeit erspart. Egal jetzt wieder etwas gelernt. Sogleich die obere SAS Platte gewechselt und schon zeigt mir ILO kein degraded mehr. Aber dafür 'Health Critical'
    -Logical Drive 01
        Status	 Failed
        Capacity	931 GiB
        Fault Tolerance	RAID 1/RAID 1+0
        Logical Drive Type	Data LUN
        Encryption Status	Not Encrypted

Vielleicht wird ja gerade an der Spiegelung gearbeitet, wo ersehe ich den Status bzw. Fortschritt der Spiegelung?
Member: radiogugu
radiogugu May 18, 2024 at 07:33:43 (UTC)
Goto Top
Sogleich die obere SAS Platte gewechselt und schon zeigt mir ILO kein degraded mehr. Aber dafür 'Health Critical'

Das iLO hat ja ein Ereignisprotokoll. Dort wird dir angezeigt, warum es meint, dass es dem System nicht gut geht.

Müsste unter "Information" > "Event Logs" zu finden sein.

Sind denn unter den logischen Laufwerken alle Haken auf grün? Ist der Status jetzt wieder sauber beim RAID Verbund?

Gruß
Marc
Member: sams15
sams15 May 19, 2024 at 08:27:26 (UTC)
Goto Top
Vielen lieben Dank, ich denke es funktioniert wieder alles soweit, aber an der Hardware bzw. rechts am HotPlug Schacht der beiden SAS Platten ist die LED an, die rötlich leuchtet, komisch. Anbei ebenfalls ein Teil-Bild des Event Log.

Bei dieser Gelegenheit drängt sich mir die Frage auf ob es Sinn macht ILO, für kleines Budget upzudaten und noch eine kleine Frage; kann ich die alte SAS irgendwie am besten via USB Bus anschließen und auslesen, bearbeiten usw., gib es dafür so etwas wie einen Adapter?
screenshot_20240519_101224
screenshot_20240519_100554
Member: sams15
sams15 May 20, 2024 at 09:57:29 (UTC)
Goto Top
Noch ein kleine Frage was bedeutet dies, was kann muss ich tun?
Embedded Flash/SD-CARD 		Controller firmware revision 2.10.00 Embedded media manager failed media attach 
Member: radiogugu
radiogugu May 20, 2024 at 12:31:54 (UTC)
Goto Top
Aktualsiere mal dein iLO. Eventuell ist hier ein Software Problem gegeben.

Hat der Server eine BOSS Karte oder sind Betriebssystem und Daten auf demselben RAID aus den genannten HDDs?

Es ist auch immer empfehlenswert die HDDs eines RAID Verbundes diesselbe Serie zu verwenden.

Gruß
Marc
Member: sams15
sams15 May 20, 2024 at 17:23:32 (UTC)
Goto Top
Das iLO habe ich heute erst auf Feb.02.2023 aktualisiert, genau danach erhielt ich auch die Meldung:
iLO Health (iLO Self-Test reports a problem with: Embedded Flash/SD-CARD. View details on Diagnostics page.)
Und 'Format Embedded Flash an Reset iLO' habe ich ebenfalls bereits getan. Da drängt sich mir die Frage auf wo hat der Server die SD-Card versteckt?. Ach so allerdings habe ich den Server seit dem nicht neu gestartet.

BOSS Karte, kannst du das ein wenig näher beschreiben? JA OS und Daten sind auf dem selben RAID, aber auf unterschiedlichen Partitionen, das ging bevor das HDD degreaded auftauchte ohne Probleme. Allerdings sind das schon, was die Serie und Hersteller betrifft, 2 unterschiedliche SAS's
screenshot_20240520_191041
screenshot_20240520_192059
screenshot_20240520_192129
Member: radiogugu
radiogugu May 21, 2024 at 16:05:45 (UTC)
Goto Top
BOSS Karte, kannst du das ein wenig näher beschreiben?

Boot Optimizes Storage Solution ist eine Erweiterung des Servers um eine PCIe Karte, welche beispielsweise zwei M.2 SSD "trägt" und mit eigenem RAID Controller den Speicher dann für das Server OS präsentiert.

Sowas hier:

https://www.serverschmiede.com/konfigurator_bulk/de/dell-boss-2x-m2-2280 ...

Ach so allerdings habe ich den Server seit dem nicht neu gestartet.

Nach einem Neustart können manche Probleme verschwunden oder andere aufgetaucht sein. Nichtsdestotrotz sollte man einen Neustart ab und an durchführen.

Gruß
Marc
Member: sams15
sams15 May 23, 2024 at 16:22:24 (UTC)
Goto Top
thx, nein ein BOSS Karte habe ich keine zumindest nicht im Sinn RAID Controller. Aber dafür eine 4er NIC-Karte, die jedoch sehr wahrscheinlich, für das Problem nicht relevant sein dürfte.

Ok dann werde ich mal über das WE den Server neu starten. Und wieder berichten.
Member: sams15
sams15 May 25, 2024 at 17:27:55 (UTC)
Goto Top
so jetzt kurz vor dem DFB Finale. Habe den Server neu gestartet.

Bilder sollen bekanntlich mehr aussagen als Worte.
Anbei ein paar Bilder, drei bzw. vier über den iLO Health Fehler bzw. Problem und eins via Kamera ohne Blitzlicht von der Server Front, hier kann man schön erkennen das die LED recht neben den zwei SAS bzw Bund an sind, leuchten.
screenshot_20240525_191312
screenshot_20240525_191244
screenshot_20240525_191335
20240525_191617
screenshot_20240525_191417