der-marek
Goto Top

VMware Esxi 7.0

Hallo Zusammen,

ich betreibe einen VMware ESXI 7.0 und einen ESXI 6.5.

Im Log kommen regelmäßig Einträge wie:
Auf dem esxi 7.0
smartd: [warn] t10.NVMe____Samsung_SSD_980_PRO_1TB_________________023C5101B9382500: REALLOCATED SECTOR CT below threshold (0 < 90)

Auf dem esxi 6.5.
smartd: [warn] t10.NVMe____CT1000P1SSD8____________________________1925E20D2C01________00000001: below REALLOCATED SECTOR CT threshold (0)

Wenn ich über SSH den Befehl für die jeweilige Platte "esxcli storage core device smart get -d (xxxx)" absetze, dann werden mir aber keine Fehler angezeigt

Hier die Daten der Samsung. Die der Crucial sehen ähnlich aus

Parameter                 Value  Threshold  Worst  Raw
------------------------  -----  ---------  -----  ---
Health Status             OK     N/A        N/A    N/A
Power-on Hours            4561   N/A        N/A    N/A
Power Cycle Count         22     N/A        N/A    N/A
Reallocated Sector Count  0      90         N/A    N/A
Drive Temperature         35     82         N/A    N/A


Wenn ich mir über
esxcli nvme device log smart get -A vmhba(x)
die SMART Infos hole, dann sind dort keine "Media Errors" enthalten und mit den "Data Units Written" komme ich mit der Samsung aktuell bei 4 TBW an, bei der Crucial bei 22 TBW. Beide weit unterhalb der vorgegebenen Lebensdauer des Herstellers. (Die Crucial hat 200 TBW, die Samsung 600 TBW)
"Percentage Used" ist bei 1% und 3%

Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?

Gruß
Marek

Content-Key: 666337

Url: https://administrator.de/contentid/666337

Printed on: April 18, 2024 at 02:04 o'clock

Member: Lochkartenstanzer
Lochkartenstanzer May 03, 2021 at 13:03:31 (UTC)
Goto Top
Zitat von @der-marek:

Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?


Moin,

da steht doch
Reallocated Sector Count  0      90         N/A    N/A

Da 0 unter der Schwelle 90 gibt, gibt es eine Warnung.

Wenn Du korrekte Daten willst, mußt du halt Geräte einsetzen, die supported sind.

Ich würde dringend davor warnen, SSDs/HDDs einzusetzen, die smart nciht vollständig unterstützten, bzw. mit denen das OS nichts anfangen kann. Das konterkariert den Zweck von smart und erhöht das Risiko für Datenverlust.

lks
Mitglied: 148121
Solution 148121 May 03, 2021 updated at 14:52:56 (UTC)
Goto Top
Zitat von @der-marek:
Wenn ich mir über
esxcli nvme device log smart get -A vmhba(x)
die SMART Infos hole, dann sind dort keine "Media Errors" enthalten und mit den "Data Units Written" komme ich mit der Samsung aktuell bei 4 TBW an, bei der Crucial bei 22 TBW. Beide weit unterhalb der vorgegebenen Lebensdauer des Herstellers. (Die Crucial hat 200 TBW, die Samsung 600 TBW)
"Percentage Used" ist bei 1% und 3%

Kann es sein, dass der ESXI mir einfach eine warnung ausgibt, weil ich keine von VMWare favorisierte Platte drin habe, oder übersehe ich da etwas?
Schließe die SSD mal an ein normales Linux oder Windows-System an und lese die Smart-Parameter mal dort aus wenn dir dort ebenfalls als Value 0 bei Reallocated Sector Count angezeigt wird dann würde ich das ernst nehmen. Zellen können aber schon vorzeitig abrauchen. Und wenn davon genug den Geist aufgeben und die Reserve-Zellen eben ausgegangen sind dann wird das auf einen massenhaften Defekt der Zellen hinweisen => SSD stirbt womöglich schneller als gedacht. Konkret wurden also schon alle Reserve-Zellen alloziiert was im Falle weiterer defekter Zellen in Zukunft wohl Bitfehler sehr wahrscheinlich werden.
SSDs sind halt auch nicht vor Defekt gefeit... Wenn du also noch Garantie/Gewährleistung auf die Teile hast ab damit zum Händler.


Gruß w.
Member: GrueneSosseMitSpeck
GrueneSosseMitSpeck May 03, 2021 at 21:27:22 (UTC)
Goto Top
wie einer der Kollegen sagte... mal die Platte mit einem physischen Host checken.

Da die 980 Pro erst seit ein paar Moanten auf dem Markt ist halte ich die Meldungen eher für Störfeuer.
Bei der anderen SSD... muß man gucken.

Ich hab eine 1 Jahre alte 970 EVO als NVME unter ESX 6.7 und hab diese Meldungen nicht, auch meine OCZ Trion SSD 1 TB (2014 für 150 Euro erworben, absolutes Billigstteil) hinterläßt im Log keine SMART Spuren...
Member: der-marek
der-marek May 05, 2021 at 13:06:18 (UTC)
Goto Top
Hi,

Danke ! Habe mir einen kleinen Adapter geholt und die Platten an meinen Rechner angeschlossen. Mit der aktuellen Crystal DiskInfo (V 8.12.0) kommt, dass alles in Ordnung ist und die selben Werte, wie ich sie auch mit SSH aus dem ESXI gezogen habe.
Lt. dem Tool unterstützen die Platten auch SMART, scheinbar nur nicht auf die gleiche Art und Weise wie der ESXI face-sad
Ich schaue mir die Platten immer mal wieder an und bewerte dann einfach neu.

Gruß
Marek