三星970 EVO Plus NVMe磁盘“Percentage Used”指标可靠性咨询
三星970 EVO Plus NVMe磁盘“Percentage Used”指标可靠性咨询
嘿,针对你提到的这台服务器里的三星NVMe磁盘情况,我来帮你拆解分析下~
先明确下服务器的磁盘配置:
- 一共2块磁盘,全是三星SSD 970 EVO Plus 2TB,固件版本统一为
2B2QEXM7
下面是其中一块磁盘(/dev/nvme0)用smartctl -A /dev/nvme0命令拿到的SMART检测数据:
smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-187-generic] (local build) Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org === START OF SMART DATA SECTION === SMART/Health Information (NVMe Log 0x02) Critical Warning: 0x04 Temperature: 44 Celsius Available Spare: 100% Available Spare Threshold: 10% Percentage Used: 100% Data Units Read: 397,100,009 [203 TB] Data Units Written: 720,731,497 [369 TB] Host Read Commands: 5,087,298,653 Host Write Commands: 24,700,879,764 Controller Busy Time: 1,679,412,115 Power Cycles: 12 Power On Hours: 31,907 Unsafe Shutdowns: 7 Media and Data Integrity Errors: 0 Error Information...
重点说下你可能关心的Percentage Used到100%的情况:
- 这个指标是NVMe盘用来估算剩余寿命的核心参数,理论上100%代表磁盘已经耗尽了厂商定义的额定写入寿命(三星970 EVO Plus 2TB的官方TBW是600TB)。但你这块盘的累计写入量才369TB,远没到600TB的阈值,这里的100%大概率是固件算法的估算偏差,或者是SMART日志的某些统计维度导致的。
- 另外注意到
Critical Warning是0x04,这个标记对应的是「可用备用空间低于阈值」,但你的Available Spare还是100%,完全没到10%的阈值,这明显矛盾——大概率是你贴的输出被截断了,Error Information部分的内容缺失,建议补全完整的SMART输出,这样能更准确判断问题。 - 好在目前
Media and Data Integrity Errors是0,说明磁盘还没出现介质层面的读写错误,31907小时的开机时长、12次电源循环、7次不安全关机这些数据也都在合理范围内。
如果要彻底搞清楚状况,建议你把两块磁盘的完整SMART数据都跑一遍,对比两者的参数,看看是不是单盘的固件异常导致的指标异常。
备注:内容来源于stack exchange,提问作者zerkms




