You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

三星970 EVO Plus NVMe磁盘“Percentage Used”指标可靠性咨询

三星970 EVO Plus NVMe磁盘“Percentage Used”指标可靠性咨询

嘿,针对你提到的这台服务器里的三星NVMe磁盘情况,我来帮你拆解分析下~

先明确下服务器的磁盘配置:

  • 一共2块磁盘,全是三星SSD 970 EVO Plus 2TB,固件版本统一为2B2QEXM7

下面是其中一块磁盘(/dev/nvme0)用smartctl -A /dev/nvme0命令拿到的SMART检测数据:

smartctl 7.1 2019-12-30 r5022 [x86_64-linux-5.4.0-187-generic] (local build)
Copyright (C) 2002-19, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x04
Temperature:                        44 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    100%
Data Units Read:                    397,100,009 [203 TB]
Data Units Written:                 720,731,497 [369 TB]
Host Read Commands:                 5,087,298,653
Host Write Commands:                24,700,879,764
Controller Busy Time:               1,679,412,115
Power Cycles:                       12
Power On Hours:                     31,907
Unsafe Shutdowns:                   7
Media and Data Integrity Errors:    0
Error Information...

重点说下你可能关心的Percentage Used到100%的情况:

  • 这个指标是NVMe盘用来估算剩余寿命的核心参数,理论上100%代表磁盘已经耗尽了厂商定义的额定写入寿命(三星970 EVO Plus 2TB的官方TBW是600TB)。但你这块盘的累计写入量才369TB,远没到600TB的阈值,这里的100%大概率是固件算法的估算偏差,或者是SMART日志的某些统计维度导致的。
  • 另外注意到Critical Warning0x04,这个标记对应的是「可用备用空间低于阈值」,但你的Available Spare还是100%,完全没到10%的阈值,这明显矛盾——大概率是你贴的输出被截断了,Error Information部分的内容缺失,建议补全完整的SMART输出,这样能更准确判断问题。
  • 好在目前Media and Data Integrity Errors是0,说明磁盘还没出现介质层面的读写错误,31907小时的开机时长、12次电源循环、7次不安全关机这些数据也都在合理范围内。

如果要彻底搞清楚状况,建议你把两块磁盘的完整SMART数据都跑一遍,对比两者的参数,看看是不是单盘的固件异常导致的指标异常。

备注:内容来源于stack exchange,提问作者zerkms

火山引擎 最新活动