HGST硬盘执行短SMART测试后负载循环计数激增及频繁启停问题求助
问题背景
我用一台旧笔记本装Debian 9.6做DIY NAS,搭配的是HGST HTS541010B7E610硬盘。之前硬盘的Power_On_Hours已经超过37000小时,但Load_Cycle_Count只有380次。
但在我用smartctl执行了一次短SMART测试后,Load_Cycle_Count开始快速增长——短短几小时就涨了约100次,同时硬盘还会发出明显的磁头加载/卸载的咔哒声。
目前我通过hdparm把APM值从默认的128改成254后,频繁启停的情况停止了,但硬盘温度上升了3℃(现在是34℃),我不确定这个温度变化的影响,想看看有没有其他不用重启系统就能解决的办法。
硬盘大概有4-5年历史,以下是完整的SMART属性数据:
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0027 192 190 021 Pre-fail Always - 1400
4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 80
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0
9 Power_On_Hours 0x0032 049 049 000 Old_age Always - 37652
10 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 0
11 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 80
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 56
193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 489
194 Temperature_Celsius 0x0022 109 099 000 Old_age Always - 34
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0
200 Multi_Zone_Error_Rate 0x0008 100 253 000 Old_age Offline - 0
可能的解决方案(无需重启系统)
- 确认APM设置的可靠性:你已经用
hdparm -B 254 /dev/sdX修改了APM,但有些HGST硬盘用smartctl设置APM会更稳定,试试执行smartctl --set=apm,254 /dev/sdX,之后用smartctl -a /dev/sdX | grep APM验证是否生效。 - 禁用磁盘自动停转超时:检查当前的自动停转设置,执行
hdparm -S /dev/sdX,如果输出不是0,说明设置了超时停转,执行hdparm -S 0 /dev/sdX可以禁用自动停转(0表示永不自动停转),这个操作即时生效。 - 排查NAS服务的频繁小IO:作为NAS,Samba、NFS这类服务可能会产生频繁的小文件访问触发磁头启停。用
iostat -x 1 /dev/sdX观察磁盘IO情况,如果看到持续的r/s或w/s数值较高(比如每秒几次以上),可以调整服务的缓存参数:比如Samba的oplocks = yes和level2 oplocks = yes能减少文件访问的频次,修改配置后重启Samba服务(systemctl restart smbd)即可,无需重启系统。 - 关于温度上升的问题:你的硬盘当前温度34℃完全在HGST 2.5寸硬盘的正常工作范围(30-45℃)内,不用过度担心。反而频繁的磁头加载卸载对硬盘的机械损伤远大于这3℃的温度变化,保持APM 254的设置是更稳妥的选择。
备注:内容来源于stack exchange,提问作者ComputerNoob456




