You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

如何排查导致电脑无预兆硬重启/崩溃的故障硬件?

如何排查导致电脑无预兆硬重启/崩溃的故障硬件?

兄弟,这种毫无预兆的硬重启真的太闹心了——尤其是双系统都中招、温度正常、压力测试还测不出来,连日志都没留下有效线索,完全摸不着头脑对吧?我结合你的情况给你梳理几个针对性的排查方向,一步步来缩小范围:

一、先从最易操作的「排除法」入手

  • 检查硬件连接:先打开机箱,挨个检查所有电源线(PSU到主板、GPU、硬盘的线)、内存、GPU的插针有没有松动,尤其是PSU的模组线——有时候模组接口氧化、没插紧会导致供电不稳,这种情况压力测试不一定能触发,反而随机小负载会出问题。可以把模组线拔下来重新插紧,甚至换个模组接口试试。
  • 内存排查:虽然你测过内存,但可以试试单条内存运行(轮流插每条),或者降低内存频率到JEDEC标准(比如3200MHz甚至2133MHz)。有些时候内存超频不稳定(哪怕你没手动超,XMP可能自动超)也会导致无预兆重启,而且不一定在压力测试中暴露。
  • 硬盘排查:用三星Magician工具给你的990pro做个全盘健康检测,重点看有没有突发读写错误——虽然硬盘故障一般会有蓝屏或日志,但也不排除极端情况,先把它排除掉。

二、针对你怀疑的PSU,这些方法能帮你确认

PSU故障是典型的「无规律、无日志」硬重启元凶,尤其是老电源,电容老化后供电波动不稳定,轻负载可能没事,随机负载就掉电:

  • 替换测试(最直接):如果能借到一个功率足够的靠谱金牌/白金级PSU(至少850W以上,你的3950x+1080ti满负载大概600W左右,1000W是够的,但老电源可能功率衰减),换上试试。如果换完后几天都不重启,基本可以确定是原PSU的问题。
  • 监测电压波动:用主板BIOS里的硬件监控功能,或者Windows下用HWMonitor、Ubuntu下用sensors命令,长期监测CPU、GPU、主板的核心电压(比如CPU Vcore、GPU VCCIO、+12V、+5V)。如果重启前出现电压突然掉幅超过5%(比如+12V掉到11.4V以下),那大概率是PSU稳压出问题了。
  • 模拟随机负载测试:普通压力测试是持续满负载,但你的问题是随机负载触发,可以试试用工具模拟「脉冲式」负载——比如用Prime95跑1分钟停2分钟,循环往复,同时开着浏览器、视频播放器、后台挂几个小软件,模拟日常使用的随机波动,看能不能触发重启。

三、GPU的排查方法

  • 降频测试:用MSI Afterburner或者NVIDIA控制面板,把GPU的核心频率和显存频率降低10%-15%。如果降低后不再重启,说明GPU的供电模块或者核心有老化故障,在随机负载下触发了保护机制。
  • 替换GPU测试:如果有备用显卡,换上试试,或者把你的1080ti插到别的靠谱主机上,看会不会出现同样的重启问题,这样能直接确认是不是GPU的锅。

四、最后排查主板和CPU

  • CPU降功耗:在BIOS里把CPU的功耗墙降低(比如从默认的142W降到120W),或者关闭超频(如果开了PBO)。有些时候CPU供电模块老化,随机高负载时供电不足也会导致重启。
  • 检查主板电容:打开机箱看主板上的电解电容(尤其是CPU供电附近的)有没有鼓包、漏液,老主板电容老化也会导致供电不稳。

备注:内容来源于stack exchange,提问作者Kodeeo

火山引擎 最新活动