You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

两台配置相同的Ubuntu Server 17.10出现soft lockup问题求助

解决Ryzen+B350平台Ubuntu 17.10下的Soft Lockup问题

这类第一代Ryzen搭配B350主板在早期Ubuntu版本上的soft lockup问题我之前接触过不少案例,结合你给出的两台完全相同配置的机器故障现象,给你几个针对性的排查和解决方向:

1. 优先修复内核与BIOS的兼容性短板

  • 你使用的Ubuntu Server 17.10(Artful)自带的内核版本对Ryzen 1800X的支持还不够成熟,建议升级到该版本专属的HWE(硬件启用栈)内核,这是官方针对新硬件适配推出的优化内核:
    sudo apt update && sudo apt install linux-generic-hwe-17.10
    
    安装完成后重启系统,HWE内核会大幅提升对Ryzen CPU和B350芯片组的兼容性。
  • 微星Tomahawk B350的早期BIOS版本存在Ryzen CPU功耗控制、内存时序适配的bug,直接导致闲置时的soft lockup。请前往微星官网下载对应主板的最新稳定版BIOS,严格按照官方流程刷新(建议用U盘启动刷新,避免系统内刷新的风险)。刷新后重点检查BIOS中是否开启了针对Ryzen的“AM4 Power Management”优化选项。

2. 调整内存与CPU的节能/超频设置

  • 你的Corsair Velocity内存虽然是品牌条,但Ryzen平台对内存的兼容性要求极高。先尝试在BIOS中关闭XMP超频,将内存降到JEDEC标准频率(比如2133MHz)运行一周,如果lockup问题消失,再逐步调整XMP参数或单独优化内存时序,找到稳定的平衡点。
  • 关闭CPU的深度C-state节能选项(C6、C7模式),早期Ryzen在深度休眠唤醒时极易触发soft lockup,而Ubuntu 17.10的内核对该场景的处理存在缺陷。在BIOS的“CPU Power Management”菜单中,将C-state设置为“Disabled”或仅保留C1模式。

3. 针对Watchdog与闲置场景的临时缓解

  • 既然每日凌晨重启无法解决问题,说明闲置时的电源管理触发了核心bug。可以修改内核参数降低watchdog的严格检测阈值,避免机器直接锁定:
    编辑/etc/default/grub文件,找到GRUB_CMDLINE_LINUX_DEFAULT行,添加以下参数:
    softlockup_panic=0 nmi_watchdog=0
    
    执行sudo update-grub后重启系统,这个设置会让watchdog仅记录报错而不触发系统锁定,给你更多排查时间。
  • 设置定时任务让系统保持轻度活动,避免进入深度休眠:
    crontab -e添加定时任务,每小时执行一次简单命令:
    0 * * * * echo "system keepalive" >> /tmp/system_keepalive.log
    

4. 排查NVMe SSD的兼容性问题

  • 你的Samsung EVO Pro 960 M.2 SSD在早期B350主板上可能存在NVMe节能模式的兼容性问题。可以安装NVMe工具检查设备状态:
    sudo apt install nvme-cli
    nvme list
    nvme smart-log /dev/nvme0n1
    
    如果发现IO错误或异常的功耗状态,在grub内核参数中添加nvme_core.default_ps_max_latency_us=0,禁用NVMe的自动节能模式,避免闲置时的IO挂起触发soft lockup。

内容的提问来源于stack exchange,提问作者Dennis

火山引擎 最新活动