Ubuntu 22.04.3在HP Pavilion DV4-3029TX Intel平台上随机无日志冻结的诊断求助
Ubuntu 22.04.3在HP Pavilion DV4-3029TX Intel平台上随机无日志冻结的诊断求助
各位大佬好,我遇到了一个特别头疼的问题,折腾了好久都没头绪,想请大家给点排查方向:
系统基本信息
- 设备:HP Pavilion DV4-3029TX PC,处理器i5-2410,核显Intel HD Graphics 3000,内存8GB
- 系统:运行Ubuntu 22.04.3,先后试过默认的5.15内核、HWE的6.2和6.5内核
问题核心表现
系统每天会随机冻结好几次,不管是空闲状态还是正在操作中都可能发生。而且是完全无响应的硬冻结:键盘鼠标没反应,屏幕停在最后显示的画面,连远程ping都不通。更麻烦的是,每次强制重启后查看日志,冻结前后几分钟的记录完全缺失,重启后的日志里也找不到任何关键错误提示。之前搜了一堆类似帖子,踩了不少坑,实在不知道下一步该怎么查了。
已做的排查测试(更新内容)
为了缩小问题范围,我做了这些测试:
- 内存验证:用Memtest86+ 5.31b跑过完整测试,没有错误,排除内存故障的可能
- 多系统/环境对比:
- Ubuntu 22.04.3桌面版(Wayland):依旧频繁冻结
- Ubuntu 22.04.3桌面Live CD(Xorg):依旧冻结
- Ubuntu MATE 22.04.3桌面Live CD(Xorg):相对稳定,但偶尔还是会出问题
- Armbian 23.11(Bookworm Xfce):完全稳定,从未出现冻结
- Windows 10:完全稳定,正常使用无异常
- Snap排除:MATE和Ubuntu都带有Snap组件,但Armbian也正常,所以应该不是Snap的锅
启用watchdog后的日志情况(最新更新)
我特意开启了watchdog并设置了10秒间隔的文件系统同步,下面是冻结前后的日志片段:
syslog相关记录
Jan 18 17:44:23 DV4 watchdog[9709]: got answer on ping=1 from target 127.0.0.1 time=0.009ms Jan 18 17:44:33 DV4 watchdog[9709]: still alive after 7891 interval(s) Jan 18 17:44:33 DV4 watchdog[9709]: got answer on ping=1 from target 127.0.0.1 time=0.009ms Jan 18 17:44:43 DV4 watchdog[9709]: still alive after 7892 interval(s) Jan 18 18:53:54 DV4 systemd-modules-load[325]: Inserted module 'lp' Jan 18 18:53:54 DV4 systemd-modules-load[325]: Inserted module 'ppdev' Jan 18 18:53:54 DV4 systemd-modules-load[325]: Inserted module 'parport_pc' Jan 18 18:53:54 DV4 systemd-modules-load[325]: Inserted module 'msr'
内核日志相关记录
Jan 18 17:14:47 DV4 kernel: [161070.600944] wlp10s0: associated Jan 18 17:14:47 DV4 kernel: [161070.682404] wlp10s0: Limiting TX power to 27 (27 - 0) dBm as advertised by 3c:7c:3f:6b:ea:28 Jan 18 18:53:54 DV4 kernel: [ 0.000000] microcode: updated early: 0x15 -> 0x2f, date = 2019-02-17 Jan 18 18:53:54 DV4 kernel: [ 0.000000] Linux version 6.5.0-14-generic (buildd@lcy02-amd64-110) (x86_64-linux-gnu-gcc-12 (Ubuntu 12.3.0-1ubuntu1~22.04) 12.3.0, GNU ld (GNU Binutils for Ubuntu) 2.38) #14~22.04.1-Ubuntu SMP PREEMPT_DYNAMIC Mon Nov 20 18:15:30 UTC 2 (Ubuntu 6.5.0-14.14~22.04.1-generic 6.5.3) Jan 18 18:53:54 DV4 kernel: [ 0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-6.5.0-14-generic root=UUID=424f70c0-d496-4afc-ae1d-9c7b44b2d383 ro quiet splash vt.handoff=7
冻结大概发生在17:44:33-43之间,重启是18:53:54。日志里完全找不到问题点,看样子导致冻结的原因要么是瞬间触发了严重故障,要么根本没机会把日志写入磁盘。不过这次系统是自动断电的(之前冻结时一直保持通电状态),应该是watchdog触发了关机,但还是没留下有用的排查线索。
有没有大佬能给点下一步的排查思路?感激不尽!
备注:内容来源于stack exchange,提问作者WallyZ




