HPE DL360 Gen10服务器加装Samsung 990 PRO NVMe后性能异常低下的排查求助
HPE DL360 Gen10服务器加装Samsung 990 PRO NVMe后性能异常低下的排查求助
看起来你遇到的问题确实有点闹心,明明硬件规格支持PCIe 3.0,却跑不出预期速度,咱们一步步拆解可能的原因,逐个排查:
先确认PCIe链路的实际运行状态
BIOS里看不到Gen3选项可能只是显示bug,但系统里能查到真实的协商结果。在Debian 12里执行lspci -vvv,找到你的NVMe设备对应的条目,重点看LnkSta:这一行:- 如果显示
Speed 5GT/s,说明当前是Gen2;Speed 8GT/s才是Gen3 - 同时看
Width参数,如果是x1或者x2,那链路宽度被降级了,这肯定会拖慢速度
正常Gen3 x4的状态应该是Speed 8GT/s (ok), Width x4 (ok),这是保证速度的基础。
- 如果显示
检查Riser卡与插槽的通道分配
你用的HP Riser Card 869432-001,要确认Slot2的PCIe通道是不是真的分配到了Gen3 x8:- 进BIOS的
PCIe Configuration菜单,查看各个插槽的通道归属(是CPU1还是CPU2的通道),有没有被其他设备(比如网卡、RAID卡)占用导致宽度缩水 - 也可以在系统里用
dmidecode -t slot查看插槽的PCIe规格,确认是否支持Gen3 x8
- 进BIOS的
排查适配器与插槽的兼容性
虽然适配器标注了向下兼容,但有些服务器的PCIe控制器对第三方适配器的协商逻辑比较挑剔:- 试试把适配器换到其他空闲的PCIe插槽(比如Slot1或者其他x8/x16插槽),重新启动后再测速度,看能不能协商到Gen3
- 另外,检查适配器的散热是否正常?NVMe满速运行需要良好散热,如果适配器过热,可能会触发降速保护
优化系统与驱动设置
Debian 12的NVMe驱动默认可能开启了一些节能选项,拖慢了性能:- 检查APST(自动电源状态转换):执行
nvme get-feature /dev/nvme0 -f 0x0c,如果返回Autonomous Power State Transition (APST): Enabled,可以用nvme set-feature /dev/nvme0 -f 0x0c -v 0关闭它(注意替换/dev/nvme0为你的实际设备名) - 用专业工具测试:别用
dd默认参数测速度(会受缓存影响),试试fio命令:
这个命令测的是直接写入,能反映真实的盘性能fio --name=write_test --ioengine=libaio --rw=write --bs=128k --numjobs=4 --size=10G --iodepth=32 --direct=1 --group_reporting
- 检查APST(自动电源状态转换):执行
调整BIOS里的其他关键设置
除了你试过的选项,还有两个可能影响的设置:- 关闭ASPM(Active State Power Management):在BIOS里找到
PCIe Power Management,把ASPM设为Disabled,有些时候节能模式会导致链路协商降级 - 暂时关闭Secure Boot:虽然概率低,但部分服务器开启Secure Boot后会限制PCIe设备的性能,你可以先关掉试试,看速度有没有提升
- 关闭ASPM(Active State Power Management):在BIOS里找到
先从第一步查链路状态开始,这是最核心的——如果链路连Gen3都没协商上,那后面的优化都是白搭。如果查到链路是Gen2 x1,那重点就放在插槽分配、适配器兼容性上;如果链路是Gen3 x4但速度还是慢,再看系统驱动和测试工具的问题。
备注:内容来源于stack exchange,提问作者netmat




