You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

HPE DL360 Gen10服务器加装Samsung 990 PRO NVMe后性能异常低下的排查求助

HPE DL360 Gen10服务器加装Samsung 990 PRO NVMe后性能异常低下的排查求助

看起来你遇到的问题确实有点闹心,明明硬件规格支持PCIe 3.0,却跑不出预期速度,咱们一步步拆解可能的原因,逐个排查:

  • 先确认PCIe链路的实际运行状态
    BIOS里看不到Gen3选项可能只是显示bug,但系统里能查到真实的协商结果。在Debian 12里执行lspci -vvv,找到你的NVMe设备对应的条目,重点看LnkSta:这一行:

    • 如果显示Speed 5GT/s,说明当前是Gen2;Speed 8GT/s才是Gen3
    • 同时看Width参数,如果是x1或者x2,那链路宽度被降级了,这肯定会拖慢速度
      正常Gen3 x4的状态应该是Speed 8GT/s (ok), Width x4 (ok),这是保证速度的基础。
  • 检查Riser卡与插槽的通道分配
    你用的HP Riser Card 869432-001,要确认Slot2的PCIe通道是不是真的分配到了Gen3 x8:

    1. 进BIOS的PCIe Configuration菜单,查看各个插槽的通道归属(是CPU1还是CPU2的通道),有没有被其他设备(比如网卡、RAID卡)占用导致宽度缩水
    2. 也可以在系统里用dmidecode -t slot查看插槽的PCIe规格,确认是否支持Gen3 x8
  • 排查适配器与插槽的兼容性
    虽然适配器标注了向下兼容,但有些服务器的PCIe控制器对第三方适配器的协商逻辑比较挑剔:

    • 试试把适配器换到其他空闲的PCIe插槽(比如Slot1或者其他x8/x16插槽),重新启动后再测速度,看能不能协商到Gen3
    • 另外,检查适配器的散热是否正常?NVMe满速运行需要良好散热,如果适配器过热,可能会触发降速保护
  • 优化系统与驱动设置
    Debian 12的NVMe驱动默认可能开启了一些节能选项,拖慢了性能:

    1. 检查APST(自动电源状态转换):执行nvme get-feature /dev/nvme0 -f 0x0c,如果返回Autonomous Power State Transition (APST): Enabled,可以用nvme set-feature /dev/nvme0 -f 0x0c -v 0关闭它(注意替换/dev/nvme0为你的实际设备名)
    2. 用专业工具测试:别用dd默认参数测速度(会受缓存影响),试试fio命令:
      fio --name=write_test --ioengine=libaio --rw=write --bs=128k --numjobs=4 --size=10G --iodepth=32 --direct=1 --group_reporting
      
      这个命令测的是直接写入,能反映真实的盘性能
  • 调整BIOS里的其他关键设置
    除了你试过的选项,还有两个可能影响的设置:

    • 关闭ASPM(Active State Power Management):在BIOS里找到PCIe Power Management,把ASPM设为Disabled,有些时候节能模式会导致链路协商降级
    • 暂时关闭Secure Boot:虽然概率低,但部分服务器开启Secure Boot后会限制PCIe设备的性能,你可以先关掉试试,看速度有没有提升

先从第一步查链路状态开始,这是最核心的——如果链路连Gen3都没协商上,那后面的优化都是白搭。如果查到链路是Gen2 x1,那重点就放在插槽分配、适配器兼容性上;如果链路是Gen3 x4但速度还是慢,再看系统驱动和测试工具的问题。

备注:内容来源于stack exchange,提问作者netmat

火山引擎 最新活动