Nvidia Linux驱动开源架构：CUDA程序GPU端用户态内存分配咨询

阿华AIGC实验室

2026-5-22

排查Nvidia UVM8 PMM模块未被CUDA代码触发的问题

看起来你已经精准定位到了Nvidia驱动中负责GPU用户空间内存管理的核心模块，uvm8_pmm_gpu.c和闭源PMA的交互逻辑确实是统一内存（Unified Memory）调度的关键部分。不过你遇到的“代码不触发”问题，大概率是因为内存分配路径没匹配上，或者驱动配置没到位，下面给你拆解几个排查方向：

第一步：确认UVM模块的启用状态

首先得确保你的驱动环境真的开启了UVM功能——毕竟uvm8_pmm_gpu.c是UVM子系统的一部分，没启用UVM的话这段代码根本不会被加载：

用lsmod | grep nvidia_uvm检查UVM模块是否已加载，如果没输出，说明驱动没启用UVM，可能需要重新安装驱动时勾选“Unified Memory”选项，或者添加内核参数nvidia-uvm.mem_policy=2（不同驱动版本参数可能有细微差异）
查看驱动版本：cat /proc/driver/nvidia/version，确保是支持UVM的较新版本（一般450以上版本都没问题）

第二步：调整CUDA代码的内存分配方式

不是所有CUDA内存分配都会走到uvm8_pmm_gpu.c的路径，你需要明确触发UVM的内存管理逻辑：

放弃cudaMalloc这类纯设备内存分配API，改用统一内存API：比如cudaMallocManaged，它会让UVM接管内存的分配、迁移和管理
如果坚持用设备内存，你需要显式调用UVM相关的内存控制函数，比如cudaMemAdvise设置内存访问策略，或者cudaMemPrefetchAsync手动迁移内存，这样才会触发PMM与PMA的交互
另外，试试申请大尺寸内存块（比如几百MB以上），因为PMM的伙伴分配器主要负责大块内存的拆分管理，小内存请求可能直接由闭源PMA处理，不会走到PMM的代码逻辑

第三步：用调试工具验证代码触发

如果调整代码后还是没触发，你可以用内核调试工具直接验证：

如果你自己编译了驱动的开源部分，可以给uvm_pmm_gpu_alloc、uvm_pmm_gpu_free这类关键函数添加pr_info打印，然后通过dmesg查看是否有输出
用perf工具跟踪内核调用：执行perf record -g -a -e probe:nvidia_uvm:uvm_pmm_gpu_alloc，然后运行你的CUDA程序，结束后用perf report查看是否有该函数的调用记录
启用驱动调试日志：添加内核参数NVreg_EnableDebugAll=1，重启后查看/var/log/syslog或dmesg，里面会有UVM子系统的详细操作日志，能帮你定位是否走到了PMM模块

补充：PMA与PMM的交互逻辑

最后再理一下两者的分工：PMA是底层的物理内存分配器，负责直接和GPU硬件交互；而PMM是上层的管理器，它会向PMA申请大块连续内存，然后用伙伴分配器拆分成小页分配给CUDA程序。如果你的CUDA请求的内存太小，或者驱动认为直接用PMA更高效，就不会触发PMM的逻辑——这也是为什么你跑普通CUDA代码看不到这段代码执行的原因。

内容的提问来源于stack exchange，提问作者Saksham Jain