Linux下无DMA控制器PCIe设备的DMA数据传输技术咨询

阿华AIGC实验室

2026-5-13

针对你的PCIe驱动DMA困境的解决方案

先直接说核心结论：你的设备没有DMA主控制器，所以无法使用真正的DMA传输，但你提出的中断触发+CPU主动拷贝的方案是完全可行的——这其实是PIO（Programmed I/O）模式，是没有DMA控制器的外设常用的数据传输方式。

A. 你的方案可行性分析

这个思路没问题，本质流程是：

设备有数据→发中断通知内核→内核中断处理函数主动读取PCIe寄存器的数据→写到内存→用户态读取内存数据

你现在缺的关键步骤，就是在中断处理函数里完成从PCIe寄存器到内核内存的数据拷贝。不过要注意：这种方式依赖CPU参与数据搬运，所以如果你的设备数据吞吐量很高（比如每秒几百MB以上），会导致CPU占用率飙升，性能受限；但如果数据量不大或者对性能要求不高，这个方案完全够用。

B. 需要用到的内核API（不是用户态系统调用）

因为你是在写Linux内核驱动，所以用的是内核提供的API，核心的几个如下：

ioremap()：把PCIe设备的BAR寄存器空间映射到内核虚拟地址，这样你就能在驱动里直接读写这些寄存器；
request_irq()：注册设备的中断处理函数，当设备发中断时，内核会调用你的handler；
kmalloc() / dma_alloc_coherent()：分配内核缓冲区用来暂存从寄存器读取的数据。如果要给用户态直接映射，dma_alloc_coherent()分配的一致内存更合适（避免缓存一致性问题）；
copy_to_user()：如果用字符设备的read()接口，把内核缓冲区的数据拷贝到用户态内存；
mmap() 驱动接口实现：如果想让用户态直接访问内核缓冲区，需要在驱动里实现file_operations的mmap函数，把内核buf映射到用户态地址空间。

举个简化的流程示例：

// 驱动初始化时映射BAR空间
void __iomem *pcie_regs = ioremap(pci_resource_start(pdev, 0), pci_resource_len(pdev, 0));
// 分配一致内存
char *kernel_buf = dma_alloc_coherent(&pdev->dev, BUF_SIZE, &dma_addr, GFP_KERNEL);
// 注册中断
request_irq(irq, irq_handler, IRQF_TRIGGER_RISING, "pcie-dev", pdev);

// 中断处理函数
irqreturn_t irq_handler(int irq, void *dev_id) {
    // 读取寄存器数据到内核buf（假设每次读4字节，循环直到数据读完）
    for (int i=0; i<DATA_LEN/4; i++) {
        *(uint32_t*)(kernel_buf + i*4) = ioread32(pcie_regs + DATA_REG_OFFSET + i*4);
    }
    // 唤醒等待数据的用户态进程
    wake_up_interruptible(&wait_queue);
    return IRQ_HANDLED;
}

// read接口实现
ssize_t dev_read(struct file *filp, char __user *buf, size_t count, loff_t *f_pos) {
    wait_event_interruptible(wait_queue, data_ready);
    copy_to_user(buf, kernel_buf, min(count, BUF_SIZE));
    data_ready = 0;
    return min(count, BUF_SIZE);
}

C. 无DMA控制器场景的配置思路

你找到的那些用struct dma_slave_config的代码，都是针对有DMA主控制器的外设，通过Linux DMA引擎来完成传输的场景——你的设备没有DMA控制器，所以这些代码完全不适用。

你需要切换到PIO模式的思路，核心配置步骤：

PCIe设备枚举与BAR映射：在驱动的probe函数里，通过pci_enable_device()启用设备，然后用ioremap()映射设备的寄存器BAR到内核地址；
中断配置：确认设备的中断号，用request_irq()注册中断处理函数，注意设置正确的触发方式（边沿/电平）；
数据搬运逻辑：在中断处理函数里，通过ioreadX()系列函数（ioread8/ioread16/ioread32）读取PCIe寄存器的数据，写入预先分配的内核缓冲区；
用户态交互：实现字符设备的read()或者mmap()接口，让用户态能获取到数据。如果用mmap，要注意内存同步（比如用msync()或者内核里的flush_dcache_page()），避免缓存不一致导致用户态读到旧数据；
内存屏障：在读写寄存器前后，适当使用rmb()/wmb()保证内存访问顺序，防止CPU乱序执行导致的错误。