Python列表内存泄漏排查：DQN经验回放数组内存溢出问题

阿华AIGC实验室

2026-5-21

解决DQN经验回放导致的内存泄漏问题

嘿，我来帮你搞定这个内存泄漏的麻烦！你已经定位到经验回放数组是问题根源，这一步很关键，接下来咱们看看问题出在哪，怎么修复。

原代码的潜在问题

从你给出的代码片段来看，大概率是截断经验回放列表的方式不对，导致旧的样本元素没有被Python的垃圾回收器（GC）正确回收。比如如果只是创建了临时切片但没有替换原Replay_Memory变量，或者截断逻辑的顺序、写法有误，都会让原列表里的旧元素一直占着内存，越积越多。

修复方案1：正确手动截断列表

把你的截断逻辑改成下面这样，确保截断后的新列表直接覆盖原变量，让旧列表失去引用被GC回收：

# 添加新样本到经验回放
Replay_Memory.extend(New_sample)
# 超出上限时，保留最近的25000条
if len(Replay_Memory) > 25000:
    Replay_Memory = Replay_Memory[-25000:]

这里的核心是直接将切片结果赋值回原变量，而不是只存在临时变量里。这样原有的大列表会因为没有引用指向它，被GC自动清理掉，不会再占用内存。

修复方案2：用deque自动维护经验回放长度

更省心的方法是用Python标准库的collections.deque，它天生支持设置最大长度，添加元素超出上限时会自动弹出最旧的元素，完全不需要手动写截断逻辑，还能避免人为出错：

from collections import deque

# 初始化经验回放队列，直接设置maxlen=25000
Replay_Memory = deque(maxlen=25000)

# 添加新样本时直接extend，自动维护长度，超了就自动删旧的
Replay_Memory.extend(New_sample)

deque在两端操作的效率比列表高得多，而且内部的内存管理更高效，能从根源上避免手动截断可能带来的内存泄漏问题。

额外排查技巧

如果还是有内存泄漏，可以用tracemalloc工具跟踪内存变化：

import tracemalloc

tracemalloc.start()

# 运行你的训练代码片段
# ...

# 查看内存快照
snapshot = tracemalloc.take_snapshot()
top_stats = snapshot.statistics('lineno')

print("[Top 10 memory usage]")
for stat in top_stats[:10]:
    print(stat)

通过这个工具可以精准看到哪些代码行占用了内存，确认是不是还有其他地方持有了旧样本的引用。

内容的提问来源于stack exchange，提问作者Dhiraj Patnaik