模拟退火算法接受概率计算咨询：含图与N皇后问题场景

阿华AIGC实验室

2026-5-20

N皇后问题中模拟退火接受概率的计算解析

嘿，我来帮你理清这个模拟退火接受概率的逻辑——当初我刚用模拟退火解N皇后的时候也在这个公式上卡过一会儿！

核心公式与接受逻辑拆解

首先得明确：在N皇后问题里，我们的目标是最小化皇后之间的冲突对数，先把几个关键变量定义清楚，就不会乱了：

current_conflicts：当前皇后布局的冲突数（比如现在有5对皇后互相攻击）
next_conflicts：随机生成的下一个布局的冲突数（比如新布局只有3对冲突）
delta = next_conflicts - current_conflicts：两个状态的冲突数差值
T：当前的退火温度（这个值会在迭代过程中逐渐降低）

然后分两种情况看接受概率：

当delta < 0时：新布局的冲突更少，也就是状态更好，这时候我们直接接受这个新状态，接受概率是100%（也就是概率值为1）。
当delta >= 0时：新布局比当前更差，冲突更多，这时候才用到你提到的指数公式。这里你说的e^((下一状态值-当前状态值)/T)其实要注意符号——正确的接受概率应该是exp(-delta / T)，而这个式子和你疑问的1/(e^(delta/T))是完全等价的，因为exp(-x) = 1/exp(x)，所以两种写法都对，只是表达方式不同而已。

举个具体的N皇后例子：
假设当前布局冲突数是4，新布局冲突数是6，那delta=2，当前温度T=10。代入公式的话，接受概率就是exp(-2/10) ≈ 0.8187，也就是有大概82%的概率接受这个更差的状态——这也是模拟退火能跳出局部最优解的关键，温度高的时候允许我们“试错”，避免卡在一个不算最优的布局里。

N皇后场景下的“状态值”定义

你可能还在纠结公式里的“状态值”到底是什么，在N皇后问题里，这个值几乎都是当前布局的皇后冲突对数（包括行、列、两条对角线的攻击情况）。比如一个8皇后布局，如果有3对皇后互相攻击，那这个状态的“值”就是3。所以公式里的“下一随机状态值 - 当前状态值”就是next_conflicts - current_conflicts，也就是我们刚才说的delta。

关于图表的补充分析

你提到“针对图表的问题是要找……的内容”，如果能补充图表的具体信息（比如是展示温度变化和接受概率的关系，还是不同delta对应的接受概率曲线？），可以更精准地帮你拆解。不过基于常见的模拟退火相关图表：

如果是温度-接受概率曲线：你会看到随着温度T降低，相同delta下的接受概率逐渐下降——这完全符合模拟退火的“退火”逻辑：温度高的时候允许我们接受更多差的状态，探索更大的解空间；温度越低，我们越倾向于只接受更好的状态，逐步收敛到最优解。
如果是delta-接受概率曲线：在同一温度下，delta越大（新状态越差），接受概率越低，这也和我们的公式逻辑完全匹配。

内容的提问来源于stack exchange，提问作者Jeffrey Hennen