将哈佛Stat110习题误作赌徒破产问题求解：错在哪里？

阿华AIGC实验室

2026-5-19

用赌徒破产模型解“赢两局领先”比赛问题的思路与常见误区

嘿，我来帮你梳理下如何把这个比赛问题映射到赌徒破产模型，以及你可能在理解上出现的偏差点～

首先，先明确问题核心：Calvin每局赢的概率是$p$，Hobbes是$q=1-p$，谁先比对手多赢2局谁获胜，求Calvin最终获胜的概率。

正确映射到赌徒破产模型的步骤

赌徒破产模型的核心是定义“状态”为当前的胜场差距，而非各自的绝对胜场数——只要差距相同，后续获胜的概率就是一致的。我们可以这样定义状态：

状态$+2$：Calvin已领先2局，直接获胜，因此Calvin获胜概率$P(+2)=1$
状态$-2$：Hobbes已领先2局，Calvin输掉比赛，概率$P(-2)=0$
状态$0$：两人当前平局（比如各赢0局、各赢1局、各赢2局…本质都是胜场差为0）
状态$+1$：Calvin领先1局
状态$-1$：Hobbes领先1局

我们要求的是初始平局状态（状态$0$）下Calvin获胜的概率$P(0)$。接下来根据状态转移列方程：

对于状态$+1$：Calvin赢下一局就到状态$+2$（概率$p$），输一局回到状态$0$（概率$q$），因此：
$$P(+1) = p \times 1 + q \times P(0)$$
对于状态$0$：Calvin赢一局到$+1$（概率$p$），输一局到$-1$（概率$q$），因此：
$$P(0) = p \times P(+1) + q \times P(-1)$$
对于状态$-1$：Calvin赢一局回到$0$（概率$p$），输一局到$-2$（概率$q$），因此：
$$P(-1) = p \times P(0) + q \times 0 = p \times P(0)$$

把$P(+1)$和$P(-1)$代入$P(0)$的方程，展开求解：
$$
\begin{align*}
P(0) &= p(p + qP(0)) + q(pP(0)) \
P(0) &= p^2 + pqP(0) + pqP(0) \
P(0) &= p^2 + 2pqP(0) \
P(0)(1 - 2pq) &= p^2 \
\end{align*}
$$
因为$1-2pq = p^2 + q^{2$（由$(p+q)}2=1$推导而来），所以最终结果：
$$P(0) = \frac{p^2}{p2 + q^2}$$

你可能踩的理解偏差误区

我整理了几个常见的错误点，看看你是不是中招了：

误区1：错误定义状态
很多人会把状态设为“Calvin赢了$k$局，Hobbes赢了$m$局”，这样状态空间会变得无比庞大（比如$(0,0),(0,1),(1,0),(1,1)...$），完全没抓住赌徒破产模型“关注差距而非绝对数值”的核心，反而把问题复杂化了。
误区2：状态转移逻辑错误
比如在状态$+1$时，误以为输一局会直接到$-1$，但实际上领先1局输一局后，两人回到平局（状态$0$），不是差距反转。这个转移关系错了，整个方程就会完全偏离正确结果。
误区3：误用对称性假设
当$p≠q$时，状态$-1$的Calvin获胜概率并不等于$1-P(+1)$（只有$p=q=0.5$时才成立），必须从状态转移方程直接推导$P(-1)=pP(0)$，不能想当然套用对称情况。
误区4：混淆“赢两局领先”和“先赢两局”
后者是先赢2局就结束（比如“赢赢”“输赢赢”“赢输赢”），概率是$p^2 + 2p^2q$；但前者需要持续领先2局，可能出现多次平局（比如1-1、2-2），这时候不能用简单的有限项求和，必须用状态转移或者无穷级数求和，而赌徒破产是更系统的解法。

验证：用无穷级数求和对比

我们可以用另一种方法验证结果：Calvin获胜的情况是“直接赢前两局”，或者“前两局打平后再赢”，以此类推。概率为：
$$
P = p^2 + 2pq \times P + (2pq)^2 \times P + ...
$$
这是首项为$p^2$、公比为$2pq$的无穷等比数列，求和结果为：
$$P = \frac{p^2}{1-2pq} = \frac{p^2}{p2+q^2}$$
和赌徒破产模型的结果完全一致，说明推导正确。

内容的提问来源于stack exchange，提问作者Train Heartnet