将哈佛Stat110习题误作赌徒破产问题求解:错在哪里?
嘿,我来帮你梳理下如何把这个比赛问题映射到赌徒破产模型,以及你可能在理解上出现的偏差点~
首先,先明确问题核心:Calvin每局赢的概率是$p$,Hobbes是$q=1-p$,谁先比对手多赢2局谁获胜,求Calvin最终获胜的概率。
正确映射到赌徒破产模型的步骤
赌徒破产模型的核心是定义“状态”为当前的胜场差距,而非各自的绝对胜场数——只要差距相同,后续获胜的概率就是一致的。我们可以这样定义状态:
- 状态$+2$:Calvin已领先2局,直接获胜,因此Calvin获胜概率$P(+2)=1$
- 状态$-2$:Hobbes已领先2局,Calvin输掉比赛,概率$P(-2)=0$
- 状态$0$:两人当前平局(比如各赢0局、各赢1局、各赢2局…本质都是胜场差为0)
- 状态$+1$:Calvin领先1局
- 状态$-1$:Hobbes领先1局
我们要求的是初始平局状态(状态$0$)下Calvin获胜的概率$P(0)$。接下来根据状态转移列方程:
- 对于状态$+1$:Calvin赢下一局就到状态$+2$(概率$p$),输一局回到状态$0$(概率$q$),因此:
$$P(+1) = p \times 1 + q \times P(0)$$ - 对于状态$0$:Calvin赢一局到$+1$(概率$p$),输一局到$-1$(概率$q$),因此:
$$P(0) = p \times P(+1) + q \times P(-1)$$ - 对于状态$-1$:Calvin赢一局回到$0$(概率$p$),输一局到$-2$(概率$q$),因此:
$$P(-1) = p \times P(0) + q \times 0 = p \times P(0)$$
把$P(+1)$和$P(-1)$代入$P(0)$的方程,展开求解:
$$
\begin{align*}
P(0) &= p(p + qP(0)) + q(pP(0)) \
P(0) &= p^2 + pqP(0) + pqP(0) \
P(0) &= p^2 + 2pqP(0) \
P(0)(1 - 2pq) &= p^2 \
\end{align*}
$$
因为$1-2pq = p^2 + q2$(由$(p+q)2=1$推导而来),所以最终结果:
$$P(0) = \frac{p2}{p2 + q^2}$$
你可能踩的理解偏差误区
我整理了几个常见的错误点,看看你是不是中招了:
- 误区1:错误定义状态
很多人会把状态设为“Calvin赢了$k$局,Hobbes赢了$m$局”,这样状态空间会变得无比庞大(比如$(0,0),(0,1),(1,0),(1,1)...$),完全没抓住赌徒破产模型“关注差距而非绝对数值”的核心,反而把问题复杂化了。 - 误区2:状态转移逻辑错误
比如在状态$+1$时,误以为输一局会直接到$-1$,但实际上领先1局输一局后,两人回到平局(状态$0$),不是差距反转。这个转移关系错了,整个方程就会完全偏离正确结果。 - 误区3:误用对称性假设
当$p≠q$时,状态$-1$的Calvin获胜概率并不等于$1-P(+1)$(只有$p=q=0.5$时才成立),必须从状态转移方程直接推导$P(-1)=pP(0)$,不能想当然套用对称情况。 - 误区4:混淆“赢两局领先”和“先赢两局”
后者是先赢2局就结束(比如“赢赢”“输赢赢”“赢输赢”),概率是$p^2 + 2p^2q$;但前者需要持续领先2局,可能出现多次平局(比如1-1、2-2),这时候不能用简单的有限项求和,必须用状态转移或者无穷级数求和,而赌徒破产是更系统的解法。
验证:用无穷级数求和对比
我们可以用另一种方法验证结果:Calvin获胜的情况是“直接赢前两局”,或者“前两局打平后再赢”,以此类推。概率为:
$$
P = p^2 + 2pq \times P + (2pq)^2 \times P + ...
$$
这是首项为$p^2$、公比为$2pq$的无穷等比数列,求和结果为:
$$P = \frac{p^2}{1-2pq} = \frac{p2}{p2+q^2}$$
和赌徒破产模型的结果完全一致,说明推导正确。
内容的提问来源于stack exchange,提问作者Train Heartnet




