进阶概率考题:成败概率幸运游戏的玩家期望收益求解
计算该幸运游戏的期望收益
让我们一步步拆解这个问题,最终算出玩家的期望收益:
1. 明确每个结果的概率与收益
- 首次成功出现在第
k次试验的概率:因为前k-1次全是失败,第k次成功,所以概率为q^(k-1)p,其中q=1-p(q是单次试验失败的概率)。 - 对应收益:题目里说第1次成功赢2美元,第2次赢1美元,第3次赢1/2美元,以此类推,第
k次成功的收益是2^(2 - k)美元(验证下:k=1时是2,k=2时是1,k=3时是1/2,完全匹配题目描述)。
2. 写出期望收益的公式
根据期望的定义,期望收益E[X]是所有可能结果的「收益×概率」之和,也就是下面这个无穷级数:
E[X] = Σ(k=1到∞)[ 2^(2 - k) * q^(k-1) * p ]
3. 化简无穷级数
直接计算无穷项肯定不现实,咱们把它转化成等比级数来求解:
- 先调整级数的索引:令
n = k-1(此时n从0到∞),那么k = n+1,代入后级数变成:
E[X] = p * Σ(n=0到∞)2^(2 - (n+1)) * q^n = p * Σ(n=0到∞)2^(1 - n) * q^n
- 拆分2的幂次,把常数项提出来:
E[X] = 2p * Σ(n=0到∞)(q/2)^n
这是个首项为1、公比为r = q/2的等比级数。我们知道,等比级数Σ(n=0到∞)r^n的和是1/(1 - r),只要|r| < 1就行。这里q=1-p,而p是概率(0≤p≤1),所以q≤1,r = q/2 ≤ 0.5 < 1,完全满足收敛条件。
4. 计算最终结果
把等比级数的和代入,再用q=1-p替换掉q:
E[X] = 2p * [1 / (1 - q/2)] = 2p / [ (2 - q)/2 ] = 4p / (2 - q)
替换分母里的q:
E[X] = 4p / (2 - (1 - p)) = 4p / (1 + p)
验证特殊情况
- 当
p=1(每次试验必成功):期望收益是4*1/(1+1)=2美元,和题目里首次成功在第1次的收益一致,没问题。 - 当
p=0.5:期望收益是4*0.5/(1+0.5)=4/3≈1.333美元,手动计算前几项的和也会趋近这个值,正确。
内容的提问来源于stack exchange,提问作者Rebellos




