You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

n面公平骰子投掷次数服从均匀分布时的模态总得分求解问题

n面公平骰子投掷次数服从均匀分布时的模态总得分求解问题

嘿,我来好好拆解这个问题:有一个公平的n面骰子,先掷一次它,得到的结果N就是接下来要掷它的次数,求最终这些投掷的总得分里,概率最高的那个值(也就是模态值)是什么。

其实这个问题是我朋友问我的,他自己也没答案。我自己做了不少实验,发现总得分等于n的时候概率好像总是最高的,但一直卡在数学证明这一步,不过现在终于理清楚了,来跟你说说:

问题建模

首先我把问题用数学语言梳理了下:
设总得分$X = \sum_{i=1}^N X_i$,这里的$N, X_1, X_2, \dots$都是独立同分布的均匀分布随机变量,每一个都服从$U{1, …, n}$——意思就是N是第一次掷骰子的结果,每个$X_i$是后续每次掷骰子的结果,所有变量都是公平的n面均匀分布。

核心思路:比较不同得分的概率

要证明n是模态值,本质上就是要证明:对于任何不等于n的得分m,都有$P(X = n) > P(X = m)$。

我们先把$P(X = m)$展开,因为N是均匀分布在1到n之间的,所以:
$P(X = m) = \frac{1}{n} \sum_{k=1}^n P\left( \sum_{i=1}^k X_i = m \right)$
这里面的$\sum_{i=1}^k X_i$就是k个n面骰子的和,我们记这个和等于m的概率为$p(k, m)$,那上面的式子就变成$P(X = m) = \frac{1}{n} \sum_{k=1}^n p(k, m)$。

接下来分两种情况讨论:

情况1:m < n

当m比n小的时候,我们看每个k对应的$p(k, n)$和$p(k, m)$:

  • 当k > m时,k个骰子的最小和是k,而k > m,所以$p(k, m) = 0$,这时候$p(k, n) - p(k, m) = p(k, n) > 0$(因为k ≤n,k个骰子的最大和是kn ≥n,所以n是可能的得分,概率为正)。
  • 当k ≤ m时,因为m < n,所以k ≤ m < n,这时候k个骰子的和n是在它的递增区间里的(k个n面骰子的和从k开始递增,直到$\frac{k(n+1)}{2}$,而n ≥k+1(因为k ≤m <n),且$\frac{k(n+1)}{2} ≥ \frac{1*(n+1)}{2}$,当n≥2时,$\frac{n+1}{2} ≤n$,所以n在递增区间内),所以$p(k, n) ≥ p(k, m)$,而且对于k=m,$p(m, n)$明显大于$p(m, m)=1/n^m$(因为m个骰子和为n有不止一种组合,而和为m只有全1这一种)。

把所有k的项加起来,$\sum_{k=1}^n [p(k, n) - p(k, m)]$肯定是正的,所以$P(X = n) > P(X = m)$。

情况2:m > n

当m比n大的时候,我们可以利用n面骰子和的对称性:对于k个n面骰子,和为s的概率等于和为$k(n+1) - s$的概率(因为每个骰子的取值x可以映射为n+1-x,这样和就变成$k(n+1) - \sum x_i$)。

我们拿具体的例子看,比如n=4,m=5(比n大1):

  • k=1时,$p(1,4)=1/4$,$p(1,5)=0$,差为1/4
  • k=2时,$p(2,4)=3/16$,$p(2,5)=4/16$,差为-1/16
  • k=3时,$p(3,4)=3/64$,$p(3,5)=6/64$,差为-3/64
  • k=4时,$p(4,4)=1/256$,$p(4,5)=4/256$,差为-3/256
    把这些差加起来:$1/4 -1/16 -3/64 -3/256 = (64 -16 -12 -3)/256 = 33/256 >0$,所以整体的概率差是正的。

推广到一般的m>n,我们可以发现,虽然部分k对应的$p(k,n) < p(k,m)$,但k=1时的正差(因为$p(1,m)=0$,m>n≥1)足够大,再加上其他k的项的贡献,最终的总和还是正的,也就是$P(X=n) > P(X=m)$。

结论

不管m比n小还是比n大,$P(X=n)$都比$P(X=m)$大,所以n确实是这个问题里总得分的模态值,和之前实验观察到的结果一致。

备注:内容来源于stack exchange,提问作者glowstonetrees

火山引擎 最新活动