条件泊松分布服从二项分布的证明及参数求解
嘿,你已经走在完全正确的推导道路上了,而且离最终结果只差最后一步简单的代数化简!咱们一步步把剩下的逻辑理清楚:
首先,你已经通过条件概率定义、拆分联合概率,再利用独立泊松变量的可加性(独立泊松变量的和仍服从泊松分布,参数为各变量参数之和),把式子化简到了这一步:
$$= \frac{y!}{x!(y-x)!}*\frac{λ_1^x (λ_2+...+λ_k){y-x}}{(λ_1+λ_2+...+λ_k)y}$$
这一步已经非常接近二项分布的形式了,接下来只需要对分式部分做拆分:
我们把分母$(λ_1+λ_2+...+λ_k)^y$拆成$(λ_1 + (λ_2+...+λ_k))^y$,然后将整个分式拆成两个部分的乘积:
$$\frac{λ_1x}{(λ_1+λ_2+...+λ_k)x} * \frac{(λ_2+...+λ_k){y-x}}{(λ_1+λ_2+...+λ_k){y-x}}$$
进一步整理后就得到:
$$\left( \frac{λ_1}{λ_1+λ_2+...+λ_k} \right)^x * \left( \frac{λ_2+...+λ_k}{λ_1+λ_2+...+λ_k} \right)^{y-x}$$
注意到$\frac{λ_2+...+λ_k}{λ_1+λ_2+...+λ_k} = 1 - \frac{λ_1}{λ_1+λ_2+...+λ_k}$,我们给两个参数做个定义:
- 令$n = y$,也就是给定的总和$X_1+X_2+...+X_k = y$
- 令$p = \frac{λ_1}{λ_1+λ_2+...+λ_k}$
代入之后,你的式子就变成了:
$$\binom{y}{x} p^x (1-p)^{y-x}$$
这正是**二项分布Binomial(n=y, p=λ₁/(λ₁+...+λₖ))**的概率质量函数!
针对你最后提出的疑问:$λ_1+...+λ_k$不需要求和到1,这里的$p$是这个比值本身,它的范围天然在0到1之间,完全符合二项分布对参数$p$的要求。
总结一下,你从条件概率出发的推导路径完全正确,只是最后一步的代数拆分需要一点小技巧,现在已经完整得到了条件分布的形式和对应的参数啦!
备注:内容来源于stack exchange,提问作者nilsinelabore




