You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

条件分布Y|X服从正态分布但Y非正态分布的实例构造与验证

条件分布Y|X服从正态分布但Y非正态分布的实例构造与验证

嘿,这个问题我之前在新生数学宾果活动里刚好遇到过!要求构造一个条件分布Y|X服从正态分布,但Y本身不是正态分布的例子,我来分享下我的思路和几个验证过的实例吧~

首先我们可以用随机变量的全概率密度公式来分析,这是判断Y分布特征的核心依据:
$$ f_Y(y) = \int_{-\infty}^{\infty} f_{Y|X}(y|x) f_X(x) dx $$
这里的各个符号分别代表:

  • $f_Y(y)$:Y的无条件概率密度
  • $f_{Y|X}(y|x)$:给定X取值为x时,Y的条件概率密度
  • $f_X(x)$:X的概率密度

其实满足要求的例子有无数个,我先给你讲一个连续型变量的实例,再补一个更直观的离散型例子。

连续型实例:依赖指数分布均值的条件正态分布

我设定的分布规则是:

  • 条件分布:$Y|X \sim N(X, \sigma2)$(Y的条件均值等于X的取值,方差取固定值$\sigma2$)
  • X的分布:$X \sim \text{Exponential}(\lambda)$(指数分布,仅取非负值,参数为$\lambda$)

先写出各自的密度函数:
给定X=x时,Y的条件密度是标准正态密度:
$$ f_{Y|X}(y|x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y - x)2}{2\sigma2}\right) $$
X的指数分布密度为:
$$ f_X(x) = \lambda e^{-\lambda x}, \quad x > 0 $$

接下来代入全概率公式计算Y的无条件密度:
$$ f_Y(y) = \int_{0}^{\infty} \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(y - x)2}{2\sigma2}\right) \lambda e^{-\lambda x} dx $$

我们可以整理积分里的指数项,通过配方法化简后会发现,这个积分结果是一个带偏度的混合正态分布——因为指数分布只给x>0的部分赋权重,相当于给不同均值的正态分布加了偏向正值的权重,最终Y的密度曲线是不对称的,而正态分布的密度必须是对称的单峰曲线,所以Y绝对不是正态分布。

离散型直观实例:两点分布的正态混合

还有个更简单好懂的例子,不用算积分就能直接看明白:
让X服从两点分布:$P(X=0)=0.5$,$P(X=1)=0.5$,然后设定:

  • 当X=0时,$Y|X=0 \sim N(0,1)$
  • 当X=1时,$Y|X=1 \sim N(10,1)$

这时候Y的无条件密度就是两个正态分布的等权重混合:
$$ f_Y(y) = 0.5 \cdot \phi(y) + 0.5 \cdot \phi(y-10) $$
这里$\phi(\cdot)$是标准正态分布的密度函数。

这个密度画出来是两个相隔很远的单峰曲线,而正态分布的密度是单一的对称单峰曲线,一眼就能看出Y的分布完全不是正态分布,但它的每个条件分布都是标准的正态分布,完美符合题目的要求!

备注:内容来源于stack exchange,提问作者konofoso

火山引擎 最新活动