正态分布下$\max(X,0)$与$\min(X,0)$的相关性分析与求解
嘿,咱们来深挖一下标准正态分布里$\max(X,0)$和$\min(X,0)$这两个变量的相关性问题,我把推导过程和结论给你讲得明明白白的~
一、变量定义与直观观察
首先先明确这两个函数的取值规则:
- 当$X>0$时,$\max(X,0)=X$,$\min(X,0)=0$
- 当$X<0$时,$\max(X,0)=0$,$\min(X,0)=X$
咱们给这俩变量起个好记的名字:$Z=\max(X,0)$(X的正部),$Y=\min(X,0)$(X的负部)。凭直觉就能得出几个关键的期望结论:
- $E(ZY)=0$:你想啊,Z和Y永远不会同时有非零值,要么Z是X、Y是0,要么反过来,所以它们的乘积ZY永远是0,期望自然也是0
- $E(Z)E(Y)<0$:E(Z)是X取正值部分的平均值,肯定是正的;E(Y)是X取负值部分的平均值,肯定是负的,一正一负相乘,结果必然小于0
- $E(Z+Y)=E(X)=0$:Z+Y其实就是X本身嘛,而标准正态分布的期望$E(X)=0$,这个结论顺理成章
二、相关性的推导
接下来咱们推导它们的相关系数。先回忆相关系数的核心公式:
$$\operatorname{corr}(Z,Y)=\frac{\operatorname{cov}(Z,Y)}{\operatorname{std}(Z)\operatorname{std}(Y)}$$
而协方差的计算公式是$\operatorname{cov}(Z,Y)=E(ZY)-E(Z)E(Y)$,结合前面的结论$E(ZY)=0$,就能得到:
$$\operatorname{cov}(Z,Y)= -E(Z)E(Y)$$
把这个代入相关系数公式:
$$\operatorname{corr}(Z,Y)=\frac{-E(Z)E(Y)}{\operatorname{std}(Z)\operatorname{std}(Y)}$$
前面说了E(Z)正、E(Y)负,所以$-E(Z)E(Y)$是正的;分母是两个标准差的乘积,肯定也是正的,所以整个相关系数大于0。是不是有点反直觉?按说Z是X的正部,Y是X的负部,怎么会正相关?但数学推导就是这么有意思~
三、标准正态下的具体数值求解
咱们拿标准正态分布$X \sim N(0,1)$来算具体的数值,更直观:
首先计算$E(Z)$:
$$\begin{align}
E(Z)&=\int_{0}^{\infty} x \cdot \frac{1}{\sqrt{2\pi}} e{-x2/2} dx \
&= \frac{1}{\sqrt{2\pi}} \int_{0}^{\infty} x e{-x2/2} dx \
&= \frac{1}{\sqrt{2\pi}} \left[ -e{-x2/2} \right]{0}^{\infty} \
&= \frac{1}{\sqrt{2\pi}} (0 - (-1)) = \frac{1}{\sqrt{2\pi}}
\end{align}$$
同理,$E(Y)$就是X取负值部分的期望:
$$E(Y)=\int{-\infty}^{0} x \cdot \frac{1}{\sqrt{2\pi}} e{-x2/2} dx = -\frac{1}{\sqrt{2\pi}}$$
接下来算协方差:
$$\operatorname{cov}(Z,Y)= -E(Z)E(Y)= -(\frac{1}{\sqrt{2\pi}})(-\frac{1}{\sqrt{2\pi}})=\frac{1}{2\pi}$$
然后算标准差,先算$\text{Var}(Z)$:
$\text{Var}(Z)=E(Z2)-[E(Z)]2$,而$Z2=\max(X,0)2=X^2 \cdot I(X>0)$(I是指示函数,X>0时取1,否则取0),标准正态的二阶矩$E(X2)=1$,所以正半部分的$E(Z2)=1/2$。代入得:
$$\text{Var}(Z)=\frac{1}{2} - (\frac{1}{\sqrt{2\pi}})^2 = \frac{1}{2} - \frac{1}{2\pi}$$
$\text{std}(Z)=\sqrt{\frac{1}{2} - \frac{1}{2\pi}}$,而Y的方差和Z完全一样,所以$\text{std}(Y)=\text{std}(Z)$
最后代入相关系数公式:
$$\operatorname{corr}(Z,Y)=\frac{\frac{1}{2\pi}}{\left( \sqrt{\frac{1}{2} - \frac{1}{2\pi}} \right)^2} = \frac{\frac{1}{2\pi}}{\frac{1}{2} - \frac{1}{2\pi}} = \frac{1}{\pi - 1} \approx 0.483$$
这样就得到了具体的相关系数值,约为0.483,确实是正的~
备注:内容来源于stack exchange,提问作者blablahhha




