You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

Z表中的数值来源于何处?附Z分数计算及含义说明

Z表中的数值来源于何处?

好问题!Z表(也就是标准正态分布表)里的数值,本质上是标准正态分布累积分布函数(CDF)的预计算近似值,背后依赖的是统计学中的积分与数值计算方法。

你已经理解了Z分数的转换公式:
$$Z = \frac{x-\mu}{\sigma}$$
当我们把任意正态分布转换为均值$\mu=0$、标准差$\sigma=1$的标准正态分布后,Z表的作用就是快速查询某个Z值对应的累积概率——也就是标准正态曲线从负无穷到该Z值区间内的面积,这个概率用数学表达式可以写成:
$$\Phi(z) = P(Z \leq z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}} e{-\frac{t2}{2}} dt$$

这里的核心点是:这个积分没有初等函数形式的解析解,也就是说我们没办法用普通的多项式、指数函数、三角函数组合出一个精确的表达式来计算它。所以统计学家们会通过以下几种数值方法来计算近似值,再把常用的结果整理成表格:

  • 数值积分法:比如梯形法、辛普森法,通过把积分区间拆分成无数小片段,近似计算每个片段的面积再求和;
  • 误差函数转换:标准正态分布的CDF可以和误差函数(erf)直接关联,公式为:
    $$\Phi(z) = \frac{1}{2} \left(1 + \text{erf}\left(\frac{z}{\sqrt{2}}\right)\right)$$
    而误差函数可以通过泰勒级数展开、渐近展开等方式计算出高精度的近似值;
  • 专用拟合公式:针对不同范围的Z值,有专门的拟合公式能快速给出足够精确的结果,满足制表的精度需求。

举个你提到的例子:当Z=1.00时,通过计算得到$\Phi(1.00)≈0.8413$,这就代表有84.13%的观测值会落在这个Z值及左侧的区域;对应的Z=-1.00时,$\Phi(-1.00)=1-\Phi(1.00)=0.1587$,意味着只有15.87%的观测值在这个位置及左侧。

内容的提问来源于stack exchange,提问作者Aleksandr Hovhannisyan

火山引擎 最新活动