多元随机向量累积分布函数几乎必然收敛是否蕴含一致收敛性的探讨

阿华AIGC实验室

2026-4-20

你这个问题问到点子上了——一维里我们习以为常的「依分布收敛等价于CDF一致收敛」，到了高维空间可是会「失效」的，这也是多元概率里一个容易混淆的点。先给你明确结论，再慢慢拆解：

核心结论：d>1时，点态收敛≠一致收敛

当维度$d>1$时，仅仅满足对每个固定的$\boldsymbol{x} \in \mathbb{R}^d$，$F_n(\boldsymbol{x}) \to F(\boldsymbol{x})$（即CDF的点态收敛，也是依分布收敛的核心要求，当$F$连续时等价于依分布收敛），并不能推出$\sup_{\boldsymbol{x} \in \mathbb{R}^d} |F_n(\boldsymbol{x}) - F(\boldsymbol{x})| \to 0$（一致收敛）。

一个直观的反例（d=2）

我们构造一个极端但清晰的例子：
令$F$是退化分布的CDF——即随机向量$\boldsymbol{X}=(0,0)$几乎必然成立，所以$F(\boldsymbol{x}) = 1$当$x_1 \geq 0$且$x_2 \geq 0$，否则$F(\boldsymbol{x})=0$。
再定义$F_n$对应随机向量$\boldsymbol{X}_n=(1/n, 0)$的CDF：$F_n(\boldsymbol{x})=1$当$x_1 \geq 1/n$且$x_2 \geq 0$，否则$F_n(\boldsymbol{x})=0$。

现在验证点态收敛：

对任意固定的$\boldsymbol{x}=(x_1,x_2)$，如果$x_1 \geq 0$且$x_2 \geq 0$，当$n$足够大时，$1/n \leq x_1$，此时$F_n(\boldsymbol{x})=1=F(\boldsymbol{x})$；
如果$x_1 < 0$或$x_2 < 0$，则$F_n(\boldsymbol{x})=0=F(\boldsymbol{x})$。
显然对所有$\boldsymbol{x}$，$F_n(\boldsymbol{x}) \to F(\boldsymbol{x})$。

但一致收敛不成立：
取$\boldsymbol{x}=(1/(2n), 0)$，此时$F(\boldsymbol{x})=1$（因为$x_1=1/(2n)\geq0$，$x_2=0\geq0$），但$F_n(\boldsymbol{x})=0$（因为$x_1=1/(2n) < 1/n$），所以$|F_n(\boldsymbol{x})-F(\boldsymbol{x})|=1$。这个差值对任意$n$都存在，因此$\sup_{\boldsymbol{x}} |F_n(\boldsymbol{x})-F(\boldsymbol{x})|=1$，始终不趋近于0。

那什么条件下，高维CDF的点态收敛能推出一致收敛？

如果加上一些额外约束，我们可以恢复“点态收敛→一致收敛”的结论，常见的条件有：

$F$是一致连续的：比如$F$对应的分布是紧支集的（比如分布在某个有界闭区域内），或者$F$本身是Lipschitz连续的CDF。此时因为一致连续的函数在点态收敛时，结合紧性可以把全局的差值控制住。
分布族${F_n}$是一致等连续的：存在一个单调递增的函数$\omega(t)$满足$\omega(t)\to0$当$t\to0$，使得对任意$\boldsymbol{x},\boldsymbol{y}$满足$|\boldsymbol{x}-\boldsymbol{y}|\leq t$，有$|F_n(\boldsymbol{x})-F_n(\boldsymbol{y})|\leq\omega(t)$且$|F(\boldsymbol{x})-F(\boldsymbol{y})|\leq\omega(t)$对所有$n$成立。这种情况下，点态收敛可以推广到一致收敛。
分布族${F_n}$是紧的（tight）且$F$连续：紧性意味着对任意$\varepsilon>0$，存在一个紧集$K$，使得$F_n(K^{c)<\varepsilon$且$F(K}c)<\varepsilon$对所有$n$成立。结合$F$在紧集上的一致连续性，我们可以把全局的差值拆成紧集内的一致收敛部分和紧集外的小误差部分，从而得到整体的一致收敛。

为什么一维的方法没法直接推广到高维？

你提到想修改一维的证明，这里的核心难点在于：一维CDF是单调不减的函数，我们可以利用单调性，用有限个分点覆盖实数轴，通过控制分点处的差值来约束整个区间的差值。但高维CDF只是关于每个变量单调，整体没有一维那样的线性单调结构，没法用有限个分点覆盖整个$\mathbb{R}^d$来控制全局的差值——这就是高维和一维概率的本质区别之一。

备注：内容来源于stack exchange，提问作者statstats