关于利用指数马尔可夫不等式证明样本均值概率上界的疑问
问题描述
我在尝试用指数马尔可夫不等式解决下面这个问题时遇到了困难:
设 $(X_{n})$, $n∈N$ 是独立同分布的实值随机变量序列,$μ := E[X_{1}]$,且对数矩生成函数 $φ(λ) := \text{log}E[e^{λX_{1}}]$ 对所有 $λ ∈ R$ 都有定义。令 $S_n$ 为前n个变量的和,证明:对任意 $a > μ$,存在 $J(a) > 0$,使得对所有自然数n,都有 $P(S_{n}/n ≥ a) ≤ e^{−nJ(a)}$。
我的尝试过程是:
$P(S_{n}/n \geq a) = P(tS_{n} \geq ta)$(对任意实数t),然后用马尔可夫不等式得到 $P(tS_{n} \geq ta) \leq e{-nat}E[e{tS_{n}}] = e^{-n(at-\phi(t))}$。我想证明 $(at-\phi(t))$ 始终为正,但卡在了如何对任意a>μ都证明这个严格不等式,尝试了泰勒展开还是没成功,有没有人能帮我解决这个问题?谢谢!
解答
没问题,我来帮你梳理清楚这里的关键逻辑!核心是利用对数矩生成函数$\phi(t)$的凸性和导数性质,就能顺利证明$at - \phi(t) > 0$:
1. 先明确$\phi(t)$的核心性质
对数矩生成函数$\phi(t)$有几个关键特性:
- $\phi(0) = \log E[e^{0 \cdot X_1}] = \log 1 = 0$;
- 一阶导数$\phi'(t) = \frac{E[X_1 e{tX_1}]}{E[e{tX_1}]}$,代入$t=0$可得$\phi'(0) = E[X_1] = \mu$;
- 二阶导数$\phi''(t) = \frac{E[X_1^2 e^{tX_1}] \cdot E[e^{tX_1}] - (E[X_1 e{tX_1}])2}{(E[e{tX_1}])2} \geq 0$(这是柯西-施瓦茨不等式的直接结果),且当$X_1$非退化时(题目中$a>\mu$,若$X_1$是常数则$a>\mu$不可能成立),$\phi''(t) > 0$,即$\phi(t)$是严格凸函数。
2. 分析函数$f(t) = at - \phi(t)$的正负性
我们构造函数$f(t) = at - \phi(t)$,目标是找到某个$t>0$(注意这里取$t>0$,因为$a>\mu$,正的t能让指数马尔可夫不等式的应用更合理)使得$f(t) > 0$:
- 首先$f(0) = a \cdot 0 - \phi(0) = 0$;
- 计算$f(t)$的一阶导数:$f'(t) = a - \phi'(t)$,代入$t=0$得$f'(0) = a - \mu > 0$(因为题目给定$a>\mu$);
- 由于$\phi'(t)$是连续函数(矩生成函数的导数具有连续性),所以$f'(t)$也连续。根据连续性,必然存在一个小的$\delta>0$,当$t \in (0, \delta)$时,$f'(t) > 0$;
- 这意味着$f(t)$在$(0, \delta)$上严格递增,而$f(0)=0$,因此对任意$t \in (0, \delta)$,都有$f(t) = \int_0^t f'(s) ds > 0$。
3. 完成最终证明
我们只需要取$J(a)$为$f(t)$在$t>0$时的某个正值(比如取$t=\delta/2$对应的$f(t)$值,或者直接取$\inf_{t>0} f(t)$,这个下确界必然是正的),这样就有:
$$P(S_n/n \geq a) \leq e^{-nJ(a)}$$
完全满足题目的要求。
补充:泰勒展开的思路验证
如果你想用泰勒展开来理解,也可以:对$\phi(t)$在$t=0$处做泰勒展开,有
$$\phi(t) = \phi(0) + \phi'(0)t + \frac{1}{2}\phi''(\xi)t^2 = \mu t + \frac{1}{2}\phi''(\xi)t^2$$
其中$\xi$介于0和t之间。代入$f(t)$得:
$$f(t) = at - \phi(t) = (a-\mu)t - \frac{1}{2}\phi''(\xi)t^2$$
当t足够小时,$(a-\mu)t$的正贡献会远大于后面的非负项,因此$f(t) > 0$——这和导数的思路本质是一致的。
备注:内容来源于stack exchange,提问作者MHC_Class_2




