求解几何分布参数θ的极大似然估计(MLE)
先明确问题:我们有一个来自几何分布的简单随机样本,样本量为n,该分布的概率质量函数(pmf)为:
$p(x) = \theta(1-\theta)^{x-1}$,其中$x=1,2,\dots$。需要求解参数$\theta$的极大似然估计(MLE)。
先看看你的尝试:
我的尝试:
$
L = \theta(1-\theta)^{1-1} \times \theta(1-\theta)^{2-1} \times \dots \times \theta(1-\theta)^{n-1} = \thetan\prod_{i=1}{n}{(1-\theta)}^{x_i-1}
$
$
\log{L\left(\theta\right)} = \log{\left[\thetan\prod_{i=1}{n}\left(1-\theta\right)^{x_i-1}\right]}= n\log{\theta+\sum_{i=1}{\infty}{\log{\left(1-\theta\right)}}{x_i-1}=n\log{\theta+\log{\left(1-\theta\right)\sum_{i=1}^{\infty}{x_i-1}}}}
$
$
\frac{d\ log\ \theta}{d\theta} = \frac{n}{\theta} + \frac{1}{\theta-1}\sum_{i=1}^{\infty}{x_i-1}
$
我觉得这里有些错误,该怎么进一步化简呢?求帮助
你的似然函数开头是对的,但后面的对数似然和导数部分有几个小问题,咱们一步步纠正并推导:
1. 修正对数似然函数
首先,你把求和上限写成了$\infty$,但我们只有n个样本,所以应该是$\sum_{i=1}{n}$,而不是$\sum_{i=1}{\infty}$;另外指数展开的括号位置也有点问题。
正确的对数似然函数推导应该是:
$$
\log L(\theta) = \log\left(\theta^n \prod_{i=1}^n (1-\theta)^{x_i - 1}\right) = n\log\theta + \sum_{i=1}^n (x_i - 1)\log(1-\theta)
$$
我们可以把求和项简化一下,用样本均值$\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i$来替换:
$$
\sum_{i=1}^n (x_i - 1) = \sum_{i=1}^n x_i - n = n\bar{x} - n = n(\bar{x} - 1)
$$
所以对数似然函数可以写成更简洁的形式:
$$
\log L(\theta) = n\log\theta + n(\bar{x} - 1)\log(1-\theta)
$$
2. 求导并建立似然方程
你这里的导数写错了,应该是对**对数似然函数$\log L(\theta)$**求导,而不是$\log\theta$。另外,对$\log(1-\theta)$求导的结果是$\frac{-1}{1-\theta}$(虽然和$\frac{1}{\theta-1}$等价,但用前者更直观)。
对$\log L(\theta)$关于$\theta$求导:
$$
\frac{d}{d\theta}\log L(\theta) = \frac{n}{\theta} + n(\bar{x} - 1) \times \frac{-1}{1-\theta}
$$
令导数等于0(极大似然估计的核心是找到让似然函数最大的θ,此时导数为0):
$$
\frac{n}{\theta} - \frac{n(\bar{x} - 1)}{1-\theta} = 0
$$
3. 解方程得到MLE
先把方程两边的n约掉(样本量n肯定大于0):
$$
\frac{1}{\theta} = \frac{\bar{x} - 1}{1-\theta}
$$
交叉相乘后展开:
$$
1 - \theta = \theta(\bar{x} - 1) \
1 - \theta = \theta\bar{x} - \theta
$$
把含θ的项移到右边,你会发现$-\theta$两边抵消了,最后得到:
$$
1 = \theta\bar{x} \
\hat{\theta}_{MLE} = \frac{1}{\bar{x}}
$$
4. 验证这是极大值点
为了确保这个解是极大值而不是极小值,我们可以求二阶导数:
$$
\frac{d2}{d\theta2}\log L(\theta) = -\frac{n}{\theta^2} - \frac{n(\bar{x} - 1)}{(1-\theta)^2}
$$
因为θ的取值范围是$(0,1)$,样本均值$\bar{x} > 1$(毕竟几何分布的样本都是≥1的整数,且不可能所有样本都是1,否则θ=1不符合分布定义),所以二阶导数是负数,说明这个解确实是让似然函数最大的点。
备注:内容来源于stack exchange,提问作者Aella




