You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

求解几何分布参数θ的极大似然估计(MLE)

求解几何分布参数θ的极大似然估计(MLE)

先明确问题:我们有一个来自几何分布的简单随机样本,样本量为n,该分布的概率质量函数(pmf)为:
$p(x) = \theta(1-\theta)^{x-1}$,其中$x=1,2,\dots$。需要求解参数$\theta$的极大似然估计(MLE)。

先看看你的尝试:

我的尝试:
$
L = \theta(1-\theta)^{1-1} \times \theta(1-\theta)^{2-1} \times \dots \times \theta(1-\theta)^{n-1} = \thetan\prod_{i=1}{n}{(1-\theta)}^{x_i-1}
$
$
\log{L\left(\theta\right)} = \log{\left[\thetan\prod_{i=1}{n}\left(1-\theta\right)^{x_i-1}\right]}= n\log{\theta+\sum_{i=1}{\infty}{\log{\left(1-\theta\right)}}{x_i-1}=n\log{\theta+\log{\left(1-\theta\right)\sum_{i=1}^{\infty}{x_i-1}}}}
$
$
\frac{d\ log\ \theta}{d\theta} = \frac{n}{\theta} + \frac{1}{\theta-1}\sum_{i=1}^{\infty}{x_i-1}
$
我觉得这里有些错误,该怎么进一步化简呢?求帮助

你的似然函数开头是对的,但后面的对数似然和导数部分有几个小问题,咱们一步步纠正并推导:

1. 修正对数似然函数

首先,你把求和上限写成了$\infty$,但我们只有n个样本,所以应该是$\sum_{i=1}{n}$,而不是$\sum_{i=1}{\infty}$;另外指数展开的括号位置也有点问题。

正确的对数似然函数推导应该是:
$$
\log L(\theta) = \log\left(\theta^n \prod_{i=1}^n (1-\theta)^{x_i - 1}\right) = n\log\theta + \sum_{i=1}^n (x_i - 1)\log(1-\theta)
$$

我们可以把求和项简化一下,用样本均值$\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i$来替换:
$$
\sum_{i=1}^n (x_i - 1) = \sum_{i=1}^n x_i - n = n\bar{x} - n = n(\bar{x} - 1)
$$

所以对数似然函数可以写成更简洁的形式:
$$
\log L(\theta) = n\log\theta + n(\bar{x} - 1)\log(1-\theta)
$$

2. 求导并建立似然方程

你这里的导数写错了,应该是对**对数似然函数$\log L(\theta)$**求导,而不是$\log\theta$。另外,对$\log(1-\theta)$求导的结果是$\frac{-1}{1-\theta}$(虽然和$\frac{1}{\theta-1}$等价,但用前者更直观)。

对$\log L(\theta)$关于$\theta$求导:
$$
\frac{d}{d\theta}\log L(\theta) = \frac{n}{\theta} + n(\bar{x} - 1) \times \frac{-1}{1-\theta}
$$

令导数等于0(极大似然估计的核心是找到让似然函数最大的θ,此时导数为0):
$$
\frac{n}{\theta} - \frac{n(\bar{x} - 1)}{1-\theta} = 0
$$

3. 解方程得到MLE

先把方程两边的n约掉(样本量n肯定大于0):
$$
\frac{1}{\theta} = \frac{\bar{x} - 1}{1-\theta}
$$

交叉相乘后展开:
$$
1 - \theta = \theta(\bar{x} - 1) \
1 - \theta = \theta\bar{x} - \theta
$$

把含θ的项移到右边,你会发现$-\theta$两边抵消了,最后得到:
$$
1 = \theta\bar{x} \
\hat{\theta}_{MLE} = \frac{1}{\bar{x}}
$$

4. 验证这是极大值点

为了确保这个解是极大值而不是极小值,我们可以求二阶导数:
$$
\frac{d2}{d\theta2}\log L(\theta) = -\frac{n}{\theta^2} - \frac{n(\bar{x} - 1)}{(1-\theta)^2}
$$

因为θ的取值范围是$(0,1)$,样本均值$\bar{x} > 1$(毕竟几何分布的样本都是≥1的整数,且不可能所有样本都是1,否则θ=1不符合分布定义),所以二阶导数是负数,说明这个解确实是让似然函数最大的点。

备注:内容来源于stack exchange,提问作者Aella

火山引擎 最新活动