求解几何分布参数θ的极大似然估计（MLE）

阿华AIGC实验室

2026-4-22

先明确问题：我们有一个来自几何分布的简单随机样本，样本量为n，该分布的概率质量函数（pmf）为：
$p(x) = \theta(1-\theta)^{x-1}$，其中$x=1,2,\dots$。需要求解参数$\theta$的极大似然估计（MLE）。

先看看你的尝试：

我的尝试：
$
L = \theta(1-\theta)^{1-1} \times \theta(1-\theta)^{2-1} \times \dots \times \theta(1-\theta)^{n-1} = \theta^n\prod_{i=1}{n}{(1-\theta)}^{x_i-1}
$
$
\log{L\left(\theta\right)} = \log{\left[\theta^n\prod_{i=1}{n}\left(1-\theta\right)^{x_i-1}\right]}= n\log{\theta+\sum_{i=1}^{{\infty}{\log{\left(1-\theta\right)}}}{x_i-1}=n\log{\theta+\log{\left(1-\theta\right)\sum_{i=1}^{\infty}{x_i-1}}}}
$
$
\frac{d\ log\ \theta}{d\theta} = \frac{n}{\theta} + \frac{1}{\theta-1}\sum_{i=1}^{\infty}{x_i-1}
$
我觉得这里有些错误，该怎么进一步化简呢？求帮助

你的似然函数开头是对的，但后面的对数似然和导数部分有几个小问题，咱们一步步纠正并推导：

1. 修正对数似然函数

首先，你把求和上限写成了$\infty$，但我们只有n个样本，所以应该是$\sum_{i=1}^{{n}$，而不是$\sum_{i=1}}{\infty}$；另外指数展开的括号位置也有点问题。

正确的对数似然函数推导应该是：
$$
\log L(\theta) = \log\left(\theta^n \prod_{i=1}^n (1-\theta)^{x_i - 1}\right) = n\log\theta + \sum_{i=1}^n (x_i - 1)\log(1-\theta)
$$

我们可以把求和项简化一下，用样本均值$\bar{x} = \frac{1}{n}\sum_{i=1}^n x_i$来替换：
$$
\sum_{i=1}^n (x_i - 1) = \sum_{i=1}^n x_i - n = n\bar{x} - n = n(\bar{x} - 1)
$$

所以对数似然函数可以写成更简洁的形式：
$$
\log L(\theta) = n\log\theta + n(\bar{x} - 1)\log(1-\theta)
$$

2. 求导并建立似然方程

你这里的导数写错了，应该是对**对数似然函数$\log L(\theta)$**求导，而不是$\log\theta$。另外，对$\log(1-\theta)$求导的结果是$\frac{-1}{1-\theta}$（虽然和$\frac{1}{\theta-1}$等价，但用前者更直观）。

对$\log L(\theta)$关于$\theta$求导：
$$
\frac{d}{d\theta}\log L(\theta) = \frac{n}{\theta} + n(\bar{x} - 1) \times \frac{-1}{1-\theta}
$$

令导数等于0（极大似然估计的核心是找到让似然函数最大的θ，此时导数为0）：
$$
\frac{n}{\theta} - \frac{n(\bar{x} - 1)}{1-\theta} = 0
$$

3. 解方程得到MLE

先把方程两边的n约掉（样本量n肯定大于0）：
$$
\frac{1}{\theta} = \frac{\bar{x} - 1}{1-\theta}
$$

交叉相乘后展开：
$$
1 - \theta = \theta(\bar{x} - 1) \
1 - \theta = \theta\bar{x} - \theta
$$

把含θ的项移到右边，你会发现$-\theta$两边抵消了，最后得到：
$$
1 = \theta\bar{x} \
\hat{\theta}_{MLE} = \frac{1}{\bar{x}}
$$

4. 验证这是极大值点

为了确保这个解是极大值而不是极小值，我们可以求二阶导数：
$$
\frac{d^2}{d\theta2}\log L(\theta) = -\frac{n}{\theta^2} - \frac{n(\bar{x} - 1)}{(1-\theta)^2}
$$

因为θ的取值范围是$(0,1)$，样本均值$\bar{x} > 1$（毕竟几何分布的样本都是≥1的整数，且不可能所有样本都是1，否则θ=1不符合分布定义），所以二阶导数是负数，说明这个解确实是让似然函数最大的点。

备注：内容来源于stack exchange，提问作者Aella

火山引擎最新活动

方舟 Coding Plan

HOT

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

查看详情

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

查看详情

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

查看详情

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠

查看详情

ArkClaw 专属智能伙伴