You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

有限/无限状态空间隐马尔可夫模型定义改写及与标准定义的关联问询

有限/无限状态空间隐马尔可夫模型定义改写及与标准定义的关联问询

嘿,我来帮你梳理清楚这个问题——不管是状态空间有限还是无限,我们都可以把HMM的定义转化为更直观的概率语言,同时也能清晰对应上标准离散HMM的核心特性。

一、不同状态空间下的HMM定义改写

原定义用测度论的通用语言描述了HMM,我们可以根据状态空间的有限/无限特性,把它改写得更具体:

1. 信号空间E有限,观测空间F无限

这种情况下,抽象的核可以转化为更易理解的形式:

  • 初始分布:$\mu$ 是E上的概率分布,对每个 $e \in E$,$\mu(e) = \mathbb{P}(X_0 = e)$
  • 状态转移:转移核 $P$ 退化为转移矩阵——对任意 $e, e' \in E$,$P(e, e') = \mathbb{P}(X_{k+1} = e' | X_k = e)$,矩阵每行的和为1(满足概率公理)
  • 观测核:$\Phi(e, \cdot)$ 是F上的概率测度,对任意 $e \in E$ 和F上的Borel集A,$\Phi(e, A) = \mathbb{P}(Y_k \in A | X_k = e)$

对应的HMM定义可以改写为:

  • 初始联合分布:对任意 $e \in E$、Borel集 $A \subset F$,$\mathbb{P}(X_0 = e, Y_0 \in A) = \mu(e) \cdot \Phi(e, A)$
  • 转移的条件期望(等价于原定义的积分形式):对任意有界可测函数 $g: E \times F \to \mathbb{R}$,
    $$
    \mathbb{E}[g(X_{k+1}, Y_{k+1}) | X_1=x_1, \dots, X_k=x_k] = \sum_{e' \in E} P(x_k, e') \cdot \int_F g(e', y) \Phi(e', dy)
    $$

2. 信号空间E和观测空间F都有限

此时所有核都可以转化为矩阵形式,定义更简洁直观:

  • 初始分布:$\mu$ 是E上的概率向量,$\mu(e) = \mathbb{P}(X_0 = e)$
  • 状态转移矩阵:$P$ 是 $|E| \times |E|$ 的矩阵,$P(e, e') = \mathbb{P}(X_{k+1} = e' | X_k = e)$
  • 观测矩阵:$\Phi$ 是 $|E| \times |F|$ 的矩阵,$\Phi(e, f) = \mathbb{P}(Y_k = f | X_k = e)$,每行和为1

对应的HMM定义:

  • 初始联合分布:对任意 $e \in E$、$f \in F$,$\mathbb{P}(X_0 = e, Y_0 = f) = \mu(e) \cdot \Phi(e, f)$
  • 转移的条件期望:对任意函数 $g: E \times F \to \mathbb{R}$(有限空间下所有函数都有界可测),
    $$
    \mathbb{E}[g(X_{k+1}, Y_{k+1}) | X_1=x_1, \dots, X_k=x_k] = \sum_{e' \in E} \sum_{f' \in F} g(e', f') \cdot P(x_k, e') \cdot \Phi(e', f')
    $$

二、与标准离散HMM定义的关联

你给出的标准条件:

$$\mathbb{P}(Y_n\in A|X_1=x_1,\ldots,X_n=x_n)=\mathbb{P}(Y_n\in A|X_n=x_n)$$

其实是原定义所蕴含的观测条件独立性的直接体现,咱们来拆解两者的联系:

  1. 从原定义推导标准条件
    取原定义中的有界可测函数 $g(x, y) = \mathbb{1}{y \in A}$(指示函数,当 $y \in A$ 时为1,否则为0),代入原定义的第一个期望式子(修正笔误:条件应该是 $X_1=x_1,\dots,X_k=x_k$,对应 $n=k$):
    左边是 $\mathbb{E}[\mathbb{1}
    {Y_{k+1} \in A} | X_1=x_1, \dots, X_k=x_k] = \mathbb{P}(Y_{k+1} \in A | X_1=x_1, \dots, X_k=x_k)$
    右边是 $\int_{E \times F} \mathbb{1}{y \in A} \Phi(x, dy) P(X_k, dx) = \int_E P(x_k, dx') \Phi(x', A) = \mathbb{P}(Y{k+1} \in A | X_k=x_k)$
    这就直接得到了标准条件的推广形式(覆盖了任意时刻的观测,而非仅 $Y_n$)。

  2. 原定义的核心等价于标准HMM的两大特性
    原定义不仅包含了观测的条件独立性,还隐含了信号过程的马尔可夫性:

  • 取 $g(x, y) = h(x)$(仅依赖信号状态的函数),代入原定义可得 $\mathbb{E}[h(X_{k+1}) | X_1=x_1, \dots, X_k=x_k] = \int_E h(x) P(x_k, dx)$,这正是马尔可夫链的定义——信号状态的转移仅依赖当前状态,与过去无关。

换句话说,标准离散HMM的核心(马尔可夫信号+观测条件独立)完全被原定义的数学表述所覆盖,原定义只是用更通用的测度论语言(针对任意可测空间)描述了HMM的本质。

备注:内容来源于stack exchange,提问作者Otto

火山引擎 最新活动