疾病检测的贝叶斯公式构建：应选用何种似然函数？

疾病检测的贝叶斯公式构建：应选用何种似然函数？

阿华AIGC实验室

2026-5-19

离散事件贝叶斯定理：疾病检测的后验概率计算

咱们直接从经典的疾病检测场景切入——当患者检测结果呈阳性时，怎么算出他实际患病的后验概率？这个概率其实是患病率、灵敏度和特异性的函数，接下来我给你拆解清楚：

贝叶斯定理的扩展拆解

通常我们会把贝叶斯定理拆成「先验、似然、后验、证据」四个核心部分，对应公式如下：

P(患病|阳性) = [P(阳性|患病) * P(患病)] / P(阳性)

对应到场景里的概念：

先验概率：P(患病)，也就是目标人群的基础患病率
似然：P(阳性|患病)，就是检测手段的灵敏度（真阳性率）
证据：P(阳性)，所有检测呈阳性的总概率，计算时要兼顾真阳性和假阳性：P(阳性|患病)*P(患病) + P(阳性|未患病)*(1-P(患病))，其中P(阳性|未患病)等于1-特异性
后验概率：P(患病|阳性)，也就是我们最终要找的、阳性结果下实际患病的概率

参数不确定性的处理：抽样方法

现实里，患病率、灵敏度、特异性这些参数往往不是绝对确定的——可能存在统计误差、人群差异等波动，这时候就需要做不确定性传播，把参数的波动传递到最终的后验概率结果里。

最常用的方法就是抽样，步骤大概是这样：

先给每个参数（患病率、灵敏度、特异性）设定合理的概率分布（比如用Beta分布模拟比例类参数的不确定性）
从这些分布里重复抽取大量的参数组合
对每一组参数，代入贝叶斯公式计算对应的后验概率
最后把所有计算出的后验概率汇总，就能得到结果的概率分布，直观看到结果的波动范围和置信区间

举个简单例子：假设患病率1%、灵敏度95%、特异性90%，你可以生成10000组围绕这些值波动的随机参数，每组算一次后验概率，最后把结果做成直方图，就能清楚看到大部分情况下后验概率的集中区间。

小提醒：这种抽样方法（比如蒙特卡洛抽样）特别适合复杂场景，当公式推导难度大时，抽样能快速给出直观的结果。

内容的提问来源于stack exchange，提问作者jtlz2

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，最新支持 DeepSeek-V4 系列与 GLM-5.1，受邀下单叠加9.5折

ArkClaw

7×24在线专属智能伙伴

Seedance 2.0 全面开放 API

创作无限可能，一键生成电影级 AI 视频

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠