火山引擎-你的AI云

Python实现含协方差项的多变量不确定性自动传播函数的技术咨询

阿华AIGC实验室

2026-4-13

Python实现含协方差项的多变量不确定性自动传播函数的技术咨询

嘿，这个需求在科学计算、实验数据分析里太常见了！我来给你详细讲讲怎么用Python实现这种**自动多变量不确定性传播（还能处理协方差项）**的功能，完全不用手动推导偏导数～

核心原理：带协方差的误差传播公式

首先得明确，当变量之间存在相关性时，不能只考虑单个变量的方差，必须纳入协方差项才能得到准确的结果。对于目标函数 ( f(x_1, x_2, ..., x_n) )，其方差的计算公式是：

( \text{Var}(f) = \sum_{i=1}^n \left( \frac{\partial f}{\partial x_i} \right)^2 \text{Var}(x_i) + 2\sum_{1 \leq i < j \leq n} \frac{\partial f}{\partial x_i} \frac{\partial f}{\partial x_j} \text{Cov}(x_i, x_j) )

简单来说，就是把每个变量的偏导数和协方差矩阵做矩阵乘法，就能得到f的方差。我们要做的就是自动计算偏导数，再结合协方差矩阵完成计算。

方案1：用Autograd做数值自动求导（适合数组输入场景）

如果你的目标函数是数值型的（比如输入是数组，对应P个数据点），用autograd库是最优解——它能自动对数值函数求导，完美适配你提到的“x_i是P元素数组”的情况。

步骤1：安装依赖

pip install autograd

步骤2：实现核心函数

import autograd.numpy as np
from autograd import grad

def propagate_uncertainty(f, x_means, cov_matrix):
    """
    自动传播多变量不确定性，支持标量/数组输入，考虑协方差
    
    参数:
        f: 目标函数，输入为长度n的数组（对应x₁到xₙ），输出可以是标量或长度P的数组
        x_means: 每个变量的均值，长度为n的列表/数组，元素可以是标量或长度P的数组
        cov_matrix: n×n的协方差矩阵，对应变量间的协方差
    
    返回:
        f_mean: f的均值（标量或长度P的数组）
        f_var: f的方差（标量或长度P的数组）
    """
    # 转成autograd兼容的数组格式
    x = np.array(x_means)
    
    # 计算f在均值处的结果（即f的均值）
    f_mean = f(x)
    
    # 定义偏导数计算函数，适配标量/数组输出
    def get_partial(i):
        # 处理数组输出的情况：给输出加一个维度，让autograd能正确求导
        if isinstance(f_mean, np.ndarray):
            return grad(lambda x_arr: f(x_arr)[..., np.newaxis])(x)[i]
        else:
            return grad(f)(x)[i]
    
    # 计算所有变量的偏导数，得到(n,)或(n, P)的数组
    grads = np.array([get_partial(i) for i in range(len(x_means))])
    
    # 计算方差：利用爱因斯坦求和实现矩阵乘法，自动适配标量/数组场景
    if grads.ndim == 2:
        # 每个P样本点单独计算方差
        f_var = np.einsum('ip,ij,jp->p', grads, cov_matrix, grads)
    else:
        # 标量变量场景
        f_var = grads @ cov_matrix @ grads
    
    return f_mean, f_var

步骤3：实际使用示例

比如我们要计算 ( f(x_1, x_2) = x_1^2 + x_2^2 ) 的不确定性，其中x₁均值2、方差0.1，x₂均值3、方差0.2，两者协方差0.05：

# 定义你的目标函数，输入是长度为n的数组（对应n个变量）
def my_target_func(x):
    return x[0]**2 + x[1]**2

# 变量均值
x_means = [2.0, 3.0]
# 协方差矩阵（n×n，n是变量数）
cov_matrix = np.array([[0.1, 0.05], [0.05, 0.2]])

# 计算不确定性传播
f_mean, f_var = propagate_uncertainty(my_target_func, x_means, cov_matrix)

print(f"f的均值: {f_mean:.4f}")
print(f"f的方差: {f_var:.4f}")

运行后会输出：

f的均值: 13.0000
f的方差: 2.8000

如果你的x_i是P个元素的数组（比如每个变量有P个样本点的均值），这个函数也能直接处理，自动给每个样本点计算对应的f的方差。

方案2：用SymPy做符号自动求导（适合解析函数场景）

如果你能写出目标函数的解析表达式，用sympy可以先得到符号化的偏导数，再转成数值计算，适合需要验证推导过程的场景。

步骤1：安装依赖

pip install sympy

步骤2：实现核心函数

import sympy as sp
import numpy as np

def sympy_propagate_uncertainty(f_sym, x_syms, x_means, cov_matrix):
    """
    基于符号计算的不确定性传播，适合有解析表达式的函数
    
    参数:
        f_sym: 符号化的目标函数
        x_syms: 符号变量列表（对应x₁到xₙ）
        x_means: 每个变量的均值，长度为n的列表/数组
        cov_matrix: n×n的协方差矩阵
    
    返回:
        f_mean: f的均值（标量）
        f_var: f的方差（标量）
    """
    # 计算f的均值：代入变量均值
    f_mean = f_sym.subs({sym: mean for sym, mean in zip(x_syms, x_means)})
    
    # 计算每个变量的符号偏导数
    partial_syms = [sp.diff(f_sym, sym) for sym in x_syms]
    # 把偏导数转成数值（代入变量均值）
    partial_vals = np.array([sym.subs({sym: mean for sym, mean in zip(x_syms, x_means)}) for sym in partial_syms], dtype=float)
    
    # 计算方差
    f_var = partial_vals @ cov_matrix @ partial_vals
    
    return float(f_mean), float(f_var)

步骤3：实际使用示例

# 定义符号变量和符号函数
x1, x2 = sp.symbols('x1 x2')
f_sym = x1**2 + x2**2

# 变量均值和协方差矩阵
x_means = [2.0, 3.0]
cov_matrix = np.array([[0.1, 0.05], [0.05, 0.2]])

# 计算
f_mean, f_var = sympy_propagate_uncertainty(f_sym, [x1, x2], x_means, cov_matrix)
print(f"符号计算得到的f均值: {f_mean:.4f}")
print(f"符号计算得到的f方差: {f_var:.4f}")

运行结果和之前的数值方法完全一致，适合需要确认偏导数推导是否正确的场景。

额外技巧：从样本数据估计协方差矩阵

如果你的x_i是P个样本点（而不是已知均值和协方差），可以用numpy的np.cov来估计协方差矩阵：

import numpy as np

# 生成带相关性的样本数据（模拟实验数据）
np.random.seed(42)
n_vars = 2  # 变量数
n_samples = 1000  # 样本数
x1 = np.random.normal(loc=2.0, scale=np.sqrt(0.1), size=n_samples)
x2 = 0.05 / 0.1 * (x1 - 2.0) + np.random.normal(loc=3.0, scale=np.sqrt(0.2 - (0.05**2)/0.1), size=n_samples)

# 整理样本：shape为(n_vars, n_samples)
samples = np.array([x1, x2])

# 估计协方差矩阵
cov_matrix = np.cov(samples)
# 计算每个变量的均值
x_means = np.mean(samples, axis=1)

# 用之前的函数计算不确定性
f_mean, f_var = propagate_uncertainty(my_target_func, x_means, cov_matrix)
print(f"从样本估计的f均值: {f_mean:.4f}")
print(f"从样本估计的f方差: {f_var:.4f}")

这样就能直接从实验样本数据出发，自动完成不确定性的传播啦～

备注：内容来源于stack exchange，提问作者midnights

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠