如何在不重建模型的情况下对fitgmdist训练的GMM降维

阿华AIGC实验室

2026-5-15

好的，针对你已经用fitgmdist训练好GMM模型、想要直接降维而不用重新训练的需求，我给你分两种常见场景来讲解，都是直接基于现有模型参数操作的：

场景1：直接选取原特征中的n个维度（边缘分布）

这是最简单的降维方式——直接从原N维特征里挑出你需要的n个维度，提取每个GMM分量对应的参数子集即可，权重保持不变。

操作代码示例

假设你要保留的维度索引存在idx向量里（比如idx = [1,3,5]表示保留第1、3、5维），可以这样构造降维后的GMM：

% 定义要保留的维度索引（示例：选3个维度）
idx = [1, 3, 5];
n = length(idx);

% 提取降维后的模型参数
new_weights = gmm_goal.ComponentProportions;  % 分量权重不变
new_mu = gmm_goal.Mu(:, idx);  % 每个分量只保留指定维度的均值
new_sigma = gmm_goal.Sigma(idx, idx, :);  % 每个分量只保留指定维度的协方差子矩阵

% 创建降维后的GMM模型
gmm_reduced = gmdistribution(new_mu, new_sigma, new_weights);

原理

多元高斯分布的边缘分布仍然是高斯分布：对于原GMM的第k个分量（N维高斯N(μ_k, Σ_k)），取n个维度后的边缘分布就是N(μ_k[idx], Σ_k[idx,idx])。而混合模型的分量权重是每个分量的先验概率，和特征维度无关，所以直接沿用即可。

场景2：通过线性投影降维（比如PCA）到n维

如果不是直接选维度，而是想要通过线性投影（比如最大化方差的PCA）将N维特征映射到n维，我们可以先计算投影矩阵，再对每个GMM分量做投影变换。

操作步骤与代码

步骤1：计算全局加权协方差，得到PCA投影矩阵

我们用GMM的全局加权协方差来计算PCA，确保投影能保留尽可能多的全局信息：

K = gmm_goal.NumComponents;
N = gmm_goal.NumVariables;
n = 2; % 目标降维维度，可按需修改

% 计算GMM的全局均值
mu_global = sum(gmm_goal.ComponentProportions .* gmm_goal.Mu, 1);

% 计算全局加权协方差
Sigma_global = zeros(N,N);
for k = 1:K
    mu_k = gmm_goal.Mu(k,:);
    Sigma_k = gmm_goal.Sigma(:,:,k);
    Sigma_global = Sigma_global + gmm_goal.ComponentProportions(k) * ...
        (Sigma_k + (mu_k - mu_global)' * (mu_k - mu_global));
end

% 提取前n个最大特征值对应的特征向量作为投影矩阵
[V, D] = eig(Sigma_global);
[~, sorted_idx] = sort(diag(D), 'descend'); % 按特征值从大到小排序
W = V(:, sorted_idx(1:n))'; % W是n×N的投影矩阵

步骤2：用投影矩阵变换每个GMM分量

% 初始化降维后的模型参数
new_weights = gmm_goal.ComponentProportions;
new_mu = zeros(K, n);
new_sigma = zeros(n, n, K);

% 逐个分量做投影变换
for k = 1:K
    new_mu(k,:) = W * gmm_goal.Mu(k,:)';
    new_sigma(:,:,k) = W * gmm_goal.Sigma(:,:,k) * W';
end

% 处理可能的协方差奇异性（可选，防止数值问题）
for k = 1:K
    new_sigma(:,:,k) = new_sigma(:,:,k) + 1e-6 * eye(n);
end

% 创建降维后的GMM模型
gmm_reduced = gmdistribution(new_mu, new_sigma, new_weights);