MATLAB非线性回归：lsqcurvefit替代方法及拟合效果对比咨询

阿华AIGC实验室

2026-5-22

Hey 你好！既然你已经在用lsqcurvefit处理包含Cure、Cure rate和Temperature三类数据的非线性回归问题，下面给你推荐几种实用的替代方法，方便你对比不同方法的拟合效果：

非线性回归替代方法推荐

1. 自定义损失函数 + 无约束优化器（`fminunc`/`fminsearch`）

你可以手动构建损失函数（比如残差平方和、绝对误差和等），然后用MATLAB的无约束优化器来最小化损失。这种方法的优势是灵活性极强，能根据数据特点调整损失逻辑（比如用绝对误差代替平方误差，适合存在异常值的场景）。

示例代码：

% 自定义损失函数：计算残差平方和
function loss = custom_loss(x, Cure, Cure_rate, Temperature)
    % 调用你的模型函数得到预测值
    predicted_cure_rate = model_fun(x, Cure, Temperature);
    % 计算残差平方和作为损失
    residuals = predicted_cure_rate - Cure_rate;
    loss = sum(residuals.^2);
end

% 使用fminunc（需要模型可导）或fminsearch（无需导数）求解
x_opt = fminunc(@(x) custom_loss(x, Cure, Cure_rate, Temperature), x0);
% 若模型难以求导，换用fminsearch：
% x_opt = fminsearch(@(x) custom_loss(x, Cure, Cure_rate, Temperature), x0);

2. 统计建模专用工具`nlinfit`（Statistics and Machine Learning Toolbox）

如果你需要更偏向统计分析的结果（比如参数置信区间、拟合优度），nlinfit会是更好的选择。它是MATLAB专门为非线性回归设计的函数，语法更贴合统计建模的逻辑。

示例代码：

% 组合自变量（Cure和Temperature）为矩阵
X = [Cure, Temperature];

% 适配nlinfit的模型函数格式：输入参数x和自变量矩阵X，输出预测值
function y_pred = model_fun_nlin(x, X)
    Cure = X(:, 1);
    Temperature = X(:, 2);
    % 你的模型计算逻辑
    y_pred = ...; % 输出预测的Cure rate
end

% 调用nlinfit求解最优参数
x_opt = nlinfit(X, Cure_rate, @model_fun_nlin, x0);

% 可选：获取拟合的统计信息（比如参数置信区间）
[~,~,~,~,stats] = nlinfit(X, Cure_rate, @model_fun_nlin, x0);
confidence_intervals = nlparci(x_opt, stats);

3. 直接最小化残差的`lsqnonlin`

lsqnonlin和lsqcurvefit同属最小二乘优化家族，但它直接以残差向量为优化目标，不需要像lsqcurvefit那样指定自变量和因变量的映射关系。如果你的残差计算逻辑比较复杂，这种形式会更直观。

示例代码：

% 定义残差函数：输出预测值与真实值的差值
function residuals = residual_fun(x, Cure, Cure_rate, Temperature)
    predicted_cure_rate = model_fun(x, Cure, Temperature);
    residuals = predicted_cure_rate - Cure_rate;
end

% 调用lsqnonlin求解
x_opt = lsqnonlin(@(x) residual_fun(x, Cure, Cure_rate, Temperature), x0);

4. 全局优化方法（应对局部最优问题）

如果你的模型是非凸的，或者初始参数x0选得不够好，lsqcurvefit这类局部优化器可能会收敛到局部最优解。这时可以试试全局优化算法，比如遗传算法(ga)或粒子群算法(particleswarm)，它们能在更大的参数空间内寻找最优解。

示例代码（遗传算法）：

% 定义适应度函数（以残差平方和为适应度，越小越好）
function fitness = ga_fitness(x, Cure, Cure_rate, Temperature)
    predicted_cure_rate = model_fun(x, Cure, Temperature);
    fitness = sum((predicted_cure_rate - Cure_rate).^2);
end

% 定义参数的上下界（根据你的模型实际情况调整）
lb = [0, 0.1]; % 参数下界
ub = [10, 5];  % 参数上界

% 调用遗传算法求解
x_opt = ga(@(x) ga_fitness(x, Cure, Cure_rate, Temperature), length(x0), ...
    [], [], [], [], lb, ub);

注意：全局优化方法的计算速度会比局部优化慢，适合对精度要求高且参数空间不大的场景。

5. 贝叶斯非线性回归（获取参数不确定性）

如果你的数据量较小，或者想要得到参数的概率分布（而非单一最优值），贝叶斯方法会很有用。它能给出参数的不确定性估计，帮助你判断模型的稳健性。

示例代码（基于bayesopt）：

% 定义对数似然函数（假设残差服从正态分布，将噪声标准差也作为参数估计）
function log_likelihood = bayes_loglike(x, Cure, Cure_rate, Temperature)
    % 前n个元素是模型参数，最后一个是噪声标准差sigma
    model_params = x(1:end-1);
    sigma = x(end);
    
    predicted_cure_rate = model_fun(model_params, Cure, Temperature);
    residuals = predicted_cure_rate - Cure_rate;
    
    % 计算对数似然（取负后作为bayesopt的优化目标）
    log_likelihood = sum(normpdf(residuals, 0, sigma, 'log'));
end

% 定义参数上下界（包含sigma）
lb = [0, 0.1, 0.01]; % 前两个是模型参数下界，最后一个是sigma下界
ub = [10, 5, 10];    % 对应上界

% 调用bayesopt寻找最优参数（最小化负对数似然）
opts = bayesoptOptions('MaxObjectiveEvaluations', 200, 'Verbose', 1);
results = bayesopt(@(x) -log_likelihood(x, Cure, Cure_rate, Temperature), ...
    length(x0)+1, 'LowerBounds', lb, 'UpperBounds', ub, opts);

% 提取最优模型参数和sigma
x_opt = results.XAtMinObjective(1:end-1);
sigma_opt = results.XAtMinObjective(end);

内容的提问来源于stack exchange，提问作者Ernest Yim