如何在时间序列价格预测作业中对比XGBoost与Random Forest的预测效果并选择最优模型

如何在时间序列价格预测作业中对比XGBoost与Random Forest的预测效果并选择最优模型

阿华AIGC实验室

2026-4-27

Hey there! 针对你时间序列预测作业里要对比Random Forest Regressor和XGBoost模型效果的需求，我整理了几个实用的评估方法和代码示例，帮你快速搞定结论部分：

一、核心评估指标：量化模型性能

回归任务里，我们通常用以下几个指标来衡量预测效果，数值表现直接反映模型优劣：

MAE（平均绝对误差）：衡量预测值与真实值的平均绝对偏差，数值越小说明预测越精准
MSE（均方误差）：对大误差的惩罚更重，适合关注极端偏差的场景
RMSE（均方根误差）：和原始数据单位一致，更易解释的误差指标
R²（决定系数）：反映模型对数据变异的解释能力，越接近1越好

二、代码实现：计算并对比指标

你可以直接用sklearn的metrics模块快速计算，示例代码如下：

from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
import numpy as np

# 假设你已经准备好测试集真实值y_test，以及两个模型的预测结果
y_pred_rf = random_forest_model.predict(X_test)  # 随机森林预测值
y_pred_xgb = xgb_model.predict(X_test)          # XGBoost预测值

# 计算随机森林的评估指标
mae_rf = mean_absolute_error(y_test, y_pred_rf)
mse_rf = mean_squared_error(y_test, y_pred_rf)
rmse_rf = np.sqrt(mse_rf)
r2_rf = r2_score(y_test, y_pred_rf)

# 计算XGBoost的评估指标
mae_xgb = mean_absolute_error(y_test, y_pred_xgb)
mse_xgb = mean_squared_error(y_test, y_pred_xgb)
rmse_xgb = np.sqrt(mse_xgb)
r2_xgb = r2_score(y_test, y_pred_xgb)

# 格式化输出对比结果
print("=== 模型性能对比表 ===")
print(f"随机森林 | MAE: {mae_rf:.4f} | MSE: {mse_rf:.4f} | RMSE: {rmse_rf:.4f} | R²: {r2_rf:.4f}")
print(f"XGBoost  | MAE: {mae_xgb:.4f} | MSE: {mse_xgb:.4f} | RMSE: {rmse_xgb:.4f} | R²: {r2_xgb:.4f}")

三、可视化对比：直观展示拟合效果

除了数值指标，可视化能更直观地展示模型对时间序列的拟合能力，代码示例：

import matplotlib.pyplot as plt

plt.figure(figsize=(14, 7))
# 绘制真实价格曲线
plt.plot(y_test.values, label='真实价格', color='#2c3e50', linewidth=2, alpha=0.8)
# 绘制随机森林预测曲线
plt.plot(y_pred_rf, label='随机森林预测', color='#e74c3c', linestyle='--')
# 绘制XGBoost预测曲线
plt.plot(y_pred_xgb, label='XGBoost预测', color='#3498db', linestyle=':')

plt.title('真实价格 vs 模型预测价格对比', fontsize=14)
plt.xlabel('时间步', fontsize=12)
plt.ylabel('价格', fontsize=12)
plt.legend(fontsize=12)
plt.grid(alpha=0.3)
plt.show()

四、统计显著性检验（可选，提升结论严谨性）

如果想判断两个模型的性能差异是否具有统计学意义，可以用配对t检验，代码示例：

from scipy.stats import ttest_rel

# 计算两个模型的预测误差
errors_rf = y_test - y_pred_rf
errors_xgb = y_test - y_pred_xgb

# 执行配对t检验
t_stat, p_value = ttest_rel(errors_rf, errors_xgb)

print(f"配对t检验结果：t统计量 = {t_stat:.4f}, p值 = {p_value:.4f}")
if p_value < 0.05:
    print("结论：两个模型的预测效果存在显著统计学差异")
else:
    print("结论：没有足够证据表明两个模型的预测效果存在显著差异")

你可以根据作业的要求，组合使用这些方法：用数值指标量化对比，用可视化展示拟合情况，可选统计检验增强结论严谨性，这样的结论部分会非常扎实。

内容的提问来源于stack exchange，提问作者titi

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠