You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

已通过pickle加载机器学习模型,如何在Jupyter Notebook中交互?

如何与加载后的statsmodels模型交互

嘿,恭喜你成功把模型加载进来啦!这第一步已经迈得很棒了~ 既然你用的是statsmodels(结合pandas、numpy),咱们就从最常用的几个操作入手,一步步和模型互动:

1. 先看看模型的基本信息

statsmodels的模型都自带一个超级实用的summary()方法,能输出模型的详细统计结果,比如系数、p值、R²这些关键指标,帮你快速回顾模型的情况:

# 输出模型的详细统计摘要
print(model.summary())

2. 用模型做预测(最核心的操作)

这应该是你最关心的部分!要注意输入数据的格式必须和你训练模型时的格式完全一致——比如训练时用的是带列名的pandas DataFrame,预测时也要传结构相同的DataFrame;如果是numpy数组,维度和特征顺序得和训练数据匹配。

举个例子:

import pandas as pd
import numpy as np

# 假设你的模型训练时用的特征是["feature1", "feature2", "feature3"]
# 方法1:用pandas DataFrame传入(推荐,不容易搞混特征顺序)
new_data = pd.DataFrame({
    "feature1": [1.2, 3.4],
    "feature2": [5.6, 7.8],
    "feature3": [9.0, 2.3]
})

# 方法2:用numpy数组传入(要确保特征顺序和训练时完全一致)
new_data_np = np.array([[1.2,5.6,9.0], [3.4,7.8,2.3]])

# 执行预测
predictions = model.predict(new_data)
# 或者用numpy数组的版本:predictions = model.predict(new_data_np)

print("预测结果:", predictions)

⚠️ 重要提醒:如果训练数据做过预处理(比如标准化、归一化、分类特征编码),那新数据必须做完全一样的预处理,不然预测结果会完全不准哦!

3. 访问模型的其他属性

除了预测,你还能直接调取模型的各种属性,比如:

  • model.params:查看模型的系数(权重)
  • model.resid:查看训练数据的残差(真实值-预测值)
  • model.fittedvalues:查看训练数据的拟合预测值
  • model.rsquared:查看模型的R²得分(针对回归模型)

示例代码:

# 查看模型系数
print("模型系数:\n", model.params)

# 查看R²得分(如果是回归模型)
print("模型R²得分:", model.rsquared)

4. 其他小技巧

如果不确定模型支持哪些方法和属性,可以用Python内置的dir()函数查看:

# 列出模型所有可用的方法和属性
print(dir(model))

挑带predictsummary这类关键词的去试,大概率就是你需要的功能~

内容的提问来源于stack exchange,提问作者cheznead

火山引擎 最新活动