SHAP蜂群图中是否存在自定义特征顺序的方法？

在SHAP蜂群图中，特征的顺序是按照此前计算得出的特征重要性进行排序的。如果我们想要自定义特征的顺序，我们可以将特征按照我们想要的顺序排列，然后在调用shap.summary_plot()时进行引用。以下是一个简单的示例代码，其中特征的顺序被自定义为['feature_3', 'feature_1', 'feature_2']：

import shap
import pandas as pd

shap.initjs()

# 构造数据
X,y = shap.datasets.diabetes()
X_df = pd.DataFrame(X, columns=shap.datasets.diabetes().feature_names)

# 训练模型
model = xgboost.train({"learning_rate": 0.01}, xgboost.DMatrix(X_df, label=y), 100)

# 计算SHAP值
explainer = shap.TreeExplainer(model)
shap_values = explainer.shap_values(X_df)

# 自定义特征顺序
feature_order = ['feature_3', 'feature_1', 'feature_2']

# 生成SHAP蜂群图
shap.summary_plot(shap_values, X_df, plot_type="bar", feature_names=shap.datasets.diabetes().feature_names,
                  sort=True, color='coolwarm', plot_size=(12,4), ordering_keys=feature_order)

通过设置ordering_keys参数，我们可以将特征排列在我们想要的顺序中。

本文内容通过AI工具匹配关键字智能整合而成，仅供参考，火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见，您可以通过联系service@volcengine.com进行反馈，火山引擎收到您的反馈后将及时答复和处理。

展开更多

开发者特惠

面向开发者的云福利中心，ECS 60元/年，域名1元起，助力开发者快速在云上构建可靠应用

ECS首年60元

社区干货

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

SHAP蜂群图中是否存在自定义特征顺序的方法？

开发者特惠

社区干货

特惠活动

热门爆款云服务器

域名注册服务

DCDN国内流量包100G