为何在Google VM上运行scikit-learn的plot_learning_curve未提速？

为何在Google VM上运行scikit-learn的plot_learning_curve未提速？

阿华AIGC实验室

2026-5-22

为什么你的学习曲线代码在Google VM上没提速？

我来帮你拆解几个实际使用scikit-learn和LightGBM时容易踩的坑，这些都是导致代码没提速的常见原因：

没开启交叉验证的并行计算
scikit-learn的learning_curve（包括plot_learning_curve）默认是单线程运行的，不管你的模型本身支不支持并行。要让代码利用Google VM的多核CPU，你需要在调用learning_curve时显式设置n_jobs=-1（或者指定VM的核数），示例如下：
```
train_sizes, train_scores, test_scores = learning_curve(
    lgb, x, y, cv=ShuffleSplit(n_splits=10, test_size=0.2),
    n_jobs=-1  # 关键参数：启用所有可用CPU核并行执行交叉验证
)
```
这个参数控制交叉验证时各个折的并行执行，是最直接的提速手段。
LightGBM本身的并行设置没优化
虽然你用了LGBMRegressor，但默认情况下它的并行线程数可能没拉满。你可以在初始化模型时指定n_jobs=-1，让它利用所有可用核：
```
lgb = LGBMRegressor(n_jobs=-1)
```
不过要注意：如果已经给learning_curve设置了n_jobs=-1，建议把LGBM的n_jobs设为1——避免交叉验证的每个折都开多线程导致CPU过载，让交叉验证层面来并行，效果反而更稳定。
Google VM的资源限制
你得确认自己的VM实例配置：如果是共享CPU的廉价实例（比如f1-micro），即使设置了多线程，实际能用到的CPU资源是被配额限制的，没法真正跑满多核。另外，部分VM实例默认的CPU配额不高，可能需要调整实例类型或申请更高配额。
数据集太小，并行开销抵消了收益
如果你的数据集非常小，创建线程、分配数据这些并行带来的额外开销，可能比并行计算节省的时间还多，结果看起来就没提速甚至更慢。这种情况下单线程反而更高效，你可以试试用更大的数据集测试。
忽略了plot_learning_curve的并行参数
如果你实际用的是plot_learning_curve函数，它的并行控制参数同样是n_jobs，需要显式设置才能启用多核，比如：
```
plot_learning_curve(lgb, x, y, cv=ShuffleSplit(n_splits=10), n_jobs=-1)
```
很多人容易遗漏这个参数，导致默认单线程运行。

内容的提问来源于stack exchange，提问作者Ghostintheshell

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠