基于Spotify音轨数据集的多标签音乐流派分类：极端类别不平衡下的模型优化问询

基于Spotify音轨数据集的多标签音乐流派分类：极端类别不平衡下的模型优化问询

阿华AIGC实验室

2026-4-27

这绝对是多标签音乐流派分类里遇到的棘手问题——极端类别不平衡加上标签重叠，我来分享一些实战中验证有效的进阶技巧，以及关于决策阈值调整的经验：

进阶类别不平衡处理技巧

以下这些方法在处理极端不平衡的多标签任务时，比单纯的类别权重效果更显著：

针对性重采样
多标签场景下的重采样要比单标签更谨慎，推荐试试这些：
- ML-SMOTE：专门为多标签设计的过采样算法，能生成符合少数类标签分布的合成样本，避免普通SMOTE在多标签下的偏差；
- 聚类式欠采样：对占比极高的"Other/Indie"类别先做聚类，再从每个簇中采样，既能减少多数类样本量，又能保留该类别的特征多样性；
- 混合采样：结合过采样少数类（比如Rock/Hip-Hop）和欠采样多数类，平衡数据分布的同时降低过拟合风险。
优化损失函数
别局限于带权重的Binary Cross-Entropy，试试这些更适配不平衡场景的损失：
- Focal Loss：通过给易分类样本（比如多数类）降低权重，强制模型把注意力放在难分类的少数类上，调参时可以调整gamma参数控制权重衰减的程度；
- Label-Weighted Cross-Entropy：除了基于类别频率的权重，还可以根据业务需求给少数类设置更高的误分类代价权重；
- Dice Loss：对样本极不均衡的情况特别友好，它直接优化F1相关的指标，能有效提升少数类的召回率。
音频特征增强
针对你的音频特征（danceability、acousticness等）做增强，增加少数类样本的多样性：
- 特征扰动：给少数类样本的特征添加小幅度的高斯噪声，或者在合理范围内随机调整特征值；
- 特征衍生：计算特征的统计量（比如均值、标准差）、特征间的比值（比如energy/acousticness）作为新特征，帮助模型捕捉少数类的独特模式。
集成学习策略
集成方法天生适合处理不平衡问题：
- 分层Bagging：每个基模型训练时，采用分层采样保证每个子集都包含足够的少数类样本；
- 专属子模型：单独训练针对Rock/Hip-Hop等少数类的二分类模型，然后和主多标签模型的结果融合；
- 用LightGBM/XGBoost的多标签版本：这类模型内置了scale_pos_weight等不平衡处理参数，结合它们的直方图优化，对大数据量的不平衡任务效率很高。

关于调整决策阈值的有效性

当然有用！很多从业者都靠这个技巧大幅提升少数类的召回率，这也是多标签分类里很容易被忽略的关键点：

默认的0.5阈值对少数类太苛刻了，因为模型对少数类的输出概率普遍偏低。你可以针对每个类别单独调整阈值：
- 用验证集绘制每个类别的Precision-Recall曲线，找到能平衡Precision和Recall的最优阈值（比如你如果更看重召回率，就选能达到目标召回率的最低阈值）；
- 比如对Rock/Hip-Hop这类少数类，可以把阈值降到0.2甚至0.1，虽然可能会增加一些误判，但能显著提升召回率，这个trade-off完全取决于你的任务需求。
进阶一点的话，可以用网格搜索或者贝叶斯优化来自动搜索每个类别的最优阈值，把阈值作为超参数来调优，能节省不少手动试错的时间。

最后建议你把类别权重+Focal Loss的模型训练，和后续的阈值调整结合起来，这样能最大化少数类的表现。

内容的提问来源于stack exchange，提问作者Ryan Thien Nguyen

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠