如何在Pandas DataFrame中检查列空值并统计空值数量?
用Pandas查看数据列的缺失值及数量
在Pandas里有几种简单直接的方法可以快速统计各列的缺失值(null)数量:
1. 基础统计:isnull().sum()
这是最常用的方式,一步就能得到每列的空值总数:
import pandas as pd # 加载你的数据集(示例用CSV,也可以是Excel等其他格式) df = pd.read_csv('your_dataset.csv') # 计算每列的空值数量 null_counts = df.isnull().sum() print(null_counts)
输出结果是一个Series,索引为列名,对应的值就是该列的空值数量。
2. 只显示存在缺失值的列
如果数据列很多,只想看有缺失值的列,可以加个过滤条件:
# 筛选出空值数量大于0的列 non_zero_nulls = null_counts[null_counts > 0] print(non_zero_nulls)
3. 转换成DataFrame格式(更易读)
如果想要结构化的表格展示结果,可以把统计结果转成DataFrame:
null_summary = pd.DataFrame({ '列名': null_counts.index, '空值数量': null_counts.values }) # 只保留有缺失值的行 null_summary = null_summary[null_summary['空值数量'] > 0] print(null_summary)
补充:用info()快速概览
另外,df.info()方法也能间接查看缺失情况——它会显示每列的非空值数量,用总行数减去非空数就能得到空值数,适合快速扫数据集的整体情况:
df.info()
内容的提问来源于stack exchange,提问作者Sa Az




