You need to enable JavaScript to run this app.
优惠活动
大模型
产品
解决方案
定价
更多
文档控制台
免费开始使用

如何在Pandas DataFrame中检查列空值并统计空值数量?

用Pandas查看数据列的缺失值及数量

在Pandas里有几种简单直接的方法可以快速统计各列的缺失值(null)数量:

1. 基础统计:isnull().sum()

这是最常用的方式,一步就能得到每列的空值总数:

import pandas as pd

# 加载你的数据集(示例用CSV,也可以是Excel等其他格式)
df = pd.read_csv('your_dataset.csv')

# 计算每列的空值数量
null_counts = df.isnull().sum()
print(null_counts)

输出结果是一个Series,索引为列名,对应的值就是该列的空值数量。

2. 只显示存在缺失值的列

如果数据列很多,只想看有缺失值的列,可以加个过滤条件:

# 筛选出空值数量大于0的列
non_zero_nulls = null_counts[null_counts > 0]
print(non_zero_nulls)

3. 转换成DataFrame格式(更易读)

如果想要结构化的表格展示结果,可以把统计结果转成DataFrame:

null_summary = pd.DataFrame({
    '列名': null_counts.index,
    '空值数量': null_counts.values
})

# 只保留有缺失值的行
null_summary = null_summary[null_summary['空值数量'] > 0]
print(null_summary)

补充:用info()快速概览

另外,df.info()方法也能间接查看缺失情况——它会显示每列的非空值数量,用总行数减去非空数就能得到空值数,适合快速扫数据集的整体情况:

df.info()

内容的提问来源于stack exchange,提问作者Sa Az

火山引擎 最新活动