基于Pandas DataFrame两列创建新列时触发KeyError问题求助

阿华AIGC实验室

2026-4-2

看起来你遇到的KeyError核心原因有两个可能性：列名不匹配，或者**apply方法的轴参数错误**，我帮你一步步排查和修复：

第一步：先确认列名是否真的存在

首先执行下面的代码，打印出DataFrame的所有列名，仔细检查keep_release和keep_truck是否在列列表里——注意大小写、下划线、空格必须完全一致（比如别把keep_release写成keep release或者KeepRelease）：

print("当前DataFrame的列名：", df_out.columns.tolist())

如果这两个列名不在输出里，说明你之前创建这两列的代码有问题（比如赋值给了其他变量，没更新到df_out），先把这一步解决，确保列存在。

第二步：如果列名正确，修复你的代码

问题1：第一种写法缺少`axis=1`参数

apply方法默认是按列（axis=0）执行函数，而你需要按行处理每一行的两个布尔值，所以必须加上axis=1，否则函数会收到整列的数据，自然找不到keep_release这个键。修复后的代码：

def check_truck_and_release_row(x):
    return x['keep_release'] and x['keep_truck']

# 关键：添加axis=1，指定按行应用函数
df_out = df_out.assign(keep=lambda x: x[['keep_release', 'keep_truck']].apply(check_truck_and_release_row, axis=1))

问题2：推荐用更高效的向量化写法（替代`apply`）

Pandas的布尔列可以直接用&操作符做向量化的逻辑与，比apply高效得多（尤其是数据量大的时候），代码也更简洁：

# 直接创建keep列：只有当两列都为True时才返回True
df_out['keep'] = df_out['keep_release'] & df_out['keep_truck']

# 或者用assign的链式写法
df_out = df_out.assign(keep=lambda x: x['keep_release'] & x['keep_truck'])

额外排查点

如果还是报KeyError，再检查：

你是不是在创建keep_release和keep_truck列后，没有把结果赋值给df_out？比如你可能写了df = df.assign(keep_release=...)，但之后操作的是df_out而不是df？
加载Excel的时候有没有把第一行当成列名？比如用pd.read_excel时如果Excel里没有表头，是不是应该指定header=None？如果原始Excel没有表头，初始列名是数字索引，要确保你后来确实成功添加了keep_release和keep_truck这两个字符串列名。

按照这个步骤来，应该能解决你的KeyError问题，同时正确生成keep列~