为何Python中max、min与numpy.nan交互时存在异常行为？

阿华AIGC实验室

2026-5-22

为什么Python内置max/min函数和numpy.nan交互时会有这种“异常”行为？

这个问题其实和nan的比较特性以及Python内置max()/min()函数的底层实现逻辑直接相关，咱们一步步拆解：

核心原因1：numpy.nan的比较规则

在Python中，numpy.nan（即“非数字”）遵循IEEE 754浮点数标准的规则：任何与nan的比较操作（除了is判断）都会返回False。比如：

import numpy as np
print(np.nan > 0)   # 输出 False
print(np.nan < 0)   # 输出 False
print(0 > np.nan)   # 输出 False
print(0 < np.nan)   # 输出 False
print(np.nan == np.nan)  # 输出 False，这点尤其容易踩坑

核心原因2：Python内置max()的实现逻辑

Python的内置max(a, b, ...)函数（当传入多个位置参数时）的工作逻辑可以简化理解为：

把第一个参数作为初始的“当前最大值”
依次遍历后续每个参数，比较当前最大值 < 下一个参数
如果这个比较结果为True，就把“当前最大值”替换为下一个参数；否则保持不变
遍历结束后返回最终的“当前最大值”

把这个逻辑套进你的测试用例里就一目了然：

案例1：max(np.nan, 0)
初始当前值是np.nan，比较np.nan < 0 → 返回False，所以不替换，最终返回np.nan
案例2：max(0, np.nan)
初始当前值是0，比较0 < np.nan → 返回False，所以不替换，最终返回0

min()函数的逻辑类似，只是比较条件变成了当前最小值 > 下一个参数，同样因为nan的比较特性，会出现“返回第一个参数”的现象：

min(np.nan, 10000)：np.nan > 10000 → False，不替换，返回np.nan
min(10000, np.nan)：10000 > np.nan → False，不替换，返回10000

补充：和numpy.max的区别

如果你习惯了numpy的np.max()函数，会发现它处理nan的方式不同——默认情况下np.max([np.nan, 0])会返回nan，但可以通过np.nanmax()忽略nan值。这是因为numpy的聚合函数是针对数组设计的，有专门处理nan的逻辑，和Python内置函数的逐参数比较逻辑完全不同。

内容的提问来源于stack exchange，提问作者Peter Dolan