>> np.nan == np.nan
False
>> np.nan is np.nan
True
>> math.nan is np.nan
False
>> np.isnan(math.nan)
True
1. 判断 ndarray 中是否存在 nan
>> c = np.array([ 1., 2., np.nan, 3., 4.])
>> np.isnan(c)
array([False, False, True, False, False])
# 注意
>> np.nan != np.nan
True
>> np.nan in c
False
上述方案要么返回的是一个序列,要么给出的是错误的结果。判断 numpy 下的多维数组中是否存在 nan 的简单方式:
>> np.isnan(np.min(c))
True
>> np.isnan(np.sum(c))
True
# 因为
>> np.min(c)
nan
>> np.sum(c)
nan
2. 将 nan 填充为均值
>> c = np.array([ 1., 2., np.nan, 3., 4.])
>> c[np.isnan(c)] = np.mean(c[~np.nan(c)])