Pandas缺失数据处理
Pandas用np.nan代表缺失数据
reindex()
可以修改 索引,会返回一个数据的副本:
df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D','E']) df1 df1 = df.reindex(index=dates[0:4], columns=['A','B','C','D']+['E']) df1 df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ['E']) df1 df1.loc[dates[0]:dates[1],'E'] = 1 df1
对缺失值进行填充
df1.fillna(value=5) df1['E'] = df1['E'].fillna(value=5) df1
丢掉含有缺失项的行:
df1.dropna(how='any')
对缺失项布尔赋值
pd.isnull(df1)