处理缺失数据

缺失数据（missing data）在大部分数据分析应用中都很常见。pandas的设计目标之一就是让缺失数据的处理任务尽量轻松。

例如， pandas对象上的所有描述统计都排除了缺失数据。

pandas使用浮点值NaN（not a Number）表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测出来的标记而已

由于Numpy的数据类型体系中缺乏真正的NA数据类型或定位模式，所以它是我能想到的最佳解决方案

NA处理方法

布尔类型索引取值

DataFrame

面对DataFrame对象，事情变得复杂了。你可能希望丢弃全NA或含有NA的行货列。drop默认丢弃任何含有缺失值的行：

丢弃全为NA的行：

丢弃全为NA的列：

翻滚数据

fillna value调用一个字典{}作为标量值用于填补缺失值。

相关阅读:
ZOJ 1001 A + B Problem
献给那些心软的人！！
将表格的数据插入另一个表格
把链接显示为方框
【ibus】设置ibus输入法（pinyin & sunpinyin）
[Mongo] How to Install Mongo on Debian（不要安装）
[Sinatra、Mongo] Mongo
Sinatra+SQLite3+DataMapper
[sinatra] Sinatra再入门
[slim] Slim

原文地址：https://www.cnblogs.com/renfanzi/p/6434022.html