Pandas可以处理数值类型的其他数据比如(字符串,时间序列等)
什么是pandas
由Series和DataFrme两个类组成的
Series
- Series一种类似与一维数组的对象,由下面两个部分组成
- values :一种数组
- index :相关数据索引标签
- Series的创建
- 由列表或者numpy数组创建
- 由字典创建
- Series的索引
- 隐式索引:数值型
- 显式索引: 自定义(字符串)_可提高数据可读性
Series的索引和切片
Series的常用属性
- shape(形状,几维度数组)
- size(长度,个数)
- index(索引)
- values(值)
Series的常用方法
- head(显示前几条数据)
- tail(显示后几条数据)
- unique(对Series进行去重的数据)
空值的清洗方法(Nan) - innull(判断值是空)
- notnull(判断值不是空)
- add(相加)
- 算数运算法则
- 索引与之匹配值进行算数运算,否则补空
- 算数运算法则
- sub(减)
- mul(乘)
- div(除)