• Python数据分析与展示[第三周](pandas数据类型操作)


    数据类型操作##

    如何改变Series/ DataFrame 对象###

    • 增加或重排:重新索引
    • 删除:drop

    重新索引 .reindex()####

    reindex() 能够改变或重排Series和DataFrame索引

    d.reindex(['c5','c4','v3','v2','c1'])
    这样是改变index的顺序

    d.reindex(column=['同比',...]
    这样是改变column的顺序

    .reincdex() 的参数#####

    index,columns 新的行列顺序
    fill_value 重新索引中,用于填充缺失位置的值
    method 填充方法,ffill 向前填充,bfill 向后填充
    limit 最大填充量
    copy 默认True,生成新的对象

    • 一个小例子,新增一列
    newc=d.colimns.insert(4,'新增’)
    newd=d.reindex(columns=newc,fill_value=200)
    
    pandas 的索引类型(index)#####

    .index .columns
    index对象是一个不可修改的类型
    +索引类型的常用操作

    方法 说明
    .append(ids) 链接另一个Index对象,产生新的Index对象
    .diff(dix) 计算两个Index的差集
    .intersection(dix) 计算两个Index的交集
    .union() 计算两个Index的并集
    .delete(loc) 删除loc位置的元素
    .insert(loc,e) 在loc位置增加一个元素e

    通过操作索引可以操作数据类型

    删除指定索引对象####

    a=pd.Series([9,8,7,6],index=['a','b','c','d'])

    a.drop(['b','c'])

    使用drop方法删除了这一部分数值(删除某一个index(row))

    d.drop(['同比], axis=1) 这样给出axis就可以删除列了。

    0 轴是操作index(row)
    1 轴是操作column

    pandas的数据类型运算###

    Series DataFram算术运算face

    根据行列索引运算,补齐后运算,运算默认产生浮点数

    补齐时缺失项填充NAN
    二维和一维 一维和0惟 间进行boradcast
    采用+-*/符号时产生新的运算对象

    • 例子
      a=pd.DataFrame(np.arange(12).reshape(3,4))
      b=pd.DataFrame(np.arange(20).reshape(4,5))
      a+b 补齐的都是NAN

    方法形式的运算####

    方法 说明
    .add(d,**argws) 类型间加法运算可选参数
    .sub
    .mul
    .div

    使用方法好处是可以增加可选参数
    fill_value= 补齐的时候使用fill_value来补齐

    一维默认在轴一(row)参与运算,
    b中给的每一个index(row) 减去a

    如果希望在零轴上 (column) b 中的每一个column减去 a

    比较运算####

    只比较相同索引的元素,不补齐
    不同维度的boradcast 默认时1轴(每一个index(row) 都作用到a))上

  • 相关阅读:
    J2EE中常用的名词解释
    java中的构造方法
    String s = new String("xyz");创建了几个StringObject?
    MySQL 学习笔记
    《SQL 必知必会》建表语句
    《SQL 必知必会》读书笔记
    IDEA 中项目代码修改后不自动生效,需要执行 mvn clean install 才生效
    curl 使用指南
    MySQL字段添加注释,但不改变字段的类型
    《痞子衡嵌入式半月刊》 第 14 期
  • 原文地址:https://www.cnblogs.com/sfzyk/p/6877796.html
Copyright © 2020-2023  润新知