• pandas 的stack() 和unstack() 函数


    pandas进行数据重排时,经常用到stack和unstack两个函数。stack的意思是堆叠,堆积,unstack即“不要堆叠”

    常见的数据的层次化结构有两种,一种是表格,一种是“花括号”,即下面这样的l两种形式:

     

     

    stack函数会将数据从”表格结构“变成”花括号结构“,即将其行索引变成列索引,反之,unstack函数将数据从”花括号结构“变成”表格结构“,即要将其中一层的列索引变成行索引

    原数据:

    import numpy as np
    import pandas as pd
    from pandas import Series,DataFrame
    data=DataFrame(np.arange(6).reshape((2,3)),
                   index=pd.Index(['street1','street2']),columns=pd.Index(['one','two','three']))

     

    原数据堆叠:

    data1=data.stack()
    
    '''
    输出:
    street1  one      0
             two      1
             three    2
    street2  one      3
             two      4
             three    5
    dtype: int32
    
    '''

    原数据不堆叠:

    data2=data.unstack()
    
    '''
    输出:
    one    street1    0
           street2    3
    two    street1    1
           street2    4
    three  street1    2
           street2    5
    dtype: int32
    
    '''

    原数据堆叠后在解开,这个一个用于groupby之后,得到不堆叠的二维表格

    data3=data.stack().unstack()

  • 相关阅读:
    通过strace 监控 fdatasync
    RAID 2.0
    AHCI vs NVMe
    NVMe 图解
    详解linux运维工程师入门级必备技能
    条带深度 队列深度 NCQ IOPS
    NVMe 与 AHCI
    IO负载高的来源定位 IO系列
    磁盘性能指标--IOPS 理论
    java程序员从笨鸟到菜鸟系列
  • 原文地址:https://www.cnblogs.com/cgmcoding/p/13497013.html
Copyright © 2020-2023  润新知