• pandas-07 DataFrame修改index、columns名的方法


    pandas-07 DataFrame修改index、columns名的方法

    一般常用的有两个方法:
    1、使用DataFrame.index = [newName],DataFrame.columns = [newName],这两种方法可以轻松实现。
    2、使用rename方法(推荐):
    DataFrame.rename(mapper = None,index = None,columns = None,axis = None,copy = True,inplace = False,level = None )
    参数介绍:
    mapper,index,columns:可以任选其一使用,可以是将index和columns结合使用。index和column直接传入mapper或者字典的形式。
    axis:int或str,与mapper配合使用。可以是轴名称(‘index’,‘columns’)或数字(0,1)。默认为’index’。
    copy:boolean,默认为True,是否复制基础数据。
    inplace:布尔值,默认为False,是否返回新的DataFrame。如果为True,则忽略复制值。

    import numpy as np
    import pandas as pd
    from pandas import Series, DataFrame
    
    df1 = DataFrame(np.arange(9).reshape(3, 3), index = ['bj', 'sh', 'gz'], columns=['a', 'b', 'c'])
    print(df1)
    '''
        a  b  c
    bj  0  1  2
    sh  3  4  5
    gz  6  7  8
    '''
    
    # 修改 df1 的 index
    print(df1.index) # 可以打印出print的值,同时也可以为其赋值
    df1.index = Series(['beijing', 'shanghai', 'guangzhou'])
    print(df1)
    '''
               a  b  c
    beijing    0  1  2
    shanghai   3  4  5
    guangzhou  6  7  8
    '''
    
    # 可以使用map方法进行映射,map的使用方法就和python中的map几乎一样
    print(df1.index.map(str.upper)) # Index(['BEIJING', 'SHANGHAI', 'GUANGZHOU'], dtype='object')
    
    print(df1) # 结果 并未改变, 上面只是返回一个 dataframe 而已
    '''
               a  b  c
    beijing    0  1  2
    shanghai   3  4  5
    guangzhou  6  7  8
    '''
    
    # 如果 需要 改变的话,可以如下: 另外赋值给一个变量
    df1.index = df1.index.map(str.upper)
    print(df1) # 这样 就 改变了
    '''
               a  b  c
    BEIJING    0  1  2
    SHANGHAI   3  4  5
    GUANGZHOU  6  7  8
    '''
    
    # 更快捷的 方法 使用 rename,可以分别为 index 和 column 来指定值
    # 使用 map 的方式来赋值
    df2 = df1.rename(index=str.lower, columns=str.upper) # 这种方法 照样是产生一个新的 dataframe
    print(df2)
    ''' 可以很轻松的 修改 dataframe 的 index 和 columns
               A  B  C
    beijing    0  1  2
    shanghai   3  4  5
    guangzhou  6  7  8
    '''
    
    # 同时,rename 还可以传入字典
    df3 = df2.rename(index={'beijing':'bj'}, columns = {'A':'aa'}) # 为某个 index 单独修改名称
    print(df3) #
    '''
               aa  B  C
    bj          0  1  2
    shanghai    3  4  5
    guangzhou   6  7  8
    '''
    
    # 自定义map函数
    def test_map(x):
        return x+'_ABC'
    
    print(df1.index.map(test_map))
    # 输出 Index(['BEIJING_ABC', 'SHANGHAI_ABC', 'GUANGZHOU_ABC'], dtype='object')
    
    print(df1.rename(index=test_map))
    '''
                   a  b  c
    BEIJING_ABC    0  1  2
    SHANGHAI_ABC   3  4  5
    GUANGZHOU_ABC  6  7  8
    '''
    
  • 相关阅读:
    [转]字符串相似度算法(编辑距离算法 Levenshtein Distance)
    [转]Earth Mover's Distance (EMD)
    [转]相似度计算常用方法综述
    小和问题和逆序对问题
    递归的理解
    验证方法是否正确——对数器
    CSS的几个核心概念(复盘大纲~)
    CSS3过渡
    CSS经典布局
    CSS3边框和圆角
  • 原文地址:https://www.cnblogs.com/wenqiangit/p/11252741.html
Copyright © 2020-2023  润新知