• Pandas DataFrame的基本属性


    DataFrame的基础功能,以后要查询就得看这里!

    功能清单

    df2.index
    df2.columns
    df2.axes
    df2.T
    df2.info()
    df2.head(i)
    df2.tail(i)
    df2.describe()

    首先随机创建一个DataFrame

    # 利用 numpy 的随机函数建立一个 DataFrame
    df = DataFrame(np.random.rand(50,5))

    运行结果

    是5行50列的一个二维数组

    5行50列的二维数组

     这里为了加深印象,我添加了一个字典,增加对比,如下

    data = {'state':['Ohino','Ohino','Ohino','Nevada','Nevada'],
            'year':[2000,2001,2002,2001,2002],
            'pop':[1.5,1.7,3.6,2.4,2.9]}
    dic_df = DataFrame(data,index=['one','two','three','four','five'],
                   columns=['year','state','pop','debt'])
    print(df)

    运行结果

     重点来了,以后查的时候就用下边

    df.index 

    求行

    df.index
    dic_df.index

    df运行结果

    RangeIndex(start=0, stop=50, step=1)
    #意思是从0开始,50结束,步长为1

     dic_df的运行结果

    Index(['one', 'two', 'three', 'four', 'five'], dtype='object')

    df.columns
    求列
    print(df.columns)
    print(dic_df.columns)

    运行结果

     df.axes

    print(df.axes)
    print(dic_df.axes)

    运行结果

    就是返回两个“边”。

    df.T

    index 跟 columns 对调

    print(dic_df)
    print(dic_df.T)

    运行结果

    df.info()
    打印二维数组的信息
    print(df.info())
    print('
    ')
    print(dic_df.info()

    运行结果

    这里显示的信息都是以列为单位(columns)

    df.head(i)
    显示前头几行数据,以行为单位,index
    print(df.head(4))
    print('
    ')
    print(dic_df.head(2))

     运行结果

    df.tail(i)

    从后头显示几条信息

    print(df.tail(4))
    print('
    ')
    print(dic_df.tail(1))

    运行结果

    df.describe()

    查看数据值列的汇总统计

    可返回变量和观测的数量、缺失值和唯一值的数目、平均值、分位数等相关信息

    print(dic_df.describe().T)
    print('
    ')
    print(dic_df.describe())

    运行结果

  • 相关阅读:
    VS扩展开发 二 从示例程序出发
    VS扩展开发 一 导航
    CLR笔记 二 函数调用
    使用C#调用C++类库
    C#编程常用工具总结
    CLR笔记 一 概述
    C#工程中 使用targets和props实例
    VS C++工程的静态库引用问题
    C#高级编程笔记(三)
    (转)如何让CPU的使用率一直在50%
  • 原文地址:https://www.cnblogs.com/PYlog/p/9141136.html
Copyright © 2020-2023  润新知