• Cookbook:pandas的学习之路——10 Minutes to pandas


      按照pandas官网上10 Minutes to pandas的快速练习:

    一 .对象创建:

    导入练习所需要的工具包:

    通过列表中的值创建序列Series,pandas在创建序列的同时会默认为列表中值创建索引:(np.nan 为空值)

    通过NumPy数组创建DataFrame,同时默认创建时间索引和行标签:

    np.random.randn(6,4) 介绍:从正太分布中返回一个或多个样本值 ,例子中表示返回6行4列的随机数,不一定在(0,1]之间

    np.random.rand(6,4)介绍:从(0,1]之间,产生6行4列的嵌套数组)

    通过将字典转化为类似序列Series的形式,创建DataFrame:

    (pd.Categorical()函数:

     pandas.Categoricalvaluescategories = Noneordered = Nonedtype = Nonefastpath = False 

    values:像列表一样,categories:类别,可以定义类别,ordered:是否有序,dtype:categ的类型)

    DataFrame每一列的数据类型:

    使用<tab>可自动补全列名,并获取指定列的值:

    二.查看数据

    查看frame的头部和底部的数据:

    显示DataFrame的索引,列标题和值:

    DataFram的函数describe(),快速分析汇总数据:

    汇总指标:count:记数,mean:平均值,std:标准差,min:最小值,max:最大值

    对DataFrame中的数据进行行列转换:

    按轴进行排序:(说明:axis=1,表示第一行,axis=0,表示第一列,降序排序)

    按照值进行排序:

    说明:按照'B'列,默认的升序进行排序)

    三.获取数据

    通过列名获取指定列名的列数据:

    通过[],获取指定范围的切牌你数据:

    通过标签获取数据:

    通过标签获得截面数据:

    获取多维截取数据:

    获取标量数据:

    说明:at()函数的定位速度优于loc:

    通过位置获取数据:

  • 相关阅读:
    DAY09(for语句)
    Python 下载 tushare 数据,然后调用 C++ DLL 计算 wMA 存入本地 csv 文件再 python 读取
    Python socket编程之八:阶段性总结
    Ctex + Lyx = 自用 Latex 编辑环境
    matlab下二重积分的蒙特卡洛算法
    实验9 根据材料编程
    实验5 编写、调试具有多个段的程序
    实验4 [bx]和loop的使用
    实验3 编程、编译、连接、跟踪
    汇编语言第三章总结
  • 原文地址:https://www.cnblogs.com/maria-ld/p/9170740.html
Copyright © 2020-2023  润新知