• Pandas :Series、DataFrame 结构的数据创建


    一、pandas核心数据结构:Series

    理解:Series可以理解为一个一维的数组,只是index可以自己改动。类似于定长的有序字典,有Index和value。
    创建的方法统一为:pd.Series(data,index=)         

    1)打印的时候按照index赋值的顺序

    2)index参数默认从0开始的整数,也是Series的绝对位置,即使index被赋值之后,绝对位置不会被覆盖,index赋值必须是list类型。

    Series可以通过以下形式创建:python的dict、umpy当中的ndarray(numpy中的基本数据结构)、具体某个数值。

     代码:

    import pandas as pd
    
    # 创建一组Series数据
    print(("---------------案例1--------------"))
    # 书写格式1: 列表格式
    s1 = pd.Series([90,86,70],index=["Leo","Kate","John"])
    print(s1)
    
    # 书写格式2:字典格式
    dict={"leo":90,"kate":86,"john":70}
    
    s2 = pd.Series(dict)
    print("s2=","
    ",s2)
    
    
    print(("--------------案例2--------------"))
    s3=pd.Series([3,-5,7,4],index=list('ABCD'))
    print("s3=","
    ",s3)

    结果图:

     

    二、pandas核心数据结构:DataFrame

    理解:DataFrame是一个类似于表格的数据类型,DataFrame可以理解为一个二维数组,index有两个维度,可更改。


    DataFrame参数:

    data (方框内的数据)     :numpy ndarray、dict、 DataFrame
    index(行索引索引)        :Index or array-like
    columns (列索引)          :Index or array-like
    dtype(data的数据类型) :dtype, 默认为 None

    DataFrame统一的创建形式为pd.DataFrame(data,columns=,index=)

       其中columns为列的索引,index为行的索引。

       index或者columns如果不进行设置则默认为0开始的整数。

     代码:

    import pandas as pd
    
    print("---------案例1:--------------")
    # 创建DataFrame,列名是:'name'、'gender'、'age'
    df = pd.DataFrame([['Snow','M',22],
                       ['Tyrion','M',32],
                       ['Sansa','F',18],
                       ['Arya','F',14]], columns=['name','gender','age'])
    print(df)
    
    print("---------案例2:--------------")
    # DataFrame创建,列名是:'Country'、'Capital'、'Population'
    data=[['Belglum','Brussels',11190846],
          ['Indla','New Delhi',1303171035],
          ['Brazil','Brasilia',207847528]]
    
    # index如果不写,默认从0开始序列,下面设置了从1开始序列
    df1=pd.DataFrame(data=data,index=[1,2,3],columns=['Country','Capital','Population'])
    print(df1)

    结果图:

  • 相关阅读:
    【翻译】Flink Table Api & SQL — 流概念
    Flink Table Api & SQL 翻译目录
    【翻译】Flink Table Api & SQL — 性能调优 — 流式聚合
    记一次kube-apiserver启动失败排错
    使用Docker和K8s搭建FastDFS分布式文件系统
    Windows 下安装RabbitMQ服务器及基本配置
    k8s部署ingress-nginx报错排错
    k8s使用私有镜像仓库Harbor下载镜像ImagePullBackOff错误拍错
    第二次安装docker时,报Transaction check error的解决方法
    k8s出现error: no configuration has been provided, try setting KUBERNETES_MASTER environment variable
  • 原文地址:https://www.cnblogs.com/wodexk/p/10314507.html
Copyright © 2020-2023  润新知