• Pandas库的基本使用 pip安装 Series DataFrame


    Pandas库的基本使用 pip安装 Series DataFrame

     

    安装pip

    pip是Python的包管理工具,熟悉Linux的朋友应该对包管理工具很熟悉(yum),一些库被集成在了pip中,因此我们需要安装pip(win10)

    • 在官方下载地址:https://pypi.org/project/pip/#files,下载.tar.gz包
    • 在自定义位置解压pip包
    • 使用cmd进入自定义路径,执行python setup.py install
    • 添加pip环境变量,在PATH后添加Python安装路径/Scripts
    • 新建cmd或者重启Pycharm,输入pip命令,出现使用说明则为配置成功

     

    Pandas简介

    Pandas是基于Numpy构建的拥有更高级数据结构以及分析能力的工具包
    两个核心的数据结构:

    • Series(一维序列)
    • DataFrame(类似数据库表,二维表结构,与json的锲合度很高)

    Pandas可以对数据进行导入、清洗、处理、统计和输出,对于不是很复杂的数据,使用几句pandas代码就可以对数据进行规整

     

    Series

    Series 是定长的字典序列,相当于两个ndarray,一列是数据,一列可以是索引

    # Series 创建方式一 直接调用Series创建,可以手动指定索引(相当于字典的key)
    x1 = Series([1, 2, 3, 4])
    x2 = Series(data=[1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
    print(x1)
    print(x2)
    # Series 创建方式二 以字典方式创建Series,先以字典方式存储,再调用Series
    s = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
    x3 = Series(s)
    print(x3)
    

    输出

    当前所使用的python版本是: 3.7.2
    0    1
    1    2
    2    3
    3    4
    dtype: int64
    a    1
    b    2
    c    3
    d    4
    dtype: int64
    a    1
    b    2
    c    3
    d    4
    dtype: int64
    

     

    DataFrame

    DataFrame有行索引和列索引,可以看做是有相同索引组成的Series

    # 在这里,列索引是科目名称,行索引是五虎上将的姓名
    data = {'Chinese': [66, 95, 93, 90, 80], 'English': [65, 85, 92, 88, 90], 'Math': [30, 98, 96, 77, 90]}
    df1 = DataFrame(data)
    df2 = DataFrame(data, index=['Zhangfei', 'Guanyu', 'Zhaoyun', 'huangzhong', 'Machao'])
    print(df1)
    print(df2)
    

    输出

       Chinese  English  Math
    0       66       65    30
    1       95       85    98
    2       93       92    96
    3       90       88    77
    4       80       90    90
                Chinese  English  Math
    Zhangfei         66       65    30
    Guanyu           95       85    98
    Zhaoyun          93       92    96
    huangzhong       90       88    77
    Machao           80       90    90
    

    说明不指定index的DataFrame和Series一样,默认index都是0,1,2,3...

     

    解决报错

    • 提示安装xlrd
      
      pip install xlrd
      
    • ModuleNotFoundError: No module named 'openpyxl'
      
      pip install openpyxl
      

     

  • 相关阅读:
    js之数组的方法
    js之选项卡
    js之数据类型的比较
    Android sharedUserId研究记录
    直接拿来用!最火的Android开源项目(一)
    [转]简约而不简单——Android SimpleAdapter
    [转]Android GC机制及一些调试信息
    sendToTarget 和 sendMessage 区别
    Android中内容观察者的使用---- ContentObserver类详解 (转)
    Inflate()
  • 原文地址:https://www.cnblogs.com/G-Aurora/p/13380306.html
Copyright © 2020-2023  润新知