• Python Pandas库的学习(一)


    今天我们来学习一下Pandas库,前面我们讲了Numpy库的学习

    接下来我们学习一下比较重要的库Pandas库,这个库比Numpy库还重要

    Pandas库是在Numpy库上进行了封装,相当于高级Numpy库

    在数据处理方面,运用Pandas库,也是非常多的,废话不多说

    先说第一个函数,read_csv,读取CSV数据文件

    import pandas
    food = pandas.read_csv("food_info.csv")
    print(type(food))
    print(food.dtypes)

    这里我打印了一下Type,可以看到类型为DataFrame,这个类型也是Pandas中,的核心类型

     下面我打印了一下,dtypes。可以看到,下面也是在pandas中非常常用的几种类型。

    int64,float64这两种就不用多说了。但是会发现一个新的类型。object类型

    这个类型就相当于str类型,也就是字符串类型值。

    然后接着,我们在运行一个函数

    food.head()

    这个函数的作用是,将我们数据中的,前5行打印出来。结果如下,

    那么如果我们想让数据显示多条怎么处理呢?

    food.head(8),只需要在这个函数中添加参数即可

    可以显示前面的,那么肯定可以显示后面的,

    food.tail(4)

    这个方法相当于显示最后面的4条数据

    如图所示,显示出最后的4行数据,可以看到跟数据中的数据做下对比,是一样的

    那么如果获取到数据表中,每一列的列名指标呢?

    print(food.columns)

    使用这个方便,可以或得到每个列表示的列名,结果是一个list,如下图

    还有一个要说的就是,如果看这个表的维度呢?我们直接在讲Numpy的时候讲过,如果查看矩阵的维度,用法一样,shape方法

    print(food.shape)

    可以看到如下结果,表示,当前数据,有8618 个样本,36个指标,36列

    我们如何从pandas中获取到某个数据呢?使用如下方法

    print(food.loc[0])

    这里我们可以看到,我们将第一个样本的全部值取出来了。对比结果。

    那么如果我们想去单独某条数据,那么只需要修改[0]到你需要的数据上即可。这里下标从0开始。

    大小超过数据的样本集,会直接报错。

    pandas中常用的数据类型如下

    object 就是我们常说的字符串类型

    int 整型

    float 浮点型

    bool 布尔型

    今天就先讲到这里我,感谢大家的阅读,谢谢!!

    更多好文章,请访问:https://www.yuanrenxue.com/

  • 相关阅读:
    安装WebStorm
    Could not obtain transaction-synchronized Session
    Hibernate4 No Session found for current thread原因
    Spring3系列7- 自动扫描组件或Bean
    论坛角色
    firefox浏览器无法显示bootstrap图标问题总结
    express文件上传中间件Multer最新使用说明
    判断圆和矩形是否相交C
    转化为用欧几里得算法判断互质的问题D
    (记录前面算过的后面仍然会用的数减小复杂度)A
  • 原文地址:https://www.cnblogs.com/ws17345067708/p/10720914.html
Copyright © 2020-2023  润新知