• pandas入门使用


    一、pandas 是什么

      pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析。它提供了大量高级的数据结构和对数据处理的方法。

      pandas 有两个主要的数据结构:Series 和 DataFrame

    二、series简介

      Series 是一个一维数组对象 ,类似于 NumPy 的一维 array。它除了包含一组数据还包含一组索引,所以可以把它理解为一组带索引的数组。 

      将 Python 数组转换成 Series 对象:
     
      将 Python 字典转换成 Series 对象:
     
      当没有显示指定索引的时候,Series 自动以 0 开始,步长为 1 为数据创建索引。
      你也可以通过 index 参数显示指定索引:
     
      对于 Series 对象里的单个数据来说,和普通数组一样,根据索引获取对应的数据或重新赋值;
      不过你还可以传入一个索引的数组来获取数据或未数据重新赋值:
     
      想要单独获取 Series 对象的索引或者数组内容的时候,可以使用 index 和 values 属性,例如:
     
      对 Series 对象的运算(索引不变):
     

    三、DataFrame

      DataFrame 是一个表格型的数据结构。它提供有序的列和不同类型的列值。
      例如将一个由 NumPy 数组组成的字典转换成 DataFrame 对象:
     
      DataFrame 默认根据列名首字母顺序进行排序,想要指定列的顺序?传入一个列名的字典即可:
     
      如果传入的列名找不到,它不会报错,而是产生一列 NA 值:
     
      DataFrame 不仅可以以字典索引的方式获取数据,还可以以属性的方法获取,例如:
     
      修改列的值:
     
     
      删除某一列:

      

  • 相关阅读:
    SQL索引一步到位
    Timeout expired超时时间已到. 达到了最大池大小 错误及Max Pool Size设置
    电脑开机的相关设置
    SELECT时为何要加WITH(NOLOCK)
    Sqlserver2008R2 数据库镜像配置步骤
    读写分离提高 SQL Server 并发性能
    八、数据结构
    七、数据库技术基础(二)
    缓存
    七、数据库技术基础(一)
  • 原文地址:https://www.cnblogs.com/ppzhang/p/13747910.html
Copyright © 2020-2023  润新知