• Pandas学习


    Pandas学习

    视频教程

    DataFrame和Series

    DataFrame

    df = pd.read_csv()

    返回一个DataFrame对象,对象是二维表。

    Series是一维的数据结构

    可以手动指定names=name_list,表示columns叫啥

    这个对象有很多属性

    .index:RangeIndex,读入时,会默认指定行号,从0开始

    .columns:列的名称

    .shape:这个表长啥样,几行几列

    .dtypes:每一列的数据类型

    df.head():查看前数列

    Series

    创建一个Series:

    series = pd.Series([1,'1',2], index = [1, 'b', 3])
    

    series.index和dataframe的index一样,也是总共几个,步长多少

    从DataFrame查询Series

    DataFrame可以看作是有Series组成的字典,可以通过表示行的index访问,也可以通过表示列的columns访问。

    如果查出来的是二维的,那么就是DataFrame,如果是一维的,就是Series。

    查询一行:df.loc[index]

    查询多行:df.loc[index_1:index_2]

    查询一列:df[column_label]

    从DataFrame查询数据

    1. df.loc:根据index和查询,甚至可以写入,常用
    2. df.iloc:
    3. df.where
    4. df.query

    主要是loc[]的使用

    参考:https://blog.csdn.net/weixin_45144170/article/details/106033436

    loc[index/index_list/index_slice, label/label_list/label_slice]
    

    条件表达式的查询

    df.loc[expr, label_slice]

    df['label'] > 0返回一个bool类型的Series,index和原dataframe一样,

    可以把这个Series放到loc[]里,挑选出符合条件的行们。

    杂接口

    df.set_index()

    df默认index时是0开始,我们可以把index设置为某个column的值,然后再把这个列删掉。

    参考: https://blog.csdn.net/lisnyuan/article/details/107086094

  • 相关阅读:
    冲刺第二阶段第五天
    找水王2
    冲刺第二阶段第四天
    梦断代码阅读笔记03
    冲刺第二阶段第三天
    冲刺第二阶段第二天
    冲刺第二阶段第一天
    梦断代码阅读笔记02
    第十二周学习进度条
    找水王
  • 原文地址:https://www.cnblogs.com/ticlab/p/15388054.html
Copyright © 2020-2023  润新知