• python的pandas库读取csv


    首先建立test.csv原始数据,内容如下

    时间,地点
    一月,北京
    二月,上海
    三月,广东
    四月,深圳
    五月,河南
    六月,郑州
    七月,新密
    八月,大连
    九月,盘锦
    十月,沈阳
    十一月,武汉
    十二月,南京

    导出pandas

    import pandas as pd
    csv=pd.read_csv('test.csv')
    print(len(csv))  #结果是12,证明length是csv的行数

    参数sep:str, default ‘,’ 指定分隔符。如果不指定参数,默认使用逗号分隔。

    usecols : array-like, default None 返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。

    csv1=pd.read_csv('test.csv',sep=',',usecols=[0,1])

    上述代码输出结果

         时间  地点
    0    一月  北京
    1    二月  上海
    2    三月  广东
    3    四月  深圳
    4    五月  河南
    5    六月  郑州
    6    七月  新密
    7    八月  大连
    8    九月  盘锦
    9    十月  沈阳
    10  十一月  武汉
    11  十二月  南京
    csv2=pd.read_csv('test.csv',sep=',',usecols=[0])

    上述代码输出结果

         时间
    0    一月
    1    二月
    2    三月
    3    四月
    4    五月
    5    六月
    6    七月
    7    八月
    8    九月
    9    十月
    10  十一月
    11  十二月

    csv=pd.read_csv('test.csv',sep=',',usecols=[0,1])
    print(csv[0:1])
    print('--------------')
    print(csv[1:3])

    上述代码输出结果

    时间 地点
    0 一月 北京
    --------------
    时间 地点
    1 二月 上海
    2 三月 广东

    可见pandas将第一行数据当作表头,不算做正式数据里。方括号里的两个数字表示从第几行到第几行

    print(csv[0:2]['时间'])

    上述代码运行结果

    0    一月
    1    二月
    Name: 时间, dtype: object
    print(csv[0:2]['时间'].values[0])

    上述代码运行结果

    一月

    可以看出从方括号里引用的某几行数据可以根据表头单独输出,并可以选择特定一行的值输出

     

  • 相关阅读:
    IPC机制key值的各位组成
    ctrl+c,ctrl+d,ctrl+z在linux中意义
    Linux x86_64与i386区别之 —— 内存寻址
    readdir_r()读取目录内容
    memmove和memcpy
    sscanf的应用
    获取CPU频率
    盘点十个超级实用的 JS 特性
    Java 类在 Tomcat 中是如何加载的?
    Java 类在 Tomcat 中是如何加载的?
  • 原文地址:https://www.cnblogs.com/roadwide/p/10293040.html
Copyright © 2020-2023  润新知