首先建立test.csv原始数据,内容如下
时间,地点
一月,北京
二月,上海
三月,广东
四月,深圳
五月,河南
六月,郑州
七月,新密
八月,大连
九月,盘锦
十月,沈阳
十一月,武汉
十二月,南京
导出pandas
import pandas as pd
csv=pd.read_csv('test.csv') print(len(csv)) #结果是12,证明length是csv的行数
参数sep:str, default ‘,’ 指定分隔符。如果不指定参数,默认使用逗号分隔。
usecols : array-like, default None 返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。
csv1=pd.read_csv('test.csv',sep=',',usecols=[0,1])
上述代码输出结果
时间 地点 0 一月 北京 1 二月 上海 2 三月 广东 3 四月 深圳 4 五月 河南 5 六月 郑州 6 七月 新密 7 八月 大连 8 九月 盘锦 9 十月 沈阳 10 十一月 武汉 11 十二月 南京
csv2=pd.read_csv('test.csv',sep=',',usecols=[0])
上述代码输出结果
时间 0 一月 1 二月 2 三月 3 四月 4 五月 5 六月 6 七月 7 八月 8 九月 9 十月 10 十一月 11 十二月
csv=pd.read_csv('test.csv',sep=',',usecols=[0,1])
print(csv[0:1])
print('--------------')
print(csv[1:3])
上述代码输出结果
时间 地点
0 一月 北京
--------------
时间 地点
1 二月 上海
2 三月 广东
可见pandas将第一行数据当作表头,不算做正式数据里。方括号里的两个数字表示从第几行到第几行
print(csv[0:2]['时间'])
上述代码运行结果
0 一月 1 二月 Name: 时间, dtype: object
print(csv[0:2]['时间'].values[0])
上述代码运行结果
一月
可以看出从方括号里引用的某几行数据可以根据表头单独输出,并可以选择特定一行的值输出