在进行数据分析之前,可能需要读写自己的数据文件。或者在完成数据分析之后,想把结果输出到外部的文件
在Python中,利用pandas模块中的几个函数,可以轻松实现这些功能,利用pandas读取文件之后数据的格式为数据框,且如果想用pandas将数据输出为外部文件,也要先确保要输出的文件的格式为数据框
注意因为这里演示了文件的操作,需要将文件上传到网站的数据文件目录下才可以成功运行程序
import pandas as pd #首先导入pandas库 as pd是将这个库缩写 之后调用这个库 只需要写pd就可以了 而不用写全称pandas
10.1 读取txt文件
以空格分隔的txt文件
import pandas as pd text=pd.read_table('read_txt.txt',index_col=0,delimiter=' ') # 文件所在的路径是必须输入的 # index_col=0指定第一列为index # delimiter指定了数据间的分隔符,分隔符可以使空格,制表符,;等等 # 这个函数中还有很多参数可以定义 print(text)
(2)第二种方法
#‘r’--只读模式,‘w’--只写模式,注意写模式会把源文件清空 text_file=open('read_txt.txt','r') #是否可读 print(text_file.readable()) #是否可写 print(text_file.writable()) #一次性读取,光标至最末尾 print(text_file.read()) #按行读取,以光标位置开始 print(text_file.readline(),end='') print(text_file.readline(),end='') print(text_file.readline(),end='') #关闭文件 text_file.close()
除了以上方法,也可用with、contextlib都可以打开文件,且自动关闭文件,
readlines()一次性读取文本的所有内容,结果是一个list with open(file) as f: for line in f.readlines(): print line 这种方法读取的文本内容,每行文本末尾都会带一个' '换行符 (可以使用L.rstrip(' ')去掉换行符)