读写文件是指请求操作系统打开一个文件对象 ,然后通过系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。
读文件
文件打开后,使用完毕必须关闭,因为文件对象会占用操作系统资源,并且操作系统同一时间能打开的文件数量是有限的。
Python使用 with
语句来自动帮我们调用 close()
方法:
with open('/path/file', 'r') as fo:
# read()
print(fo.read())
# readline()
for line in readline():
print(line.strip())
# readlines()
for line in readlines():
print(line.strip())
read()
会一次性读取文件的全部内容readline()
可以每次读取一行内容readlines()
一次读取所有内容并按行返回list
字符编码
前面讲的默认都是读取文本文件,并且是UTF-8编码的文本文件。要读取二进制文件,比如图片、视频等等,用'rb'
模式打开文件即可:
f = open('/Users/michael/test.jpg', 'rb')
f.read()
要读取非UTF-8编码的文本文件,需要给open()
函数传入encoding
参数,例如,读取GBK编码的文件:
f = open('/Users/michael/gbk.txt', 'r', encoding='gbk')
f.read()
遇到有些编码不规范的文件,你可能会遇到UnicodeDecodeError
,因为在文本文件中可能夹杂了一些非法编码的字符。遇到这种情况,open()
函数还接收一个errors
参数,表示如果遇到编码错误后如何处理。最简单的方式是直接忽略:
f = open('/Users/michael/gbk.txt', 'r', encoding='gbk', errors='ignore')
写文件
写文件和读文件是一样的,唯一区别是调用open()
函数时,传入标识符'w'
或者'wb'
表示写文本文件或写二进制文件:
f = open('/Users/michael/test.txt', 'w')
f.write('Hello, world!')
f.close()
避免忘记关闭文件,可以使用with
语句来打开
with open('/path/test.txt', 'w') as f:
f.write('Hello, world!')
以'w'
模式写入文件时,如果文件已存在,会直接覆盖(相当于删掉后新写入一个文件),文件不存在,创建文件。
with open('/path/test.txt', 'a') as f:
f.write('Hello, world!')
a
表示以追加的形式写入文件,如果该文件已存在,文件指针将会放在文件的结尾。