一、x模式(控制文件操作模式,与rwa同级)
1 特点
创建不存在文件,文件存在则报错
可写不可读
2 格式
with open('d.txt',mode='x',encoding='utf-8') as f:
f.write('哈哈哈
')
#d文件存在则报错,不存在则创建并写入哈哈哈
二、b模式(控制文件读写内容的模式,与t同级)
1.b模式和t模式的区别
t模式:
- 读写都必须是以字符串(uncode)为单位
- 只能针对文本文件
- 必须指定字符编码,即必须指定encoding参数
- 硬盘的二进制读入内存-》t模式会直接把内存中的二进制encode解码
b模式(binary):
- 读写都是以bytes为单位
- 可以针对所有文件
- 一定不能指定字符编码,即一定不能指定encoding参数
- 硬盘中的二进制读入内存-》b模式下不会做任何操作,直接读入内存
总结:在操作纯文本文件方面t模式帮我们省去了编码与解码的环节,b模式则需要手动编码和解码,所以t在纯文本的操作上更方便。非纯文本文件只能用b模式
2 b模式应用
with open("a.txt","rb") as f :
print(f.read().decode("utf-8"))
#在b模式下如果想读文本文件,必须要以源文件存的方式解码,如果没有这一步操作输出的是一个bytes类型
#同理,在写文件的时候,就要以文件同样格式去编码
with open(r"cvc.txt","wb") as f :
f.write("aaaa".encode("utf-8"))
3 循环读取文件
方式一:自己控制每次读取的数据的数据量(while)
with open(r"cvc.txt","rb") as f :
while True:
res = f.read(5)#控制每次只读5个字节的数据
print(res)
if len(res) == 0:
break
方式二:每次读一行(for)
with open(r"cvc.txt","rb") as f :
for line in f:
print(line)
三、文件操作的其他方法
1 读相关操作
1.1readline:一次读一行
with open(r"cvc.txt","rt",encoding="utf-8") as f :
res = f.readline()
print(res)
1.2readlines:把文件内容存放到列表内,以换行符分隔
with open(r"cvc.txt","rt",encoding="utf-8") as f :
res = f.readlines()
print(res)
>>>['aaaa
', '12321
', '123123
', '123123
', '12321
', '213312
', '123
', '123']
强调:read和readlines都是将文件所有的内容读到内存中,如果文件过大,容易内存溢出
2 写相关操作
2.1writelines:readlines的反操作,把列表中的数据写到文件中
with open(r"cvc.txt","wt",encoding="utf-8") as f :
f.writelines(["aaa","BBB"])#不能写数字
补充1:b模式下,如果是纯英文和数字可以在前面加b前缀得到bytes类型
l = [
b'1111aaa1
',
b'222bb2',
b'33eee33'
]
l = [
'1111aaa1
'.encode('utf-8'),
'222bb2'.encode('utf-8'),
'33eee33'.encode('utf-8')
]
#这两者效果相同
补充2:'上'.encode('utf-8') 等同于bytes('上',encoding='utf-8')
3 flsh刷新
with open('h.txt', mode='wt',encoding='utf-8') as f:
f.write('哈')
f.flush()
#操作系统在把应用程序的数据写入文件时不是瞬时的,需要攒到一定量再执行,flush可以忽略这个设定直接执行。
4 了解
with open('h.txt', mode='wt',encoding='utf-8') as f:
print(f.readable())#判断文件是否可读
print(f.writable())#判断文件是否可写
print(f.encoding)#读取文件存放的字符编码
print(f.name)#读取文件名称
print(f.closed)#判断文件是否关闭
>>>False
>>>True
>>>utf-8
>>>h.txt
>>>True
四、文件高级操作:控制文件指针的移动
前提:文件指针移动的单位是bytes
只有一种情况下特殊,t模式我们读取文件时,获得的是字符串,所以这个时候指针移动的单位是字符
with open('aaa.txt',mode='rt',encoding='utf-8') as f:
res=f.read(4)
print(res)
f.seek(n,模式)n代表的是移动的字节数
1 模式0:参照物是文件开头
with open(r"cvc.txt","rb") as f :
f.seek(5,0)#从开头把光标移动到底5个字节处
f.seek(111,0)#从开头把光标移动到第111字节处,如果没有这么多,就移到最后一个
2 模式1:参照物是光标当前所在位置
with open(r"cvc.txt","rb") as f :
f.seek(3,1)#在第三个字节处
f.seek(1,1)#在第四个字节处
3 模式2:参照物是文件末尾,应该是倒着移动的n为负数
with open(r"cvc.txt","rb") as f :
f.seek(-1,2)#在文件倒数第一个字节处
f.seek(-2,2)#在文件倒数第二个字节处
强调 0模式可以在t模式下使用,1,2模式只能在b模式下使用
4 tell获取文件当前光标所在位置
with open(r"cvc.txt","rb") as f :
f.seek(-1,2)
f.seek(-2,2)
res = f.tell()
print(res)
>>>3
五、文件修改
强调
- 硬盘空间是无法修改的,硬盘中的数据的更新都是用新的值取覆盖旧的值
- 内存中的数据是可以修改的
# 文件a.txt内容如下
张一蛋 山东 179 49 12344234523
李二蛋 河北 163 57 13913453521
王全蛋 山西 153 62 18651433422
# 执行操作
with open('a.txt',mode='r+t',encoding='utf-8') as f:
f.seek(9)
f.write('<妇女主任>')
# 文件修改后的内容如下
张一蛋<妇女主任> 179 49 12344234523
李二蛋 河北 163 57 13913453521
王全蛋 山西 153 62 18651433422
因此如果需要修改文件,只能把文件的数据从硬盘读到内存中,然后在内存中修改最后覆盖源文件
方式一
#实现思路:讲文件的内容一次性全部读入内存中,然后再内存中修改,最后覆盖原文件
#优点:在文件修改的过程中只有一个文件
#缺点:一次性读入内存会过多占用内存空间
with open("b.txt","r",encoding="utf-8") as f :
info = f.read()
with open("b.txt","w",encoding="utf-8") as f1:
f1.write(info.replace("a","b"))
方式二
#实现思路:打开原文件的同时,创建一个临时文件,把原文件的数据一行一行的读入内存,再保存到临时文件,最后把原文件删除,重命名临时文件
#优点:不会占用很多内存空间,同时出现在内存中的数据只有一行
#缺点:文件修改的过程中会出现两个文件
import os
with open("b.txt","r",encoding="utf-8") as f1,
open(".b.txt.swap","w",encoding="utf-8") as f2:
for line in f1:
f2.write(line.replace("b","a"))
os.remove("b.txt")
os.rename(".b.txt.swap","b.txt")