一、文件处理流程
1.打开文件,得到文件句柄并赋值给一个变量
2.通过句柄对文件进行操作
3.关闭文件
r模式,默认模式,文件不存在则报错
w模式,文件不存在则创建,文件存在则覆盖
a模式,文件不存在则创建,文件存在则不会覆盖,写内容会以追加的方式写(写日志文件的时候常用),追加模式是一种特殊的写模式
b(rb,wb,ab)模式:不用加encoding:utf-8
1 f=open('c.txt','rb') 2 # print(f.read()) 3 print(f.read().decode()) 4 5 f=open('d.txt','wb') 6 f.write('啦啦啦'.encode('utf-8')) 7 f.close()
二、基本操作
1.文件打开模式
文件句柄=open('文件路径',‘模式’)
打开文件时,需要指定文件路径和以什么方式打开文件。
打开文件的模式有:
- r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
- w,只写模式【不可读;不存在则创建;存在则清空内容】
- x, 只写模式【不可读;不存在则创建,存在则报错】
- a, 追加模式【可读; 不存在则创建;存在则只追加内容】
# #只读模式
# f=open(r'c.txt',encoding='utf-8')
# # print('====>1',f.read())
# # print('====>2',f.read())
# # print(f.readable())
# # print(f.readline(),end='')
# # print(f.readline())
# # print("="*20)
# # print(f.read())
# print(f.readlines())
# f.close()
#写模式:文件不存在则创建,文件存在则覆盖原有的
# f=open("new.py",'w',encoding='utf-8')
# f.write('1111111111
')
# f.writelines(['2222
','2222548
','978646
'])
# f.close()
# 追加模式:文件不存在则创建,文件存在不会覆盖,写内容是追加的方式写
# f=open('new.py','a',encoding='utf-8')
# f.write('nishishui
')
# f.writelines(['aa
','bb
'])
# f.close()
"+" 表示可以同时读写某个文件
- r+, 读写【可读,可写】
- w+,写读【可读,可写】
- x+ ,写读【可读,可写】
- a+, 写读【可读,可写】
"b"表示以字节的方式操作
- rb 或 r+b
- wb 或 w+b
- xb 或 w+b
- ab 或 a+b
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
练习,利用b模式,编写一个cp工具,要求如下:
1. 既可以拷贝文本又可以拷贝视频,图片等文件
# b模式
f=open('1.jpg','rb')
data=f.read()
# print(data)
f=open('2.jpg','wb')
f.write(data)
print(data)
三、上下文管理
1. with open('a.txt','w') as f:
pass
2.with open('a.txt','r') as read_f,open('b.txt','w') as write_f:
data=read_f.read()
write_f.write(data)
四、文件的修改
import os
with open('a.txt','r',encoding='utf-8') as read_f,
open('a.txt.swap','w',encoding='utf-8') as write_f:
for line in read_f:
write_f.write(line)
os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')
五、文件内光标移动
一: read(3):
1. 文件打开方式为文本模式时,代表读取3个字符
2. 文件打开方式为b模式时,代表读取3个字节
二: 其余的文件内光标移动都是以字节为单位如seek,tell,truncate
注意:
1. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的
seek控制光标的移动,是以文件开头作为参照的。
tell当前光标的位置
2. truncate是截断文件,截断必须是写模式,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果
import time
with open('test.txt','rb') as f:
f.seek(0,2)
while True:
line=f.readline()
if line:
print(line.decode('utf-8'))
else:
time.sleep(0.2)
# #只读模式 # f=open(r'c.txt',encoding='utf-8') # # print('====>1',f.read()) # # print('====>2',f.read()) # # print(f.readable()) # # print(f.readline(),end='') # # print(f.readline()) # # print("="*20) # # print(f.read()) # print(f.readlines()) # f.close() #写模式:文件不存在则创建,文件存在则覆盖原有的 # f=open("new.py",'w',encoding='utf-8') # f.write('1111111111 ') # f.writelines(['2222 ','2222548 ','978646 ']) # f.close() # 追加模式:文件不存在则创建,文件存在不会覆盖,写内容是追加的方式写 # f=open('new.py','a',encoding='utf-8') # f.write('nishishui ') # f.writelines(['aa ','bb ']) # f.close()