文件的高级处理（文件打开模式，控制文件操作方法，控制文件指针移动，文件修改的两种方式）

一、文件的打开模式分类两大类
1、控制文件读写操作的模式
1.1  r：只读(不指定模式下默认的模式)：在文件不存在时则报错，文件存在时文件指针跳到文件开头

f=open('m.txt',mode='rt',encoding='utf-8')
# res = f.read()
print(f.readable())#True
print(f.writable())#False
f.close()

1.2 w：只写:在文件不存在时则创建空文件，文件存在时则清空，文件指针跳到文件开头

f=open('b.txt',mode='wt',encoding='utf-8')
f.write("你好啊哈哈哈
")
f.write("hello1
")
f.write("hello2
")
f.close()

1.3 a：只追加写:在文件不存在时则创建空文件，文件存在时也不会清空，文件指针跳到文件末尾

f=open('c.txt',mode='at',encoding='utf-8')
f.write("jason:777
")#会换行
f.write("jjj:666
")
f.close()

总结：w与a的异同
相同点：在打开了文件不关闭的情况下，连续地写入，新的内容永远跟在老内容之后
不同点：重新打开文件，w会清空老的内容，而a模式会保留老的内容并且指针跳到文件末尾

示范1：注册功能

# 示范1：注册功能
name = input("your name: ").strip()
# 做合法性校验：
# 1、如果输入的用户名包含特殊字符^$&...让用户重新输入
# 2、如果输入的用户名已经存在也重新输入
pwd = input("your password: ").strip()
# 做合法性校验：
# 1、密码长度
# 2、如果密码包含特殊字符则重新输入
f = open('user.txt',mode='at',encoding='utf-8')
f.write('%s:%s
' %(name,pwd))
f.close()

示范2：登录功能

# 示范2：登录功能
inp_name = input("your name: ").strip()
inp_pwd = input("your pwd: ").strip()

f = open('user.txt',mode='rt',encoding='utf-8')
for line in f:
    user,pwd=line.strip('
').split(':')#解压赋值
    if inp_name == user and inp_pwd == pwd:
        print('login successful')
        break
else:
    print('user or password error')

f.close()
# 升级需求1：同一个账号输错三次则退出
# 升级需求2：同一个账号输错三次则，该账号则锁定10秒，即便程序被终止，仍然计时


2、控制文件读写内容的模式
1.1 t（在不指定的情况下默认的模式）：读写都是以str字符串为单位，一定要指定encoding--------只能处理文本文件

f=open('a.txt',mode='rt',encoding='utf-8')
f.read()
f.close()

1.2 b：读写都是以bytes为单位,一定不能指定encoding参数----------可以处理任意文件

#r
f=open('m.txt',mode='rb')
data=f.read()
print(data,type(data))#b'hello
xe4xbdxa0xe5xa5xbd
123

' <class 'bytes'>
print(data.decode('utf-8'))#b模式要解码
f.close()
#w
f=open('m.txt',mode='wb')
f.write("egon".encode('utf-8'))
f.close()

3、 上下文管理with

with open(...) as f,open(...) as f1:
   f.read()

4、案例：编写文件拷贝程序

src_file=input("源文件路径：").strip()
dst_file=input("目标文件路径：").strip()

with open(r'%s' %src_file,mode='rb') as src_fobj,open(r'%s' %dst_file,mode='wb') as dst_fobj:
    # data=src_fobj.read()
    for line in src_fobj:  # line=第二行内容
        dst_fobj.write(line)

5、补充模式

rwa
tb必须和rwa联用
+必须与rwa联用：r+、w+、a+  （r+、w+、a+ 它们都可读可写）

有：
r+t
w+t
a+t
r+b
w+b
a+b

不指定模式，那么默认的是rt
with open('a.txt') as f:#默认rt模式
    pass

with open('a.txt',mode='w+') as f:#默认wt模式
    pass

二、控制文件操作的其他方法
1、读相关方法
　　readline() :读一行，读完一行之后，光标会转到下一行行首，
占用2个字符
　　readlines()：相当于内置了for循环，一行一行读出来，把所有内容读出并且返回列表

with open('a.txt',mode='rt',encoding='utf-8') as f:
    line1=f.readline()
    line2=f.readline()
    line3=f.readline()
    print(line1)
    print(line2)
    print(line3)

    lines=[]
    for line in f:
        lines.append(line)

    lines=f.readlines()#for循环简写为此行
    print(lines)

2、写相关方法

f.write()#一次性写入

f.writelines()#有个可以被for循环的，把所有写出（写出来跟f.write一样，但底层原理不一样

with open('b.txt',mode='wt',encoding='utf-8') as f:
    lines=['111
','222
','333
']
    for line in lines:
        f.write(line)
    # f.writelines(lines)#for循环简写成此行
    f.writelines("hello")

3、其他

f.flush()#实时把数据刷新到硬盘，一般不要用，涉及到安全性

f.name #取的是打开文件的路径

with open(r'a.txt',mode='wt',encoding='utf-8') as f:
    print(f.name) # 取的是打开文件的路径  a.txt
    print(f.closed)#False
    for i in range(100):
        f.write("%s
" %i)
        f.flush()#实时刷新

三、控制文件指针的移动

1、控制文件内指针的移动都是以字节为单位
　　只有一种特殊情况，t模式下的read(n),代表的是n个字符，此外代表的全都是字节

with open('f.txt',mode='rt',encoding='utf-8') as f:
    data=f.read(6) # 6个字符
    print(data)

with open('f.txt',mode='rb') as f:
    # data=f.read(6) # 6个字节
    data=f.read(8) # 8个字节
    print(data.decode('utf-8'))

2、f.seek(n,模式) # n代表的移动的字节个数

模式：
0模式：参照文件的开头开始移动(只有0模式可以在t下使用，1和2模式只能在b下使用)
ps:  f.tell():告诉光标现在所在的位置

with open('f.txt',mode='rt',encoding='utf-8') as f:
    f.seek(5,0)
    print(f.tell())
    print(f.read())
    print(f.tell())
    print('='*100)
    f.seek(0,0)
    print(f.read())

1模式：参照指针当前所在的位置

with open('f.txt',mode='rb') as f:
    f.seek(3,1)
    f.seek(3,1)
    print(f.tell())
    # f.seek(2,1)
    f.seek(5,0)
    print(f.read().decode('utf-8'))

2模式：参照文件末尾的位置

with open('f.txt',mode='rb') as f:
    f.seek(0,2)
    f.seek(-3,2)
    # print(f.tell())
    print(f.read().decode('utf-8'))

ps: a+ f.seek() 指针可以跳到文件末尾

3、案例：模拟程序记录日志的功能

import time

for i in range(10000):
    with open('access.log',mode='at',encoding='utf-8') as f:
        t=time.strftime("%Y-%m-%d %H:%M:%S")
        content="egon给刘老师转了%s个亿" %i

        msg=f"{t} {content}
"
        f.write(msg)
    time.sleep(3)

#time模块介绍

import time

time.strftime("%Y-%m-%d %H:%M:%S")
time.sleep(n) #n代表几秒

4、读取日志程序

#读取日志程序
import time

with open('access.log', mode='rb') as f:
    f.seek(0, 2)

    while True:
        line = f.readline()
        if len(line) == 0:
            # 没有读到内容
            time.sleep(0.5)
        else:
            print(line.decode('utf-8'), end='')

5、了解truncate()

f.truncate(n)从文件开头往后数n个字节保留下来，其余全部删除
f.truncate()从文件开头往后数指针当前所在的位置，其余全部删除

with open('f.txt',mode='ab') as f:
    # f.truncate(3)
    # f.seek(-3,2)
    f.truncate()

6、功能小结

#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,光标移动到第二行首部
f.readlines() #读取每一行内容,存放于列表中

f.write('1111
222
') #针对文本模式的写,需要自己写换行符
f.write('1111
222
'.encode('utf-8')) #针对b模式的写,需要自己写换行符
f.writelines(['333
','444
']) #t模式
f.writelines([bytes('333
',encoding='utf-8'),'444
'.encode('utf-8')]) #b模式

#了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘
f.name #获取打开的文件路径
del f #回收应用程序级的变量

四、文件修改的两种方式

文件对应的是硬盘空间，硬盘都是用新内容覆盖旧内容，没有修改的概念，但是内存是可以修改的

如何修改文件：
思路：把硬盘的内容先读入内存，然后在内存中修改完毕后，再覆盖会硬盘
------------------------------------------------------------------

方式一：
步骤：
1、先将硬盘中文件的内容全部读入内存，然后在内存中修改完毕得到一个修改好的结果
2、将修改的结果覆盖回原文件
优点: 不耗费硬盘
缺点：耗费内存
应用：wps,文本编辑器

with open('a.txt',mode='rt',encoding='utf-8') as f1:
    data=f1.read()
    res=data.replace('lxx','SB')

with open('a.txt',mode='wt',encoding='utf-8') as f2:
    f2.write(res)

方式二：
步骤：
1、循环读取源文件内容，一行行修改一行行写入一个新的临时文件
2、删除源文件
3、将临时文件重命名为源文件名
优点：节省内存
缺点：耗费硬盘空间
应用：针对大文件用

import os
with open('a.txt',mode='rt',encoding='utf-8') as f1,
        open('.a.txt.swp',mode='wt',encoding='utf-8') as f2:
    for line in f1:
        res=line.replace('SB','lxx')
        f2.write(res)

os.remove('a.txt')
os.rename('.a.txt.swp','a.txt')

相关阅读:
撒旦撒旦撒
 的释放的是分
 识别真假搜索引擎（搜索蜘蛛）方法（baidu,google,Msn,sogou,soso等)
[转]Tesseract-OCR (Tesseract的OCR引擎最先由HP实验室于1985年开始研发)
使用SQLMAP对网站和数据库进行SQL注入攻击
 Kali Linux 安装教程-转
 【教程】如何修改路由表？
基于comet服务器推送技术(web实时聊天)
Ghost硬盘对拷
 Web 通信之长连接、长轮询（long polling）
原文地址：https://www.cnblogs.com/guojieying/p/13323604.html