python 10：文件基本操作

文件处理

文件处理

1.什么是文件，为什么要用文件？

文件是操作系统提供给用户或应用程序操作硬盘的一种虚拟的概念。

用户和应用程序可以通过文件将数据永久保存在硬盘中。操作文件就是操作硬盘。

2.如何用文件：open（）

open的模式1：控制文件读写内容，t 和 b，必须配合r a w使用。

t 文本模式（默认模式）

1.读写都以str为单位

2.必须是文本文件

3.必须指定encoding(不指定的会使用系统默认的编码)

b 二进制模式（bytes）

open的模式1：控制文件读写的模式

3.文件操作的基本流程

1.打开文件：open（‘文件路径’）

绝对路径：完整的路径，从磁盘开始，一层层的写

相对路径：相对于当前程序所在的文件夹为起始开始找

with as 的用法

with open(r'C:UsersAdministratorAppDataLocalTemp3.py111',mode='rt',encoding='utf_8') as f :
    res=f.read()
    print(res)

2、操作文件：读/写文件，应用程序对文件的读写请求都是在向操作系统发送系统调用，然后由操作系统控制硬盘把输入读入内存、或者写入硬盘。

3.关闭文件：.close( )

.close() # 回收操作系统资源
.read() # 变量f存在，但是不能再读了

del f # 回收应用程序资源

4.文件操作模式详解

以t模式为基础的操作：

r（默认操作模式）：只读模式，全部读取，有多少读多少。当文件存在时文件指针跳到开始位置。

with open('c.txt',mode='rt',encoding='utf-8') as f:
    print('第一次读'.center(50,'*'))
    res=f.read() # 把所有内容从硬盘读入内存
    print(res)

===============案例==================
inp_username=input('your name>>: ').strip()
inp_password=input('your password>>: ').strip()

# 验证
with open('user.txt',mode='rt',encoding='utf-8') as f:
    for line in f:
        # print(line,end='') # egon:123

        username,password=line.strip().split(':')
        if inp_username == username and inp_password == password:
            print('login successfull')
            break
    else:
        print('账号或密码错误')

2、w：只写模式，当文件不存在时会创建空文件，当文件存在会清空文件，指针位于开始位置,不能读。

with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.read() # 报错，不可读
    f.write('擦勒
')

强调1：
在以w模式打开文件没有关闭的情况下，连续写入，新的内容总是跟在旧的之后

with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒1
')
    f.write('擦勒2
')
    f.write('擦勒3
')

强调2：
如果重新以w模式打开文件，则会清空文件内容

with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒1
')
with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒2
')
with open('d.txt',mode='wt',encoding='utf-8') as f:
    f.write('擦勒3
')

3、a：只追加写，在文件不存在时会创建空文档，在文件存在时文件指针会直接调到末尾

with open('e.txt',mode='at',encoding='utf-8') as f:
    # f.read() # 报错，不能读
    f.write('擦嘞1
')
    f.write('擦嘞2
')
    f.write('擦嘞3
')

强调 w 模式与 a 模式的异同：
1 相同点：在打开的文件不关闭的情况下，连续的写入，新写的内容总会跟在前写的内容之后
2 不同点：以 a 模式重新打开文件，不会清空原文件内容，会将文件指针直接移动到文件末尾，新写的内容永远写在最后
案例：a模式用来在原有的文件内存的基础之上写入新的内容，比如记录日志、注册
注册功能

name=input('your name>>: ')
pwd=input('your name>>: ')
with open('db.txt',mode='at',encoding='utf-8') as f:
    f.write('{}:{}
'.format(name,pwd))

了解：+不能单独使用，必须配合r、w、a

with open('g.txt',mode='rt+',encoding='utf-8') as f:
    print(f.read())
    f.write('中国')

with open('g.txt',mode='w+t',encoding='utf-8') as f:
    f.write('111
')
    f.write('222
')
    f.write('333
')
    print('====>',f.read())


with open('g.txt',mode='a+t',encoding='utf-8') as f:
    print(f.read())
    f.write('444
')
    f.write('5555
')
    print(f.read())

5 文件高级处理

b模式：更通用的模式,针对所有类型的文件

硬盘的二进制不做任何转换直接读入内存，python不显示二进制（太长了）
python会把内存的二进制处理成bytes（16进制）类型显示输出，英文显示原字母。只是显示，本质还是二进制不变。
必须不能指定encoding

mode=‘rb’：只读

with open (r'C:UsersAdministratorDesktop111.txt',mode='rb') as f:
    res=f.read()
    print(res,type(res))
    print(res.decode('utf-8'))#指定解码类型将二进制数解码成uft8输出
    结果：
    b'xe9x98xbfxe5x87xa1xe8xbexbeaaaa' <class 'bytes'>
	阿凡达aaaa

mode=‘wb’：只写

 with open('a.txt',mode='wb') as f:
     msg="你好"
     res=msg.encode('utf-8') # res为bytes类型
     f.write(res) # 在b模式下写入文件的只能是bytes类型

补充：文件拷贝

方式一：while循环读文件（可以指定一次读取的字节）

with open('a.txt',mode='wb') as f1:
    with open('a.txt',mode='wb') as f2:
    while=1:
        res=f.read(1024)#不规定字节的话一次全部读取文件的全部内容，可能导致占用太多内存计算机卡死。
        f2=write(res)
        if len (res)==0:
            break

方式二：for循环读文件（只能一次读一行）如果一行有太多字节也能导致占用太多内存计算机卡死。

with open('a.txt',mode='wb') as f:
    for line in f:#for循环默认换行符为分割符
        res=line.read()
        f2=write(res)

6 文件操作方法

读相关操作：

f.read() # 读取所有内容,执行完该操作后，文件指针会移动到文件末尾

f.readline() # 读取一行内容,光标移动到第二行首部
f.readlines() # 读取每一行内容,存放于列表中

写相关操作：

f.write('1111
222
')  # 针对文本模式的写,需要自己写换行符
f.write('1111
222
'.encode('utf-8'))  # 针对b模式的写,需要自己写换行符
f.writelines(['333
','444
'])  # 文件模式
f.writelines([bytes('333
',encoding='utf-8'),'444
'.encode('utf-8')]) #b模式

补充：bytes类型的使用

如果是纯英文

如果是汉字

f.flush：立即写入硬盘

f.write()一般是攒够一波再写

f.readable()  # 文件是否可读
f.writable()  # 文件是否可读
f.closed  # 文件是否关闭
f.encoding  # 如果文件打开模式为b,则没有该属性
f.flush()  # 立刻将文件内容从内存刷到硬盘
f.name

7 控制指针移动

大前提:文件内指针的移动都是Bytes为单位的,唯一例外的是t模式下read(n),n以字符为单位

# 之前文件内指针的移动都是由读/写操作而被动触发的，若想读取文件某一特定位置的数据，则则需要用f.seek方法主动控制文件内指针的移动，详细用法如下：
# f.seek(指针移动的字节数,模式控制): 如果移到末尾了就不能再往后移动了，指针只会停在末尾。
# 模式控制:
# 0: 默认的模式,该模式代表指针移动的字节数是以文件开头为参照的
# 1: 该模式代表指针移动的字节数是以当前所在的位置为参照的
# 2: 该模式代表指针移动的字节数是以文件末尾的位置为参照的

*强调:其中0模式可以在t或者b模式使用,而1跟2模式只能在b模式下用*

8.文件修改两种方式

修改硬件中文件的的方式只有一个就是：覆盖

基于w模式修改
实现思路：将文件内容发一次性全部读入内存,然后在内存中修改完毕后再覆盖写回原文件
优点: 在文件修改过程中同一份数据只有一份，一般用于文本格式
缺点: 会过多地占用内存
```
with open('c.txt',mode='rt',encoding='utf-8') as f:
    res=f.read()
    data=res.replace('alex','dsb')
    print(data)

with open('c.txt',mode='wt',encoding='utf-8') as f1:
    f1.write(data)
```
基于import os
实现思路：以读的方式打开原文件,以写的方式打开一个临时文件,一行行读取原文件内容,修改完
后写入临时文件...,删掉原文件,将临时文件重命名原文件名
优点: 不会占用过多的内存
缺点: 在文件修改过程中同一份数据存了两份，过多的占用硬盘
```
with open('c.txt', mode='rt', encoding='utf-8') as f, 
        open('.c.txt.swap', mode='wt', encoding='utf-8') as f1:
    for line in f:
        f1.write(line.replace('alex', 'dsb'))

os.remove('c.txt')
os.rename('.c.txt.swap', 'c.txt')
```

习题：

1，文件copy工具实现

with open (r'1.txt',mode='rb') as f1:
    with open(r'2.txt',mode='wb' as f2:
        for line in f1:
            res=line.read()
            f2.write(res)

2，基于seek控制指针移动，测试r+、w+、a+模式下的读写内容

with open (r'1.txt',mode='rb+') as f1:
    f1.seek(-4,2)
    f1.write('egon')
    res=f1.read()
    print(res)
with open (r'1.txt',mode='w+b') as f1:
    f1.write('egon')
    f1.seek(-4,2)
    res=f1.read()
    print(res)
with open (r'1.txt',mode='wb+') as f1:
    f1.write('egon')
    f1.seek(-4,2)
    res=f1.read()
    print(res)

3、tail -f access.log 程序实现

with open('1.txt') as f:
    f.seek(0,2)
        line = f.readline()
        print(line)

相关阅读:
11.01T3 实数二分
 11.01T2 树状数组维护动态LIS
11.1T1打表
 10.31T4 HAOI2010最长公共子序列计数+容斥原理
 10.31T3 其他算法思想
 10.31T2 点双联通分量+预处理前缀+二分答案
 10.31T1 二分图
 10.30T3 换根
 10.30T2 二分+前缀和（后缀和）
10.30T1 期望DP
原文地址：https://www.cnblogs.com/Franciszw/p/12487212.html