文件操作

主要内容:

1. 初识文件操作
2. 只读(r, rb)
3. 只写(w, wb)
4. 追加(a, ab)
5. r+读写
6. w+写读
7. a+写读(追加写读)
8. 其他操作方法
9. 文件的修改以及另一种打开文件句柄的方式

1. 初识文件操作

使用python来读写文件是非常简单的操作. 我们使用open()函数来打开一个文件, 获取到文件句柄.然后通过文件句柄就可以进行各种各样的操作了.根据打开方式的不同能够执行的操作也会有相应的差异.

打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的是r(只读)模式

2.只读操作(r, rb)

(1)read

将文件中的内容全部读取出来. 弊端: 占内存. 如果文件过大.容易导致内存崩溃.

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
content = f.read()
print(content)
f.close()

(2)readline()

⼀次读取⼀行数据, 注意: readline()结尾, 注意每次读取出来的数据都会有⼀个所以呢. 需要我们使用strip()方法来去掉或者空

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
line1=f.readline().strip()   # 空白: 空格, 	, 

print(line1)      #张无忌
f.close()

(3)readlines()

将每⼀行形成⼀个元素, 放到⼀个列表中. 将所有的内容都读取出来. 所以也是. 容易出现内存崩溃的问题.不推荐使用

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
lst = f.readlines()
print(lst)
for line in lst:
    print(line.strip())
f.close()

(4) 循环读取

# f是一个可迭代对象
f= open("倚天屠龙记",mode="r",encoding="UTF-8")
for line in f:
    print(line.strip())
f.close

(5) read(n) 读取n个字符.

需要注意的是:如果再次读取. 那么会在当前位置继续去读,而不是从头读, 如果使用的是rb模式. 则读取出来的是n个字节

f= open("倚天屠龙记",mode="r",encoding="UTF-8")
content = f.read(2)
print(content)      #张无
f.close()

f= open("倚天屠龙记",mode="rb")
print(f.read(3))
f.close()    #b'xe5xbcxa0'

2. 只写(w, wb)

写的时候注意. 如果没有文件. 则会创建文件, 如果文件存在. 则将原件中原来的内容删除, 再写入新内容

f = open("write", mode="w", encoding="utf-8")
f.write("周笔畅
") # 写的时候. 先清空. 再写入. w
f.write("胡辣汤
")
f.write("实付款
")
f.flush()
f.close()

f= open("倚天屠龙记",mode="w",encoding="UTF-8")
f.write("金毛狮王")
f.flush()
f.close()               #金毛狮王

f= open("倚天屠龙记",mode="w",encoding="UTF-8")
f.write("金毛狮王")
f.read()          #UnsupportedOperation: not readable       模式是w. 不不可以执⾏行行读操作
f.flush()
f.close()

wb模式下. 可以不指定打开文件的编码. 但是在写文件的时候必须将字符串转化成utf-8的 bytes数据

f= open("倚天屠龙记",mode="wb")
f.write("金毛狮王".encode("utf-8"))
f.flush()
f.close()

4. 追加(a, ab)

f = open("倚天屠龙记", mode="a", encoding="utf-8")
f.write("俞岱岩
") # 追加写
f.write("陈友谅
")
f.flush()
f.close()

5. r+读写

对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进行写入. 我们以后使用频率最高的模式就是r+

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
content = f.read()
f.write("光明左使杨逍")
print(content)
f.flush()
f.close()

错误方式:

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
f.write("光明左使杨逍")
content = f.read()
print(content)
f.flush()
f.close()                          #将开头内容改为"光明左使杨逍'再往后读

所以记住: r+模式下. 必须是先读取. 然后再写入

6. w+写读

先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常用

f = open("倚天屠龙记", mode="w+", encoding="utf-8")
f.write("光明左使杨逍")
print(f.read())
f.flush()
f.close()

先读不就好了了么? 错. w+ 模式下, ⼀开始读取不到数据. 然后写的时候再将原来的内容清空,所以极少用

7.a+写读(追加写读)

f = open("倚天屠龙记", mode="a+", encoding="utf-8")
f.write("光明左使杨逍")
# f.seek(0)
print(f.read())
f.flush()
f.close()

a+模式下, 不论先读还是后读. 都是读取不到数据的. 但是移动光标就可以

8. 其他操作方法

(1)seek(n)

光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中⽂文部分要是3的倍数.
通常我们使用seek都是移动到开头或者结尾. 移动到开头: seek(0) 移动到结尾: seek(0,2)
seek的第⼆个参数表示的是从哪个位置进行偏移, 默认是0, 表示开头, 1表示当前位置, 2表示结尾

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
f.write("白眉鹰王殷天正青翼蝠王韦一笑")
f.seek(0)      #光标移动到开头
print(f.read())      #读取内容,此时光标移动到结尾
f.seek(0)             #将光标移至开头
f.seek(0,2)           #将光标移至结尾
print(f.read())       #读取内容,什么都没有
f.seek(0)             #移动到开头
f.write("朱元璋")     #写入信息,此时光标在
print(f.tell())        #此时光标位置9
f.flush()
f.close()

(2). tell()

使用tell()可以帮我们获取到当前光标在什么位置

(3). truncate() 截断文件

f = open("倚天屠龙记", mode="r+", encoding="utf-8")
f.seek(3)
f.truncate(12) # 如果没有参数. 按照光标来阶段. 如果有参数. 截断到参数位置
f.flush()
f.close()

9. 文件的修改以及另一种打开文件句柄的方式

文件修改: 只能将文件中的内容读取到内存中, 将信息修改完毕, 然后将源文件删除, 将新文件的名字改成老⽂文件的名字.

import os # 引入os模块

with open("alex", mode="r", encoding="utf-8") as f1, 
     open("alex_副本", mode="w", encoding="utf-8") as f2:

    for line in f1:
        new_line = line.replace("good", "ok")
        f2.write(new_line)

os.remove("alex")
os.rename("alex_副本", "alex")

弊端: 一次将所有内容进行读取. 内存溢出. 解决方案: ⼀行⼀行的读取和操作

另外:关于文件拷贝

f1 = open("G:/路飞01.png", mode="rb")
f2 = open("E:/路飞02.png", mode="wb")
for line in f1:
    f2.write(line)
f1.close()
f2.flush()
f2.close()

Homework

1.有如下文件，a1.txt，里面的内容为：

老男孩是最好的培训机构，
全心全意为学生服务，
只为学生未来，不为牟利。

我说的都是真的。哈哈

分别完成以下的功能：

a,将原文件全部读出来并打印。

b,在原文件后面追加一行内容：信不信由你，反正我信了。

c,将原文件全部读出来，并在后面添加一行内容：信不信由你，反正我信了。

d,将原文件全部清空，换成下面的内容：

每天坚持一点，
每天努力一点，
每天多思考一点，
慢慢你会发现，

你的进步越来越大。

e,将原文件内容全部读取出来，并在‘我说的都是真的。哈哈’这一行的前面加一行，‘你们就信吧~’然后将更改之后的新内容，写入到一个新文件：a1.txt。

1.
with open("a1",mode ="r",encoding="utf-8") as f:
    for line in f:
        print(line.strip())

with open("a1",mode ="a",encoding="utf-8") as f:
    f.write("信不信由你，反正我信了")

with open("a1",mode ="r+",encoding="utf-8") as f:
    f.write("信不信由你，反正我信了")
    for line in f:
        print(line.strip())

with open("a1",mode ="w",encoding="utf-8") as f:
    f.write("""每天坚持一点，
每天努力一点，
每天多思考一点，
慢慢你会发现，
你的进步越来越大。
""")

import os # 引入os模块
#
with open("a1",mode ="r",encoding="utf-8") as f1,
    open("a1_副本",mode="a",encoding="utf-8" ) as f2:
    # line1 = f1.readline()
    # f2.write(line1)
    # line2 = f1.readline()
    # f2.write(line2)
    # line3 = f1.readline()
    # f2.write(line3)
    #
    # f2.write("你们就信吧
")
    # line4 = f1.readline()
    # f2.write(line4)
    cont = 0
    for i in f1:
        if cont ==3:
            f2.write("你们就信吧
")
        f2.write(i)
        cont+=1
os.remove("a1")
os.rename("a1_副本", "a1")

2.有如下文件，t1.txt,里面的内容为：

葫芦娃，葫芦娃，
一根藤上七个瓜
风吹雨打，都不怕，
啦啦啦啦。
我可以算命，而且算的特别准:

上面的内容你肯定是心里默唱出来的，对不对？哈哈

分别完成下面的功能：

a,以r+的模式打开原文件，判断原文件是否可读，是否可写。
b,以r的模式打开原文件，利用for循环遍历文件句柄。
c,以r的模式打开原文件，以readlines()方法读取出来，并循环遍历 readlines(),并分析b,与c 有什么区别？深入理解文件句柄与 readlines()结果的区别。
d,以r模式读取‘葫芦娃，’前四个字符。
e,以r模式读取第一行内容，并去除此行前后的空格，制表符，换行符。
f,以r模式打开文件，从‘风吹雨打.....’开始读取，一直读到最后。
g,以a+模式打开文件，先追加一行：‘老男孩教育’然后在从最开始将原内容全部读取出来。
h,截断原文件，留下内容：‘葫芦娃’

# with open("t1",mode ="r+",encoding="utf-8") as f:
#     for line in f:
#         print(line.strip())
#     f.write("你说的对")

# with open("t1",mode ="r",encoding="utf-8") as f:
#     for line in f:
#        print(line.strip())

# with open("t1",mode ="r",encoding="utf-8") as f:
#     lst = f.readlines()
#     print(lst)

# with open("t1",mode ="r",encoding="utf-8") as f:
#     print(f.read(4))

# with open("t1",mode ="r",encoding="utf-8") as f:
#     print(f.readline().strip())

# with open("t1",mode ="r",encoding="utf-8") as f:
#     lst = f.readlines()
#     for i in range(2,len(lst)):
#         print(lst[i].strip())
# 先用readline在for循环
# with open("t1",mode ="a+",encoding="utf-8") as f:
#     f.write("老男孩儿教育")
#     f.seek(0)
#     for line in f:
#         print(line.strip())

# with open("t1",mode ="r+",encoding="utf-8") as f:
#     f.seek(9)
#     f.truncate()
##   f.truncate(9)

3.文件a.txt内容：每一行内容分别为商品名字，价钱，个数。

apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3

chicken 10 3

通过代码，将其构建成这种数据类型：[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。

lis=[]
with open("a",mode ="r",encoding="utf-8") as f:
    for line in f :
        lst = line .strip().split(" ")
        dic ={"name":lst[0],"price":lst[1],"amount":lst[2],}
        lis.append(dic)
sum =0
for i in range(len(lis)):
    sum+=int(lis[i]["price"])*int(lis[i]["price"])
print(sum)

4，有如下文件：

tony是创建人。
tony其实是人妖。
谁说tony是sb？

你们真逗，tony再牛逼，也掩饰不住资深屌丝的气质。

将文件中所有的tony都替换成大写的SB（文件的改的操作）

import os
with open("4t",mode ="r",encoding="utf-8") as f1,
     open("4t_副本", mode="w", encoding="utf-8") as f2:
    for line in f1:
        new_line= line.replace("tony","SB")
        f2.write(new_line)
os.remove("4t")
os.rename("4t_副本", "4t")

5.文件a1.txt内容(升级题)

name:apple price:10 amount:3 year:2012
name:tesla price:100000 amount:1 year:2013

.......

通过代码，将其构建成这种数据类型：
[{'name':'apple','price':10,'amount':3},
{'name':'tesla','price':1000000,'amount':1}......]
并计算出总价钱。

lis=[]
with open("5t",mode ="r",encoding="utf-8") as f:
    for line in f :
        lst1 = line .strip().split(" ")
        # print(lst1)
        dic = {}
        for i in range(0,3):
            [k,v]=lst1[i].split(":")
            dic.setdefault(k, v)
        print(dic)
        lis.append(dic)
print(lis)
sum =0
for i in range(len(lis)):
    sum+=int(lis[i]["price"])*int(lis[i]["price"])
print(sum)

5，文件a1.txt内容(升级题)

序号部门人数平均年龄备注

1       python    30         26         单身狗
2       Linux     26         30         没对象
3       运营部     20         24         女生多

.......

通过代码，将其构建成这种数据类型：
[{'序号':'1','部门':Python,'人数':30,'平均年龄':26,'备注':'单身狗'},
......]

result=[]
with open("6t",mode ="r",encoding="utf-8") as f:
    title = f.readline().strip().split(" ")
    # print(title)
    lis1=[]
    lis2=[]
    for i in range(len(title)):
        if title[i]!="":
            lis1.append(title[i])
    print(lis1)
    for line in f:
        lst=line.strip().split(" ")
        for i in range(len(lst)):
            if lst[i] != "":
                lis2.append(lst[i])
        dic = {lis1[0]: lis2[0], lis1[1]: lis1[1], lis1[2]: lis2[2], lis1[3]: lis2[3], lis1[4]: lis2[4]}
        result.append(dic)
print(result)

注意:其实s.split()什么都不写默认是用空白去切

相关阅读:
shell编程：字符串处理方式
 shell编程：变量替换
 export的用法
 docker stack利用secrets启动wordpress
docker swarm创建swarm集群
 docker x509: certificate has expired or is not yet valid
docker-compose的scale的用法
 字符串函数-unquote()函数
 Sass-@each
Sass-@while
原文地址：https://www.cnblogs.com/wcx666/p/9636553.html