主要内容:
- 1. 初识文件操作
- 2. 只读(r, rb)
- 3. 只写(w, wb)
- 4. 追加(a, ab)
- 5. r+读写
- 6. w+写读
- 7. a+写读(追加写读)
- 8. 其他操作方法
- 9. 文件的修改以及另一种打开文件句柄的方式
1. 初识文件操作
使用python来读写文件是非常简单的操作. 我们使用open()函数来打开一个文件, 获取到文件句柄.然后通过文件句柄就可以进行各种各样的操作了.根据打开方式的不同能够执行的操作也会有相应的差异.
打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的是r(只读)模式
2.只读操作(r, rb)
(1)read
将文件中的内容全部读取出来. 弊端: 占内存. 如果文件过大.容易导致内存崩溃.
f= open("倚天屠龙记",mode="r",encoding="UTF-8") content = f.read() print(content) f.close()
(2)readline()
⼀次读取⼀行数据, 注意: readline()结尾, 注意每次读取出来的数据都会有⼀ 个 所以呢. 需要我们使用strip()方法来去掉 或者空
f= open("倚天屠龙记",mode="r",encoding="UTF-8") line1=f.readline().strip() # 空白: 空格, , print(line1) #张无忌 f.close()
(3)readlines()
将每⼀行形成⼀个元素, 放到⼀个列表中. 将所有的内容都读取出来. 所以也是. 容易出现内存崩溃的问题.不推荐使用
f= open("倚天屠龙记",mode="r",encoding="UTF-8") lst = f.readlines() print(lst) for line in lst: print(line.strip()) f.close()
(4) 循环读取
# f是一个可迭代对象 f= open("倚天屠龙记",mode="r",encoding="UTF-8") for line in f: print(line.strip()) f.close
(5) read(n) 读取n个字符.
需要注意的是:如果再次读取. 那么会在当前位置继续去读,而不是从头读, 如果使用的是rb模式. 则读取出来的是n个字节
f= open("倚天屠龙记",mode="r",encoding="UTF-8") content = f.read(2) print(content) #张无 f.close()
f= open("倚天屠龙记",mode="rb") print(f.read(3)) f.close() #b'xe5xbcxa0'
2. 只写(w, wb)
写的时候注意. 如果没有文件. 则会创建文件, 如果文件存在. 则将原件中原来的内容删除, 再写入新内容
f = open("write", mode="w", encoding="utf-8") f.write("周笔畅 ") # 写的时候. 先清空. 再写入. w f.write("胡辣汤 ") f.write("实付款 ") f.flush() f.close()
f= open("倚天屠龙记",mode="w",encoding="UTF-8") f.write("金毛狮王") f.flush() f.close() #金毛狮王
f= open("倚天屠龙记",mode="w",encoding="UTF-8") f.write("金毛狮王") f.read() #UnsupportedOperation: not readable 模式是w. 不不可以执⾏行行读操作 f.flush() f.close()
wb模式下. 可以不指定打开文件的编码. 但是在写文件的时候必须将字符串转化成utf-8的 bytes数据
f= open("倚天屠龙记",mode="wb") f.write("金毛狮王".encode("utf-8")) f.flush() f.close()
4. 追加(a, ab)
f = open("倚天屠龙记", mode="a", encoding="utf-8") f.write("俞岱岩 ") # 追加写 f.write("陈友谅 ") f.flush() f.close()
5. r+读写
对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进行写入. 我们以后使用频率最高的模式就是r+
f = open("倚天屠龙记", mode="r+", encoding="utf-8") content = f.read() f.write("光明左使杨逍") print(content) f.flush() f.close()
错误方式:
f = open("倚天屠龙记", mode="r+", encoding="utf-8") f.write("光明左使杨逍") content = f.read() print(content) f.flush() f.close() #将开头内容改为"光明左使杨逍'再往后读
所以记住: r+模式下. 必须是先读取. 然后再写入
6. w+写读
先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常用
f = open("倚天屠龙记", mode="w+", encoding="utf-8") f.write("光明左使杨逍") print(f.read()) f.flush() f.close()
先读不就好了了么? 错. w+ 模式下, ⼀开始读取不到数据. 然后写的时候再将原来的内容清空,所以极少用
7.a+写读(追加写读)
f = open("倚天屠龙记", mode="a+", encoding="utf-8") f.write("光明左使杨逍") # f.seek(0) print(f.read()) f.flush() f.close()
a+模式下, 不论先读还是后读. 都是读取不到数据的. 但是移动光标就可以
8. 其他操作方法
(1)seek(n)
- 光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中⽂文部分要是3的倍数.
- 通常我们使用seek都是移动到开头或者结尾. 移动到开头: seek(0) 移动到结尾: seek(0,2)
- seek的第⼆个参数表示的是从哪个位置进行偏移, 默认是0, 表示开头, 1表示当前位置, 2表示结尾
f = open("倚天屠龙记", mode="r+", encoding="utf-8") f.write("白眉鹰王殷天正青翼蝠王韦一笑") f.seek(0) #光标移动到开头 print(f.read()) #读取内容,此时光标移动到结尾 f.seek(0) #将光标移至开头 f.seek(0,2) #将光标移至结尾 print(f.read()) #读取内容,什么都没有 f.seek(0) #移动到开头 f.write("朱元璋") #写入信息,此时光标在 print(f.tell()) #此时光标位置9 f.flush() f.close()
(2). tell()
使用tell()可以帮我们获取到当前光标在什么位置
(3). truncate() 截断文件
f = open("倚天屠龙记", mode="r+", encoding="utf-8") f.seek(3) f.truncate(12) # 如果没有参数. 按照光标来阶段. 如果有参数. 截断到参数位置 f.flush() f.close()
9. 文件的修改以及另一种打开文件句柄的方式
文件修改: 只能将文件中的内容读取到内存中, 将信息修改完毕, 然后将源文件删除, 将新 文件的名字改成老⽂文件的名字.
import os # 引入os模块 with open("alex", mode="r", encoding="utf-8") as f1, open("alex_副本", mode="w", encoding="utf-8") as f2: for line in f1: new_line = line.replace("good", "ok") f2.write(new_line) os.remove("alex") os.rename("alex_副本", "alex")
弊端: 一次将所有内容进行读取. 内存溢出. 解决方案: ⼀行⼀行的读取和操作
另外:关于文件拷贝
f1 = open("G:/路飞01.png", mode="rb") f2 = open("E:/路飞02.png", mode="wb") for line in f1: f2.write(line) f1.close() f2.flush() f2.close()
Homework
1.有如下文件,a1.txt,里面的内容为:
- 老男孩是最好的培训机构,
- 全心全意为学生服务,
- 只为学生未来,不为牟利。
- 我说的都是真的。哈哈
分别完成以下的功能:
a,将原文件全部读出来并打印。
b,在原文件后面追加一行内容:信不信由你,反正我信了。
c,将原文件全部读出来,并在后面添加一行内容:信不信由你,反正我信了。
d,将原文件全部清空,换成下面的内容:
- 每天坚持一点,
- 每天努力一点,
- 每天多思考一点,
- 慢慢你会发现,
- 你的进步越来越大。
e,将原文件内容全部读取出来,并在‘我说的都是真的。哈哈’这一行的前面加一行,‘你们就信吧~’然后将更改之后的新内容,写入到一个新文件:a1.txt。
1. with open("a1",mode ="r",encoding="utf-8") as f: for line in f: print(line.strip()) with open("a1",mode ="a",encoding="utf-8") as f: f.write("信不信由你,反正我信了") with open("a1",mode ="r+",encoding="utf-8") as f: f.write("信不信由你,反正我信了") for line in f: print(line.strip()) with open("a1",mode ="w",encoding="utf-8") as f: f.write("""每天坚持一点, 每天努力一点, 每天多思考一点, 慢慢你会发现, 你的进步越来越大。 """)
import os # 引入os模块 # with open("a1",mode ="r",encoding="utf-8") as f1, open("a1_副本",mode="a",encoding="utf-8" ) as f2: # line1 = f1.readline() # f2.write(line1) # line2 = f1.readline() # f2.write(line2) # line3 = f1.readline() # f2.write(line3) # # f2.write("你们就信吧 ") # line4 = f1.readline() # f2.write(line4) cont = 0 for i in f1: if cont ==3: f2.write("你们就信吧 ") f2.write(i) cont+=1 os.remove("a1") os.rename("a1_副本", "a1")
2.有如下文件,t1.txt,里面的内容为:
- 葫芦娃,葫芦娃,
- 一根藤上七个瓜
- 风吹雨打,都不怕,
- 啦啦啦啦。
- 我可以算命,而且算的特别准:
- 上面的内容你肯定是心里默唱出来的,对不对?哈哈
分别完成下面的功能:
- a,以r+的模式打开原文件,判断原文件是否可读,是否可写。
- b,以r的模式打开原文件,利用for循环遍历文件句柄。
- c,以r的模式打开原文件,以readlines()方法读取出来,并循环遍历 readlines(),并分析b,与c 有什么区别?深入理解文件句柄与 readlines()结果的区别。
- d,以r模式读取‘葫芦娃,’前四个字符。
- e,以r模式读取第一行内容,并去除此行前后的空格,制表符,换行符。
- f,以r模式打开文件,从‘风吹雨打.....’开始读取,一直读到最后。
- g,以a+模式打开文件,先追加一行:‘老男孩教育’然后在从最开始将 原内容全部读取出来。
- h,截断原文件,留下内容:‘葫芦娃’
# with open("t1",mode ="r+",encoding="utf-8") as f: # for line in f: # print(line.strip()) # f.write("你说的对") # with open("t1",mode ="r",encoding="utf-8") as f: # for line in f: # print(line.strip()) # with open("t1",mode ="r",encoding="utf-8") as f: # lst = f.readlines() # print(lst) # with open("t1",mode ="r",encoding="utf-8") as f: # print(f.read(4)) # with open("t1",mode ="r",encoding="utf-8") as f: # print(f.readline().strip()) # with open("t1",mode ="r",encoding="utf-8") as f: # lst = f.readlines() # for i in range(2,len(lst)): # print(lst[i].strip()) # 先用readline在for循环 # with open("t1",mode ="a+",encoding="utf-8") as f: # f.write("老男孩儿教育") # f.seek(0) # for line in f: # print(line.strip()) # with open("t1",mode ="r+",encoding="utf-8") as f: # f.seek(9) # f.truncate() ## f.truncate(9)
3.文件a.txt内容:每一行内容分别为商品名字,价钱,个数。
- apple 10 3
- tesla 100000 1
- mac 3000 2
- lenovo 30000 3
- chicken 10 3
通过代码,将其构建成这种数据类型:[{'name':'apple','price':10,'amount':3},{'name':'tesla','price':1000000,'amount':1}......] 并计算出总价钱。
lis=[] with open("a",mode ="r",encoding="utf-8") as f: for line in f : lst = line .strip().split(" ") dic ={"name":lst[0],"price":lst[1],"amount":lst[2],} lis.append(dic) sum =0 for i in range(len(lis)): sum+=int(lis[i]["price"])*int(lis[i]["price"]) print(sum)
4,有如下文件:
- tony是创建人。
- tony其实是人妖。
- 谁说tony是sb?
- 你们真逗,tony再牛逼,也掩饰不住资深屌丝的气质。
将文件中所有的tony都替换成大写的SB(文件的改的操作)
import os with open("4t",mode ="r",encoding="utf-8") as f1, open("4t_副本", mode="w", encoding="utf-8") as f2: for line in f1: new_line= line.replace("tony","SB") f2.write(new_line) os.remove("4t") os.rename("4t_副本", "4t")
5.文件a1.txt内容(升级题)
name:apple
price:10 amount:3 year:2012
name:tesla price:100000 amount:1 year:2013
.......
通过代码,将其构建成这种数据类型:
[{'name':'apple','price':10,'amount':3},
{'name':'tesla','price':1000000,'amount':1}......]
并计算出总价钱。
lis=[] with open("5t",mode ="r",encoding="utf-8") as f: for line in f : lst1 = line .strip().split(" ") # print(lst1) dic = {} for i in range(0,3): [k,v]=lst1[i].split(":") dic.setdefault(k, v) print(dic) lis.append(dic) print(lis) sum =0 for i in range(len(lis)): sum+=int(lis[i]["price"])*int(lis[i]["price"]) print(sum)
5,文件a1.txt内容(升级题)
序号 部门 人数 平均年龄 备注
1 python 30 26 单身狗
2 Linux 26
30 没对象
3 运营部 20
24 女生多
.......
通过代码,将其构建成这种数据类型:
[{'序号':'1','部门':Python,'人数':30,'平均年龄':26,'备注':'单身狗'},
......]
result=[] with open("6t",mode ="r",encoding="utf-8") as f: title = f.readline().strip().split(" ") # print(title) lis1=[] lis2=[] for i in range(len(title)): if title[i]!="": lis1.append(title[i]) print(lis1) for line in f: lst=line.strip().split(" ") for i in range(len(lst)): if lst[i] != "": lis2.append(lst[i]) dic = {lis1[0]: lis2[0], lis1[1]: lis1[1], lis1[2]: lis2[2], lis1[3]: lis2[3], lis1[4]: lis2[4]} result.append(dic) print(result)
注意:其实s.split()什么都不写默认是用空白去切