一、相对路径和绝对路径
1. 绝对路径:从磁盘根⽬录开始⼀直到⽂件名.
2. 相对路径:同⼀个⽂件夹下的⽂件. 相对于当前这个程序所在的⽂件夹⽽⾔. 如果在同⼀个⽂件夹中. 则相对路径就是这个⽂件名. 如果在上⼀层⽂件夹. 则要使用“../”退回到上一个文件夹,再去查找相应的文件夹和文件。
如下是相对路径:
绝对路径如下:
二、 初识⽂件操作
使⽤python来读写⽂件是非常简单的操作. 我们使⽤open()函数来打开⼀个⽂件, 获取到⽂件句柄. 然后通过⽂件句柄就可以进⾏各种各样的操作了. 根据打开⽅式的不同能够执⾏的 操作也会有相应的差异.
打开⽂件的⽅式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使⽤的是r(只读)模式
1.read() 将⽂件中的内容全部读取出来. 弊端: 占内存. 如果⽂件过⼤.容易导致内存崩溃。
f = open("test.txt", mode="r", encoding="utf-8")#在此py文件下,新建一个test.txt的文件 content = f.read() print(content)
2. read(n) 读取n个字符. 需要注意的是. 如果再次读取. 那么会在当前位置继续去读⽽不是从头读, 如果使⽤的是rb模式. 则读取出来的是n个字节。
f = open("test.txt", mode="r" encoding="utf-8") content = f.read(3) print(content)
3. readline() ⼀次读取⼀⾏数据, 注意: readline()结尾, 注意每次读取出来的数据都会有⼀
个 所以呢. 需要我们使⽤strip()⽅法来去掉 或者空格
f = open("../def/哇擦.txt", mode="r", encoding="utf-8") content = f.readline() print(content)
4. readlines()将每⼀⾏形成⼀个元素, 放到⼀个列表中. 将所有的内容都读取出来. 所以也是容易出现内存崩溃的问题.不推荐使⽤
f = open("test.txt", mode="r", encoding="utf-8") lst = f.readlines() print(lst) for line in lst: print(line.strip())
5. 循环读取. 这种⽅式是组好的. 每次读取⼀⾏内容.不会产⽣内存溢出的问题.
f = open("test.txt", mode="r", encoding="utf-8") for line in f: print(line.strip())
6.注意: 读取完的⽂件句柄⼀定要关闭 f.close()
三. 写模式(w, wb)
写的时候注意. 如果没有⽂件. 则会创建⽂件, 如果⽂件存在. 则将原件中原来的内容删除, 再写入新内容
f = open("test.txt", mode="w", encoding="utf-8") f.write("test0001") f.flush() # 刷新. 养成好习惯 f.close()
wb模式下. 可以不指定打开⽂件的编码. 但是在写⽂件的时候必须将字符串转化成utf-8的bytes数据
f = open("test.txt", mode="wb") f.write("test0002".encode("utf-8")) f.flush() f.close()
四. 追加(a, ab)
在追加模式下. 我们写入的内容会追加在⽂件的结尾。有这个文件,则会在末尾追加。如果没有此文件,则会创建。
f = open("test.txt", mode="a", encoding="utf-8") f.write("张三的最爱") f.flush() f.close()
ab模式代码如下:
f = open("test.txt", mode="ab") f.write("麻花藤的最爱".encode('utf-8')) f.flush() f.close()
五. 读写模式(r+, r+b)
对于读写模式. 必须是先读. 因为默认光标是在开头的. 准备读取的. 当读完了之后再进⾏写入. 我们以后使⽤频率最⾼的模式就是r+
f = open("test.txt", mode="r+", encoding="utf-8") content = f.read() f.write("麻花藤的最爱") print(content) f.flush() f.close()
注意:r+模式下. 必须是先读取. 然后再写入
六. 写读(w+, w+b)
先将所有的内容清空. 然后写入. 最后读取. 但是读取的内容是空的, 不常⽤。 w+ 模式下, ⼀开始读取不到数据. 然后写的时候再将原来的内容清空. 所以, 很少⽤。
f = open("test.txt", mode="w+", encoding="utf-8") f.write("哈哈") content = f.read() print(content) f.flush() f.close()
七. 追加读(a+)
a+模式下, 不论先读还是后读. 都是读取不到数据的.
f = open("⼩娃娃", mode="a+", encoding="utf-8") f.write("⻢化腾") content = f.read() print(content) f.flush() f.close()
还有⼀些其他的带b的操作. 就不多赘述了. 就是把字符换成字节. 仅此⽽已
八. 其他相关操作
1. seek(n) 光标移动到n位置, 注意, 移动的单位是byte. 所以如果是UTF-8的中⽂部分要是3的倍数.通常我们使⽤seek都是移动到开头或者结尾.
移动到开头: seek(0)
移动到结尾: seek(0,2) seek的第⼆个参数表⽰的是从哪个位置进⾏偏移, 默认是0, 表⽰开头, 1表⽰当前位置, 2表⽰结尾.
使用时,不知道有没有遇到这个错误:io.UnsupportedOperation: can't do nonzero cur-relative seeks
这个问题主要是因为在python3和python2的问题,如果在Python2中是不会报错的,Python3则会报错。因为Pyhon3在文本文件中,没有使用b模式选项打开的文件,只允许从 文件头开始计算相对位置,从文件尾计算时就会引发异常。
f = open("test.txt", mode="rb") f.seek(0) # 光标移动到开头 content = f.read() # 读取内容, 此时光标移动到结尾 print(content) print(f.tell()) f.seek(-3, 1) # 再次将光标移动到开头 content = f.read(6) # 读取内容, 此时光标移动到结尾 print(content) print(f.tell()) f.flush() f.close()
2.tell()方法也使用了,就是告诉用户,当前光标在什么位置。计算时,是按照,字节数累加的。
3.truncate()
此方法的作用就是,删除光标后面的所有内容。如果truncate()括号内,填入值,就是只保留这几个值,其余的全部删除。
f = open('test.txt',mode='w',encoding='utf-8')#此行代码执行后,文件中就没有文字了,所以需要下面的f.write('哈呵护'),写入一些值。这是因为‘w’模式就是这个特点。 f.write('哈呵护') c = f.seek(6) print(c) f.truncate() f = open('test.txt', mode='r+', encoding='utf-8') print(f.read()) f.seek(0) f.seek(3) f.truncate() print(f.read())
f = open('test.txt', mode='r+', encoding='utf-8') f.truncate(6)#这里对的数字代表,截取的是字节,如果utf-8编码格式的汉字,3个字节代表一个。
九. 修改⽂件以及另⼀种打开⽂件的⽅式
⽂件修改: 只能将⽂件中的内容读取到内存中, 将信息修改完毕, 然后将源⽂件删除, 将新⽂件的名字改成老⽂件的名字.
# ⽂件修改
import os with open("test.txt", mode="r", encoding="utf-8") as f1, open("test_new.txt", mode="w", encoding="UTF-8") as f2: content = f1.read() new_content = content.replace("冰糖葫芦", "⼤⽩梨") f2.write(new_content) os.remove("⼩娃娃") # 删除源⽂件 os.rename("test_new.txt", "⼩娃娃") # 重命名新⽂件 弊端: ⼀次将所有内容进⾏读取. 内存溢出. 解决⽅案: ⼀⾏⼀⾏的读取和操作 import os with open("test.txt", mode="r", encoding="utf-8") as f1, open("⼩娃娃_new", mode="w", encoding="UTF-8") as f2: for line in f1: new_line = line.replace("⼤⽩梨", "冰糖葫芦") f2.write(new_line) os.remove("test.txt") # 删除源⽂件 os.rename("test_new.txt", "test.txt") # 重命名新⽂件