文件操作示例分析:
文件操作一般要经历三个步骤:
- 打开文件
- 操作文件
- 关闭文件
读取操作示例:
>>>f = open('test.txt', 'r') # 打开文件test.txt, r表示只读,文件不存在则报错 >>>f.read() # 文件打开后,read()方法将文件内容读到内存中 '123432' # 获取的内容是一个字符串 >>>f.close() # 文件使用完必须关闭,打开文件占用资源
打开文件:文件句柄 = file('文件路径',‘模式’)
备注:Python中打开文件有两种方式,即open()和file(),本质上前者会调用后者进行文件操作,推荐使用open
上诉,方式中,每次打开一个文件操作完成后,都要手动关闭文件,操作繁琐,易忘。推荐一种更加简便的操作方式:with语句, 这种语句帮助我们自动完成f.close() 这一步操作。
with open('test.txt', 'r') as f: file = f.read() print(type(file)) pirint(file) # 输出结果 <class'str'> # 取出的内容还是字符串 123432 # 虽然没有看到引号,但还是字符串 ---------------------------------------------------------------------- # with 语句的多文件同时处理 # Python2.7版本之后,with 支持同事打开多个文件 with open('db1','r') as f1, open('db2', 'r') as f2: pass ----------------------------------------------------------------------- # 一个文件读取一行处理一行然后写入另一个文件一行 with open('db1', 'r', encoding="utf-8") as f1, open('db2', 'w', encoding="utf-8") as f2: for line in f1: new_str = line.replace('abc', "st") f2.write(new_str)
写入文件示例:
with open('test.txt', 'a+') as f: f.write('hello world')
备注:所有的文件操作,如果文件没有写绝对路径,默认路径为程序所在路径,文件操作要注意操作文件的存在性。
文件操作权限:
- r # 以只读的方式打开文件,文件的指针放在文件的开头,默认方式
- r+ # 以读写模式打开,和追加效果一样,但是如果文件不存在,不会像a一样创建文件,而是报错
- rb # 以二进制格式打开一个文件用于只读,文件指针将会放在文件的开头,这是默认模式
- rb+ # 以二进制格式打开一个文件用于读写,文件指针放在文件的开头
- w # 替换重写(覆盖写入)
- w+ # 以读写模式打开文件,如果该文件已经存在则将其内容覆盖,文件不存在则创建文件
- wb # 以二进制格式打开一个文件只用于写入,如果该文件已经存在则将其内容覆盖,文件不存在则创建文件
- wb+ # 以二进制格式打开一个文件用于读写, 如果该文件已经存在则将其内容覆盖,文件不存在则创建文件
- a # 在原文件的基础上,追加写入,文件指针放在文件结尾,如果文件不存在,则创建新文件进行写入
- a+ # 打开一个文件用于读写,如果文件已经存在,文件指针放在文件结尾。文件打开时是追加模式,如果文件不存在则创建文件用于读写
- ab # 以二进制格式打开一个文件,如果文件存在,文件指针放在文件结尾,文件不存在则创建新文件并进行写入
- ab+ # 以二进制格式打开一个文件用于追加,如果文件存在,文件指针放在文件结尾,文件不存在则创建新文件用于读写
- b # 二进制文件,主要用于跨平台,来解决windows和linux的回车换行区别,按照字节
- x # python3中添加,如果文件存在则报错,不存在则创建并写入内容
文件其他方法:
- f.mode # 显示文件打开格式
- f.flush() # 把缓冲区中的数据刷到硬盘,当你往文件里写数据时,python会先把你写的内容写到缓冲区,等缓冲区满了再统一自动写入硬盘,因此减少了对硬盘的操作次数,毕竟硬盘的速度比内存慢得多
- f.read() # 把文件一次性读入内存
- f.read(szie) # 一次读取指定大小的文件
- f.readline() # 读取一行文件
- f.readlines() # 把文件都读入内存,并且每行转成列表中的一个元素
- f.tell() # 显示程序光标所在该文件中的当前的位置,位置是以字节来算的
- f.seek() # 跳到指定位置,f.seek(0) 是返回文件开始,位置是以字节来算的
- f.truncate() # f.truncate(10) 从文件开头截取10个字符,超出的都删除
- f.writelines() # 参数需为一个列表,将一个列表中的每一个元素都写入文件
- f.xreadlines() # 以迭代的形式循环文件,在处理大文件时效率极高,只记录文件开头和结尾,每循环一次,只读一行,因此不需要将整个文件都一次性加载到内存,而如果用readlines(),则需要将整个文件都加载到内存,处理大文件不合适。
- f.next() # 获取下一行数据,不存在,则报错
文件对象的属性
- file.closed # 返回True如果文件已经关闭,否则返回False
- file.mode # 返回被打开文件的访问模式
- file.name # 返回文件的名称
- file.softspace # 如果用print输出后,必须跟一个空格符,则返回False ,否则返回True
文件读取选择:
- 文件很小,read() 最方便
- 不确定文件大小,反复调用read(size) 安全
- 如果是配置文件,调用readlines() 最方便
操作系统中文件操作
- import os # python中的文件操作需要导入os模块
- os.rename( current_file_name, new_file_name) # 文件重命名
- os.remove( file_name ) # 删除文件
- os.mkdir( "test") # 创建一个目录test
- os.chdir( "newdir" ) # 切换目录到newdir
- os.getcwd() # 获取当前目录的路径
- os.rmdir( "dirname" ) # 删除目录,在删除目录前,它的所有内容应该先被清除