1.打开文件
读写文件是最常见的 IO 操作。Python 内置了读写文件的函数,方便了文件的 IO 操作。
文件读写之前需要打开文件,确定文件的读写模式。open 函数用来打开文件,语法如下:
open(name [.mode[.buffering]])
open 函数使用一个文件名作为唯一的强制参数,然后返回一个文件对象。模式(mode)和缓冲区(buffering)参数都是可选的,默认模式是读模式,默认缓冲区是无。
在交出式环境的提示符">>>"下,输入如下内容:
>>> f=open(r'c: est.txt')
如果文件不存在,将会看到一个类似下面的异常回溯:
>>> f=open(r'c: est.txt') Traceback (most recent call last): File "<stdin>", line 1, in <module> FileNotFoundError: [Errno 2] No such file or directory: 'c:\test.txt'
2.文件模式
下面主要说一下 open 函数中的 mode 参数,通过改变mode 参数可以实现对文件的不同操作。
这里主要是提醒一下'b' 参数的使用,一般处理文本文件时,时用不到'b'参数的,但处理一些其他类型的文件(二进制文件),比如MP3音乐或者图像,那么应该在模式参数中增加'b', 这在爬虫中处理媒体文件很常用。参数'rb' 可以用来读取一个二进制文件。
3.文件缓冲区
open 函数中第三个可选参数 buffering 控制着文件的缓冲。如果参数时0, I/O 操作就时无缓冲的,直接将数据写到硬盘上;如果参数时1,I/O 操作就是有缓冲的,数据先写到内存里,只有使用flush 函数或者 close 函数才会将数据更新到硬盘;如果参数为大于1的数字则代表缓冲区的大小 (单位是字节),-1(或者是任何负数)代表使用默认缓冲区的大小。
4.文件读取
文件读取只要是分为按字节读取和按行读取,经常用到的方法有 read(),readlines(),close()。
在">>>"输入f=open(r'c: ext est.txt')后,如果成功打开文本文件,接下来调用 read() 方法则可以一次性将文件内容全部读到内存中,最后返回的是 str 类型的对象:
>>> f.read()