python之文件操作

读写文件是最常见的IO操作。

在磁盘上读写文件的功能都是由操作系统提供的，读写文件就是请求操作系统打开一个文件对象(通常称之为文件描述符)，然后，通过操作系统提供的接口从这个文件对象中读取数据(读文件)，或者把数据写入这个文件对象(写文件)。

读文件：

read([size])：读取文件(读取size字节，默认读取全部)
readline([size])：读取一行
readlines([size]) ：读取缓冲buf(io.DEFAULT_SET_BUFFER)，返回每一行所组成的列表
iter：使用迭代器遍历读取文件 f.open(name);iter_f = iter(f);用for line in iter_f循环迭代器

　　要以读文件的模式打开一个文件对象，使用Python内置的open()函数，传人文件名和标识符。

>>> f = open('/opt/test.txt','r')

　　标识符'r'表示读，如果文件不存在，open()函数就会抛出一个FileNotFoundError的错误，并提示文件不存在。

>>> f = open('test.txt','r')
 
Traceback (most recent call last):
  File "D:/Users/练习.py", line 305, in <module>
    f = open('test.txt','r')
FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'

　　文件打开成功，则调用read()方法可以一次读取文件的全部内容，Python把内容读到内存，用str对象表示：close()方法关闭文件。文件使用完必须关闭，因为文件对象会占用操作系统的资源，并且操作系统同一时间能打开的文件数量是有限的。

f = open('test.txt','r')
print(f.read())
f.close()
 
hello world

　　使用with语句可以来自动帮我们调用close()方法。

with open('test.txt','r') as f:
    print(f.read())
 
hello world

　　调用read()会一次性读取文件的全部内容，如果文件过大，内存就爆了，所以，保险起见，可以反复调用read(size)方法，每次最多读取size个字节的内容。另外，readline()可以每次读取一行的内容，调用readlines()一次读取所有内容并按行返回list。

　　如果文件过小，read()一次性读取最方便，如果不能确定文件大小，可以反复调用read(size)比较保险，如果是配置文件，调用readlines()最方便。

for line in f.readlines():
    print(line.strip()) # 把末尾的
去除

　　二进制文件

　　要读取二进制文件，如图片、视频等，用‘rb’模式打开文件

with open('test.txt','rb') as f:
    print(f.read())
 
b'hello world
xe5x88xa4'

　　字符编码

　　windows下默认编码是gbk模式，要读取utf-8编码的文本文件，需要给open()函数传人encoding参数

with open('test.txt','r',encoding='utf8') as f:
    print(f.read())
 
hello world
判断下列

　　遇到编码不规范的文件，可能会碰到UnicodeDecodeError，这是由于文本文件中可能夹杂了一些非法编码的字符，open()函数还接收了一个errors参数，表示如果遇到编码错误后如何处理，最简单的方式就是直接忽略。

with open('test.txt','r',encoding='utf8',errors='ingore') as f:
    print(f.read())

写文件：

write(str)：将字符串写入文件
writelines(sequence_of_strings):写多行到文件，参数为可迭代的对象<br>flush() 将存放再内存中的内容写入硬盘。

　　当调用write()时，Python解释器调用系统想把内容写到磁盘，但Linux内核有文件缓冲机制，所以会缓存到内核的缓存区，当调用close()或者flush()时才会把内容写到文件。或者写入数据量大于或等于写缓存，写缓存也会同步到磁盘上。

　　写文件和读文件一样，都是调用open()函数，唯一区别就是标识符的传人，'w'，或者'wb'来表示写文本文件或者写二进制文件。

with open('t.txt','w') as f_w:
    f_w.write('hello world')

　　写入文件如不存在时，会直接创建该文件并进行写入操作。如果文件里面又内容时，会覆盖掉原有的文件。

　　追加文件内容则可以传入'a'参数。

文件指针的操作：

seek(offset[,whwence]) 移动文件指针 # offset 偏移量，可以为负数。 whenc 偏移相对位置。有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的
tell 打印指针所在位置
truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果。

相关阅读:
慎用SELECT INTO复制表
 Log4net 配置使用总结(一)
清除Chrome浏览器的历史记录、缓存
 System.Runtime.InteropServices.COMException (0x80040154)错误
 MS SQL开发命名规则
 查看数据库、表、索引的物理存储情况
 (转)ASP.NET调用javascript脚本的方法总结
 SQL Server ——动态SQL
SQL性能调优实践——SELECT COUNT
养成随时注释的好习惯
原文地址：https://www.cnblogs.com/valorchang/p/11282114.html