• Python基础(七)-文件操作


    一、文件处理流程

    1、打开文件,得到文件句柄赋值给一个变量

    2、通过句柄对文件进行操作

    3、关闭文件

    二、基本操作

    f = open('zhuoge.txt') #打开文件
    first_line = f.readline()  #读取一行内容
    print('first line:',first_line) #读一行
    print('我是分隔线'.center(50,'-'))
    data = f.read()# 一次性读取剩下的所有内容,文件大时不要用
    print(data) #打印读取内容
     
    f.close() #关闭文件

    1、文件编码

    pycharm打开文件,从硬盘读取二进制数据加载到内存,Python解释器用自身编码方式将这些数据decode成Unicode方式放到内存

    Python解释器从内存中读取Unicode代码执行,执行时的代码中函数指定的编码与python解释器再无半点关系

    以哪种字符编码格式写入 就以哪种编码格式读取 否则会出现乱码

    如果文件以gbk方式写入,那么读取:

    f = open ('zhuoge.tex',encoding='gbk')
    f.read()
    f.close()

    2、文件打开模式:

    文件句柄 = open('文件路径', '模式')

    打开文件的模式有:

    • r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
    • w,只写模式【不可读;不存在则创建;存在则清空内容】
    • x, 只写模式【不可读;不存在则创建,存在则报错】
    • a, 追加模式【可读;   不存在则创建;存在则只追加内容】

    "+" 表示可以同时读写某个文件

    • r+, 读写【可读,可写】
    • w+,写读【可读,可写】
    • x+ ,写读【可读,可写】
    • a+, 写读【可读,可写】

     "b"表示以字节的方式操作

    • rb  或 r+b
    • wb 或 w+b
    • xb 或 w+b
    • ab 或 a+b
    注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
    
    f=open('zhuoge.txt','wb')
    
    f.write('fuck you'.encode(encoding='utf-8'))
    
    f.close()

    3、文件内置函数flush

    flush原理:

    1. 文件操作是通过软件将文件从硬盘读到内存
    2. 写入文件的操作也都是存入内存缓冲区buffer(内存速度快于硬盘,如果写入文件的数据都从内存刷到硬盘,内存与硬盘的速度延迟会被无限放大,效率变低,所以要刷到硬盘的数据我们统一往内存的一小块空间即buffer中放,一段时间后操作系统会将buffer中数据一次性刷到硬盘)
    3. flush即,强制将写入的数据刷到硬盘

    4、文件内光标移动

     f.read(n) 代表读取n个字符,操作的是字符,其他方法操作都是字节

    #文件内容
    1你好啊
    2我好
    3他也好
    
    f=open('hello.txt','r+',encoding='utf-8')
    print(f.tell())  #以r模式打开 光标在最开头
    n=f.read(6)  #读取6个字符
    print(n)
    print(f.tell())  #此时光标位于6个字符的位置 
    print(f.read(3))  #在光标之后再读3个字符
    f.close()
    
    结果:
    0
    
    1你好啊
    2
    
    b'1xe4xbdxa0xe5xa5xbdxe5x95x8a
    2'
    13
    我好
    View Code

     f.readline() 

     f.readlines()  读出来的是个列表

     f.truncate(n) 截取前n个字节内容

     1 #文件内容
     2 1你好
     3 2我好
     4 3大家好
     5 
     6 f=open('hello.txt','a+')  #以a模式打开,光标在最后
     7 print(f.tell())     #证明光标当前位置
     8 print(f.truncate(7))   #但是截取是从文件开头开始
     9 print(f.tell())   #截取后
    10 f.close()
    11 
    12 结果:
    13 28
    14 7
    View Code

    f.seek()

    5、open() 详解

    open(file, mode='r', buffering=None, encoding=None, errors=None, newline=None, closefd=True)
    
    常用参数 file mode encoding
    open() 将会返回一个 file 对象

    file:'文件路径'

    mode:对文件的操作方式,如下:

        r w a 基本模式

        t b + U与基本模式结合使用 文本模式(默认)、二进制、读写模式、通用换行符

    r     以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
    rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
    r
    + 打开一个文件用于读写。文件指针将会放在文件的开头。
    rb
    + 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
    w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    w
    + 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    wb
    + 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
    a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
    ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 a
    + 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

    buffering的可取值有0,1,>1三个,0代表buffer关闭(只适用于二进制模式),1代表line buffer(只适用于文本模式),>1表示初始化的buffer大小;

    encoding表示的是返回的数据采用何种编码,一般采用utf8或者gbk;

    errors的取值一般有strict,ignore,当取strict的时候,字符编码出现问题的时候,会报错,当取ignore的时候,编码出现问题,程序会忽略而过,继续执行下面的程序。

    newline可以取的值有None, , , ”, ‘ ',用于区分换行符,但是这个参数只对文本模式有效;

    closefd的取值,是与传入的文件参数有关,默认情况下为True,传入的file参数为文件的文件名,取值为False的时候,file只能是文件描述符,什么是文件描述符,就是一个非负整数,在Unix内核的系统中,打开一个文件,便会返回一个文件描述符。

    Python中file()与open()区别

    两者都能够打开文件,对文件进行操作,也具有相似的用法和参数,但是,这两种文件打开方式有本质的区别:

    file为文件类,用file()来打开文件,相当于这是在构造文件类

    open()打开文件,是用python的内建函数来操作,建议使用open

    6、使用with进行文件操作

    with open() as f:  处理完自动关闭 f.close

    with open('hello.txt','r+',encoding='utf-8') as f:
        with open('hello_new','w+',encoding='utf-8') as p:        
            for lines in f.readlines():
                p.write(lines)
        print(p.closed)
    print(f.closed)
    
    #执行结果
    True
    True
  • 相关阅读:
    关于might_sleep的一点说明---CONFIG_DEBUG_ATOMIC_SLEEP【转】
    让你的软件飞起来:RGB转为YUV【转】
    Linux终端彩色打印+终端进度条【转】
    Linux中实现一个简单的进度条【转】
    Linux内核官方文档atomic_ops.txt【摘自Linux 内核文档】
    Linux 内核链表的使用及深入分析【转】
    Linux2.6.32内核笔记(5)在应用程序中移植使用内核链表【转】
    spin_lock & mutex_lock的区别? 【转】
    Linux c括号作用域【原创笔记】
    linux C 中的volatile使用【转】
  • 原文地址:https://www.cnblogs.com/chenzhuo-/p/6144278.html
Copyright © 2020-2023  润新知