• 文件处理


    一.字符编码中encode和decode

    encode:unicode的二进制------编码encode------->gbk格式的二进制

    decode:unicode的二进制<------解码decode-------gbk格式的二进制

    二.文件的基本知识

    1. 什么是文件
                  文件是操作系统为应用程序或者用户提供一种操作硬盘的虚拟单位
                  强调:
                         文件是操作系统提供的虚拟单位
                         应用程序或者用户对文件的读写操作其实都是向操作系统发送指令

    2. 为何要用文件
                  文件对应的硬盘空间,如果需要考虑永久保存数据那必须使用文件

    3. 如何用文件
           路径问题:
                  绝对路径:在任意位置都可以找到文件
                      win: C:acd.txt 
                      linux: /a/b/c/d.txt
                  相对路径: 相对于当前执行文件所在文件夹
                      a/b/c/d.txt

    三.文件的基本操作

    1 打开文件
                f=open(r'D:脱产5期内容day09a.txt',mode='rt',encoding='utf-8')

                第一个参数:文件路径

                第二个参数:文件的打开模式

                第三个参数:指定文件的编码     

                f=open(...)是由操作系统打开文件,那么如果我们没有为open指定编码,那么打开文件的默认编码很明显是操作系统说了算了,操作系统会用自己的默认编码去打开文件,在windows下是gbk,在linux下是utf-8。 若要保证不乱码,文件以什么方式存的,就要以什么方式打开。

    2 读/写文件
                data=f.read()

                data=f.write()

    3 关闭文件
    f.close() # 向操作系统发送指令,让操作系统关闭打开的文件,回收操作系统资源

    4.上下文管理:用with打开文件,执行完毕后,会自动关闭文件
               with open('a.txt',mode='rt',encoding='utf-8') as f:
                     data=f.read()
                     print(data)

    四.文件的打开模式

    1.控制文件读写操作的模式


    r(默认):只读模式,以该模式打开文件,当文件不存在时则报错,当文件存在时文件指针在文件开头
    with open('a.txt',mode='rt',encoding='utf-8') as f:
    f.read() # 读取所有内容,光标移动到文件末尾
    f.readable() # 文件是否可读
    f.writable() # 文件是否可写
    f.readline() # 读取一行内容,光标移动到下一行开头
    f.readlines() # 读取每一行内容,放到一个列表当中


    w: 只写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时清空文件内容,文件指针在文件开头
    with open('a.txt',mode='wt',encoding='utf-8') as f:
    在打开了文件不关闭的情况下,连续的写入,新写的内容总是跟在老内容之后
    f.write() # 把所有内容都写进文件中
    f.writelines(lines) # 相当于执行一个for循环,把每一个内容,都写进文件中
    a: 只追加写模式,以该模式打开文件,当文件不存在时创建一个空文档,当文件存在时不清空文件内容,文件指针跳到文件末尾
    with open('c.txt',mode='at',encoding='utf-8') as f:
    f.write()
    f.writelines()


    2.控制文件读写内容的模式(不能单独使用,必须与r、w、a连用)


    t(默认):无论读写都是以字符为单位的,只能操作文本文件,必须指定encoding参数
    b:无论读写都是以bytes为单位的,可以操作所有文件,一定不能指定encoding参数

    3.了解:
           +(可以同时读写文件):不能单独使用,必须与r、w、a连用,r+ w+ a+
           控制文件内指针移动:f.seek(10),其中的数字代表的字节数

    五.修改文件的两种方式

    方式一:
    1. 以读的方式打开源文件
    2. 将文件内容一次性全读入内存,在内存完成修改
    3. 以写的方式打开源文件,然后将修改后的结果一次性写入源文件
    总结:
    优点:在文件修改过程中硬盘只存在一份数据
    缺点:浪费内存

    with open('b.txt',mode='rt',encoding='utf-8') as f1:
        msg=f1.read()
        new_msg=msg.replace('alex','大SB')

    with open('b.txt',mode='wt',encoding='utf-8') as f2:
    f2.write(new_msg)

    方式二:
    1. 以读的方式打开源文件,以写的方式打开一个临时文件
    2. 读取源文件的一行内容到内存中,将修改的结果写入临时文件,循环往复直到改
    3. 删除源文件,将临时文件重命名为源文件名
    优点:同一时间在内存中只有文件的一行内容,更节省内容
    缺点:在文件修改过程中硬盘只存在两份数据

    import os

    with open('b.txt',mode='rt',encoding='utf-8') as read_f,open('.b.txt.swap',mode='wt',encoding='utf-8') as write_f:
        for line in read_f:
        write_f.write(line.replace('大SB','alex'))

    os.remove('b.txt')
    os.rename('.b.txt.swap','b.txt')

  • 相关阅读:
    一个切换鼠标左右手的小工具
    聊一聊高并发高可用那些事
    PHP 笔记
    PHP 安装 XDebug
    php symfony/var-dumper 打印插件
    PHP字符串和数组
    ThinkPHP自定义分页模板
    匿名函数
    SQL优化工具
    spring cloud 服务容错保护
  • 原文地址:https://www.cnblogs.com/wangke0917/p/10022290.html
Copyright © 2020-2023  润新知