• 字符编码与文件处理


    字符编码

    1 以什么编码存的就要以什么编码取出
    ps:内存固定使用unicode编码,
    我们可以控制的编码是往硬盘存放或者基于网络传输选择编码
    
    2 数据是最先产生于内存中,是unicode格式,要想传输需要转成bytes格式
    #unicode----->encode(utf-8)------>bytes
    拿到bytes,就可以往文件内存放或者基于网络传输
    #bytes------>decode(gbk)------->unicode
    
    3 python3中字符串被识别成unicode
    python3中的字符串encode得到bytes
    
    4 了解
    python2中的字符串就bytes
    python2中在字符串前加u,就是unicode

    文件处理

    文件处理流程
    
    打开文件,得到文件句柄并赋值给一个变量------->通过句柄对文件进行操作------->关闭文件
    
    读文件:
    
    f=open(r'aaaa.py','r',encoding='utf-8')
    print(f.readline(),end='')      #读取一行,
    print(f.readlines())       #读取全部,不换行
    print(f.readable())       #可读文件
    print(f.writable())       #不可写文件
    f.close()       #结束之后必须关闭,否则占用内存
    写文件:
    f=open('new.txt','w',encoding='utf-8')
    f.write('1111111111
    ')      #写入第一行
    f.writelines(['2222
    ','3333
    ','4444
    '])      #添加多行
    print(f.writable())       #可写
    f.close()
    追加:
    f=open('new_2','a',encoding='utf-8')
    print(f.readable())         #不可读
    print(f.writable())         #可写
    f.write('888888
    ')       #追加单行
    f.write('999999
    ')
    f.writelines(['787878
    ','878787
    '])       #追加多行
    f.close()
    #rb
    f=open('aaaa.py','rb')    #以字节打开
    print(f.read().decode('utf-8'))
    拷贝图片
    f=open('1.jpg','rb')      #以rb的方式打开1.JPG
    data=f.read()           #data获取读取到f的内容
    print(data)
    f2=open('3.jpg','wb')      #以写的方式打开
    f2.write(data)         #把data的内容写到f2
    f2.close()
    f.close()
    #ab,以二进制的形式追加
    f=open('new_3.txt','ab')
    f.write('aaaaa
    '.encode('utf-8'))
    上下文管理
    with open('aaaa.py','r',encoding='utf-8') as read_f,
            open('aaaa_new.py','w',encoding='utf-8') as write_f:
        data=read_f.read()
        write_f.write(data)
    循环取文件每一行内容
    with open('a.txt','r',encoding='utf-8') as f:
        while True:
            line=f.readline()
            if not line:break
            print(line,end='')
    
        lines=f.readlines() #只适用于小文件
        print(lines)
    
        data=f.read()
        print(type(data))
    
    
        for line in f: #推荐使用
            print(line,end='')
    文件的修改
    方式一:只适用于小文件
    import os
    with open('a.txt','r',encoding='utf-8') as read_f,
            open('a.txt.swap','w',encoding='utf-8') as write_f:
        data=read_f.read()
        write_f.write(data.replace('alex_SB','alex_BSB'))
    
    os.remove('a.txt')
    os.rename('a.txt.swap','a.txt')
    #方式二:
    import os
    with open('a.txt','r',encoding='utf-8') as read_f,
            open('a.txt.swap','w',encoding='utf-8') as write_f:
        for line in read_f:
            write_f.write(line.replace('alex_BSB','BB_alex_SB'))
    
    os.remove('a.txt')
    os.rename('a.txt.swap','a.txt')

    打开文件的模式有:

    r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
    w,只写模式【不可读;不存在则创建;存在则清空内容】
    x, 只写模式【不可读;不存在则创建,存在则报错】
    a, 追加模式【可读;   不存在则创建;存在则只追加内容】
    "+" 表示可以同时读写某个文件
    
    r+, 读写【可读,可写】
    w+,写读【可读,可写】
    x+ ,写读【可读,可写】
    a+, 写读【可读,可写】
     "b"表示以字节的方式操作
    
    rb  或 r+b
    wb 或 w+b
    xb 或 w+b
    ab 或 a+b
    注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
    
    
    
  • 相关阅读:
    玩转Bootstrap(JS插件篇)-第1章 模态弹出框 :1-4 模态弹出框--结构分析
    玩转Bootstrap(JS插件篇)-第1章 模态弹出框 :1-3 模态弹出框
    玩转Bootstrap(JS插件篇)-第1章 模态弹出框 :1-2 动画过渡
    玩转Bootstrap(JS插件篇)-第1章 模态弹出框 :1-1导入JavaScript插件
    SpringMVC中的 JSR 303 数据校验框架说明
    对JSON格式的城市按照拼音首字母排序
    Urozero Autumn 2016. BAPC 2016
    BZOJ2596 : [Wc2007]疯狂赛车
    BZOJ3253 : 改编
    XVII Open Cup named after E.V. Pankratiev. GP of Moscow Workshops
  • 原文地址:https://www.cnblogs.com/52-qq/p/7230712.html
Copyright © 2020-2023  润新知