• python3中编码和解码


    ------------恢复内容开始------------

    一、python3与python2.7在字符编码上的差异

    • python2.7 默认编码是和所在的操作系统一致,windows 是 GBK,macOS是 utf8 ,linux是utf8
    • python3 编码统一规定默认编码为 Unicode

     二、python3中str和bytes的区别

        (1)python3有两种数据类型:str 和bytes。

          1、编码为Unicode的文本显示为str;

          2、其他编码(比如gbk,utf8等)显示为bytes(16进制方式表示)

         (2)在python3中的encode和decode都是相对于Unicode而言的

          1、encode()方法是str类型数据拥有的方法,将Unicode编码的数据,转换为其他编码,作为新对象返回

          2、decode()方法是bytes类型数据拥有的方法,将其他编码的数据解码为Unicode编码,作为新对象返回

     三、在python3中,汉字的编码及其显示方式

      例如,输入汉字“中文”时

     
    编码方式 编码二进制格式 在屏幕中的显示
    Unicode
    'u4e2du6587'
     "中文"
    GBK    b'xd6xd0xcexc4'  b'xd6xd0xcexc4'
    UTF8
    b'xe4xb8xadxe6x96x87'
     b'xe4xb8xadxe6x96x87'
    注解
    b:代表bytes类型  ;x代表编码是16进制表示 ;u表示编码是Unicode
     

      

    另外,ASCII码可以表示所有到的英文字符,仅占一个字节,ASCII码表示的字符会始终以字符形式在屏幕中显示。

    四、当在python3中用open()方法打开文件的注意事项

    open()方法有很多参数,其中常用的有

        file:文件所在路径及文件名

        mode:

          r:只读,以text的模式打开文件

          w:写入,以文本的模式打开文件,且打开时将文件内容清空

             b :以bytes的模式打开文件

                          a:在文件后添加内容

          r+:可读可写,在文件已有文本的后面继续写入

          w+:以可读可写方式打开文件,且打开文件时,清空文件,文件不存在则创建文件

          encoding:指定解码文件使用的‘编码方式’,比如‘utf8’、‘gbk’等,默认使用操作系统的编码方式。windows默认是GBK,   macOS、linux默认使用utf8

    ------------恢复内容结束------------

  • 相关阅读:
    516. 最长回文子序列
    NC50493 环形石子合并
    NC16650 采药
    NC16664 合唱队形
    NC51170 石子合并
    148. 合并果子
    NC25138 子串查询
    二维数组对角线 的 规律
    如何讲一个网页转换为jpg?(图片!)
    Java两倍 犯错题
  • 原文地址:https://www.cnblogs.com/wl413911/p/12680867.html
Copyright © 2020-2023  润新知