• Python中的幽灵—编码方式


    首先要搞懂本地操作系统编码与系统编码的区别:

    1. 本地操作系统编码方式与操作系统有关,Linux默认编码方式为utf-8,Windows默认编码方式为gbk;
    2. 系统编码方式与编译器or解释器有关,Python3解释器默认编码方式为unicode。
    3. 编码方式不仅仅代表编码,也包括解码,因为编码与解码是相对应的。

    好了,进入正题:

    字符串的encode方法会默认编码为utf8格式,gbk编码方式兼容gb2312





    两个文件都出现了这样的问题
    &nbsp
    其中一个我们点击Reload in “GBK”进行了重载,内容正常显示了

    另一个我们点击下面的GBK编码方式看看


    什么意思呢,我来解释一下
    Reload:从硬盘中以新的编码方式读取内容并显示在编辑器上,文件在硬盘上的编码方式不改变
    Convet:将现在编辑器上的内容以新的编码方式写入硬盘,覆盖掉原先的内容,编码方式改变。
    第一个文件已经选择了Reload,这个文件我们选择Convert
    所以,这个文件会将Python�е����顪���뷽ʽ这些内容以gbk编码方式存入硬盘,结果是这样


    接下来我们验证以下我们的想法


    补充:
    网络上的数据以字节流的方式传输,所以

    要用utf-8解码才可以得到正确的字符串内容
    &nbsp
    当然如果想存入文件的话就需要注意啦

    从文件中读取的时候可要小心啊,要以文件相应的编码方式读出,比如open函数指定encoding,或者以二进制方式读出,之后在调用str.decode()方法以指定encoding解码。

  • 相关阅读:
    大数定理、中心极限定理、样本估计参数
    泰勒公式、Jenson不等式、切比雪夫不等式
    查询:分页、连接查询、自关联、子查询
    查询:排序Order by、聚合函数、分组groupby
    查询:基本查询、条件查询
    数据库和表的基本操作
    函数使用,增删改操作
    groupby
    统计分析函数
    pandas的基础使用
  • 原文地址:https://www.cnblogs.com/malinqing/p/11329961.html
Copyright © 2020-2023  润新知