Python3中的编码问题

Python3中的编码问题
编码方式介绍

我们首先来熟悉一下常见的一些编码方式，按照时间轴来划分，共有以下几种编码方式（常见）：
- ASCII编码方式：对127个常见字符进行编码，其中包含了10个阿拉伯数字，共52个大小写英文字母。
- GB2312编码方式：由中国提出，对常见的汉字进行了编码，并且兼容ASCII编码。
- Unicode编码方式：国际统一字符编码，对所有的常见字符进行统一编码。
- UTF-8编码方式：由Unicode引申出来的可变长编码方式。
  以上都是对字符编码的一些方式，目的就是为了显示、存储、传输的方便。
如果我们按照编码的长度进行区分：
- ASCII编码方式：1个byte。
- GB2312编码方式：若干byte。
- Unicode编码方式：若干byte，编码长度最长。
- UTF-8编码方式：若干byte。
  因为如果在存储或者是传输时使用Unicode编码，那样太浪费空间了，所以才推出一个可变长的UTF-8编码。这样既保证可以对所有的字符进行编码，又能合理利用空间。
Python3的编码方式

在Python3中，字符串str是用Unicode编码的。
字符串str：
1. 在内存中是Unicode编码。
2. 在进行网络传输或者是磁盘存储时，需要转化成字节码(bytes),这时就需要用以上几种编码方式进行编码(encode)了。
因为英文字符只有一个字节，所以可以用ASCII编码。但是中文字符不止一个字节，所以要用UTF-8进行编码，当然英文同样可以用UTF-8进行编码。
既然传输与存储对字符进行编码了，那我们将其读取到内存中时，就需要对其进行解码(decode)操作了，用什么编码，那么就用什么解码。逆向操作完之后，此时内存中就又是Unicode编码的字符了。

Reference
- 字符串和编码
相关阅读:
【OpenStack】OpenStack系列16之OpenStack镜像制作
 【OpenStack】OpenStack系列15之OpenStack高可用详解
 【OpenStack】OpenStack系列14之Dashboard定制开发
 【OpenStack】OpenStack系列13之Nova源码解析与API扩展
 linux之scp命令
 阿里大鱼短信平台
 count(1)与count（*）
java中枚举类到高级使用
 idea中mybatis-plugin破解
 mmall项目之问题一（mavenplugin问题）
原文地址：https://www.cnblogs.com/yinzm/p/7650469.html

Python3中的编码问题

编码方式介绍

Python3的编码方式

Reference