1-Python3中字符串类型:
- bytes:二进制 互联网上数据的都是以二进制的方式传输的。
- str :unicode的呈现形式。
2-Unicode UTF8 ASCII的补充
- 字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
- 字符集(Character set)是多个字符的集合。
- 字符集包括:ASCII字符集、GB2312字符集、GB18030字符集、Unicode字符集等。
- ASCII编码是1个字节,而Unicode编码通常是2个字节(由于占位长度问题,普及率不高)。
- UTF-8(python3中默认的编码与解码)是Unicode的实现方式之一,UTF-8是它是一种变长的编码方式,可以是1,2,3个字节。
3-Python3把系统的默认编码设置为utf-8
4-str 与bytes之间的转化-encode()和decode()。
- str--->bytes encode()方法-编码
- bytes--->str decode()方法-解码