ascii
A 00000010 8位 一个字节
uncode
A 000000000 00000001 00000010 00000100 32位
中000000000 00000001 00000010 00000110 32位
utf-8
A 0010 0000 8位 一个字节
中 000000000 00000010 00000110 24位 三个字节
gbk
A 00000110 8 位 一个字节
中 00000010 00000110 16位 两个字节
1.各个编码之间的二进制, 是不能相互认识的,会产生乱码
2.文件的储存,传输,不能是uncode,只能是(ascii gbk gb2312 utf- 8 utf-16)
python3 的str编码就是uncode
bytes类型使用gbk和utf-8等
对于英文
str表现形式
str="feaf"
编码方式
uncode 01010101
bytes 表现形式
bytes=b"fafe"
编码方式 00101010 utf-8 gbk
对于中文
str表现形式
str="中文"
编码方式
uncode 01010101
bytes 表现形式
bytes=b"/fef"#看不懂
编码方式 00101010 utf-8 gbk
str="fhahjf"
s22=str.encode("utf-8")#encode把str转化成bytes
print(s22)
s2=str.encode("gbk")#encode把str转化成gbk(bytes)
print(s2)