ASCII:美国
一个字节表示一个字符,不能表示汉字
大写字母 65--90 小写97--122
包含数字、字母、特殊符号,256个位置
GBK: 中国
只包含本国文字
英文:沿用ASCII 一个字节表示一个字符
中文:两个字节表示一个汉字
例如:中国 用的是4个字节,24位
Unicode:万国码 全世界通用
最早两个字节表示一个字符
2个字节表示一个汉字
生僻字用4个字节表示一个字符
缺点: 占用内存比较大
utf-8(Unicode的升级版)
一个字节表示一个字符(沿用ASCII规则)
欧洲:两个字节表示一个字符
亚洲国家:三个字节表示一个字符
python2用的是ASCII 编码
python默认使用utf-8编码
计算机只要是在内存里面的,用的一定是Unicode
在传输和存储时用的是非Unicode(utf-8,gbk...)
python3 中str类型用的编码方式是Unicode
str 中文
bytes 二进制 字节 (字符串的特殊)
encode 编码 Unicode--->非Unicode
str--->bytes
decode 解码 非unicode ---> Unicode
bytes--->str