字符编码
1.什么是字符编码
字符编码表;人类的字符《======》数字
1Bytes=8bit
1B=8b 一个字节等于8个二进制
ASCII码:只能识别英文字符,一个英文字符=8bit
GBK:能识别汉字于英文,1汉字=16bit,1英文字符=8bit
Shift_JIS日语编码
Eur_kr 韩语编码
unicode:能够识别万国字符,1字符=2Bytes=16bit
两大特点:
1,能够兼容万国字符
2,与各个国家的字符编码都有映射关系
utf_8:是Unicode的转换格式,1个英文字符=1Bytes 1个汉字=3bytes
重点:
1,编码与解码:
字符-----编码---》Unicode的二进制------编码----》GBK的二进
GRB 的二进制---解码----》Unicode的二进制---解码 ----字符
2,解决乱码问题的核心法则:
字符用什么编码格式编码,就应该用什么编码格式进行解码
3,python解释器默认的字符编码
python2:ASCII
python:utf_8
通过文件头可以修改python解释器默认使用的字符编码
在文件首行写:#coding:文件当初存的时候用的字符编码
为何人类要编码
人类与计算机打交道用的 都是人类的字符,而计算机无法识别人类的字符,只能识别二进制,所以必须将人类的字符编码成计算机能识别的二进制数字
如何用字符编码